Está en la página 1de 56

Apuntes de cálculo diferencial en una y varias

variables reales

Eduardo Liz Marzán

Diciembre de 2013
Índice general

1. Preliminares 1
1.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. La relación de orden en el conjunto de los números reales. . . . . . . . . . . . . . 1
1.3. El valor absoluto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4. Funciones reales de variable real. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2. Lı́mites y continuidad de funciones de una variable 5


2.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2. Lı́mite de una función en un punto. . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3. Continuidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4. Lı́mites en infinito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.5. Cálculo de lı́mites. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.6. Algunos teoremas para funciones continuas. . . . . . . . . . . . . . . . . . . . . . 9

3. Derivación de funciones de una variable 11


3.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.2. El problema de la tangente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.3. Derivada de una función en un punto. . . . . . . . . . . . . . . . . . . . . . . . . 12
3.4. Función derivada. Derivadas sucesivas. . . . . . . . . . . . . . . . . . . . . . . . . 14
3.5. Propiedades de las derivadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.6. Cálculo de derivadas en algunos casos especiales. . . . . . . . . . . . . . . . . . . 16
3.7. La regla de L’Hôpital. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.8. Extremos relativos de una función. . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.9. El teorema del valor medio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.10. El teorema de Taylor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

4. Introducción a las funciones vectoriales 25


4.1. Funciones vectoriales de una variable. Curvas en R2 y R3 . . . . . . . . . . . . . . 25
4.2. Campos escalares y vectoriales. Curvas de nivel . . . . . . . . . . . . . . . . . . . 27
4.3. Nociones básicas de topologı́a en Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 28

5. Continuidad y cálculo diferencial de funciones de varias variables 31


5.1. Lı́mites y continuidad de funciones de varias variables. . . . . . . . . . . . . . . . 31
5.2. Derivadas parciales y plano tangente. . . . . . . . . . . . . . . . . . . . . . . . . . 33

i
5.3. Diferenciabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.4. Regla de la cadena. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.4.1. Interpretación de la diferencial como aplicación. . . . . . . . . . . . . . . . 37
5.4.2. Regla de la cadena: una variable independiente . . . . . . . . . . . . . . . 37
5.4.3. Regla de la cadena: varias variables independientes . . . . . . . . . . . . . 39
5.5. Derivación implı́cita. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.6. Derivadas parciales de orden superior. . . . . . . . . . . . . . . . . . . . . . . . . 41
5.7. Extremos locales y globales de un campo escalar. . . . . . . . . . . . . . . . . . . 43
5.8. Extremos condicionados. Multiplicadores de Lagrange. . . . . . . . . . . . . . . . 46

Referencias 51
Introducción

Se recogen aquı́ los apuntes de la asignatura “Cálculo I” adaptada a los nuevos grados. En lo
que respecta a las titulaciones de Ingenierı́a de la energı́a e Ingenierı́a de los recursos mineros y
energéticos en la Universidad de Vigo, el grado tiene tres asignaturas cuya docencia corresponde
al área de Matemática Aplicada. En el primer cuatrimestre se imparten Álgebra Lineal y Cálculo
I, y en el segundo cuatrimestre Cálculo II.
La primera parte del cálculo (a la que corresponden estos apuntes) se dedica al estudio de la
continuidad y diferenciabilidad de funciones de una y varias variables reales y sus aplicaciones. A
su docencia se dedican 40 horas de aula (teorı́a y problemas) y 10 horas de laboratorio (prácticas
de ordenador y problemas).

Estas notas no pretenden sustituir ni a los apuntes de clase ni a los libros de la bibliografı́a
(que incluyen mucho más material, en particular muchos más dibujos y ejemplos), sino servir
de ayuda para que los alumnos tengan el material del curso organizado.

Agradezco la cuidadosa lectura y las observaciones de Guillermo Garcı́a Lomba, que han
ayudado a pulir versiones anteriores.

iii
Capı́tulo 1

Preliminares

1.1. Introducción.
En la primera parte del curso se estudia el cálculo en una variable real, con lo que el conjunto
protagonista es el de los números reales, que denotaremos por R. En este capı́tulo preliminar
recordaremos algunas cuestiones importantes que se utilizan en los temas siguientes, como la
relación de orden total de los números reales, el valor absoluto y el concepto de función.

1.2. La relación de orden en el conjunto de los números reales.


Una caracterı́stica fundamental en el conjunto R de los números reales es que existe una
relación de orden total compatible con las operaciones. En particular, se verifican las siguientes
propiedades:

1. Si x ≤ y y z ∈ R entonces x + z ≤ y + z.

2. Si x ≤ y y λ > 0 entonces λx ≤ λy.

3. Si x ≤ y y λ < 0 entonces λx ≥ λy. En particular, x ≤ y =⇒ −x ≥ −y.

4. Si 0 < x < y entonces 0 < 1/y < 1/x.

Intervalos.
La relación de orden permite definir los intervalos, que son los subconjuntos de números
reales que usaremos más habitualmente. Si a, b son dos números reales tales que a < b, se definen
los siguientes intervalos:

(a, b) = {x ∈ R / a < x < b} (Intervalo abierto de extremos a y b).

[a, b] = {x ∈ R / a ≤ x ≤ b} (Intervalo cerrado de extremos a y b).

[a, b) = {x ∈ R / a ≤ x < b}.

(a, b] = {x ∈ R / a < x ≤ b}.

1
2 1. Preliminares

Observaciones:

1. Estos dos últimos se llaman intervalos semiabiertos o semicerrados.

2. Todos estos tipos de intervalos se llaman intervalos finitos o acotados. Los intervalos ce-
rrados acotados [a, b] se llaman también intervalos compactos.

Existen otros intervalos infinitos o no acotados:

Abiertos: (a, ∞) = {x ∈ R / x > a}, (−∞, b) = {x ∈ R / x < b}.

Cerrados: [a, ∞) = {x ∈ R / x ≥ a}, (−∞, b] = {x ∈ R / x ≤ b}.

Obsérvese que R = (−∞, ∞) también es un intervalo no acotado.

1.3. El valor absoluto.


Se define el valor absoluto de un número real x como

x si x ≥ 0
|x| =
−x si x < 0

Propiedades

1. |x| ≥ 0, ∀ x ∈ R y además |x| = 0 ⇐⇒ x = 0.

2. |x| = | − x|, ∀ x ∈ R.

3. |x · y| = |x| · |y|, ∀ x, y ∈ R.

4. |x + y| ≤ |x| + |y|, ∀ x, y ∈ R.

5. Si r > 0 entonces |x| ≤ r ⇐⇒ −r ≤ x ≤ r ⇐⇒ x ∈ [−r, r].

La propiedad 5 permite caracterizar el intervalo [x0 − r, x0 + r] centrado en x0 ∈ R y de


radio r > 0 en términos del valor absoluto:

x ∈ [x0 − r, x0 + r] ⇐⇒ |x − x0 | ≤ r.

Lo mismo se obtiene para intervalos abiertos utilizando la desigualdad estricta.


1.4. Funciones reales de variable real. 3

1.4. Funciones reales de variable real.


Las funciones reales de variable real son el objeto principal de los primeros temas del curso.
En esta sección repasamos algunos conceptos relacionados.
Sea D un subconjunto de R. Una función real de variable real (en adelante nos referiremos
a ella únicamente como función) es una correspondencia f : D → R que asigna a cada número
x ∈ D un único número f (x) ∈ R que se llama imagen de x.
El conjunto D se llama dominio de definición de f . Se llama imagen de f o rango de f al
conjunto f (D) = {f (x) / x ∈ D}.
Por ejemplo, la aplicación f (x) = ln(x) está definida únicamente en D = (0, ∞) y su imagen
es f (D) = R, ya que todo número real y se puede escribir como y = ln(ey ) = f (ey ).

Composición de funciones. Sean f : D1 → R, g : D2 → R. Si f (D1 ) ⊂ D2 , se puede definir


la composición (g ◦ f ) : D1 → R como (g ◦ f )(x) = g(f (x)), ∀ x ∈ D1 .
Por ejemplo, si f (x) = x2 + 1 y g(x) = ln(x), se define (g ◦ f ) : R → R como
(g ◦ f )(x) = g(f (x)) = ln(x2 + 1), ∀ x ∈ R.
Funciones inversas.
Se dice que dos funciones f : D1 → R, g : D2 → R son inversas si (g ◦ f )(x) = x, ∀ x ∈ D1
y (f ◦ g)(y) = y, ∀ y ∈ D2 . Si f y g son inversas, se denota g = f −1 .
Por ejemplo, las funciones f (x) = ex y g(x) = ln(x) son inversas ya que
g(f (x)) = ln(ex ) = x, ∀ x ∈ R ; f (g(y)) = eln(y) = y, ∀ y ∈ (0, ∞).
En general, aunque una función f : D → R tenga inversa, no es sencillo calcularla. Por
ejemplo, la función f : R → R definida por f (x) = x + ex tiene inversa pero no se puede
encontrar una expresión sencilla para ella. En ocasiones, saber que la función tiene inversa
también es útil, aunque no se pueda calcular explı́citamente.
Las funciones que tienen inversa se llaman funciones inyectivas. Se caracterizan por la
siguiente propiedad: f es inyectiva si y sólo si para cualquier par de números reales distintos
x, y ∈ D sus imágenes f (x), f (y) también son distintas. Por ejemplo, la función f : R → R
definida por f (x) = x2 no es inyectiva ya que f (−1) = f (1) = 1.
Sea I un intervalo real. Una función f : I → R es estrictamente creciente si para cualquier
par de números reales distintos x, y ∈ I se cumple que x < y =⇒ f (x) < f (y). Diremos que f
es estrictamente decreciente si x < y =⇒ f (x) > f (y). Las funciones estrictamente crecientes
o decrecientes se llaman funciones estrictamente monótonas. Es inmediato probar que toda
función estrictamente monótona es inyectiva y por tanto tiene inversa. Por ejemplo, la función
f (x) = x + ex mencionada antes es claramente creciente ya que x < y =⇒ x + ex < y + ey .
Como y = f (x) ⇐⇒ x = f −1 (y), el punto (x, y) está en la gráfica de f si y sólo si el punto
(y, x) está en la gráfica de f −1 . Esto quiere decir que las gráficas de f y f −1 son simétricas
respecto de la recta y = x.
Ejercicio de aplicación: representar la gráfica de la función arccos(x) en el intervalo [−1, 1].

Repaso. Se recomienda repasar las propiedades principales y las gráficas de las funciones ex ,
ln(x), sen(x), cos(x), tg(x) y arctg(x).
4 1. Preliminares
Capı́tulo 2

Lı́mites y continuidad de funciones


de una variable

2.1. Introducción.
En este capı́tulo se introducen los conceptos de lı́mite de una función en un punto y de
lı́mite en infinito. La noción de lı́mite conduce a la importante definición de continuidad. Al
final del tema se enuncian varios teoremas importantes que dependen de forma esencial de la
continuidad.

2.2. Lı́mite de una función en un punto.


Sea x0 ∈ R y sea f una función definida en los intervalos (x0 − r, x0 ) y (x0 , x0 + r) para
algún r > 0. Se dice que existe el lı́mite de f en x0 si ocurre una de las siguientes posibilidades:

1. lı́m f (x) = y0 ∈ R si las imágenes de los puntos cercanos a x0 se aproximan a y0 .


x→x0
Formalmente,

lı́m f (x) = y0 ⇐⇒ [∀ ε > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ |f (x) − y0 | < ε] .


x→x0

2. lı́m f (x) = ∞ si las imágenes de los puntos cercanos a x0 toman valores arbitrariamente
x→x0
grandes. Formalmente,

lı́m f (x) = ∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ f (x) > M ] .


x→x0

3. lı́m f (x) = −∞ si las imágenes de los puntos cercanos a x0 toman valores negativos
x→x0
arbitrariamente grandes en valor absoluto. Formalmente,

lı́m f (x) = −∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ f (x) < −M ] .


x→x0

5
6 2. Lı́mites y continuidad de funciones de una variable

Si no sucede ninguna de las situaciones anteriores, diremos que no existe el lı́mite de f en


x0 .
En ocasiones no existe el lı́mite de una función en x0 , pero existe alguno de los lı́mites
laterales. El concepto de lı́mite lateral se define de forma muy parecida al de lı́mite.
Sea f una función real. Si x0 es un número real tal que f está definida en un intervalo
(x0 − r, x0 ) para algún r > 0 entonces diremos que existe el lı́mite por la izquierda de f en
x0 si ocurre una de las siguientes posibilidades:

1) lı́m f (x) = y0 ⇐⇒ [∀ ε > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 ) =⇒ |f (x) − y0 | < ε] .


x→x−
0

2) lı́m f (x) = ∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 ) =⇒ f (x) > M ] .


x→x−
0

3) lı́m f (x) = −∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 ) =⇒ f (x) < −M ] .


x→x−
0

Si lı́m f (x) = ±∞ se dice que la recta vertical x = x0 es una ası́ntota vertical de la


x→x−
0
gráfica de f por la izquierda.

De modo completamente análogo (cambiando (x0 −δ, x0 ) por (x0 , x0 +δ)) se define el lı́mite
por la derecha de f en x0 si f está definida en un intervalo de la forma (x0 , x0 + r) para algún
r > 0. Se denota lı́m f (x).
x→x+
0
Si lı́m f (x) = ±∞ se dice que la recta vertical x = x0 es una ası́ntota vertical de la gráfica
x→x+
0
de f por la derecha.

Observación. Si f está definida en intervalos de la forma (x0 − r, x0 ) y (x0 , x0 + r) para algún


r > 0 entonces existe lı́m f (x) si y sólo si existen los lı́mites laterales y coinciden, es decir,
x→x0
lı́m f (x) = lı́m f (x). Por ejemplo, consideremos la función f : (−∞, 0) ∪ (0, ∞) → R definida
x→x−
0 x→x+
0
por f (x) = 1/|x|. Existe lı́m f (x) = ∞ ya que 1/|x| toma valores arbitrariamente grandes y
x→0
positivos cuando x se aproxima a cero tanto por la derecha como por la izquierda.

Otros ejemplos:

1. Sea f : (0, ∞) → R definida por f (x) = ln(x). Existe lı́m f (x) = −∞ ya que ln(x) toma
x→0+
valores arbitrariamente grandes y negativos cuando x se aproxima a cero por la derecha.

2. Sea f : (−π/2, π/2) → R definida por f (x) = tg(x).

lı́m f (x) = ∞ ; lı́m f (x) = −∞.


x→π/2− x→−π/2+

3. Sea f : (−∞, 0) ∪ (0, ∞) → R dada por f (x) = sen(x)/x. Veremos que existe lı́m f (x) = 1.
x→0
2.3. Continuidad. 7

2.3. Continuidad.
Sea f : I → R una función definida en un intervalo abierto I. Se dice que f es continua en
un punto x0 ∈ I si existe el lı́mite de f en x0 y además

lı́m f (x) = f (x0 ).


x→x0

Si f no es continua en x0 , diremos que f tiene una discontinuidad en x0 . Consideraremos


dos tipos distintos de discontinuidades:

1. Discontinuidad de salto. Se produce cuando existen los lı́mites laterales de f en x0 pero


no coinciden. Se dice que el salto es finito si los dos lı́mites laterales son finitos. Si alguno
de ellos es infinito, diremos que el salto es infinito.

2. Discontinuidad esencial. Se produce cuando no existe alguno de los lı́mites laterales de


f en x0 .

Ejemplos:

1. Sea f : R → R definida por



sen(x) si x ≤ 0
f (x) =
ln(x) si x > 0.

Existe una discontinuidad de salto infinito en x0 = 0, ya que

lı́m f (x) = sen(0) = 0 ; lı́m f (x) = lı́m ln(x) = −∞.


x→0− x→0+ x→0+

2. Sea f : R → R definida por



sen(x) si x ≤ 0
f (x) =
sen(1/x) si x > 0.

Existe una discontinuidad esencial en x0 = 0, ya que no existe lı́m f (x) = lı́m sen(1/x).
x→0+ x→0+
La razón es que cuando x se aproxima a cero por la derecha, la función f toma todos los
valores entre −1 y 1 en cada intervalo de la forma [1/(kπ + 2π), 1/(kπ)], k ∈ N.

Se dice que una función es continua en un conjunto A si es continua en todos los puntos de A.

Algunos ejemplos de funciones continuas.


Las funciones más comunes son continuas en sus dominios de definición. Por ejemplo:

Las funciones polinómicas p(x) = a0 + a1 x + a2 x2 + · · · + an xn , donde a0 , a1 , . . . , an ∈ R,


son continuas en R.

Las funciones racionales (cocientes de polinomios) r(x) = p(x)/q(x) son continuas en su


dominio de definición, es decir, en el conjunto de los números reales x tales que q(x) 6= 0.
8 2. Lı́mites y continuidad de funciones de una variable

La función exponencial ex es continua en R y ln(x) es continua en (0, ∞).


Las funciones trigonométricas sen(x), cos(x), tg(x) y sus inversas arcsen(x), arccos(x),
arctg(x) son continuas en sus respectivos dominios de definición.
Los ejemplos anteriores, combinados con las propiedades que enunciamos a continuación,
permiten probar la continuidad de muchas funciones.

Propiedades.
1. La composición de funciones continuas es una función continua. Por ejemplo, la función
f (x) = ln(1 + | cos(x)|) es continua en R ya que f (x) = f1 (f2 (f3 (f4 (x)))), donde f1 (x) =
ln(x), f2 (x) = 1 + x, f3 (x) = |x| y f4 (x) = cos(x) son continuas.
2. Si f y g son funciones continuas en x0 entonces las funciones (f +g) y (f ·g) son continuas en
x0 . La función f /g es continua en x0 si g(x0 ) 6= 0. Por ejemplo, la función f (x) = ex /(x−1)
es continua para todo x 6= 1.

2.4. Lı́mites en infinito.


Sea f una función definida en el intervalo (a, ∞) para algún a ∈ R. Diremos que existe el
lı́mite de f en ∞ si ocurre una de las siguientes posibilidades:
1. lı́m f (x) = y0 ⇐⇒ [∀ ε > 0, ∃M > 0 / x > M =⇒ |f (x) − y0 | < ε] . Es decir, y0 es el lı́mite
x→∞
de f cuando x tiende a infinito si f (x) se aproxima arbitrariamente a y0 cuando x se hace
suficientemente grande.
2. lı́m f (x) = ∞ ⇐⇒ ∀ M > 0, ∃M 0 > 0 / x > M 0 =⇒ f (x) > M . Es decir, si f (x) toma
 
x→∞
valores arbitrariamente grandes cuando x se hace suficientemente grande.
3. lı́m f (x) = −∞ ⇐⇒ ∀ M > 0, ∃M 0 > 0 / x > M 0 =⇒ f (x) < −M .
 
x→∞

Si no sucede ninguna de las situaciones anteriores, diremos que no existe el lı́mite de f en


infinito.
De modo completamente análogo se define el lı́mite de f en −∞ si f está definida en (−∞, b)
para algún b ∈ R.

Si y0 ∈ R es el lı́mite de f en ±∞, entonces la recta horizontal y = y0 es una ası́ntota


horizontal de la gráfica de f .

Ejemplos:
1. lı́m ex = ∞, lı́m ex = 0.
x→∞ x→−∞

2. lı́m 1/x = lı́m 1/x = 0.


x→∞ x→−∞

3. No existe lı́m sen(x).


x→∞
2.5. Cálculo de lı́mites. 9

2.5. Cálculo de lı́mites.


Las siguientes propiedades son útiles para el cálculo de lı́mites:

1. Sean f y g dos funciones. Supongamos que existen lı́m f (x) ∈ R y lı́m g(x) ∈ R (x0
x→x0 x→x0
puede ser ±∞). Entonces:

a) lı́m (f (x) + g(x)) = lı́m f (x) + lı́m g(x).


x→x0 x→x0 x→x0
   
b) lı́m (f (x) · g(x)) = lı́m f (x) · lı́m g(x) .
x→x0 x→x0 x→x0
   
c) lı́m (f (x)/g(x)) = lı́m f (x) / lı́m g(x) , si lı́m g(x) 6= 0.
x→x0 x→x0 x→x0 x→x0

    lı́m g(x)
x→x0
d ) lı́m f (x)g(x) = lı́m f (x) , si lı́m f (x) > 0.
x→x0 x→x0 x→x0

Algunas de las propiedades anteriores se pueden extender al caso en que alguno de los
lı́mites es ±∞, teniendo en cuenta las relaciones formales ∞ + ∞ = ∞, ∞ · ∞ = ∞,
λ · ∞ = ∞ si λ > 0, λ · ∞ = −∞ si λ < 0, ∞∞ = ∞.
 
2. Si g es continua y existe lı́m f (x) entonces lı́m g(f (x)) = g lı́m f (x) .
x→x0 x→x0 x→x0
 
Por ejemplo, lı́m ln(x + 1) = ln lı́m (x + 1) = ln(1) = 0.
x→0 x→0

3. Si lı́m f (x) = 0 y g está acotada en un entorno de x0 entonces lı́m (f (x) · g(x)) = 0. Por
x→x0 x→x0
ejemplo, lı́m sen(x)/x = 0, ya que sen(x) está acotada y lı́m 1/x = 0.
x→∞ x→∞

4. Si f, g, h son tres funciones tales que h(x) ≤ f (x) ≤ g(x) en un entorno de x0 y lı́m h(x) =
x→x0
lı́m g(x) entonces lı́m f (x) = lı́m h(x) = lı́m g(x).
x→x0 x→x0 x→x0 x→x0

5. lı́m f (x) = 0 ⇐⇒ lı́m |f (x)| = 0.


x→x0 x→x0

En muchos caso el cálculo de lı́mites conduce a indeterminaciones. Algunas de ellas se re-


solverán utilizando la regla de L’Hôpital, que se introduce en el tema siguiente.

2.6. Algunos teoremas para funciones continuas.


En esta sección se recogen cuatro resultados muy útiles basados en la continuidad. Son
resultados muy intuitivos que se deducen del siguiente teorema:
Teorema 2.1 Sea I un intervalo real y f : I → R una función continua. Entonces f (I) =
{f (x) / x ∈ I} también es un intervalo. Además, si I = [a, b] es un intervalo compacto entonces
f ([a, b]) = [c, d] también es un intervalo compacto.
10 2. Lı́mites y continuidad de funciones de una variable

Como consecuencias de este resultado se tienen los siguientes teoremas importantes:

Teorema 2.2 (Teorema de los valores extremos) Sea f : [a, b] → R una función continua.
Entonces existen m, M ∈ R tales que m = mı́n f (x), M = máx f (x).
x∈[a,b] x∈[a,b]

Por ejemplo, sea f : [0, 2] → R definida por f (x) = x4 − 2x2 . Se puede probar que

mı́n f (x) = f (1) = −1 ; máx f (x) = f (2) = 8.


x∈[0,2] x∈[0,2]

Este resultado no tiene por qué ser cierto si f no es continua o no está definida en un
intervalo compacto. Por ejemplo, la función f : (0, 2) → R definida por f (x) = 1/x es continua
pero no existe máx f (x) ya que lı́m f (x) = ∞.
x∈(0,2) x→0+

Teorema 2.3 (Teorema de los valores intermedios) Sea f : [a, b] → R una función con-
tinua. Sean m = mı́n f (x), M = máx f (x). Para cualquier c tal que m < c < M existe al
x∈[a,b] x∈[a,b]
menos un número x ∈ [a, b] tal que f (x) = c.

Teorema 2.4 (Teorema de Bolzano) Sea f : [a, b] → R una función continua.


Si f (a) · f (b) < 0 entonces existe al menos un número x ∈ [a, b] tal que f (x) = 0.

El teorema de Bolzano es una buena herramienta para probar la existencia de ceros de una
función. (Diremos que c es un cero o una raı́z de f si f (c) = 0.)
Por ejemplo, la función continua f (x) = ex − x4 tiene un cero en el intervalo [1, 2] ya que
f (1) = e − 1 > 0 y f (2) = e2 − 16 < 0.

Teorema 2.5 (Teorema de punto fijo) Si f : [a, b] → [a, b] es una función continua entonces
existe al menos un punto fijo de f en [a, b], es decir, ∃ x ∈ [a, b] / f (x) = x.

En realidad, para asegurar la existencia de un punto fijo es suficiente considerar la función


g(x) = f (x) − x y probar que es continua y g(a) · g(b) < 0.
Por ejemplo, la función continua f (x) = ex−2 tiene un punto fijo en [0, 1] ya que si definimos
g(x) = f (x) − x entonces g(0) = f (0) − 0 = e−2 > 0 y g(1) = f (1) − 1 = e−1 − 1 < 0.
Capı́tulo 3

Derivación de funciones de una


variable

3.1. Introducción.
En este capı́tulo se introduce el concepto de derivada de una función en un punto y algunas
de sus propiedades, como la regla de la cadena. El cálculo diferencial es la herramienta más eficaz
para obtener propiedades de una función como sus intervalos de crecimiento, decrecimiento,
concavidad y convexidad. También tiene importantes aplicaciones al cálculo de lı́mites (y por
tanto de ası́ntotas) y a la aproximación de funciones por otras más sencillas.

3.2. El problema de la tangente.


Una de las aplicaciones del cálculo de lı́mites, que conduce al concepto de derivada, es la
definición precisa de lo que se entiende por recta tangente a una curva en un punto. La idea
intuitiva de que la tangente es la recta que toca en un único punto a la curva funciona bien con
algunas curvas, como la circunferencia, pero en general es bastante ambigua en otras situaciones.
Para la curva de la figura 3.1, la recta en trazo discontinuo sólo toca una vez a la gráfica, mientras
que la de trazo continuo la toca dos veces. Sin embargo, esta última es la recta tangente.
La definición correcta de recta tangente se basa en que la pendiente de la recta tangente a
una curva en el plano (x, y) representa la razón de cambio instantáneo de y con respecto a x.
Si f es una función, la razón promedio de cambio en un intervalo [x0 , x0 + h] de longitud h
viene dada por el cociente de incrementos

∆y f (x0 + h) − f (x0 )
= .
∆x h
Por tanto, tiene sentido definir la razón de cambio instantánea como

f (x0 + h) − f (x0 )
lı́m . (1)
h→0 h

11
12 3. Derivación de funciones de una variable

Figura 3.1: Ilustración del concepto de recta tangente.

Para cada h > 0, el cociente de incrementos representa la pendiente de la recta que pasa por
los puntos (x0 , f (x0 )) y (x0 + h, f (x0 + h)). Estas rectas cortan a la gráfica de f en dos puntos y
se aproximan cuando h tiende a cero a la recta tangente a la gráfica de f en el punto (x0 , f (x0 )).
Por tanto, si el lı́mite definido en (1) existe, se puede definir de forma precisa la recta tangente
en x0 como la recta que pasa por (x0 , f (x0 )) y tiene como pendiente dicho lı́mite.
La razón de cambio instantánea definida por (1) conduce al concepto de derivada de una
función en un punto.

3.3. Derivada de una función en un punto.


Consideremos una función f : I → R, donde I es un intervalo abierto (acotado o no). Se
dice que f es derivable en un punto x0 ∈ I, si existe el siguiente lı́mite y es finito:

f (x0 + h) − f (x0 )
lı́m .
h→0 h
En caso de que exista, se llama derivada de f en x0 y se denota por f 0 (x0 ). Si el lı́mite
no existe o es infinito, diremos que f no es derivable en x0 o que no existe la derivada de f en x0 .

Una definición equivalente de f 0 (x0 ) se obtiene tomando h = x − x0 :

f (x0 + h) − f (x0 ) f (x) − f (x0 )


f 0 (x0 ) = lı́m = lı́m .
h→0 h x→x0 x − x0
Ejemplo:
La función f (x) = x2 es derivable en todo punto x ∈ R y además

f (x + h) − f (x) (x + h)2 − x2 h2 + 2xh


f 0 (x) = lı́m = lı́m = lı́m = lı́m (h + 2x) = 2x.
h→0 h h→0 h h→0 h h→0
3.3. Derivada de una función en un punto. 13

Interpretación geométrica.
Como hemos comentado antes, la derivada de f en x0 representa la pendiente de la recta
tangente a la gráfica de f en el punto (x0 , f (x0 )). Por tanto, la ecuación de dicha recta tangente
es
y − f (x0 ) = f 0 (x0 )(x − x0 ).
Por ejemplo, la función f (x) = x2 es derivable en x0 = 1 y f 0 (1) = 2. Por tanto, la ecuación
de la recta tangente a la gráfica de f en el punto (1, 1) es y − 1 = 2(x − 1). Las gráficas de f y
la recta tangente R se representan en la figura 3.2.

4 f(x)
3

2
R(x)
1

-2 -1 1 2

-1

Figura 3.2: Gráfica de f (x) = x2 y su tangente en (1, 1).

Derivadas laterales.
También se pueden definir las derivadas laterales de f en x0 .
Se llama derivada por la izquierda de f en x0 , y se denota f 0 (x−
0 ), al lı́mite

f (x0 + h) − f (x0 )
f 0 (x−
0 ) = lı́m ,
h→0− h
siempre que éste exista y sea finito.
Análogamente, se define la derivada por la derecha f 0 (x+
0 ) tomando el lı́mite por la derecha.

Propiedad. f es derivable en x0 si y sólo si existen f 0 (x− 0 + 0 − 0 +


0 ) y f (x0 ) y además f (x0 ) = f (x0 ).

Ejemplo:
La función f (x) = |x| no es derivable en x0 = 0 ya que

f (0 + h) − f (0) |h| −h
f 0 (0− ) = lı́m = lı́m = lı́m = −1
h→0− h h→0 − h h→0 − h
f (0 + h) − f (0) |h| h
f 0 (0+ ) = lı́m = lı́m = lı́m = 1.
h→0+ h h→0 + h h→0 h+
14 3. Derivación de funciones de una variable

En caso de que una función f esté definida en un intervalo compacto [a, b], la derivada de
f en a se define como la derivada por la derecha y la derivada de f en b se entenderá como la
derivada por la izquierda.

3.4. Función derivada. Derivadas sucesivas.


Sea f : I → R una función. Se dice que f es derivable en I si es derivable en todos los
puntos de I. En este caso se puede definir la función derivada de f :

f 0 : I −→ R
x 7→ f 0 (x)

Si la función f 0 es a su vez derivable en I entonces se define la derivada segunda (o derivada


de orden 2) de f como f 00 (x) = (f 0 )0 (x), ∀ x ∈ I. En general, si n ≥ 2, existe la derivada de
orden n − 1 de f y f n−1) es derivable en I entonces se define f n) (x) = (f n−1) )0 (x), ∀ x ∈ I. En
este caso, se dice que f es n veces derivable en I y f n) se llama derivada n-ésima de f en I.
Por convenio, se define f 0) (x) = f (x).
Se dice que una función es de clase n en I y se denota f ∈ C n (I) si f es n veces derivable
en I y la función f n) es continua.
Si f tiene derivadas de todos los órdenes entonces se dice que f es de clase infinito y se
denota f ∈ C ∞ (I).

Ejemplos:

1. La función f (x) = ex es de clase infinito en R ya que existen todas las derivadas sucesivas
de f . De hecho, f n) (x) = ex , ∀ n ∈ N.

2. La función f : R → R definida por

−x2 si x ≤ 0

f (x) =
x2 si x > 0

es derivable en R, pero su derivada



0 −2x si x ≤ 0
f (x) =
2x si x > 0

no es derivable en x = 0. Por tanto f ∈ C 1 (R) pero f 6∈ C 2 (R).

Observación. Toda función derivable es continua. Sin embargo, no toda función continua es
derivable. Por ejemplo, la función f (x) = |x| es continua en R pero no es derivable en x = 0.
3.5. Propiedades de las derivadas. 15

Derivación de funciones definidas a trozos.


El siguiente resultado simplifica el estudio de la derivabilidad en funciones definidas a trozos:

Proposición 3.1 Sea f una función continua en un punto x0 y derivable en los intervalos
(x0 − r, x0 ) y (x0 , x0 + r) para algún r > 0. Supongamos que existen lı́m f 0 (x) y lı́m f 0 (x).
x→x−
0 x→x+
0
0 0
Entonces f es derivable en x0 si y sólo si lı́m f (x) = lı́m f (x). Además, en ese caso,
x→x−
0 x→x+
0
0
f 0 (x0 ) = lı́m f (x) y por tanto f 0 es continua en x0 .
x→x0

Por ejemplo, consideremos la función f : R → R definida por

−x2 si x ≤ 0

f (x) =
x2 si x > 0

Claramente f es derivable para todo x 6= 0 y



0 −2x si x < 0
f (x) =
2x si x > 0

Como lı́m f 0 (x) = lı́m f 0 (x) = 0, se deduce que f es derivable en x = 0 y f 0 (0) = 0. Por tanto
x→0− x→0+
f 0 está definida y es continua en R:

0 −2x si x ≤ 0
f (x) =
2x si x > 0

Ahora, como 
−2 si x < 0
f 00 (x) =
2 si x > 0
es claro que lı́m f 00 (x) = −2 6= lı́m f 00 (x) = 2 y por tanto no existe f 00 (0).
x→0− x→0+

3.5. Propiedades de las derivadas.


Sean f : I → R, g : I → R dos funciones derivables en un punto x0 ∈ I. Entonces:

1. (f + g) es derivable en x0 y (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ).

2. (λf ) es derivable en x0 y (λf )0 (x0 ) = λf 0 (x0 ), ∀ λ ∈ R.

3. (f · g) es derivable en x0 y (f · g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).

4. Si g(x0 ) 6= 0, (f /g) es derivable en x0 y

f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )


(f /g)0 (x0 ) = .
(g(x0 ))2
16 3. Derivación de funciones de una variable

Regla de la cadena.
Se conoce con el nombre de regla de la cadena a la fórmula para la derivada de la composición
de dos funciones.
Sean f : D1 → R, g : D2 → R tales que f (D1 ) ⊂ D2 . Si f es derivable en x0 y g es derivable
en f (x0 ) entonces (g ◦ f ) es derivable en x0 y además
(g ◦ f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ).
Ejemplo.
2 2
La función f (x) = e(x ) es derivable en R y f 0 (x) = (2x)e(x ) , ∀ x ∈ R.

3.6. Cálculo de derivadas en algunos casos especiales.


Derivadas de funciones implı́citas
En algunas ocasiones la variable y no está expresada como una función explı́cita de x (es
decir, y = f (x)), sino de forma implı́cita mediante una expresión F (x, y) = 0.
Por ejemplo, los puntos de la circunferencia de centro (0, 0) y radio 1 están definidos por la
ecuación x2 + y 2 = 1.
Para calcular la derivada de y respecto de x no es necesario despejar y en función de x.
Veamos el procedimiento con el caso de la circunferencia:
Escribiendo y = y(x) y aplicando la regla de la cadena, se tiene
−x
x2 + y(x)2 = 1 =⇒ 2x + 2y(x)y 0 (x) = 0 =⇒ y 0 (x) = .
y(x)
√ √
Por ejemplo, en el punto (1/ 2, 1/ 2) se tiene:

0
√ −1/ 2
y (1/ 2) = √ = −1,
1/ 2
y la ecuación de la recta tangente a la circunferencia en ese punto es:
 
1 1
y − √ = (−1) x − √ ,
2 2

es decir, y = −x + 2.

Derivadas de funciones inversas.


Supongamos que f es derivable y estrictamente monótona en un intervalo I. Entonces
f tiene inversa y f −1 también es derivable. Denotemos y = f (x). Teniendo en cuenta que
f ◦ f −1 (x) = x, por la regla de la cadena se tiene:
0 1
f ◦ f −1 (x) = f 0 (f −1 (x)) · (f −1 )0 (x) = 1 =⇒ (f −1 )0 (x) = .
f 0 (f −1 (x))
Por ejemplo, si f (x) = tg(x), se tiene que f −1 (x) = arctg(x) y f 0 (x) = 1 + (tg(x))2 . Por
tanto, la derivada de la función arco tangente es:
1 1 1
(f −1 )0 (x) = 0 −1 = = .
f (f (x)) 1 + (tg(arctg(x)))2 1 + x2
3.7. La regla de L’Hôpital. 17

3.7. La regla de L’Hôpital.


En esta sección nos saltamos el orden usual por dos razones: la primera es que la regla de
L’Hôpital es la aplicación de las derivadas más relacionada con el tema anterior. De hecho es
probablemente el método más efectivo para el cálculo de lı́mites en el caso de indeterminaciones.
El segundo motivo es que no se incluye la demostración del teorema y eso nos permite dejar el
teorema del valor medio para más adelante.

Teorema 3.1 (Regla de L’Hôpital) Sea x0 ∈ R. Sean f y g dos funciones definidas y deri-
vables en los intervalos (x0 − r, x0 ) y (x0 , x0 + r) para algún r > 0, de tal manera que g no se
anula en esos intervalos. Supongamos que se cumplen las siguientes condiciones:

(a) lı́m f (x) = lı́m g(x) = 0 o lı́m f (x) = lı́m g(x) = ∞


x→x0 x→x0 x→x0 x→x0

(b) Existe lı́m (f 0 (x)/g 0 (x)) = l (l puede ser finito o infinito).


x→x0

Entonces existe lı́m (f (x)/g(x)) y


x→x0

f (x) f 0 (x)
lı́m = lı́m 0 .
x→x0 g(x) x→x0 g (x)

El resultado del teorema sigue siendo cierto si x0 = ±∞ y las funciones f y g son derivables
en intervalos de la forma (a, ∞) o (−∞, b). También se aplica para el cálculo de lı́mites laterales
en caso de que f /g sólo esté definida a la izquierda o a la derecha de x0 .

Ejemplo.
sen(x) cos(x)
lı́m = lı́m = cos(0) = 1.
x→0 x x→0 1
Órdenes de crecimiento
Hay muchas funciones que tienen lı́mite infinito en infinito. Sin embargo, también es im-
portante la magnitud del crecimiento. Por ejemplo, es sabido que el crecimiento exponencial es
más rápido que el crecimiento logarı́tmico.
Sean f , g dos funciones tales que lı́m f (x) = lı́m g(x) = ∞. La regla de L’Hôpital ayuda
x→∞ x→∞
a decidir cuál de ellas crece más rápido. Diremos que f y g tienen el mismo orden de crecimiento
cuando cuando x tiende a infinito si lı́m (f (x)/g(x)) = c > 0. Si lı́m (f (x)/g(x)) = ∞ diremos
x→∞ x→∞
que el orden de crecimiento de f en infinito es mayor que el de g.

Los siguientes órdenes de crecimiento en infinito están ordenados de mayor a menor:

1. Crecimiento exponencial: f crece exponencialmente cuando x tiende a infinito si existen


constantes a > 0 y c > 0 tales que lı́m (f (x)/eax ) = c.
x→∞

2. Crecimiento superlineal: f crece superlinealmente cuando x tiende a infinito si existen


constantes a > 1 y c > 0 tales que lı́m (f (x)/xa ) = c.
x→∞
18 3. Derivación de funciones de una variable

3. Crecimiento lineal: f crece linealmente cuando x tiende a infinito si existe una constante
c > 0 tal que lı́m (f (x)/x) = c.
x→∞

4. Crecimiento sublineal: f crece sublinealmente cuando x tiende a infinito si existen cons-


tantes a ∈ (0, 1) y c > 0 tales que lı́m (f (x)/xa ) = c.
x→∞

5. Crecimiento logarı́tmico: f tiene crecimiento logarı́tmico cuando x tiende a infinito si existe


una constante c > 0 tal que lı́m (f (x)/ ln(x)) = c.
x→∞

Por ejemplo, veamos que el crecimiento sublineal es más rápido que el logarı́tmico usando
la regla de L’Hôpital. En efecto,
xa axa−1
lı́m = lı́m = lı́m axa = ∞, ∀ a > 0.
x→∞ ln x x→∞ x−1 x→∞

3.8. Extremos relativos de una función.


Las siguientes aplicaciones que veremos del cálculo diferencial se dirigen en primer lugar al
estudio cualitativo de las funciones, con especial atención al crecimiento, decrecimiento, conca-
vidad y convexidad. Pero, además, los teoremas que se incluyen en esta sección tienen muchas
otras aplicaciones.
Empezamos recordando el concepto de máximo y mı́nimo relativo de una función. Sea
f : D → R una función. Se dice que f alcanza un máximo relativo en un punto x0 ∈ D si
existe un número r > 0 tal que f (x) ≤ f (x0 ) para todos los puntos x ∈ D tales que |x − x0 | < r.
Análogamente, f alcanza un mı́nimo relativo en un punto x0 ∈ D si existe un número
r > 0 tal que f (x) ≥ f (x0 ) para todos los puntos x ∈ D tales que |x − x0 | < r.

Observaciones:
1. En cualquiera de los dos casos anteriores se dice que f tiene un extremo relativo en x0 .

2. El extremo es estricto si las desigualdades que relacionan f (x) y f (x0 ) son estrictas.

3. El extremo es absoluto si las desigualdades f (x) ≤ f (x0 ) o f (x) ≥ f (x0 ) se cumplen para
todo x ∈ D.
En virtud del teorema de los valores extremos (Teorema 2.2), si f : [a, b] → R es una
función continua entonces siempre se alcanzan el máximo y el mı́nimo absolutos, es decir, existen
x1 , x2 ∈ [a, b] tales que f (x1 ) ≤ f (x) ≤ f (x2 ), ∀ x ∈ [a, b].
El siguiente resultado facilita la búsqueda de los extremos relativos de una función.

Teorema 3.2 (Teorema del extremo relativo) Sea f : I → R una función derivable en un
intervalo abierto I. Si f tiene un extremo relativo en un punto x0 ∈ I entonces f 0 (x0 ) = 0.

Demostración. Supongamos que f 0 (x0 ) > 0. Entonces


f (x) − f (x0 )
lı́m = f 0 (x0 ) > 0.
x→x0 x − x0
3.8. Extremos relativos de una función. 19

En consecuencia, los términos (f (x) − f (x0 )) y (x − x0 ) tienen el mismo signo en un intervalo


(x0 − r, x0 + r) para algún r > 0. Por lo tanto, f (x) > f (x0 ) si x > x0 y f (x) < f (x0 ) si x < x0 .
Esto quiere decir que f no puede alcanzar un extremo relativo en x0 .
El razonamiento si f 0 (x0 ) < 0 es completamente análogo. Por tanto, la única posibilidad
para que f tenga un extremo relativo en x0 es que f 0 (x0 ) = 0. t
u

Observaciones:

1. Este teorema sólo proporciona una condición necesaria para la existencia de extremos. El
hecho de que f 0 (x0 ) = 0 no garantiza que f tenga un extremo en x0 . Por ejemplo, la
función f : R → R definida por f (x) = x3 no tiene ningún extremo relativo y sin embargo
f 0 (0) = 0.

2. El teorema sólo se puede aplicar en intervalos abiertos. Si f está definida en un intervalo


compacto [a, b], el teorema se puede usar en el intervalo (a, b). En los extremos del intervalo
se debe estudiar directamente la posible existencia de extremos. Por ejemplo, la función
f (x) = x2 definida en el intervalo [−1, 1] tiene tres extremos relativos: un mı́nimo relativo
en x = 0 y máximos relativos en x = −1 y en x = 1.

Una de las consecuencias del teorema del extremo relativo es el teorema de Rolle.

Teorema 3.3 (Teorema de Rolle) Sea f : [a, b] → R una función derivable. Si f (a) = f (b)
entonces existe al menos un punto x0 ∈ [a, b] tal que f 0 (x0 ) = 0.

Demostración. Si f es constante en [a, b] entonces f 0 (x) = 0, ∀ x ∈ (a, b). En otro caso, el


mı́nimo y el máximo absolutos de f en [a, b] son distintos. Como f (a) = f (b), necesariamente
uno de ellos se alcanza en un punto x0 ∈ (a, b). El teorema 3.2 garantiza que f 0 (x0 ) = 0. t
u

Como consecuencia del teorema de Rolle se puede relacionar el número de ceros de una
función derivable f con el número de ceros de f 0 .

Corolario 3.1 Sea f : I → R una función derivable definida en un intervalo real I. Entre dos
ceros consecutivos de f existe al menos un cero de f 0 . En consecuencia, si f 0 tiene n ceros en I
entonces f tiene a lo sumo (n + 1) ceros en I.

Demostración. Sean c1 < c2 dos ceros consecutivos de f . Entonces f : [c1 , c2 ] → R es deri-


vable y f (c1 ) = f (c2 ). Por el teorema de Rolle, existe al menos un punto x0 ∈ (c1 , c2 ) tal que
f 0 (x0 ) = 0. t
u

Ejemplo. Veamos que la función f (x) = 2ex − x − 3 tiene exactamente una raı́z positiva. En
efecto,
f 0 (x) = 2ex − 1 = 0 ⇐⇒ ex = 1/2 ⇐⇒ x = ln(1/2).
Como ln(1/2) = − ln(2) < 0, f 0 no tiene raı́ces en (0, ∞) y por tanto f tiene a lo sumo una raı́z
positiva. Por otra parte, como f (0) = −1 < 0, f (1) = 2e − 4 > 0, el teorema de Bolzano permite
afirmar que f tiene un cero en el intervalo (0, 1).
20 3. Derivación de funciones de una variable

3.9. El teorema del valor medio.


Una de las consecuencias principales del teorema de Rolle es el teorema del valor medio.

Teorema 3.4 (Teorema del valor medio) Sea f : [a, b] → R una función derivable. Enton-
ces existe al menos un punto x0 ∈ (a, b) tal que f (b) − f (a) = f 0 (x0 )(b − a).

Demostración. La prueba de este resultado consiste en aplicar el teorema de Rolle a la dife-


rencia entre f y la recta que pasa por (a, f (a)) y (b, f (b)). En efecto, sea g : [a, b] → R definida
por  
f (b) − f (a)
g(x) = f (x) − f (a) + (x − a) .
b−a
Como g es derivable y g(a) = g(b) = 0, existe un x0 ∈ (a, b) tal que g 0 (x0 ) = 0. Por tanto,

f (b) − f (a) f (b) − f (a)


g 0 (x0 ) = f 0 (x0 ) − = 0 =⇒ f 0 (x0 ) = .
b−a b−a
t
u
A continuación se obtienen algunas consecuencias de este resultado. Incluiremos las pruebas
de alguno de ellos.

Corolario 3.2 (Intervalos de crecimiento y decrecimiento) Sea f una función derivable


en un intervalo (a, b).

(a) Si f 0 (x) > 0, ∀ x ∈ (a, b) entonces f es estrictamente creciente en (a, b).

(b) Si f 0 (x) < 0, ∀ x ∈ (a, b) entonces f es estrictamente decreciente en (a, b).

Demostración. Probaremos el apartado (a): Sean x, y ∈ (a, b) tales que x < y. Tenemos que
demostrar que f (x) < f (y).
Aplicando el teorema del valor medio en el intervalo [x, y] se deduce la existencia de un
punto x0 ∈ (x, y) tal que f (y) − f (x) = f 0 (x0 )(y − x). Entonces:

f 0 (x0 ) > 0 =⇒ f (y) − f (x) > 0 =⇒ f (x) < f (y).

t
u
Recordemos que toda función estrictamente creciente o decreciente en un intervalo (a, b) es
inyectiva en (a, b) y por tanto se puede definir su inversa f −1 .

Corolario 3.3 (Determinación de máximos y mı́nimos relativos) Sea f : I → R una


función definida en un intervalo abierto I. Supongamos que f es dos veces derivable en un
entorno de un punto x0 ∈ I y f 0 (x0 ) = 0.

(a) Si f 00 (x0 ) > 0 entonces f alcanza un mı́nimo relativo estricto en x0 .

(b) Si f 00 (x0 ) < 0 entonces f alcanza un máximo relativo estricto en x0 .


3.9. El teorema del valor medio. 21

Demostración. Como antes, probaremos el primer apartado. Como f 00 (x0 ) > 0, la función f 00
toma valores positivos en un intervalo (x0 − r, x0 + r) para algún r > 0. Por el corolario 3.2, f 0
es estrictamente creciente en (x0 − r, x0 + r). En consecuencia, f 0 (x) > f 0 (x0 ) = 0 si x > x0 y
f 0 (x) < f 0 (x0 ) = 0 si x < x0 . Por tanto, f es estrictamente decreciente en (x0 − r, x0 ) y estric-
tamente creciente en (x0 , x0 +r). Esto quiere decir que f tiene en x0 un mı́nimo relativo estricto.u t

El último de los corolarios que veremos sirve para determinar los intervalos de concavidad
y convexidad de la gráfica de una función.
Recordamos estos conceptos. Sea f : I → R una función derivable en un intervalo I. En
este caso se puede definir la recta tangente a la gráfica de f en cada punto (x0 , f (x0 )), x0 ∈ I.
Se dice que la función es convexa en I si la gráfica de f queda por encima de cualquier recta
tangente a dicha gráfica en los puntos del intervalo I. Si la gráfica de f queda por debajo de cual-
quier recta tangente a dicha gráfica en los puntos del intervalo I se dirá que f es cóncava en I.
Si f es convexa a un lado de x0 y cóncava a otro se dirá que f tiene en x0 un punto de inflexión.

El ejemplo tı́pico de función convexa en R es f (x) = x2 , mientras que el de función cóncava


es f (x) = −x2 . Ambas se muestran en la figura 3.3.

4
-2 -1 1 2
3
-1
2
-2
1

-3
-2 -1 1 2

-1
-4

Figura 3.3: Gráficas de x2 y −x2 .

Corolario 3.4 (Concavidad y convexidad) Sea f : I → R una función dos veces derivable
en un intervalo abierto I.

(a) Si f 00 (x) > 0, ∀x ∈ I entonces f es convexa en I.

(b) Si f 00 (x) < 0, ∀x ∈ I entonces f es cóncava en I.

(c) Si f tiene en x0 un punto de inflexión entonces necesariamente f 00 (x0 ) = 0.

Demostración. Probemos el apartado (a). Para ello, escogemos un punto x0 ∈ I; tenemos que
demostrar que la gráfica de f queda por encima de la recta tangente a dicha gráfica en el punto
(x0 , f (x0 )). Recordemos que la ecuación de la recta tangente es y = r(x) = f (x0 )+f 0 (x0 )(x−x0 ).
Por tanto, debemos probar que

f (x) > f (x0 ) + f 0 (x0 )(x − x0 ), ∀ x ∈ I.


22 3. Derivación de funciones de una variable

Como f 00 (x) > 0, ∀x ∈ I, se deduce que f 0 es estrictamente creciente en I. Distinguimos los


casos x > x0 y x < x0 .
Por el teorema del valor medio, para cada x > x0 existe un punto ξx ∈ (x0 , x) tal que
f (x) − f (x0 ) = f 0 (ξx )(x − x0 ). Como f 0 es creciente, f 0 (ξx ) > f 0 (x0 ) y por tanto:

f (x) − f (x0 ) = f 0 (ξx )(x − x0 ) > f 0 (x0 )(x − x0 ) =⇒ f (x) > f (x0 ) + f 0 (x0 )(x − x0 ).

El caso x < x0 se resuelve de forma completamente análoga. t


u

3.10. El teorema de Taylor.


Sea f : I → R una función definida en un intervalo real I. El teorema de Taylor establece
la forma de aproximar la función f por un polinomio en un entorno de un punto x0 ∈ I. El
caso más sencillo consiste en aproximar por la recta tangente a la gráfica de f en (x0 , f (x0 )),
es decir, por el polinomio de grado uno p1 (x) = f (x0 ) + f 0 (x0 )(x − x0 ). Obsérvese que p1 es el
único polinomio de grado 1 que satisface las relaciones p1 (x0 ) = f (x0 ), p01 (x0 ) = f 0 (x0 ).
La recta tangente es una “primera aproximación”de la función f en un entorno del punto
x0 . Cabe esperar que podamos mejorar esta aproximación si imponemos condiciones adicionales
al polinomio (y por tanto incrementamos su grado).
Para una función n veces derivable en I se define el polinomio de Taylor de grado n de
f centrado en x0 al único polinomio pn (x) de grado menor o igual que n que satisface las n + 1
n)
ecuaciones pn (x0 ) = f (x0 ), p0n (x0 ) = f 0 (x0 ), . . . , pn (x0 ) = f n) (x0 ). Su expresión abreviada es
la siguiente:
n
X f k) (x0 )
pn (x) = f (x0 ) + (x − x0 )k .
k!
k=1

Es decir,

f 00 (x0 ) f n) (x0 )
pn (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + (x − x0 )2 + · · · + (x − x0 )n .
2! n!
Por ejemplo, si f (x) = ex y x0 = 0, el polinomio de Taylor de grado 3 de f centrado en cero
es:
f 00 (0) 2 f 000 (0) 3 x2 x3
p3 (x) = f (0) + f 0 (0)x + x + x =1+x+ + ,
2! 3! 2 6
0 00 000 0
ya que f (0) = f (0) = f (0) = f (0) = e = 1.
Usando este polinomio, podemos aproximar ex en puntos próximos a cero. Por ejemplo,
√ √
e = e1/2 ≈ p3 (1/2) = 1+1/2+1/8+1/48 = 1,64583. La calculadora proporciona e = 1,64872,
con lo que las dos primeras cifras decimales son correctas.

El teorema de Taylor permite estimar el error cometido cuando aproximamos una función
por el polinomio de Taylor.
3.10. El teorema de Taylor. 23

Teorema 3.5 (Teorema de Taylor) Sea f : [a, b] → R una función derivable n + 1 veces
y sea x0 ∈ [a, b]. Entonces, para cada x ∈ [a, b], existe un número ξx entre x0 y x tal que
f (x) = pn (x) + rn (x), donde

f n+1) (ξx )
rn (x) = (x − x0 )n+1 .
(n + 1)!

El término rn (x) se llama resto del polinomio de Taylor de grado n de f centrado en


x0 y proporciona el error cometido en la aproximación ya que |f (x) − pn (x)| = |rn (x)|, ∀ x ∈ I.

Por ejemplo, el polinomio de Taylor de grado tres de f (x) = sen(x) centrado en x0 = 0 es


p3 (x) = x − x3 /6. El error cometido al aproximar sen(1/2) por p3 (1/2) es

f iv) (ξ )  1 4
x
|r3 (1/2)| = , ξx ∈ (0, 1/2).

4! 2

Dado que |f iv) (ξx )| = | sen(ξx )| ≤ 1, ∀ ξx ∈ (0, 1/2), se tiene que:


1
| sen(1/2) − p3 (1/2)| = |r3 (1/2)| ≤ = 0,00260417.
4! 24
De hecho p3 (1/2) = 1/2 − 1/48 = 0,479167 y la calculadora proporciona sen(1/2) = 0,479426.

Finalizamos el tema con dos aplicaciones del teorema de Taylor para obtener condiciones
precisas para la existencia de extremos relativos y puntos de inflexión de una función f suficien-
temente regular (con suficientes derivadas sucesivas).

Corolario 3.5 (Criterio para la existencia de extremos) Sea f : I → R una función de


clase C n en un intervalo abierto I. Sea x0 ∈ I tal que f 0 (x0 ) = 0 y sea n el orden de la primera
derivada de f que no se anula en x0 , es decir f k) (x0 ) = 0 si 1 ≤ k < n y f n) (x0 ) 6= 0.

(a) Si n es par y f n) (x0 ) > 0 entonces f es tiene un mı́nimo relativo estricto en x0 .

(b) Si n es par y f n) (x0 ) < 0 entonces f es tiene un máximo relativo estricto en x0 .

(c) Si n es impar entonces f no tiene un extremo relativo en x0 .

Demostración. Demostramos el apartado (a). El polinomio de Taylor de grado n − 1 de f


centrado en x0 es

f 00 (x0 ) f n−1) (x0 )


pn−1 (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + (x − x0 )2 + · · · + (x − x0 )n−1 = f (x0 ),
2! (n − 1)!

ya que f k) (x0 ) = 0 si k < n. Por el teorema de Taylor, existe un ξx entre x0 y x tal que

f n) (ξx )
f (x) = pn−1 (x) + rn−1 (x) = f (x0 ) + (x − x0 )n .
n!
24 3. Derivación de funciones de una variable

Como n es par y f n) (x0 ) > 0, se cumple que (x − x0 )n > 0 y f n) (ξx ) > 0 para x 6= x0 en un
entorno (x0 − r, x0 + r) de x0 . Por tanto,

f n) (ξx )
f (x) = f (x0 ) + (x − x0 )n > f (x0 ), ∀ x ∈ (x0 − r, x0 ) ∪ (x0 , x0 + r).
n!
De aquı́ se deduce que f tiene en x0 un mı́nimo relativo estricto. t
u

Corolario 3.6 (Criterio para la existencia de puntos de inflexión) Sea f : I → R una


función de clase n en un intervalo abierto I. Sea x0 ∈ I tal que f 00 (x0 ) = 0 y sea n el orden de la
primera derivada de f mayor que dos que no se anula en x0 , es decir f k) (x0 ) = 0 si 2 ≤ k < n
y f n) (x0 ) 6= 0. Entonces f tiene un punto de inflexión en x0 si y sólo si n es impar.

Ejemplo.
Consideremos la función f (x) = x4 − x3 .

f 0 (x) = 4x3 − 3x2 = 0 ⇐⇒ x = 0 ó x = 3/4


f 00 (x) = 12x2 − 6x = 0 ⇐⇒ x = 0 ó x = 1/2.

Para x = 0 se tiene que f 0 (0) = f 00 (0) = 0, f 000 (0) = −6 6= 0. Por tanto, f tiene en x = 0 un
punto de inflexión.
Para x = 3/4 se tiene que f 0 (3/4) = 0, f 00 (3/4) = 9/4 > 0. Por tanto, f tiene en x = 3/4
un mı́nimo relativo estricto.
Para x = 1/2 se tiene que f 00 (1/2) = 0, f 000 (1/2) = 6 6= 0. Por tanto, f tiene en x = 1/2 un
punto de inflexión.

La gráfica se muestra en la figura 3.4.

0 1/2 3/4 1

Figura 3.4: Gráfica de la función f (x) = x4 − x3 .


Capı́tulo 4

Introducción a las funciones


vectoriales

4.1. Funciones vectoriales de una variable. Curvas en R2 y R3 .


Sea I un intervalo real. Una función f : I → Rn se llama función vectorial de una variable.
Para cada t ∈ I, f (t) es un vector de Rn y por tanto se puede escribir en la forma

f (t) = (f1 (t), f2 (t), . . . , fn (t)),

donde fi : I → R es una función escalar para i = 1, 2, . . . , n. Las funciones fi se llaman funciones


componentes de f .
Por ejemplo, la función f : [0, 2π] → R2 dada por f (t) = (cos(t), sen(t)) es una función
vectorial con valores en R2 . Sus componentes son f1 (t) = cos(t) y f2 (t) = sen(t).
Las funciones componentes permiten extender fácilmente los conceptos de lı́mite, continui-
dad y derivada. Sea t0 ∈ R tal que f está definida en los intervalos (t0 − r, t0 ) y (t0 , t0 + r) para
algún r > 0. Diremos que existe el lı́mite de f cuando t tiende a t0 si existe el lı́mite de cada
una de las componentes. En este caso, se define
 
lı́m f (t) = lı́m f1 (t), lı́m f2 (t), . . . , lı́m fn (t) .
t→t0 t→t0 t→t0 t→t0

Una función f es continua en t0 ∈ I si existe el lı́mite de f cuando t tiende a t0 y además


lı́m f (t) = f (t0 ). Es evidente que f es continua en t0 si y sólo si todas sus componentes son
t→0
continuas en t0 .
Se dice que f : I → Rn es derivable en un punto t0 si lo es cada una de sus componentes;
en ese caso, la derivada de f en t0 es

f (t) − f (t0 )
f 0 (t0 ) = f10 (t0 ), f20 (t0 ), . . . , fn0 (t0 ) = lı́m

.
t→t0 t − t0

Por ejemplo, la derivada de f (t) = (cos(t), sin(t)) es f 0 (t) = (− sen(t), cos(t)).

25
26 4. Introducción a las funciones vectoriales

Curvas y vector tangente


La gráfica de una función vectorial f : I → Rn es el conjunto de puntos {(t, f (t)) / t ∈ I} y
por tanto es un subconjunto de Rn+1 . En los casos n = 2 y n = 3, es habitual representar sólo
los puntos f (t) ∈ Rn en lugar de la gráfica.
Sea f : I → Rn una función continua definida en un intervalo real I. El conjunto

C = {f (t) = (f1 (t), f2 (t), . . . , fn (t)) / t ∈ I}

se llama curva en Rn y se dice que la función f es una parametrización de la curva.

Ejemplos:
La función f : [0, π] → R2 dada por f (t) = (cos(t), sin(t)) describe la curva plana

C = {(cos(t), sin(t)) / t ∈ [0, π]},

que es una semicircunferencia de centro (0, 0) y radio 1 en R2 . Otraposible parametrización



de la misma curva es g : [−1, 1] → R dada por g(t) = t, 1 − t2 . En este caso, la curva
se recorre en sentido contrario.

La función f : [0, ∞) → R3 definida por f (t) = (cos(t), sen(t), t) describe una curva en R3
llamada hélice circular, que se enrolla en un cilindro circular de radio 1.
Si f : I → Rn es derivable en t0 y f 0 (t0 ) 6= (0, 0, . . . , 0) entonces f 0 (t0 ) es un vector tangente
a la curva C en el punto f (t0 ). El vector tangente indica en qué sentido se recorre la curva (su
orientación) y permite definir la recta tangente a la curva C en el punto f (t0 ) como la recta que
pasa por f (t0 ) y tiene la dirección de f 0 (t0 ), es decir, su ecuación paramétrica es

x(t) = f (t0 ) + t f 0 (t0 ), t ∈ R.

Por ejemplo, la función f : [0, 2π] → R2 dada por f (t) = (cos(t), sin(t)) define la circunferencia
de centro (0, 0) y radio √ 1 en R√2 y su derivada en cada punto t es f 0 (t) = (− sen(t), cos(t)). Para
√ √
t0 = π/4, f (π/4) = (1/ 2, 1/ 2) y el vector tangente es f 0 (π/4) = (−1/ 2, 1/ 2). Por tanto
las ecuaciones paramétricas de la recta tangente son
1−t

 x(t) = √2

√ √ √ √

(x(t), y(t)) = (1/ 2, 1/ 2) + t(−1/ 2, 1/ 2) ⇐⇒
1+t
 y(t) = √


2

Despejando t se obtiene la ecuación cartesiana y = −x + 2.
Cuando n = 2 o n = 3, una curva se puede pensar como la trayectoria que sigue una
partı́cula. Si denotamos por r(t) = (x(t), y(t), z(t)) el vector de posición en un instante t, entonces
el vector tangente v(t) = r0 (t) = (x0 (t), y 0 (t), z 0 (t)) es el vector velocidad y a(t) = v 0 (t) = r00 (t) =
(x00 (t), y 00 (t), z 00 (t)) es el vector aceleración.
Las derivadas de funciones vectoriales de una variable tienen propiedades similares a las
de las derivadas escalares con respecto a la suma y el producto por escalares. En el caso del
4.2. Campos escalares y vectoriales. Curvas de nivel 27

producto de funciones, se cumple una regla análoga a la de funciones escalares de una variable,
pero en términos del producto escalar. Nótese que si f : I → Rn y g : I → Rn son dos funciones
vectoriales entonces su producto escalar (f · g) es una función escalar (f · g) : I → R definida
n
X
por (f · g)(t) = f (t) · g(t) = fi (t)gi (t).
i=1
Si f : I → Rn y g : I → Rn son dos funciones vectoriales derivables entonces se tienen las
siguientes propiedades:
1) f + g es derivable y (f + g)0 (t) = f 0 (t) + g 0 (t).
2) λf es derivable y (λf )0 (t) = λf 0 (t), ∀λ ∈ R.
3) El producto escalar (f · g) es derivable y (f · g)0 (t) = f 0 (t) · g(t) + f (t) · g 0 (t).

4.2. Campos escalares y vectoriales. Curvas de nivel


Sea D un subconjunto de Rn , con n > 1. Una función f : D → Rp es una función de varias
variables reales. El conjunto D se llama dominio de definición de f .
En el caso particular p = 1, una función f : Rn → R se suele llamar campo escalar (o
función escalar de varias variables). Por ejemplo, la función que asigna a cada punto (x, y, z)
de un recinto tridimensional D su temperatura es un campo escalar T : D ⊂ R3 → R llamado
campo de temperaturas.
Si p > 1, una función f : D ⊂ Rn → Rp se llama función vectorial de varias variables.
Especialmente en el caso p = n, la función vectorial f : D ⊂ Rn → Rn suele llamarse campo de
vectores. En el caso de R2 es un campo de vectores en el plano y en el de R3 es un campo de
vectores en el espacio.
Una función f : D ⊂ Rn → Rp se puede expresar en función de sus componentes:
f (x) = f (x1 , x2 , . . . , xn ) = (f1 (x1 , x2 , . . . , xn ), f2 (x1 , x2 , . . . , xn ), . . . , fp (x1 , x2 , . . . , xn )).
Para cada k = 1, 2, . . . , p, la componente fk : Rn → R es un campo escalar.
Por ejemplo, la función f : R2 → R3 definida por f (x, y) = (x + y, exy , sen(x − y)) tiene tres
componentes f1 (x, y) = x + y, f2 (x, y) = exy , f3 (x, y) = sen(x − y).
La gráfica de una función f : D ⊂ Rn → Rp se define como el conjunto
G(f ) = {(x, f (x)) / x ∈ D} .
Nótese que los puntos de la gráfica son de la forma
(x, f (x)) = (x1 , x2 , . . . , xn , f1 (x1 , x2 , . . . , xn ), f2 (x1 , x2 , . . . , xn ), . . . , fp (x1 , x2 , . . . , xn )) ∈ Rn+p ,
y por tanto la gráfica de f es un subconjunto de Rn+p .
Por ejemplo, la gráfica de la función f : R2 → R definida por f (x, y) = x2 + y 2 es el parabo-
loide definido por la ecuación z = x2 + y 2 en R3 . En general, las gráficas de funciones de R2 en
R son difı́ciles de representar; para n > 2 y/o p > 1, la gráfica de una función de varias variables
f : Rn → Rp estarı́a en un espacio de dimensión mayor que 3 y por tanto no se podrı́a representar.
28 4. Introducción a las funciones vectoriales

Curvas de nivel
Si f : D ⊂ R2 → R es un campo escalar definido en un dominio D del plano, se definen sus
curvas de nivel como los conjuntos de puntos sobre los que f toma el mismo valor, es decir, si
K ∈ R, la curva de nivel K es

CK = {(x, y) ∈ R2 / f (x, y) = K}.

Ejemplos tı́picos de curvas de nivel son los mapas topográficos, donde cada curva de nivel
se corresponde con los puntos que tienen la misma altura, y los mapas de isobaras, donde cada
curva de nivel (isobara) representa los puntos donde la presión atmosférica es la misma.
Por ejemplo, las curvas de nivel de la función f : R2 → R definida por f (x, y) = x2 + y 2
sólo tienen sentido para K = r2 > 0 y son circunferencias de centro (0, 0) y radio r:

CK = {(x, y) ∈ R2 / x2 + y 2 = r2 }, K = r2 .

Cada curva de nivel representa la intersección de la gráfica de f con el plano z = K paralelo


al plano horizontal z = 0.

4.3. Nociones básicas de topologı́a en Rn .


En esta sección generalizaremos a Rn algunos conceptos que en R proporcionan de forma
natural los intervalos y el valor absoluto.
El papel de un intervalo real (x0 − r, x0 + r) centrado en x0 ∈ R y radio r > 0 lo juega en
R la bola abierta de centro P ∈ Rn y radio r > 0, que se define como el conjunto de puntos de
n

Rn cuya distancia a P es menor que r, es decir,

B(P, r) = {x ∈ Rn / kx − P k < r} ,
q
donde recordemos que k(x1 , x2 , . . . , xn )k = x21 + x22 + · · · + x2n .
Por ejemplo, en R2 la bola abierta de centro (0, 0) y radio r está formada por los puntos
que quedan dentro de la circunferencia de centro (0, 0) y radio r, es decir:

B((0, 0), r) = (x, y) ∈ R2 / x2 + y 2 < r2 .




Las bolas abiertas permiten definir el interior y la frontera de un conjunto de Rn .


Sea A un subconjunto de Rn . Se dice que P ∈ A es un punto interior de A si existe alguna
bola abierta centrada en P que queda dentro de A, es decir, si

∃ r > 0 / B(P, r) ⊂ A.

El conjunto de los puntos interiores de A se llama interior de A y lo denotaremos por Int(A).


Diremos que un conjunto A es abierto si todos sus puntos son interiores. Por ejemplo, las
bolas abiertas en Rn son conjuntos abiertos.
Los puntos de A que no están en el interior se llaman puntos frontera. También puede haber
puntos de la frontera de A que no pertenecen a A. Diremos que un punto P ∈ Rn es un punto de
4.3. Nociones básicas de topologı́a en Rn . 29

la frontera de A si cualquier bola abierta centrada en P contiene puntos de A y puntos que no


están en A. El conjunto de puntos frontera se llama frontera de A y lo denotaremos por Fr(A).
Por ejemplo, la frontera de la bola abierta de centro (0, 0) y radio r es la circunferencia de centro
(0, 0) y radio r:
Fr(B((0, 0), r)) = (x, y) ∈ R2 / x2 + y 2 = r2 .


Diremos que un conjunto A es cerrado si contiene a todos los puntos de su frontera. Por
ejemplo, el cuadrado unidad I 2 en R2 es cerrado:

I 2 = [0, 1] × [0, 1] = (x, y) ∈ R2 / 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 .




En general, los conjuntos cerrados que manejaremos están definidos por desigualdades no es-
trictas y los conjuntos abiertos están definidos por desigualdades estrictas (obsérvese la analogı́a
con los intervalos abiertos y cerrados).
Diremos que un subconjunto A de Rn está acotado si existe una constante positiva K tal
que kxk ≤ K, ∀ x ∈ A.
Diremos que un subconjunto A de Rn es compacto si está acotado y es cerrado. Los
conjuntos compactos de Rn juegan el papel de los intervalos compactos [a, b] de R.
Ejemplos:

El cuadrado unidad I 2 descrito anteriormente es compacto.

El cuadrante positivo A = {(x, y) ∈ R2 / x ≥ 0, y ≥ 0} no es compacto porque no está aco-


tado.

La bola abierta de centro (0, 0) y radio r no es compacta porque no es cerrada.


30 4. Introducción a las funciones vectoriales
Capı́tulo 5

Continuidad y cálculo diferencial de


funciones de varias variables

5.1. Lı́mites y continuidad de funciones de varias variables.

Sea f : D ⊂ Rn → Rp una función vectorial definida en un subconjunto abierto D de Rn .


Sea P un punto de D o de su frontera. Diremos que L ∈ Rp es el lı́mite de f cuando x tiende
a P si f (x) se aproxima a L cuando x se aproxima a P . Esta definición se puede escribir en
términos de normas y es muy similar a la de lı́mite de funciones escalares de una variable:

lı́m f (x) = L ⇐⇒ [∀ ε > 0, ∃δ > 0 / kx − P k < δ, x 6= P =⇒ kf (x) − Lk < ε] .


x→P

Al igual que pasaba con las funciones vectoriales de una variable, si f : Rn → Rp y P ∈ Rn


entonces existe el lı́mite de f en P si y sólo si existen los lı́mites en P de cada una de las compo-
nentes f1 (x), f2 (x), . . . , fp (x). Por tanto, podemos restringir nuestro estudio a campos escalares.

Lı́mites direccionales
Una de las diferencias fundamentales es que el lı́mite de una función de una variable en un
punto x0 ∈ R existe si y sólo si existen los lı́mites laterales y coinciden. Sin embargo, las posibles
formas de aproximarse a un punto en Rn son infinitas.
Esta observación resulta útil como criterio para probar que el lı́mite en P no existe: basta
encontrar dos direcciones de tal forma que los lı́mites de f (x) cuando x tiende a P a lo largo de
esas direcciones sean distintos. Estos lı́mites se llaman lı́mites direccionales.
Por ejemplo,
x2 − y 2
lı́m
(x,y)→(0,0) x2 + y 2

no existe porque cuando nos aproximamos a (0, 0) a lo largo de los dos ejes de coordenadas la

31
32 5. Continuidad y cálculo diferencial de funciones de varias variables

función se aproxima a valores diferentes:

x2 − y 2 x2
lı́m = lı́m = lı́m 1 = 1.
(x,y)→(0,0) x2 + y 2 x→0 x2 x→0
y=0

x2 − y 2 −y 2
lı́m = lı́m = lı́m (−1) = −1.
(x,y)→(0,0) x2 + y 2 y→0 y 2 y→0
x=0

En el siguiente ejemplo estos dos lı́mites coinciden y consideramos las rectas y = λx que
pasan por (0, 0):
2xy
lı́m
(x,y)→(0,0) x2 + y 2

no existe porque cuando nos aproximamos a (0, 0) a lo largo de las rectas y = λx con distintos
valores de λ la función se aproxima a valores diferentes:

2xy 2λx2 2λ
lı́m = lı́m = .
(x,y)→(0,0) x2 + y 2 x→0 (1 + λ2 )x2 1 + λ2
y=λx

Para λ = 1, el lı́mite vale 1 mientras que para λ = −1 el lı́mite vale −1.

Continuidad
El concepto de continuidad para funciones de varias variables es similar al de funciones
de una variable. Sea f : D ⊂ Rn → Rp una función definida en un conjunto abierto D y sea
P ∈ D. Se dice que f es continua en P si existe el lı́mite de f en P y además

lı́m f (x) = f (P ).
x→P

Diremos que f es continua en D si es continua en todos los puntos de D.


Es claro que f (x) = (f1 (x), f2 (x), . . . , fp (x)) es continua en P si y sólo si todas sus compo-
nentes son continuas en P . Por ello podemos centrarnos en campos escalares.

Las propiedades relacionadas con la continuidad para funciones de varias variables son
similares a las de las funciones de una variable:

1. La composición de funciones continuas es una función continua.

2. Si f : Rn → R y g : Rn → R son funciones continuas en P entonces las funciones (f + g)


y (f · g) son continuas en P . La función f /g es continua en P si g(P ) 6= 0.

ex+y
Por ejemplo, la función f (x, y) = es continua para todos los puntos de R2 que no
xy − 1
están sobre la hipérbola xy = 1.
5.2. Derivadas parciales y plano tangente. 33

5.2. Derivadas parciales y plano tangente.


Para definir el concepto de diferenciabilidad de funciones de varias variables, comenzaremos
con campos escalares en R2 .
Sea f : R2 → R un campo escalar. Se llama derivada parcial de f respecto a la variable
x a la función que resulta de considerar la variable y constante y aplicar la derivación usual
∂f
respecto de x. Se representa por o fx .
∂x
Por ejemplo, si f (x, y) = x3 y + xy 2 − ln(xy) entonces:

∂f 1 ∂f 1
= 3x2 y + y 2 − ; = x3 + 2xy − .
∂x x ∂y y

Formalmente, la derivada parcial de f respecto de x en un punto (x, y) se define como

∂f f (x + h, y) − f (x, y)
(x, y) = lı́m .
∂x h→0 h

La derivada parcial de f respecto de x en el punto (x0 , y0 ) representa la tasa de crecimiento


instantánea de f en la dirección paralela al eje x, cuando y0 se mantiene constante. La inter-
pretación geométrica es la siguiente: denotemos por z = f (x, y) la gráfica de f ; entonces la
derivada parcial respecto de x en un punto (x0 , y0 ) representa la pendiente de la recta tangente
a la curva z = f (x, y0 ) en el punto (x0 , y0 , f (x0 , y0 )), es decir, la pendiente de la tangente a la
curva intersección de la gráfica de f con el plano y = y0 .
De modo análogo, la parcial respecto de y en el punto (x0 , y0 ) representa la pendiente de la
tangente a la curva intersección de la gráfica de f con el plano x = x0 .
Si existen las derivadas parciales respecto de x y de y en un punto (x0 , y0 ) entonces el vector
fila  
∂f ∂f
∇f (x0 , y0 ) = (x0 , y0 ), (x0 , y0 ) ∈ R2
∂x ∂x
se llama vector gradiente de f en (x0 , y0 ).

Plano tangente.
La interpretación geométrica de las derivadas parciales motiva la idea de definir el plano
tangente a la superficie z = f (x, y) definida por la gráfica de un campo escalar f : R2 → R
en un punto (x0 , y0 , z0 ) como el plano que pasa por (x0 , y0 , z0 ) y contiene a las rectas tangentes
definidas por (∂f /∂x)(x0 , y0 ) y (∂f /∂y)(x0 , y0 ) respectivamente.
Recordemos que la ecuación de la recta tangente a la gráfica de una una función f : R → R
en un punto (x0 , f (x0 )) es y − f (x0 ) = f 0 (x0 )(x − x0 ). La ecuación del plano tangente es similar:

∂f ∂f
z − z0 = (x0 , y0 ) (x − x0 ) + (x0 , y0 ) (y − y0 ), z0 = f (x0 , y0 ).
∂x ∂y

Nótese que si hacemos y = y0 entonces la intersección del plano tangente con el plano y = y0
es precisamente la recta tangente a la intersección de la gráfica de f con dicho plano.
34 5. Continuidad y cálculo diferencial de funciones de varias variables

Por ejemplo, calculemos la ecuación del plano tangente a la gráfica de f (x, y) = x2 + y 2 + y


en el punto (1, 0, 1). Como fx (x, y) = 2x, fy (x, y) = 2y + 1, resulta:

z − 1 = fx (1, 0)(x − 1) + fy (1, 0)(y − 0) = 2(x − 1) + y ⇐⇒ 2x + y − z = 1.

La ecuación del plano tangente a f en el punto (x0 , y0 , z0 ), donde z0 = f (x0 , y0 ), también


se puede escribir en la forma:

z = f (x0 , y0 ) + ∇f (x0 , y0 ) · (x − x0 , y − y0 ).

5.3. Diferenciabilidad.
El plano tangente motiva la idea para extender el concepto de función diferenciable en un
punto para funciones de varias variables. Recordemos que una función f : R → R es derivable
en un punto x0 si la recta tangente y = r(x) es una buena aproximación de la gráfica de f en
puntos cercanos a (x0 , f (x0 )):

f (x) − f (x0 ) f (x) − [f (x0 ) + f 0 (x0 )(x − x0 )]


lı́m = f 0 (x0 ) ⇐⇒ lı́m = 0 ⇐⇒
x→x0 x − x0 x→x0 x − x0
f (x) − r(x)
⇐⇒ lı́m =0
x→x0 x − x0

De alguna manera esto quiere decir que, cuando x tiende a x0 , f (x) se aproxima a r(x) con
mayor rapidez.
Para funciones f : R2 → R una función será diferenciable en un punto (x0 , y0 ) si el plano
tangente en el punto (x0 , y0 , f (x0 , y0 )) es una buena aproximación de la gráfica de f . Por analogı́a
con el caso anterior, se tiene que f es diferenciable si existen las derivadas parciales fx (x0 , y0 ),
fy (x0 , y0 ) y además:

f (x, y) − [f (x0 , y0 ) + ∇f (x0 , y0 ) · (x − x0 , y − y0 )]


lı́m = 0.
(x,y)→(x0 ,y0 ) k(x, y) − (x0 , y0 )k

Si ocurre esto, se define la diferencial de f en (x0 , y0 ) como el vector gradiente:


 
∂f ∂f
Df (x0 , y0 ) = ∇f (x0 , y0 ) = (x0 , y0 ), (x0 , y0 ) .
∂x ∂y

Se dice que f : R2 → R es diferenciable en P = (x0 , y0 ) ∈ R2 si existen las derivadas


parciales en P y el lı́mite anterior es 0. Una condición suficiente más fácil de comprobar es la
siguiente:

Proposición 5.1 Sea A un subconjunto abierto de R2 y sea f : A → R un campo escalar. Si


existen las derivadas parciales en todo punto de A y son continuas entonces f es diferenciable
en todos los puntos de A.
5.3. Diferenciabilidad. 35

En general, sea f : Rn → R y P ∈ Rn . Si existen las derivadas parciales y son continuas


entonces f es diferenciable en P . Se define la diferencial de f en P como el vector gradiente
 
∂f ∂f ∂f
Df (P ) = ∇f (P ) = (P ), (P ), . . . , (P ) .
∂x1 ∂x2 ∂xn

Por ejemplo, si f : R3 → R está definida por f (x, y, z) = xyz − sen(xy) + z entonces el


gradiente en (x, y, z) es

∇f (x, y, z) = (yz − y cos(xy), xz − x cos(xy), xy + 1) .

Para el punto P = (π/2, 1, 1),


π   π π 
∇f , 1, 1 = 1, , + 1 .
2 2 2

Por el momento hemos definido el concepto de diferencial para campos escalares. Si queremos
extender este concepto a funciones vectoriales f : Rn → Rp , usaremos de nuevo las componentes
f1 , f2 , . . . , fp .
Recordemos que si f : R → Rp entonces la derivada se definı́a como el vector formado por
las derivadas de las componentes. Escribiremos esta diferencial como vector columna:

f10 (x0 )
 
 f20 (x0 ) 
Df (x0 ) = f 0 (x0 ) =  .
 
..
 . 
fp0 (x0 )

Si f : Rn → Rp y P ∈ Rn entonces diremos que f es diferenciable en P si cada una de las


componentes de f es diferenciable en P . Se define la diferencial de f en P como la matriz cuyas
filas son los vectores gradiente de cada una de las componentes:
 
∂f1 ∂f1 ∂f1
  ∂x1 (P ) ∂x2 (P ) ··· ∂xn (P )
∇f1 (P )  
∂f2 ∂f2 ∂f2
 ∇f2 (P )  
∂x1 (P ) ∂x2 (P ) ··· ∂xn (P )

  
Df (P ) =  = .

..
 .   .. .. .. .. 
. . . .
 
∇fp (P )
 
∂fp ∂fp ∂fp
∂x1 (P ) ∂x2 (P ) · · · ∂xn (P )

Obsérvese que si f : Rn → Rp entonces la diferencial en cada punto es una matriz con p


filas y n columnas. Esta matriz también se llama matriz jacobiana o matriz de las derivadas
parciales. Cada elemento aij = ∂fi /∂xj (P ) representa la tasa de variación instantánea de la
componente fi respecto de la variable xj en el punto P .
Ejemplo: Sea f : R3 → R2 definida por f (x, y, z) = (xyz, sen(xy) + z). Vamos a calcular
la diferencial de f en el punto (0, 1, 2). Para ello necesitamos las derivadas parciales de las
componentes f1 (x, y, z) = xyz, f2 (x, y, z) = sen(xy) + z.
36 5. Continuidad y cálculo diferencial de funciones de varias variables

∂f1 ∂f1 ∂f1


= yz ; = xz ; = xy ;
∂x ∂y ∂z
∂f2 ∂f2 ∂f2
= y cos(xy) ; = x cos(xy) ; = 1.
∂x ∂y ∂z
Entonces:
!
yz xz xy
 
2 0 0
Df (x, y, z) = =⇒ Df (0, 1, 2) = .
y cos(xy) x cos(xy) 1 1 0 1

Propiedades.
1. Si f : Rn → Rp es diferenciable en P entonces f es continua en P .
2. Si f : Rn → Rp y g : Rn → Rp son funciones diferenciables en P y λ, µ ∈ R entonces
(λf + µg) es diferenciable en P y D(λf + µg)(P ) = λDf (P ) + µDg(P ).

5.4. Regla de la cadena.


Como en el caso de funciones escalares de una variable, una herramienta fundamental del
cálculo de la diferencial es la regla de la cadena.
Sean f : Rn → Rp , g : Rp → Rq dos funciones. Si f es diferenciable en P y g es diferenciable
en f (P ) entonces (g ◦ f ) es diferenciable en P y además
D(g ◦ f )(P ) = Dg(f (P ))Df (P ).
Nótese que el producto de matrices está bien definido porque Dg(f (P )) tiene p columnas y
Df (P ) tiene p filas.
Ejemplo: Sea f : R3 → R2 definida por f (x, y, z) = (xyz, sen(xy) + z). Sea g : R2 → R2 definida
por g(u, v) = (uv 2 , v eu ). Vamos a calcular la diferencial de g ◦ f en el punto (0, 1, 2). Por la regla
de la cadena, teniendo en cuenta que f (0, 1, 2) = (0, 2), se tiene:
D(g ◦ f )(0, 1, 2) = Dg(0, 2)Df (0, 1, 2).
Ya hemos calculado  
2 0 0
Df (0, 1, 2) = .
1 0 1
A continuación calculamos Dg(0, 2).
Du (uv 2 ) Dv (uv 2 )
   2   
v 2uv 4 0
Dg(u, v) = = =⇒ Dg(0, 2) =
Du (v eu ) Dv (v eu ) v eu eu 2 1
Finalmente,
    
4 0 2 0 0 8 0 0
D(g ◦ f )(0, 1, 2) = Dg(0, 2)Df (0, 1, 2) = = .
2 1 1 0 1 5 0 1
5.4. Regla de la cadena. 37

5.4.1. Interpretación de la diferencial como aplicación.


La regla de la cadena permite dar una interpretación de la diferencial como aplicación. Lo
veremos en el plano, aunque se extiende de forma natural a más dimensiones.
Consideremos un campo vectorial f : R2 → R2 y una curva diferenciable c1 (t) = (x(t), y(t)).
La función c2 (t) = f (c1 (t)) representa otra curva en R2 obtenida como la imagen de c1 por el
campo f . Por la regla de la cadena:

c02 (t) = Df (c1 (t)) c01 (t).

Esto quiere decir que la diferencial de f en c1 (t) lleva al vector tangente c01 (t) en el vector
tangente c02 (t), es decir, si un campo vectorial en R2 lleva puntos de una curva en puntos de su
imagen, la diferencial en cada punto (x0 , y0 ) es otro campo vectorial (lineal) en R2 que lleva al
vector tangente a c1 en (x0 , y0 ) en el vector tangente a c2 en f (x0 , y0 ).

5.4.2. Regla de la cadena: una variable independiente


Sea f : R3 → R un campo escalar y c : R → R3 una curva diferenciable en R3 . Consideremos
la función f sobre la curva, es decir, g(t) = f (c(t)). Denotemos c(t) = (x(t), y(t), z(t)).
Entonces, por la regla de la cadena,

∂f ∂f ∂f
g 0 (t) = ∇f (c(t)) · c0 (t) = (c(t)) x0 (t) + (c(t)) y 0 (t) + (c(t)) z 0 (t).
∂x ∂y ∂z

La fórmula g 0 (t) = ∇f (c(t)) · c0 (t) se extiende de forma natural al caso g(t) = f (c(t)), con
f : Rn → R y c : R → Rn .

Ejemplo. Un cilindro circular recto varı́a de tal manera que su radio r crece a razón de 3 cm/hora
y su altura decrece a razón de 5 cm/hora. Calcular la tasa de variación de su volumen cuando
r = 3 cm y h = 4 cm.
El volumen es V (r, h) = πr2 h. Sabemos que las tasas de variación son r0 (t) = 3, h0 (t) = −5.
Entonces:
∂V 0 ∂V 0
V 0 (t) = r (t) + h (t) = 2πrhr0 (t) + πr2 h0 (t) = 6πrh − 5πr2 .
∂r ∂h
Para r = 3 y h = 4, V 0 (t) = 72π − 45π = 27π, es decir, el volumen crece a la razón de 27π
cm3 /hora.

A continuación veremos dos aplicaciones de la regla de la cadena: la relación entre el gra-


diente y las curvas de nivel y las derivadas direccionales.
Gradiente y curvas de nivel.
Consideremos un campo escalar en el plano f : R2 → R.

Proposición 5.2 Si f es diferenciable en (x0 , y0 ) entonces el gradiente de f en (x0 , y0 ) es


ortogonal a la curva de nivel que pasa por (x0 , y0 ).
38 5. Continuidad y cálculo diferencial de funciones de varias variables

Demostración. Sea c(t) = (x(t), y(t)) la curva de nivel que pasa por (x0 , y0 ). Para un cierto
t0 , c(t0 ) = (x0 , y0 ) y por tanto el vector tangente a la curva de nivel en (x0 , y0 ) es c0 (t0 ).
Como g(t) = f (c(t)) = K para una constante K, usando la regla de la cadena se tiene:

0 = g 0 (t) = ∇f (c(t)) · c0 (t) .

Para t = t0 , c(t0 ) = (x0 , y0 ) y por tanto:

∇f (x0 , y0 ) · c0 (t0 ) = ∇f (c(t0 )) · c0 (t0 ) = 0.

Esto quiere decir que el gradiente de f en (x0 , y0 ) es ortogonal a la curva de nivel. t


u

Usando que el gradiente es un vector normal, la ecuación de la recta tangente a la curva de


nivel en el punto (x0 , y0 ) se puede expresar en la forma

∇f (x0 , y0 ) · (x − x0 , y − y0 ) = 0.

Este resultado se puede aplicar al cálculo de la recta tangente a una curva dada en forma
implı́cita.
Ejemplo. Calcular la recta tangente a la circunferencia x2 + y 2 = 2 en el punto (1, 1).
La circunferencia es una curva de nivel del campo f (x, y) = x2 +y 2 . En este caso, ∇f (1, 1) =
(2, 2) y por tanto la ecuación es

(2, 2) · (x − 1, y − 1) = 0 ⇐⇒ y = 2 − x.

Gradiente y derivadas direccionales.


Sean f : Rn → R un campo escalar, P ∈ Rn y u ∈ Rn un vector unitario, es decir kuk = 1.
Se considera la recta y(t) = P + tu que pasa por P y tiene la dirección de u. Sea g(t) = f (P + tu)
la acción del campo f sobre la recta. Se define la derivada direccional de f en P según el
vector u como g 0 (0) = ∇f (P ) · u. La derivada direccional mide la tasa de cambio de f en la
dirección de u.
Por ejemplo, la derivada direccional de f (x, y) = x2 y + y 3 en el punto (2, 1) en la dirección
de u = (1, 1) es
 √ 
u 1/√2 11
D~u f (2, 1) = ∇f (2, 1) · = (4, 7) =√ ,
kuk 1/ 2 2
ya que ∇f (x, y) = (2xy, x2 + 3y 2 ).

Dirección de máximo crecimiento. Sea f : Rn → R un campo escalar diferenciable. Si


∇f (P ) 6= 0 entonces el máximo valor de la derivada direccional se alcanza para el vector unitario
en la dirección del gradiente
∇f (P )
u= .
k∇f (P )k
Es decir, el gradiente de f apunta en la dirección de Rn en la que f crece más rápidamente.
5.4. Regla de la cadena. 39

La demostración de esta propiedad para n = 2 se basa en la fórmula del producto escalar.


La derivada direccional en la dirección de un vector unitario u es

∇f (P ) · u = k∇f (P )k kuk cos(φ) = k∇f (P )k cos(φ),

donde φ es el ángulo entre ∇f (P ) y u. Claramente, la derivada direccional alcanza su máximo


valor cuando cos(φ) = 1, es decir, cuando u apunta en la dirección y sentido del gradiente.
Obsérvese que el mismo razonamiento indica que la dirección de crecimiento mı́nimo es
la opuesta del gradiente, es decir, −∇f (P ). Ası́, el valor máximo de la derivada direccional es
k∇f (P )k y el mı́nimo es −k∇f (P )k.
Para n arbitrario, la propiedad se basa en que para x, y ∈ Rn se cumple siempre que

x · y ≤ kxk kyk,

y la igualdad sólo se cumple cuando x e y tienen la misma dirección y sentido (es decir, y = λx,
con λ > 0).

Ejemplo. Hallar la dirección de máximo crecimiento del campo escalar f (x, y) = x2 + y 2 en el


punto (1, 1).
∇f (x, y) = (2x, 2y) =⇒ ∇f (1, 1) = (2, 2).
√ √
La dirección de máximo crecimiento es la del vector unitario v = (1/ 2, 1/ 2).

En fı́sica, una de las aplicaciones es que el campo eléctrico es ortogonal a las curvas equi-
potenciales. En el siguiente ejemplo vemos otra aplicación al flujo de calor.

Ejemplo. Consideremos una placa cuadrada [0, 5] × [0, 5] y supongamos que la temperatura en
un punto (x, y) es T (x, y) = x2 + y 2 /4. Calcular en qué sentido irá el flujo de calor C(x, y) en el
punto (2, 4).
Teniendo en cuenta que el calor fluye de puntos de mayor temperatura a puntos de menor
temperatura y lo hace en dirección perpendicular a las isotermas, se tiene que

C(x, y) = −k ∇T (x, y),

donde k es una constante llamada conductividad térmica del medio. En este caso ∇T (x, y) =
(2x, y/2) y por tanto
C(2, 4) = −k ∇T (2, 4) = −k(4, 2).
 
−2 −1
Por tanto, el calor fluye en el sentido del vector unitario u = √ , √ .
5 5

5.4.3. Regla de la cadena: varias variables independientes


Supongamos que z = f (x, y), donde x e y dependen de u y v, es decir, z = f (x(u, v), y(u, v)).
Si f es diferenciable y existen las derivadas parciales de x = x(u, v) e y = y(u, v) respecto
de u y v entonces se pueden calcular las derivadas parciales de z respecto de u y v del siguiente
modo:
40 5. Continuidad y cálculo diferencial de funciones de varias variables

∂z ∂f ∂x ∂f ∂y ∂z ∂f ∂x ∂f ∂y
= + ; = + .
∂u ∂x ∂u ∂y ∂u ∂v ∂x ∂v ∂y ∂v
Estas fórmulas se extienden de forma natural al caso de más variables dependientes y más varia-
bles independientes: si y = f (x1 , x2 , . . . , xn ) y xi = xi (u1 , u2 , . . . , up ) para cada i = 1, 2, . . . , n,
entonces, para cada j = 1, 2, . . . , p,

∂y ∂f ∂x1 ∂f ∂x2 ∂f ∂xn


= + + ··· + .
∂uj ∂x1 ∂uj ∂x2 ∂uj ∂xn ∂uj

5.5. Derivación implı́cita.


Ya hemos descrito en la sección 3.6 del capı́tulo 3 cómo derivar de forma implı́cita una
expresión F (x, y) = 0, donde y = y(x). Este proceso se puede generalizar a funciones de más
variables dependientes e independientes utilizando la forma general de la regla de la cadena.
Consideremos una expresión F (x, y, z) = 0 que define implı́citamente una función z =
z(x, y), es decir, la variable z se puede despejar en función de las variables independientes x e
y. Es posible calcular las derivadas parciales de z respecto de x e y sin necesidad de despejar z
(lo cual es a veces imposible).

∂g ∂F ∂F ∂z ∂z ∂F /∂x


 = + = 0 =⇒ =−
 ∂x
 ∂x ∂z ∂x ∂x ∂F /∂z
g(x, y) = F (x, y, z(x, y)) = 0 =⇒

 ∂g ∂F ∂F ∂z ∂z ∂F /∂y

 = + = 0 =⇒ =− .
∂y ∂y ∂z ∂y ∂y ∂F /∂z

Ejemplo. Sabiendo que xy 2 + z 2 + sen(xz) = 1:

∂z ∂z
Calcular las derivadas parciales y .
∂x ∂y
Hallar ∇f (0, 1) sabiendo que z se puede despejar como z = f (x, y), con z > 0.

Se considera la función auxiliar F (x, y, z) = xy 2 + z 2 + sen(xz) − 1.

∂F ∂F ∂F
= y 2 + z cos(xz) ; = 2xy ; = 2z + x cos(xz) .
∂x ∂y ∂z

Por tanto,
∂z y 2 + z cos(xz) ∂z 2xy
=− ; =− .
∂x 2z + x cos(xz) ∂y 2z + x cos(xz)
Para x = 0, y = 1, se tiene que z 2 = 1 y por tanto (como z > 0), z = 1. Ası́,
 
∂z ∂z
∇f (0, 1) = (0, 1), (0, 1) = (−1, 0).
∂x ∂y
5.6. Derivadas parciales de orden superior. 41

5.6. Derivadas parciales de orden superior.


∂f
Sea f : Rn → R un campo escalar. Si las derivadas parciales ∂x i
son funciones derivables
entonces se pueden definir las derivadas parciales segundas (o de segundo orden). Se define la
derivada parcial segunda de f respecto de xi y de xj como

∂2f
 
∂ ∂f
= .
∂xj ∂xi ∂xj ∂xi

Ejemplo. Sea f (x, y) = xy + x2 y 2 + yex entonces

∂f ∂f
= y + 2xy 2 + yex ; = x + 2x2 y + ex .
∂x ∂y

Por tanto, las derivadas parciales segundas son:

∂2f ∂2f
   
∂ ∂f 2 x ∂ ∂f
= = 2y + ye ; = = 1 + 4xy + ex ;
∂x2 ∂x ∂x ∂y∂x ∂y ∂x

∂2f ∂2f
   
∂ ∂f 2 ∂ ∂f
= = 2x ; = = 1 + 4xy + ex .
∂y 2 ∂y ∂y ∂x∂y ∂x ∂y

Un campo f : Rn → R es de clase C 1 si existen las derivadas parciales primeras y son


continuas. Si existen las derivadas parciales segundas y son continuas, se dice que f es de clase
C 2 . De modo análogo se definen las derivadas de orden superior a 2 y las funciones de clase C k
para k > 2.
Por ejemplo, para la función del ejemplo anterior,

∂3f ∂ ∂2f ∂3f ∂ ∂2f


   
∂ 2 x x ∂
2y 2 + yex = yex .
 
2
= 2
= 2y + ye = 4y + e ; 3
= 2
=
∂y∂x ∂y ∂x ∂y ∂x ∂x ∂x ∂x

Para funciones de clase C 2 , las derivadas cruzadas no dependen del orden de derivación:

Teorema 5.1 (Teorema de las derivadas cruzadas) Sea f : Rn → R un campo escalar de


clase C 2 . Entonces, para cada par de variables independientes xi , xj , se cumple que

∂2f ∂2f
= .
∂xj ∂xi ∂xi ∂xj

Este teorema se extiende a derivadas de orden superior. Si una función es de clase C k su


derivada parcial k−ésima con respecto de k variables es independiente del orden de derivación.

Matriz hessiana.
Sea f : Rn → R un campo escalar de clase C 2 . Se llama matriz hessiana de f a la matriz
∂2f
cuadrada Hf (x) de tamaño n × n que tiene en el lugar (i, j) la derivada parcial segunda ,
∂xi ∂xj
42 5. Continuidad y cálculo diferencial de funciones de varias variables

es decir,
∂2f ∂2f ∂2f
 
∂x21 ∂x1 ∂x2 ··· ∂x1 ∂xn
 
∂2f ∂2f ∂2f
 

∂x2 x1 ∂x22
··· ∂x2 ∂xn

Hf (x) =  .
 
 .. .. .. .. 

 . . . . 

∂2f ∂2f ∂2f
∂xn ∂x1 ∂xn ∂x2 ··· ∂x2n

En cada punto P ∈ Rn ,
∂2f ∂2f ∂2f
 
∂x21
(P ) ∂x1 ∂x2 (P ) ··· ∂x1 ∂xn (P )
 
∂2f ∂2f ∂2f
 

∂x2 x1 (P ) ∂x22
(P ) ··· ∂x2 ∂xn (P )

Hf (P ) =   ∈ Mn×n (R) .
 
 .. .. .. .. 

 . . . . 

∂2f ∂2f ∂2f
∂xn ∂x1 (P ) ∂xn ∂x2 (P ) · · · ∂x2
(P )
n

En virtud del teorema de las derivadas cruzadas, Hf (P ) es una matriz simétrica.


La forma cuadrática ω : Rn → R definida por ω(x) = xt H0 x, donde H0 = Hf (P ), se llama
diferencial segunda de f en P .
Por ejemplo, para la función f (x, y) = xy + x2 y 2 + yex del ejemplo anterior, la matriz
hessiana es
 2
∂2f

∂ f
2y 2 + yex 1 + 4xy + ex
!
∂x 2 ∂x∂y
Hf (x, y) =  2 = .
∂ f ∂2f 1 + 4xy + ex 2x2
∂y∂x 2 ∂y

La matriz hessiana en el punto (0, 1) es


!
3 2
Hf (0, 1) = .
2 0

La diferencial segunda de f en (0, 1) está definida por


! !
3 2 x
ω(x, y) = (x, y) = 3x2 + 4xy.
2 0 y

Recordemos que una forma cuadrática en Rn es una aplicación ω : Rn → R definida por


n
X
ω(x) = xt Ax = aij xi xj ,
i,j=1

donde A = (aij ) ∈ Mn×n (R) es una matriz simétrica.


La clasificación de formas cuadráticas permite establecer la siguiente clasificación de matri-
ces simétricas:
5.7. Extremos locales y globales de un campo escalar. 43

Definición 5.1 Sea A ∈ Mn×n (R) una matriz simétrica. Diremos que

1. A es definida positiva si xt Ax > 0 , ∀ x 6= 0,

2. A es definida negativa si xt Ax < 0 , ∀ x 6= 0,

3. A es indefinida si existen dos vectores x, y ∈ Rn tales que xt Ax > 0 , y t Ay < 0.

Si A es simétrica y |A| =
6 0 entonces se puede determinar si A es definida positiva, definida
negativa o indefinida analizando el signo de los menores principales de la matriz.

Teorema 5.2 Supongamos que A es simétrica y |A| =


6 0. Entonces:

(a) Si todos los menores principales de A son positivos entonces A es definida positiva.

(b) Si los menores principales de orden impar son negativos y los de orden par son positivos
entonces A es definida negativa.

(c) En cualquier otro caso, A es indefinida.

Utilizaremos este resultado en la siguiente sección.

5.7. Extremos locales y globales de un campo escalar.


Recordemos que los extremos relativos (locales) de funciones escalares de una variable se
detectan igualando a cero la derivada primera, y en la mayorı́a de los casos se determina si es
máximo local o mı́nimo local utilizando el signo de la derivada segunda. Por ejemplo, f (x) = x2
alcanza un mı́nimo local en x = 0 porque f 0 (0) = 0 y f 00 (0) > 0, lo que quiere decir que la recta
tangente a la gráfica de f en (0, 0) es horizontal y que f es convexa.
Estos argumentos se pueden generalizar a campos escalares en Rn . En primer lugar, intro-
ducimos la definición de máximo y mı́nimo local.
Sea f : D ⊂ Rn → R un campo escalar definido en un subconjunto D de Rn . Se dice que f
alcanza un máximo local (o máximo relativo) en un punto P ∈ D si existe un entorno B0 de
P tal que f (x) ≤ f (P ), ∀ x ∈ B0 .
La definición de mı́nimo local se obtiene cambiando el sentido de la desigualdad en la
definición anterior. Diremos que P es un punto de extremo local para f si f alcanza en P un
máximo local o un mı́nimo local.
Observación: Un entorno del punto P se puede definir como la intersección de una bola abierta
centrada en P con el dominio de definición D.

Teorema 5.3 (Condición necesaria de extremo) Sea f : D ⊂ Rn → R un campo escalar


de clase C 1 definido en un subconjunto abierto D de Rn . Si f alcanza en P ∈ D un extremo
local entonces ∇f (P ) = (0, 0, . . . , 0).
44 5. Continuidad y cálculo diferencial de funciones de varias variables

Nótese que si f : R2 → R es un campo escalar en el plano, la condición anterior es equivalente


a decir que el plano tangente a la gráfica de f en el punto (P, f (P )) es paralelo al plano horizontal
XY . (Está dado por la ecuación z = z0 , donde z0 = f (P ).)
Por tanto, los extremos locales de f se buscarán entre los puntos que tienen gradiente cero
o aquellos donde f no es diferenciable. Estos puntos se llaman puntos crı́ticos de f .
Si ∇f (P ) = (0, 0, . . . , 0) pero f no alcanza un extremo en P , entonces se dice que f tiene
en P un punto de silla. En estos puntos, la gráfica de f crece en algunas direcciones cerca de
P y decrece en otras.

Observación: El teorema sólo vale para conjuntos abiertos. Si el dominio de definición de f no


es abierto, el resultado se puede usar para encontrar los puntos crı́ticos del interior de D. Los
posibles extremos locales en la frontera hay que determinarlos de otro modo.

Ejemplo. Calcular los puntos crı́ticos de la función f : R2 → R dada por f (x, y) = 4x3 −12xy+y 2 .

y = x2
 
2
∇f (x, y) = (12x − 12y, −12x + 2y) = (0, 0) ⇐⇒
6x = y

Por tanto,
x2 = y = 6x =⇒ x2 − 6x = 0 =⇒ x(x − 6) = 0.
Las únicas raı́ces reales son x = 0, x = 6. Como y = x2 , se obtienen los puntos crı́ticos (0, 0) y
(6, 36).

Al igual que las derivadas segundas de f permiten obtener condiciones suficientes para
asegurar que un punto crı́tico es un máximo o un mı́nimo local para funciones de una variable,
la diferencial segunda juega ese papel para campos escalares en Rn . La razón es que si la mejor
aproximación de grado 2 para una función f : R → R cerca de un punto x0 es el polinomio de
Taylor p2 (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + (1/2)f 00 (x0 )(x − x0 )2 , para funciones f : Rn → R la
mejor aproximación de grado 2 viene dada por
1
f (x) ≈ q(x) = f (P ) + ∇f (P ) · (x − P ) + (x − P )t (Hf (P )) (x − P ).
2
Por tanto, cuando ∇f (P ) = (0, 0, . . . , 0), lo que determina el signo de f (x) − f (P ) para puntos x
próximos a P es el signo de la forma cuadrática ω(x) = xt Hx, donde H = Hf (P ) ∈ Mn×n (R).

Teorema 5.4 (Criterio de la derivada segunda para extremos locales) Sea f un cam-
po escalar de clase C 2 definido en un subconjunto abierto D de Rn . Supongamos que P ∈ D es
un punto crı́tico de f , es decir, ∇f (P ) = (0, 0, . . . , 0).

1. Si la matriz H = Hf (P ) es definida positiva entonces f alcanza en P un mı́nimo local.

2. Si la matriz H = Hf (P ) es definida negativa entonces f alcanza en P un máximo local.

3. Si el determinante de H no es cero y la matriz H = Hf (P ) es indefinida entonces f


alcanza en P un punto de silla.
5.7. Extremos locales y globales de un campo escalar. 45

Observación: Los puntos crı́ticos de f para los que |Hf (P )| =


6 0 se llaman puntos crı́ticos no
degenerados. Los puntos crı́ticos degenerados se suelen examinar directamente.
Ejemplo. Calcular los extremos locales del campo escalar f : R2 → R definido por

f (x, y) = 4x3 − 12xy + y 2 .

Ya hemos visto que los puntos crı́ticos son (0, 0) y (6, 36). La matriz hessiana es
 2
∂2f

∂ f !
∂x2 ∂x∂y 24x −12
Hf (x, y) =  2 = .
∂ f ∂2f −12 2
∂y∂x 2
∂y

Para (0, 0), los menores principales son



0 −12
∆1 = 0 ; ∆2 = |Hf (0, 0)| = = −144 < 0.

−12 2

Por tanto, Hf (0, 0) es indefinida y f tiene un punto de silla en (0, 0).


Por otra parte, para (6, 36),

144 −12
∆1 = 144 > 0 ; ∆2 = |Hf (6, 36)| = = 144 > 0.

−12 2

Como Hf (6, 36) es definida positiva, f alcanza un mı́nimo local en (6, 36).

Máximos y mı́nimos globales.


Sea f : D ⊂ Rn → R un campo escalar definido en un conjunto D de Rn . Sea P ∈ D. Se
dice que f alcanza en P su máximo global (o máximo absoluto) en D si f (P ) ≥ f (x), ∀ x ∈ D.
De modo análogo se define el mı́nimo global (cambiando de sentido la desigualdad). El siguiente
resultado es similar al de existencia de extremos absolutos en intervalos compactos de R.

Teorema 5.5 (Existencia de extremos globales) Sea f : D ⊂ Rn → R un campo escalar


definido en un conjunto D de Rn . Si D es compacto y f es continua entonces f alcanza en D
su máximo global y su mı́nimo global.

Para localizar los etremos absolutos de f se siguen estos pasos:

1. Localizar los puntos crı́ticos de f en el interior de D.

2. Hallar los extremos de f considerada como función definida en la frontera de D.

3. Calcular el valor de f en todos los puntos crı́ticos y seleccionar el mayor y el menor.

Ejemplo. Calcular los extremos globales del campo escalar f (x, y) = x2 + 3x + y 2 + 1 en la región

D = (x, y) ∈ R2 / (x + 1)2 + y 2 ≤ 1 .

46 5. Continuidad y cálculo diferencial de funciones de varias variables

La región D representa un disco cerrado de centro (−1, 0) y radio 1. Por tanto D es com-
pacto.
En primer lugar, calculamos los puntos crı́ticos de f en el interior de D.
−3
∇f (x, y) = (2x + 3, 2y) = (0, 0) ⇐⇒ x = , y = 0.
2
El único punto crı́tico en el interior de D es (−3/2, 0).
En la frontera, como y 2 = 1 − (x + 1)2 , se tiene:

g(x) = f (x, y) = x2 + 3x + 1 + (1 − (x + 1)2 ) = x2 + 3x + 2 − x2 − 2x − 1 = x + 1, x ∈ [−2, 0].

Como g es creciente, el mı́nimo se alcanza para x = −2 y el máximo para x = 0. Los extremos


relativos de f en la frontera se alcanzan en (−2, 0) y (0, 0).
Finalmente, como
−5
f (−3/2, 0) = , f (−2, 0) = −1 , f (0, 0) = 1 ,
4
se deduce que el máximo global se alcanza en (0, 0) y el mı́nimo global se alcanza en (−3/2, 0).

5.8. Extremos condicionados. Multiplicadores de Lagrange.


En muchas ocasiones hay que maximizar o minimizar una función sujeta a ciertas restric-
ciones; es lo que se conoce con el nombre de extremos condicionados. Por ejemplo, queremos
hallar el máximo valor que toma una función f : R2 → R entre todos los puntos (x, y) que tienen
norma 1. Una de las técnicas más efectivas para abordar este tipo de problemas es el método de
los multiplicadores de Lagrange. Para motivarlo, consideremos el siguiente ejemplo:

Ejemplo. Calcular el punto de la recta y = 2 − x más próximo a (0, 0).


La función que hay que minimizar es el cuadrado de la distancia de (x, y) a (0, 0), es decir,

f (x, y) = x2 + y 2 . Trazamos las circunferencias x2 + y 2 = r de centro (0, 0) y radio r, que son
las curvas de nivel de f . En la figura 5.1 se observa que para valores pequeños de r (r = 1/2,
r = 1) las curvas de nivel no intersecan a la recta, lo cual quiere decir que no hay puntos de la
recta a esa distancia de (0, 0); para valores grandes (r = 3), hay dos puntos de intersección, pero
hay puntos de la recta dentro del disco de radio r, lo que indica que hay puntos de la recta que

distan del origen menos que r. El mı́nimo corresponde a la primera curva de nivel que corta a
la recta, que coincide con la circunferencia centrada en el origen que es tangente a la recta.
Para calcular el valor de r, obsérvese que un vector perpendicular a las curvas de nivel es
el gradiente ∇f (x, y) = (2x, 2y). Por otra parte, la recta y = 2 − x es una curva de nivel de la
función g(x, y) = x + y, y por tanto ∇g(x, y) = (1, 1) debe ser perpendicular a la recta. Como
∇f y ∇g son perpendiculares a la recta en el punto P = (x0 , y0 ) donde se alcanza el mı́nimo,
deben tener la misma dirección; por tanto, debe existir un escalar λ ∈ R tal que

∇f (x0 , y0 ) = λ∇g(x0 , y0 ).
5.8. Extremos condicionados. Multiplicadores de Lagrange. 47

y=2-x

r=3
r=2
r=1
r=0.5

Figura 5.1: Gráfica de y = 2 − x y las curvas de nivel x2 + y 2 = r.

De aquı́ se deduce que 2x0 = 2y0 = λ y por tanto x0 = y0 .


Como el punto está sobre la recta, se cumple que y0 = 2−x0 y, en consecuencia, x0 = y0 = 1.
√ El punto donde la distancia es mı́nima es (x0 , y0 ) = (1, 1) y la menor distancia posible es
2 (de ahı́ que el nivel correspondiente sea r = 2, como se observa en la figura).
Este ejemplo se generaliza a campos escalares en Rn para definir el método de los multipli-
cadores de Lagrange.

Teorema 5.6 (de los multiplicadores de Lagrange)


Supongamos que f : Rn → R y g : Rn → R son dos funciones de clase C 1 y

∇g(x1 , x2 , . . . , xn ) 6= (0, 0, . . . , 0) si g(x1 , x2 , . . . , xn ) = 0.

Si P ∈ Rn es un punto de máximo o mı́nimo local de f sujeto a la restricción g(x1 , . . . , xn ) = 0,


entonces existe un λ ∈ R tal que
∇f (P ) = λ∇g(P ).

Ejemplo 5.1 Calcular los valores máximos y mı́nimos de la función f (x, y) = x2 + 2y 2 sujetos
a la restricción x2 + y 2 = 1.
Definimos g(x, y) = x2 + y 2 − 1, de modo que la restricción se convierte en g(x, y) = 0. La
ecuación de los multiplicadores es:
(
2x = λ 2x
∇f (x, y) = λ∇g(x, y) ⇐⇒ (2x, 4y) = λ(2x, 2y) ⇐⇒
4y = λ 2y

De la primera ecuación se obtiene que x = 0 o λ = 1. De la segunda se obtiene que y = 0 o


λ = 2. Por tanto las únicas posibilidades son [x = 0, λ = 2] e [y = 0, λ = 1].
48 5. Continuidad y cálculo diferencial de funciones de varias variables

Para x = 0, como x2 + y 2 = 1, se obtienen los puntos (0, 1) y (0, −1). Para y = 0 se obtienen
los puntos (1, 0) y (−1, 0).
Para determinar cuáles son los valores máximos y mı́nimos, evaluamos f en esos puntos:
f (0, 1) = f (0, −1) = 2 ; f (1, 0) = f (−1, 0) = 1 .
Por tanto, los máximos relativos se alcanzan en (0, 1) y (0, −1), y los mı́nimos relativos en (1, 0)
y (−1, 0).
Observación: El método de los multiplicadores de Lagrange se puede usar para determinar los
extremos globales de una función en un conjunto compacto; en primer lugar se calcuları́an los
puntos crı́ticos en el interior igualando el gradiente a cero y luego se usarı́a el método de los
multiplicadores para determinar los extremos en la frontera.

Cálculo de extremos con varias restricciones.

El método de los multiplicadores se extiende al cálculo de extremos de una función sujeta


a varias restricciones. El resultado general es el siguiente:
Teorema 5.7 Sean f y g1 , g2 , . . . , gk funciones de clase C 1 definidas en Rn . Si P ∈ Rn es un
punto de máximo o mı́nimo local de f sujeto a las restricciones
g1 (x1 , . . . , xn ) = 0
g2 (x1 , . . . , xn ) = 0
..
.
gk (x1 , . . . , xn ) = 0,
entonces existen λ1 , λ2 , . . . , λk ∈ R tales que
∇f (P ) = λ1 ∇g1 (P ) + λ2 ∇g2 (P ) + · · · + λk ∇gk (P ).
Ejemplo 5.2 Calcular las alturas máxima y mı́nima de la curva intersección del plano x+y+z =
0 con la esfera x2 + y 2 + z 2 = 1.

Tenemos que encontrar los extremos de la función f (x, y, z) = z restringidos a la intersección


del plano con la esfera, es decir, sujetos a las restricciones
g1 (x, y, z) = x + y + z = 0 ; g2 (x, y, z) = x2 + y 2 + z 2 − 1 = 0 .
Según el resultado anterior, en los puntos de extremo deben existir λ, µ ∈ R tales que ∇f (x, y, z) =
λ∇g1 (x, y, z) + µ∇g2 (x, y, z). Por tanto:

∇f (x, y, z) = λ∇g1 (x, y, z) + µ∇g2 (x, y, z) ⇐⇒ (0, 0, 1) = λ(1, 1, 1) + µ(2x, 2y, 2z) ⇐⇒
 
 λ + 2µx = 0 
⇐⇒ λ + 2µy = 0 ⇐⇒ 2µx = 2µy = 1 − 2µz .
λ + 2µz = 1
 
5.8. Extremos condicionados. Multiplicadores de Lagrange. 49

Es claro que µ 6= 0 y por tanto x = y. Como x + y + z = 0, se obtiene que z = −x − y = −2y.


Sustituyendo en la ecuación x2 + y 2 + z 2 = 1, tenemos :
1
1 = x2 + y 2 + z 2 = y 2 + y 2 + (−2y)2 = 6y 2 =⇒ y = ± √ .
6
√ √ √ √ √
Si√y = 1/ 6, entonces x = 1/ 6, z = −2/ 6. Si y = −1/ 6, entonces x = −1/ 6,
z = 2/ 6. Por tanto los puntos de extremo son
   
1 1 −2 −1 −1 2
P1 = √ , √ , √ ; P2 = √ , √ , √ .
6 6 6 6 6 6
√ √
En consecuencia, la altura máxima es z = 2/ 6 y la mı́nima es z = −2/ 6.

Condición suficiente para la existencia de extremos condicionados.

Hay que tener en cuenta que el método de los multiplicadores de Lagrange detecta puntos
de tangencia, que pueden corresponder a mı́nimos, máximos o puntos de silla. En la situación
que se muestra en la figura 5.2, el punto A corresponderı́a a un mı́nimo de f (x, y) = x2 + y 2
restringido a la condición g(x, y) = 0, pero el punto B serı́a un punto de silla.

B
g(x,y)=0

Figura 5.2: Dos puntos de tangencia de la curva definida por una función g(x, y) = 0 y las curvas
de nivel x2 + y 2 = r.

Si la función objetivo f es continua y el conjunto de puntos que cumplen las restricciones


es compacto, entonces se alcanzan el mı́nimo y el máximo absolutos, de modo que para saber a
qué puntos corresponden de entre los que cumplen la ecuación de multiplicadores, basta evaluar
f en cada uno de ellos y escoger los valores extremos.
En otros casos se puede usar el siguiente criterio:
50 5. Continuidad y cálculo diferencial de funciones de varias variables

Proposición 5.3 Sean f, g1 , g2 , . . . , gk funciones de clase C 2 definidas en Rn . Supongamos que


para un punto P ∈ Rn existen λ1 , λ2 , . . . , λk ∈ R tales que

∇f (P ) = λ1 ∇g1 (P ) + λ2 ∇g2 (P ) + · · · + λk ∇gk (P ).

Se considera la función definida por

F (x) = f (x) − (λ1 g1 (x) + λ2 g2 (x) + · · · + λk gk (x)).

Denotemos por
U = Ker (Dg(P )) = {x ∈ Rn / Dg(P ) x = 0} ,
donde g : Rn → Rk es la función definida por g(x) = (g1 (x), g2 (x), . . . , gk (x)). Sea H = HF (P )
la matriz hessiana de F en P y ω : U → R la forma cuadrática definida en U por ω(x) = xt Hx.

Si ω es definida positiva entonces P es un mı́nimo local de f restringido a la condición


g(x) = (0, 0, . . . , 0).

Si ω es definida negativa entonces P es un máximo local de f restringido a la condición


g(x) = (0, 0, . . . , 0).

Si ω es indefinida y no degenerada entonces P es un punto de silla.

Ejemplo 5.3 Como ilustración del método, comprobemos que en el ejemplo 5.1 el punto P =
(1, 0) es un mı́nimo de la función f (x, y) = x2 +2y 2 sujeto a la restricción g(x, y) = x2 +y 2 −1 = 0.
Hemos visto que λ = 1 y por tanto

F (x, y) = f (x, y) − λg(x, y) = f (x, y) − g(x, y) = x2 + 2y 2 − (x2 + y 2 − 1) = y 2 + 1.

La matriz hessiana es  
0 0
H = HF (P ) = .
0 2
Como Dg(x, y) = ∇g(x, y) = (2x, 2y), en particular Dg(P ) = Dg(1, 0) = (2, 0). Por tanto,
   
x
U = Ker (Dg(P )) = (x, y) ∈ R2 / (2, 0) = 0 = (x, y) ∈ R2 / 2x = 0 = {(0, y) / y ∈ R} .

y

La forma cuadrática ω sobre U está definida por


  
0 0 0
ω(0, y) = (0, y) = 2y 2 .
0 2 y

Como ω es definida positiva, el punto P es un mı́nimo local de f restringido a g(x, y) = 0.


Referencias

Gerald L. Bradley y Karl J. Smith, “Cálculo de una y varias variables” (dos volúme-
nes), Prentice Hall, 1998.

Serge Lang, “Cálculo”, Addison-Wesley Iberoamericana, 1990.

Jerrold E. Marsden y Anthony J. Tromba, “Cálculo vectorial”, 5a. ed., Pearson,


2004.

Jon Rogawski, “Cálculo: Varias variables”, Reverte, 2012.

James Stewart, “Cálculo. Conceptos y contextos”, 4a. ed., Thompson, 2010.

51

También podría gustarte