Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apuntes Tema 3
Apuntes Tema 3
Máximos y mı́nimos.
660
f (x) = 2πx2 + .
x
Si queremos determinar cuál debe ser el radio del cilindro para minimizar la superficie de
metal necesaria para construir la lata (y por tanto, cómo debe ser el cilindro, ya que la
condición de que el volumen sea igual a 330 hace que la altura del cilindro dependa del
radio de la base), basta con determinar el mı́nimo de f (x). Para ello, teniendo en cuenta
que
660
f ′ (x) = 4πx − 2 ,
x
q
e igualando a cero, se tiene x = 3 660 4π
≈ 8, 033 cm; puede comprobarse, por ejemplo
utilizando f ′′ (x), que para ese valor de x, se alcanza efectivamente un mı́nimo. Para ese
valor del radio, estamos optimizando la fabricación de la lata, ya que estamos minimizan-
do la cantidad de metal necesario para construirla (y por tanto, el coste y el tiempo de
fabricación)1
1
Por cierto, acabo de ir al frigorı́fico y medir la base de una lata de refresco. Las dimensiones de las
latas que se comercializan son otras, luego entiendo que intervienen otras variables, por ejemplo estéticas,
etc.
53
54 CAPÍTULO 3. MÁXIMOS Y MÍNIMOS.
La pregunta es: ¿tiene sentido hablar de máximos y mı́nimos para funciones de varias
variables? Y en caso afirmativo, ¿cómo calcularlos? Esta es la cuestión que trataremos en
este tema.
∂ 2f
∂ ∂f
fxx = (fx )x = =
∂x ∂x ∂x2
∂ 2f
∂ ∂f
fyy = (fy )y = =
∂y ∂y ∂y 2
Y dos más, que llamamos derivadas mixtas o, más habitualmente, derivadas cruzadas,
∂ 2f
∂ ∂f
fyx = (fy )x = =
∂x ∂y ∂x∂y
∂ 2f
∂ ∂f
fxy = (fx )y = = .
∂y ∂x ∂y∂x
Por lo tanto, una función f (x, y) tiene dos derivadas primeras (o de orden 1), cuatro
derivadas segundas (o de orden 2), ocho derivadas terceras (o de orden 3), correspondientes
a derivar cada una de las derivadas segundas respecto a x ó respecto a y, etc. Análogamente,
una función F (x, y, z) tiene tres derivadas primeras, nueve derivadas segundas, veintisiete
derivadas terceras... Sin embargo, algunas de esas derivadas, bajo buenas condiciones, serán
iguales. Veamos un ejemplo:
Además,
fxx = 6x + 2y 3 , fxy = 6xy 2 , fyx = 6xy 2 , fyy = 6x2 y − 4.
En el ejemplo anterior observamos que fxy = fyx . Esta igualdad no es casual, sino que
es consecuencia del teorema siguiente.
3.1. DERIVADAS DE ORDEN SUPERIOR. 55
Si tenemos una función F (x) con x ∈ Rn , es decir, una función de más de dos variables,
el resultado es análogo.
∂ 8F
,
∂x2 ∂y∂z 2 ∂x3
nos indica que hay que tomar una función F (x, y, z), derivarla tres veces respecto a x,
luego dos veces respecto a z, luego una respecto a y, y finalmente dos veces más respeto a
x. Bajo buenas condiciones, lo que podemos asegurar es que el resultado de esa derivada
será igual al de
∂ 8F
,
∂x5 ∂y∂z 2
donde primero derivamos dos veces respecto a z, luego respecto a y, y luego cinco veces
respecto a x, y también igual a
∂ 8F
,
∂x∂y∂x∂z∂x∂z∂x∂x
donde derivamos respecto a cada variable el mismo número de veces que antes, pero con
un orden mucho más caprichoso. El siguiente resultado corresponde a esta idea. Aquı́ se
utiliza la noción de función de clase C k : decimos que una función es de clase C k si la
función y todas sus derivadas hasta orden k son continuas.
y y = f (x)
P3
P1
P2
x
a I b
También podemos hablar de extremos absolutos, pero eso requiere que fijemos un inter-
valo I ⊂ R (que puede ser toda la recta real). El máximo absoluto de una función f (x)
sobre un intervalo I, es simplemente el mayor valor que alcanza la función en el intervalo;
análogamente, el mı́nimo absoluto es el menor valor que alcanza la función f (x) sobre I.
Para calcularlo, debemos tener en cuenta dos cosas: (i) los valores que alcanza la función
en los posibles extremos locales comprendidos en I (es decir, en los valores de x ∈ I donde
f ′ (x) = 0, o donde f (x) no es derivable); (ii) los valores de la función en los extremos de I
(es decir, si I = [a, b], los valores f (a) y f (b), y si alguno de los extremos de I es ±∞, el
lı́mite correspondiente). Esencialmente, reunimos todos esos valores, y buscamos el menor
y el mayor; el menor corresponde al mı́nimo absoluto, y el mayor, al máximo absoluto.
Por ejemplo, en el caso de la función de Fig. 3.1, el mı́nimo absoluto se alcanza en x = a,
3.2. EXTREMOS LOCALES. 57
Vamos ahora a generalizar estos conceptos para el caso de funciones de dos variables,
f (x, y). En esta sección nos centraremos en los extremos locales; en la sección siguiente
trataremos los extremos absolutos. Intuitivamente, si f (x, y) presenta un máximo local en
un punto p = (a, b), el punto de la gráfica de f (x, y) (es decir, de la superficie z = f (x, y))
al que da lugar aparece como una “cumbre”de la superficie (véase Fig. 3.2). Análogamente,
si f (x, y) presenta un mı́nimo local en un punto p = (a, b), el punto correspondiente de
z = f (x, y) aparece como un “valle”, o un “pozo”de la superficie (véase Fig. 3.2, también).
Formalicemos las definiciones de extremo local. Intuitivamente, hemos dicho que una
función alcanza un mı́nimo local (resp. máximo local) en p cuando está por debajo (resp.
por encima) de sus vecinos inmediatos. La definición siguiente persigue definir esto con
más precisión. En esta definición aparece el concepto de entorno de un punto: si p ∈ R2 ,
un entorno Ep ⊂ R2 de p (abreviadamente, E) es simplemente un subconjunto del plano
que contiene a p; por ejemplo, en Fig. 3.3 se muestra un entorno del origen.
58 CAPÍTULO 3. MÁXIMOS Y MÍNIMOS.
fx (0, 0) = fy (0, 0) = 0. Sin embargo, observemos que en (0, 0), la función f (x, y) no tiene
ni máximo ni mı́nimo local. En efecto, f (0, 0) = 02 −02 = 0. Por lo tanto, si fuera un mı́nimo
local, en las proximidades del (0, 0) tendrı́amos que f (x, y) ≥ f (0, 0), es decir, y 2 − x2 ≥ 0.
Sin embargo, eso no es cierto, porque en cualquier punto de la forma (x0 , 0), con x0 6= 0
(y cualquier entorno del (0, 0) contiene puntos de ese tipo) se tiene f (x0 , 0) = −x20 < 0.
Pero tampoco hay un mı́nimo local en (0, 0): si lo fuera, en las proximidades del (0, 0)
tendrı́amos que f (x, y) ≤ f (0, 0), es decir, y 2 − x2 ≤ 0, pero eso de nuevo es falso porque
en cualquier punto (0, y0 ), con y0 6= 0, se tiene f (0, y0 ) = y02 > 0. En Fig. 3.3, se puede
observar cómo cualquier entorno de (0, 0) contiene puntos (x0 , 0), con x0 6= 0, y (0, y0 ), con
y0 6= 0.
y
(0, y0)
(x0, 0)
Figura 3.3: Cualquier entorno del origen contiene puntos (x0 , 0) y (0, y0 ).
∂ 2f ∂ 2f
∂
∂x2 (p) (p) ← (p) ~
∇f →
Hf (p) = ∂x∂y = ∂x
∂ 2f ∂ 2f ∂
~
(p) (p) ← (p) ∇f →
∂y∂x ∂y 2 ∂y
El Hessiano de f en p es el determinante de Hf (p).
Observemos que, bajo “buenas condiciones”(es decir, siempre que las derivadas primeras
y las derivadas cruzadas sean continuas), por el Lema de Schwartz, Hf (p) es simétrica.
Por simplicidad, en lo que sigue asumiremos que esa condición se da, y escribiremos
A B
Hf (p) = .
B C
Observemos que el teorema anterior no cubre todos los casos: por ejemplo, si D = 0, o
si D > 0 y A = 0, el teorema no nos dice nada, y tenemos que recurrir a la Definición 31
para aclarar qué sucede en el punto. Veamos primero un ejemplo de aplicación del Teorema
36. Después veremos otro ejemplo donde el teorema no aporta nada, y donde tendremos
que recurrir a la definición.
3.2. EXTREMOS LOCALES. 61
Ejemplo 16. Sea f (x, y) = x3 + y 3 − 2xy. Como la función es polinómica, las parciales
fx = 3x2 − 3y, y fy = 3y 2 − 3x están siempre definidas, y por lo tanto los puntos crı́ticos
corresponden a los puntos (x, y) donde fx = fy = 0, es decir, a las soluciones del sistema
polinómico: 2
3x − 3y = 0,
3y 2 − 3x = 0.
En la primera ecuación despejamos y = x2 ; en la segunda, x = y 2 . Por lo tanto, se tiene
x = (x2 )2 , es decir, x4 − x = 0. Luego x = 0, x = 1. Si x = 0, entonces y = 0, y si x = 1,
y = 1, luego los puntos crı́ticos son P1 = (0, 0), y P2 = (1, 1). Para estudiar la naturaleza
de cada uno, calculamos la matriz hessiana,
6x −3
Hf (x, y) = ,
−3 6y
y el hessiano, entonces, es
det(Hf (x, y)) = 36xy − 9.
Como
0 −3
Hf (0, 0) = ,
−3 0
cuyo determinante es −9, aplicando el criterio del Teorema 36 se tiene que (0, 0) es un
punto de silla. En cambio,
6 −3
Hf (1, 1) = ,
−3 6
y aplicando el criterio del Teorema 36, se tiene que (1, 1) es un mı́nimo local.
Ejemplo 17. Consideremos ahora la función f (x, y) = x4 + y 4 + 2x2 y 2 . Como la función
es polinómica, los puntos crı́ticos son, todos ellos, estacionarios. Las parciales son fx =
4x3 + 4xy 2 = 4x(x2 + y 2 ), fy = 4y 3 + 4yx2 = 4y(x2 + y 2 ), que se anulan a la vez únicamente
en el punto P = (0, 0). Sin embargo, como
12x2 + 4y 2
8xy
Hf (x, y) = ,
8xy 12y 2 + 4x2
entonces
0 0
Hf (0, 0) = ,
0 0
cuyo determinante es D = 0. Por lo tanto, Teorema 36 no es aplicable. Sin embargo,
observamos que f (0, 0) = 0. Por lo tanto, tendremos un mı́nimo local si en torno al origen,
se tiene f (x, y) ≥ f (0, 0), es decir, f (x, y) ≥ 0. Como f (x, y) = x4 + y 4 + 2x2 y 2 =
(x2 + y 2 )2 , y necesariamente (x2 + y 2 )2 ≥ 0, efectivamente, tenemos un mı́nimo local (de
hecho, absoluto).
Los conceptos y resultados anteriores son generalizables al caso de funciones F (x), con
x ∈ Rn , n ≥ 3.
62 CAPÍTULO 3. MÁXIMOS Y MÍNIMOS.
(3) Si los determinantes de las submatrices Ak para k = 1, . . . , n son todos no nulos pero
no estamos en ninguna de las situaciones anteriores, entonces a es un punto de silla.
lim(x,y)→(0,0) f (x, y) = ∞.
Es más, el valor más pequeño para la función se obtiene en los puntos del borde del disco,
es decir, en los puntos donde x2 + y 2 = 1: en estos esos puntos, la función toma el valor 1,
y ese valor se va haciendo más y más grande a medida que nos movemos hacia el origen.
Por lo tanto, el mı́nimo absoluto de f (x, y) es 1 y se alcanza en infinitos puntos a la vez,
en concreto sobre todos los puntos de la circunferencia x2 + y 2 = 1; en cambio, no hay
máximo absoluto.
1
Figura 3.5: f (x, y) = x2 +y 2
, en U = {(x, y) ∈ R2 |x2 + y 2 ≤ 1}.
Para asegurar que se alcanzan los extremos absolutos, necesitamos ciertas condiciones
sobre la función y sobre el subconjunto U . Decimos, informalmente, que U ⊂ Rn es aco-
tado, si no se extiende indefinidamente. Por ejemplo, un disco o una esfera son acotados;
en cambio un plano no lo es. Decimos, también informalmente, que U es cerrado, cuando
contiene a su frontera. Si se dan las dos condiciones anteriores, es decir, si U ⊂ Rn es
cerrado y acotado, decimos que es compacto. Se tiene entonces el siguiente resultado, que
garantiza que se alcancen los extremos absolutos.
3.3. EXTREMOS ABSOLUTOS. 65
Vamos a ver ahora un ejemplo detallado de cálculo de extremos absolutos. Antes, re-
cordemos cómo calcular extremos absolutos de una función de una variable. Si queremos
calcular los extremos absolutos de, por ejemplo, f (t) = t2 + 2t en el intervalo I = [−2, 1],
debemos buscar primero los puntos donde pueda darse extremo absoluto. Esos puntos son:
(i) los puntos del interior de I donde f ′ (t) = 0 (potenciales extremos relativos); (ii) los
puntos del extremo del intervalo, en este caso t = −2 y t = 1. En nuestro caso, como
f ′ (t) = 2t + 2, entonces f ′ (t) = 0 para t = −1, que está dentro del intervalo. Por tanto,
las posibilidades son t = −2, t = −1, t = 1. Ahora evaluamos f (t) en cada uno de esos
puntos: f (−2) = 0, f (−1) = −1, f (1) = 3. El mayor valor es 3, luego ése es el máximo
absoluto, que se alcanza en un extremo del intervalo, t = 1. El menor valor es −1, que se
alcanza en el punto t = −1, interior al intervalo, que también es extremo relativo.
Antes de abordar el ejemplo, necesitamos introducir la noción de parametrización de
una curva, sobre la cuál volveremos más adelante, en el curso, cuando abordemos las inte-
grales sobre curvas. Una parametrización de una curva f (x, y) = 0 es un par de funciones
{x(t), y(t)}, con t ∈ I (I un intervalo) de tal manera que: (a) para todo t ∈ I, el punto
(x(t), y(t)) esté en la curva; (b) todo punto de la curva pueda escribirse como (x(t), y(t))
para algún t ∈ I. En particular, debe cumplirse f (x(t), y(t)) = 0 para todo t ∈ I. Decimos
66 CAPÍTULO 3. MÁXIMOS Y MÍNIMOS.
U = {(x, y) ∈ R2 |0 ≤ x ≤ 4, 0 ≤ y ≤ 2x}.
1. Como f (x, y) es polinómica, los puntos crı́ticos en el interior de U son los puntos
donde se anula el gradiente de la función (porque no hay puntos donde alguna parcial
no exista). Como fx = y − 2, fy = x − 3, obtenemos el punto P1 = (3, 2), que
efectivamente está en el interior de U 3 .
2. La frontera de U (véase Fig. 3.6) consta de tres tramos: (a) L1 , el tramo del eje x
entre x = 0 y x = 4; (b) L2 , el tramo de la recta x = 4, desde el punto (4, 0) hasta el
punto (4, 8); (c) L3 , el tramo de la recta y = 2x desde x = 0 hasta x = 4.
8
L3
L2
0 L1 4
las variables x, y no son libres, sino que están ligadas por la condición de que (x, y) sea un
punto de la hipérbola; es decir, por la condición xy − 1 = 0. Podemos por tanto reformular
nuestro problema de la siguiente manera:
Minimizar f˜(x, y) = x2 + y 2 ,
p
68 CAPÍTULO 3. MÁXIMOS Y MÍNIMOS.
sujeta a la condición xy − 1 = 0.
Además,
√ √ como la raı́z cuadrada
p es una función monótona (es decir, si a, b > 0, entonces
a < b si y sólo si a < b), x2 + y 2 será mı́nima en el mismo punto en que lo sea x2 + y 2 .
Por lo tanto, podemos simplificar el problema como:
Minimizar f (x, y) = x2 + y 2 ,
sujeta a la condición xy − 1 = 0.
Se trata entonces de buscar el mı́nimo absoluto de la función f (x, y), sobre los puntos
de una curva g(x, y) = 0, en este caso la hipérbola xy − 1 = 0. Esto es lo que llamamos un
problema de máximos y mı́nimos condicionados, porque queremos encontrar el máximo o el
mı́nimo (absolutos) de una cierta función f (x1 , x2 , . . . , xn ), en un caso en que las variables
x1 , x2 , . . . , xn no son libres, sino que satisfacen una condición g(x1 , x2 , . . . , xn ) = 0 (se habla
de condición, o también de restricción o ligadura). Cuando sólo hay una condición (puede
haber más, como veremos después), entonces la forma general del problema es la siguiente:
Problema 1.
Maximizar/Minimizar f (x1 , x2 , . . . , xn ),
sujeta a la condición g(x1 , x2 , . . . , xn ) = 0.
Volvamos al problema original: en este caso, la solución es sencilla, sin más que repre-
sentar geométricamente la situación (ver Fig. 3.7).
y
Geométricamente, puede verse que los puntos de la hipérbola xy = 1 que están más
próximos al origen son los puntos de intersección con la recta y = x; por lo tanto, se
cumple x2 = 1, es decir, x = ±1, y puesto que y = x, los puntos buscados son√(±1, ±1),
que aparecen marcados en rojo en Fig. 3.7.√ La distancia de ambos al origen, es 2; por lo
tanto, la respuesta a nuestra pregunta es 2. En este caso, se puede encontrar la solución
por métodos sencillos, pero en general necesitamos un procedimiento más sofisticado. La
base del método la proporciona el Teorema de Lagrange.
3.4. MÁXIMOS Y MÍNIMOS CONDICIONADOS. 69
Teorema 45. Sean f (x), g(x) funciones diferenciables en Rn . Si f (x) alcanza su máximo
~
o mı́nimo absolutos en x = x0 sobre el conjunto g(x) = 0, y ∇g(x 0 ) 6= 0, se tiene
~ (x0 ) = λ · ∇g(x
∇f ~ 0) (3.1)
para algún λ ∈ R.
Demostración. (Opcional del Teorema 45; caso de dos variables) Por hipótesis, sabemos
~
que ∇g(x 0 ) 6= 0. Por el Teorema de la Función implı́cita, entonces tenemos o bien un
intervalo I ⊂ R, x0 ∈ I, tal que para todo x ∈ I la expresión g(x) = g(x, y) = 0 define
implı́citamente a y = y(x), con y(x) diferenciable en I, o bien un intervalo J ⊂ R, y0 ∈ J,
tal que para todo y ∈ J la expresión g(x) = g(x, y) = 0 define implı́citamente a x = x(y),
con x(y) diferenciable en J. Supongamos que se da la primera situación; la segunda es
análoga. Por lo tanto, en la vecindad de x0 la función f (x, y) que queremos maximizar o
minimizar es de hecho una función f (x, y(x)), que es diferenciable porque f y y(x) son
diferenciables. Como f (x, y(x)) tiene un máximo o mı́nimo en x = x0 ∈ I, su derivada se
debe anular en x = x0 ; por la regla de la cadena, en el punto (x0 , y0 ) se tiene
fx · 1 + fy · y ′ = 0,
es decir, ∇f ~ = (fx , fy ) en el punto (x0 , y0 ) es perpendicular al vector (1, y ′ (x0 )). Puesto que
~
(1, y ′ (x0 )) es tangente a la curva g(x, y) = 0 en (x0 , y0 ), y el vector ∇g(x 0 , y0 ) es normal
a la misma, entonces ∇f ~ (x0 ) y ∇g(x
~ 0 ) son paralelos. Además, como habı́amos supuesto
~
que ∇g(x ~ ~
0 ) 6= 0, se tiene ∇f (x0 ) = λ · ∇g(x0 ) para algún λ ∈ R.
1. Formamos la función
z z
x y
Llamamos [1], [2], [3], [4] a las ecuaciones anteriores. En general, para resolver estos sis-
temas buscamos librarnos de los multiplicadores (a menudo sin calcularlos). Por ejemplo,
si multiplicamos [1] por y, y [2] por x, obtenemos
8y 2 z + λ · 2xy = 0,
8x2 z + λ · 2xy = 0.
Restando las ecuaciones anteriores, se deduce que 8z(y 2 − x2 ) = 0. Puesto que z > 0, se
tiene x2 = y 2 ; y como x, y > 0, concluimos que x = y. Podemos hacer algo similar con [2] y
[3]. En este caso multiplicamos [2] por z, [3] por y, restamos las ecuaciones que obtenemos,
y razonando como antes se tiene y = z. Por lo tanto, x = y = z. Sustituyendo esto en [4],
llegamos a
3x2 − 1 = 0,
√
de donde, puesto que x > 0, se tiene x = 3/3. Como x = y = z, y nos piden las
dimensiones de la caja, que son 2x, 2y, 2z,
√ vemos que la caja de volumen máximo, inscrita
en la esfera unidad, es el cubo de lado 2 3/3.
72 CAPÍTULO 3. MÁXIMOS Y MÍNIMOS.
En el caso más general posible, podemos tener no una, sino varias restricciones. Es
decir, la versión más general del problema es la siguiente:
Problema 2.
Maximizar/Minimizar f (x1 , x2 , . . . , xn ),
sujeta a las condiciones g1 (x1 , x2 , . . . , xn ) = 0, . . . , gk (x1 , x2 , . . . , xn ) = 0, con
k < n.
En este caso, el resultado fundamental que necesitamos es el siguiente; la demostración
es similar al caso de dos variables, utilizando una forma más general para el Teorema de
la Función Implı́cita.
Teorema 46. Sean f (x), g1 (x), . . . , gk (x) funciones de clase C 1 en Rn . Si f (x) alcanza
su máximo o mı́nimo absolutos en x = x0 sobre el conjunto de Rn definido por g1 (x) =
~ 1 (x0 ), . . . , ∇g
0, . . . , gk (x) = 0, k < n, y ∇g ~ k (x0 ) son linealmente independientes, existen
λ1 , . . . , λk ∈ R tales que
~ (x0 ) = λ1 · ∇g
∇f ~ 1 (x0 ) + · · · + λk · gk (x0 ). (3.2)
Los pasos que debemos dar para resolver un problema de este tipo son muy similares a
los del caso anterior.
1. Formamos la función
F (x, λ) = f (x) + λ1 · g1 (x) + · · · + λk · gk (x).
Las variables λ1 , . . . , λk son auxiliares, y se llaman multiplicadores de Lagrange.
2. Consideramos el sistema formado al igualar a 0 todas las derivadas de la función F
(respecto a las xi , y respecto a λ1 , . . . , λk ; al igualar a 0 la derivada de F con respecto
a λi obtenemos, de hecho, la condición gi (x) = 0). En forma compacta, este sistema
es
~ (x) + λ1 ∇g
∇f ~ 1 (x) + · · · + λk ∇g ~ k (x) = 0,
que se corresponde con Eq. 3.2.
3. Resolvemos el sistema anterior para x1 , . . . , xn . Las variables λ1 , . . . , λk son auxi-
liares, y en muchos casos podemos eliminarlas sin calcularlas. En otros casos las
calcularemos, pero sólo como un medio para llegar a x1 , . . . , xn , y no como un fin en
sı́ mismo.
4. Si existe, el máximo o mı́nimo (absoluto) buscado estará entre las soluciones obteni-
das.
Como ya observamos antes, si existe, la solución al problema estará entre las soluciones
del sistema anterior. Pero primero debemos convencernos de que, efectivamente, la solución
existe.
3.4. MÁXIMOS Y MÍNIMOS CONDICIONADOS. 73
Para buscarla, llamemos (x, y, z) a las coordenadas del punto que deseamos encontrar.
La distancia de ese punto al origen es
p p
(x − 0)2 + (y − 0)2 + (z − 0)2 = x2 + y 2 + z 2 .
Queremos que esta función se haga mı́nima. Sin embargo, observamos que, puesto que la
raı́z cuadrada es una función monótona creciente, dicha función se hará mı́nima allá donde
x2 + y 2 + z 2 se haga mı́nima, con lo que la función que deseamos minimizar es f (x, y, z) =
x2 + y 2 + z 2 . Como (x, y, z) es un punto de la intersección del plano x + y − z − 1 = 0 y el
cono x2 + y 2 − z 2 = 0, tenemos dos restricciones. Es decir, el problema es:
Minimizar f (x, y, z) = x2 + y 2 + z 2 ,
F (x, y, z, λ, µ) = x2 + y 2 + z 2 + λ · (x + y − z − 1) + µ · (x2 + y 2 − z 2 ),
(x − y)(2 + 2µ) = 0,
Sin embargo este sistema no tiene soluciones reales, ya que la única pareja que satisface
la segunda ecuación es x = 0, y = 0, que sin embargo no cumple la primera ecuación.
Por lo tanto, los únicos candidatos son P1 y P2 . Podemos ver que f (P1 ) > f (P2 ), luego
la distancia mı́nima al origen se alcanza en P2 . En realidad, P1 corresponde al punto
más alejado del origen (obsérvese que si en vez de minimizar f (x, y, z) hubiéramos elegido
maximizar f (x, y, z), el proceso habrı́a sido el mismo).
polinomio Pn (x), del grado n que fijemos, que aproxime suficientemente bien, en algún
sentido, la función f (x) en las proximidades del punto x = x0 . Escribamos
Pn (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + an (x − x0 )n .
Si la función f (x) tiene derivadas hasta orden n, para asegurar que Pn (x) aproxima bien a
f (x) para x cercano a x0 , imponemos
Pn (x0 ) = f (x0 ), Pn′ (x0 ) = f ′ (x0 ), , Pn′′ (x0 ) = f ′′ (x0 ), . . . , Pnn) (x0 ) = f n) (x0 ).
Escribiendo Pn (x0 ), Pn′ (x0 ), Pn′′ (x0 ), . . . en función de a0 , a1 , a2 , . . ., podemos obtener los
valores de los ai en función de los valores de las derivadas de f (x) en x = x0 . Más concre-
tamente, se tiene
x x2 xn
Pn (x) = 1 + + + ··· + .
1! 2! n!
Tomando por ejemplo n = 2, se tiene que una buena aproximación de e0,1 (obsérvese que
x = 0,1 está próximo a x = 0), serı́a
La expresión Rn (x) = f (x) − Pn (x) recibe el nombre de resto de Taylor de f (x), de orden
n, en x = a, y el resultado anterior nos dice no sólo que Rn (x) tiende a cero cuando x → a,
sino que tiende a 0 más rápido que |x − a|n .
Nos planteamos entonces algo parecido para funciones de varias variables. Indicaremos
simplemente la idea para el caso de funciones de dos variables, f (x, y); para funciones de
un mayor número de variables, los resultados son análogos. Para una función f (x, y), y un
punto p = (x0 , y0 ), buscamos entonces un polinomio Pn (x, y), de grado n, que aproxime
bien la función en las proximidades de p. Para ello, impondremos que los valores de las
derivadas parciales de Pn (x, y) en p hasta orden n coincidan con los valores de las derivadas
parciales de f (x, y) en p hasta orden n. En el caso de n = 1, se tiene
1 ∂f ∂f
P1 (x, y) = f (p) + (p)(x − x0 ) + (p)(y − y0 ) .
1! ∂x ∂y
La expresión anterior deberı́a ser ya familiar: corresponde a la coordenada z del plano
tangente a la gráfica de z = f (x, y) en p. Para n = 2, se tiene
1 ∂f ∂f
P2 (x, y) = f (p) + (p)(x − x0 ) + (p)(y − y0 ) +
1! ∂x ∂y
2 (3.3)
∂ 2f ∂ 2f
1 ∂ f 2 2
(p)(x − x0 ) + 2 (p)(x − x0 )(y − y0 ) + 2 (p)(y − y0 ) .
2! ∂x2 ∂x∂y ∂y
En general, para pasar de Pk−1 (x, y) a Pk (x, y), tenemos que añadir el término
k
1 X k ∂kf
· k−j j
(p)(x − x0 )k−j (y − y0 )j ,
k! j=0 j ∂x ∂y
Teorema 47. Sea f (x, y) una función de clase C n+1 en un conjunto abierto U ⊂ R2 que
contiene a (x0 , y0 ), y sea Pn (x, y) su polinomio de Taylor de orden n en (x0 , y0 ). Si el
segmento que conecta (x0 , y0 ) y (x, y) está contenido en U , entonces
f (x, y) = Pn (x, y) + Rn (x, y),
donde
Rn (x, y) f (x, y) − Pn (x, y)
lim(x,y)→(x0 ,y0 ) n = lim(x,y)→(x0 ,y0 ) → 0.
k(x, y) − (x0 , y0 )k k(x, y) − (x0 , y0 )kn
La expresión Rn (x, y) recibe el nombre de resto de Taylor de f (x, y), de orden n, en (x0 , y0 ).
El resultado anterior justifica que Pn (x, y) proporciona una buena aproximación de
f (x, y) en las proximidades de (x0 , y0 ), ya que la diferencia entre ambos tiende a cero más
deprisa de lo que nos aproximamos al punto.
2 2
A modo de ejemplo, consideremos f (x, y) = e−x −y , cuya gráfica aparece en la Fig.
3.11. En las sucesivas imágenes, se muestran la gráfica de la función y la de su polinomio
de Taylor en (0, 0) para n = 1, n = 2, n = 4, n = 6 y n = 8. Puede apreciarse cómo las
graficas de los polinomios se ajustan cada vez mejor a la gráfica original, a medida que el
grado va subiendo.
El polinomio de Taylor proporciona por tanto, siempre que f cumpla ciertas condiciones,
una buena aproximación de f (x, y) en las proximidades del punto p. De hecho, podemos
utilizar el polinomio de Taylor para justificar el criterio del Teorema 36, que permitı́a
discriminar si en un punto crı́tico p tenı́amos máximo local, mı́nimo local o punto de silla,
en determinados casos. Para ello, recordemos que en un punto crı́tico las dos derivadas
primeras se anulan, es decir,
∂f ∂f
(p) = (p) = 0.
∂x ∂y
Por lo tanto, la expresión (3.3) para el Polinomio de Taylor en p, de orden 2, queda, en el
caso en que p es un punto crı́tico,
1 ∂ 2f ∂ 2f ∂ 2f
2 2
P2 (x, y) = f (p) + (p)(x − x0 ) + 2 (p)(x − x0 )(y − y0 ) + 2 (p)(y − y0 ) .
2! ∂x2 ∂x∂y ∂y
(3.4)
Para (x, y) suficientemente próximo a p, podemos escribir f (x, y) ≈ P2 (x, y), es decir,
1 ∂ 2f ∂ 2f ∂ 2f
2 2
f (x, y) ≈ f (p) + (p)(x − x0 ) + 2 (p)(x − x0 )(y − y0 ) + 2 (p)(y − y0 ) .
2! ∂x2 ∂x∂y ∂y
Por lo tanto,
∂ 2f ∂ 2f ∂ 2f
1 2 2
f (x, y) − f (p) ≈ (p)(x − x0 ) + 2 (p)(x − x0 )(y − y0 ) + 2 (p)(y − y0 ) .
2! ∂x2 ∂x∂y ∂y
Para poder saber si p es un máximo local, mı́nimo local o un punto de silla, necesitamos
conocer el signo de f (x, y) − f (p) en las proximidades de p: si el signo es positivo, entonces
78 CAPÍTULO 3. MÁXIMOS Y MÍNIMOS.
2 −y 2
Figura 3.11: Polinomio de Taylor de distintos grados para f (x, y) = e−x en el origen.
M es diagonalizable. Es decir, existe una matriz diagonal J, y una matriz invertible P , tal
que M = P · J · P −1 . Pero además, por ser M simétrica, se puede conseguir que P −1 = P T ,
es decir, que la transpuesta de P coincida con la inversa de P . Por tanto, M = P · J · P T ,
donde los elementos de la matriz J son los autovalores de M . En nuestro caso,
A B λ1 0
=P· · PT.
B C 0 λ2
Llamemos ahora
"
w= u v · P.
Entonces,
T T u
w =P · ,
v
y la expresión (3.5) queda
λ1 0
w· · wT .
0 λ2
Si finalmente llamamos w = (w1 , w2 ), llegamos a
λ1 w12 + λ2 w2 , (3.8)
No obstante, aún no hemos justificado el Teorema 36, que está enunciado en términos
de A, B, C. Para ello, necesitamos recordar algo más del Álgebra Lineal. Dos matrices R, S
tales que existe otra matriz Q cumpliendo R = Q · S · Q−1 se llaman semejantes. Y dos
4
Por ejemplo, si λ1 > 0 y λ2 < 0, para w1 = 0 y w2 6= 0 el signo es negativo, y para w1 6= 0 y w2 = 0,
positivo
80 CAPÍTULO 3. MÁXIMOS Y MÍNIMOS.
matrices semejantes tienen el mismo determinante, y también la misma traza5 . Como las
matrices
A B λ1 0
,
B C 0 λ2
son semejantes, entonces se cumple lo anterior, y por tanto, D = AC − B 2 coincide con
λ1 · λ2 (es decir, los determinantes de ambas matrices son iguales), y A + C = λ1 + λ2 (las
trazas de ambas matrices son iguales). Ahora ya podemos demostrar el Teorema 36.
Demostración. (del Teorema 36) Consideramos los siguientes casos:
5
Recordemos que la traza de una matriz es la suma de los elementos de la diagonal principal