Está en la página 1de 24

Aproximación local.

Extremos

Contenido
2.1. Desarrollo de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1.1. Fórmula de Taylor y aplicaciones en una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1.2. El desarrollo de Taylor multidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.3. Series de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2. Máximos y mı́nimos relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1. Matrices definidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.2. Índice de formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.3. Puntos crı́ticos no degenerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3. Extremos condicionados. Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . . . . 15
2.3.1. La regla del multiplicador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.1. Desarrollo de Taylor

2.1.1. Fórmula de Taylor y aplicaciones en una variable

Si P = P (x) es un polinomio de grado ≤ n, es decir, P (x) = a0 + a1 x + a2 x2 + · · · + an xn , P se puede


escribir en potencias de (x − a) en la forma P (x) = b0 + b1 (x − a) + b2 (x − a)2 + · · · + bn (x − a)n para cualquier
punto a ∈ R. Los coeficientes bi vendrán dados en términos del polinomio P . Explı́citamente, calculando las
derivadas sucesivas de P , encontramos
n
X
P (k (x) = j(j − 1)(j − k + 1)bj (x − a)j−k , k ≥ 1
j=k

y por tanto P (k (a) = k!bk , es decir

P (k (a)
bk = , k = 0, 1, 2, . . . , n.
k!
Ası́
n
X P (k (a)
P (x) = (x − a)k . (2.1)
k!
k=0

La expresión de los coeficientes bk tiene sentido si consideramos una función f con suficientes derivadas
en un punto dado a ∈ R, pero no cabe esperar una identidad como (2.1) en general -¡esto implicarı́a que
toda función suficientemente regular serı́a un polinomio!- Sin embargo, como veremos en el apartado 2.1.3,
la versión de (2.1) para n → ∞ es cierta en ciertas circunstancias.

Aproximación polinómica. Fórmula de Taylor

Dada una función f : I → R definida en un intervalo abierto I ⊂ R y a ∈ I, si existen las derivadas


f 0 (a), f 00 (a), . . . , f (n (a), llamamos polinomio de Taylor de f en a de grado n a
n
X f (k (a)
Pn,a (x) = f (a) + (x − a)k .
k!
k=1
Curso 21/22 MMII Aproximación local. Extremos

Nótese que
f (k (a) = Pn,a
(k
(a)
para todo k = 0, 1, 2, . . . , n y que, por lo anteriormente expuesto, dicho polinomio es el único de grado ≤ n
que satisface esta propiedad.
El Teorema de Taylor se obtiene de un resultado más general que, a su vez, es una extensión del
Teorema de Cauchy.

Teorema 2.1 (Cauchy generalizado). Sean f y g dos funciones con derivadas n-ésimas f (n y g (n en
un intervalo abierto (a, b) y derivadas hasta orden (n − 1) continuas en [a, b]. Supongamos que c ∈ [a, b].
Entonces, para todo x ∈ [a, b], x 6= c, existe ξ en el interior del intervalo que une c con x tal que
n−1
! n−1
!
X f (k (c) X g (k (c)
f (x) − (x − c)k g (n (ξ) = f (n (ξ) g(x) − (x − c)k
k! k!
k=0 k=0

Demostración. Sin pérdida de generalidad supongamos c < x. Para x fijo sean F y G las funciones
n−1
X f (k (t)
F (t) = f (t) + (x − t)k
k!
k=1
n−1
X g (k (t)
G(t) = g(t) + (x − t)k
k!
k=1

para t ∈ [c, x]. Puesto que F y G son continuas en [c, x] y derivables en (c, x), de acuerdo con el Teorema de
los incrementos finitos, existe ξ ∈ (c, x) para el que

F 0 (ξ) G(x) − G(c) = G0 (ξ) F (x) − F (c)


 

o
F 0 (ξ) g(x) − G(c) = G0 (ξ) f (x) − F (c) ,
 
(2.2)
ya que F (x) = f (x) y G(x) = g(x).
De la expresión que define F tenemos
n−1
f (n (t)
 
0 0
X 1  (k+1 
F (t) = f (t) + f (t)(x − t)k − kf (k (t)(x − t)k−1 = f 0 (t) + (x − t) n−1 0
− f (t)
k! (n − 1)!
k=1
f (n (t)
= (x − t)n−1
(n − 1)!
ya que los sumandos se cancelan mutuamente. Análogamente,

g (n (t)
G0 (t) = (x − t)n−1 .
(n − 1)!

Si hacemos t = ξ y sustituimos en (2.2) obtenemos la igualdad en el enunciado. t


u

En particular, con g(x) = (x − c)n se deduce el siguiente Teorema (nótese que g (k (c) = 0, k =
0, 1, . . . , n − 1 y g (n (c) = n!)

Teorema 2.2 (Taylor). Sea f una función que admita derivada n-ésima en el intervalo abierto (a, b) y
derivadas hasta orden (n − 1) continuas en [a, b]. Supongamos que c ∈ (a, b). Entonces, para todo x ∈ [a, b],
x 6= c, existe ξ en el interior del intervalo que une c con x tal que
n−1
X f (k (c) f (n (ξ)
f (x) = f (c) + (x − c)k + (x − c)n (2.3)
k! n!
k=1

2
Curso 21/22 MMII Aproximación local. Extremos

Definición 2.1. Como ya hemos mencionado, en las hipótesis del Teorema 2.2, el polinomio

f 00 (c) f (n−1 (c)


Pn−1,c (x) = f (c) + f 0 (c)(x − c) + (x − c)2 + · · · + (x − c)n−1
2 (n − 1)!
se denomina polinomio de Taylor de f en c de grado n − 1.
Cuando a < 0 < b y se toma c = 0 en el Teorema 2.2, el desarrollo (2.3) se denomina de Maclaurin y
el correspondiente polinomio de Taylor

f 00 (0) 2 f (n−1 (0) n−1


Pn−1 (x) = f (0) + f 0 (0)x + x + ··· + x
2 (n − 1)!
se llama polinomio de Maclaurin.
Obsérvese que, para ser mas exactos, en general Pn−1,c es un polinomio de grado ≤ n − 1.

En la figura 2.1 se muestran los 4 primeros polinomios de Maclaurin para la función f (x) = sen x+cos x
en el intervalo [−π, π]. Obsérvese como convergen sus gráficas a medida que n crece ...

y P1 (x) = 1 + x

| |
π
x
−π
x2
P2 (x) = 1 + x − 2!
f (x) = senx + cosx
x2 x3 x4
P4 (x) = 1 + x − 2!
− 3!
+ 4!

x2 x3
P3 (x) = 1 + x − 2!
− 3!

Figura 2.1. Polinomios de Taylor para f (x) = sen x + cos x

Formula de Taylor con resto integral

En este apartado estableceremos la versión integral de (2.3). Para ello necesitaremos la siguiente regla
de derivación de Leibniz
Proposición 2.1 (Regla de derivación de Leibniz). Sea f : [a, b] × [c, d] → R una función C 1 y
α, β : [a, b] → [c, d] dos funciones C 1 tales que α ≤ β. Entonces, la función
1

ˆ β(λ)
F (λ) : = f (λ, x)dx
α(λ)

es C 1 en [a, b] y
ˆ β(λ)
∂f
F 0 (λ) = β 0 (λ)f (λ, β(λ)) − α0 (λ)f (λ, α(λ)) + (λ, x)dx. (2.4)
α(λ) ∂λ

Demostración. Consideremos la función auxiliar de tres variables


ˆ v
A(u, v, λ) = f (λ, x)dx.
u

3
Curso 21/22 MMII Aproximación local. Extremos

Por hipótesis A es C 1 y por el Teorema fundamental del cálculo


∂A ∂A
= f (λ, u), y = −f (λ, v).
∂u ∂v
Puesto que F (λ) = A(α(λ), β(λ), λ), por la regla de la cadena,
∂A ∂A ∂A
F 0 (λ) = β 0 (λ) (α(λ), β(λ), λ) + α0 (λ) (α(λ), β(λ), λ) + (α(λ), β(λ), λ)
∂u ∂v ∂λ
∂A
= β 0 (λ)f (λ, β(λ)) − α0 (λ)f (λ, α(λ)) + (α(λ), β(λ), λ)
∂λ
que establece (2.4) tan pronto veamos que
ˆ v
∂A ∂f
(u, v, λ) = (λ, x)dx
∂λ u ∂λ
esto es, ˆ v
A(u, v, λ + t) − A(u, v, λ) ∂f
lı́m = (λ, x)dx.
t→0 t u ∂λ
Para ello, por el Teorema de los incrementos finitos aplicado a la función t → f (λ + t, x) (con λ y x fijos)
tenemos
ˆ v ˆ v
A(u, v, λ + t) − A(u, v, λ) f (λ + t, x) − f (λ, x) ∂f
= dx = (λ + θt, x)dx
t u t u ∂λ

donde θ ∈ (0, 1) puede en principio depender de λ, t y x. Pero,


ˆ v ˆ v  
A(u, v, λ + t) − A(u, v, λ) ∂f ∂f ∂f
− (λ, x)dx =
(λ + θt, x) − (λ, x) dx
t u ∂λ u ∂λ ∂λ
ˆ v
∂f ∂f
≤ (λ + θt, x) −
∂λ (λ, x) dx
u ∂λ
que, por el Teorema de Heine (continuidad uniforme), se puede hacer tan pequeño como se quiera si t es
suficientemente pequeño. t
u
Ahora tenemos
Teorema 2.3 (Taylor con resto integral). En las hipótesis del Teorema 2.2,
n−1
X f (k (c) ˆ x
1
f (x) = f (c) + k
(x − c) + (x − t)n−1 f (n (t)dt. (2.5)
k! (n − 1)! c
k=1

Demostración. De (2.4), si ˆ x
1
u(x) = (x − t)n−1 f (n (t)dt
(n − 1)! c
tenemos
ˆ x
1
u0 (x) = (x − t)n−2 f (n (t)dt ⇒ u0 (c) = 0
(n − 2)! c
ˆ x
1
u00 (x) = (x − t)n−3 f (n (t)dt ⇒ u00 (c) = 0
(n − 3)! c
..
.
ˆ x
(n−1
u (x) = f (n (t)dt ⇒ u(n−1 (c) = 0
c
u(n (x) = f (n (x) ← para todo x ∈ [a, b]
y por tanto f − u es un polinomio de grado a lo sumo n − 1 que debe ser igual al de Taylor de f en c. Esto
es exactamente (2.5). t
u

4
Curso 21/22 MMII Aproximación local. Extremos

Corolario 2.1. Si f es continua en [a, b], la función


ˆ x
1
u(x) = (x − t)n−1 f (t)dt
(n − 1)! a

es la única que satisface u(n = f en [a, b] y las condiciones iniciales u(a) = u0 (a) = u00 (a) = . . . = u(n−1 (a) =
0. Además, la única solución de la ecuación u(n = f tal que u(a) = ξ0 , u0 (a) = ξ1 , . . . , u(n−1 (a) = ξn−1 es
n−1 ˆ x
X ξk 1
u(x) = (x − a)k + (x − t)n−1 f (t)dt.
k! (n − 1)! a
k=0

Observación 2.1. 1. Nótese que por el Teorema del valor medio integral
ˆ x ˆ x
1 f (n (ξ) f (n (ξ) t=x f (n (ξ)
(x − t)n−1 f (n (t)dt = (x − t)n−1 dt = − (x − t)n = (x − c)n

(n − 1)! c (n − 1)! c n! t=c n!
para algún ξ en el intervalo que une c con x. Ası́, (2.5) implica (2.3).
2. La segunda parte del corolario 2.1 muestra que el espacio de soluciones  de la ecuación diferencial ho-
mogénea u(n = 0 forma un espacio vectorial de dimensión n para el que 1, x−a, (x−a)2 , . . . , (x−a)n−1

es una base. La solución general de la ecuación completa u(n = f se puede escribir como u = uh + up
donde ˆ x
1
up (x) = (x − t)n−1 f (t)dt
(n − 1)! a
(n
es una solución particular de la ecuación completa (satisface up = f ) y
n−1
X
uh (x) = ak (x − a)k
k=0

es la solución general de la correspondiente ecuación homogénea (describen completamente el espacio de


soluciones de u(n = 0 si aj ∈ R, j = 0, 1, . . . , n − 1)(1) .
Nota. Para el caso particular en el que nos encontramos, la primera parte de este corolario se puede probar
a fuerza bruta sin apelar a la regla de Leibniz. Si por el momento ponemos
ˆ x n−1 ˆ
n − 1 n−1−j x j
 
1 1 X
un (x) = (x − t)n−1 f (t)dt = (−1)j x t f (t)dt, (2)
(n − 1)! a (n − 1)! j=0 j 0

entonces
n−1 ˆ x
n−1
  
1 X
u0n (x) = (−1)j xn−1 f (x) + (n − 1 − j)xn−2−j tj f (t)dt
(n − 1)! j=0 j 0
 n−1 ˆ x  n−2
n−1 n − 2 n−2−j j
    
1 X 1 X
= (−1)j xn−1 f (x) + (−1)j x t f (t)dt
(n − 1)! j=0 j (n − 2)! a j=0 j
| {z } | {z }
(1−1)n−1 =0 (x−t)n−2
ˆ x
1
= (x − t)n−2 f (t)dt = un−1 (x)
(n − 2)! a

(k (k
si n ≥ 2. Por tanto un (x) = un−k (x) para k = 0, 1, . . . , n−1 y en particular, un (a) = 0 si k = 0, 1, . . . , n−1.
Además ˆ x
0 d
u(n
n (x) = u1 (x) = f (t)dt = f (x).
dx a
(1)
La Teorı́a de ecuaciones diferenciales ordinarias forman parte de los contenidos de la asignatura de grado Métodos
Matemáticos IV del primer cuatrimestre de segundo curso.
(2)
Aquı́, y en P
el
m cálculo siguiente, hemos usado (con a = −t, b = x y m = n − 2, n − 1) el binomio de Newton
m
(a + b)m =
 j m−j
j
a b , válida para todo a, b ∈ R y m = 1, 2, . . .
j=0

5
Curso 21/22 MMII Aproximación local. Extremos

Máximos y mı́nimos relativos

Supongamos que en un entorno del punto a ∈ R, la función f admita derivadas continuas hasta orden
ny
f 0 (a) = f 00 (a) = · · · = f (n−1 (a) = 0
pero f (n (a) 6= 0. La fórmula de Taylor nos permite escribir

f (n (ξ)
f (x) = f (a) + (x − a)n .
n!
Si x está próximo a a, ξ también lo estará y, por continuidad, f (n (ξ) tendrá el mismo signo que f (n (a). Por
tanto si n es par f tendrá en x = a un máximo o un mı́nimo relativo según sea f (n (a) < 0 o f (n (a) > 0
respectivamente. Si n es impar, se deduce que f (x) − f (a) cambia de signo dependiendo del lado de a en el
que nos encontremos. En este caso f presenta una inflexión en x = a.

Infinitésimos equivalentes

En el cálculo de lı́mites es usual utilizar infinitésimos, y a este respecto, para una función dada, el
Teorema de Taylor 2.2 permite encontrarlos. Si f es una función definida en un entorno de a ∈ R con
derivadas continuas hasta orden n + 1, entonces

f (x) ∼ Pn (x), cuando x → a (2.6)

donde,
n
X f (k (a)
Pn (x) = (x − a)k
k!
k=1

es el polinomio de Taylor de f en a de grado n, si Pn 6= 0.


Esto sigue inmediatamente del desarrollo (2.3) ya que, para cierta constante M > 0,
f (x) − Pn (x) ≤ M |x − a|n+1

y por tanto,
f (x)
lı́m =1
x→a Pn (x)
ya que Pn tiene grado ≤ n.

Ejemplo 2.1. Como ejemplos tenemos

x3
sen x ∼ x − ,
6
x2
cos x ∼ 1 − ,
2
ln(1 + x) ∼ x,
(1 + x)α ∼ 1 + αx (α ∈ R),

cuando x → 0.

2.1.2. El desarrollo de Taylor multidimensional

Sean a ∈ Rn , r > 0 y f : B(a, r) ⊂ Rn → R una función real con derivadas continuas en B(a, r)
hasta orden N + 1. Entonces, para cada vector unitario ~v ∈ Rn , la función f~v : I~v ⊂ R → R definida en
I~v = {a + t~v / |t| < r} dada por
f~v (t) : = f (a + t~v )
admite derivadas continuas hasta orden N + 1.
El Teorema de Taylor unidimensional permite escribir

6
Curso 21/22 MMII Aproximación local. Extremos

(N
f~v00 (0) 2 f (0) N
f~v (t) = f~v (0) + f~v0 (0)t + t + · · · + ~v t + EN (t) (2.7)
2 N!
donde
EN (t)
lı́m = 0. (2.8)
t→0 tN
Ahora bien, para cada m = 1, 2, . . . , N ,
n
(m
X ∂ m f (a + t~v )
f~v (t) = vk vk · · · vkm ,
∂xk1 ∂xk2 · · · ∂xkm 1 2
k1 ,k2 ,...,km =1

por lo que
(m
X m
f~v (0) = ∂ α f (a)~v α ,
α
|α|=m

donde
n
α = (α1 , α2 , . . . , αn ) ∈ N ∪ {0} ,
|α| = α1 + α2 + · · · + αn ,
α! = α1 ! · α2 ! · . . . · αn !,
~v α = v1α1 · v2α2 · . . . · vnαn ,
 
m m!
=
α α!

y,

∂ |α| f
∂αf = αn .
∂xα α2
1 ∂x2 · · · ∂xn
1

Ası́, el desarrollo (2.7) se puede reescribir como


N  X   
X 1 m α
f (a + t~v ) = ∂ f (a)~v tm + EN (t).
α

m=0
m! α
|α|=m

x−a
Finalmente, haciendo ~v = |x−a| y t = |x − a| encontramos que

N  X   
X 1 m α
f (x) = ∂ f (a)(x − a)α + TN (x), (2.9)
m=0
m! α
|α|=m

con  
1 X N +1 α
TN (x) = EN (|x − a|) = ∂ f (ζ)(x − a)α , (2.10)
(N + 1)! α
|α|=n+1

donde ζ = a + θ(x − a), (0 < θ < 1) es algún punto del segmento [a, x] \ {a, x}, para el que (2.8) se traduce
en
|TN (x)|
lı́m = 0.
x→a |x − a|N

La relación anterior también se puede escribir como


N
X
f (x) = fm (x) + TN (x), (2.11)
m=0

7
Curso 21/22 MMII Aproximación local. Extremos

donde  
1 X m α
fm (x) = ∂ f (a)(x − a)α
m! α
|α|=m

es un polinomio homogéneo de grado m en x − a.


En ambas formas, tanto (2.9) como (2.11) se conocen como desarrollo de Taylor multidimensional.
Observación 2.2 (Estimación del error de Taylor). Puesto que
(N +1
f~v (ξ) N +1
EN (t) = t
(N + 1)!
con |ξ| ≤ |t|, !
|t|N +1 (N +1
|EN (t)| ≤ sup f~v (ξ) .
(N + 1)! |ξ|≤|t|

Ahora bien, para t ∈ I~v


X m
f~vm (t) = ∂ α f (a + t~v )~v α ,
α
|α|=m
y por tanto
X m    X  
m

|f~vm (t)| ≤ |~v ||α| sup |∂ α f (x)| = ||∂ α f ||∞ |~v |m
α x∈B(a,r) α
|α|=m |α|=m

donde,
||∂ α f ||∞ = sup |∂ α f (x)| .
x∈B(a,r)

Ası́, si Mm = sup ||∂ α f ||∞ tenemos


|α|=m

|f~vm (t)| ≤ Mm nm |~v |m = Mm nm ,


ya que
X m
= nm (2.12)
α
|α|=m

y ~v es unitario. Por consiguiente,


nN +1
|EN (t)| ≤ MN +1 |t|N +1
(n + 1)!
y de la primera igualdad en (2.10) obtenemos la estimación
nN +1 N +1
|TN (x)| ≤ MN +1 r (2.13)
(N + 1)!
para x ∈ B(a, r).

2.1.3. Series de Taylor


A la vista del desarrollo (2.9), si f es C ∞ en B(a, r) y para x ∈ B(a, r) TN (x) → 0 cuando N → ∞,
f se podrá representar en serie de potencias
∞ ∞  X   
X X 1 m α α
f (x) = fm (x) = ∂ f (a)(x − a) , (2.14)
m=0 m=0
m! α
|α|=m

que llamaremos serie de Taylor de f en a.


Por supuesto, que TN (x) → 0 dependerá de f . De la estimación (2.13) podemos observar que si
N N
MN n Nr! → 0, entonces (2.14) será válido en B(a, r). Naturalmente toda función C ∞ en B(a, r) determina
su serie de Taylor pero, como muestra el siguiente ejemplo, incluso si ésta es convergente, puede que no la
represente.

8
Curso 21/22 MMII Aproximación local. Extremos

Ejemplo 2.2. Para la función  2


e−1/x , si x 6= 0
f (x) =
0, si x = 0
2
tenemos f (k (x) = Pk (1/x)e−1/x para ciertos polinomios Pk de grados 3k, k = 0, 1, 2, . . . Por tanto

lı́m f (k (x) = 0,
x→0

f es C ∞ en toda la recta real y f (k (0) = 0 para k = 0, 1, 2, . . .


Desde otro punto de vista, en (2.7) f (x) = EN (x) para todo N = 0, 1, 2, . . . y, por tanto, ¡el error de
aproximación EN no depende de N !
Observación 2.3. Con relación al ejemplo 2.2 cabe destacar que, para funciones C ∞ , no existe restricción
alguna sobre las derivadas f (k (0) en el siguiente sentido: para cualquier sucesión ak ∈ R, k = 0, 1, 2 . . . de
números reales existe una función f , C ∞ en R, tal que f (k (0) = ak para cada k = 0, 1, 2, . . .
El caso de una variable es suficientemente ilustrativo para el estudio de la convergencia de la serie
(2.14). Por ejemplo, las derivadas sucesivas de las funciones sen x y cos x están acotadas por 1 en todo R y
por tanto
rN +1
|TN (x)| ≤
(N + 1)!
si r > 0 y |x| < r. Ası́ TN (x) → 0 cuando N → ∞ y

X x2k+1
sen x = (−1)k (2.15)
(2k + 1)!
k=0

X x2k
cos x = (−1)k , (2.16)
(2k)!
k=0

con convergencia uniforme en intervalos acotados [−r, r] para todo r > 0.


De forma análoga, para la función exponencial ex , se tiene
rN +1 r
|TN (x)| ≤ e
(N + 1)!
si |x| < r para todo r > 0, y que también tiende a 0 cuando N → ∞. Ası́,

X xk
ex = (2.17)
k!
k=0

también uniformemente en [−r, r], r > 0.


Observación 2.4 (Una justificación de la fórmula de Euler). La conocida fórmula de Euler en variable com-
pleja establece que
eiθ = cos θ + i sen θ
para todo θ ∈ R (figura 2.2). Aprovechando las series anteriores, a continuación presentamos una de sus
muchas justificaciones.
La serie (2.17) permite definir la exponencial compleja

X zk
ez = , z∈C
k!
k=0

N
zk
P
ya que, de la desigualdad triangular, su sucesión de sumas parciales k! está mayorada por las
k=1
correspondientes en (2.17)

9
Curso 21/22 MMII Aproximación local. Extremos


N N
X z k X |z|k
≤ .

k! k!


k=0 k=0
Ası́, para θ ∈ R, con z = iθ
∞ ∞ k k ∞ ∞
X (iθ)k X i θ X i2m θ2m X i2m+1 θ2m+1
eiθ = = = +
k! k! m=0
(2m)! m=0
(2m + 1)!
k=0 k=0
∞ ∞
X θ2m X θ2m+1
= (−1)m +i (−1)m = cos θ + i sen θ
m=0
(2m)! m=0
(2m + 1)!

por (2.15) y (2.16).


eiθ = cos θ + i sen θ

sen θ
θ
x
cos θ

Figura 2.2. Representación geométrica de la fórmula de Euler

Nota. Recordemos que la notación polar z = %θ de un número complejo z = x + iy ∈ C, significa que
% = |z| = x2 + y 2 es su módulo y θ = arg θ = arc tg xy su argumento. Equivalentemente,
p

)
x = % cos θ
.
y = % sen θ

Con relación a la fórmula de Euler podemos también escribir %θ = %eiθ . Considerar (%, θ) como nuevas
variables proporcionan las llamadas coordenadas polares.

2.2. Máximos y mı́nimos relativos 1

Esta sección está dedicada al estudio local de aquellos puntos donde una función dada alcanza su
valor máximo o mı́nimo tanto en el caso libre como para el caso de extremos condicionados. En el caso
unidimensional, éstos se encuentran igualando a cero la primera derivada para luego, haciendo uso de la
segunda, decidir (cuando el método lo permita) si son máximos o mı́nimos.
El análogo multidimensional es similar, pero el estudio local usando la segunda derivada es un poco
más sutil. En este caso, para una función de varias variables f , la ecuación que deben satisfacer los puntos
crı́ticos es ∇f = 0 que, en el caso de n variables, realmente es un sistema de n ecuaciones con n incógnitas,
y su segunda derivada es ahora una matriz de orden n × n (la matriz hessiana).
Además, al contrario que en una variable, podemos considerar problemas máx/mı́n con restricciones,
es decir, problemas en los que las variables están sujetas a alguna relación a priori. La idea fundamental se
presenta como la regla del multiplicador y proporciona el conocido método de los multiplicadores de Lagrange.
Definición 2.2. Sea f una función real definida en un abierto Ω ⊂ Rn y a ∈ Ω. Decimos que f tiene un
máximo relativo o local en a si existe r > 0 tal que B(a, r) ⊂ Ω y f (x) ≤ f (a) para todo x ∈ B(a, r).
De igual forma, a es un mı́nimo relativo o local de f si existe una bola B(a, r) ⊂ Ω tal que f (a) ≤ f (x) para
cualquier x ∈ B(a, r).

10
Curso 21/22 MMII Aproximación local. Extremos

Al igual que en el caso unidimensional tenemos


Proposición 2.2. Si f : Ω ⊂ Rn → R es diferenciable en a ∈ Ω donde f tiene un máximo o un mı́nimo
local, entonces ∇f (a) = 0.
Demostración. Sea r > 0 tal que B(a, r) ⊂ Ω. Si ~u es un vector unitario, la función ϕ~u (t) = f (a+t~u) definida
para |t| < r posee un máximo o un mı́nimo en t = 0. Por tanto ϕ~0u (0) = 0 y, puesto que ϕ~0u (0) = ∇f (a) · ~u,
concluimos que ∇f (a) · ~u = 0 para cualquier elección de ~u. Esto implica que ∇f (a) = 0, como afirma la
Proposición. t
u
Análogamente al caso de una variable, los puntos donde ∇f (a) = 0 se denominan crı́ticos de f . Ası́,
los extremos relativos son puntos crı́ticos.
Sea ahora a ∈ Rn un punto crı́tico para una función f . Queremos obtener condiciones suficientes
para que f tenga en a un máximo o un mı́nimo local. Para ello sea ~u = (u1 , u2 , . . . , un ) cualquier vector, y
ϕ~u (t) = f (a + t~u). Como antes ϕ~0u (0) = ∇f (a) · ~u = 0 y el desarrollo de Taylor de ϕ~u en t = 0 nos permite
escribir
1
ϕ~u (t) − ϕ~u (0) = ϕ~00u (0)t + E(t),
2
donde E representa el correspondiente resto de Taylor. Puesto que ϕ~u (0) = f (a) y
n
X ∂2f
ϕ~00u (0) = (Hf (a)~u) · ~u = (0)ui uj ,
i,j=1
∂xi ∂xj

la restricción de f L al segmento La,~v = {a + t~v /; |t| < r} tendrá un máximo o un mı́nimo local en
a,~v
a (t = 0) si Hf (a)~u · ~u es < 0 o > 0. A este respecto, decimos que la matriz Hf (a) es definida positiva si
Hf (a)~u · ~u > 0 y definida negativa si Hf (a)~u · ~u < 0 para todo ~u 6= 0 (esto se denotará por Hf (a) > 0 y
Hf (a) < 0 respectivamente). El siguiente resultado muestra que éstas condiciones sobre la matriz hessiana
son suficientes para afirmar que en a f tiene un extremo local. Recuérdese que
 2 
∂ f ∂2f ∂2f
2 · · ·
 ∂x1 ∂x1 ∂x2 ∂x1 ∂xn 
 2
∂2f ∂2f 

 ∂ f
 ∂x1 ∂x2 ∂x22 · · · ∂xn2 
Hf =  .
 
 .. .. .. .. 
 . . . . 
 
 2 2 2

∂ f ∂ f ∂ f
∂xn ∂x1 ∂xn ∂x2 · · · ∂x 2
n

Proposición 2.3. Si f : Ω → R es de clase C 2 en un entorno de un punto crı́tico a ∈ Ω entonces, a es un


máximo/mı́nimo local estricto de f si Hf (a) < 0/ > 0, respectivamente.
Demostración. Atendiendo al desarrollo de Taylor (2.9), de la expresión del error en la segunda igualdad de
(2.10) con N = 1, si r > 0 es suficientemente pequeño, f (x) = f (a) + 21 Hf (ζ)(x − a) · (x − a) para todo
|x − a| < r donde ζ es algún punto del segmento [a, x] \ {a, x}. Si Hf (a) > 0, como la esfera unidad |~u| = 1
es compacta,  
γ : = mı́n{ Hh(a)~u · ~u |~u| = 1} > 0,
· ~u ≥ γ|~u|2 para todo ~u 6= 0. Puesto que f es C 2 cerca de a, la aplicación

con lo que Hf (a)~
u (b, ~u) 7→
Hf (b)~u · ~u es continua (reduciendo r > 0 si fuese necesario) podemos suponer que Hf (ζ)~u · ~u ≥ γ2 |~u|2 si
 

~u 6= 0. Por tanto, f (x) ≥ f (a) + γ4 |x − a|2 si x 6= a, lo que significa que a es un mı́nimo local estricto de f .
Por último, el caso que resta sigue de éste aplicado a la función la función −f . t
u
Observación 2.5. La relevancia de la Proposición anterior queda de manifiesto con el ejemplo siguiente:
la función f (x, y) = 3x4 − 4x2 y + y 2 tiene un mı́nimo local en (0, 0) sobre cualquier recta que pase por
(0, 0). Sin embargo, f no tiene un mı́nimo local (bidimensional) en el origen. Para ver esto observemos
que, completandocuadrados, f se puede escribir como f (x, y) = (y − 2x2 )2 − x4 , por lo que el conjunto
2 2 2

D : ={f ≤ 0} = (x, y) ∈ R / x ≤ y ≤ 3x no contiene, cerca del origen, ninguna recta que pasa por él
(figura 2.3).

11
Curso 21/22 MMII Aproximación local. Extremos

x
m
=
D

y
x

Figura 2.3. Posición de las rectas y = mx respecto al conjunto D : |y − 2x2 | ≤ x2

2.2.1. Matrices definidas

Sea A = (aij ) una matriz cuadrada real de orden n × n y L su correspondiente transformación lineal.
Un real λ es un valor caracterı́stico o autovalor de L si la transformación L − λI es singular. Si L(~u) = λi ~u
y ~u 6= 0, ~u es un vector caracterı́stico o autovector correspondiente al autovalor λi . En general existen n
autovalores complejos λ1 , λ2 , . . . , λn contados con sus multiplicidades, y sus correspondientes autovectores
pueden, a su vez, tener componentes complejas.
Si A es simétrica A> = A (aij = aji para todo i, j = 1, 2, . . . , n), entonces todos los autovalores de A
son reales. De hecho cada uno está caracterizado por ser el valor de cierto máximo condicionado. Nótese
que A es simétrica si, y sólo si,
(L~u) · ~v = ~u · (L~v ) (2.18)
para todo ~u, ~v ∈ Rn .
Consideremos el polinomio cuadrático homogéneo
n
X
Q(~u) : = (L~u) · ~u = aij ui uj ,
i,j=1

y sea S1 la esfera unidad en Rn , S1 : = {~u / |~u| = 1}. Sean

λ1 : = máx{Q(~u) / ~u ∈ S1 },

y ~u1 ∈ S1 un vector donde se alcanza el máximo. Ahora veremos que λ1 es un autovalor de L para el que
~u1 es un autovector. Para ver esto primero observamos que

L ~u⊥ u⊥

1 ⊂~ 1 (2.19)

ya que, si ~v ∈ ~u⊥ , por la desigualdad de Cauchy aplicada a la forma cuadrática Q1 (~u) = λ1 |~u1 |2 − Q(~u) (que
es no negativa de la definición de λ1 ) tenemos

:0
|~v · L~u1 | = |λ1~v · ~u1 − ~v · L~u1 | ≤ |λ1 |~v |2 − Q(~v )|
  
1−
(λ Q(~
u 1 )| = 0
 
por lo que, L~v · ~u1 = ~v · L~ u1 = 0 y ası́ L~v ⊥ ~u1 . Ahora bien, ~v1 : = L~u1 − λ1 ~u1 ⊥ ~u1 ya que
λ1 = L~u1 · ~u1 ⇒ L~u1 − λ~u1 · ~u1 = 0 y por tanto

|~v1 |2 = L~u1 − λ~u1 · ~v1 = L~u1 · ~v1 − λ~u1 · ~v1 = 


  
u~1·L~v1 − λ
~u1 · ~v
1 =0

↑ ↑
v1 ⊥~
L~ u1 v1 ⊥~
~ u1

que significa que ~v1 = 0 o equivalentemente  que L~u1 = λ1 ~u1 según querı́amos ver.
Sean ahora S2 = S1 ∩ ~u⊥

1 = {~
u ∈ S1 ~u ⊥ ~u1 } y ~u2 ∈ S2 tal que Q(~u2 ) = λ2 : = máx{Q(~u) ~u ∈ S2 }.
Por el mismo razonamiento anterior pero ahora trabajando en ~u⊥ n
1 en lugar de R vemos que ~ u2 es un
autovector de L con autovalor λ2 ≤ λ1 . Continuando de esta forma encontramos una base ortonormal
{~u1 , ~u2 , . . . , ~un } de Rn constituida de vectores propios de L.
Ası́ hemos probado

12
Curso 21/22 MMII Aproximación local. Extremos

Teorema 2.4. Toda matriz simétrica A es ortogonalmente diagonalizable, es decir, todos sus valores propios
son reales y existe una base ortonormal {~u1 , ~u2 , . . . , ~un } formada por vectores propios.
Si (x1 , x2 , . . . , xn ) denotan las componentes de un vector ~u en esta base, la forma cuadrática Q asociada
a A toma la forma
Q(~u) = λ1 x21 + λ2 x21 + · · · + λn x2n .

Corolario 2.2. Sea A una matriz cuadrada simétrica. Entonces, todos sus autovalores son reales y,
(i) A es definida positiva, esto es, (A~u) · ~u > 0 para todo ~u =
6 0 si, y sólo si, todos sus autovalores son
positivos.
(ii) A es definida negativa, esto es, (A~u) · ~u < 0 para todo ~u =6 0 si, y sólo si, todos sus autovalores son
negativos.

Puesto que L − λI es singular si λ es un autovalor de L, det(A − λI) = 0. Al polinomio p(λ) =


det(A − λI) se le llama polinomio caracterı́stico de L y, por tanto, sus raı́ces son los autovalores de L.
Observación 2.6. La representación matricial correspondiente a una trasformación lineal L depende de la
base elegida a tal efecto. De hecho, si A y A0 representan la misma transformación, A y A0 son semejantes,
es decir, existe una matriz P no singular (la matriz de cambio de base) tal que A0 = P −1 AP .
Puesto que A0 − λI = P −1 AP − λI = P −1 (A − λI)P , las matrices semejantes tienen el mismo
polinomio caracterı́stico y, por tanto, el conjunto de autovalores (también llamado espectro) sólo depende
de L, o equivalentemente, de la clase de semejanza de cualquier matriz que la represente. A menudo, y
abusando de éste concepto, hablaremos del espectro de una matriz cuando nos referimos al espectro de la
transformación lineal asociada en la base canónica.
De acuerdo con el Corolario 2.2, serı́a deseable disponer de algún criterio que proporcione información
sobre el signo de las raı́ces de un polinomio real dado. Por ejemplo, como caso particular de la conocida
regla de los signos de Descartes tenemos
Proposición 2.4. Sea p(t) = an tn + an−1 tn−1 + · · · + a1 t + a0 un polinomio de grado n con coeficientes
reales (ak ∈ R, 0 ≤ k ≤ n). Si p tiene todas sus raı́ces reales, entonces son equivalentes:
(i) Todas las raı́ces de p son positivas.
(ii) p presenta n cambios de signo entre sus coeficientes.

Demostración. Que (i) implica (ii) es inmediato de las relaciones de Cardano-Vieta(3) (que no son mas que
aquellas que resultan de escribir los coeficientes de p en término de sus raı́ces).
Recı́procamente, por hipótesis, los coeficientes del polinomio q(t) : = p(−t) tienen todos el mismo signo
y por tanto no tiene raı́ces positivas. Ası́, todas las raı́ces de p (que suponemos reales) deben ser positivas. t
u

Observemos que la condición (ii) implica que ak 6= 0 para k = 0, 1, 2, . . . , n.


Del Corolario 2.2, la Proposición 2.4 aplicada al polinomio caracterı́stico de una matriz real simétrica
nos proporciona el siguiente resultado

Corolario 2.3. Una matriz real simétrica A es,


(i) positiva si, y sólo si, el número de cambios de signo en su polinomio caracterı́stico es máximo,
(ii) negativa si, y sólo si, los coeficientes de su polinomio caracterı́stico tienen el mismo signo.

Ejemplo 2.3. Para la función f (x, y) = x2 + y 2 + exy tenemos


∂f xy
)
∂x = 2x + ye
∂f
∂y = 2y + xexy

con lo que el punto (0, 0) es crı́tico.


Ahora bien, las parciales de segundo orden de f son
(3) an−k
rj1 rj2 · · · rjk = (−1)k
Q
Si r1 , r2 , . . . , rn son las raı́ces de p(t) entonces an
.
1≤j1 <j2 <...jk ≤n

13
Curso 21/22 MMII Aproximación local. Extremos

∂2f
= 2 + y 2 exy

∂x2 


∂2f
∂x∂y = (1 + xy)exy ,

2 
∂ f
= 2 + x2 exy

∂y 2
que evaluadas en el punto (0, 0) nos proporciona la matriz hessiana
 
21
Hf (0, 0) = .
12
Sus autovalores se calculan resolviendo la ecuación caracterı́stica

2 − λ 1
p(λ) =
= 0,
1 2 − λ
que es equivalente a (2 − λ)2 − 1 = 0 ⇔ λ = 1, 3. Ası́ Hf (0, 0) tiene sus dos autovalores > 0 (nótese los
cambios de signo en los coeficientes de p(λ) = λ2 − 4λ + 3 respecto al Corolario 2.3) y por tanto podemos
afirmar que (0, 0) es un mı́nimo local de f .
Nota. Puesto que et ≥ 1 + t para todo t ∈ R (¿por qué?),
(y + 2x)2 + 3y 2
f (x, y) = x2 + y 2 + exy ≥ x2 + y 2 + xy + 1 = + 1 ≥ 1 = f (0, 0)
4
para todo (x, y) ∈ R2 . Por tanto (0, 0) es un mı́nimo global de f .

2.2.2. Índice de formas cuadráticas


Toda forma cuadrática real Q en Rn tiene asociada una matriz simétrica A ∈ Mn (R) respecto a una
base dada, a saber, si ~u1 , ~u2 , . . . , ~un es una base, A = Q(~ui , ~uj ) i,j donde Q(~ui , ~uj ) = (A~ui )·~uj . Obviamente
esta matriz cambia si cambiamos la base de referencia: si P ∈ Mn (R) no es singular, respecto a la nueva
base ~vk := P ~uk , la matriz asociada A0 vendrá dada por (A0~vi ) · ~vj = (AP ~ui ) · (P ~uj ) = (P >AP ~ui ) · ~uj , de
donde A0 = P >AP (en este caso, A y A0 se dicen congruentes).
Afortunadamente, aunque el espectro de una matriz no es invariante bajo congruencia, existen algunas
cantidades que sı́ lo son. Estas son por tanto invariantes de formas cuadráticas, y el siguiente Teorema
proporciona un ejemplo,
Teorema 2.5 (Ley de inercia. Sylvester). San A y A0 dos matrices reales simétricas de orden n × n
y q, q 0 el número de autovalores negativos de A y A0 respectivamente. Si A y A0 son congruentes, entonces
q = q0 .
Demostración. Previa diagonalización de A (Teorema 2.4) podemos escribir
Rn = M+ ⊕ M− ⊕ N, (2.20)
donde M+ /M− es el subespacio generado por los vectores propios asociados a los autovalores positivos/ne-
gativos y N es el núcleo de A. De igual manera, respecto a A0 ,
0 0
R n = M+ ⊕ M− ⊕ N 0. (2.21)
Por construcción tenemos q = dim M− y q 0 = dim M−
0
. Supongamos que q > q 0 . Si dim M+ = p, dim M+
0
= p0
y P denota la matriz de congruencia, entonces
dim P −1 (M− ⊕ N ) + dim M+
0 0
= dim(M− ⊕ N ) + dim M+ = q + p0 + dim N > q 0 + p0 + dim N 0 = n,
por (2.21) ya que N ' N 0 son isomorfos via P (P (N 0 ) = N ). Por tanto, existe w ∈ M+
0
\ {0} tal que
P w ∈ M− ⊕ N . Ası́,
0 < A0 w · w = (P >AP w) · w = A(P w) · (P w)

≤ 0,
↑ ↑
w∈M 0 P w∈M− ⊕N
+

que es una contradicción. Por tanto q ≤ q 0 . De igual forma q 0 ≤ q, de donde q = q 0 . t


u

14
Curso 21/22 MMII Aproximación local. Extremos

Observación 2.7. Puesto que de (2.20) y (2.21), p + q = p0 + q 0 , también p = p0 .

Definición 2.3. Al entero q en el Teorema 2.5 se le llama ı́ndice de la correspondiente forma cuadrática.

2.2.3. Puntos crı́ticos no degenerados

Un punto crı́tico a ∈ Ω ⊂ Rn de una función f ∈ C 2 (Ω) se dice no degenerado si Hf (a) no es singular,


es decir, si det Hf (a) 6= 0.
Si denotamos por F : Ω → Rn la aplicación F : = ∇f , se sigue que Hf (a) = F 0 (a) es la matriz jacobiana
de F an a. Si a no es degenerado, por el Teorema de la función inversa, F será localmente biyectiva y, por
tanto, a es aislado.
El ı́ndice de un punto crı́tico no degenerado a es el ı́ndice q de la forma cuadrática asociada a Hf (a).

Observación 2.8. Si a no es degenerado y 0 < q < n, existen autovectores ~u± 6= 0 de Hf (a) asociados a
autovalores λ− < 0 < λ+ . Las funciones ϕ~u± (t) = f (a + t~u± ) entonces presentan, en t = 0, un máximo y un
mı́nimo local estricto respectivamente.

En el caso de dos variables (n = 2), los puntos crı́ticos no degenerados sólo pueden ser de tres tipos
dependiendo del signo de los autovalores λ1 , λ2 de Hf (a), a saber:
1. Máximos locales estrictos, si λ1 , λ2 < 0 (q = 2).
2. Mı́nimos locales estrictos, si λ1 , λ2 > 0 (q = 0).
3. Puntos de silla, si λ1 < 0 < λ2 (q = 1).
El origen (0, 0) es crı́tico no degenerado de ı́ndice q = 1 para la función f (x, y) = x2 − y 2 . Obsérverse
que  
1 0
Hf (0, 0) = 2 ,
0 −1

y por tanto, ~u+ = ~i y ~u− = ~j con λ± = ±2 (la figura 2.4 muestra su geometrı́a local).

·
·

Figura 2.4. Punto de silla z = x2 − y 2

Observación 2.9. La condición suficiente para decidir si un punto crı́tico es máximo o mı́nimo local dada
en la Proposición 2.3 implica que éste no es degenerado. Sin embargo ésta se requiere para una silla.
Por otro lado, la misma geometrı́a local que se presenta en estos puntos crı́ticos puede darse en el caso
degenerado. Por ejemplo, (0, 0) es crı́tico para las funciones f (x, y) = x4 + y 4 y g(x, y) = x4 − y 4 para las
que Hf (0, 0) = Hg(0, 0) = ( 00 00 ) es la matriz nula. Obsérvese que (0, 0) es un mı́nimo para f , máximo para
−f y una silla para g.

2.3. Extremos condicionados. Multiplicadores de Lagrange

2.3.1. La regla del multiplicador

Supongamos que queremos hallar los extremos, máximos o mı́nimos, de una función f : Ω ⊂ Rn → R
condicionados a que g(x) = 0, x ∈ Ω, donde g : Ω ⊂ Rn → R y ∇g(x) 6= 0 si g(x) = 0.

15
Curso 21/22 MMII Aproximación local. Extremos

Si en a ∈ Ω con g(a) = 0, f tiene un extremo condicionado, para cualquier curva γ : (−ε, ε) → Ω (ε > 0)
tal que g(γ(t)) = 0 y γ(0) = a, la función t ∈ (−ε, ε) → f (γ(t)) debe tener un extremo en t = 0. Como
sabemos, esto implica que
d
∇f (a) · γ 0 (0) = f (γ(t)) = 0,
dt t=0
Ahora observamos que la condición que debe satisfacer el vector γ 0 (0) es ∇g(a) · γ 0 (0) = dt
d

t=0
g(γ(t)) = 0.
Ası́ ∇f (a) debe ser perpendicular al espacio tangente a la “superficie” g = 0 en x = a o, equivalentemente,
paralelo a ∇g(a), esto es, debe existir λ ∈ R tal que ∇f (a) = λ∇g(a) (figura 2.5).
Por tanto, el sistema )
∇f (x) = λ∇g(x)
g(x) = 0
nos proporciona los puntos crı́ticos de f bajo la condición g = 0.

∇g
γ 0 (0)

a
∇f γ

g=0

Figura 2.5. Regla del multiplicador

Si en general hubiera más de una condición de ligadura, g1 (x) = g2 (x) = · · · = gd (x) = 0, 1 ≤ d < n (con
∇g1 (x), ∇g2 (x), . . . , ∇gd (x) independientes cuando g1 (x) = g2 (x) = · · · = gd (x) = 0), es decir, g : Ω → Rd
y g(x) = (g1 (x), g2 (x), . . . , gd (x)), el razonamiento anterior nos proporcionarı́a escalares λ1 , λ2 , . . . , λd ∈ R
para los que el sistema )
∇f (x) = λ1 ∇g1 (x) + λ2 ∇g2 (x) + · · · + λd ∇gd (x)
(2.22)
g1 (x) = g2 (x) = · · · = gd (x) = 0
debe ser satisfecho por los puntos crı́ticos en cuestión. Estos escalares se denominan multiplicadores de
Lagrange, y al vector de multiplicadores λ = (λ1 , λ2 , . . . , λd ) se le denomina simplemente multiplicador de
Lagrange.
Observación 2.10. De la primera ecuación en (2.22), cada punto crı́tico tiene asociado un único multiplicador
ya que los vectores ∇g1 , . . . , ∇gd son independientes cuando se evalúan sobre g1 = g2 = · · · = gd = 0.
Esta discusión sugiere introducir la función auxiliar F (x, λ) = f (x) − λ · g(x) = f (x) − λ1 g1 (x) −
λ2 g2 (x) − . . . − λd gd (x), con lo que el sistema (2.22) puede expresarse como ∇(x,λ) F (x, λ) = 0 con x ∈
Rn , λ = (λ1 , λ2 , . . . , λd ) ∈ Rd .
Del sistema anterior encontramos los puntos crı́ticos para el problema de optimización considerado. Si
x0 ∈ Rn tiene asociado el multiplicador λ0 ∈ Rd , particularizamos la función auxiliar F fijando λ = λ0 para
obtener la función de n variables
F0 (x) = f (x) − λ0 · g(x), (2.23)
la cual debemos estudiar en x0 . Si su hessiano resulta definido positivo o negativo, en x0 tendremos un
mı́nimo o un máximo relativo, respectivamente.
1
En caso de que este hessiano no sea definido hemos de estudiar su comportamiento en las direcciones
tangentes a g = 0 en el punto x0 . Esto quiere decir que si elegimos una base ortonormal ~u1 , ~u2 , . . . , ~un−d del
espacio tangente anterior y formamos el hessiano “restringido”
 
H{g=0} F0 (x0 ) = HF0 (x0 )~ui · ~uj ∈ M(n−d)×(n−d) (R), (2.24)
1≤i,j≤n−d

16
Curso 21/22 MMII Aproximación local. Extremos

F tendrá en x0 un mı́n . o un máx . local sobre g = 0 si H{g=0} F0 (x0 ) es > 0 ó < 0 respectivamente puesto
que la discusión anterior sigue igual con la matriz restringida atendiendo a la siguiente

Proposición 2.5. Sean F : Ω ⊂ Rn → R de clase C 1 y x0 ∈ Rn . Entonces, si γ : (−ε, ε) → Rn y γ(0) = x0


tenemos
d2

F (γ(t)) = HF (x0 )γ 0 (0) · γ 0 (0),

2
dt t=0

siempre que ∇F (x0 ) = 0.

Demostración. La regla de la cadena nos permite escribir


n
d X ∂F
F (γ(t)) = ∇F (γ(t)) · γ 0 (t) = (γ(t))γk0 (t),
dt ∂xk
k=1

y derivando de nuevo con respecto a t,


n 
d2
  
X d ∂F 0 ∂F 00
F (γ(t)) = (γ(t)) γ k (t) + (γ(t))γ k (t)
dt2 dt ∂xk ∂xk
k=1 
n n
∂2F
 
X X
0 0 ∂F 00
= (γ(t))γj (t) γk (t) + (γ(t))γk (t) .
j=1
∂xj ∂xk ∂xk
k=1

∂F
Haciendo t = 0 y teniendo en cuenta que ∇F (x0 ) = 0 ⇔ ∂xk (x0 ) = 0, k = 1, 2, . . . , n, se tiene
n
d2 ∂2F

X
(x0 )γj0 (0)γk0 (0) = HF (x0 )γ 0 (0) · γ 0 (0).

2
F (γ(t)) = t
u
dt t=0
∂xj ∂xk
j,k=1

Observación 2.11. En el caso que nos ocupa, F = F0 sobre g = 0 y ∇F0 (x0 ) = 0 ya que λ0 es el multiplicador
asociado a x0 (2.22).

Observación 2.12. Puesto que las matrices asociadas a una forma cuadrática en diferentes bases son congruen-
tes, el Teorema 2.5 permite concluir que su carácter de positividad será independiente de la base elegida para
representarla. Por tanto, la base ~u1 , ~u2 , . . . , ~un−d del espacio tangente tras la Observación 2.10 no tiene que
ser necesariamente ortonormal, esto es, cualquier base será suficiente para representar el hessiano restringido
H{g=0} F0 (x0 ) en (2.24).

Una interpretación de los multiplicadores

Consideremos el problema de optimizar f = f (x, y) sujeta a la condición g(x, y) = c. Supongamos que


tenemos una solución x = x(c), y = y(c) para varios valores de c con multiplicador λ = λ(c) que dependen
suavemente de c. Entonces
d ∂f ∂f
f (x(c), y(c)) = (x(x), y(c))x0 (c) + (x(x), y(c))y 0 (c)
dc ∂x ∂y
 
∂g 0 ∂g 0
= λ(c) (x(x), y(c))x (c) + (x(x), y(c))y (c) = λ(c),
∂x ∂y
puesto que
∂g ∂g d
(x(c), y(c))x0 (c) + (x(x), y(c))y 0 (c) = g(x(c), y(c)) = 1,
∂x ∂y dc
ya que g(x(c), y(c)) = c.
Por tanto:
el valor del multiplicador es igual a la tasa de cambio del valor crı́tico f ∗ (c) = f (x(c), y(c)) cuando
se perturba la condición.

17
Curso 21/22 MMII Aproximación local. Extremos

Ejemplo 2.4 (Un problema en la granja). Presentamos un ejemplo intuitivo de esta clase de problemas. Su
enunciado es el siguiente:
Ha llegado el momento de ordeñar en una granja, y un granjero se dirige al campo para recoger la
leche del dı́a. Antes de ordeñar debe lavar su cubo en un rı́o cercano.
Justo cuando se encuentra en el punto P (figura 2.6) divisa una vaca en el punto Q. Como el granjero
tiene algo de prisa, quiere encontrar la forma mas rápida de ir al rı́o y luego hasta la vaca. Si el rı́o describe
una curva que satisface la ecuación g(x, y) = 0, ¿cuál es el camino más corto a tomar?

rı́o [g = 0]
M


Q

• f = cte
P

Figura 2.6. El problema de la granja

En términos matemáticos, el granjero quiere encontrar un punto M en el rı́o tal que dist(P, M ) +
dist(M, Q) sea mı́nima. Ası́, debemos minimizar la función f (M ) = dist(P, M ) + dist(M, Q) sujeta a la
condición g(M ) = 0.
Interpretación geométrica
Vamos a usar la siguiente propiedad de las elipses: para todo punto M en una elipse dada, la suma de
las distancias de M a sus focos es constante.
En nuestro problema, esto significa que el granjero puede llegar a la vaca en el mismo tiempo sobre
una elipse dada: las elipses son las curvas de nivel f = cte.
La figura 2.6 muestra una sucesión de elipses de tamaño creciente con focos en los puntos P y Q que
termina en aquélla que es tangente al rı́o. Aquı́ tangente es la propiedad crucial. En el punto de tangencia
de esta elipse crı́tica, su vector normal es perpendicular a g = 0 y por tanto ∇f (M ) paralelo a ∇g(M ). Este
es precisamente el contenido del apartado 2.3.1.

Ejemplo 2.5. En el plano euclı́deo hallar la mı́nima y máxima distancia del punto (2, 0) a la circunferencia
x2 + y 2 = 1.
En este ejemplo (trivial), la función objetivo es

f (x, y) = dist((x, y), (2, 0))2 = (x − 2)2 + y 2

con la condición g(x, y) = x2 + y 2 − 1 = 0.


Como método directo podemos empezar por parametrizar la circunferencia dada por
)
x = cos θ
0 ≤ θ ≤ 2π.
y = sen θ

Entonces f (θ) = (cos θ − 2)2 + sen 2 θ = 5 − 4cos θ. Derivando respecto a θ obtenemos df /dθ = 4sen θ que
se anula para θ = 0, π. Además d2 f /dθ2 (0) = 4 > 0 y d2 f /dθ2 (π) = −4 < 0 con lo que en θ = 0 habrá un
mı́nimo y en θ = π un máximo (aunque el punto θ = 0 no es interiorpal intervalo [0, 2π], lapfunción objetivo
es 2π periódica). Estos valores corresponden a la distancia mı́nima f (0) = 1 y máxima f (π) = 3.

18
Curso 21/22 MMII Aproximación local. Extremos

Siguiendo el método de Lagrange consideramos la función auxiliar

F (x, y, λ) = f (x, y) − λg(x, y) = (x − 2)2 + y 2 − λ(x2 + y 2 − 1).

Ası́, los puntos crı́ticos de F los encontramos al resolver el sistema


∂F
∂x = 2[(x − 2) − λx] = 0 


∂F
∂y = 2[y − λy] = 0 .

∂F 2 2
∂λ = −(x + y − 1) = 0

De aquı́ se obtienen los puntos crı́ticos P0 = (1, 0) con λ0 = −1 y P1 = (−1,0) con λ1 = 3. Para estudiar de
qué tipo son, consideramos la función auxiliar F0 (x, y) = F (x, y, λ0 ) para P0 y F1 (x, y) = F (x, y, λ1 ) para
P1 . Consecuentemente

F0 (x, y) = (x − 2)2 + y 2 + (x2 + y 2 − 1) = 2x2 + 2y 2 − 4x + 3.

Como !
40
HF0 (1, 0) = >0
04
es definida positiva encontramos que el punto P0 es un mı́nimo relativo de f condicionado a g = 0. El caso
P1 se trata de igual manera, pero ahora
!
−4 0
HF1 (−1, 0) = <0
0 −4

es definida negativa y por tanto P1 es un máximo local de f sujeta a la condición g = 0.

Ejemplo 2.6. Hallar las dimensiones del rectángulo inscrito en una circunferencia de radio a > 0 para que su
área sea máxima (figura 2.7).
Si denotamos por x e y los semilados del rectángulo que buscamos, el problema se traduce en maximizar
la función A(x, y) = 4xy sujeta a la condición g(x, y) = x2 + y 2 − a2 = 0. Por tanto la función de Lagrange
toma la forma
Φ(x, y, λ) = 4xy − λ(x2 + y 2 − a2 ),
y los puntos crı́ticos deben satisfacer
4y − 2λx = 0 


4x − 2λy = 0 .

2 2 2
x +y = a
√ √ √ √
De aquı́ se sigue que los puntos crı́ticos son (±a/ 2, ±a/ 2) con λ = 2 y (±a/ 2, ∓a/ 2) ambos con
λ = −2 (notemos que el sistema lineal formado por las dos primeras ecuaciones debe, por la tercera, tener
solución no trivial y por tanto su matriz de coeficientes debe ser singular, es decir

−λ 2 2
2 −λ = 0 ⇔ λ = 4 ⇔ λ = ±2.

Ahora, la función auxiliar para λ = 2 es Φ0 (x, y) = 4xy − 2(x2 + y 2 − a2 ) cuyo hessiano es


!
−4 4
HΦ0 (x, y) =
4 −4

y sus autovalores son 0 y −8 independientemente del punto crı́tico considerado. Por tanto, la matriz hessiana
no es definida y debemos estudiar esta matriz restringida a las direcciones tangentes a la circunferencia
x2 + y 2 = a2 en los puntos crı́ticos. La recta tangente en un punto (x0 , y0 ) de esta circunferencia tiene como
ecuación x0 x + y0 y = a2 cuyo vector director es (−y0 , x0 ). Ası́

19
Curso 21/22 MMII Aproximación local. Extremos

√ !! √ !
√ √ −a/ 2 −a/ 2
HΦ0 (a/ 2, a/ 2) √ · √ = −8a2 < 0 (2.25)
a/ 2 a/ 2
√ √
√ (a/ 2,
y por tanto habrá un máximo local en √a/ 2).
Para el√ √ crı́tico (−a/ 2, −a/ 2) el tratamiento es similar y encontramos otro máximo local.
otro punto
En (a/ 2, −a/ 2) la función auxiliar Φ1 (x, y) = 4xy + 2(x2 + y 2 − a2 )tiene hessiano
!
44
HΦ1 (x, y) = ,
44

cuyos autovalores son 0 y 8 por lo que, de nuevo, se hace necesario estudiar el hessiano restringido. En este
caso, √ !! √ !
√ √ a/ 2 a/ 2
HΦ1 (a/ 2, −a/ 2) √ · √ = 8a2 > 0.
a/ 2 a/ 2
√ √
Ası́ (a/ 2, −a/ 2) es un mı́nimo local. De igual manera se trata el caso restante.
Por último, ambos casos considerados son simétricos y por esta razón tienen la misma naturaleza.
Observamos también que los mı́nimos ‘degenerados’ en (0, ±a) y (±a, 0) no aparecen, ya que en el plantea-
miento del problema hemos considerado la posibilidad de “áreas negativas”. Por la misma razón, estos cuatro
puntos crı́ticos determinan el mismo cuadrado: el área real es |A(x, y)| = 4|x| |y| con lo que los mı́nimos para
A representan máximos geométricos con valor |A|.

(x, y)

y a

x
x

Figura 2.7. Rectángulo inscrito en la circunferencia de radio a

Observación 2.13. Otro análisis para el estudio en el caso λ = 2 es el siguiente: los autovectores asociados a
1

la matriz HΦ0 se calculan encontrando las soluciones no triviales del sistema homogéneo

−4x + 4y = 0
4x − 4y = 0

asociados al autovalor 0 y del sistema 


−4x + 4y = −8x
4x − 4y = −8y
para el autovalor −8.
Resolviendo encontramos que los autovectores son (1, 1) y (1, −1) asociados a 0 y −8, respectivamente.
Ahora observemos que son perpendiculares entre sı́ y que (1, −1) es tangente a la circunferencia x2 + y 2 = a2
en los puntos crı́ticos asociados a λ = 2. ¡De aquı́ que H{g=0} Φ0 sea definida negativa!

20
Ejercicios

Problema 2.1. (a) Utilizando el desarrollo de Taylor, estimar el error que se comete al aproximar el número
1 1 1 (*)
e por 1 + 1 + 2! + 3! + 4! .
(b) Evaluar aproximadamente e0,1 estimando el error cometido.
(c) ¿Cuál es el grado óptimo (ell más pequeño) del polinomio de Maclaurin que aproxima la función f (x) = ex
en el intervalo [−1, 1] con error menor que 10−4 ?
Problema 2.2. Calcular aproximadamente los siguientes valores usando el polinomio de Taylor de orden
dos para las funcionas apropiadas en los puntos adecuados
(a) sen(0, 3)e−1,05 ,
(b) sen(0, 01) cos 0, 03).
Estimar el error cometido en ambos casos.
Problema 2.3. Determinar la fórmula de Taylor de segundo orden en (0, 0) para las siguientes funciones
(a) f (x, y) = (x + y)2 ,
(b) f (x, y) = 1−x12 −y2 ,
(c) f (x, y) = ex+y ,
2 2
(d) f (x, y) = e−x −y ,
(e) f (x, y) = sen xy + cos xy,
2
(f ) f (x, y) = e(1−x) cos y.
Problema 2.4. Se considera la parábola de ecuación y = 12 − x2 y el triángulo, en el primer cuadrante,
formado por la tangente a dicha curva (figura 2.8). Determinar el punto de tangencia para que el área de
dicho triángulo sea mı́nima.

•(a, 12 − a2 )
y = 12 − x2

a
x

Figura 2.8. Triángulo en el ejercicio 2.4


)

(∗) 1 1 1
Para referencia: 1 + 1 + 2!
+ 3!
+ 4!
= 65/24 ≈ 2, 7083 y e ≈ 2, 71828182 . . .
Curso 21/22 MMII Aproximación local. Extremos

Problema 2.5. Calcular y clasificar los puntos crı́ticos de las siguientes funciones
(a) f (x, y) = x2 − 2xy + y 2 ,
(b) f (x, y) = log(1 + x2 + y 2 ),
(c) f (x, y) = x5 y + xy + xy 5 ,
(d) f (x, y) = x3 + y 2 − 6xy + 6x + 3y,
(e) f (x, y) = (y − 3x2 )(y − x2 ).
Problema 2.6. El precio de un diamante es proporcional al cuadrado de su peso. Demostrar que si un
diamante se rompe en dos hay pérdida de su valor y que ésta es máxima cuando las dos partes son iguales.
Problema 2.7. Un alambre de longitud ` se corta en dos trozos con los que se forman un cı́rculo y un
cuadrado. Hallar el corte que debe hacerse para que la suma de las áreas sea
(a) máxima,
(b) mı́nima.
Problema 2.8. (a) Probar que el paralelepı́pedo rectangular con área de superficie fija y volumen máximo
es un cubo.
(b) Inscribir en una esfera dada un cono recto de base circular y volumen máximo.
(c) ¿Qué cilindro de volumen dado tiene área lateral mı́nima?
1
Problema 2.9. Encontrar los puntos sobre la gráfica de la función f (x, y) = xy más cercanos al origen.
Problema 2.10. Encontrar los valores máximo y mı́nimo absolutos que alcanzan las siguientes funciones en
el disco unidad cerrado U : x2 + y 2 ≤ 1
(a) f (x, y) = (x4 + y 4 )2 ,
(b) f (x, y) = x5 y + xy + xy 5 .
Problema 2.11. Encontrar los valores máximo y mı́nimo absolutos que alcanzan las siguientes funciones en
los recintos indicados
(a) f (x, y) = sen x + cos y en R = [0, 2π]2 ,
(b) f (x, y) = xy en R = [−1, 1]2 .

Problema 2.12. Encontrar los extremos relativos de f Σ si
(a) f (x, y) = x2 + y 2 y Σ : y = 2,
(b) f (x, y) = x2 + y 2 y Σ : y ≥ 2,
(c) f (x, y) = x2 − y 2 y Σ : y = cos x,
(c) f (x, y, z) = x2 + y 2 + z 2 y Σ : z ≥ 2 + x2 + y 2 .
Problema 2.13. Usar el método de los multiplicadores de Lagrange para encontrar los extremos de las
siguientes funciones baja las restricciones señaladas
(a) f (x, y) = x, si x2 + 2y 2 = 3,
(b) f (x, y) = x − y, si x2 − y 2 = 2,
(c) f (x, y, z) = x − y + z, si x2 + y 2 + z 2 = 12,
(c) f (x, y, z) = x − y + z, si x2 − y 2 = 1 y 2x + z = 1.
Problema 2.14. Probar que la ecuación x2 + y 2 + z 2 + xy + 2z = 3 determina z como función de x e y en
un entorno del punto (0, 0, 1) donde z tiene un máximo local:
(a) considerando z = z(x, y) implı́citamente definida por la ecuación anterior,
(b) utilizando el método de los multiplicadores de Lagrange.
Problema 2.15. Usando el método de los multiplicadores de Lagrange, determinar las dimensiones de un
depósito descubierto con base circular y capacidad 16π m3 que minimicen el coste de material para su
construcción si el precio del m2 de la base es el doble que el de la pared lateral.

22
Curso 21/22 MMII Aproximación local. Extremos

Problema 2.16. (a) El perı́metro de un triángulo isósceles es 2τ . ¿Cuánto deben medir sus lados para que
el volumen del cono engendrado al girar sobre su altura sea máximo?
(b) Probar que entre todos los triángulos inscritos en una circunferencia, el de mayor perı́metro es el equi-
látero.

Problema 2.17. Usando los multiplicadores


√ de Lagrange, determinar las dimensiones de un rectángulo
inscrito en una circunferencia de radio 2 (figura 2.9) de manera que
(a) el perı́metro sea máximo,
(b) el área sea máxima.

√ 2
• x

Figura 2.9. Rectángulo inscrito en el ejercicio 2.17

Problema 2.18. Utilizar el método de los multiplicadores para calcular la distancia mı́nima entre la circun-
ferencia x2 + y 2 = 1 y la parábola y 2 = 2x + 6 (figura 2.10).
Ayuda: Usar p el hecho que la distancia de un punto (x, y) en la parábola dada a la circunferencia x2 + y 2 = 1
es D(x, y) = x2 + y 2 − 1.

y 2 = 2x + 6

x2 + y 2 = 1
x

Figura 2.10. Circunferencia y parábola en el ejercicio 2.18

Problema 2.19. Sea γ la curva definida por las ecuaciones


 2
x + y2 = 1
γ:
x2 − xy + y 2 − z 2 = 1.

Encontrar el(los) punto(s) en γ más cercanos al origen.

23

1
Curso 21/22 MMII Aproximación local. Extremos

Problema 2.20. Calcular, utilizando el método de Lagrange, los puntos de mayor/menor altura en la elipse
obtenida por la intersección del plano x + y + z = 24 y el paraboloide z = x2 + y 2 .

Problema 2.21. Calcular el volumen de la caja rectangular más grande situada en el primer octante, con
tres caras en los planos coordenados y un vértice sobre el plano Π : x + 2y + 3z = 6 (figura 2.11).

z
Π

y

Figura 2.11. Caja en el ejercicio 2.21

24

También podría gustarte