Ale 2

Aproximación local.
Extremos
Contenido
2.1. Desarrollo de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1.1. Fórmula de Taylor y aplicaciones en una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1.2. El desarrollo de Taylor multidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.3. Series de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2. Máximos y mı́nimos relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1. Matrices definidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.2. Índice de formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.3. Puntos crı́ticos no degenerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3. Extremos condicionados. Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . . . . 15
2.3.1. La regla del multiplicador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1. Desarrollo de Taylor
2.1.1. Fórmula de Taylor y aplicaciones en una variable
Si P = P (x) es un polinomio de grado ≤ n, es decir, P (x) = a0 + a1 x + a2 x2 + · · · + an xn , P se puede

escribir en potencias de (x − a) en la forma P (x) = b0 + b1 (x − a) + b2 (x − a)2 + · · · + bn (x − a)n para cualquier
punto a ∈ R. Los coeficientes bi vendrán dados en términos del polinomio P . Explı́citamente, calculando las
derivadas sucesivas de P , encontramos
n
X
P (k (x) = j(j − 1)(j − k + 1)bj (x − a)j−k , k ≥ 1
j=k
y por tanto P (k (a) = k!bk , es decir
P (k (a)
bk = , k = 0, 1, 2, . . . , n.
k!
Ası́
n
X P (k (a)
P (x) = (x − a)k . (2.1)
k!
k=0
La expresión de los coeficientes bk tiene sentido si consideramos una función f con suficientes derivadas
en un punto dado a ∈ R, pero no cabe esperar una identidad como (2.1) en general -¡esto implicarı́a que
toda función suficientemente regular serı́a un polinomio!- Sin embargo, como veremos en el apartado 2.1.3,
la versión de (2.1) para n → ∞ es cierta en ciertas circunstancias.
Aproximación polinómica. Fórmula de Taylor
Dada una función f : I → R definida en un intervalo abierto I ⊂ R y a ∈ I, si existen las derivadas

f 0 (a), f 00 (a), . . . , f (n (a), llamamos polinomio de Taylor de f en a de grado n a
n
X f (k (a)
Pn,a (x) = f (a) + (x − a)k .
k!
k=1
Curso 21/22 MMII Aproximación local. Extremos
Nótese que
f (k (a) = Pn,a
(k
(a)
para todo k = 0, 1, 2, . . . , n y que, por lo anteriormente expuesto, dicho polinomio es el único de grado ≤ n
que satisface esta propiedad.
El Teorema de Taylor se obtiene de un resultado más general que, a su vez, es una extensión del
Teorema de Cauchy.
Teorema 2.1 (Cauchy generalizado). Sean f y g dos funciones con derivadas n-ésimas f (n y g (n en
un intervalo abierto (a, b) y derivadas hasta orden (n − 1) continuas en [a, b]. Supongamos que c ∈ [a, b].
Entonces, para todo x ∈ [a, b], x 6= c, existe ξ en el interior del intervalo que une c con x tal que
n−1
! n−1
!
X f (k (c) X g (k (c)
f (x) − (x − c)k g (n (ξ) = f (n (ξ) g(x) − (x − c)k
k! k!
k=0 k=0
Demostración. Sin pérdida de generalidad supongamos c < x. Para x fijo sean F y G las funciones
n−1
X f (k (t)
F (t) = f (t) + (x − t)k
k!
k=1
n−1
X g (k (t)
G(t) = g(t) + (x − t)k
k!
k=1
para t ∈ [c, x]. Puesto que F y G son continuas en [c, x] y derivables en (c, x), de acuerdo con el Teorema de
los incrementos finitos, existe ξ ∈ (c, x) para el que
F 0 (ξ) G(x) − G(c) = G0 (ξ) F (x) − F (c)

o
F 0 (ξ) g(x) − G(c) = G0 (ξ) f (x) − F (c) ,

(2.2)
ya que F (x) = f (x) y G(x) = g(x).
De la expresión que define F tenemos
n−1
f (n (t)

0 0
X 1 (k+1
F (t) = f (t) + f (t)(x − t)k − kf (k (t)(x − t)k−1 = f 0 (t) + (x − t) n−1 0
− f (t)
k! (n − 1)!
k=1
f (n (t)
= (x − t)n−1
(n − 1)!
ya que los sumandos se cancelan mutuamente. Análogamente,
g (n (t)
G0 (t) = (x − t)n−1 .
(n − 1)!
Si hacemos t = ξ y sustituimos en (2.2) obtenemos la igualdad en el enunciado. t

u
En particular, con g(x) = (x − c)n se deduce el siguiente Teorema (nótese que g (k (c) = 0, k =
0, 1, . . . , n − 1 y g (n (c) = n!)
Teorema 2.2 (Taylor). Sea f una función que admita derivada n-ésima en el intervalo abierto (a, b) y
derivadas hasta orden (n − 1) continuas en [a, b]. Supongamos que c ∈ (a, b). Entonces, para todo x ∈ [a, b],
x 6= c, existe ξ en el interior del intervalo que une c con x tal que
n−1
X f (k (c) f (n (ξ)
f (x) = f (c) + (x − c)k + (x − c)n (2.3)
k! n!
k=1
2
Definición 2.1. Como ya hemos mencionado, en las hipótesis del Teorema 2.2, el polinomio
f 00 (c) f (n−1 (c)

Pn−1,c (x) = f (c) + f 0 (c)(x − c) + (x − c)2 + · · · + (x − c)n−1
2 (n − 1)!
se denomina polinomio de Taylor de f en c de grado n − 1.
Cuando a < 0 < b y se toma c = 0 en el Teorema 2.2, el desarrollo (2.3) se denomina de Maclaurin y
el correspondiente polinomio de Taylor
f 00 (0) 2 f (n−1 (0) n−1

Pn−1 (x) = f (0) + f 0 (0)x + x + ··· + x
2 (n − 1)!
se llama polinomio de Maclaurin.
Obsérvese que, para ser mas exactos, en general Pn−1,c es un polinomio de grado ≤ n − 1.
En la figura 2.1 se muestran los 4 primeros polinomios de Maclaurin para la función f (x) = sen x+cos x
en el intervalo [−π, π]. Obsérvese como convergen sus gráficas a medida que n crece ...
y P1 (x) = 1 + x
| |
π
x
−π
x2
P2 (x) = 1 + x − 2!
f (x) = senx + cosx
x2 x3 x4
P4 (x) = 1 + x − 2!
− 3!
+ 4!
x2 x3
P3 (x) = 1 + x − 2!
− 3!
Figura 2.1. Polinomios de Taylor para f (x) = sen x + cos x
Formula de Taylor con resto integral
En este apartado estableceremos la versión integral de (2.3). Para ello necesitaremos la siguiente regla
de derivación de Leibniz
Proposición 2.1 (Regla de derivación de Leibniz). Sea f : [a, b] × [c, d] → R una función C 1 y
α, β : [a, b] → [c, d] dos funciones C 1 tales que α ≤ β. Entonces, la función
1
ˆ β(λ)
F (λ) : = f (λ, x)dx
α(λ)
es C 1 en [a, b] y
ˆ β(λ)
∂f
F 0 (λ) = β 0 (λ)f (λ, β(λ)) − α0 (λ)f (λ, α(λ)) + (λ, x)dx. (2.4)
α(λ) ∂λ
Demostración. Consideremos la función auxiliar de tres variables

ˆ v
A(u, v, λ) = f (λ, x)dx.
u
3
Por hipótesis A es C 1 y por el Teorema fundamental del cálculo

∂A ∂A
= f (λ, u), y = −f (λ, v).
∂u ∂v
Puesto que F (λ) = A(α(λ), β(λ), λ), por la regla de la cadena,
∂A ∂A ∂A
F 0 (λ) = β 0 (λ) (α(λ), β(λ), λ) + α0 (λ) (α(λ), β(λ), λ) + (α(λ), β(λ), λ)
∂u ∂v ∂λ
∂A
= β 0 (λ)f (λ, β(λ)) − α0 (λ)f (λ, α(λ)) + (α(λ), β(λ), λ)
∂λ
que establece (2.4) tan pronto veamos que
ˆ v
∂A ∂f
(u, v, λ) = (λ, x)dx
∂λ u ∂λ
esto es, ˆ v
A(u, v, λ + t) − A(u, v, λ) ∂f
lı́m = (λ, x)dx.
t→0 t u ∂λ
Para ello, por el Teorema de los incrementos finitos aplicado a la función t → f (λ + t, x) (con λ y x fijos)
tenemos
ˆ v ˆ v
A(u, v, λ + t) − A(u, v, λ) f (λ + t, x) − f (λ, x) ∂f
= dx = (λ + θt, x)dx
t u t u ∂λ
donde θ ∈ (0, 1) puede en principio depender de λ, t y x. Pero,

ˆ v ˆ v
A(u, v, λ + t) − A(u, v, λ) ∂f ∂f ∂f
− (λ, x)dx =
(λ + θt, x) − (λ, x) dx
t u ∂λ u ∂λ ∂λ
ˆ v
∂f ∂f
≤ (λ + θt, x) −
∂λ (λ, x) dx
u ∂λ
que, por el Teorema de Heine (continuidad uniforme), se puede hacer tan pequeño como se quiera si t es
suficientemente pequeño. t
u
Ahora tenemos
Teorema 2.3 (Taylor con resto integral). En las hipótesis del Teorema 2.2,
n−1
X f (k (c) ˆ x
1
f (x) = f (c) + k
(x − c) + (x − t)n−1 f (n (t)dt. (2.5)
k! (n − 1)! c
k=1
Demostración. De (2.4), si ˆ x
1
u(x) = (x − t)n−1 f (n (t)dt
(n − 1)! c
tenemos
ˆ x
1
u0 (x) = (x − t)n−2 f (n (t)dt ⇒ u0 (c) = 0
(n − 2)! c
ˆ x
1
u00 (x) = (x − t)n−3 f (n (t)dt ⇒ u00 (c) = 0
(n − 3)! c
..
.
ˆ x
(n−1
u (x) = f (n (t)dt ⇒ u(n−1 (c) = 0
c
u(n (x) = f (n (x) ← para todo x ∈ [a, b]
y por tanto f − u es un polinomio de grado a lo sumo n − 1 que debe ser igual al de Taylor de f en c. Esto
es exactamente (2.5). t
u
4
Corolario 2.1. Si f es continua en [a, b], la función

ˆ x
1
u(x) = (x − t)n−1 f (t)dt
(n − 1)! a
es la única que satisface u(n = f en [a, b] y las condiciones iniciales u(a) = u0 (a) = u00 (a) = . . . = u(n−1 (a) =
0. Además, la única solución de la ecuación u(n = f tal que u(a) = ξ0 , u0 (a) = ξ1 , . . . , u(n−1 (a) = ξn−1 es
n−1 ˆ x
X ξk 1
u(x) = (x − a)k + (x − t)n−1 f (t)dt.
k! (n − 1)! a
k=0
Observación 2.1. 1. Nótese que por el Teorema del valor medio integral
ˆ x ˆ x
1 f (n (ξ) f (n (ξ) t=x f (n (ξ)
(x − t)n−1 f (n (t)dt = (x − t)n−1 dt = − (x − t)n = (x − c)n

(n − 1)! c (n − 1)! c n! t=c n!
para algún ξ en el intervalo que une c con x. Ası́, (2.5) implica (2.3).
2. La segunda parte del corolario 2.1 muestra que el espacio de soluciones de la ecuación diferencial ho-
mogénea u(n = 0 forma un espacio vectorial de dimensión n para el que 1, x−a, (x−a)2 , . . . , (x−a)n−1

es una base. La solución general de la ecuación completa u(n = f se puede escribir como u = uh + up
donde ˆ x
1
up (x) = (x − t)n−1 f (t)dt
(n − 1)! a
(n
es una solución particular de la ecuación completa (satisface up = f ) y
n−1
X
uh (x) = ak (x − a)k
k=0
es la solución general de la correspondiente ecuación homogénea (describen completamente el espacio de

soluciones de u(n = 0 si aj ∈ R, j = 0, 1, . . . , n − 1)(1) .
Nota. Para el caso particular en el que nos encontramos, la primera parte de este corolario se puede probar
a fuerza bruta sin apelar a la regla de Leibniz. Si por el momento ponemos
ˆ x n−1 ˆ
n − 1 n−1−j x j

1 1 X
un (x) = (x − t)n−1 f (t)dt = (−1)j x t f (t)dt, (2)
(n − 1)! a (n − 1)! j=0 j 0
entonces
n−1 ˆ x
n−1

1 X
u0n (x) = (−1)j xn−1 f (x) + (n − 1 − j)xn−2−j tj f (t)dt
(n − 1)! j=0 j 0
n−1 ˆ x n−2
n−1 n − 2 n−2−j j

1 X 1 X
= (−1)j xn−1 f (x) + (−1)j x t f (t)dt
(n − 1)! j=0 j (n − 2)! a j=0 j
| {z } | {z }
(1−1)n−1 =0 (x−t)n−2
ˆ x
1
= (x − t)n−2 f (t)dt = un−1 (x)
(n − 2)! a
(k (k
si n ≥ 2. Por tanto un (x) = un−k (x) para k = 0, 1, . . . , n−1 y en particular, un (a) = 0 si k = 0, 1, . . . , n−1.
Además ˆ x
0 d
u(n
n (x) = u1 (x) = f (t)dt = f (x).
dx a
(1)
La Teorı́a de ecuaciones diferenciales ordinarias forman parte de los contenidos de la asignatura de grado Métodos
Matemáticos IV del primer cuatrimestre de segundo curso.
(2)
Aquı́, y en P
el
m cálculo siguiente, hemos usado (con a = −t, b = x y m = n − 2, n − 1) el binomio de Newton
m
(a + b)m =
j m−j
j
a b , válida para todo a, b ∈ R y m = 1, 2, . . .
j=0
5
Máximos y mı́nimos relativos
Supongamos que en un entorno del punto a ∈ R, la función f admita derivadas continuas hasta orden
ny
f 0 (a) = f 00 (a) = · · · = f (n−1 (a) = 0
pero f (n (a) 6= 0. La fórmula de Taylor nos permite escribir
f (n (ξ)
f (x) = f (a) + (x − a)n .
n!
Si x está próximo a a, ξ también lo estará y, por continuidad, f (n (ξ) tendrá el mismo signo que f (n (a). Por
tanto si n es par f tendrá en x = a un máximo o un mı́nimo relativo según sea f (n (a) < 0 o f (n (a) > 0
respectivamente. Si n es impar, se deduce que f (x) − f (a) cambia de signo dependiendo del lado de a en el
que nos encontremos. En este caso f presenta una inflexión en x = a.
Infinitésimos equivalentes
En el cálculo de lı́mites es usual utilizar infinitésimos, y a este respecto, para una función dada, el
Teorema de Taylor 2.2 permite encontrarlos. Si f es una función definida en un entorno de a ∈ R con
derivadas continuas hasta orden n + 1, entonces
f (x) ∼ Pn (x), cuando x → a (2.6)
donde,
n
X f (k (a)
Pn (x) = (x − a)k
k!
k=1
es el polinomio de Taylor de f en a de grado n, si Pn 6= 0.

Esto sigue inmediatamente del desarrollo (2.3) ya que, para cierta constante M > 0,
f (x) − Pn (x) ≤ M |x − a|n+1

y por tanto,
f (x)
lı́m =1
x→a Pn (x)
ya que Pn tiene grado ≤ n.
Ejemplo 2.1. Como ejemplos tenemos
x3
sen x ∼ x − ,
6
x2
cos x ∼ 1 − ,
2
ln(1 + x) ∼ x,
(1 + x)α ∼ 1 + αx (α ∈ R),
cuando x → 0.
2.1.2. El desarrollo de Taylor multidimensional
Sean a ∈ Rn , r > 0 y f : B(a, r) ⊂ Rn → R una función real con derivadas continuas en B(a, r)
hasta orden N + 1. Entonces, para cada vector unitario ~v ∈ Rn , la función f~v : I~v ⊂ R → R definida en
I~v = {a + t~v / |t| < r} dada por
f~v (t) : = f (a + t~v )
admite derivadas continuas hasta orden N + 1.
El Teorema de Taylor unidimensional permite escribir
6
(N
f~v00 (0) 2 f (0) N
f~v (t) = f~v (0) + f~v0 (0)t + t + · · · + ~v t + EN (t) (2.7)
2 N!
donde
EN (t)
lı́m = 0. (2.8)
t→0 tN
Ahora bien, para cada m = 1, 2, . . . , N ,
n
(m
X ∂ m f (a + t~v )
f~v (t) = vk vk · · · vkm ,
∂xk1 ∂xk2 · · · ∂xkm 1 2
k1 ,k2 ,...,km =1
por lo que
(m
X m
f~v (0) = ∂ α f (a)~v α ,
α
|α|=m
donde
n
α = (α1 , α2 , . . . , αn ) ∈ N ∪ {0} ,
|α| = α1 + α2 + · · · + αn ,
α! = α1 ! · α2 ! · . . . · αn !,
~v α = v1α1 · v2α2 · . . . · vnαn ,

m m!
=
α α!
y,
∂ |α| f
∂αf = αn .
∂xα α2
1 ∂x2 · · · ∂xn
1
Ası́, el desarrollo (2.7) se puede reescribir como

N X
X 1 m α
f (a + t~v ) = ∂ f (a)~v tm + EN (t).
α
m=0
m! α
|α|=m
x−a
Finalmente, haciendo ~v = |x−a| y t = |x − a| encontramos que
N X
X 1 m α
f (x) = ∂ f (a)(x − a)α + TN (x), (2.9)
m=0
m! α
|α|=m
con
1 X N +1 α
TN (x) = EN (|x − a|) = ∂ f (ζ)(x − a)α , (2.10)
(N + 1)! α
|α|=n+1
donde ζ = a + θ(x − a), (0 < θ < 1) es algún punto del segmento [a, x] \ {a, x}, para el que (2.8) se traduce
en
|TN (x)|
lı́m = 0.
x→a |x − a|N
La relación anterior también se puede escribir como

N
X
f (x) = fm (x) + TN (x), (2.11)
m=0
7
donde
1 X m α
fm (x) = ∂ f (a)(x − a)α
m! α
|α|=m
es un polinomio homogéneo de grado m en x − a.

En ambas formas, tanto (2.9) como (2.11) se conocen como desarrollo de Taylor multidimensional.
Observación 2.2 (Estimación del error de Taylor). Puesto que
(N +1
f~v (ξ) N +1
EN (t) = t
(N + 1)!
con |ξ| ≤ |t|, !
|t|N +1 (N +1
|EN (t)| ≤ sup f~v (ξ) .
(N + 1)! |ξ|≤|t|
Ahora bien, para t ∈ I~v

X m
f~vm (t) = ∂ α f (a + t~v )~v α ,
α
|α|=m
y por tanto
X m X
m

|f~vm (t)| ≤ |~v ||α| sup |∂ α f (x)| = ||∂ α f ||∞ |~v |m
α x∈B(a,r) α
|α|=m |α|=m
donde,
||∂ α f ||∞ = sup |∂ α f (x)| .
x∈B(a,r)
Ası́, si Mm = sup ||∂ α f ||∞ tenemos

|α|=m
|f~vm (t)| ≤ Mm nm |~v |m = Mm nm ,

ya que
X m
= nm (2.12)
α
|α|=m
y ~v es unitario. Por consiguiente,

nN +1
|EN (t)| ≤ MN +1 |t|N +1
(n + 1)!
y de la primera igualdad en (2.10) obtenemos la estimación
nN +1 N +1
|TN (x)| ≤ MN +1 r (2.13)
(N + 1)!
para x ∈ B(a, r).
2.1.3. Series de Taylor

A la vista del desarrollo (2.9), si f es C ∞ en B(a, r) y para x ∈ B(a, r) TN (x) → 0 cuando N → ∞,
f se podrá representar en serie de potencias
∞ ∞ X
X X 1 m α α
f (x) = fm (x) = ∂ f (a)(x − a) , (2.14)
m=0 m=0
m! α
|α|=m
que llamaremos serie de Taylor de f en a.

Por supuesto, que TN (x) → 0 dependerá de f . De la estimación (2.13) podemos observar que si
N N
MN n Nr! → 0, entonces (2.14) será válido en B(a, r). Naturalmente toda función C ∞ en B(a, r) determina
su serie de Taylor pero, como muestra el siguiente ejemplo, incluso si ésta es convergente, puede que no la
represente.
8
Ejemplo 2.2. Para la función 2

e−1/x , si x 6= 0
f (x) =
0, si x = 0
2
tenemos f (k (x) = Pk (1/x)e−1/x para ciertos polinomios Pk de grados 3k, k = 0, 1, 2, . . . Por tanto
lı́m f (k (x) = 0,
x→0
f es C ∞ en toda la recta real y f (k (0) = 0 para k = 0, 1, 2, . . .

Desde otro punto de vista, en (2.7) f (x) = EN (x) para todo N = 0, 1, 2, . . . y, por tanto, ¡el error de
aproximación EN no depende de N !
Observación 2.3. Con relación al ejemplo 2.2 cabe destacar que, para funciones C ∞ , no existe restricción
alguna sobre las derivadas f (k (0) en el siguiente sentido: para cualquier sucesión ak ∈ R, k = 0, 1, 2 . . . de
números reales existe una función f , C ∞ en R, tal que f (k (0) = ak para cada k = 0, 1, 2, . . .
El caso de una variable es suficientemente ilustrativo para el estudio de la convergencia de la serie
(2.14). Por ejemplo, las derivadas sucesivas de las funciones sen x y cos x están acotadas por 1 en todo R y
por tanto
rN +1
|TN (x)| ≤
(N + 1)!
si r > 0 y |x| < r. Ası́ TN (x) → 0 cuando N → ∞ y
∞
X x2k+1
sen x = (−1)k (2.15)
(2k + 1)!
k=0
∞
X x2k
cos x = (−1)k , (2.16)
(2k)!
k=0
con convergencia uniforme en intervalos acotados [−r, r] para todo r > 0.

De forma análoga, para la función exponencial ex , se tiene
rN +1 r
|TN (x)| ≤ e
(N + 1)!
si |x| < r para todo r > 0, y que también tiende a 0 cuando N → ∞. Ası́,
∞
X xk
ex = (2.17)
k!
k=0
también uniformemente en [−r, r], r > 0.

Observación 2.4 (Una justificación de la fórmula de Euler). La conocida fórmula de Euler en variable com-
pleja establece que
eiθ = cos θ + i sen θ
para todo θ ∈ R (figura 2.2). Aprovechando las series anteriores, a continuación presentamos una de sus
muchas justificaciones.
La serie (2.17) permite definir la exponencial compleja
∞
X zk
ez = , z∈C
k!
k=0
N
zk
P
ya que, de la desigualdad triangular, su sucesión de sumas parciales k! está mayorada por las
k=1
correspondientes en (2.17)
9

N N
X z k X |z|k
≤ .

k! k!

k=0 k=0
Ası́, para θ ∈ R, con z = iθ
∞ ∞ k k ∞ ∞
X (iθ)k X i θ X i2m θ2m X i2m+1 θ2m+1
eiθ = = = +
k! k! m=0
(2m)! m=0
(2m + 1)!
k=0 k=0
∞ ∞
X θ2m X θ2m+1
= (−1)m +i (−1)m = cos θ + i sen θ
m=0
(2m)! m=0
(2m + 1)!
por (2.15) y (2.16).
•
eiθ = cos θ + i sen θ
sen θ
θ
x
cos θ
Figura 2.2. Representación geométrica de la fórmula de Euler
Nota. Recordemos que la notación polar z = %θ de un número complejo z = x + iy ∈ C, significa que
% = |z| = x2 + y 2 es su módulo y θ = arg θ = arc tg xy su argumento. Equivalentemente,
p
)
x = % cos θ
.
y = % sen θ
Con relación a la fórmula de Euler podemos también escribir %θ = %eiθ . Considerar (%, θ) como nuevas
variables proporcionan las llamadas coordenadas polares.
2.2. Máximos y mı́nimos relativos 1
Esta sección está dedicada al estudio local de aquellos puntos donde una función dada alcanza su
valor máximo o mı́nimo tanto en el caso libre como para el caso de extremos condicionados. En el caso
unidimensional, éstos se encuentran igualando a cero la primera derivada para luego, haciendo uso de la
segunda, decidir (cuando el método lo permita) si son máximos o mı́nimos.
El análogo multidimensional es similar, pero el estudio local usando la segunda derivada es un poco
más sutil. En este caso, para una función de varias variables f , la ecuación que deben satisfacer los puntos
crı́ticos es ∇f = 0 que, en el caso de n variables, realmente es un sistema de n ecuaciones con n incógnitas,
y su segunda derivada es ahora una matriz de orden n × n (la matriz hessiana).
Además, al contrario que en una variable, podemos considerar problemas máx/mı́n con restricciones,
es decir, problemas en los que las variables están sujetas a alguna relación a priori. La idea fundamental se
presenta como la regla del multiplicador y proporciona el conocido método de los multiplicadores de Lagrange.
Definición 2.2. Sea f una función real definida en un abierto Ω ⊂ Rn y a ∈ Ω. Decimos que f tiene un
máximo relativo o local en a si existe r > 0 tal que B(a, r) ⊂ Ω y f (x) ≤ f (a) para todo x ∈ B(a, r).
De igual forma, a es un mı́nimo relativo o local de f si existe una bola B(a, r) ⊂ Ω tal que f (a) ≤ f (x) para
cualquier x ∈ B(a, r).
10
Al igual que en el caso unidimensional tenemos

Proposición 2.2. Si f : Ω ⊂ Rn → R es diferenciable en a ∈ Ω donde f tiene un máximo o un mı́nimo
local, entonces ∇f (a) = 0.
Demostración. Sea r > 0 tal que B(a, r) ⊂ Ω. Si ~u es un vector unitario, la función ϕ~u (t) = f (a+t~u) definida
para |t| < r posee un máximo o un mı́nimo en t = 0. Por tanto ϕ~0u (0) = 0 y, puesto que ϕ~0u (0) = ∇f (a) · ~u,
concluimos que ∇f (a) · ~u = 0 para cualquier elección de ~u. Esto implica que ∇f (a) = 0, como afirma la
Proposición. t
u
Análogamente al caso de una variable, los puntos donde ∇f (a) = 0 se denominan crı́ticos de f . Ası́,
los extremos relativos son puntos crı́ticos.
Sea ahora a ∈ Rn un punto crı́tico para una función f . Queremos obtener condiciones suficientes
para que f tenga en a un máximo o un mı́nimo local. Para ello sea ~u = (u1 , u2 , . . . , un ) cualquier vector, y
ϕ~u (t) = f (a + t~u). Como antes ϕ~0u (0) = ∇f (a) · ~u = 0 y el desarrollo de Taylor de ϕ~u en t = 0 nos permite
escribir
1
ϕ~u (t) − ϕ~u (0) = ϕ~00u (0)t + E(t),
2
donde E representa el correspondiente resto de Taylor. Puesto que ϕ~u (0) = f (a) y
n
X ∂2f
ϕ~00u (0) = (Hf (a)~u) · ~u = (0)ui uj ,
i,j=1
∂xi ∂xj

la restricción de f L al segmento La,~v = {a + t~v /; |t| < r} tendrá un máximo o un mı́nimo local en
a,~v
a (t = 0) si Hf (a)~u · ~u es < 0 o > 0. A este respecto, decimos que la matriz Hf (a) es definida positiva si
Hf (a)~u · ~u > 0 y definida negativa si Hf (a)~u · ~u < 0 para todo ~u 6= 0 (esto se denotará por Hf (a) > 0 y
Hf (a) < 0 respectivamente). El siguiente resultado muestra que éstas condiciones sobre la matriz hessiana
son suficientes para afirmar que en a f tiene un extremo local. Recuérdese que
 2 
∂ f ∂2f ∂2f
2 · · ·
 ∂x1 ∂x1 ∂x2 ∂x1 ∂xn 
 2
∂2f ∂2f 

 ∂ f
 ∂x1 ∂x2 ∂x22 · · · ∂xn2 
Hf =  .
 
 .. .. .. .. 
 . . . . 
 
 2 2 2

∂ f ∂ f ∂ f
∂xn ∂x1 ∂xn ∂x2 · · · ∂x 2
n
Proposición 2.3. Si f : Ω → R es de clase C 2 en un entorno de un punto crı́tico a ∈ Ω entonces, a es un

máximo/mı́nimo local estricto de f si Hf (a) < 0/ > 0, respectivamente.
Demostración. Atendiendo al desarrollo de Taylor (2.9), de la expresión del error en la segunda igualdad de
(2.10) con N = 1, si r > 0 es suficientemente pequeño, f (x) = f (a) + 21 Hf (ζ)(x − a) · (x − a) para todo
|x − a| < r donde ζ es algún punto del segmento [a, x] \ {a, x}. Si Hf (a) > 0, como la esfera unidad |~u| = 1
es compacta,
γ : = mı́n{ Hh(a)~u · ~u |~u| = 1} > 0,
· ~u ≥ γ|~u|2 para todo ~u 6= 0. Puesto que f es C 2 cerca de a, la aplicación

con lo que Hf (a)~
u (b, ~u) 7→
Hf (b)~u · ~u es continua (reduciendo r > 0 si fuese necesario) podemos suponer que Hf (ζ)~u · ~u ≥ γ2 |~u|2 si

~u 6= 0. Por tanto, f (x) ≥ f (a) + γ4 |x − a|2 si x 6= a, lo que significa que a es un mı́nimo local estricto de f .
Por último, el caso que resta sigue de éste aplicado a la función la función −f . t
u
Observación 2.5. La relevancia de la Proposición anterior queda de manifiesto con el ejemplo siguiente:
la función f (x, y) = 3x4 − 4x2 y + y 2 tiene un mı́nimo local en (0, 0) sobre cualquier recta que pase por
(0, 0). Sin embargo, f no tiene un mı́nimo local (bidimensional) en el origen. Para ver esto observemos
que, completandocuadrados, f se puede escribir como f (x, y) = (y − 2x2 )2 − x4 , por lo que el conjunto
2 2 2

D : ={f ≤ 0} = (x, y) ∈ R / x ≤ y ≤ 3x no contiene, cerca del origen, ninguna recta que pasa por él
(figura 2.3).
11
x
m
=
D
y
x
Figura 2.3. Posición de las rectas y = mx respecto al conjunto D : |y − 2x2 | ≤ x2
2.2.1. Matrices definidas
Sea A = (aij ) una matriz cuadrada real de orden n × n y L su correspondiente transformación lineal.
Un real λ es un valor caracterı́stico o autovalor de L si la transformación L − λI es singular. Si L(~u) = λi ~u
y ~u 6= 0, ~u es un vector caracterı́stico o autovector correspondiente al autovalor λi . En general existen n
autovalores complejos λ1 , λ2 , . . . , λn contados con sus multiplicidades, y sus correspondientes autovectores
pueden, a su vez, tener componentes complejas.
Si A es simétrica A> = A (aij = aji para todo i, j = 1, 2, . . . , n), entonces todos los autovalores de A
son reales. De hecho cada uno está caracterizado por ser el valor de cierto máximo condicionado. Nótese
que A es simétrica si, y sólo si,
(L~u) · ~v = ~u · (L~v ) (2.18)
para todo ~u, ~v ∈ Rn .
Consideremos el polinomio cuadrático homogéneo
n
X
Q(~u) : = (L~u) · ~u = aij ui uj ,
i,j=1
y sea S1 la esfera unidad en Rn , S1 : = {~u / |~u| = 1}. Sean
λ1 : = máx{Q(~u) / ~u ∈ S1 },
y ~u1 ∈ S1 un vector donde se alcanza el máximo. Ahora veremos que λ1 es un autovalor de L para el que
~u1 es un autovector. Para ver esto primero observamos que
L ~u⊥ u⊥

1 ⊂~ 1 (2.19)
ya que, si ~v ∈ ~u⊥ , por la desigualdad de Cauchy aplicada a la forma cuadrática Q1 (~u) = λ1 |~u1 |2 − Q(~u) (que
es no negativa de la definición de λ1 ) tenemos
:0
|~v · L~u1 | = |λ1~v · ~u1 − ~v · L~u1 | ≤ |λ1 |~v |2 − Q(~v )|

1−
(λ Q(~
u 1 )| = 0

por lo que, L~v · ~u1 = ~v · L~ u1 = 0 y ası́ L~v ⊥ ~u1 . Ahora bien, ~v1 : = L~u1 − λ1 ~u1 ⊥ ~u1 ya que
λ1 = L~u1 · ~u1 ⇒ L~u1 − λ~u1 · ~u1 = 0 y por tanto
|~v1 |2 = L~u1 − λ~u1 · ~v1 = L~u1 · ~v1 − λ~u1 · ~v1 =

u~1·L~v1 − λ
~u1 · ~v
1 =0

↑ ↑
v1 ⊥~
L~ u1 v1 ⊥~
~ u1
que significa que ~v1 = 0 o equivalentemente que L~u1 = λ1 ~u1 según querı́amos ver.
Sean ahora S2 = S1 ∩ ~u⊥

1 = {~
u ∈ S1 ~u ⊥ ~u1 } y ~u2 ∈ S2 tal que Q(~u2 ) = λ2 : = máx{Q(~u) ~u ∈ S2 }.
Por el mismo razonamiento anterior pero ahora trabajando en ~u⊥ n
1 en lugar de R vemos que ~ u2 es un
autovector de L con autovalor λ2 ≤ λ1 . Continuando de esta forma encontramos una base ortonormal
{~u1 , ~u2 , . . . , ~un } de Rn constituida de vectores propios de L.
Ası́ hemos probado
12
Teorema 2.4. Toda matriz simétrica A es ortogonalmente diagonalizable, es decir, todos sus valores propios
son reales y existe una base ortonormal {~u1 , ~u2 , . . . , ~un } formada por vectores propios.
Si (x1 , x2 , . . . , xn ) denotan las componentes de un vector ~u en esta base, la forma cuadrática Q asociada
a A toma la forma
Q(~u) = λ1 x21 + λ2 x21 + · · · + λn x2n .
Corolario 2.2. Sea A una matriz cuadrada simétrica. Entonces, todos sus autovalores son reales y,
(i) A es definida positiva, esto es, (A~u) · ~u > 0 para todo ~u =
6 0 si, y sólo si, todos sus autovalores son
positivos.
(ii) A es definida negativa, esto es, (A~u) · ~u < 0 para todo ~u =6 0 si, y sólo si, todos sus autovalores son
negativos.
Puesto que L − λI es singular si λ es un autovalor de L, det(A − λI) = 0. Al polinomio p(λ) =

det(A − λI) se le llama polinomio caracterı́stico de L y, por tanto, sus raı́ces son los autovalores de L.
Observación 2.6. La representación matricial correspondiente a una trasformación lineal L depende de la
base elegida a tal efecto. De hecho, si A y A0 representan la misma transformación, A y A0 son semejantes,
es decir, existe una matriz P no singular (la matriz de cambio de base) tal que A0 = P −1 AP .
Puesto que A0 − λI = P −1 AP − λI = P −1 (A − λI)P , las matrices semejantes tienen el mismo
polinomio caracterı́stico y, por tanto, el conjunto de autovalores (también llamado espectro) sólo depende
de L, o equivalentemente, de la clase de semejanza de cualquier matriz que la represente. A menudo, y
abusando de éste concepto, hablaremos del espectro de una matriz cuando nos referimos al espectro de la
transformación lineal asociada en la base canónica.
De acuerdo con el Corolario 2.2, serı́a deseable disponer de algún criterio que proporcione información
sobre el signo de las raı́ces de un polinomio real dado. Por ejemplo, como caso particular de la conocida
regla de los signos de Descartes tenemos
Proposición 2.4. Sea p(t) = an tn + an−1 tn−1 + · · · + a1 t + a0 un polinomio de grado n con coeficientes
reales (ak ∈ R, 0 ≤ k ≤ n). Si p tiene todas sus raı́ces reales, entonces son equivalentes:
(i) Todas las raı́ces de p son positivas.
(ii) p presenta n cambios de signo entre sus coeficientes.
Demostración. Que (i) implica (ii) es inmediato de las relaciones de Cardano-Vieta(3) (que no son mas que
aquellas que resultan de escribir los coeficientes de p en término de sus raı́ces).
Recı́procamente, por hipótesis, los coeficientes del polinomio q(t) : = p(−t) tienen todos el mismo signo
y por tanto no tiene raı́ces positivas. Ası́, todas las raı́ces de p (que suponemos reales) deben ser positivas. t
u
Observemos que la condición (ii) implica que ak 6= 0 para k = 0, 1, 2, . . . , n.

Del Corolario 2.2, la Proposición 2.4 aplicada al polinomio caracterı́stico de una matriz real simétrica
nos proporciona el siguiente resultado
Corolario 2.3. Una matriz real simétrica A es,

(i) positiva si, y sólo si, el número de cambios de signo en su polinomio caracterı́stico es máximo,
(ii) negativa si, y sólo si, los coeficientes de su polinomio caracterı́stico tienen el mismo signo.
Ejemplo 2.3. Para la función f (x, y) = x2 + y 2 + exy tenemos

∂f xy
)
∂x = 2x + ye
∂f
∂y = 2y + xexy
con lo que el punto (0, 0) es crı́tico.

Ahora bien, las parciales de segundo orden de f son
(3) an−k
rj1 rj2 · · · rjk = (−1)k
Q
Si r1 , r2 , . . . , rn son las raı́ces de p(t) entonces an
.
1≤j1 <j2 <...jk ≤n
13
∂2f
= 2 + y 2 exy

∂x2 


∂2f
∂x∂y = (1 + xy)exy ,

2 
∂ f
= 2 + x2 exy

∂y 2
que evaluadas en el punto (0, 0) nos proporciona la matriz hessiana

21
Hf (0, 0) = .
12
Sus autovalores se calculan resolviendo la ecuación caracterı́stica

2 − λ 1
p(λ) =
= 0,
1 2 − λ
que es equivalente a (2 − λ)2 − 1 = 0 ⇔ λ = 1, 3. Ası́ Hf (0, 0) tiene sus dos autovalores > 0 (nótese los
cambios de signo en los coeficientes de p(λ) = λ2 − 4λ + 3 respecto al Corolario 2.3) y por tanto podemos
afirmar que (0, 0) es un mı́nimo local de f .
Nota. Puesto que et ≥ 1 + t para todo t ∈ R (¿por qué?),
(y + 2x)2 + 3y 2
f (x, y) = x2 + y 2 + exy ≥ x2 + y 2 + xy + 1 = + 1 ≥ 1 = f (0, 0)
4
para todo (x, y) ∈ R2 . Por tanto (0, 0) es un mı́nimo global de f .
2.2.2. Índice de formas cuadráticas

Toda forma cuadrática real Q en Rn tiene asociada una matriz simétrica A ∈ Mn (R) respecto a una
base dada, a saber, si ~u1 , ~u2 , . . . , ~un es una base, A = Q(~ui , ~uj ) i,j donde Q(~ui , ~uj ) = (A~ui )·~uj . Obviamente
esta matriz cambia si cambiamos la base de referencia: si P ∈ Mn (R) no es singular, respecto a la nueva
base ~vk := P ~uk , la matriz asociada A0 vendrá dada por (A0~vi ) · ~vj = (AP ~ui ) · (P ~uj ) = (P >AP ~ui ) · ~uj , de
donde A0 = P >AP (en este caso, A y A0 se dicen congruentes).
Afortunadamente, aunque el espectro de una matriz no es invariante bajo congruencia, existen algunas
cantidades que sı́ lo son. Estas son por tanto invariantes de formas cuadráticas, y el siguiente Teorema
proporciona un ejemplo,
Teorema 2.5 (Ley de inercia. Sylvester). San A y A0 dos matrices reales simétricas de orden n × n
y q, q 0 el número de autovalores negativos de A y A0 respectivamente. Si A y A0 son congruentes, entonces
q = q0 .
Demostración. Previa diagonalización de A (Teorema 2.4) podemos escribir
Rn = M+ ⊕ M− ⊕ N, (2.20)
donde M+ /M− es el subespacio generado por los vectores propios asociados a los autovalores positivos/ne-
gativos y N es el núcleo de A. De igual manera, respecto a A0 ,
0 0
R n = M+ ⊕ M− ⊕ N 0. (2.21)
Por construcción tenemos q = dim M− y q 0 = dim M−
0
. Supongamos que q > q 0 . Si dim M+ = p, dim M+
0
= p0
y P denota la matriz de congruencia, entonces
dim P −1 (M− ⊕ N ) + dim M+
0 0
= dim(M− ⊕ N ) + dim M+ = q + p0 + dim N > q 0 + p0 + dim N 0 = n,
por (2.21) ya que N ' N 0 son isomorfos via P (P (N 0 ) = N ). Por tanto, existe w ∈ M+
0
\ {0} tal que
P w ∈ M− ⊕ N . Ası́,
0 < A0 w · w = (P >AP w) · w = A(P w) · (P w)

≤ 0,
↑ ↑
w∈M 0 P w∈M− ⊕N
+
que es una contradicción. Por tanto q ≤ q 0 . De igual forma q 0 ≤ q, de donde q = q 0 . t

u
14
Observación 2.7. Puesto que de (2.20) y (2.21), p + q = p0 + q 0 , también p = p0 .
Definición 2.3. Al entero q en el Teorema 2.5 se le llama ı́ndice de la correspondiente forma cuadrática.
2.2.3. Puntos crı́ticos no degenerados
Un punto crı́tico a ∈ Ω ⊂ Rn de una función f ∈ C 2 (Ω) se dice no degenerado si Hf (a) no es singular,

es decir, si det Hf (a) 6= 0.
Si denotamos por F : Ω → Rn la aplicación F : = ∇f , se sigue que Hf (a) = F 0 (a) es la matriz jacobiana
de F an a. Si a no es degenerado, por el Teorema de la función inversa, F será localmente biyectiva y, por
tanto, a es aislado.
El ı́ndice de un punto crı́tico no degenerado a es el ı́ndice q de la forma cuadrática asociada a Hf (a).
Observación 2.8. Si a no es degenerado y 0 < q < n, existen autovectores ~u± 6= 0 de Hf (a) asociados a
autovalores λ− < 0 < λ+ . Las funciones ϕ~u± (t) = f (a + t~u± ) entonces presentan, en t = 0, un máximo y un
mı́nimo local estricto respectivamente.
En el caso de dos variables (n = 2), los puntos crı́ticos no degenerados sólo pueden ser de tres tipos
dependiendo del signo de los autovalores λ1 , λ2 de Hf (a), a saber:
1. Máximos locales estrictos, si λ1 , λ2 < 0 (q = 2).
2. Mı́nimos locales estrictos, si λ1 , λ2 > 0 (q = 0).
3. Puntos de silla, si λ1 < 0 < λ2 (q = 1).
El origen (0, 0) es crı́tico no degenerado de ı́ndice q = 1 para la función f (x, y) = x2 − y 2 . Obsérverse
que
1 0
Hf (0, 0) = 2 ,
0 −1
y por tanto, ~u+ = ~i y ~u− = ~j con λ± = ±2 (la figura 2.4 muestra su geometrı́a local).
·
·
•
Figura 2.4. Punto de silla z = x2 − y 2
Observación 2.9. La condición suficiente para decidir si un punto crı́tico es máximo o mı́nimo local dada
en la Proposición 2.3 implica que éste no es degenerado. Sin embargo ésta se requiere para una silla.
Por otro lado, la misma geometrı́a local que se presenta en estos puntos crı́ticos puede darse en el caso
degenerado. Por ejemplo, (0, 0) es crı́tico para las funciones f (x, y) = x4 + y 4 y g(x, y) = x4 − y 4 para las
que Hf (0, 0) = Hg(0, 0) = ( 00 00 ) es la matriz nula. Obsérvese que (0, 0) es un mı́nimo para f , máximo para
−f y una silla para g.
2.3. Extremos condicionados. Multiplicadores de Lagrange
2.3.1. La regla del multiplicador
Supongamos que queremos hallar los extremos, máximos o mı́nimos, de una función f : Ω ⊂ Rn → R
condicionados a que g(x) = 0, x ∈ Ω, donde g : Ω ⊂ Rn → R y ∇g(x) 6= 0 si g(x) = 0.
15
Si en a ∈ Ω con g(a) = 0, f tiene un extremo condicionado, para cualquier curva γ : (−ε, ε) → Ω (ε > 0)
tal que g(γ(t)) = 0 y γ(0) = a, la función t ∈ (−ε, ε) → f (γ(t)) debe tener un extremo en t = 0. Como
sabemos, esto implica que
d
∇f (a) · γ 0 (0) = f (γ(t)) = 0,
dt t=0
Ahora observamos que la condición que debe satisfacer el vector γ 0 (0) es ∇g(a) · γ 0 (0) = dt
d

t=0
g(γ(t)) = 0.
Ası́ ∇f (a) debe ser perpendicular al espacio tangente a la “superficie” g = 0 en x = a o, equivalentemente,
paralelo a ∇g(a), esto es, debe existir λ ∈ R tal que ∇f (a) = λ∇g(a) (figura 2.5).
Por tanto, el sistema )
∇f (x) = λ∇g(x)
g(x) = 0
nos proporciona los puntos crı́ticos de f bajo la condición g = 0.
∇g
γ 0 (0)
•
a
∇f γ
g=0
Figura 2.5. Regla del multiplicador
Si en general hubiera más de una condición de ligadura, g1 (x) = g2 (x) = · · · = gd (x) = 0, 1 ≤ d < n (con
∇g1 (x), ∇g2 (x), . . . , ∇gd (x) independientes cuando g1 (x) = g2 (x) = · · · = gd (x) = 0), es decir, g : Ω → Rd
y g(x) = (g1 (x), g2 (x), . . . , gd (x)), el razonamiento anterior nos proporcionarı́a escalares λ1 , λ2 , . . . , λd ∈ R
para los que el sistema )
∇f (x) = λ1 ∇g1 (x) + λ2 ∇g2 (x) + · · · + λd ∇gd (x)
(2.22)
g1 (x) = g2 (x) = · · · = gd (x) = 0
debe ser satisfecho por los puntos crı́ticos en cuestión. Estos escalares se denominan multiplicadores de
Lagrange, y al vector de multiplicadores λ = (λ1 , λ2 , . . . , λd ) se le denomina simplemente multiplicador de
Lagrange.
Observación 2.10. De la primera ecuación en (2.22), cada punto crı́tico tiene asociado un único multiplicador
ya que los vectores ∇g1 , . . . , ∇gd son independientes cuando se evalúan sobre g1 = g2 = · · · = gd = 0.
Esta discusión sugiere introducir la función auxiliar F (x, λ) = f (x) − λ · g(x) = f (x) − λ1 g1 (x) −
λ2 g2 (x) − . . . − λd gd (x), con lo que el sistema (2.22) puede expresarse como ∇(x,λ) F (x, λ) = 0 con x ∈
Rn , λ = (λ1 , λ2 , . . . , λd ) ∈ Rd .
Del sistema anterior encontramos los puntos crı́ticos para el problema de optimización considerado. Si
x0 ∈ Rn tiene asociado el multiplicador λ0 ∈ Rd , particularizamos la función auxiliar F fijando λ = λ0 para
obtener la función de n variables
F0 (x) = f (x) − λ0 · g(x), (2.23)
la cual debemos estudiar en x0 . Si su hessiano resulta definido positivo o negativo, en x0 tendremos un
mı́nimo o un máximo relativo, respectivamente.
1
En caso de que este hessiano no sea definido hemos de estudiar su comportamiento en las direcciones
tangentes a g = 0 en el punto x0 . Esto quiere decir que si elegimos una base ortonormal ~u1 , ~u2 , . . . , ~un−d del
espacio tangente anterior y formamos el hessiano “restringido”

H{g=0} F0 (x0 ) = HF0 (x0 )~ui · ~uj ∈ M(n−d)×(n−d) (R), (2.24)
1≤i,j≤n−d
16
F tendrá en x0 un mı́n . o un máx . local sobre g = 0 si H{g=0} F0 (x0 ) es > 0 ó < 0 respectivamente puesto
que la discusión anterior sigue igual con la matriz restringida atendiendo a la siguiente
Proposición 2.5. Sean F : Ω ⊂ Rn → R de clase C 1 y x0 ∈ Rn . Entonces, si γ : (−ε, ε) → Rn y γ(0) = x0

tenemos
d2

F (γ(t)) = HF (x0 )γ 0 (0) · γ 0 (0),

2
dt t=0

siempre que ∇F (x0 ) = 0.
Demostración. La regla de la cadena nos permite escribir

n
d X ∂F
F (γ(t)) = ∇F (γ(t)) · γ 0 (t) = (γ(t))γk0 (t),
dt ∂xk
k=1
y derivando de nuevo con respecto a t,

n
d2

X d ∂F 0 ∂F 00
F (γ(t)) = (γ(t)) γ k (t) + (γ(t))γ k (t)
dt2 dt ∂xk ∂xk
k=1
n n
∂2F

X X
0 0 ∂F 00
= (γ(t))γj (t) γk (t) + (γ(t))γk (t) .
j=1
∂xj ∂xk ∂xk
k=1
∂F
Haciendo t = 0 y teniendo en cuenta que ∇F (x0 ) = 0 ⇔ ∂xk (x0 ) = 0, k = 1, 2, . . . , n, se tiene
n
d2 ∂2F

X
(x0 )γj0 (0)γk0 (0) = HF (x0 )γ 0 (0) · γ 0 (0).

2
F (γ(t)) = t
u
dt t=0
∂xj ∂xk
j,k=1
Observación 2.11. En el caso que nos ocupa, F = F0 sobre g = 0 y ∇F0 (x0 ) = 0 ya que λ0 es el multiplicador
asociado a x0 (2.22).
Observación 2.12. Puesto que las matrices asociadas a una forma cuadrática en diferentes bases son congruen-
tes, el Teorema 2.5 permite concluir que su carácter de positividad será independiente de la base elegida para
representarla. Por tanto, la base ~u1 , ~u2 , . . . , ~un−d del espacio tangente tras la Observación 2.10 no tiene que
ser necesariamente ortonormal, esto es, cualquier base será suficiente para representar el hessiano restringido
H{g=0} F0 (x0 ) en (2.24).
Una interpretación de los multiplicadores
Consideremos el problema de optimizar f = f (x, y) sujeta a la condición g(x, y) = c. Supongamos que

tenemos una solución x = x(c), y = y(c) para varios valores de c con multiplicador λ = λ(c) que dependen
suavemente de c. Entonces
d ∂f ∂f
f (x(c), y(c)) = (x(x), y(c))x0 (c) + (x(x), y(c))y 0 (c)
dc ∂x ∂y

∂g 0 ∂g 0
= λ(c) (x(x), y(c))x (c) + (x(x), y(c))y (c) = λ(c),
∂x ∂y
puesto que
∂g ∂g d
(x(c), y(c))x0 (c) + (x(x), y(c))y 0 (c) = g(x(c), y(c)) = 1,
∂x ∂y dc
ya que g(x(c), y(c)) = c.
Por tanto:
el valor del multiplicador es igual a la tasa de cambio del valor crı́tico f ∗ (c) = f (x(c), y(c)) cuando
se perturba la condición.
17
Ejemplo 2.4 (Un problema en la granja). Presentamos un ejemplo intuitivo de esta clase de problemas. Su
enunciado es el siguiente:
Ha llegado el momento de ordeñar en una granja, y un granjero se dirige al campo para recoger la
leche del dı́a. Antes de ordeñar debe lavar su cubo en un rı́o cercano.
Justo cuando se encuentra en el punto P (figura 2.6) divisa una vaca en el punto Q. Como el granjero
tiene algo de prisa, quiere encontrar la forma mas rápida de ir al rı́o y luego hasta la vaca. Si el rı́o describe
una curva que satisface la ecuación g(x, y) = 0, ¿cuál es el camino más corto a tomar?
rı́o [g = 0]
M
•
•
Q
• f = cte
P
Figura 2.6. El problema de la granja
En términos matemáticos, el granjero quiere encontrar un punto M en el rı́o tal que dist(P, M ) +
dist(M, Q) sea mı́nima. Ası́, debemos minimizar la función f (M ) = dist(P, M ) + dist(M, Q) sujeta a la
condición g(M ) = 0.
Interpretación geométrica
Vamos a usar la siguiente propiedad de las elipses: para todo punto M en una elipse dada, la suma de
las distancias de M a sus focos es constante.
En nuestro problema, esto significa que el granjero puede llegar a la vaca en el mismo tiempo sobre
una elipse dada: las elipses son las curvas de nivel f = cte.
La figura 2.6 muestra una sucesión de elipses de tamaño creciente con focos en los puntos P y Q que
termina en aquélla que es tangente al rı́o. Aquı́ tangente es la propiedad crucial. En el punto de tangencia
de esta elipse crı́tica, su vector normal es perpendicular a g = 0 y por tanto ∇f (M ) paralelo a ∇g(M ). Este
es precisamente el contenido del apartado 2.3.1.
Ejemplo 2.5. En el plano euclı́deo hallar la mı́nima y máxima distancia del punto (2, 0) a la circunferencia
x2 + y 2 = 1.
En este ejemplo (trivial), la función objetivo es
f (x, y) = dist((x, y), (2, 0))2 = (x − 2)2 + y 2
con la condición g(x, y) = x2 + y 2 − 1 = 0.

Como método directo podemos empezar por parametrizar la circunferencia dada por
)
x = cos θ
0 ≤ θ ≤ 2π.
y = sen θ
Entonces f (θ) = (cos θ − 2)2 + sen 2 θ = 5 − 4cos θ. Derivando respecto a θ obtenemos df /dθ = 4sen θ que
se anula para θ = 0, π. Además d2 f /dθ2 (0) = 4 > 0 y d2 f /dθ2 (π) = −4 < 0 con lo que en θ = 0 habrá un
mı́nimo y en θ = π un máximo (aunque el punto θ = 0 no es interiorpal intervalo [0, 2π], lapfunción objetivo
es 2π periódica). Estos valores corresponden a la distancia mı́nima f (0) = 1 y máxima f (π) = 3.
18
Siguiendo el método de Lagrange consideramos la función auxiliar
F (x, y, λ) = f (x, y) − λg(x, y) = (x − 2)2 + y 2 − λ(x2 + y 2 − 1).
Ası́, los puntos crı́ticos de F los encontramos al resolver el sistema

∂F
∂x = 2[(x − 2) − λx] = 0 


∂F
∂y = 2[y − λy] = 0 .

∂F 2 2
∂λ = −(x + y − 1) = 0

De aquı́ se obtienen los puntos crı́ticos P0 = (1, 0) con λ0 = −1 y P1 = (−1,0) con λ1 = 3. Para estudiar de
qué tipo son, consideramos la función auxiliar F0 (x, y) = F (x, y, λ0 ) para P0 y F1 (x, y) = F (x, y, λ1 ) para
P1 . Consecuentemente
F0 (x, y) = (x − 2)2 + y 2 + (x2 + y 2 − 1) = 2x2 + 2y 2 − 4x + 3.
Como !
40
HF0 (1, 0) = >0
04
es definida positiva encontramos que el punto P0 es un mı́nimo relativo de f condicionado a g = 0. El caso
P1 se trata de igual manera, pero ahora
!
−4 0
HF1 (−1, 0) = <0
0 −4
es definida negativa y por tanto P1 es un máximo local de f sujeta a la condición g = 0.
Ejemplo 2.6. Hallar las dimensiones del rectángulo inscrito en una circunferencia de radio a > 0 para que su
área sea máxima (figura 2.7).
Si denotamos por x e y los semilados del rectángulo que buscamos, el problema se traduce en maximizar
la función A(x, y) = 4xy sujeta a la condición g(x, y) = x2 + y 2 − a2 = 0. Por tanto la función de Lagrange
toma la forma
Φ(x, y, λ) = 4xy − λ(x2 + y 2 − a2 ),
y los puntos crı́ticos deben satisfacer
4y − 2λx = 0 


4x − 2λy = 0 .

2 2 2
x +y = a
√ √ √ √
De aquı́ se sigue que los puntos crı́ticos son (±a/ 2, ±a/ 2) con λ = 2 y (±a/ 2, ∓a/ 2) ambos con
λ = −2 (notemos que el sistema lineal formado por las dos primeras ecuaciones debe, por la tercera, tener
solución no trivial y por tanto su matriz de coeficientes debe ser singular, es decir

−λ 2 2
2 −λ = 0 ⇔ λ = 4 ⇔ λ = ±2.

Ahora, la función auxiliar para λ = 2 es Φ0 (x, y) = 4xy − 2(x2 + y 2 − a2 ) cuyo hessiano es

!
−4 4
HΦ0 (x, y) =
4 −4
y sus autovalores son 0 y −8 independientemente del punto crı́tico considerado. Por tanto, la matriz hessiana
no es definida y debemos estudiar esta matriz restringida a las direcciones tangentes a la circunferencia
x2 + y 2 = a2 en los puntos crı́ticos. La recta tangente en un punto (x0 , y0 ) de esta circunferencia tiene como
ecuación x0 x + y0 y = a2 cuyo vector director es (−y0 , x0 ). Ası́
19
√ !! √ !
√ √ −a/ 2 −a/ 2
HΦ0 (a/ 2, a/ 2) √ · √ = −8a2 < 0 (2.25)
a/ 2 a/ 2
√ √
√ (a/ 2,
y por tanto habrá un máximo local en √a/ 2).
Para el√ √ crı́tico (−a/ 2, −a/ 2) el tratamiento es similar y encontramos otro máximo local.
otro punto
En (a/ 2, −a/ 2) la función auxiliar Φ1 (x, y) = 4xy + 2(x2 + y 2 − a2 )tiene hessiano
!
44
HΦ1 (x, y) = ,
44
cuyos autovalores son 0 y 8 por lo que, de nuevo, se hace necesario estudiar el hessiano restringido. En este
caso, √ !! √ !
√ √ a/ 2 a/ 2
HΦ1 (a/ 2, −a/ 2) √ · √ = 8a2 > 0.
a/ 2 a/ 2
√ √
Ası́ (a/ 2, −a/ 2) es un mı́nimo local. De igual manera se trata el caso restante.
Por último, ambos casos considerados son simétricos y por esta razón tienen la misma naturaleza.
Observamos también que los mı́nimos ‘degenerados’ en (0, ±a) y (±a, 0) no aparecen, ya que en el plantea-
miento del problema hemos considerado la posibilidad de “áreas negativas”. Por la misma razón, estos cuatro
puntos crı́ticos determinan el mismo cuadrado: el área real es |A(x, y)| = 4|x| |y| con lo que los mı́nimos para
A representan máximos geométricos con valor |A|.
(x, y)
•
y a
x
x
Figura 2.7. Rectángulo inscrito en la circunferencia de radio a
Observación 2.13. Otro análisis para el estudio en el caso λ = 2 es el siguiente: los autovectores asociados a
1
la matriz HΦ0 se calculan encontrando las soluciones no triviales del sistema homogéneo

−4x + 4y = 0
4x − 4y = 0
asociados al autovalor 0 y del sistema

−4x + 4y = −8x
4x − 4y = −8y
para el autovalor −8.
Resolviendo encontramos que los autovectores son (1, 1) y (1, −1) asociados a 0 y −8, respectivamente.
Ahora observemos que son perpendiculares entre sı́ y que (1, −1) es tangente a la circunferencia x2 + y 2 = a2
en los puntos crı́ticos asociados a λ = 2. ¡De aquı́ que H{g=0} Φ0 sea definida negativa!
20
Ejercicios
Problema 2.1. (a) Utilizando el desarrollo de Taylor, estimar el error que se comete al aproximar el número
1 1 1 (*)
e por 1 + 1 + 2! + 3! + 4! .
(b) Evaluar aproximadamente e0,1 estimando el error cometido.
(c) ¿Cuál es el grado óptimo (ell más pequeño) del polinomio de Maclaurin que aproxima la función f (x) = ex
en el intervalo [−1, 1] con error menor que 10−4 ?
Problema 2.2. Calcular aproximadamente los siguientes valores usando el polinomio de Taylor de orden
dos para las funcionas apropiadas en los puntos adecuados
(a) sen(0, 3)e−1,05 ,
(b) sen(0, 01) cos 0, 03).
Estimar el error cometido en ambos casos.
Problema 2.3. Determinar la fórmula de Taylor de segundo orden en (0, 0) para las siguientes funciones
(a) f (x, y) = (x + y)2 ,
(b) f (x, y) = 1−x12 −y2 ,
(c) f (x, y) = ex+y ,
2 2
(d) f (x, y) = e−x −y ,
(e) f (x, y) = sen xy + cos xy,
2
(f ) f (x, y) = e(1−x) cos y.
Problema 2.4. Se considera la parábola de ecuación y = 12 − x2 y el triángulo, en el primer cuadrante,
formado por la tangente a dicha curva (figura 2.8). Determinar el punto de tangencia para que el área de
dicho triángulo sea mı́nima.
•(a, 12 − a2 )
y = 12 − x2
a
x
Figura 2.8. Triángulo en el ejercicio 2.4

)
(∗) 1 1 1
Para referencia: 1 + 1 + 2!
+ 3!
+ 4!
= 65/24 ≈ 2, 7083 y e ≈ 2, 71828182 . . .
Problema 2.5. Calcular y clasificar los puntos crı́ticos de las siguientes funciones
(a) f (x, y) = x2 − 2xy + y 2 ,
(b) f (x, y) = log(1 + x2 + y 2 ),
(c) f (x, y) = x5 y + xy + xy 5 ,
(d) f (x, y) = x3 + y 2 − 6xy + 6x + 3y,
(e) f (x, y) = (y − 3x2 )(y − x2 ).
Problema 2.6. El precio de un diamante es proporcional al cuadrado de su peso. Demostrar que si un
diamante se rompe en dos hay pérdida de su valor y que ésta es máxima cuando las dos partes son iguales.
Problema 2.7. Un alambre de longitud ` se corta en dos trozos con los que se forman un cı́rculo y un
cuadrado. Hallar el corte que debe hacerse para que la suma de las áreas sea
(a) máxima,
(b) mı́nima.
Problema 2.8. (a) Probar que el paralelepı́pedo rectangular con área de superficie fija y volumen máximo
es un cubo.
(b) Inscribir en una esfera dada un cono recto de base circular y volumen máximo.
(c) ¿Qué cilindro de volumen dado tiene área lateral mı́nima?
1
Problema 2.9. Encontrar los puntos sobre la gráfica de la función f (x, y) = xy más cercanos al origen.
Problema 2.10. Encontrar los valores máximo y mı́nimo absolutos que alcanzan las siguientes funciones en
el disco unidad cerrado U : x2 + y 2 ≤ 1
(a) f (x, y) = (x4 + y 4 )2 ,
(b) f (x, y) = x5 y + xy + xy 5 .
Problema 2.11. Encontrar los valores máximo y mı́nimo absolutos que alcanzan las siguientes funciones en
los recintos indicados
(a) f (x, y) = sen x + cos y en R = [0, 2π]2 ,
(b) f (x, y) = xy en R = [−1, 1]2 .

Problema 2.12. Encontrar los extremos relativos de f Σ si
(a) f (x, y) = x2 + y 2 y Σ : y = 2,
(b) f (x, y) = x2 + y 2 y Σ : y ≥ 2,
(c) f (x, y) = x2 − y 2 y Σ : y = cos x,
(c) f (x, y, z) = x2 + y 2 + z 2 y Σ : z ≥ 2 + x2 + y 2 .
Problema 2.13. Usar el método de los multiplicadores de Lagrange para encontrar los extremos de las
siguientes funciones baja las restricciones señaladas
(a) f (x, y) = x, si x2 + 2y 2 = 3,
(b) f (x, y) = x − y, si x2 − y 2 = 2,
(c) f (x, y, z) = x − y + z, si x2 + y 2 + z 2 = 12,
(c) f (x, y, z) = x − y + z, si x2 − y 2 = 1 y 2x + z = 1.
Problema 2.14. Probar que la ecuación x2 + y 2 + z 2 + xy + 2z = 3 determina z como función de x e y en
un entorno del punto (0, 0, 1) donde z tiene un máximo local:
(a) considerando z = z(x, y) implı́citamente definida por la ecuación anterior,
(b) utilizando el método de los multiplicadores de Lagrange.
Problema 2.15. Usando el método de los multiplicadores de Lagrange, determinar las dimensiones de un
depósito descubierto con base circular y capacidad 16π m3 que minimicen el coste de material para su
construcción si el precio del m2 de la base es el doble que el de la pared lateral.
22
Problema 2.16. (a) El perı́metro de un triángulo isósceles es 2τ . ¿Cuánto deben medir sus lados para que
el volumen del cono engendrado al girar sobre su altura sea máximo?
(b) Probar que entre todos los triángulos inscritos en una circunferencia, el de mayor perı́metro es el equi-
látero.
Problema 2.17. Usando los multiplicadores

√ de Lagrange, determinar las dimensiones de un rectángulo
inscrito en una circunferencia de radio 2 (figura 2.9) de manera que
(a) el perı́metro sea máximo,
(b) el área sea máxima.
√ 2
• x
Figura 2.9. Rectángulo inscrito en el ejercicio 2.17
Problema 2.18. Utilizar el método de los multiplicadores para calcular la distancia mı́nima entre la circun-
ferencia x2 + y 2 = 1 y la parábola y 2 = 2x + 6 (figura 2.10).
Ayuda: Usar p el hecho que la distancia de un punto (x, y) en la parábola dada a la circunferencia x2 + y 2 = 1
es D(x, y) = x2 + y 2 − 1.
y 2 = 2x + 6
x2 + y 2 = 1
x
Figura 2.10. Circunferencia y parábola en el ejercicio 2.18
Problema 2.19. Sea γ la curva definida por las ecuaciones

2
x + y2 = 1
γ:
x2 − xy + y 2 − z 2 = 1.
Encontrar el(los) punto(s) en γ más cercanos al origen.
23
1
Problema 2.20. Calcular, utilizando el método de Lagrange, los puntos de mayor/menor altura en la elipse
obtenida por la intersección del plano x + y + z = 24 y el paraboloide z = x2 + y 2 .
Problema 2.21. Calcular el volumen de la caja rectangular más grande situada en el primer octante, con
tres caras en los planos coordenados y un vértice sobre el plano Π : x + 2y + 3z = 6 (figura 2.11).
z
Π
y
•
Figura 2.11. Caja en el ejercicio 2.21
24

Ale 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ale 2

Cargado por

Copyright:

Formatos disponibles

Aproximación local.

2.1. Desarrollo de Taylor

2.1.1. Fórmula de Taylor y aplicaciones en una variable

Si P = P (x) es un polinomio de grado ≤ n, es decir, P (x) = a0 + a1 x + a2 x2 + · · · + an xn , P se puede

y por tanto P (k (a) = k!bk , es decir

Aproximación polinómica. Fórmula de Taylor

Dada una función f : I → R definida en un intervalo abierto I ⊂ R y a ∈ I, si existen las derivadas

F 0 (ξ) G(x) − G(c) = G0 (ξ) F (x) − F (c)

Si hacemos t = ξ y sustituimos en (2.2) obtenemos la igualdad en el enunciado. t

f 00 (c) f (n−1 (c)

f 00 (0) 2 f (n−1 (0) n−1

Figura 2.1. Polinomios de Taylor para f (x) = sen x + cos x

Formula de Taylor con resto integral

Demostración. Consideremos la función auxiliar de tres variables

Por hipótesis A es C 1 y por el Teorema fundamental del cálculo

donde θ ∈ (0, 1) puede en principio depender de λ, t y x. Pero,

Corolario 2.1. Si f es continua en [a, b], la función

es la solución general de la correspondiente ecuación homogénea (describen completamente el espacio de

Máximos y mı́nimos relativos

f (x) ∼ Pn (x), cuando x → a (2.6)

es el polinomio de Taylor de f en a de grado n, si Pn 6= 0.

Ejemplo 2.1. Como ejemplos tenemos

2.1.2. El desarrollo de Taylor multidimensional

Ası́, el desarrollo (2.7) se puede reescribir como

La relación anterior también se puede escribir como

es un polinomio homogéneo de grado m en x − a.

Ahora bien, para t ∈ I~v

Ası́, si Mm = sup ||∂ α f ||∞ tenemos

|f~vm (t)| ≤ Mm nm |~v |m = Mm nm ,

y ~v es unitario. Por consiguiente,

2.1.3. Series de Taylor

que llamaremos serie de Taylor de f en a.

Ejemplo 2.2. Para la función  2

f es C ∞ en toda la recta real y f (k (0) = 0 para k = 0, 1, 2, . . .

con convergencia uniforme en intervalos acotados [−r, r] para todo r > 0.

también uniformemente en [−r, r], r > 0.

por (2.15) y (2.16).

Figura 2.2. Representación geométrica de la fórmula de Euler

2.2. Máximos y mı́nimos relativos 1

Al igual que en el caso unidimensional tenemos

Proposición 2.3. Si f : Ω → R es de clase C 2 en un entorno de un punto crı́tico a ∈ Ω entonces, a es un

Figura 2.3. Posición de las rectas y = mx respecto al conjunto D : |y − 2x2 | ≤ x2

2.2.1. Matrices definidas

y sea S1 la esfera unidad en Rn , S1 : = {~u / |~u| = 1}. Sean

|~v1 |2 = L~u1 − λ~u1 · ~v1 = L~u1 · ~v1 − λ~u1 · ~v1 = 

Puesto que L − λI es singular si λ es un autovalor de L, det(A − λI) = 0. Al polinomio p(λ) =

Observemos que la condición (ii) implica que ak 6= 0 para k = 0, 1, 2, . . . , n.

Corolario 2.3. Una matriz real simétrica A es,

Ejemplo 2.3. Para la función f (x, y) = x2 + y 2 + exy tenemos

con lo que el punto (0, 0) es crı́tico.

2.2.2. Índice de formas cuadráticas

que es una contradicción. Por tanto q ≤ q 0 . De igual forma q 0 ≤ q, de donde q = q 0 . t

Observación 2.7. Puesto que de (2.20) y (2.21), p + q = p0 + q 0 , también p = p0 .

2.2.3. Puntos crı́ticos no degenerados

Un punto crı́tico a ∈ Ω ⊂ Rn de una función f ∈ C 2 (Ω) se dice no degenerado si Hf (a) no es singular,

Figura 2.4. Punto de silla z = x2 − y 2

2.3. Extremos condicionados. Multiplicadores de Lagrange

2.3.1. La regla del multiplicador

Figura 2.5. Regla del multiplicador

Proposición 2.5. Sean F : Ω ⊂ Rn → R de clase C 1 y x0 ∈ Rn . Entonces, si γ : (−ε, ε) → Rn y γ(0) = x0

siempre que ∇F (x0 ) = 0.

Demostración. La regla de la cadena nos permite escribir

y derivando de nuevo con respecto a t,

Ejemplo 2.2. Para la función 2

|~v1 |2 = L~u1 − λ~u1 · ~v1 = L~u1 · ~v1 − λ~u1 · ~v1 =

asociados al autovalor 0 y del sistema