Está en la página 1de 96

' $

Curso de Optimización Estática II

Banco de Guatemala

Abril 2013
Elvio Accinelli
Universidad Autónoma de San Luis Postosı́. México.

E-mail: elvio.accinelli@eco.uaslp.mx

& %
1
' $

1 Funciones de varias variables.

1.1 El espacio vectorial Rn .


Rn es el producto cartesiano de n factores iguales a R.
• Los puntos de Rn son las listas de n−números reales (o
vectores) de la forma x = (x1 , ..., xn )
• Rn es un espacio vectorial n−dimensional en el que definimos
– la suma de x e y elementos de Rn como
x + y = (x1 + y1 , ..., xn + yn )

– el producto de α ∈ R por x ∈ Rn como


αx = (αx1 , ..., αxn ).

• Para n = 1 tenemos R la recta; para n = 2, R2 representa el


plano y n = 3, R3 el espacio habitual.
& %
2
' $

En Rn un conjunto particularmente importante de vectores es la


base canónica
Cn = {e1 , ..., en } .
Donde ei = (0, ..., 0, 1, 0, ....) i = 1, ..., n son vectores con todas sus
coordenadas iguales a cero con excepción de la i−ésima que vale 1.
Dado x = (x1 , ..., xn ) se tiene que x = x1 e1 + ... + xn en .
Ejercicio 1 Demuestre que Cn forma una base para Rn , esto es que
es un conjunto de vectores linealmente independiente y generador.

& %
3
' $

1.2 Transformaciones lineales

Decimos que una aplicación L : Rn → Rm es lineal cuando se


verifica que:
1. Es una función con dominio en Rn y recorrido en Rm .
2. L(x + y) = L(x) + L(y) ∀ x, y ∈ Rn
3. L(αx) = αL(x) ∀α ∈ R, x ∈ Rn .
4. Ejemplo: La matrices Mnm representan transformaciones
lineales en Rm → Rn .

& %
4
' $

Un caso sencillo de aplicación lineal es el de los funcionales lineales:


L : Rn → R es decir, aplicaciones lineales de Rn → R.
El conjunto de las aplicaciones lineales sobre un espacio vectorial
forma a su vez un espacio vectorial, llamado espacio dual.
Todo funcional lineal f : Rn → R Queda caractrerizado por los
valores que toma en la base canónica. En efcto:
n
X
f (x) = f (x1 e1 + ...xn en ) = xi f (ei ).
i=1

& %
5
' $

Ejercicio 2 Considere el conjunto de las matrices cuadradas de


orden n simbolizado por Mn×n con las operaciones habituales.
1. Demostrar que forma un espacio vectorial.
2. Encontrar una base para dicho espacio.
3. Demostrar que toda transformaci´n lineal L : Rn → Rm puede
ser represantado por una matriz en Mm×n .
Ejercicio 3 Demostrar que el el espacio dual de Rn , con las
operaciones puntuales, es un espacio vectorial.

& %
6
' $

Nótese que el conjunto de aplicaciones lienales π = (π1 , ...πn ) tales


que 
 0 i 6= j
πi (ej ) =
 1 i=j

forman una base en el espacio de los funcionales lineales en Rn .


Cada elemento de este conjunto es la proyección de Rn sobre sus
ejes, en efecto πi (x) = xi π(ei ) = xi . Obsérvese que todo funcional
f : Rn → R puede escribirse como
n
X
f= f (ei )πi
i=1
Pn Pn
pues f (x) = i=1 f (ei )πi (x) = i=1 xi f (ei )

& %
7
' $

1.3 El producto escalar

Llamamos producto escalar euclideano de Rn a la operación


P : Rn × Rn → R definda como
n
X
P (x, y) = xy = xi yi = hx, yi.
i=1

Para cada x fijo P (x, ·) : Rn → R es un funciomal lineal.


Ejercicio 4 Muestre que el producto interno de dos vectores, puede
ser cero, sin necesidad de que ninguno de los factores sea el vector
nulo.
• Cuando esto sucede decimos que los vectores son ortogonales.

& %
8
' $

Una aplicación impotante es la definida por N : Rn → R tal que


v
u n
p uX
N (x) = |x| = P (x, x) = t x2i
i=1

a la que llamaremos norma del vector x


Teorema 5 Desiguldad de Cauchy Schwarz Para cualquier
x, y ∈ Rn se tiene que |xy| ≤ |x||y|. La igualdad vale si y solamente
se uno de los vectores x e y es múltiplo escalar del otro.

& %
9
' $

La demostración es obvia para y = 0. Para el caso y 6= 0 la


afirmación del teorema sigue de ser:

hx + αy, x + αyi = α2 |y|2 + 2αhx, yi + |x|2 > 0 ∀α ∈ R.

Decimos que dos vectores x, y ∈ Rn son ortogonales si xy = 0.


Nótese que del hecho de que xy = 0 no se deduce que
necesariamente deba ser x = 0 o y = 0.
Ejemplo: Los elementos de la base canónica son ortogonales dos a
dos.

& %
10
' $
1.4 Nociones geométricas básicas
• La distancia entre dos elementos de x, y ∈ Rn queda definida
p
por d(x, y) = |x − y| = (x1 − y1 )2 + ... + (xn − yn )2
p
n
• Definimos la norma de x ∈ R como x = x21 + ... + x2n
representa la longitud de x.
Definición 6 Llamamos bola abierta de centro a ∈ Rn y radio
r ∈ R+ al conjunto:

B(a, r) = {x ∈ Rn : |x − a| < r} .

• Bola cerrada B[a, r] = {x ∈ Rn : |x − a| ≤ r} .


• Esfera S[a, r] = {x ∈ Rn : |x − a| = r} .
Para el caso n = 1 respectivamente tenemos,
el intervalo abierto (a − r, a + r), el intervalo cerrado [a − r, a + r],
y los extremos del intervalo: {a − r, a + r} .
& %
11
' $

Algunos elementos de la geometrı́a del plano y del espacio.


• Representación en el plano de un vector, módulo, dirección y
sentido.
• Suma geométrica de vectores
• Rectas en el palno y en el espacio. X = P + t~v .
• El cı́rculo trigonométrico.
• La circunferencia y la esfera. Generalizaciones.

& %
12
' $

2 Sucesiones y subconjuntos de Rn
Definición 7 Una sucesión en Rn es una función x : N → Rn .
Es decir que para cada k ∈ N, x(k) = xk ∈ Rn por lo que
xk = (x1k , ..., xnk ).
• La sucesión {xk }k∈N en Rn converge a a ∈ Rn si y solamente si
limk→∞ |xk − ak | → 0.
• Decimos que x ∈ Rn es punto de acumulación de A ⊂ Rn si y
solamente si, para toda bola abierta de centro en x y radio
r > 0 arbitrario, existe a 6= x tal que a ∈ A ∩ B(x, r).
Equivalentemente, si y solamente si, existe una sucesion
{ak }k∈N de elementos de A, tales que ak 6= x y que ak → x.

& %
13
' $

• Decimos que un subcomnjunto A ⊂ Rn es acotado, si y


solamente si existe r > 0 tal que A ⊂ B(0, r).
• Decimos que x ∈ A es del interior de A si y solamente si existe
δ > 0 tal que B(x, δ) ⊂ A.
• Decimos que un subconjunto A ⊂ Rn es abierto si y solamente
si todo punto de A es del interior, es decir si y solamente si
A = int(A).
• Equivalentemente, si todo punto es del interior.

& %
14
' $

• La definición de subconjuntos cerrados es análoga a la de R.


• Podemos generalizar el concepto de subconjunto compacto en
Rn cambiando intervalos abiertos por bolas abiertas cuando
fuera necesario.
En Rn sigue siendo válido que un conjunto es compacto si y
solamente si es acotado y cerrado. Este es el teorema de
Borel-Lebesgue.
Las propiedades de los subconjuntos, abiertos y cerrados son
análogas a las comprobadas en R.

& %
15
' $

Un concepto importante en Rn es el de subconjunto convexo.


Definición 8 Decimos que X ⊂ Rn es convexo si y solamente si
cada vez que x, y ∈ X entonces c = αx + βy ∈ X para todo α y β
no negativos tales que α + β = 1.
Entendemos por combinación convexa de los elementos x1 , ..., xl el
Pl
vector x = t1 x1 + ... + tl xl donde i=1 ti = 1 siendo
ti ≥ 0, ∀ i = 1, .., l.
La siguiente definición de conjunto convexo es equivalente a la
anterior:
Definición 9 Decimos que X ⊂ Rn es convexo si y toda
combinación convexa de elementos de X pertenence a X.

& %
16
' $
Aplicación: Consideremos una economı́a con l bienes.
• El conjunto de consumo X ⊂ Rl generalemnte es R+
l

• Una cesta de consumo, es un vector x = (x1 , ..., xl ).


• Se define la restricción presupuestaria como el subconjnto de Rl
B(p, I) = {x ∈ X : px ≤ I} .
– El vector p = (p1 , ..., pl ) es un sistema de precios unitarios.
– El número px = p1 x1 + ... + pl xl es el valor de la cesta x.
– Un sistema de precios es un elemento del espacio dual a Rl .
– I representa el ingreso del consumidor.
• Si pi > 0 ∀i = 1, .., l, B(p, I) es acotado y cerrado, por lo tanto
compacto.
• Si algún pi = 0 entonces B(p, I) no es acotado.
• B(p, I) es convexo.
& %
17
' $

Ejercicio 10 Muestre que si un consumidor tiene una utilidad del


tipo Cobb-Douglas, entonces sus preferencias son convexas, es decir
el conjunto I x = {y ∈ R+
2
: y º x} es convexo.
Ejercicio 11 Considere una economı́a con dos bienes.
1. Muestre que si las preferencias de un agente, cuyas dotaciones
iniciales son (w1 , w2 ), son localmente no saciables y
estrictamente convexas, esto es

αx + (1 − α)y  min{x, y}

y si los precios de los bienes son estrictaemnte positivos,


entonces existe la demanda y esta se alcanza en la frontera de
la restricción presupuestaria.
2. ¿Concluirı́a lo mismo para el caso en el que uno de los precios
fuera cero?
& %
18
' $

3 Lı́mite y continuidad de aplicaciones


Sea f : X → Rm una aplicación de X ⊂ Rn en Rm . Análogamente
a lo hecho en R, diremos que L ∈ Rm es el lı́mite de f (x) cuando
x ∈ X converge a a ∈ Rn ∩ X̄, si y solamente si, para todo ² > 0
existe δ(², a) > 0 tal que

|f (x) − L| < ², ∀x ∈ X : |x − a| < δ.

Es decir, si para todo ² > 0 ∃ δ > 0 : ∀ x ∈ B(a, δ) se tiene que:


f (x) ∈ B(L, ²), equivalentemente si: f ((a, δ))ir ⊂ B(L, ²).

& %
19
' $

Definición 12 Diremos que la aplicación es continua en a ∈ X si:

∀² > 0, ∃δ > 0 : ∀ x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| < ².

Por lo que f : X → R es continua en a ∈ X si y solamente si


L = f (a), es decir el valor funcional y el lı́mite en el punto a
coinciden.
• NOTA: Observe que la definición de lı́mite no requiere que el
punto en el cual se estudia su existencias sea del dominio, basta
con que sea un punto de acumulación del dominio.
• No obstante el estudio de la continuidad en un punto, tiene
sentido si y solamente si el punto es del dominio.
• Es posible continuizar una funcón en un punto en el que no
está definida, si el lı́mite en el punto existe.

& %
20
' $

Ejemplo Sea f : R2 → R definida como



 x21 x22 (x , x ) 6= (0, 0)
x1 +x2 1 2
f (x1 , x2 ) =
 0 (x1 , x2 ) = (0, 0)

Si bien la función está definida en (0, 0) no existe el lı́mite en (0, 0).


Basta para convencerse de ello considerar x2 = kx1 para x1 → 0 se
tiene que (x1 , x2 ) = (x1 , kx1 ) → (0, 0) cuando x1 → 0.

& %
21
' $

• NOTA: La diferencia en los lı́mites según las direcciones


x2 = kx1 es suficiente para decir que el lı́mite no existe.
• No obstante del hecho de que limx1 →0 f (x1 , kx1 ) = b no se
puede inferir ni que el lı́mite exista. Ciertemnte si existe deberá
ser igual a b.
x3 y
• Considere el lim(x,y)→(0,0) x6 +y2 .
Comprobará que:
limx→0 f (x, kx) = 0 mientras que limx→0 f (x, x3 ) = 12 .

& %
22
' $

4 Funciones reales de n−variables


Discutiremos el caso de funciones con dominio X ⊂ Rn que toman
valores reales, es decir f : X → R.
El teorema de Weierstrass sobre funciones continuas definidos en
compactos puede generalizarse a Rn .
Definición 13 Dada una función f : U → R llamamos superficie
de nivel al subconjunto de Rn definido como:
Sc = {x ∈ U : f (x) = c}
Se sigue que Sc = f −1 (c).
Ejemplo: Sea f : R3 → R definida por f (x, y, z) = x2 + y 2 + z 2 . Las

superficies de nivel son las esferas de centro en el origen y radio c
descritas por las ecuaciones
x2 + y 2 + z 2 = c
& %
23
' $

Aplicación: Consideremos una economı́a con l−bienes.


• Una cesta de bienes es un vector x ∈ Rl .
• Las funciones de utilidad estarán definidas sobre cestas en el
l
espacio de consumo, generalmente R+ . Es decir una función de
l
utilidad es una apliación u : R+ →R
• Las superficies de nivel correspondientes a u(x1 , ..., xl ) = c se
denominan conjuntos de isopreferencia. Representan cestas
diferentes pero que son indiferentes para el consunmidor.

& %
24
' $

• La restricción presupuestaria del agente económico es el


subconjunto de Rl representado por
© l
ª
B(p, I) = x ∈ R : px ≤ I

• p ∈ Rl es el vector que representa los precios unitarios de cada


uno de los bienes.
• px es el valor de la cesta x, es decir: px = p1 x1 + ... + pl xl
• I es el ingreso del agente.
El problema del consumidor es el de maximizar sus preferencias en
la restricción presupuestaria.

& %
25
' $

• Si p >> 0 entonces B(p, I) es un conjunto acotado y cerrado de


Rl . Por lo tanto compacto.
• Luego si las preferencias se representan por una función de
utilidad u : X → R continua, el consumidor consigue
maximizar su utilidad en B(p, I).
• En deste caso problema del consumidor tiene solución, pues
siendo B(p, I) ⊂ Rn compacto, por el teorema de Weierstrass,
u alcanza su máximo en este conjunto.
• El problema del consumidor puede no tener solución si algún
pi = 0.

& %
26
' $
• La cesta que maximiza la función de utilidad en la restricción
presupuestaria es la demanda del consumidor, x(p, I) ∈ Rl .
• En el caso de ser algún pi = 0 la demanda puede no existir.
• La demanda agregada esta definido por la suma de las
demandas dindividuales, d(p) = x1 (p) + .. + xn (p) donde
xi (p) ∈ R+
l
representa la demanda del agente i a precios p.
• Las dotaciones iniciales wi = (w1i , ..., wli ) ∈ Rl representan lo
que incialmente cada consumidor dispone, en este caso
elingreso del agnete i será I i = pwi .
• Asignación factible es una distribución de cestas de consumo
Pn Pn
x = (x1 , ...; xn ) ∈ Rln tal que i=1 xi ≤ i=1 wi .
• El exceso de demada es el vector z(p) = d(q) − W ∈ Rl siendo
Pn
W = i=1 wi .
• Decimos que p es un precio de equilibrio si z(p) = 0.
& %
27
' $

4.1 Derivadas parciales

Definición 14 Sea f : U → R una función real definida en un


subconjunto U abierto de Rn . Dado un punto a ∈ U definmos
i−ésima derivada parcial de f en a al lı́mite, (si existe):
∂f f (a + hei ) − f (a)
(a) = lim
∂xi h→0 h

Cuando U ⊂ R2 la función f : U → R se dice real de dos variables.


Se es escribe z = f (x, y) para indicar el valor que toma f en el
punto (x, y) ∈ U. La derivda parcial según x en (a, b) ∈ X es
∂f f (a + h, b) − f (a, b)
(a, b) = lim
∂x h→0 h

& %
28
' $

NOTA: A diferencia de lo que sucede en el caso de funciones reales


de variable real, la existencia de las derivadas de f : X → R en un
punto a ∈ X, no permite concluir nada sobre la continuidad de la
función en a.
• Como veremos más adelante, la diferenciabilidad de la función
en un punto si implica la continuidad en el punto. Para
funciones definidas en subconjuntos de Rn la diferencial juega
el papal de la derivada en el caso de una variable real.

& %
29
' $
Ejemplo: Consideremos la función f : R2 → R definida como
f (x, y) = xy/(x2 + y 2 ) si (x, y) 6= (0, 0) y f (0, 0) = 0.
• Notemos que la función no tiene lı́mite en (0, 0). Para esto
consideremos y = kx se sigue que si x 6= 0 entonces
f (x, kx) = kx2 /(x2 + k 2 x2 ) tomando ahora el lı́mite x → 0
k
llegamos que limx→0 f (x, kx) = 1+k 2 es decir que depende del

camino seguido para llegar a cero, por lo que no existe ningún


L al que se acerque la función cuando (x, y) → (0, 0).
• Por lo tanto la función no es continua.
• Veamos que sin embargo existen las derivadas parciales en
(0, 0) :
∂f f (h, 0) − f (0, 0)
(0, 0) = lim =0y
∂x h→0 h
∂f f (0, h) − f (0, 0)
(0, 0) = lim = 0.
∂y h→0 h
& %
30
' $
Aplicación: Considere una economı́a con dos bienes l = 2. Suponga
un agente con una función de utilidad u : R2 → R representada por
1 1
u(x, y) = x 2 y 3 y un ingreso I = 15. Verifique que:
1. u(x, y) es continua en R2 .
2. Dibuje las curvas de isopreferencias.
3. Sea p1 = 1 y p2 = 2.
2
(a) B(p, I) ⊂ R+ es compacto y convexo.
(b) Existe x(p, I) demanda del consumidor.
(c) La demanda verifica que px(p, I) = I. (Ley de Walras).
4. Sea p1 = 0 y p2 = 2.
2
(a) B(P, I) ⊂ R+ no es ni abierto ni cerrado, tampoco es
acotado, pero es convexo.
(b) Verifique que en este caso no existe la demanda.
& %
31
' $
Derivadas direccionales
Definición 15 Sea f : U → R definida en U abierto en Rn . Sea
a ∈ U y v ∈ Rn . Definimos derivada direccional de f en a en la
dirección de v al lı́mite:
∂f f (a + tv) − f (a)
(a) = lim
∂v t→0 t
cuando el lı́mite existe.
∂f ∂f
• Obsérvese que ∂ei (a) = ∂xi (a).

• No se consideró en la definición de ∂f /∂v que kvk = 1.


Considerando a v arbitrario, resulta, siempre que f sea
diferenciable en a, que Lf (a) (v) = ∂f
∂v (a) es una función lineal
en v :
∂f ∂f ∂f ∂f ∂f
(a) = α (a); (a) = (a) + (a).
∂(αv) ∂v ∂(v + w) ∂v ∂w
& %
32
' $

Ejemplo: Caso n = 2. Sea a = (a1 , a2 ) y v = (α, β)


∂f f (a1 + tα, a2 + tβ) − f (a1 , a2 )
(a) = lim
∂v t→0 t
Sea f (x, y) = xy, a = (0, 0), v = (1, 2). Entonces
∂f f (tα, tβ) − f (0, 0) t2 αβ
(0) = lim = lim = lim tαβ = 0.
∂v t→0 t t→0 t t→0

& %
33
' $

Sea f : U → R definida en el abierto U ⊂ Rn Llamaremos gradiente


de f en a ∈ U al vector
µ ¶
∂f ∂f
grad[f (a)] = (a), ...., (a)
∂x1 ∂xn
Algunas propiedades del gradiente
1. Puede demostrarse que si f es diferenciable en a entonces:
∂f
∂v (a) = grad[f (a)]v. (La definición de diferenciabilidad sera
considerada más adelante.)
2. Diremos que un punto a ∈ U es un punto crı́tico de f si el
gradiente de f en a es el vector nulo.
3. Si f es derivable en U abierto entonces, un punto de máximo o
mı́nimo relativo de f es necesariamente un punto crı́tico.

& %
34
' $

5 Funciones diferenciables
Dada f : U → R, con U ⊂ Rn decimos que f es diferenciable en
a ∈ U cuando existe una transformación lineal L : Rn → R tal que
para todo vector v puede escribirse:
r(v)
f (a + v) − f (a) = L(a)v + r(v), donde lim = 0.
v→0 |v|

∂f
Vemos que para v = tei se sigue que L(a)ei = ∂xi (a).
n
Por lo que diremos que f : U → R, con U ⊂ R decimos que f es
diferenciable en a ∈ U cuando existen las derivadas parciales y
además para todo vector v = (α1 , ..., αn ) tal que a + v ∈ U puede
escribirse:
Xn
∂f r(v)
f (a + v) − f (a) = (a)αi + r(v), donde lim = 0.
i=1
∂x i v→0 |v|

& %
35
' $

Sea πi (x) = xi la proyección de Rn en el i−ésimo eje coordenado.


Definimos la transformación lineal dxi = pii : Rn → R definida por
dxi (v) = αi donde v = (α1 , ..., αn ). Esto nos permite escrivir en el
caso en que el diferencial de f en a exista:
Xn
∂f
df (a)v = (a)dxi v.
i=1
∂xi

Llamaremos diferencial de f en a a la transformación lineal


df (a) : Rn → R y simbolizada por
Xn
∂f
df (a) = (a)dxi
i=1
∂xi
Pn ∂f
definida en v = (α1 , ..., αn ) por df (a)v = i=1 ∂xi (a)αi .

& %
36
' $
Nótese que el concepto de diferencial para funciones en Rn n ≥ 1 es
el análogo al concepto de derivada para funciones reales de variable
real. Ejemplos:
• Toda función diferenciable en a es continua en a.
• a es punto crı́tico de f si y solamente si df (a)v = 0 para todo
v ∈ Rn .
• La existencia de todas las derivadas parciales de f en a por si
sola no garantiza la diferenciabilidad de f en a.
• No obstante, es suficiente para que exista la diferencial en un
punto, que todas las derivadas en el punto sean continuas.
Ejemplo: Sea f : R2 → R, f (x, y) = xy/(x2 + y 2 ), f (0, 0) = 0.
Existen todas las derivadas parciales en (0, 0) sin embargo f no es
diferenciable en cero, lo que se sigue del hecho de que el
r(v)
p 2
limv→0 |v| = limv→0 xy/( (x + y 2 ))3 , no existe.
& %
37
' $
Pn ∂f (a)
Formalmente la diferencial es: df (a) = i=1 ∂xi dxi .

• La existencia de la diferencial, supone algo más que existencia


de las derivadas.
• Supongamos que es lı́cita la composición f (λ(t)) para
λ : R → Rn y f : Rn → R
• La regla de la cadena, permite: dividir ”formalmente” a ambos
miembros por dt y escribir para a0 = λ(t0 ) :
n
df (λ(t0 )) X ∂f (a0 ) dxi (t0 )
= = df (a0 )(λ0 (t0 ).
dt i=1
∂xi dt

• Sea c = f (a), si df (a)λ0 (t) = 0 y a no es punto crı́tico de f,


entonces λ0 (t0 ) es ortogonal al grad f (a0 ), como veremos
equivale a decir que λ0 (t0 ) pertenece al plano tangente a la
superficie f −1 (c) en a.
& %
38
' $
Nota sobre al regla de la cadena:
Teorema 16 Supongamos que f : X → R y g : Y → R son
funciones derivables en X ⊂ R e Y ⊂ R y tales que la
composiciónde gof está bien definida. Sea a ∈ X y b = g(a).
Entonces
(gof )0 (a) = g 0 (f (a))f 0 (a).

Demostración:
• Por definición de derivada, sabemos que
f (a + h) − f (a) = f 0 (a)h + ²(h) verificándose que

lim ²(h) = 0.
h→0

• Lo que se verigica pues


¯ ¯ ¯ ¯
¯ f (a + h) − f (a) ¯ ¯ ²(h) ¯¯
¯ 0 ¯ ¯
− f (a)¯ = ¯ → 0 si h → 0.
¯ h h ¯

& %
39
' $

g(f (a+h))−g(f (a))


Queremos calcular limh→0 h .
• Sea kh = f 0 (a)h + ²(h) ⇒ f (g(a + h)) = f (g(a) + kh ).
• Sustituyendo tenemos que
g(f (a+h))−g(f (a)) = g(f (a)+kh )−g(f (a)) = g 0 (f (a)kh +η(kh )
con limkh →0 η(kh ) = 0.
• Tenemos entonces que

g(f (a + h)) − g(f (a)) = g 0 (f (a))[f 0 (a)h + ²(h))] + η(kh )


g(f (a+h))−g(f (a))
• h = g 0 (f (a))f 0 (a) + g 0 (f (a)) ²(h)
h +
η(kh )
h .

• Luego toman do lı́mites para h → 0 en la expresión anterior,


tenemos el resultado deseado.

& %
40
' $

Como extension de la regla anterior tenemos que:


n
X ∂f dxi
d
f (x1 (t), x2 (t), ..., xn (t)) = .
dt i=1
∂x i dt

Demostración para n = 2. Se generaliza inmediatamente.


• Sea φ(h) = f (x(t + h), y(t + h)).
• Por el teorema del valor: φ(h) − φ(0) = φ(hc )h hc ∈ (h, 1).
• Luego: f (x(t + h), y(t + h)) − f (x(t), y(t)) =
∂f
= ∂x (x(t + hc ), y(t + hc ))(x(t + hc ) − x(t)]+
+ ∂f
∂y (x(t), y(t + hc ))[y(t + hc ) − y(t)]

• Dividiendo entre h y luego tomando lı́mites para h tendiendo a


cero, obtenemos la conclusión.

& %
41
' $

Gradiente de funciones diferenciables


Las siguientes tres propiedades merecen un comentario adicional.
1. El gradiente apunta en la dirección en la cual f crece.
2. Entre todas las direcciones en que f crece, el gradiente tiene la
dirección de crecimiento más rápido.
3. El gradiente de f en un punto a es perpendicular a la superficie
de nivel que pasa por a.
∂f
La afirmación (1) se sigue de considerar ∂w (a) para w = grad[f (a)]
pues:
∂f ∂f
(a) = (a) = grad[f (a)]w = |grad[f (a)]|2 > 0.
∂grad[f (a)] ∂w

& %
42
' $

Demostración de la afirmación (2). Consideremos


v ∈ Rn : |v| = |grad[f (a)]|, y tal que apunte en la dirección de los
niveles crecientes. Utilizando la definición de derivada direccional y
la desigualdad de Cauchy Schwartz :

∂f
(a) = grad[f (a)]v ≤ |grad[f (a)]||v| =
∂v
2 ∂f
= |grad[f (a)]| = (a).
∂grad[f (a)]

La afirmación (3) se sigue de considerar λ : R → Rn un camino


derivable tal que λ(0) = a y tal que λ(t) ∈ f −1 (c). A partir de la
igualdad f (λ(t)) = c, derivando con respecto a t se tiene la
afirmación.

& %
43
' $

Aplicación: Sea u : R2 → R y la curva de nivel correspondiente a


u(x1 , x2 ) = c. Supongamos que u0x2 (a1 , a2 ) 6= 0. Supongamos que la
curva de nivel puede representarse por la función x2 = f (x1 ). A lo
largo de la curva de nivel tendremos entonces que:

φ(x1 ) = u(x1 , f (x1 )) ≡ c.

es decir una función constante, sea a ∈ u−1 (c) es decir que


a = (a1 , f (a1 ))

0 ∂u dx1 ∂u dx2 (a1 )


φ (a1 ) = (a) + (a) = 0.
∂x1 dx1 ∂x2 dx1

& %
44
' $

Nótese que:
³ ´
dx2 (a1 )
• hgradu(a)vi = 0 siendo v = 1, dx1 .

• Habremos obtenido que:


∂u(a)
dx2 ∂x1
(a1 ) = − ∂u(a)
.
dx1
∂x2

Ejercicio: Obtenga los resutados anteriores para el caso en que


1 1
u(x1 , x2 ) = x1 x2 , y c = 32.
2 3

& %
45
' $
Teorema 17 Si una función f : U → R posee derivadas parciales
continuas en todos los puntos de U entonces, es diferenciable en
cada c ∈ U.
Demostración: Haremos la demostración par el caso n = 2. Sea
r(v) = r(v1 , v2 ) = f (a1 + v1 , a2 + v2 ) − f (a1 , a2 ) − ∂f
∂x v 1 − ∂f
∂y v1 .

r(v) = r(v1 , v2 ) = [f (a1 + v1 , a2 + v2 ) − f (a1 , a2 + v2 )]+


∂f ∂f
+[f (a1 , a2 + v2 ) − f (a1 , a2 )] − ∂x v1 − ∂y v2 .

Por el teo. del valor medio para una variable, existen θi ∈ [0, 1] :
h i
√r(v) = ∂f
∂x (a 1 + θ1 v 1 , a 2 + v 2 ) − ∂f √ v1
∂x +
v12 +v22 v12 +v22
h i
∂f ∂f √ v2
+ ∂y (a1 + v1 , a2 + θ2 v2 ) − ∂y 2 2
.
v1 +v2
vi
Por la continuidad de las derivadas y como √ ,i = 1, 2, están
v12 +v22
r(v)
acotadas por 1 en valor absoluto, se sigue que: lim|v|→0 |v| = 0.•
& %
46
' $

P
Ejemplo: Todo polinomio de la forma P (x) = i ai1 ...in xi11 ...xinn es
una función continua con derivadas continuas, por lo tanto es una
función diferenciable en todo Rn .
Fácilmente pueden verificarse las siguientes igualdades, para
f, g : U → R, U ⊂ Rn funciones diferenciables:
1. f + g es diferenciable en U y d(f + g) = df + dg
2. f g es diferenciables en U y d(f g) = f (dg) + g(dg)
g(df )−f (dg)
3. Si g(x) 6= 0, ∀x ∈ U entonces d(f /g) = g2 .

& %
47
' $
Derivadas de órden superior Sea f : U → R diferenciable en el
abierto U ⊂ Rn , en este caso para N = 1, 2, .., n exiten las
derivadas parciales de segundo orden:
µ ¶
∂ ∂f ∂2f
(a) = (a) = fxj xi (a).
∂xj ∂xi ∂xj ∂xi
Teorema 18 (de Schwarz) Sea f : U → T tiene sus derivadas
segundas cruzadas continuas en c ∈ U se tiene que:
∂2f ∂2f
(c) = (c).
∂xj ∂xi ∂xi ∂xj

De la misma manera que se definieron las derivadas parciales


segundas, pueden definirse derivadas parciales de orden superior:
∂kf
∂xi11 xi22 ...xinn
Pn
∀n−upla (i1 , ..., in ) con ij ≥ 0, ∀j : j=1 ij = k.
& %
48
' $

Demostración del teorema de Schwartz: Definamos las funciones:

F (t) = f (x0 + t, y0 + s) − f (x0 + t, y0 )

G(s) = f (x0 + t, y0 + s) − f (x0 , y0 + s)

Obtenemos
• F (t)−F (0) = F 0 (ξi )t)) = [fx (x0 +ξ1 , y0 +s)−fx (x0 +ξ1 , y0 )]t =

= fyx (x0 + ξ1 , y0 + σ1 )ts.

• G(s) − G(0) = G0 (ξ2 )s = [fy (x0 + t, y0 + ξ2 ) − fy (x0 , y0 + ξ2 )]s =

= fxy (x0 + ξ2 , y0 + ξ2 )ts.

• A partir de la igualdad F (t) − F (0) = G(t) − G(0) y tomando


lı́mites para s → 0 y t → 0 llegamos a la conclusión.
& %
49
' $

EJEMPLO: Considere la función


xy(x2 − y 2 )
f (x, y) = , (x, y) 6= (0, 0), f (0, 0) = 0.
x2 + y 2
∂2f ∂2f
Muestre que en (0, 0) ∂x∂y 6= ∂y∂x .

∂f xy(x2 − y 2 )
(0, y) = lim 2 2
= −y.
∂x x(x + y )
2
µ ¶
∂ f ∂ ∂f
(0, 0) = (0, 0) = −1.
∂y∂x ∂y ∂x
∂2f
Mientras que ∂x∂y (0, 0) = 1.
No obstante la igualdad se verifica para todo (x, y) 6= (0, 0).

& %
50
' $
Fórmula de Taylor para funciones reales de varias variables
La foŕmula de Taylor para una función f : U → R definida en
U ⊂ Rn es la siguiente:

1 1
f (a + v) = f (a) + df (a)v + d2 f (a)v 2 + ... + dk f (a)v k + rk (v)
2 k!
r(v)
con limv→0 |v|k
= 0.
Para f, (k + 1) veces diferenciable, existe 0 < θ < 1 tal que:
1
r(v) = dk+1 f (a + θv)v k+1
(k + 1)!

Donde para v = (α1 , ...αn ) y para todo j = 1, ..., k escribimos


X ∂j f ik
j j i1 i2
d f (a)v = i1 in
α1 α2 ...αk .
i1 ,...,in :i1 +...+in =j
∂x1 ...∂xn

& %
51
' $
Se demuestra aplicando la fórmula de Taylor a la función auxiliar
φ : [0, 1] → definida como φ(t) = f (a + tv) :

1 0
0 1 (k)
φ(1) = φ(0) + φ (0) + φ (0) + ... + φ (0) + rk .
2 k!
Definimos dp f (a + tv)v p = φ(p) (t). Por lo que:
0 X ∂f
φ (t) = (a + tv)αi = df (a + tv)v.
i
∂xi

0 X ∂f
φ (0) = (a)αi = df (a)v.
i
∂xi
0 X ∂2f
φ (t) = (a + tv)αi αj = d2 f (a + tv)v 2 , etc...
i,j
∂xi ∂xj

00 X ∂2f
φ (0) = (a)αi αj = d2 f (a)v 2
i,j
∂xi ∂xj

& %
52
' $
Caso de dos variables:
Sea f : U → R siendo U ⊂ R2 y sea a = (x, y) ∈ R2 y v = (α1 , α2 ),
se tiene entonces que:

φ(t) = f (x + α1 t, y + α2 t).

Por lo que:
0
φ (0) = fx (x, y)α1 + fy (x, y)α2 = df (x, y)v.

00
φ (0) = fxx (x, y)α12 + 2fxy (x, y)α1 α2 + fyy (x, y)α22 = d2 f (x, y)v 2 .

Luego la fórmula de Taylor correspondiente será:


1 2
f (x + α1 , y + α2 ) = f (x, y) + df (x, y)v + d f (x, y)v 2 + r2 .
2

& %
53
' $

La hessiana Sea f : U → R definida en U ⊂ R2 abierto.


Llamamos matriz hessiana de f en a ∈ U a la matriz
µ 2 ¶
∂ f
H= .
∂xi ∂xj
 
F (a) F12 (a) ... F1j (a) ... F1n (a)
 11 
 F (a) F (a) ... F (a) ... F (a) 
 21 22 2j 2n 
 .. .. .. .. .. .. 
 
 . . . . . . 

H(a) =  .

 Fi1 (a) Fi2(a) ... Fij (a) ... Fin (a) 
 
 .. .. .. .. .. .. 
 . . . . . . 
 
Fn 1 Fn2 (a) ... Fnj (a) ... Fnn (a)
2
µ ¶
∂ F (a) ∂ ∂F (a)
Fij (a) = Fxi xj (a) = = .
∂xj ∂xi ∂xi ∂xj

& %
54
' $

Puede verse que d2 f (a)v 2 = vH(a)v


El teorema de Schwarz asegura que la matriz hessiana es simétirca.
La aplicación F (v) = vH(a)v define una forma cuadrática:
• Definida positiva si ∀ v ∈ R2 ⇒ vH(a)v > 0
• Definida negativa si ∀ v ∈ R2 ⇒ vH(a)v < 0
• En otro caso es indefinida.

& %
55
' $

 
α β
Un matriz H =  
β γ

• Es definida si y solamente si det[H] = αγ − β 2 > 0, y será:


– definida positiva si además α > 0 y γ > 0.
– definida negitiva si además α < 0 y γ < 0.
En nuestro caso:
∂2f ∂2f ∂2f
α= (a); β = (a); γ = (a).
∂x2 ∂x∂y ∂y 2

& %
56
' $

Decimos que a ∈ U es un punto crı́tico para f si df (a) ≡ 0 es decir


si
∂f ∂f
(a) = ... = (a) = 0.
∂x1 ∂xn
• El punto crı́tico se dice no degenerado si det[H(a)] 6= 0.
Equivalentemente si la matriz hessiana es no degenerada.
La función f tiene un máximo local (resp. mı́nimo local) en a ∈ U
cuando existe δ > 0 tal que para todo v con

|v| < δ ⇒ f (a + v) ≤ f (a) (resp. f (a + v) ≥ f (a)).

Todo máximo o mı́nimo local, es un punto crı́tico de f.

& %
57
' $

El siguiente teorema establece la relación existente entre puntos


crı́ticos y Hessiano.
Teorema 19 Sean f : U → R una función de clase C 2 , a ∈ U un
punto crı́tico de f y H la matriz Hessiana en a. Entonces:
(a) Si H es positiva definida entonces, a es mı́nimo local.
(b) Si H es negativa definida entonces, a es máximo local.
(c) Si H es indefinida entonces, a es no es máximo ni mı́nimo
local.

& %
58
' $

Demostración: Sea 0 < |v| < δ.


f (a + v) = f (a) + 12 vH(a)v + r(v) =
· ¸
1 1 v v r(v) 2
= f (a) + H(a) + |v|
2 2 |v| |v| |v|2
v
El vector u = |v| pertenece a la esfera de radio 1
• Caso (a): por ser H(a) continua y definida positiva se tiene que
v v
|v| H(a) |v| > ² > 0. Para δ suficientemente pequeño se tiene
r(v)
que: |v|2 < ². Por lo que f (a + v) − f (a) > 0, ∀ v : |v| < δ.
• El caso (b) es análogo.
• El caso (c) sigue de considerar que por ser H(a) indefinida,
existen vectores v y w tales que vH(a)v < 0 y wH(a)w > 0 en
cualquier B(a, δ).

& %
59
' $
Clasificación de Puntos crı́ticos en el caso de dos variables
Sea f : U → R siendo U ⊂ R2 y sea a = (x, y) ∈ R2 : fxx (x, y) 6= 0.
Para v = (h1 , h2 ) y φ(t) = f (a + th), sabemos que
00
φ (0) = fxx (x, y)h21 + 2fxy (x, y)h1 h2 + fyy (x, y)h22 = vH(a)v.

La siguiente igualdad es fácil de verificar

vH(a)v = fxx (x, y)h21 + 2fxy (x, y)h1 h2 + fyy (x, y)h22 =

1 2 1
¡ 2
¢
= fxx (fxx h1 + fxy h2 ) + fxx fxx fyy − fxy h22 .

Por lo que el signo de vH(a)v dependerá del signo del sumando


1 ¡ 2
¢ 2
fxx fyy − fxy h2
fxx
1
el que corresponde al de la expresión: fxx |H(a)|.
& %
60
' $

Se tiene entonces que si a = (x, y) es un punto crı́tico de f cada vez


que:
1. fxx (x, y) < 0 y |H(a)| > 0 a será máximo.
2. fxx (x, y) > 0 y |H(a)| > 0 a será mı́nimo.
3. En otros casos debemos recurrir a más términos del desarrollo
de Taylor para hacer la clasificación.
Ejercicio 20 Verifique que si

fxx (a) < 0 y |H(a)| > 0 entonces fyy (a) < 0

y si
fxx (x, y) > 0 y |H(a)| > 0 entonces fyy (a) > 0.

& %
61
' $

Ejercicio 21 La oferta de la firma competitiva Suponga una firma


que maximiza sus beneficios. Dicha firma tiene una tecnologı́a
2
representada por una función f : R+ → R definida por
f (x1 , x2 ) = y. La función de beneficios la definimos como

π(x1 , x2 ) = pf (x1 , x2 ) − w1 x1 − w2 x2 ,

donde p reprenseta el precio del producto, w1 y w2 representan


respectivamente, el precio de los factores. Suponga que la firma
decide producir una cantidad ȳ usando las cantidades x1 = x̄1 y
x2 = x̄2 , encuentre condiciones en la tecnologı́a que justifiquen tal
elección.
β
Repita el ejercicio para f (x1 , x2 ) = xα
1 2 discuta la elección de la
x
firma en función de α + β.

& %
62
' $

El teorema de la función implı́cita


Considere f : U → R, U ⊂ Rn de clase C k . Bajo los supuestos del
teorema de la función implı́cita, la condición f (x) = c permite
definir, en un entorno Vx de cada x que cumpla esta condición, de
modo único, una función ξ : Vx−i → R, ∈ C k :

xi = ξ(x1 , ..., xi−1 , xi+1 , ..., xn )

que expresa la i−ésima coordenada en función de las demás, de


forma tal que

f (x−i , ξ(x−i )) = c ∀x−i ∈ Vx−i ,

siendo Vx = Vx−i × Vxi , por x−i denotamos el vector de Rn−1 :

x−i = (x1 , ..., xi−1 , xi+1 , ..., xn )

& %
63
' $
Teorema del valor medio en Rn
Teorema 22 Sea f : U → R definida en U ⊂ Rn , diferenciable en
a ∈ U, tales que a + v ∈ U entonces existe 0 ≤ t0 ≤ 1.

f (a + v) − f (a) = df (a + t0 v)v.

Demostración:
• Sean a ∈ U y b = a + v es decir v = b − a.
• Definimos φ : [0, 1] → R definida como φ(t) = f (a + tv).
• Se tiene que f (a + v) − f (a) = φ(1) − φ(0).
• Por el teorema del valor medio φ(1) − φ(0) = φ0 (t0 ).
• Es decir:
Xn
0 ∂f
f (a + v) − f (a) = φ (t0 ) = (a + t0 v)vi .
i=1
∂x i

& %
64
' $

Teorema de la función implı́cita


Teorema 23 Sea f : U → R una función de clase C k , k ≥ 1
definida en U ⊂ R2 abierto, y (x0 , y0 ) tal que f (x0 , y0 ) = c, con
∂f
∂y (x0 , y0 ) 6= 0. Entonces existe un rectángulo abierto I × J tal que
f −1 (c) ∩ (I × J) es el gráfico de una función ξ : I → J, de clase C k ,
además ξ 0 (x) = − ∂f /∂x
∂f /∂y calculadas en el el punto (x, ξ(x)).
∂f
Demostración: Supongamos que ∂y (x0 , y0 ) > 0.
∂f
• Como ∂y es continua existen δ > 0 y ² > 0 tales que en
∂f
I × J = (x − δ, x + δ) × (y − ², y + ²); ∂y (x, y) > 0.
• Para cada x ∈ I y → f (x, y) es creciente.
• Como f (x0 , y0 ) = c entonces

f (x0 , y0 − ²) < c y f (x0 , y0 + ²) > c.

& %
65
' $

• Nuevamente por la continuidad de f existe


δ : ∀x ∈ (x0 − δ, x0 + δ)

f (x, y0 − ²) < c f (x, y0 + ²) > c.

• Luego, por el teorema del valor medio, para cada x ∈ I existe


y = ξ(x) ∈ (y0 − ², y0 + ²) tal que se verifica f (x, ξ(x)) = c.
• Veamos ahora la derivabilidad de la función ξ(x) (implı́cita).

& %
66
' $
• Sea h tal que x + h ∈ I, y k = ξ(x + h) − ξ(x).
• Luego f (x + h, ξ(x) + k) = f (x, ξ(x)) = c.
• Por el teorema del valor medio existe θ tal que
0 = f (x + h, ξ(x) + k) − f (x, ξ(x)) =
∂f ∂f
= (x + θh, ξ(x) + θk)h + (x + θh, ξ(x) + θk)k.
∂x ∂y
• Luego:
∂f
ξ(x + h) − ξ(x) k ∂x (x + θh, ξ(x) + θk)
= = − ∂f .
h h ∂y (x + θh, ξ(x) + θk)

• Asuminedo la continuidad de ξ : tomando lı́mites cuando


h → 0, llegamos a:
∂f
∂x (x, ξ(x))
ξ 0 (x) = − ∂f
.
∂y (x, ξ(x))

& %
67
' $

Veamos ahora la continuidad de la función implı́cita, que fue


utilizado en la demostración de su derivabilidad:
Lema 24 Sean X ⊂ Rn , K ⊂ Rk compacto, f : X × K → Rp
continua, y c ∈ Rp . Si f −1 (c) es el gráfico de una aplicación
ξ : X → K (esto es si para cada x ∈ X existe un único
y = ξ(x) ∈ K : f (x, ξ(x)) = c entonces ξ es continua.
Demostración: Sea x0 ∈ X : f (x0 , ξ(x0 )) = c. Debemos demostrar
que para toda sucesión xn ∈ X : xn → x0 se verifica que
yn = ξ(xn ) → ξ(x0 ). Por ser K compacto, existe ynk = ξ(xnk ) → z,
luego f (xnk , ξ(xnk )) = f (x, z) = c, por la unicidad se concluye que
z = ξ(x : 0). Probamos entonces que toda subsucesión ξ(xnk )
convergente en K, converge a ξ( x0 ). Como K es acotado el teorema
queda probado.

& %
68
' $
Aun sin conocer explı́citamente una función definida
implı́citamente, podemos calcular sus derivadas en un punto.
Ejemplo Considere la función z = x3 + x2 y − 2y 2 − 10y y la
ecuación x3 + x2 y − 2y 2 − 10y = 0. Calcule la derivada de la función
y(x) definida implicitamente por la ecuación anterior en P = (1, 2)
• f (1, 2) = 0.
• fx (x, y) = 3x2 + 2xy, fy (x, y) = x2 − 4y − 10.
• fy (1, 2) = −13 6= 0. Estamos entionces en las condiciones del
teorema de la función implı́cita.
0 3x2 +2xy 7
• Luego y (x) = x2 −4y−10 , luego y 0 (1) = 13 .

1. Calcule al derivada de la función x(y) definida implicitamente


por la ecuación anterior en el punto (1, 2)
2. Calcule el valor de las derivadas segundas de cada una de las
dos funciones anteriores en dicho punto.
& %
69
' $

El teorema de la función implı́cita se generaliza fácilmente al caso


en que f : U → R siendo U ⊂ Rn .
• Bajo determinadas hipótesis:
∂f
1. ∂xn (x0 , y0 ) 6= 0, (x0 , y0 ) ∈ Rn−1 × R,
2. f (x0 , y0 ) = c
• podremos expresar una de las variables, (en este caso xn , en un
entorno de x0 ∈ B ⊂ Rn−1 ) en función de las demás:
• Es decir, existe, ξ : B → R tal que xn = ξ(x−n ) siendo
B = B(x0 , δ) ⊂ Rn−1 , de forma tal que y0 = ξ(x0 ) y
f (x, ξ(x)) = c, ∀x ∈ B.
• La función y = ξ(x) se dice definida implı́citamente por la
ecuación f (x, y) = c.

& %
70
' $

• La afirmación: f −1 (c) ∩ (B × J) es el gráfico de una función,


significa que para cada x ∈ B existe y = ξ(x) ∈ J tal que
f (x, y) = c.
Teorema 25 Sea f : U → R una función de clase C k , k ≥ 1
definida en U ⊂ Rn+1 abierto, y un punto p = (x0 , y0 ) tal que
f (p) = c, con ∂f
∂y (p) 6= 0. Entonces existe una bola
B = B(x0 , δ) ⊂ Rn y un abierto J = (y0 − ², y0 + ²) tales que
f −1 (c) ∩ (B × J) es el gráfico de una función ξ : B → J, de clase
C k , además
∂f
∂ξ ∂xi (x0 , ξ(x0 ))
(x0 ) = − ∂f , i = (1, ..., n).
∂xi ∂y (x0 , ξ(x0 ))

& %
71
' $
El teorema de la función implı́cita puede extenderse a uns sistema
de ecuaciones del tipo:

f1 (x1 , ..., xn , y1 , ..., ym ) = 0


f2 (x1 , ..., xn , y1 , ..., ym ) = 0
................................
fm (x1 , ..., xn , y1 , ..., ym ) = 0

• Bajo determinadas condiciones cada una de las m variables


y1 , ..., ym puee escribirse como función de las primeras x1 , ...xn
• Un principio general es que no puede resolverse un sistemas con
mas ecuaciones que incógnitas.
• Nuestro sistema tiene m ecuaciones y m incógintas, y1 , ..., ym
(variablas endógenas)vlas x1 , ...xn hacen las veces de
parámetros (variables exógenas).
& %
72
' $
Para que las funciones implı́citamente definidas que verifican las
ecuaciones:

f1 (x, y(x)) = 0, f2 (x, y(x)) = 0, ..., f (x, y(x)) = 0

donde
y : Vx0 ⊂ Rn → Rm y(x1 , ..., xn ) = (y1 (x1 , ...xn ), ..., ym (x1 , ..xn ))
existan debe verificarse la existencia de al menos un punto
(x0 , y0 ) ∈ Rn × Rm tal que:
1. f1 (x0 , y0 ) = 0 f2 (x0 , y0 ) = 0, ...., fm (x0 , y0 ) = 0.
¯ ¯
¯ ∂f1 ∂f1 ¯
¯ ∂y1 (x0 , y0 ) .... ∂y ¯
¯ n ¯
¯ .. .. ¯
2. (∂f 1 ,...,fm )
(y1 ,...,ym ) = ¯ . ··· . ¯¯ 6= 0.
¯
¯ ∂fn ∂f ¯
¯ ∂y (x0 , y0 ) .... ∂y ¯ n
1 n

La matriz cuyo determinante debe ser no nulo es llamada


jacobiana.
& %
73
' $

Ejemplo Considere las funciones


• F : R4 → R definida como F (x1 , x2 , y1 , y2 ) = x1 x2 − y12 − y2
• G : R4 → R definida como G(x1 , x2 , y1 , y2 ) = −x21 + x22 + −y12 y2
• Conisdere las ecuaciones

F (x1 , x2 , y1 , y2 ) = 0 y G(x1 , x2 , y1 , y2 ) = 0.
1. Muestre que pueden definirse las funciones implı́citas
y1 : R2 → R y y2 : R2 → R en un entorno del punto
(x1 , x2 , y1 , y2 ) = (1, 0, −1, 1) tales que

y1 (1, 0) = −1, y y2 ((1, 0) = 1.


∂y1 ∂y2
2. Calcule ∂x2 (1, 0) y ∂x1 (1, 0).

& %
74
' $
Aplicación: Superficies de nivel.
Sea M = {x ∈ Rn : f (x) = c} = f −1 (c).
En el caso en que f : R → R sea C k diremos que: M es una
superficie, pues puede describirse como la unión de grafos de
funciones diferenciables, pues para cada x ∈ M : f (x) = c, existe
Vx = Vx−i × Vxi y una función ξ : Vxi → R de clase C k :

M ∩ Vx = {(x−i , ξ(x−i )) : x−i ∈ Vxi } .


S
Luego M = x:f (x)=c M ∩ Vx . conistituye superficie de nivel c.
Diremos que una aplicación λ : (−², ²) → Rn definida por,

λ(t) = (λ1 (t), ..., λn (t))

es un camino en M, si para todo t ∈ (−², ²), λ(t) ∈ M. Si cada


coordenada λi : (−², ²) → R es una función diferenciable, entonces
λ0 (t) = (λ01 (t), ..., λ0n (t)), ∀t ∈ (−², ²).
& %
75
' $

El espacio tangente
Definición 26 Sea p ∈ M, llamamos espacio tangente de M en p
al conjunto de vectores λ0 (0) de los caminos λ : (−², ²) → M tales
que λ(0) = p. Denotaremos a este conjunto por Tp M.
Teorema 27 El conjunto Tp M es un espacio vectorial de
dimensión n − 1 incluı́do en Rn .
Demostración: Sea p = (a1 , ..., an ) ∈ M siendo M = f −1 (c) y sea
xi = ξ(x−i ) donde x−i = (x1 , ..., xi−1 , xi+1 , ..., xn ), la función
implı́citamente definida a partir de f (x1 , ..., xn ) = c. Afirmamos que
X ∂ξ
v = (α1 , ..., αn ) ∈ Tp M ⇔ αi = (p−i )αj .
∂xj
j6=i

• Aceptemos momentáneamente esta afirmación.

& %
76
' $

Resulta entoces que: el plano tangente es el subespacio vectorial de


dimesión n − 1 generado por los n − 1 vectores linealmente
independientes:

e1 + c1 ei , , ..., ei−1 + ci−1 ei , ei+1 + ci+1 ei , ..., en−1 + cn−1 ei ,


∂ξ
siendo cj = ∂xj (p−i ) ∀j 6= i. Basta para ver esto escribir la
igualdad:
X
v= αj (ej + cj ei ),
j6=i

siendo v = (α1 , ...αn ) ∈ Tp M.•


Puede decirse que Tp M es el grafo del funcional
dξ(p) → Rn−1 → R. Siendo
© n−1
ª
Gξ (p) = v = (v−i , vi ) ∈ R × R : (v−i , dξ(p)v−i ) .

& %
77
' $

Demostración de la afirmación
• Directo: Sea λ : (−², ²) → M, tal que λ(0) = p un campo
vectorial en M = f −1 (c). Debe verificar que

λi (t) = ξi (λ1 (t), ..., λi−1 (t), λi+1 (t), ...λn (t))

Se sigue, usando la regla de la cadena que:


X ∂ξ
λ0i (0) = (p−i )λ0j (0).
∂xj
j6=i

• Recı́proco: Sea v = (α1 , ..., αn ) un vector tal que verifica la


P ∂ξ
condición mencionada, es decir que αi = j6=i ∂x j
(p−i )αj .
Podemos definir en M el campo vectorial λ : (−², ²) → M por
λj (t) = aj + tαj . Puede verificarse que f (λ1 (t), ...., λn (t)) = c
para todo t ∈ (−², ²).

& %
78
' $

Veamos ahora que esta definición es equivalente a decir que el


espacio tangente, es el el conjunto de vectores pertenecientes al
núcelo de df (a) siendo a ∈ M = f −1 (c). En efecto, si v ∈ N [df (a)]
se verifica que
Xn
∂f
(a)vj = 0
j=1
∂x j

∂f (a) P ∂f (a)
∂xj
De donde se sigue que, siendo ∂xi 6= 0, vi = j6=i ∂f (a) vj .
∂xi

De acuerdo al teorema de la función implı́cita se verifca que:


X ∂ξ
vi = (a−i )vi . (∗ )
∂xj
j6=i

Y reciprocamente......si v puede escribirse en la forma (∗ ) entonces

v ∈ N [df (a)].•

& %
79
' $
Ejemplo: Sea f : U → R, U ⊂ R3 abierto y sea p = (a1 , a2 , a3 ) tal
que f (p) = c. Existe entonces ξ : Va−3 (p−3 ) → R : a3 = ξ(a1 , a2 ),
que verifica que f (x, y, ξ(x, y)) = c ∀(x, y) ∈ Va−3 .
Luego el espacio tangente en p ∈ M es un subsepacio de dimensión
2, en R3 generado por los vectores :
∂ξ ∂ξ
g1 (p−3 ) = e1 + (a1 , a2 )e3 = (1, 0, (a1 , a2 ))
∂x ∂x
∂ξ ∂ξ
g2 (p−3 ) = e2 + (a1 , a2 )e3 = (0, 1, (a1 , a2 )).
∂y ∂y
Es decir que
∂ξ ∂ξ
v = (α1 , α2 , α3 ) ∈ Tp M ⇔ α3 = α1 (a1 , a2 ) + α2 (a1 , a2 )
∂x ∂y
∂ξ ∂ξ
luego v = α1 (1, 0, ∂x (a1 , a2 )) + α2 (0, 1, ∂y (a1 , a2 )).
Nótese que este subespacio es ortogonal al vector grad[f (p)]. Es
decir que: < g1 (p−3 ), grad[f (p)] >=< g2 (p−3 ), grad[f (p)] >= 0
& %
80
' $

• Un conjunto M ⊂ Rn se llama hipersuperficie de clase C k


cuando es localmente el gráfico de una función de n − 1
variables de calse C k .
• Esto significa que: para cada punto p ∈ M pertenciente a un
abierto V ⊂ Rn , tal que V ∩ M es el gráfico de una funación de
clase C k definida en un abierto de Rn−1 .
– Cuando n = 2 la hipersuperficie es una curva y
– si n = 3 es una superficie.
– El ejemplo anterior puede generalizarse, de la siguiente
forma: si no existen punto crı́ticos de f en el nivel c
entonces el conjunto de nivel c de una función, es una
hipersuperficie.

& %
81
' $

Como resumen de lo anterior tenemos el siguiente teorema:


Teorema 28 (Global de la función implı́cita)
• La imagen inversa M = f −1 (c) de un valor regular c de una
función f : U → R, U ⊂ Rn−1 , es una hipersuperficie de clase
Ck.
• En cada p ∈ M, el espacio vectorial tangente Tp M, es el núcleo
de la diferencial df (p) : Rn+1 → R, o equivalentemente, es el
conjunto de vectores perpendiculares al vector grad f (p), o bien
v resulta ser la derivada de un camino en f −1 (c).

& %
82
' $
Ecuación del Plano Tangente
• Sea f : U → R, C 2 ; U ⊂ R2 , definida z = f (x, y). Dicha
ecuación puede ser escrita como F (x, y, z) = z − f (x, y) = 0
• Supongamos que para z = z0 se verifica que z0 = f (x0 , y0 ). Sea
w0 = (x0 , y0 , z0 ).
• Los vectores v = (v1 , v2 , v3 ) que pertenences al plano tangente
verifican la ecuación:
∂f ∂f
dF (x0 , y0 , z0 )v = v3 − (x0 , y0 )v1 − (x0 , y0 )v2 = 0.
∂x ∂y
• Ubiquemos al vector v en p = (x0 , y0 , z0 ), podemos escribir
entonces que: v1 = x − x0 , v2 = y − y0 , v3 = z − z0
obtendremos entonces la ecuación del plano tangente que pasa
por p = (x0 , y0 , z0 ) y esta es:

z − z0 = fx0 (x0 )(x − x0 ) + fy0 (y0 )(y − y0 ).


& %
83
' $
1 1 1
Ejercicio Sea u(x1 , x2 , x3 ) = x1 x2 x3 la utilidad de un agente cuyo
3 2 6

3
espacio de conusmo es R+ .
1. Encuentre las superficies de isopreferencia.
2. Encuentre los vectores directores del plano tangente para cada
punto correspondiente a la superficie de nivel c > 0.
3. Muestre que el gradiente en cada punto de una superficie de
nivel c > 0, es perpendicular al plano tangente correspondiente
a dicho punto. Represente gráficamente el plano tangente.
4. Analice en particular el caso en que c = 0.
3
5. Suponga que los precios están definidos por p ∈ R++ y que sus
3
dotaciones iniciales están definidas por w ∈ R++ . Resuelva el
problema del consumidor para este caso.
6. Muestre la relación existente entre precios y el gradiente de u
evaluado en la demanda.
& %
84
' $

Funciones cuasi-cóncavas y cuasi-convexas en Rn


Sea f : U → R, definida en U ⊂ Rn convexo.
Definición 29 Decimos que f : U → R definda en U ⊂ Rn ,
convexo, es cuasi-convexa si y solamente si ∀c ∈ R

S̄c = {x ∈ U : f (x) ≤ c}

es un subconjunto convexo en Rn .
Definición 30 Decimos que f : U → R definda en U ⊂ Rn ,
convexo, es cuasi-cóncava si y solamente si ∀c ∈ R

S c = {x ∈ U : f (x) ≥ c}

es un subconjunto convexo en Rn .
Es fácil ver que si f es una función cuasi-cóncava, entonces −f es
cuasi-convexa.
& %
85
' $
Proposición: Sea f : U → R definda en U ⊂ Rn , convexo, entonces
f es cuasicóncava en U si y solamente si ∀x, y ∈ U :

f (αx + (1 − α)y) ≥ min {f (x), f (y)} .

Demostración: Sea f : U → R siendo U convexo .


• Supongamos que f es cuasicóncava. S.p.g., asumimos que
f (x) = min {f (x), f (y)} . Por ser f cuasicóncava se sigue que
S f (x) = {z ∈ U : f (z) ≥ f (x)} es convexo. Luego como
f (y), f (x) ∈ S f (x) resulta que f (αx + (1 − α)y) ∈ S f (x) ⇔
f (αx + (1 − α)y) ≥ f (x) = min {f (x), f (y)} .
• Recı́procamente. Supongamos
f (αx + (1 − α)y) ≥ min {f (x), f (y)} . Sea c ∈ R consideremos,
x, y ∈ U tales que f (x), f (y) ∈ S c luego por ser
f (αx + (1 − α)y) ≥ min {f (x), f (y)} > c se sigue que
αx + (1 − α)y ∈ S c .•
& %
86
' $
Funciones cóncavas y convexas en Rn
Sea f : U → R, definida en U ⊂ Rn convexo.
Definición 31 Decimos que f es convexa si y solamente si para
Pk
toda combinación convexa x = i=1 λi xi de elementos xi ∈ U se
tiene que à k !
X n
X
f λi xi ≤ λi f (xi ).
i=1 i=1

Diremos que f es cóncava si −f es convexa, por lo que:


Definición 32 f es cóncava si y solamente si para toda
Pk
combinación convexa x = i=1 λi xi de elementos xi ∈ U se tienen
que à k !
X Xk
f λi xi ≥ λi f (xi ).
i=1 i=1

Diremos que f es afı́n si y solamente si es cóncava y convexa a la


vez.
& %
87
' $

Teorema 33 Sea f : U → R, siendo U ⊂ Rn convexo. Las


siguientes dos condiciones son equivalentes:
1. f es convexa.
2. ∀x, y ∈ U, ∀ α ∈ [0, 1]

f (αx + (1 − α)y) ≤ αf (x) + (1 − α)f (y).

Proposición: Si f es (estrictamente)cónvava es
(estrictamente)cuasi-cóncava. (Análogamente para convexas.)
Pero el recı́proco no vale.
Como en el caso de una variable, podemos introducir las
definiciones de función estrictamente cóncava y estrictamente
convexa, cambiando desigualdades por desigualdades estrictas.

& %
88
' $
Funciones cóncavas y convexas diferenciables.
Los teoremas siguientes se demuestran a partir del lema:
Lema 34 Sea f : U ⊂ R, definida en U ⊂ Rn convexo, entonces f
es convexa si y solamnente si φ : [0, 1] → R definida como
φ(t) = f (a + td) es convexa.
Demostración: Sean a y b ∈ para d = b − a se tiene que
φ(0) = f (a) y φ(1) = f (b).
• Supongamos φ convexa, entonces tenemos que
f ((1 − t)a + tb) = φ(t) = φ(t1 + (1 − t)0) ≤

≤ tφ(1) + (1 − t)φ(0) = tf (b) + (1 − t)f (a).

• Recı́procamente de la convexidad de f se desprende de la


igualdad: φ(αt + (1 − α)t1 ) = f [a + (αt + (1 − α)t1 )(b − a)] y
del hecho de ser: 0 ≤ [αt + (1 − α)t1 ](b − a) ≤ 1.
& %
89
' $

Teorema 35 Sea f : U → R, f ∈ C1 (U ). Es convexa si y


solamente si:
f (b) ≥ f (a) + df (a)v
para todo a, b ∈ U.
Demostración: Considere la función φ del lema anterior siendo
v = b − a, es decir φ(t) = f (a + tv).
Es decir una función f : U → R definida en U ⊂ R convexo, es
convexa si y solamente si
• la cuerda que une los puntos (a, f (b)) y (a, f (b)) siendo a < b
queda por arriba de la recta tangente al grafo de f en (a, f (a)).

& %
90
' $

Teorema 36 Sea f : U → R, f ∈ C2 (U ). Es convexa si y


solamente si:
• d2 f (a) = Hf (a) es semidefinida positiva para todo a ∈ U.
• Si d2 f (a + v) = Hf (a) es definida positiva entonces f es
estrictamente convexa.
Demostración: Considere la función φ del lema anterior. Sea
v = (b − a). Ahora demuestre que φ00 (0) = d2 f (a)v. Por ser
φ00 (0) ≥ 0 la derivada primera es creciente, luego φ es convexa.

& %
91
' $

Extremos absolutos de funciones cuasi-convexas y cuasicóncavas


La caracterización de los extremos absolutos de funciones reales
convexas definidas en U ⊂ Rn compacto, puede hacerse
análogamente al caso de funciones convexas de una variable real.
Si f : U → R es c-convexa (c-cóncava)
• No tiene máximos (mı́nimos) relativos estrictos en el interior.
• Sus mı́nimos (máximos) absolutos corresponden a puntos
crı́ticos de f o bien a puntos sobre la frontera.
• Todo punto crı́tico en el interior de U es un mı́nimo (máximo)
relativo. El subconjunto de U donde f alcanza el mı́nimo
(máximo) absoluto es convexo.
• Si f es estrictamente c-convexa (c-cóncava) existe un único
mı́nimo (máximo) absoluto.

& %
92
' $
El método de Lagrange
• Caso R2 : Sean f y g : X → R donde X ⊂ R2 abierto.
• Supongamos que para el punto P = (x0 , y0 ) se verifica que:
– g(x0 , y0 ) = 0 y además que:
– f (x0 , y0 ) ≥ f (x, y), ∀(x, y) ∈ X ∩ g −1 (0).
• Supongamos que además que grad g(x0 , y0 ) 6= 0.
• Sin pérdida de generalidad podemos asumir que gy (x0 , y0 ) 6= 0.
• Estamos entonces en las condiciones del teorema de la función
implı́cita.
• Existen entornos Ix0 de x0 y Jy0 de y0 ası́ como una función
y : Ix0 → Jy0 que verifica y0 = y(x0 ) y además g(x, y(x)) = 0
para todo x ∈ Ix0 .
• Luego gx (x0 , y0 ) + gy (x0 , y0 )y 0 (x0 ) = 0.
& %
93
' $

Como (x0 , y0 ) es un máximo de f restringido a g −1 (0), debe


verificarase que:

fx (x0 , y0 ) + fy (x0 , y0 )y 0 (x0 ) = 0.

• Por lo tanto resulta que gradf (x0 , y0 ) y gradg(x0 , y0 ) son


perpendiculares al mismo vector (1, y 0 (x0 )) y son por lo tanto
paralelos, por lo que existe λ; el multiplicador de Lgrange tal
que:
• grad f (x0 , y0 ) = λ grad g(x0 , y0 ).

& %
94
' $
Caso R3 Supongamos que en (x0 , y0 , z0 ) se verifica que
f (x0 , y0 , z0 ) ≥ f (x, y, z) ∀(x, y, z) ∈ g −1 (0) ∩ h−1 (0).
• Consideremos además que grad h(x0 , y0 , z0 ) y grad g(x0 , y0 , z0 )
son dos vectores linealmente independientes.
• Sin pérdida de generalidad asumanos que
¯ ¯
¯ ¯
¯ hx (x0 , y0 , z0 ) hy (x0 , y0 , z0 ) ¯
¯ ¯ 6= 0.
¯ ¯
¯ gx (x0 , y0 , z0 ) gy (x0 , y0 , z0 ) ¯

• Estamsos entonces en las condiciones del teorema de la función


implı́cita, esto es:
– Existen entonces intervalos Ix0 de x0 , Jy0 de y0 y Kz0 de z0
ası́ como funciones:
∗ y : Ix0 → Jy0 z : Ix0 → Kz0 tales que:
∗ y(x0 ) = y0 , z(z0 ) = z0 y
∗ h(x, y(x), z(x)) = 0 y g(x, y(x), z(x)) = 0 ∀x ∈ Ix0 .
& %
95
' $

• Se verifica entonces que


gx (x0 , y0 , z0 ) + gy (x0 , y0 , z0 )y 0 (t0 ) + gz (x0 , y0 , z0 )z 0 (t0 ) = 0.
• y que
hx (x0 , y0 , z0 ) + hy (x0 , y0 , z0 )y 0 (t0 ) + hz (x0 , y0 , z0 )z 0 (t0 ) = 0.
• Por alcanzar f su máximo en X ∩ g −1 (0) ∩ h−1 (0) se tiene que
fx (x0 , y0 , z0 ) + fy (x0 , y0 , z0 )y 0 (t0 ) + fz (x0 , y0 , z0 )z 0 (t0 ) = 0.
• Como grad g(x0 , y0 , z0 ) y grad h(x0 , y0 , z0 ) son linealmente
independientes existen λ1 y λ2 tales que

grad f (x0 , y0 , z0 ) = λ1 grad g(x0 , y0 , z0 ) + λ2 grad h(x0 , y0 , z0 ).

• Los números reales λ1 y λ2 se denominan multiplicadores de


Lagrange.

& %
96

También podría gustarte