Está en la página 1de 170

Apuntes de Matemáticas III

(ENMEM 205)
Versión: julio de 2023

Jorge Rivera Cayupi


Jorge Rivera es Profesor Titular del Departamento de Economía, FEN-Universidad de Chile: jrivera@fen.uchile.cl
Este apunte es de uso libre, y se puede distribuir de manera gratuita, sin solicitar permisos (solo citar la fuente).
Se agradece la corrección y comentarios de los profesores que dictan Mate III en la FEN, muy especialmente el
trabajo acucioso y relevante del Prof. Humberto Cipriano.
El “template” que se utiliza en la confección de este trabajo fue creado por Mathias Legrand y por “Vlad” (ver
https://www.latextemplates.com/template/the-legrand-orange-book).
Contenido

I Preliminares

1 Cálculo diferencial (una variable) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9


1.1 Derivada de una función real . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.1 Concepto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.2 Interpretación de la derivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Cálculo efectivo de derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Aplicaciones de las derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17


2.1 Derivadas de orden superior y polinomio de Taylor . . . . . . . . . . . . . . . . . . . . 17
2.1.1 Derivadas de orden superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 Polinomio de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Análisis del crecimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3 Concavidad - convexidad de funciones reales . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.1 Idea y concepto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.2 Convexidad - concavidad desde un punto de vista local . . . . . . . . . . . . . . . . . . . 29
2.3.3 *Complementos sobre convexidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4 Máximos y mínimos de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.1 Óptimos locales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.2 Óptimos globales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3 Integral de funciones de una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43


3.1 Primitiva de una función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1.1 Concepto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.1.2 Cálculo de primitivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 Integral definida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2.1 Área bajo la curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2.2 Teorema fundamental del cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.2.3 Integral impropia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

II Cálculo en varias variables


4 Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.1 Motivación: funciones de varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.2 Conceptos relevantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2.1 Idea de función de varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2.2 Dominio de funciones de varias variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.3 Operaciones con funciones de varias variables . . . . . . . . . . . . . . . . . . . . . . . 68
4.3.1 Suma y ponderación, producto y cociente de funciones . . . . . . . . . . . . . . . . . . . 68
4.3.2 Composición de funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3.3 Ejercicios de la sección . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.4 Aspectos gráfico de funciones de varias variables . . . . . . . . . . . . . . . . . . . . 72
4.4.1 Consideraciones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4.2 Gráfico de funciones: caso dos variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4.3 Curvas de nivel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.4 *Regiones definidas por desigualdades de funciones de varias variables . . . . . . . 81

5 Cálculo diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.1 Derivadas parciales (primer orden) y gradiente . . . . . . . . . . . . . . . . . . . . . . . 85
5.1.1 Intuición y concepto de las derivadas parciales (primer orden) . . . . . . . . . . . . . . 85
5.1.2 Gradiente de una función de Rk en R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.2 Reglas de derivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.2.1 Regla de la suma (y ponderación), producto y cociente . . . . . . . . . . . . . . . . . . . 93
5.2.2 Regla de la cadena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.3 Derivadas parciales de segundo orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.3.1 Idea y concepto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.3.2 Matriz de Hesse de una función . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.4 Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.4.1 Derivadas implícitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.4.2 Interpretación geométrica del gradiente de una función . . . . . . . . . . . . . . . . . . 115
5.4.3 Derivadas direccionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

6 Aplicaciones del cálculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119


6.1 Análisis del crecimiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.2 Polinomio de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.3 Convexidad (concavidad) de funciones de varias variables . . . . . . . . . . . 127
6.3.1 Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.3.2 Recapitulación sobre convexidad de funciones de una variable . . . . . . . . . . . . 128
6.3.3 Convexidad (concavidad): caso varias variables . . . . . . . . . . . . . . . . . . . . . . . . 128
6.3.4 Convexidad de curvas de nivel, funciones “cuasicóncavas” . . . . . . . . . . . . . . . 134
6.4 Máximos y mínimos de funciones de varias variables . . . . . . . . . . . . . . . . . 137
6.4.1 Puntos críticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
6.4.2 Óptimos locales de funciones de varias variables . . . . . . . . . . . . . . . . . . . . . . . . 140
6.4.3 Óptimos globales de funciones de varias variables . . . . . . . . . . . . . . . . . . . . . . . 146
6.5 Problema de optimización con restricción lineal . . . . . . . . . . . . . . . . . . . . . 151

III Integrales múltiples


7 Integrales (definidas) dobles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
7.1 Idea y concepto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
7.2 Cálculo de integrales dobles: Teorema de Fubini . . . . . . . . . . . . . . . . . . . . . 164
I
Preliminares

1 Cálculo diferencial (una variable) . . . . . 9


1.1 Derivada de una función real . . . . . . . . . . . . . . 9
1.2 Cálculo efectivo de derivadas . . . . . . . . . . . . . 11

2 Aplicaciones de las derivadas . . . . . . . 17


2.1 Derivadas de orden superior y polinomio de Tay-
lor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Análisis del crecimiento . . . . . . . . . . . . . . . . . . 19
2.3 Concavidad - convexidad de funciones reales 24
2.4 Máximos y mínimos de funciones . . . . . . . . . . 35

3 Integral de funciones de una variable 43


3.1 Primitiva de una función . . . . . . . . . . . . . . . . . 43
3.2 Integral definida . . . . . . . . . . . . . . . . . . . . . . . . 51
1. Cálculo diferencial (una variable)

En lo que sigue de esta parte, el dominio y el recorrido de las funciones que se analizan es R, pudiendo
ser subconjuntos de este. En tal caso se trata de funciones de una variable a valores reales, que
llamaremos funciones reales. El repaso de conceptos y propiedades del cálculo diferencial (e integral)
para funciones reales es necesario para el estudio del cálculo diferencial (e integral) de funciones que
dependen de varias variables.

1.1 Derivada de una función real


1.1.1 Concepto

Definición 1.1 Una función f : R → R se dice “derivable” en x̄ ∈ R si existe el límite

f (x̄ + h) − f (x̄)
lim .
h→0 h
En tal caso, ese límite se llama derivada de la función “ f ” en el punto x̄, y se denota como f ′ (x̄).
Es decir:
f (x̄ + h) − f (x̄)
f ′ (x̄) = lim .
h→0 h

Si la derivada de f existe en cualquier punto “x” del dominio, entonces podemos asociar la
cantidad “x” con el valor de la derivada en dicho punto. Esa es la función derivada, que por abuso
de lenguaje simplemente llamamos derivada de f , que evaluada en “x” la denotamos como f ′ (x).

Importante 1.1 En otros textos es frecuente encontrar que la derivada de f evaluada en x̄ se denota
como alguna de las siguientes expresiones:

d f (x̄)
, fx (x̄), D f (x̄).
dx
En este curso usaremos la notación como se presentó en la definición anterior, es decir, la derivada
de la función “ f ” evaluada en “x̄” se denota como f ′ (x̄).
10 Capítulo 1. Cálculo diferencial (una variable)

1.1.2 Interpretación de la derivada


1.1.2.1 Geometría: pendiente de la tangente al gráfico de la función
La pendiente de la tangente al gráfico de f (x) en el punto (x̄, f (x̄)) es la derivada de la función “ f ”
evaluada en x̄, es decir, f ′ (x̄). Por lo tanto,

Importante 1.2 Ecuación de la recta tangente al gráfico de f (x) por el punto (x̄, f (x̄)):

y(x) = f (x̄) + f ′ (x̄) · (x − x̄).

Ejemplo 1.1 Para la función f (x) = x2 , dado x̄ en su dominio, la recta tangente al gráfico de f (x) en el
punto (x̄, f (x̄)) tiene pendiente f ′ (x̄). Ya que f ′ (x̄) = 2x̄, la recta tangente que buscamos “pasa” por el
punto (x̄, x̄2 ) y tiene pendiente 2x̄, de modo que su ecuación es

x̄2 + |{z}
y(x) = |{z} 2x̄ (x − x̄) ⇐⇒ y = 2 x̄ x − x̄2 .
f (x̄) m= f ′ (x̄)

En la Figura 1.1, la recta azul es la recta tangente que acabamos de obtener.

Figura 1.1: TANGENTE A LA PARÁBOLA f (x) = x2 EN (x̄, f (x̄)): y = 2 x̄ x − x̄2

Por ejemplo, en el punto (4, 16) de la curva f (x) = x2 , la recta tangente a la parábola es

y = |{z} 8 ·(x − |{z}


16 + |{z} 4 ) = 8x − 16.
f (4) f ′ (4) x̄

En general, para la parábola f (x) = ax2 + bx + c, en x̄ ∈ R se tiene que f (x̄) = a x̄2 + bx̄ + c y que
f ′ (x̄) = 2ax̄ + b, por lo que la ecuación de la recta tangente a la curva f (x) por el punto (x̄, f (x̄)) es

y = (ax̄2 + bx̄ + c) + (2ax̄ + b) (x − x̄) ⇒ y(x) = (2ax̄ + b) · x + (c − ax̄2 ).


| {z } | {z }
f (x̄) f ′ (x̄)

En lo anterior, por abuso de lenguaje no hacemos explícito el hecho que “y” depende de “x”; la
notación correcta para la ecuación de la recta tangente debería ser y(x) = (2ax0 + b)x + (c − ax02 ). ■

1.1.2.2 Derivada como cambio marginal


Suponga que N(t) es la nota que obtiene en cierta asignatura si estudia t horas. Por lo tanto, si en
situación inicial ocurre que estudio t0 horas, el nivel de la nota que se obtiene es N(t0 ), mientras que
en situación final, si estudio t0 + 1 horas, el nivel de la nota que se obtiene es N(t0 + 1).
1.2 Cálculo efectivo de derivadas 11

Dado lo anterior, la pregunta es: habiendo estudiado t0 horas (también se dice “condicional en
haber estudiado t0 horas) ”, ¿cuánto aporta a la nota el hecho de estudiar una hora más? Es decir, ¿cuál
es el extra de nota que se obtiene si estudio una hora adicional a partir del hecho que ya he estudiado
t0 horas? Dicho “extra” es el cambio marginal que hay en la nota explicado por una hora de estudio
adicional a partir de t0 . De acuerdo con lo expuesto, el cambio marginal es dado por:

C AMBIO MARGINAL DE LA NOTA = N(t0 + 1) − N(t0 )


| {z } | {z }
nota final nota inicial

Considerando ahora que la derivada de N(t) evaluada en t0 es

N(t0 + h) − N(t0 )
N ′ (t0 ) = lim ,
h→0 h

ocurre que si en el lado derecho en vez de tomar el límite reemplazamos h = 1 la igualdad en cuestión
deja de ser válida; luego de ese reemplazo se obtiene sólo una aproximación de la derivada, es decir:

N(t0 + 1) − N(t0 )
N ′ (t0 ) ≈ = N(t0 + 1) − N(t0 ).
1
Por lo anterior, mirando los extremos se tiene que el cambio marginal de la nota es dado, de manera
aproximada, por la derivada de la función N(t) evaluada en t0 .
De ahora en adelante, obviando que se trata de una aproximación y además entendido que “una
hora adicional” es la unidad mínima de tiempo que se considera para determinar la nota,

Importante 1.3 el cambio marginal de una función en cierto punto se entiende como la derivada
de la función en el punto:

C AMBIO MARGINAL DE LA NOTA EN t0 = N ′ (t0 ).

1.2 Cálculo efectivo de derivadas


En términos generales, el cálculo efectivo de derivadas descansa en dos derivadas conocidas y en cinco
propiedades: conociendo la derivada de la función exponencial, f (x) = ex , y de la función potencia,
f (x) = xα , y conociendo la (i) regla de la suma y la ponderación, (ii) la regla del producto, (iii) la regla
del cociente, (iv) la regla de la cadena y (v) la regla de la función inversa (las cinco propiedades),
entonces uno puede obtener la derivada de prácticamente todas las funciones que utilizará a lo largo de
la carrera.
De manera concreta, las dos derivadas conocidas con las cuales uno parte el análisis son:

Importante 1.4 Derivada de función exponencial


Para f : R → R++ tal que f (x) = ex , se tiene f ′ (x) = ex .

Importante 1.5 Derivada de función potencia


Dado α ∈ R y dada f : R++ → R tal que f (x) = xα se tiene que f ′ (x) = α xα−1 .
12 Capítulo 1. Cálculo diferencial (una variable)

N En lo anterior se indicó que el dominio de la función potencia es R++ (reales positivos). En


estricto rigor eso puede cambiar dependiendo del valor del parámetro α (el exponente). Si α ∈ N
(por ejemplo, α = 1, α = 2, α = 3, etc.), el dominio de f (x) = xα es R. En cambio, si α > 0
es una fracción impropia no natural (por ejemplo α = 12 ), entonces el dominio de f es R+ . En
cambio, si α < 0 entonces el dominio no puede incluir el 0, por lo que este es R++ . Cualquiera
que sea el caso, el dominio de las funciones potencia siempre estará claramente establecido.
Ejemplo 1.2 Como consecuencia de la derivada de una función potencia se tiene lo siguiente:
1. Si f (x) = x2 , es decir α = 2, entonces el dominio de f es R y se tiene que f ′ (x) = 2x.

2. Si f (x) = x, es decir α = 12 , entonces el dominio de f es R+ y e tiene que f ′ (x) = 2 √ 1
x
. Note
que el dominio de la función derivada es R++ .
3. Si f (x) = 1x , es decir α = −1 por lo que f (x) = x−1 , entonces el dominio de f es R sin el 0, y se
tiene que f ′ (x) = − x12 .

4. Si f (x) = √1 ,
x
es decir α = −1/2 por lo que f (x) = x−1/2 , entonces el dominio de f es R++ , y
se tiene que f ′ (x) = − 2 x13/2 .

Respecto de los (cinco) propiedades que se aplican para obtener derivadas, se tiene lo siguiente.

Proposición 1.1 Reglas de derivación


Dadas las funciones f : R → R y g : R → R, y dada una constante β ∈ R, se tiene que:
(i) Regla de la suma y ponderación:

( f (x) + β g(x))′ = f ′ (x) + β g′ (x).

(ii) Regla del producto:


( f (x) · g(x))′ = f ′ (x) · g(x) + f (x) · g′ (x).
(iii) Regla del cociente: ′
f ′ (x) · g(x) − f (x) · g′ (x)

f (x)
= .
g(x) [g(x)]2
(iv) Regla de la cadena:
( f (g(x)))′ = f ′ (g(x)) · g′ (x).
(v) Regla de la función inversa:
1
( f −1 )′ (x) = .
f ′ ( f −1 (x))

N La regla de la cadena requiere una explicación complementaria. Para obtener la derivada de


f (g(x)), es decir, la composición de f con g evaluada en x, ( f ◦ g)(x) = f (g(x)), la regla de la
cadena sostiene que, primero, se calcula la derivada genérica de “ f ”, la que se evalúa en g(x) y,
segundo, ese resultado se multiplica por la derivada de “g” evaluada en x. Obviamente que para
aplicar esta regla uno debe identificar las funciones que se están componiendo. A este respecto,
note también que la regla de la cadena se puede aplicar a la composición de tres o más funciones.
Por ejemplo, si h(x) = f3 ( f2 ( f1 (x))) entonces h′ (x) = f3′ ( f2 ( f1 (x))) · ( f2 ( f1 (x)))′ . Así:

h′ (x) = f3′ ( f2 ( f1 (x))) · f2′ ( f1 (x)) · f1′ (x).


2 x
Ejemplo 1.3 Para h(x) = ex +e , encontrar h′ (1) y h′ (0). Para esto, notamos que h(x) = f (g(x)) donde
f (x) = ex y donde g(x) = x2 + ex . Por lo tanto, primero, la derivada (genérica) de f (x) es f ′ (x) = ex ,
1.2 Cálculo efectivo de derivadas 13

mientras que la derivada (genérica) de g(x) es (aplicar regla de la suma) g′ (x) = 2x + ex . Luego, la
2 x
derivada de f (x) evaluada en g(x) es f ′ (g(x)) = eg(x) = ex +e , por lo que (regla de la cadena)
2 +ex
h′ (x) = f ′ (g(x)) · g′ (x) = ex · (2x + ex ).

Como se pide h′ (1), el resultado anterior se evalúa en x = 1 (primero se deriva, de manera genérica,
y luego se evalúa), es decir:
2 +ex x=1 2 +e1
h′ (x) = ex (2x + ex ) =⇒ h′ (1) = e1 (2 · 1 + e1 ) = e1+e (2 + e).

Por otro lado, para obtener la derivada en x = 0 se tiene que


2 +ex x=0 2 0
h′ (x) = ex (2x + ex ) =⇒ h′ (0) = e|0{z
+e
} (2 · 0 + e0 ) = e.
| {z }
e1 1

Ejemplo 1.4 Si f (x) = ex , sabemos que f −1 (x) = ln(x) (logaritmo natural). Por lo tanto, ya que
f ′ (x) = ex se tiene que
1 1 1
( f −1 )′ (x) = ′ −1 = ln(x) = .
| {z } f ( f (x)) e x
(ln(x))′

En lo que sigue, se da por conocida la derivada del logaritmo natural, que junto con la derivada
de la exponencial y la derivada de la función potencia es un resultado clave. ■

x eαx
Ejemplo 1.5 Dados α, β ∈ R, encontrar f ′ (0) cuando f (x) = 2.
En este caso, para derivar
x2 +eβ x
debemos aplicar las reglas de la suma, producto, cociente y cadena para obtener el resultado. Por otro
lado, ya que se pide la derivada en x = 0, primero se obtiene la derivada de manera genérica (es decir,
evaluada en x arbitrario) y luego, con el resultado a la vista, se reemplaza x por 0. Así, por regla del
cociente tenemos que
2 ′
   
x2 + eβ x · (xeαx )′ − (xeαx ) · x2 + eβ x
2

f ′ (x) = 2 2
 .
x2 + eβ x

Para obtener (xeαx )′ aplican regla del producto y regla de la cadena:

(xeαx )′ = (x)′ · eαx + x · (eαx )′ = eαx + xαeαx .


2 ′
 
Por otro lado, para x2 + eβ x aplican regla de la suma y regla de la cadena:

2 ′
  2
x2 + eβ x = 2x + 2β xeβ x .
 2 ′ 2
En el caso de eβ x se considera el hecho que eβ x = f (g(x)) con f (x) = ex y g(x) = β x2 , de
modo que g′ (x) = 2β x. Luego, a partir de todo eso (recuerde que e0 = 1):
 2
  2

x2 + eβ x · (eαx + xαeαx ) − (xeαx ) · 2x + 2β xeβ x x=0
f ′ (x) = 2 2
 ⇒ f ′ (0) = 1.
2
x +e β x


14 Capítulo 1. Cálculo diferencial (una variable)

Ejemplo 1.6 Dado α > 0, considere f : R+ → R tal que f (x) = α x . La derivada de esta función se
obtiene aplicando la regla de la cadena. Teniendo en cuenta que α = eln(α) , ocurre
 x
f (x) = α x = eln(α) = eln(α) x .

Luego, f (x) = h(g(x)) con h(x) = ex y g(x) = ln(α) x. De esta manera,


f ′ (x) = h′ (g(x)) g′ (x) = eln(α) x ln(α) ⇒ f ′ (x) = ln(α) α x .
Cuando α = 1, f (x) es la función constante, cuya derivada cero es concordante con el hecho que
ln(1) = 0. Cuando α = e, lo anterior informa que la derivada de f (x) es ex , ya que ln(e) = 1. ■

Ejemplo 1.7 Considere la función f : R → R tal que f (x) = ln(x2 + 2x ). Ya que f (x) = h(g(x)) con
h(x) = ln(x) y g(x) = x2 + 2x , por regla de la cadena tenemos que
1 ′ 1
f ′ (x) = g (x) = 2 (2x + ln(2) 2x ).
g(x) x + 2x
En general, para una función de la forma f (x) = ln(g(x)) ocurre que
g′ (x)
f ′ (x) = .
g(x)
2 √ 2 √
Por ejemplo, si f (x) = ln(2x + x), es decir, f (x) = ln(g(x)) con g(x) = 2x + x, entonces
g′ (x)
z { }|
1 x2
ln(2) 2x 2 + √
′ 2 x
f (x) = 2 √ .
2x + x
| {z }
g(x)

Ejemplo 1.8 Encuentre la ecuación de la tangente a la curva f (x) = ln(x)e x2 por el punto (1, 0) de ella.
Para esto:
1 2 2 x=1 1 2 2
f ′ (x) = ex + ln(x)2xex ⇒ f ′ (1) = e1 + ln(1)2 · 1e1 = 1 · e + 0 · 2 · e = e.
x 1
2
La ecuación de la recta tangente a la curva f (x) = ln(x)ex por el punto (1, 0) es dada por
 

y(x) = |{z} e x − |{z}


0 + |{z} 1  ⇒ y(x) = ex − e.
f (x0 ) f ′ (x 0) x0

La figura a continuación muestra (línea roja) la recta tangente que se ha obtenido.


2
Figura 1.2: R ECTA TANGENTE A f (x) = ln(x)ex POR EL PUNTO (1, 0)


1.2 Cálculo efectivo de derivadas 15

Ejemplo 1.9 Dados x, y ∈ R, definamos las función f (x) = x · y, y la función g(y) = x · y. Note que
para la función f la variable es “x” de modo que “y” es una constante, mientras que para la función g
la variable es “y” de modo que “x” es una constante. Se tiene que f ′ (x) = y, g′ (y) = x. ■

Ejemplo 1.10 Dados x, y ∈ R++ , definamos las funciones f (x) = xy y g(y) = xy . Para la función f la
variable es “x” de modo que “y” es una constante, mientras que para la función g la variable es “y” de
modo que “x” es una constante. Se tiene entonces que

f ′ (x) = yxy−1 , g′ (y) = ln(x)xy .

Ejemplo 1.11 Para x, y ∈ R definamos las funciones f (x) = x2 y + e xy2


y g(y) = x2 y + e . Para la xy2

función f la variable es “x” de modo que “y” es una constante, mientras que para la función g la variable
es “y” de modo que “x” es una constante. Se tiene entonces que
2 2
f ′ (x) = 2xy + y2 exy , g′ (y) = x2 + 2yxexy .

Ejemplo 1.12 Para x, y ∈ R++ definamos f (x) = ln(1 + x + y2 ) y g(y) = ln(1 + x + y2 ). Así, para
la función f la variable es “x” de modo que “y” es una constante, mientras que para la función g la
variable es “y” de modo que “x” es una constante. Se tiene entonces que
1 2y
f ′ (x) = , g′ (y) = .
1 + x + y2 1 + x + y2

Ejercicio 1.1
√ 1
1. Suponga que f (x) = 5 ex , g(x) = x y que h(x) = x3
. Encuentre la derivada de

f (x) + 2 g(x) − β h(x).

2. Asumiendo que n, s y α son constantes, encuentre la derivada de z(x) cuando

α√ 1 25
z(x) = x − ex + x n + s .
2 n x
3. Para z(x) de la parte anterior, encuentre z′ (1), z′ (y), z′ (△) y z′ ( f (◦)), con f (x) de la parte 1.

Ejercicio 1.2
1. Encuentre f ′ (x0 ) si

ex 1 + x2 1 ex
f (x) = √ , f (x) = √ , f (x) = x2 ex + 1 , f (x) = .
x x x 3 x2

2. Determine f ′ (1) cuando


√ x
 
2 1
f (x) = x · e · x + 2 .
x

16 Capítulo 1. Cálculo diferencial (una variable)

Ejercicio 1.3
1. Dada h(x) = (x2 + 2)ex , encuentre x̄ tal que h′ (x̄) = 0.

2. Para h(x) de la parte anterior, dada g(x) = (1 + x) x encuentre g′ (h(x)). Encuentre además lo
siguiente: g′ (h(1)) · h′ (1).
3. Dada h(x) = ex · x3 · (1 + x2 ), encuentre h′ (1) y h′ (0).
1−ex ′
4. Para f (x) = 1+e x , determine f (0).

Ejercicio 1.4
1. Determine las derivadas en x = 1 de las siguientes funciones:
√ x+1
ex x 2 − ex x+ x x+2+ x − x 3 ex
f (x) = x , g(x) = 2 , h(x) = , j(x) = √ .
e +1 x + 2x + 1 1 + x2 + xex ex + x

2. Determine las derivadas evaluadas en x = 0 de las siguientes funciones:


ex √ 1 √
1+x2
+ x−x x2 +1
+ xex
f (x) = 3 x , g(x) = .
x e +x+1 x + ex + 1
ex
3. Dada f (x) = 1+ex y dada g(x) = x2 + 1, definamos h(x) tal que

g(x)
h(x) = .
x2 + f (x)

Se pide encontrar

la derivada de h(x) evaluada en x = 0.
1+ x
4. Dada f (x) = ex +1 , determine la derivada de f evaluada en f (x), es decir, f ′ ( f (x)).

Ejercicio 1.5 Para las funciones

√ 1
f (x) = ln(1 + x), g(x) = ex y h(x) = ,
x2
se pide encontrar la derivada de

f (x) h(x)
f (x), h(x), , .
g(x) f (x) · g(x)

Ejercicio 1.6 Encuentre f ′ (x̄) cuando f (x) = ln(ln(ln(x))). ■

Ejercicio 1.7 Dados x, y ∈ R++ , definamos


√ √
xy xy
f (x) = , g(y) = .
x + y2 x + y2

Encuentre f ′ (x) y g′ (y) y con esto determine f ′ (1) y g′ (1). ■


2. Aplicaciones de las derivadas

2.1 Derivadas de orden superior y polinomio de Taylor


2.1.1 Derivadas de orden superior
Dada f (x) = x3 , sabemos que f ′ (x) = 3x2 . Note ahora que la función f ′ (x) = 3 x2 se puede volver a
derivar, y el resultado que se obtiene, evaluado en x, es dado por:

Derivada de f ′ (x) = 6 x.
El resultado anterior es “la derivada de la derivada” de f evaluado en x, y se llama segunda
derivada de f (evaluada en x), la que se denota como f ′′ (x). Visto de otra manera,

f ′′ (x) = ( f ′ (x))′ .

Ejercicio 2.1
1. Muestre que si f (x) = ln(x), entonces f ′′ (x) = − x12 .
2. Muestre que si f (x) = ex , entonces f ′′ (x) = f (x).
3. Determine f ′ (△) · f ′′ (◦) cuando

2 1
f (x) = x3 , f (x) = ex , f (x) = .
x2
4. Dada α ∈ R, muestre que f ′′ (x) − 7 f ′ (x) + 10 f (x) = 0 cuando f (x) = e2x + αe5x .

En general, conocida la segunda derivada de f (x) se puede determinar su tercera derivada como la
“derivada de la segunda derivada”. De hecho, habiendo definido la k-derivada de f , podemos definir su
(k + 1)-derivada como “la derivada de la k-derivada”.
Evaluada en x, la k-derivada de f , también llamada derivada de orden k, se denota como

f (k) (x).

En algunas ocasiones se escribe f (1) (x) y f (2) (x) para denotar f ′ (x) y f ′′ (x), respectivamente.
18 Capítulo 2. Aplicaciones de las derivadas

Ejercicio 2.2 Explique por qué la cuarta derivada de un polinomio de grado 3 es cero. ■

Ejercicio 2.3 Explique por qué si f (x) = ex entonces para todo n ∈ N se cumple que f (n) (x) = f (x).

Ejercicio 2.4 Dado α > 0 y f (x) = α x , explique por qué para todo n ∈ N se cumple que

f (n) (x) = [ln(α)]n · α x .

Ejercicio 2.5 Para x ∈ R++ , dado k ∈ N encuentre la expresión de f (k) (x) cuando f (x) = ln(x).

2.1.2 Polinomio de Taylor


Para una función f (x), nos damos un punto x0 ∈ R cuya imagen es f (x0 ). Con esto, el polinomio de
Taylor de orden k ∈ N de f (x) en torno a x0 es

Polinomio de Taylor de orden k de f (x) en torno a x0

f ′′ · (x0 ) f (k) (x0 )


Pk (x) = f (x0 ) + f ′ (x0 ) · (x − x0 ) + · (x − x0 )2 + · · · + · (x − x0 )k ,
2! k!

donde k! = 1 · 2 · 3 · · · k, es el factorial de k.
Note que polinomio de Taylor de orden 1 de f (x) en torno a x0 es la recta tangente al gráfico de
f (x) por el punto (x0 , f (x0 )):
P1 (x) = f (x0 ) + f ′ (x0 ) · (x − x0 ),
mientras que el polinomio de Taylor de orden 2 de f (x) en torno a x0 es la parábola
f ′′ (x0 )
P2 (x) = f (x0 ) + f ′ (x0 ) · (x − x0 ) + · (x − x0 )2 .
2
¿Qué informa lo anterior? Primero, que la función f (x) y el polinomio Pk (x) son tal que, evaluados
en x0 , coinciden y además lo hacen sus derivadas hasta el orden k. Segundo, Pk (x) es una aproximación
polinómica de la función f (x), tanto mejor la aproximación mientras mayor es el grado del polinomio.
Ejemplo 2.1 Determinemos el polinomio de Taylor de orden k de f (x) = ex en torno a x0 = 0. En este
caso, ya que todas las derivadas de f (x) = ex son iguales a la función – f (n) (x) = ex para todo n ∈ N–,
evaluando en x = 0 se obtiene f ′ (0) = e0 = 1, f ′′ (0) = 1, · · · , f (k) (0) = 1, por lo que dicho polinomio
es (notar que (x − x0 )k = xk pues x0 = 0)
x2 x3 x4 xk
Pk (x) = 1 + x + + + +···+ .
2 3! 4! k!
Por ejemplo, usando lo anterior, del hecho que f (1) = e ocurre que ese número se puede aproximar
de la siguiente manera (evaluar Pk (x) con x = 1): para k ∈ N,
1 1 1 1
f (1) = e ≈ 1 + 1 + + + + · · · + .
2 3! 4! k!
2.2 Análisis del crecimiento 19

Mientras mayor es k ocurre que mejor es la aproximación que se obtiene. En efecto, con k = 1 se
obtiene 2 como aproximación de e, con k = 2 se obtiene 2, 5, con k = 3 se obtiene 2, 66666, con k = 4
se obtiene 2, 7083, con k = 5 se obtiene 2, 7166, con k = 6 se obtiene 2, 7180, con k = 7 se obtiene
2, 71825, etc., con k = 17 se obtiene 2.71828182845, que es una aproximación de e con 11 decimales
de precisión. ■

Ejemplo 2.2 Para obtener el polinomio de Taylor de orden 3 de f (x) = ln(1 + x) en torno x0 , se tiene
lo siguiente:

1 1 2
f (x) = ln(1 + x), f ′ (x) = − , f (2) (x) = f (3) (x) = − .
1+x (1 + x)2 (1 + x)3

Luego,

1 1 2
P3 (x) = ln(1 + x0 ) − (x − x0 ) + 2
(x − x0 )2 − (x − x0 )3 .
1 + x0 2 (1 + x0 ) 6 (1 + x0 )3

A partir de lo anterior, tomando x0 = 0 y x = 1, ocurre que P3 (1) aproxima el valor de f (1) = ln(2):

1 1 2 1 1
ln(2) ≈ ln(1 + 0) − (1 − 0) + (1 − 0)2 − (1 − 0)3 = −1 + − ,
1+0 2 (1 + 0)2 6 (1 + 0)3 2 3

por lo que ln(2) ≈ − 56 . Cabe señalar que, por lo general, en la medida que aumentamos el grado del
polinomio de Taylor mejor es la aproximación que se obtiene. ■

Ejercicio 2.6 Encuentre P2 (x) cuando x0 = 1 y f (x) = x ex . ■

Ejercicio 2.7 Encuentre P2 (x) cuando x0 = 0 y f (x) = x ex . ■

Ejercicio 2.8

1. Dada f (x) = x, determine P3 (x) considerando x0 = 1.
2. Dada f (x) = ln(1 + x), determine P4 (x) considerando x0 = 0.
3. Dada f (x) = 1 − 3x + 4x2 , determine P2 (x) considerando x0 = 1.


√ P4 (x) cuando x0 = 0 y f (x) =
Ejercicio 2.9 Encuentre 1 + x. Emplee ese resultado para obtener
una aproximación de 2. ■

2.2 Análisis del crecimiento


Una función f : R → R es creciente cuando x1 < x2 implica que f (x1 ) < f (x2 ), mientras que la función
se dice decreciente cuando x1 < x2 implica que f (x1 ) > f (x2 ). La Figura 2.1 muestra el gráfico de
cuatro funciones crecientes.
20 Capítulo 2. Aplicaciones de las derivadas

Figura 2.1: G RÁFICO DE FUNCIONES CRECIENTES

La Figura 2.2 muestra que para funciones crecientes ocurre que la derivada es positiva. Destaca el
hecho que para funciones lineales, la derivada es constante e igual a la pendiente de la recta.

Figura 2.2: G RÁFICO DE FUNCIONES CRECIENTES : DERIVADA ES POSITIVA

Para funciones decrecientes, la Figura 2.3 muestra que la derivada es negativa.

Figura 2.3: G RÁFICO DE FUNCIONES DECRECIENTES : DERIVADA ES NEGATIVA

Por último, para función que es creciente en cierta región (intervalo), y decreciente en otra región,
las derivadas correspondientes serán positivas o negativas en el intervalo respectivo. La Figura 2.4
muestra este hecho. En ella se tiene que

(1) : f ′ (x) > 0 cuando x < x1 ∨ x > x2 , (2) : f ′ (x) < 0 cuando x1 < x < x2 .
2.2 Análisis del crecimiento 21

Figura 2.4: F UNCIONES CRECIENTES - DECRECIENTES POR TRAMOS Y SU DERIVADA

El resultado a continuación resume los hallazgos anteriores. En él, se considera que el dominio de
la función es R, pudiendo ser otro conjunto donde se determina la derivada de la función.

Proposición 2.1
(a) Una función f : R → R es creciente cuando su derivada es positiva.
(b) Una función f : R → R es decreciente cuando su derivada es negativa.
En general, la región donde la función f : R → R es creciente es donde su derivada es positiva,
mientras que la región donde es decreciente es donde su derivada es negativa.

N Intuición del resultado


Suponiendo que el gráfico de una función f es un camino (senda), el hecho que el camino vaya
en subida cuando nos movemos de izquierda a derecha corresponde a decir que la pendiente que
enfrentamos es positiva (subida), mientras que si el camino va en bajada es porque la pendiente del
camino es negativa. A este respecto, “movernos” de izquierda a derecha corresponde a aumentar el
valor de “x”, y que la pendiente sea positiva (negativa) es porque la derivada es positiva (negativa).
Luego, un camino en subida corresponde a que la curva es creciente, y su derivada es positiva,
mientras que un camino en bajada es porque la función es decreciente, con pendiente negativa.
Ejemplo 2.3 La función f : R → R tal que f (x) = x2 − 3x + 2 no es creciente ni decreciente. Sin
embargo, hay una región donde ella es creciente y otra región donde es decreciente. Para encontrar
esas regiones usamos la propiedad anterior. La derivada de f (x) es f ′ (x) = 2x − 3, por lo que:
• f (x) es creciente cuando f ′ (x) > 0, es decir, cuando 2x − 3 > 0 ⇔ x > 3/2.
• f (x) es decreciente cuando f ′ (x) < 0, es decir, cuando 2x − 3 < 0 ⇔ x < 3/2.
El resultado anterior se ilustra en la Figura 2.5. En ella se muestra que cuando x < 3/2 la derivada
de f (x) es negativa de modo que la función es decreciente, mientras que cuando x > 3/2 la derivada es
positiva, de modo que la función es creciente.

Figura 2.5: C RECIMIENTO DE f (x) = x2 − 3x + 2


22 Capítulo 2. Aplicaciones de las derivadas

Ejemplo 2.4 Consideremos f : R++ → R tal que f (x) = xb , donde b es una constante. Se considera
que el dominio son los reales positivos ya que el exponente puede un número real cualquiera. Dado
esto, el análisis del crecimiento de esta función requiere el estudio del signo de la derivada de f (x):

f ′ (x) = b · xb−1 .

Ya que x > 0, ocurre que xb−1 es positivo para cualquier “b”. Por lo tanto, el signo de la derivada “lo
manda” el signo de “b”. Se tiene entonces que
(a) f (x) = xb es creciente cuando f ′ (x) = b · xb−1 > 0, es decir, cuando b > 0.
(b) f (x) = xb es decreciente cuando f ′ (x) = b · xb−1 < 0, es decir, cuando b < 0.

Ejemplo 2.5 Estudiemos el crecimiento de f (x) = ln(x) − x, donde se asume que x > 0. En este caso,
la derivada de f (x) es f ′ (x) = 1x − 1, por lo que la función es creciente cuando

1 1
−1 > 0 ⇒ >1 ⇒ 0 < x < 1.
x x
Recuerde que por condición se asume x positivo. Por otro lado, de lo anterior es directo que la función
es decreciente cuando x > 1, pues en tal caso la derivada de la función es negativa. ■

Ejemplo 2.6 Dado β > 0, ¿en qué región se cumple que f (x) = eβ x − x es decreciente? Para responder,
necesitamos la derivada de f (x), dada por f ′ (x) = β eβ x − 1. Luego, la función f (x) es decreciente
cuando
1
β eβ x − 1 < 0 ⇒ eβ x < .
β
Como el logaritmo natural es creciente, aplicándolo a ambos lados en la desigualdad anterior se
tiene que  
βx 1 1
e < ⇒ β x < ln ,
β β
por lo que la función es creciente cuando
ln(β )
β x < − ln(β ) ⇒ x<− .
β
La siguiente figura muestra el gráfico de f (x) cuando β = 5.


2.2 Análisis del crecimiento 23

Ejemplo 2.7 Estudiemos el crecimiento g(x) = x2 ex . Como g′ (x) = 2xex +x2 ex = (2x+x2 ) ex , teniendo
presente que ex > 0, obtenemos

g′ (x) > 0 ⇐⇒ 2x + x2 > 0 ⇐⇒ x(2 + x) > 0.

En consecuencia, la función es creciente cuando

(i) : (x > 0 ∧ 2 + x > 0) ∨ (ii) : (x < 0 ∧ 2 + x < 0).

Por (i), x > 0 y por (ii) se tiene que x < −2. Luego, f (x) = x2 ex es creciente en el conjunto

] − ∞, −2[∪]0, +∞[,

y es decreciente en el intervalo ] − 2, 0[. ■

Ejercicio 2.10
(a) Para f (x) = 1 − 2x − x2 , determine la región donde f (x) es creciente y la región donde es
decreciente.
(b) Para f (x) = 1 − 2x + x2 , determine la región donde f (x) es creciente, y la región donde es
decreciente.
(c) Sobre lo anterior, concluya un resultado general para f : R → R tal que

f (x) = c + bx + ax2 .

Considere los casos a > 0 y a < 0.


Ejercicio 2.11 Explique por qué f (x) = 21 (ex + e−x ) es creciente cuando x > 0, y es decreciente
cuando x < 0. ■

Ejercicio 2.12
1. Dada una constante b ∈ R, explique por qué f (x) = e−b x es creciente cuando b < 0 y es
decreciente cuando b > 0.
2
2. Analice el crecimiento f (x) = ex (es decir, determine las regiones donde la función f (x) es
creciente y aquellas donde es decreciente).
3. Analice el crecimiento de f (x) = x3 ex .

Ejercicio 2.13 Muestre que f (x) = ln(1 + x2 ) es creciente cuando x > 0 y decreciente si x < 0. ■

Ejercicio 2.14 Dado k ∈ N, explique por qué h(x) = xk e−x es creciente en el intervalo ]0, k[, y es
decreciente en ] − ∞, 0[∪]k, +∞[. ■

Ejercicio 2.15 Muestre que f : R++ → R tal que f (x) = x ln(x) es creciente cuando x > 1e . ■
24 Capítulo 2. Aplicaciones de las derivadas

Ejercicio 2.16 Suponga que f : R → R y g : R → R son dos funciones crecientes. Usando la regla
de la cadena, explique por qué la función h : R → R tal que h(x) = f (g(x)) es creciente. ■

Ejercicio 2.17 Suponiendo que f : R → R+ es una función creciente, usando derivadas explique
1
por qué la función g(x) = 1+ f (x) es decreciente. ■

Ejercicio 2.18 Si la función f (x) es creciente, ¿la función g(x) = ( f (x))2 es creciente? ■

2.3 Concavidad - convexidad de funciones reales


2.3.1 Idea y concepto
La idea de convexidad - concavidad de funciones es fundamental, entre otros, en el estudio de problemas
de optimización. Para comenzar, recordemos el concepto de “combinación convexa” de puntos, que es
una (nueva) forma de llamar al promedio ponderado de cantidades.
Definición 2.1 Para x1 , x2 ∈ R tal que x1 < x2 , una combinación convexa de x1 y x2 es la cantidad

λ x1 + (1 − λ )x2

donde λ ∈ [0, 1] es un “ponderador”.

Importante 2.1 Desde un punto de vista geométrico, suponiendo que x1 < x2 , el conjunto de todas
las combinaciones convexas de x1 y x2 es el intervalo [x1 , x2 ]: cualquier elemento x ∈ [x1 , x2 ] se
puede escribir como x = λ x1 + (1 − λ )x2 , para algún λ ∈ [0, 1]. Note que los elementos del intervalo
abierto ]x1 , x2 [ son combinaciones convexas de x1 y x2 donde λ ∈]0, 1[.

Ejemplo 2.8 Supongamos que el valor de x1 representa, en alguna escala, el color blanco, y que el
valor de x2 representa el color negro. Se tiene entonces que una combinación convexa de x1 y x2 ,
digamos λ x1 + (1 − λ )x2 , es algún tono gris. En la medida que λ es más cercano a uno, el gris es más
claro (le da más peso al blanco que al negro), mientras que cuando λ es cercano a cero, de modo que
1 − λ es cercano a uno, el resultado es un gris más oscuro. Todos los tonos de gris, pasando de blanco
a negro, se obtienen “moviendo” el ponderador λ entre 0 y 1. ■

En la siguiente definición el dominio de las funciones es R, aunque se puede extender para


considerar que sea un intervalo.
Definición 2.2 Dada f : R → R, se dice que:
(a) f es una función convexa si para todo x1 , x2 ∈ R y para todo λ ∈ ]0, 1[ se cumple
f (λ x1 + (1 − λ )x2 ) < λ f (x1 ) + (1 − λ ) f (x2 ) (2.1)
(b) f es una función cóncava si para todo x1 , x2 ∈ R y para todo λ ∈ ]0, 1[ se cumple
f (λ x1 + (1 − λ )x2 ) > λ f (x1 ) + (1 − λ ) f (x2 ) (2.2)
En complemento, se dice que
(a1) f es una función débilmente convexa si para todo x1 , x2 ∈ R y para todo λ ∈ [0, 1] se cumple
f (λ x1 + (1 − λ )x2 ) ≤ λ f (x1 ) + (1 − λ ) f (x2 ) (2.3)
(b1) f es una función débilmente cóncava si para todo x1 , x2 ∈ R y para todo λ ∈ [0, 1] se cumple
f (λ x1 + (1 − λ )x2 ) ≥ λ f (x1 ) + (1 − λ ) f (x2 ) (2.4)
2.3 Concavidad - convexidad de funciones reales 25

Importante 2.2 Dada f : R → R definamos (− f ) : R → R tal que (− f )(x) = − f (x), es decir, la


función − f es el negativo de la función f . Es directo ver que si f es convexa entonces − f es cóncava.
Así, cambiando de manera adecuada los signos y sentido de las desigualdades, las propiedades de
funciones cóncavas son directas a partir de propiedades de funciones convexas, y viceversa.

Importante 2.3 Desde un punto de vista geométrico, la desigualdad que define la convexidad de
una función corresponde a decir que el trazo recto que une dos puntos cualquiera del gráfico de
la función está arriba del gráfico entre esos puntos. En la Figura 2.6 consideremos dos puntos del
gráfico de la función convexa f , digamos A = (x1 , f (x1 )) y B = (x2 , f (x2 )). La recta azul L(x) en
esa figura es aquella que pasa por esos puntos.

Figura 2.6: F UNCIÓN CONVEXA

La función es convexa si la recta que une los puntos del gráfico está arriba de la porción
correspondiente del gráfico salvo, obviamente, en x1 y x2 donde gráfico y recta coinciden. Por este
hecho, el gráfico de funciones convexas no tiene lados rectos, y eso hace la diferencia con una
función que es débilmente convexa, la que tiene un gráfico con partes rectas.

Sobre la base de lo anterior resulta entonces sencillo identificar, a partir de un gráfico, si una
función es convexa o si es cóncava. En la Figura 2.7 se observa que:
• la función (1) es convexa y, además, es decreciente en cierto rango de valores y creciente en otro
rango de valores de la variable,
• la función (2) es débilmente convexa ya que el gráfico tiene un tramo recto. Además esa función
es creciente en cierta región y decreciente en otra,
• la función (3) es convexa y, además, es decreciente en su dominio,
• la función (4) es convexa y, además, es creciente en su dominio.
Figura 2.7: F UNCIONES CONVEXAS Y DÉBIL CONVEXA
26 Capítulo 2. Aplicaciones de las derivadas

Importante 2.4 Por lo visto, destaca el hecho que ser convexa no necesariamente tiene relación con
ser creciente o decreciente. Visto de otra manera, y este punto es importante: una función convexa
puede ser creciente, puede ser decreciente o bien tener comportamiento mixto en cuanto al
crecimiento.
Volviendo a las funciones mostradas en la Figura 2.7, para aquellas que son convexas en esa figura
(es decir, las funciones (1), (3) y (4)), ocurre que la derivada de cada una de ellas es creciente, es
decir, f ′ (x) aumenta en la medida que x aumenta, por lo que f ′′ (x) > 0. Note que la función en (2)
tiene derivada constante en el tramo recto, de modo que solo es débilmente convexa. Además, esa
función no tiene derivada el punto esquina. La Figura 2.8 es ilustrativa.

Figura 2.8: F UNCIONES CONVEXA : DERIVADA CRECIENTE

Para funciones cóncavas, en la Figura 2.9 se puede apreciar que la derivada es decreciente para
los casos (1), (3) y (4) es decir, f ′′ (x) < 0. Note además que la función (2) es débilmente cóncava
(gráfico tiene lado recto) y, además, esa función no tiene derivada en la “punta superior”.

Figura 2.9: F UNCIONES CÓNCAVAS : DERIVADA DECRECIENTE


2.3 Concavidad - convexidad de funciones reales 27

Importante 2.5 Sobre la base de todo lo expuesto, la convexidad de una función se puede ver desde
tres puntos de vista equivalentes, de modo que (a), (b) y (c) a continuación informan lo mismo:
(a) para todo x1 , x2 ∈ R, y para todo λ ∈]0, 1[ se cumple que

f (λ x1 + (1 − λ )x2 ) < λ f (x1 ) + (1 − λ ) f (x2 ).

(b) para todo x1 , x2 ∈ R, con x1 < x2 , el segmento de recta que une los puntos (x1 , f (x1 )) y
(x2 , f (x2 )) está arriba del gráfico de f (x) (no lo toca) cuando x varía entre x1 y x2 , sin
incluirlos,
(c) f ′′ (x) > 0.
La adecuación de lo recién expuesto para una función cóncava es directo.

Ejemplo 2.9 De manera “intuitiva” sabemos que f : R → R tal que f (x) = x2 es una función convexa.
Verifiquemos esto usando la propiedad anterior, para lo cual necesitamos determinar el signo de su
segunda derivada de esa función. Así,

f (x) = x2 ⇒ f ′ (x) = 2x ⇒ f ′′ (x) = 2.

Por lo tanto, la segunda derivada es igual a 2, independiente del valor de x, es decir, para todo x se
cumple que f ′′ (x) > 0. Por lo tanto, f (x) = x2 es convexa.
Más general, considerando una parábola cualquiera f (x) = ax2 + bx + c, se tiene que

f ′ (x) = 2ax + b ⇒ f ′′ (x) = 2a.

Por lo tanto, la función f (x) = ax2 + bx + c es convexa cuando f ′′ (x) > 0, lo cual se cumple cuando
a > 0. Por otro lado, la parábola f (x) = ax2 + bx + c es cóncava cuando f ′′ (x) < 0, lo que ocurre si
a < 0. Por último, note que, independiente de si es cóncava o convexa, una función cuadrática no es ni
creciente, ni decreciente en todo su dominio. ■

Ejemplo 2.10 Concavidad del logaritmo natural


Mostremos que la función logaritmo natural es cóncava. Recordando que el dominio de esa función
es R++ , tenemos que

1 1
f (x) = ln(x) ⇒ f ′ (x) = ⇒ f ′′ (x) = − < 0,
x x2
por lo que la función es cóncava. Visto de otra manera, hemos probado que para todo x1 , x2 ∈ R++ y
para todo λ ∈]0, 1[ se cumple que

ln(λ x1 + (1 − λ )x2 ) > λ ln(x1 ) + (1 − λ ) ln(x2 ).


1

Ya que f (x) = ln(x) es cóncava, g(x) = − ln(x) = ln x , definida en R++ , es convexa. ■

Ejemplo 2.11 Convexidad de la función exponencial


Mostremos que la función f (x) = ex es convexa en R. En efecto, tenemos que:

f (x) = ex ⇒ f ′ (x) = ex ⇒ f ′′ (x) = ex .

Ya que la exponencial es positiva para cualquier valor del argumento, ocurre que f ′′ (x) > 0 para todo x,
es decir, la función f (x) = ex es convexa.
28 Capítulo 2. Aplicaciones de las derivadas

Considere ahora la función g : R → R tal que g(x) = e−x . Se tiene entonces que:
g(x) = e−x ⇒ g′ (x) = −e−x ⇒ g′′ (x) = e−x > 0.
Por lo tanto, la función g(x) = e−x también es convexa. Note que la función f (x) es creciente y que la
función g(x) es decreciente. ■

Ejemplo 2.12 Convexidad - concavidad de las funciones potencia


Dado α ∈ R, estudiemos la concavidad / convexidad de la función f : R++ → R tal que f (x) = xα .
Se considera que el dominio son los reales positivos porque α puede tomar valores negativos y/o
fraccionarios. Dado esto, notamos que si f (x) = xα , entonces f ′ (x) = α · xα−1 y f ′′ (x) = α · (α −
1) · xα−2 . Por lo tanto, para determinar el signo de la segunda derivada, en primer lugar notamos que
x ∈ R++ , de modo que independiente del valor de α ocurre que xα−2 es una cantidad positiva. Por
lo tanto, el signo de la segunda derivada “lo manda” el signo de la cantidad α · (α − 1). Así, cuando
α · (α − 1) > 0 ocurre que f (x) = xα es convexa, y cuando α · (α − 1) < 0 ocurre que f (x) = xα es
cóncava. A este respecto se tiene que α(α − 1) > 0 cuando
   

| −{z ⇒ ∨ | −{z ⇒
α > 0, α 1 > 0} α > 1 α < 0, α 1 < 0} α < 0 ,
α>1 α<1

por lo que, resumiendo:


α(α − 1) > 0 cuando α < 0 ∨ α > 1, α(α − 1) < 0 cuando α ∈]0, 1[.
De esta manera, definidas en R++ , las siguientes funciones son convexas (exponente mayor que uno o
bien exponente negativo)
1 1
f (x) = x2 , f (x) = √ , f (x) = x3/2 , f (x) = ,
x x
mientras que las siguientes funciones son cóncavas (exponente entre cero y uno)

f (x) = x, f (x) = x1/3 , f (x) = x4/5 .
Note también que cuando α = 1 ocurre que f ′′ (x) = 0. La función lineal es débilmente convexa y
débilmente cóncava a la vez (caso extremo). La siguiente figura es ilustrativa de los casos indicados.

Figura 2.10: C ONVEXIDAD / CONCAVIDAD DE LA FUNCIÓN f (x) = xα


2.3 Concavidad - convexidad de funciones reales 29

Ejercicio 2.19
1. Usando derivadas, muestre que f (x) = 12 (ex + e−x ) es convexa.
2. Usando la caracterización geométrica, explique por qué f (x) = |x| es débilmente convexa.
3. Usando derivadas, explique por la función f : R− → R tal que f (x) = x3 es una función
cóncava. El conjunto R− corresponde a los reales menores o iguales a cero.

Ejercicio 2.20 Suponga que φ : R → R es una función cóncava. Explique por qué la función
f (x) = x + φ (x) es cóncava. ■

Ejercicio 2.21 Suponga que φ : R → R es una función convexa. Explique por qué la función
f (x) = x + φ (x) es convexa. ■

Ejercicio 2.22 Recodemos que la regla de la cadena establece que [ f (g(x))]′ = f ′ (g(x)) · g′ (x).
(a) Aplicando la regla de la cadena y la regla del producto, explique por qué se cumple lo siguiente:

[ f (g(x))]′′ = f ′′ (g(x)) · [g′ (x)]2 + f ′ (g(x)) · g′′ (x).

(b) Concluya que si f y g son funciones convexas y f es creciente, entonces f ◦ g es convexa.


Ejercicio 2.23 ¿La suma de funciones convexas es una función convexa? ¿El producto de funciones
convexas es una función convexa? ■

Ejercicio 2.24 Dado a > 0, con a ̸= 1, explique por qué f (x) = ax es convexa.
En complemento, distinguiendo los casos 0 < a < 1 y a > 1, concluya que si 0 < a < 1 ocurre
que la función f (x) = ax es decreciente y convexa, mientras que si a > 1 ocurre que la función es
creciente y convexa. ■

Ejercicio 2.25 Por la regla de la función inversa sabemos que

′ 1
f −1 (x) = .
f ′ ( f −1 (x))

(a) Con lo anterior, usando la regla del cociente y nuevamente la regla de la cadena, muestre que

′′ − f ′′ ( f −1 (x)) · ( f −1 )′ (x) − f ′′ ( f −1 (x))


f −1 (x) = = ′ −1 .
[ f ′ ( f −1 (x))]2 [ f ( f (x))]3

(b) Suponiendo que f es convexa y creciente, usando la parte (a) explique por qué f −1 (x) es una
función cóncava.

2.3.2 Convexidad - concavidad desde un punto de vista local


Para terminar esta parte, destacamos el hecho que, en general, una función no necesariamente será
cóncava o convexa. Más bien, podría cumplir alguna de esas propiedades en cierta región, pero no
30 Capítulo 2. Aplicaciones de las derivadas

necesariamente en todo el dominio. Por ejemplo, la función que se muestra en la Figura 2.11 no es ni
cóncava, ni convexa en su dominio. Sin embargo, sí podemos decir que es cóncava en cierta región
(donde la segunda derivada es negativa) y que es convexa en otra región (donde la segunda derivada es
positiva). Se trata entonces de analizar la convexidad / concavidad desde un punto de vista local.

Figura 2.11: F UNCIÓN QUE NO ES CONVEXA NI CÓNCAVA

La región (intervalo) donde la función es convexa de manera local es aquella definida por los
“x” donde f ′′ (x) > 0, mientras que región (intervalo) donde la función es cóncava de manera local
es aquella definida por los “x” donde f ′′ (x) < 0. El (o los) puntos donde se separan estas regiones de
concavidad / convexidad, se llaman punto de inflexión de la función, y se caracterizan por el hecho
que en ellos la segunda derivada es 0:

x0 punto de inflexión de f (x)

f ′′ (x0 ) = 0

La siguiente figura es ilustrativa de lo recién expuesto.

Figura 2.12: P UNTO DE INFLEXIÓN Y CAMBIO DE TIPO DE CONVEXIDAD

Ejemplo 2.13 El gráfico de la función f : R → R tal que f (x) = x3 − 2x2 + 1 se muestra en la Figura
2.13. En él se observa que la función f no es ni convexa, ni cóncava en su dominio. Sin embargo,
desde un punto de vista local hay regiones donde es convexa y regiones donde es cóncava.
2.3 Concavidad - convexidad de funciones reales 31

Figura 2.13: G RÁFICO DE f (x) = x3 − 2x2 + 1

Tomando derivadas, se tiene que si f (x) = x3 − 2x2 + 1, entonces f ′ (x) = 3x2 − 4x, por lo que
f ′′ (x) = 6x − 4. Por lo tanto, la función es convexa de manera local cuando f ′′ (x) > 0, es decir, cuando:
 
2
6x − 4 > 0 ⇒ x ∈ , +∞ ,
3

mientras que es cóncava de manera local cuando x ∈ −∞, 32 . Finalmente, el punto de inflexión de
 

f (x) es x = 23 . ■

Ejemplo 2.14 En el Ejemplo 2.12 se estudió la convexidad / concavidad de las funciones potencia
f (x) = xα asumiendo que el dominio es R++ . Sin embargo, cuando el exponente es un número
natural, el dominio de las potencias es R, en cuyo caso puede ocurrir que las funciones no son ni
convexas, ni cóncavas. Por ejemplo, la función f : R → R tal que f (x) = x3 tiene el siguiente gráfico.

Figura 2.14: G RÁFICO DE f (x) = x3 CON DOMINIO R

En la Figura 2.14 se observa que cuando x < 0 la función es cóncava, mientras que cuando x > 0
es convexa . Esto debería quedar reflejando con las derivadas de la función. Puesto que f ′ (x) = 3x2 y
f ′′ (x) = 6 x, se tiene lo siguiente:
• la función f (x) = x3 , con dominio R, es convexa de manera local cuando 6x > 0, es decir, cuando
x > 0,
• la función f (x) = x3 , con dominio R, es cóncava de manera local cuando 6x < 0, es decir, cuando
x < 0,
• la función tiene un punto de inflexión en x = 0.

32 Capítulo 2. Aplicaciones de las derivadas

Ejemplo 2.15 Analicemos la convexidad - concavidad de f (x) = ln(x2 + 1), cuyo dominio es R. Para
eso, como f (x) = ln(x2 + 1), tenemos que f ′ (x) = 1
x2 +1
· (2x), implicando que
′
(x2 + 1) · 2 − (2x) · (2x) 2 − 2x2

′′ 2x
f (x) = 2
= = .
x +1 (x2 + 1)2 (x2 + 1)2
Luego, como el signo de la segunda derivada “lo manda” el numerador de expresión anterior (el
denominador es siempre positivo), se tiene que:

f ′′ (x) > 0 ⇔ 2 − 2x2 > 0 ⇒ x2 < 1 ⇒ x ∈] − 1, 1[.

Por lo tanto, la función es convexa de manera local en el intervalo ] − 1, 1[, pues allí la segunda derivada
es positiva, y es cóncava de manera local en caso contrario (donde la segunda derivada es negativa).
Notemos también que los puntos de inflexión cumplen que:

2 − 2x2
f ′′ (x) = =0 ⇒ 2 − 2x2 = 0 ⇒ x2 = 1 ⇒ x1 = 1, x2 = −1.
(x2 + 1)2
El gráfico de esta función es como sigue.

Figura 2.15: G RÁFICO DE f (x) = ln(x2 + 1)

Ejemplo 2.16 La función f : R → R tal que f (x) = 1+e1 −x es tal que

e−x −e−x (1 + e−x )2 − e−x 2(1 + e−x ) · (−e−x )


f ′ (x) = ⇒ f ′′ (x) = ,
(1 + e−x )2 (1 + e−x )4
es decir,
e−x (1 + e−x ) [−(1 + e−x ) + 2 e−x ] e−x (1 + e−x ) [e−x − 1]
f ′′ (x) = = .
(1 + e−x )4 (1 + e−x )4
Por lo tanto, ya que las exponenciales son positivas, el signo de la segunda derivada lo manda la
cantidad e−x − 1 en el numerador. Se tiene entonces que f es convexa de manera local cuando

f ′′ (x) > 0 ⇒ e−x − 1 > 0 ⇒ e−x > 1 ⇒ −x > 0 ⇒ x < 0.

Por lo tanto, para x > 0 ocurre que f es cóncava de manera local. Además, el punto de inflexión de
f (x) = 1+e1 −x es x = 0. ■
2.3 Concavidad - convexidad de funciones reales 33

Ejercicio 2.26 Para a > 0 una constante, analice la concavidad / convexidad, es decir, “indique las
regiones donde es convexa y las regiones donde es cóncava, identificando los puntos de inflexión”,
de la función f (x) = 1+e1−a·x . Haga lo mismo para la función g(x) = 1+e
1
ax .

Ejercicio 2.27 Analice la concavidad / convexidad de las siguientes funciones:

x ex
f1 (x) = x3 ex , f2 (x) = , f3 (x) = ln(1 + x2 ), f4 (x) = x3 + x, f5 (x) = .
1 + x2 1 + ex

1 2
Ejercicio 2.28 Sea µ > 0 un parámetro dado y sea f (x) = e− 2 (x−µ) .
(a) Muestre que
1 2 1 2
f ′ (x) = −(x − µ) e− 2 (x−µ) , f ′′ (x) = [(x − µ)2 − 1] e− 2 (x−µ)

(b) Concluya que f (x) es convexa cuando x > 1 + µ o bien cuando x < −1 + µ.
(c) Concluya que f (x) es cóncava cuando x ∈] − 1 + µ, 1 + µ[.
(e) Encuentre los puntos de inflexión de f (x).

2.3.3 *Complementos sobre convexidad


2.3.3.1 Aspectos geométricos adicionales
Para una función f : R → R, dado x0 ∈ R sabemos que la recta tangente al gráfico de f por el punto
(x0 , f (x0 )) tiene ecuación y(x) = f (x0 ) + f ′ (x0 ) (x − x0 ). En general, se entiende que la tangencia de
esa recta con el gráfico de la función es en un sentido local, es decir, “en torno” a x0 . Por lo mismo,
puede ocurrir que al prolongar la recta en el espacio podría intersectar al gráfico de la función en otro
punto. La siguiente figura es ilustrativa.

Figura 2.16: R ECTA “ TANGENTE ” ES LOCAL

A este respecto, para una función f : R → R convexa, la recta tangente “toca” a la función solo en
el punto donde se determinó. Es decir, al prolongar la recta “no vuelve a haber intersección con la
curva”. De esta manera, salvo en el punto donde se calcula la recta, todo el gráfico de la función queda
arriba de la recta en cuestión. La siguiente figura es ilustrativa.
34 Capítulo 2. Aplicaciones de las derivadas

Figura 2.17: R ECTA “ TANGENTE ” DE FUNCIÓN CONVEXA

Sobre la base de lo anterior, otra diferencia entre una función convexa y una función débilmente
convexa es que para la primera ocurre que la recta tangente “toca” a la función en un solo punto,
quedando el resto del gráfico arriba de la recta; en cambio, para una función débilmente convexa el
gráfico de la función queda arriba de la recta, pero hay más de un punto (usualmente infinitos puntos)
donde se intersecta con la recta tangente: las curvas débilmente convexas pueden tener lados rectos, y
es precisamente en esa porción donde alguna recta tangente puede intersectar en infinitos puntos con el
gráfico. Por este hecho, las funciones convexas son “redondeadas”, sin tramos rectos.
2.3.3.2 Crecimiento de niveles y crecimiento de marginales
Suponga que N(t) es la nota que obtengo en una prueba de cierto ramo si estudio t horas. Supongamos
también que estudiar más es beneficioso, por lo que N(t) es una función creciente en el argumento. A
este respecto, si estudio una hora adicional se tiene que el aporte marginal a la nota (es decir, el extra
de nota que entrega estudiar una hora adicional) es N ′ (t) > 0 (el marginal es positivo ya que estamos
suponiendo que la función es creciente en t).
Sobre la base de lo anterior, la pregunta es la siguiente: ya que cada hora de estudio aporta
positivamente a la nota, ¿es acaso cierto que cada hora adicional aporta cada vez más a la nota?,
¿o aporta cada vez menos? Visto de otra manera, la primera hora aporta cierta cantidad a la nota, la
segunda hora aporta más que la primera, la tercera aporta más que la segunda, y así sucesivamente, o
bien, la primera ahora aporta cierta cantidad al resultado, la segunda hora aporta menos que la primera,
la tercera menos que la segunda, etc.
Respecto de lo anterior, dentro de las opciones indicadas, la que parece más razonable es que la
“primera hora aporta cierta cantidad a la nota, pero que la segunda aporta menos que la primera, que la
tercera aporta menos que la segunda, etc., eso en vez de que el aporte marginal sea creciente.
El hecho de que cada hora de estudio aporta cada vez menos a la nota corresponde a decir que
el cambio marginal de la nota (positivo) es cada vez más pequeño, es decir, que la derivada N ′ (t) es
decreciente. Esto último corresponde a decir que la función N(t) es cóncava, pues esas funciones se
caracterizan por hecho que la derivada es decreciente, es decir, la segunda derivada es negativa. Si
fuera que cada hora adicional de estudio aporta cada vez más a la nota, entonces la función nota sería
convexa en el argumento.
Entrenar más mejora el rendimiento deportivo. Sin embargo, nuevamente parece ser cierto que
cada hora adicional de entrenamiento aporta cada vez menos al resultado. Es decir, la primera hora
puede resultar muy productiva, pero la segunda es seguramente menos productiva que la primera, la
tercera menos productiva que la segunda, etc. Es decir, el rendimiento deportivo como función del
tiempo de entrenamiento parece, nuevamente, ser una función cóncava.
En los dos ejemplos anteriores, las funciones nota y logro deportivo son funciones crecientes (más
2.4 Máximos y mínimos de funciones 35

estudio implica mejor nota; más entrenamiento implica mejor logro). Sin embargo, a pesar de que los
niveles son crecientes con el argumento, ocurre que los marginales son decrecientes.

¿Hay fenómenos donde el nivel y el marginal son crecientes? La respuesta es sí. Por ejemplo el
tiempo de viaje promedio en una ciudad como función de la cantidad de vehículos que circula en la
ciudad es una función creciente (más autos implica más tiempo de viaje). Sin embargo, en la medida
que aumenta la cantidad de vehículos ocurre que el tiempo de viaje no sólo es mayor, si no que es mayor
de manera creciente: la evidencia indica que el tiempo de viaje promedio crece de manera exponencial
con la cantidad de vehículos que circulan en la ciudad. En este caso, la función que relaciona tiempo
de viaje promedio con cantidad de vehículos sería una función creciente y convexa.

En general, que los niveles sean crecientes o decrecientes es una cuestión del crecimiento /
decrecimiento de la función, y eso se relaciona con el signo de la primera derivada. Sin embargo, el
crecimiento o decrecimiento de los marginales es una cuestión que se relaciona con el crecimiento /
decrecimiento de la derivada, es decir, con el signo de la segunda derivada.

En la práctica, puede haber “situaciones” donde las funciones:


• son crecientes en nivel pero decrecientes en marginal, y eso ocurre

cuando la función es creciente
y cóncava. Por ejemplo, cuando x > 0 es el caso de f (x) = x, f (x) = ln(x), pues para ambas
se tiene que f ′ (x) > 0 y f ′′ (x) < 0,
• son crecientes en nivel y crecientes en marginal, y eso ocurre cuando la función es creciente y
convexa. Por ejemplo, cuando x > 0 es el caso de f (x) = x2 , f (x) = ex , pues para ambas se tiene
que f ′ (x) > 0 y f ′′ (x) > 0,
• son decrecientes en nivel y crecientes en marginal, y eso ocurre cuando la función es decreciente
y convexa. Por ejemplo, cuando x > 0 es el caso de f (x) = 1x , f (x) = e−x , pues para ambas se
tiene que f ′ (x) < 0 y f ′′ (x) > 0,
• son decrecientes en nivel y decrecientes en marginal, y eso ocurre cuando
√ la función es decre-
ciente y cóncava. Por ejemplo, cuando x ∈]0, 1[ es el caso de f (x) = 1 − x2 , pues esa función
se tiene que f ′ (x) < 0 y f ′′ (x) < 0.

2.4 Máximos y mínimos de funciones


2.4.1 Óptimos locales
La idea de un óptimo local de una función es la idea de puntos donde esta alcanza valores máximos o
valores mínimos en torno a él, es decir, en un intervalo al que dicho punto pertenece.
Definición 2.3 Dada f : R → R, se dice que:
(a) x1 es un punto donde la función f tiene un máximo local si existe ε1 > 0 tal que f (x1 ) es el
mayor valor que la función puede tomar en el intervalo ]x1 − ε1 , x1 + ε1 [, es decir, para todo
x ∈]x1 − ε1 , x1 + ε1 [ se cumple que f (x) ≤ f (x1 ).
(b) x2 es un punto donde la función f tiene un mínimo local si existe ε2 > 0 tal que f (x2 ) es el
menor valor que la función puede tomar en el intervalo ]x2 − ε2 , x2 + ε2 [, es decir, para todo
x ∈]x2 − ε2 , x2 + ε2 [ se cumple f (x2 ) ≤ f (x).

La Figura 2.18 muestra que x1 y x2 son puntos donde la función f tiene máximo y mínimo
local, respectivamente, pues existen los intervalos antes mencionados donde se cumple la condición
correspondiente.
36 Capítulo 2. Aplicaciones de las derivadas

Figura 2.18: P UNTOS DE EXTREMO LOCAL DE f

El resultado a continuación ayuda a obtener los puntos donde f alcanza máximos o mínimos
locales.
Proposición 2.2 Dada f : R → R, se tiene entonces que:
(a) si se cumple
f ′ (x1 ) = 0, f ′′ (x1 ) < 0
entonces x1 es un punto donde f tiene un máximo local,
(b) si se cumple
f ′ (x2 ) = 0, f ′′ (x2 ) > 0
entonces x2 es un punto donde f tiene un mínimo local.

Sobre la base de lo anterior, el esquema para encontrar los puntos donde f tiene máximos / mínimos
locales procede de la siguiente manera:

Importante 2.6
• Primero, se determinan los puntos que cumplen f ′ (x) = 0. Esta condición se llama condición
necesaria de optimalidad de primer orden, y los puntos que cumplen esa condición se
llaman puntos críticos (o puntos estacionarios) de la función.
• Segundo, a partir de lo anterior, dados los puntos críticos de la función, para saber si se trata
de un punto donde f tiene máximo o mínimo local se evalúa la segunda derivada:
– si el signo de la segunda derivada evaluada en el punto crítico es positivo, entonces en
ese punto crítico ocurre que la función tiene mínimo local,
– si el signo de la segunda derivada evaluada en el punto crítico es negativo, entonces en
ese punto crítico ocurre que la función tiene máximo local.
– si la segunda derivada evaluada en el punto crítico es cero, entonces no podemos decidir,
con esa información, si en dicho punto hay máximo o mínimo local. Ver Nota más
adelante.

Ejemplo 2.17 Encontremos los puntos donde la función f : R → R tal que f (x) = x3 − 2x2 + 1 tiene
máximos o mínimos locales. Para eso, lo primero es obtener los puntos críticos, por lo que necesitamos
la primera derivada: f ′ (x) = 3x2 − 4x. Luego, los puntos críticos de f (x) cumplen que

4
f ′ (x) = 3x2 − 4x = 0 ⇒ x1 = 0 ∨ x2 = .
3

Para saber si se trata de un punto donde la función tiene máximo o mínimo local, obtenemos la segunda
2.4 Máximos y mínimos de funciones 37

derivada de f : f ′′ (x) = 6 · x − 4. Luego, evaluándola en los puntos críticos se tiene que


4
f ′′ (x1 ) = 6 · 0 − 4 = −4, f ′′ (x2 ) = 6 · − 4 = 4.
3
Ya que f ′′ (x1 ) < 0, la función f tiene máximo local en x1 = 0, y el valor máximo local que alcanza
la función en ese punto es f (x1 ) = f (0) = 1. Por otro lado, ya que f ′′ (x2 ) > 0, ocurre que la función
tiene mínimo local en x2 = 43 , y el valor mínimo local que alcanza la función en ese punto es
5
f (4/3) = (4/3)3 − 2 · (4/3)2 + 1 = − 27 . La siguiente figura es ilustrativa de lo que se ha encontrado.

Figura 2.19: Ó PTIMOS LOCALES DE f (x) = x3 − 2x2 + 1

Ejercicio 2.29 Dados α ∈]0, 1[ y β > 0, encontrar los puntos críticos de las siguientes funciones, e
indicar si en ellos la función tiene máximo o mínimo local:

f (x) = α x − β x, g(x) = (1 + β x2 )α , h(x) = ln(α + β x2 ).

2
Ejercicio 2.30 Encuentre el punto crítico de f : R++ → R tal que f (x) = ln(x) − x2 . Indique si en él
hay máximo o mínimo local de la función. ■


Ejercicio 2.31 Dado β > 0, encuentre el punto crítico de f : R+ → R tal que f (x) = x − β x.
Indique si en él hay máximo o mínimo local de la función. ■

Ejercicio 2.32 Encuentre los puntos críticos de las siguientes funciones, e indique si en ellos ocurre
que la función tiene máximo o mínimo local.
1 3 x
f1 (x) = x3 − x2 + 2x + 8, f2 (x) = ex + e−x , f3 (x) = ex − e−x , f4 (x) = .
3 2 1 + x2

Ejercicio 2.33 Dado β > 0, encuentre el punto crítico de f : R+ → R tal que f (x) = x3 − β x. Indique
si en él hay máximo o mínimo local de la función. Por otro lado, dado α > 0, β > 0, encuentre
el punto crítico de la función g : R+ → R tal que g(x) = xα − β x. Indique si en dicho punto hay
38 Capítulo 2. Aplicaciones de las derivadas

máximo o mínimo local. Presente su respuesta considerando el caso α > 1, y para el caso α ∈]0, 1[.
¿Qué se puede decir si α = 1? ■

Ejercicio 2.34 Dados α, β > 0, α ̸= 2, encuentre el punto crítico de la función h : R++ → R tal que
h(x) = xα − β x2 . Explique por qué si α > 2 entonces en el punto crítico hay mínimo local. ■

2.4.2 Óptimos globales


Comencemos esta parte con un ejemplo sencillo.
Ejemplo 2.18 Considere la función f : R → R tal que f (x) = ax2 + bx + c, donde a > 0. En este caso,
los puntos críticos cumplen que

b
f ′ (x) = 2ax + b = 0 ⇒ x=− .
2a

Por otro lado, ya que la segunda derivada de f es f ′′ (x) = 2a, se tiene entonces que x = − 2a
b
es
un punto donde f (x) tiene un mínimo local si a > 0, o bien f (x) tiene un máximo local si a < 0. La
figura a continuación es ilustrativa.

Figura 2.20: Ó PTIMOS DE PARÁBOLAS

En el ejemplo anterior, suponiendo que a > 0 –curva roja en la Figura 2.20– ocurre que el punto
crítico
b
x̄ = −
2a
si bien es un punto donde f (x) tiene mínimo local, en estricto rigor es un punto donde la función tiene
mínimo global, es decir, donde la función toma el mínimo valor en todo el dominio, no sólo alrededor
de x̄. En otras palabras, dicho punto cumple que:

∀x ∈ R : f (x̄) ≤ f (x).
Sobre lo anterior, destaca entonces que para las parábolas (funciones cuadráticas), dependiendo
del signo del coeficiente del término cuadrático, el punto crítico cumple que minimiza (caso a > 0) o
maximiza (caso a < 0) a la función en todo su dominio, no solo en un intervalo (que sería el caso si
2.4 Máximos y mínimos de funciones 39

solo fuese un punto donde hay máximo o mínimo local). Esto motiva la siguiente definición, que se
presenta para funciones cuyo dominio es R, pudiendo ser otro dominio.
Definición 2.4 Se dice que f : R → R tiene un mínimo global es xm ∈ R si para todo x ∈ R se
cumple que
f (xm ) ≤ f (x).
Con esto, el valor mínimo que toma la función en su dominio es f (xm ). Por otro lado, se dice que
f : R → R tiene un máximo global es xM ∈ R si para todo x ∈ R se cumple que

f (x) ≤ f (xM ).

Con esto, el valor máximo que toma la función en su dominio es f (xM ).

En general, las condiciones de optimalidad en la Proposición 2.2 permiten encontrar puntos donde
f (x) alcanza máximos o mínimos locales (si es que existen), pero no permiten distinguir si el punto en
cuestión es uno donde la función alcanza el máximo (o mínimo) global. Hay pocos resultados en esta
línea, y uno de ellos (importante) sostiene lo siguiente.

Proposición 2.3 Dada f : R → R, se tiene entonces que:


(a) Si f es convexa (o bien es cóncava), entonces, la función tiene, a lo más, único punto crítico.
(b) Si f es convexa y xm es un punto crítico de f entonces xm es un punto donde f (x) tiene un
mínimo global, es decir, para todo x ∈ R se cumple que f (xm ) ≤ f (x).
(c) Si f es cóncava y xM es un punto crítico de f entonces xM es un punto donde f (x) tiene un
máximo global, es decir, para todo x ∈ R se cumple que f (x) ≤ f (xM ).

Respecto de lo anterior se tiene lo siguiente:


• Primero, cabe señalar que una función convexa (cóncava) no necesariamente debe tener puntos
críticos. Por ejemplo, la función f (x) = ex (convexa) no tiene puntos críticos, pues f ′ (x) = ex
nunca es cero. La Proposición 6.5 sostiene que si una función convexa (cóncava) tiene puntos
críticos, entonces este es único. Esa proposición no sostiene que una función convexa (cóncava)
debe tener un punto crítico.

• Segundo, la Proposición 6.5 establece además que si hay un punto crítico para una función
convexa (cóncava), entonces, además de ser único, ese punto es donde la función se minimiza
(maximiza) globalmente.
• Tercero, como consecuencia de todo lo anterior, si es que existe, el punto que minimiza glob-
almente a una función convexa es único. De manera análoga, si es que existe, el punto que
maximiza globalmente a una función cóncava es único.

Finalmente, lo que sigue es una cuestión que puede servir para simplificar el análisis de óptimos
globales de funciones. Supongamos que f : R → R tiene un máximo global en xM , es decir, para
todo x ∈ R se tiene que f (x) ≤ f (xM ). Supongamos además que g : R → R es creciente, es decir, si
x < y entonces g(x) < g(y). Obviamente si x = y uno tiene que g(x) = g(y), por lo que, resumiendo, si
x ≤ y entonces g(x) ≤ g(y). Ya que para todo x se cumple que f (x) ≤ f (xM ), por las propiedades de la
función g(x) se concluye que para todo x ∈ R:

g creciente
f (x) ≤ f (xM ) =⇒ g( f (x)) ≤ g( f (xM )),

es decir, la composición de g con f , es decir, la función g( f (x)), tiene un máximo global en xM .Por
40 Capítulo 2. Aplicaciones de las derivadas

ejemplo, ya que la función f (x) = − 12 x2 + x tiene máximo global en xM = 1, ocurre que la función
1 2
h(x) = e− 2 x +x

tiene máximo global en xM = 1, eso pues h(x) es la composición de g(x) = ex , creciente, con f (x) =
− 12 x2 + x.
Note que lo anterior sigue siendo válido para mínimos globales: si xm es tal que para todo x ∈ R se
cumple que f (xm ) ≤ f (x) y g(x) es creciente concluimos que para todo x ∈ R, g( f (xm )) ≤ g( f (x)), es
decir, en xm hay mínimo global de g( f (x)).
Visto de otra manera:
Importante 2.7 Encontrar los máximos (mínimos) globales de la función f (x) es equivalente
a encontrar los máximos (mínimos) globales de la función g( f (x)) cuando g(x) es una función
creciente.
Más aún, siguiendo un razonamiento similar a lo hecho previamente, es directo ver que:

Importante 2.8 Si h(x) = g( f (x)) con g(x) creciente, el punto donde h(x) tiene máximo (mínimo)
global es el punto donde f (x) tiene máximo (mínimo) global.

N ¿Cuál es la intuición de lo anterior? Suponga que para N personas sus estaturas son x1 , x2 , . . . , xN .
La persona más alta es el individuo j, de modo que para todo i = 1, 2, . . . , N se cumple que xi ≤ x j .
Dado esto, ¿cuál es la persona que tiene el mayor exponencial de la estatura? Obviamente es el
individuo j, que ya tenía la mayor estatura: al aplicar exponencial, que es una función creciente,
se mantiene el orden de los individuos en cuando a la estatura. De esta manera, si la función
f (x) alcanza un máximo global en xM , entonces la función e f (x) alcanza un máximo global en xM .
Mismo si en vez de la exponencial uno considera cualquier otra función creciente.
Ejemplo 2.19 Considere f : R++ → R tal que f (x) = ln(x) − x. Primero que todo, f ′ (x) = 1x − 1, por
lo que el punto crítico de esta función cumple que
1
−1 = 0 ⇒ x̄ = 1.
x
Por otro lado, ya que

1 1
f ′ (x) =
− x ⇒ f ′′ (x) = − 2 < 0,
x x
se concluye que f (x) = ln(x) − x es una función cóncava. Usando la Proposición 6.5 se tiene entonces
que x̄ = 1 es un punto donde f (x) tiene un máximo global, es decir, el mayor valor que puede tomar
f (x) = ln(x) − x en todo R++ es cuando x = 1, y ese máximo valor es f (1) = ln(1) − 1 = −1. De esta
manera, para todo x ∈ R++ se cumple que:

f (x) ≤ −1 ⇐⇒ ln(x) − x ≤ −1 ⇐⇒ ln(x) ≤ x − 1.

Ejemplo 2.20 La función f : R → R tal que f (x) = ex + e−x cumple que

f ′ (x) = ex − e−x , f ′′ (x) = ex + e−x .

El punto crítico de f (x) satisface que f ′ (x) = 0, es decir, ex − e−x = 0, a partir de lo cual es directo
ver que x̄ = 0 es el punto crítico de f (x) (del hecho que ex − e−x = 0 se tiene que ex = e−x , es decir,
2.4 Máximos y mínimos de funciones 41

e2x = 1, por lo que 2x = 0). En él ocurre que f ′′ (0) = e0 + e0 = 2 > 0, por lo que en x̄ = 0 la función
f (x) tendría un “mínimo local”. Sin embargo, ya que f ′′ (x) > 0 para todo x ∈ R, se concluye que f (x)
es convexa en todo su dominio, por lo que tiene un mínimo global en x̄ = 0, es decir, para todo x ∈ R
se cumple que f (0) ≤ f (x). Como f (0) = 2, desarrollado la desigualdad anterior se concluye que para
todo x ∈ R, 2 ≤ ex + e−x . ■

Ejemplo 2.21 Dado f (x) = ln(x2 + 1), como ln(x) es creciente, entonces f (x) tiene óptimo global
(máximo o mínimo) donde la función g(x) = x2 + 1 lo tiene. Como g′ (x) = 2x y g′′ (x) = 2, la función
g(x) tiene mínimo global en x = 0. Eso implica que la función f (x) = ln(x2 + 1) tiene mínimo global
en x = 0, y el valor correspondiente es f (0) = ln(1) = 0. De esta manera, para todo x ∈ R se tiene que
0 ≤ ln(x2 + 1). ■

Ejemplo 2.22 Dado a < 0, b, c ∈ R, expliquemos por qué la función


2 +bx+c
f (x) = eax
b
tiene máximo en x̄ = − 2a . En efecto, ya que g(x) = ax2 + bx + c es cóncava (a < 0), ocurre que tiene
máximo global en el punto donde su derivada es cero, es decir:
b
g(x) = ax2 + bx + c ⇒ 2ax + b = 0 ⇒ x=− .
2a
2 +bx+c
Como la exponencial es una función creciente, ocurre que f (x) = eax tiene máximo global
b
en x = − 2a , donde se maximizaba globalmente la parábola. ■

Ejemplo 2.23 Suponga que tiene una cuerda de longitud L, con la cual construye un rectángulo cuyo
perímetro es el largo de esa cuerda. ¿Cuál es el rectángulo de mayor área que se puede obtener? Si la
base del rectángulo es “x”, la altura “y” debe cumplir que 2x + 2y = L, por lo cual y = L2 − x. Por lo
tanto, el área del rectángulo cuya base es “x” es dada por
 
L L L
A(x) = x · −x ⇒ A(x) = x · − x2 ⇒ A′ (x) = − 2x.
2 2 2
Por lo tanto, el punto crítico de A(x) es x̄ = L4 . Ya que la función A(x) es cóncava (A′′ (x) = −2 < 0),
ocurre que x̄ = L4 es la base que permite construir el rectángulo de mayor área posible. Por lo expuesto,
2 L2
dicho rectángulo (en realidad, un cuadrado) tiene por área L4 = 16 . ■

Ejemplo 2.24 Suponga que x + y = α, donde α > 0 es una cantidad conocida. Encontremos el valor
de x e y que hacen máximo el producto x · y. Por lo indicado, como x + y = α se tiene que y = α − x
por lo que, x · y = x · (α − x) = α x − x2 . Ya que el problema es encontrar el punto donde se maximiza
f (x) = αx − x2 , derivando se tiene que
α α
f ′ (x) = α − 2x = 0 ⇒ x̄ = ⇒ ȳ = .
2 2
Como f ′′ (x) = −2, la función f (x) es cóncava, por lo que el punto encontrado maximiza el
producto de esas cantidades. ■

Ejercicio 2.35
1. Suponga que x + y = α, donde α > 0 es una cantidad conocida. Encuentre el valor de x e y
que hacen máximo el valor de ex·y .
2. Suponga que 2x + y = α, donde α > 0 es una cantidad conocida. Encuentre el valor de x e y
que hacen máximo el producto x · y.
42 Capítulo 2. Aplicaciones de las derivadas

3. Dados p1 , p2 y R son cantidades conocidas (todas positivas), suponga que x e y cumplen que
p1 x + p2 y = R. Con esto, encuentre x e y de modo que x · y sea máximo.
4. Dados p, q y R cantidades conocidas (todas positivas), suponga que x e y cumplen que p x +
q y = R. Con esto, encuentre x e y de modo que ln(x · y) sea máximo.
5. Dados p, q y R cantidades conocidas (todas positivas), suponga que x e y cumplen que p x +

q y = R. Con esto, encuentre x e y de modo que x · y sea máximo.

Ejercicio 2.36 Dado α ∈]0, 1[ y dado r > 0, definamos f : R++ → R tal que f (x) = xα − rx.
Explique por qué el punto crítico de f (x) maximiza globalmente a esta función. Encuentre el valor
de la función en dicho punto.

Ejercicio 2.37 Dado α > 1 y dado r > 0, definamos f : R++ → R tal que f (x) = xα − rx. Explique
por qué el punto crítico de f (x) minimiza globalmente a esta función. ■

Ejercicio 2.38 Explique por qué x̄ = µ es el punto donde la función


1 2
f (x) = e− 2 (x−µ)

tiene máximo global. ■


Ejercicio 2.39 Explique por qué el punto donde f (x) = ln( 1 + x2 ) se minimiza globalmente es el
punto donde g(x) = 1 + x2 se minimiza globalmente. ■
3. Integral de funciones de una variable

3.1 Primitiva de una función


3.1.1 Concepto
Definición 3.1 Para una función real (una variable) f (x), la función F(x) tal que F ′ (x) = f (x) se
llama primitiva, o integral indefinida, de f (x), y se denota
Z
F(x) = f (x)dx.

Note que si F(x) es una primitiva de f (x), entonces para cualquier constante C ∈ R ocurre que
F(x) +C también es una primitiva de f (x). En lo que sigue, salvo que se diga lo contrario, la constante
C se omitirá del análisis cuando encontremos primitivas de una función.
Ejemplo 3.1 Omitiendo la constante, se tiene que
Z
ln(x)dx = x ln(x) − x,

ya que la derivada de x ln(x) − x es igual a ln(x):

1
(x ln(x) − x)′ = x + ln(x) − 1 = ln(x).
x

R ′
Ejercicio 3.1 Explique por qué lo siguiente es cierto: f (x)dx = f (x). ■

R 3x
Ejercicio 3.2 Encuentre el valor de β para que e dx = β e3x . ■
44 Capítulo 3. Integral de funciones de una variable

Ejercicio 3.3 Para que valor de α y β se tiene que

1
Z
√ dx = α xβ .
x

3.1.2 Cálculo de primitivas


3.1.2.1 Primitivas directas
Considere la siguiente tabla de derivadas:

Nombre - Comentario Función: Derivada:


α ∈R xα α xα−1
Exponencial ex ex
Exponencial general, a > 0 ax ln(a)ax
1
Logaritmo Natural, x > 0 ln(x) x

A partir de lo anterior, podemos concluir de manera directa lo siguiente:


R
Función: f (x) Primitiva: f (x)dx
1
xα , con α ̸= −1 α+1 x
α+1 ,
1
x ln(x)
ex ex
1
ax , con a > 0, a ̸= 1 ln(a) a
x

f ′ (x) f (x)

Ejemplo 3.2
1
Z
√ dx =?
x
En este caso, f (x) = √1
x
= 1
x1/2
= x−1/2 . Así, de la tabla anterior, aplica la primitiva de xα con
α = −1/2, por lo que:
Z
1 1 −1 1 √
√ = −1
x 2 +1 = 1 x1/2 = 2 x.
x 2 +1 2

Ejemplo 3.3 Z
2
xex dx =?
2
Parece muy complicado. Sin embargo, la función que se integra “se parece” a la derivada de ex
2 2
(aplicar regla de la cadena): (ex )′ = 2x ex . Luego, corrigiendo por la constante en la derivada anterior,
se tiene que:
1 2
Z
2
xex dx = ex .
2

Ejemplo 3.4 Z
e3x dx =?
3.1 Primitiva de una función 45
1
Como ax dx = x del hecho que e3x = (e3 )x , identificando a = e3 se tiene que
R
ln(a) a ,

1 1
Z
e3x dx = 3
(e3 )x = e3x .
ln(e ) 3

Ejemplo 3.5 Z
2x dx =?
1
Aplicando ax dx = x
R
ln(a) a con a = 2 se tiene que

1 x
Z
2x dx = 2.
ln(2)

Ejercicio 3.4 Encontrar las siguientes primitivas:


(a)
1 1 1 1
Z Z Z Z Z
2
√ dx, x dx, dx, dx, dx.
x3 x2 x
2
5 x−3

(b)
1 1
Z Z Z Z Z Z
e−x dx, e5x dx, 3x dx, dx, e−β x dx, dx.
2x e2x
(c)
1 1
Z Z
dx, − dx..
2x x

Ejercicio 3.5 Dado r > 0, usando el hecho que r = eln(r) , explique por qué se tiene lo siguiente:

1 1
Z
dx = − e−x ln(1+r) .
(1 + r)x ln(1 + r)

3.1.2.2 Primitiva de suma y ponderación de funciones


Por la regla de la derivada de la suma y ponderación notamos que si F(x) es una primitiva de f (x) (es
decir, F ′ (x) = f (x)) y G(x) es una primitiva de g(x) (es decir, G′ (x) = g(x)), entonces, para α, β ∈ R
se tiene que αF(x) + β G(x) es una primitiva de α f (x) + β g(x), pues

(αF(x) + β G(x))′ = αF ′ (x) + β G′ (x) = α f (x) + β g(x).

Visto de otra manera, lo anterior corresponde a decir que:


46 Capítulo 3. Integral de funciones de una variable

Importante 3.1 Para constantes α, β se tiene que


Z Z Z
[α f (x) + β g(x)] dx = α f (x) dx + β g(x) dx .
| {z } | {z } | {z }
primitiva de α f (x)+β g(x) α por primitiva de f (x) β por primitiva de g(x)

4
Ejemplo 3.6 Ya que la primitiva de 1x es ln(x) y aquella de x3 es x4 , usando β = −3 se tiene que:

Z  
3 1
x3 − dx = x4 − 3 ln(x).
x 4

Ejemplo 3.7 Ya que x2 dx = 13 x3 , xdx = 21 x2 y 1dx = x, tenemos que


R R R

a b
Z
(ax2 + bx + c) dx = x3 + x2 + cx.
3 2

Extendiendo esto, es directo ver que (primitiva de un polinomio):

a1 a2 an n+1
Z
a0 + a1 x + a2 x2 + · · · + an xn dx = a0 x + x2 + x3 + · · · +

x .
2 3 n+1

Ejercicio 3.6 Encuentre las siguientes primitivas:


1.
√ Z  
1
Z Z
3
√ − ex 2x + 2−x dx.

(x − x) dx, dx,
x
2.
1 + x2 e + e−x
Z   Z  x 
1
Z
dx, x − x + x4 − 8 x9
3
dx, dx.
x 3 2
3.
1 3x2 − x4
Z   Z   Z  
2 2 1 2
− x2 + e3x dx, − − 2x + √ dx, xex + − dx.
x x x3 ex x5

3.1.2.3 Primitivas de “derivada dividido por función”


Otra regla simple, pero importante, viene de lo siguiente: por regla de la cadena tenemos que

cadena g′ (x)
F(x) = ln(g(x)) =⇒ F ′ (x) = .
g(x)

Por lo anterior, se tiene que:

Importante 3.2
Z  ′ 
g (x)
dx = ln(g(x)).
g(x)
3.1 Primitiva de una función 47

Ejemplo 3.8 Calcular la siguiente primitiva:

x3
Z
dx
x4 + 1
Claramente el numerador se “parece” a la derivada del denominador. De hecho, el numerador x3
multiplicado por 4 es igual a la derivada del denominador. Por lo tanto:
x3 4 x3 1 4x3
Z Z Z
dx = dx = dx
x4 + 1 4
4 x +1 4 x4 + 1
En lo anterior, si g(x) = x4 + 1 se tiene que g′ (x) = 4x3 , por lo que
x3 1 4x3 1
Z Z
4
dx = 4
dx = ln(x4 + 1).
x +1 4 x +1 4

R x
Ejemplo 3.9 Calcular exe−2 dx. Para esto, como la “derivada del denominador” es igual a lo que está
en el numerador, por lo que
ex
Z
dx = ln(ex − 2).
ex − 2

Ejercicio 3.7 Calcular las siguientes primitivas:


1.
x2 1 e−x
Z Z Z
dx, dx, dx.
x3 + 1 x+β 1 − e−x
2.
1
Z
dx.
x ln(x)

3.1.2.4 * Primitivas usando cambio de variable (sustitución)


Queremos calcular
1
Z
√ dx.
1+x
La regla del cambio de variable es como sigue: haciendo (definiendo) u = 1 + x usando la notación
de “diferenciales” tenemos que
du = dx,
pues la derivada de u es igual a la derivada de 1 (que es cero) más la derivada de x (que denotamos dx).
Luego, haciendo el reemplazo de 1 + x por u y dx por du en la primitiva que queremos calcular, queda
Z
1 u=1+x
Z
1 √ Z
1 √
√ dx =⇒ √ du = 2 u ⇒ √ dx = 2 1 + x.
1+x u 1+x
Ejemplo 3.10 Dado α ∈ R, usemos la sustitución u = 1 + α x para calcular (1 + α x)3/2 dx. En este
R
1
caso, u = 1 + α x, por lo que du = α dx =⇒ dx = α du, implicando que
1 2 5/2 2
Z Z Z
(1 + α x)3/2 dx =⇒ u3/2 du = u =⇒ (1 + α x)3/2 dx = (1 + α x)5/2 .
α 5α 5α

48 Capítulo 3. Integral de funciones de una variable

Ejemplo 3.11 Usemos la sustitución u = α x + β para calcular lo siguiente:


1
Z
dx.
α x+β
Ya que u = α x + β , tenemos du = α dx, por lo que dx = α1 du. Reemplazado en la integral, se tiene
que
1 1 1 1 1 1
Z Z Z
dx =⇒ du = ln(u) =⇒ dx = ln(α x + β ).
α x+β uα α α x+β α

Ejemplo 3.12 Usando la sustitución u = x + 1, calcular lo siguiente:


x
Z
dx.
x+1
Como u = x + 1 se tiene que du = dx. Con esto, reemplazando x por u − 1 se obtiene
Z   Z  
x u−1 1 x
Z Z
u=x+1
dx =⇒ du = 1− du = u − ln(u) ⇒ dx = (x + 1) − ln(x + 1).
x+1 u u x+1

R √
Ejemplo 3.13 Usemos la sustitución u = 1 + x para determinar x 1 + x dx. En este caso, u = 1 + x
implica que du = dx y, además, x = u − 1. Por lo tanto
Z √ u=1+x
Z
√ Z   2 2
x 1 + x dx =⇒ (u − 1) u du = u3/2 − u1/2 du = u5/2 − u3/2 .
5 3
Luego, recordando que u = x + 1:
Z √ 2 2
x 1 + x dx = (x + 1)5/2 − (1 + x)3/2 .
5 3

Ejercicio 3.8 Usar la sustitución u = αx + β para determinar (αx + β )4/3 dx.


R

√ 1
R
Ejercicio 3.9 Usar la sustitución u = αx + 1 para determinar αx+1
dx.

Ejercicio 3.10 Dados a y b constantes, usando la sustitución u = ax + b, calcular

x
Z
dx.
ax+b

1
Ejercicio 3.11 Notando que x+1 x
x+a = x+a + x+a , se pide encontrar

x+1
Z
dx.
x+a

3.1 Primitiva de una función 49

R p
Ejercicio 3.12 Usar la sustitución u = αx + β para calcular x αx + β dx.

√x
R
Ejercicio 3.13 Usar la sustitución u = x + a para calcular x+a
dx.

3.1.2.5 Primitivas usando regla de integración por partes


De la regla de la derivada del producto, para dos funciones f y g tenemos que:

( f (x) · g(x))′ = f ′ (x) · g(x) + f (x) · g′ (x).

Luego, “integrando” lo anterior (recordar que, por definición, h′ (x)dx = h(x) pues la derivada de h(x)
R

es precisamente lo que “está dentro de a integral”):


Z Z Z
[( f (x) · g(x))]′ dx = [ f ′ (x) · g(x)] dx + [ f (x) · g′ (x)] dx. (3.1)

Pero, por lo antes indicado, tenemos que


Z
[( f (x) · g(x))]′ dx = f (x) · g(x),

por lo cual queda la siguiente “regla” (despejar extremo derecho de (3.1))


Z  Z 
f (x) · g′ (x) dx = f (x) · g(x) − f ′ (x) · g(x) dx.
 
(3.2)

Identificando u con f (x) y v con g (x), de modo que du = f ′ (x) dx y dv = g′ (x)dx, la relación en (3.2)
se convierte en lo siguiente (conocida como regla de integración por partes):

Importante 3.3 Z Z
u · dv = u · v − v · du.

A pesar de lo simple que fue es obtener la regla anterior (en el fondo, viene de la regla del producto
para derivadas), resulta útil para diversos cálculos de primitivas, usualmente cuando se trata de integrar
un producto de funciones. La “astucia” está en definir correctamente R
qué es u y qué es dv. Esa elección
debe
R
ser tal que obtener v sea sencillo a partir de su derivada, y que v · du sea más sencilla que calcular
u · dv.
Ejemplo 3.14 Calcular, por partes, xe−2x dx A este respecto, para aplicar la “regla por partes” uno
R

siempre debe comenzar por definir qué es u y qué es dv, que son los elementos de la primitiva que se
desea encontrar. Normalmente hay dos caminos para proceder, y uno de ellos es el “mal camino”,
es decir que cuando es elegido se complica el problema. ¿Cómo elegir? Es cuestión de práctica y de
probar las alternativas.
Para el problema tenemos dos opciones para definir u y dv:

(i) : que u = x y que dv = e−2x dx ∨ (ii) : que u = e−2x y que dv = x dx

Bajo el caso (i):


−1 −2x
Z
u=x ⇒ du = dx, dv = e−2x dx ⇒ v= e−2x dx ⇒ v= e .
2
50 Capítulo 3. Integral de funciones de una variable

Por lo tanto, de la regla de integración por partes tenemos que:


Z Z
u · dv = u · v − v · du ⇒
  Z
−1 −2x −1 −2x 1 1
Z Z
xe−2x dx = |{z}
x e − dx = − xe−2x +
e |{z} e−2x dx.
2 2 2 2
u | {z } | {z } du
v v

Ya que
−1 −2x
Z
e−2x dx = e ,
2
se tiene finalmente que
1 1 −1 −2x 1 1
Z
xe−2x dx = − xe−2x + e = − xe−2x − e−2x .
2 2 2 2 4

Si hubiésemos escogido la alternativa (ii), u = e−2x , entonces du = −2 e−2x dx, y como dv = x dx


se tiene que
1
Z
v = x dx = x2 .
2
Luego, usando la segunda alternativa,

x2
u = e−2x , du = −2e−2x dx, v= y dv = xdx,
2
por lo que aplicando la regla de integración por partes

x2 x2 x2
Z Z Z
xe−2x dx = e−2x − (−2e−2x ) dx = e−2x + x2 e−2x dx.
2 2 2
La integral de la derecha es más “complicada” que la original, por lo que el camino (ii) complica el
problema. ■
R 2 x
Ejemplo 3.15 Calcular x e dx. Para esto, defiendo u = x2 y dv = ex dx, tenemos que du = 2x dx y
v = ex . Luego,
Z Z
2 x 2 x
x e dx = x e − ex (2x) dx.

Para el lado derecho volvemos a utilizar la regla por partes: definiendo u = 2x y dv = ex dx, tenemos
que du = 2 dx y v = ex , por lo que
Z Z
2x ex dx = 2x ex − 2ex dx = 2xex − 2ex .

Por lo tanto, volviendo al problema original:


Z Z
x2 ex dx = x2 ex − 2x ex dx = x2 ex − (2xex − 2ex ) = x2 ex − 2xex + 2ex .

3.2 Integral definida 51

Ejercicio 3.14 Calcular las siguientes primitivas (r es una constante)


Z Z Z Z
xe−x dx, x e2x dx, xerx dx, xe−rx dx.

Ejercicio 3.15 Calcular las siguientes primitivas (r es una constante):


Z Z Z Z
x2 e−x dx, x2 e2x dx, x2 erx dx, x2 e−rx dx.

3.2 Integral definida


3.2.1 Área bajo la curva
El problema es el siguiente: calcular el área que encierra la curva definida por la función f (x) entre los
puntos a y b, con a < b. La Figura 3.1 muestra una función f (x) cualquiera, a valores positivos, y en
ella se destaca el área que deseamos encontrar.

Figura 3.1: Á REA BAJO UNA CURVA ( GRÁFICO DE f (x)) ENTRE x = a Y x = b

Esa área se representa como


Z b
Área = f (x)dx
a

y se llama integral definida de f (x) entre a y b. Las cantidades a y b se llaman límites de integración.

Para determinar el área en cuestión, lo que haremos será aproximarla por la suma de las áreas de
una serie de rectángulos que se construyen para el efecto.

Para construir las bases de los rectángulos que se han mencionado, dividamos el intervalo [a, b] en
n sub-intervalos: el primero es el intervalo [x0 , x1 ], el segundo es el intervalo [x1 , x2 ], el tercero es el
intervalo [x2 , x3 ], · · · , el intervalo i-ésimo es [xi−1 , xi ], · · · , el intervalo n-ésimo es [xn−1 , xn ]. Se asume
que el primer punto de esos intervalos es x0 = a y que el último punto es xn = b. Se entiende además
que xi−1 < xi . Los largos de estos intervalos serán las bases de los rectángulos que hemos mencionado.
La siguiente figura es ilustrativa: en ella se muestra la partición del intervalo [a, b] a partir de la cual
construiremos las bases de los rectángulos.
52 Capítulo 3. Integral de funciones de una variable

Figura 3.2: D IVISIÓN DE [a, b] EN n SUB - INTERVALOS

Para determinar la altura de los rectángulos, evaluamos la función f (x) en algún punto intermedio
de cada intervalo que define la base, digamos,

x̄i ∈ [xi−1 , xi ].

Con todo lo anterior, el área bajo la curva se aproxima por la suma de las áreas de esos rectángulos.
En la Figura 3.3 se destaca el rectángulo i-ésimo, cuya área es

f (x̄i )(xi − xi−1 ).

Figura 3.3: A PROXIMACIÓN DEL ÁREA BAJO LA CURVA

Así, por lo indicado, la aproximación del área bajo la curva es dada por la sumatoria a la derecha
de lo siguiente, llamada suma de Riemann:
n
Área ≈ ∑ f (x̄i ) (xi − xi−1 ).
i=1

Notamos que mientras mayor es la cantidad de sub-intervalos que consideramos para particionar el
intervalo [a, b] mejor resulta la aproximación del área bajo la curva. En el “límite”, tomando “infinitos
rectángulos” obtenemos el área en cuestión. Así, tenemos que:
Z b n

a
f (x)dx = lim
n→∞
∑ f (x̄i ) (xi − xi−1 ). (3.3)
i=1

3.2.2 Teorema fundamental del cálculo


En términos geométricos, calcular el área bajo la curva es una cuestión compleja: por (3.3) deberíamos
calcular una sumatoria con términos generales y luego, a ese resultado, tomar límite cuando n tiende
a infinito. Sin embargo, un teorema muy importante, llamado Teorema Fundamental del Cálculo,
3.2 Integral definida 53

entrega un camino para determinar el área en cuestión. A este respecto, si denotamos como F(x) la
primitiva de f (x) (ignorando la constante), es decir

Z
F(x) = f (x) dx,

se tiene lo siguiente.

Teorema 3.1 Teorema fundamental del cálculo


Z b
f (x) dx = F(b) − F(a)
a

Importante 3.4 En lo que sigue usaremos la siguiente notación: dados a, b ∈ R, para una función
F(x) denotamos
b
F(x) = F(b) − F(a).
a

Rb
Importante 3.5 Cuando uno escribe a f (x)dx, recordemos que se está calculando un límite de una
sumatoria: Z b n

a
f (x)dx = lim
n→∞
∑ f (x̄i ) (xi − xi−1 ).
i=1

Si en vez de haber utilizado la variable “x” para denotar las cantidades dentro de ese límite
(y sumatoria) utilizamos la variable “t” (o cualquier otra), el resultado del área no se modifica,
quedando:
n
Área = lim
n→∞
∑ f (t¯i ) (ti − ti−1 ).
i=1

Por lo anterior, usando esta última expresión uno debió escribir ab f (t)dt en vez de ab f (x)dx, y
R R

el
Rb
resultado no cambia. Rb
Visto de otra manera, para integrales definidas es equivalente escribir
a f (x)dx que escribir a f (t)dt: la variable que se utiliza en la integral definida es muda.

Rh
Ejemplo 3.16 Considere la función f (x) = αx. Calculemos 0 f (x)dx e interpretemos el resultado.
R R α 2
Para ello, primero, ignorando constantes se tiene que f (x)dx = αx dx = 2 x . Segundo, por el
teorema fundamental del cálculo se tiene que:

α 2 α 2 αh2
Z h hα i h
f (x)dx = x2 = (h) − (0) = .
0 2 0 2 2 2

La integral que se calculó corresponde al área en la figura a continuación, es decir, un triángulo cuya
base es h y cuya altura es αh: se ha probado que el área de un triángulo es 1/2 de la base (h) por la
altura (α h).
54 Capítulo 3. Integral de funciones de una variable


Ra 1
Ejemplo 3.17 Para a > 1, calcular 1 x dx, e interpretar el resultado. Por lo indicado, el problema es
calcular el área de la siguiente figura:

R 1
Puesto que x dx = ln(x), se tiene que:
Z a a
1
dx = [ln(x)] = ln(a) − ln(1) = ln(a).
1 x 1

Es decir, el área de la figura anterior es ln(a).


En el ejemplo a continuación usamos el siguiente hecho: dados a, b tal que a < b, considere un
punto c intermedio entre a y b: a < c < b. Dado esto, el área bajo la curva entre a y b es entonces la
suma del área entre a y c y el área entre c y b. Es decir:
Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx.
a a c

Ejemplo 3.18 Considere la siguiente función, definida por partes:


(
2x si x < 3
f (x) =
6 si x ≥ 3.

Se pide entonces obtener


Z 5
f (x)dx.
0
3.2 Integral definida 55

Para esto, notamos que cuando x < 3 entonces f (x) = 2x, mientras que si x ≥ 3, entonces f (x) = 6.
Luego, considerando que x = 3 es un punto singular para obtener la integral, se tiene que
Z 5 Z 3 Z 5 Z 3 Z 5
f (x)dx = f (x)dx + f (x)dx = 2xdx + 6dx,
0 0 3 0 3
por lo que
Z 5 3 5
f (x)dx = 3x2 + 6x = 27 − 0 + 30 − 18 = 39.
0 0 3

Ejemplo 3.19 Dado r > 0 y dado T > 0, considere la función ψ(T ) definida como
Z T
ψ(T ) = e−rx dx.
0

Se pide obtener la expresión de ψ(T ) y, además, obtener ψ ′ (0). Para esto, primero obtenemos la
primitiva de f (x) = e−rx , dada por

1
Z
F(x) = e−rt dx = − e−rx .
r
Luego, Z T
1 T 1 1
ψ(T ) = e−rx dx = − e−rx = − e−rT + .
0 r 0 r r
Luego, derivando con respecto a T y evaluando el resultado en T = 0 se tiene que
1 1 T =0
ψ(T ) = − e−rT + ⇒ ψ ′ (T ) = e−rT =⇒ ψ ′ (0) = 1.
r r

Ra
Ejercicio 3.16 Dados a > 0 y b > 0, encontrar 0 b dx e interpretar el resultado. ■

Ra
Ejercicio 3.17 Dado a > 0, encontrar 0 x2 dx e interpretar el resultado. ■

Ejercicio 3.18
(a) Dado a > 0, encontrar R 0α ex dx e interpretar el resultado desde un punto de vista geométrico.
R

(b) Dado a > 0, encontrar 0α e−x dx e interpretar el resultado desde un punto de vista geométrico.

Ejercicio 3.19 Determine el valor de θ ′ (1) cuando


Z t
θ (t) = x e−x dx.
1

56 Capítulo 3. Integral de funciones de una variable

Ejercicio 3.20 Dado b > 1 y r > 0, encontrar


Z b
e−rx dx.
1

Ejercicio 3.21 Dada la función


(
e−2t si x < 0
g(t) = ,
2t + 1 si t ≥ 0

se pide obtener
Z 1
g(t) dt.
−1

3.2.3 Integral impropia


Un caso particular importante de integral definida es cuando uno de los límites de integración es +∞
o −∞, es decir, la integral tiene la forma
Z b Z +∞
f (x) dx o bien f (x) dx,
−∞ a

donde a y b son constantes dadas. Esas integrales (definidas) se llaman integrales impropias (más
preciso, integrales impropias de primera especie), que desde un punto de vista geométrico corresponden
al área bajo la curva entre ] − ∞, b] o entre [a, +∞[ (según el caso). La Figura 3.4 muestra lo indicado
para la integral impropia Z ∞
f (x)dx.
a

R∞
Figura 3.4: I NTEGRAL IMPROPIA a f (x)dx.

Para calcular una integral impropia se procede de la siguiente manera:


(i) primero, se calcula una integral definida usual (con “límites finitos”),
(ii) dado lo anterior, se toma el límite del resultado ya obtenido, haciendo tender el límite de
integración a +∞ o −∞ según el caso.
3.2 Integral definida 57

Más precisamente: para calcular la integral impropia a+∞ f (x) dx se determina


R Rn
a f (x) dx, y luego,
usando ese resultado (que depende de n), se determina el siguiente límite:
Z n
lim f (x) dx.
n→+∞ a

Rb Rb
Por otro lado, para la integral impropia −∞ f (x)dx, se calcula −n f (x)dx, y luego se determina su
límite cuando n → ∞. Así, en resumen:
Importante 3.6
n Z b b
Z ∞ Z  Z 
f (x) dx = lim f (x) dx y f (x) dx = lim f (x) dx .
a n→∞ a −∞ n→∞ −n

Ejemplo 3.20 Dado r > 0, calcular Z ∞


e−rx dx.
0

En este caso, ya que e−rx dx = − 1r e−rx , se tiene que


R

e−rn
 −r0 
e−r n 1
Z n  
n
−rx 1 −rx e
e dx = − e =− − − =− + ,
0 r 0 r r r r

por lo cual:  −r n 
e 1 1
Z ∞
−rx
e dx = lim − + = .
0 n→∞ r r r

Ejemplo 3.21 Dado r > 0, calcular Z ∞


x e−r x dx.
0

Para esto, lo primero es calcular la primitiva de x e−rx . Usamos integración por partes: definiendo
u = x y dv = e−rx dx, tenemos que du = dx y, de manera directa, v = − 1r e−rx . Luego,

xe−rx 1 −rx
  Z  
1 −rx 1 −rx
Z Z
−rx
x e dx = x − e − − e dx ⇒ x e−rx dx = − − 2e .
r r r r

Evaluando el resultado en x = n y restando la evaluación en x = 0 se tiene que:

ne−r n 1 −r n 1 n e−r n 1 −r n 1
Z n Z ∞  
−rx −rx
x e dx = − − 2e + 2 ⇒ x e dx = lim − − 2e + 2 .
0 r r r 0 n→∞ r r r

Ahora bien, como

ne−r n
     
1 −r n  n  1
lim e = 0, lim = lim = lim = 0,
n→∞ r 2 n→∞ r n→∞ r er n n→∞ r 2 er n

donde el límite a la derecha se obtiene por L’Hôpital (derivada con respecto a n), se tiene que:
1
Z ∞
xe−r x dx = .
0 r2

58 Capítulo 3. Integral de funciones de una variable

Ejemplo 3.22 Dado a > 0, se pide calcular


Z +∞
2
xe−a x dx.
0
2
En este caso, primero que todo debemos calcular la primitiva de f (x) = xe−a x . Podemos hacerlo por
partes (siga Ud. por ese camino), o bien observar que
 ′ Z
1
−a x2 −a x2 2 2
e = −2axe ⇒ xe−a x dx = − e−a x .
2a
Por lo tanto,
Z n  
n
   
2 1 2 1 2 1 1 2 1
xe−a x dx = − e−a x = − e−a n − − e0 = − e−a n + ,
0 2a 0 2a 2a 2a 2a
a partir de lo cual tenemos que
 
1 −a n2 1 1
Z ∞
−a x2
xe dx = lim − e + = .
0 n→∞ 2a 2a 2a

N Cultura general
En sus cursos de probabilidades y estadística Ud. estudiará variables aleatorias continuas.
Una variable aleatoria continua, digamos X , queda caracterizada por el conjunto donde toma los
valores, y por lo que se conoce como la función de densidad. El conjunto en cuestión puede
ser un intervalo de la forma [a, b], o bien todo R, o bien R+ , etc., (en general, un intervalo no
acotado). Para ilustrar, si la variable aleatoria toma valores en R y la función de densidad es f (x),
la probabilidad de que la variable aleatoria X tome valores entre x1 y x2 , con x1 < x2 , es dada por
la siguiente integral definida:
Z x2
P(x1 ≤ X ≤ x2 ) = f (x)dx.
x1

Hay además dos conceptos que son muy importantes para variables aleatorias continuas:
valor esperado (o media) y varianza. Suponiendo que la variable aleatoria X toma valores en R,
el valor esperado y la varianza de X se definen, de manera respectiva, como el resultado de las
siguientes integrales impropias:
Z +∞ Z +∞
X) =
E(X x f (x)dx ∈ R y X) =
V(X X ))2 f (x)dx.
(x − E(X
−∞ −∞

Por ejemplo, una variable aleatoria que es fundamental en un sinnúmero de aplicaciones


es la normal: uno dice que la variable aleatoria X es una normal de media µ y varianza σ 2 (se
representa X ∼ N(µ, σ 2 )) si la función de densidad de X es
1 − 1 (x−µ)2
f (x) = √ e 2σ 2 .
σ 2π
En particular, X ∼ N(0, 1) cuando la función de densidad es
1 1 2
f (x) = √ e− 2 x .

Cualquiera que sea el caso para la normal, el gráfico de f (x) es conocida como la campana de
Gauss. Así, para X ∼ N(µ, σ 2 ) se tiene que, por ejemplo,
Z x1
1 − 1 2 (x−µ)2
X ≤ x1 ) =
P(X √ e
2σ dx.
σ 2π −∞
3.2 Integral definida 59

Ejercicio 3.22 Dado ε > 0, calcular la siguiente integral impropia:

1
Z ∞
dx.
1 x1+ε

Ejercicio 3.23 Dados a, b ∈ R y r > 0, determine las siguientes integrales:


Z +∞ Z +∞ Z +∞ Z ∞ Z b
2 2
e−rx dx, xe−rx dx, e−x dx, xe−r x dx, xe−r x dx.
1 1 0 a −∞

II
Cálculo en varias variables

4 Conceptos básicos . . . . . . . . . . . . . . . . . . 63
4.1 Motivación: funciones de varias variables . . . 63
4.2 Conceptos relevantes . . . . . . . . . . . . . . . . . . . . 64
4.3 Operaciones con funciones de varias variables 68
4.4 Aspectos gráfico de funciones de varias vari-
ables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5 Cálculo diferencial . . . . . . . . . . . . . . . . . . 85
5.1 Derivadas parciales (primer orden) y gradiente 85
5.2 Reglas de derivación . . . . . . . . . . . . . . . . . . . . 93
5.3 Derivadas parciales de segundo orden . . . . . 107
5.4 Complementos . . . . . . . . . . . . . . . . . . . . . . . . 113

6 Aplicaciones del cálculo . . . . . . . . . . . 119


6.1 Análisis del crecimiento . . . . . . . . . . . . . . . . . . 119
6.2 Polinomio de Taylor . . . . . . . . . . . . . . . . . . . . . 125
6.3 Convexidad (concavidad) de funciones de varias
variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.4 Máximos y mínimos de funciones de varias vari-
ables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
6.5 Problema de optimización con restricción lineal 151
4. Conceptos básicos

4.1 Motivación: funciones de varias variables


La mayoría de las funciones que Ud. utilizará a lo largo de su carrera son funciones de varias variables
a valores reales. Esto quiere decir que el dominio de esas funciones será el espacio vectorial Rk , con
k ∈ N, k > 1, ( o un subconjunto de él), mientras que el conjunto de llegada será R. Visto de otra
manera, las funciones de varias variables que mayormente nos interesa estudiar asocian vectores con
números reales. Los siguientes son ejemplos (motivación) de funciones de varias variables a valores
reales.
Ejemplo 4.1 Función de utilidad
En economía se asume que las personas (individuos) consumen bienes con el fin de lograr satis-
facción (utilidad, felicidad, etc.). Los bienes de consumo los indexamos por 1, 2, 3, · · · , k, de modo
que hay k de ellos. Por ejemplo, el bien 1 es el “pan”, el bien 2 es “manzana”, etc. Con esto, si
denotamos por x1 ∈ R+ cierta cantidad de bien 1, por x2 ∈ R+ cierta cantidad de bien 2, · · · , por
xk ∈ R+ cierta cantidad de bien k, entonces una canasta de consumo conformada por esos bienes es
un vector x ∈ Rk donde su componente i ∈ {1, . . . , k} es la cantidad xi del bien correspondiente. Dado
esto, la satisfacción que el individuo logra con el consumo de la canasta x ∈ Rk+ es dada por u(x) ∈ R,
donde u : Rk+ → R es una función de utilidad que asocia vectores (canastas de consumo) con una
medida (real) de satisfacción. ■

Ejemplo 4.2 Función de producción


Suponga que para elaborar cierto producto, una firma utiliza dos factores, digamos, capital, cantidad
genérica K ≥ 0, y trabajo, cantidad genérica L ≥ 0. Usando esos factores, la firma elabora cierta
cantidad de producto. La función que relaciona los factores con el producto se llama función de
producción. Para este caso, dicha función tiene dos argumentos (capital y trabajo), y sus valores
son reales (el producto que elabora es una cantidad real). Corresponde entonces a una función cuyo
argumento es un vector de R2+ , y cuya imagen (valores) están en R, digamos, f : R2+ → R. ■

Ejemplo 4.3 Si una persona tiene estatura (en metros) h ∈ R+ y peso (en kilogramos) m ∈ R+ , el
índice de masa corporal se obtiene como IMC = hm2 . De esta manera, podemos entender que el índice
de masa corporal es una función que al vector de R2 cuya primera componente es la altura y cuya
segunda componente es la masa le asocia el indicador ya definido. Visto de otra manera, el índice de
masa corporal es una función IMC : R2+ → R. ■
64 Capítulo 4. Conceptos básicos

4.2 Conceptos relevantes


4.2.1 Idea de función de varias variables
4.2.1.1 Preliminares sobre la notación vectorial
Dado k ∈ N, recordemos que Rk es el producto cartesiano de R, k veces, es decir,

Rk = R
| × R ×{z
R · · · × R} .
k veces

Recordemos además que los elementos de Rk (es decir, vectores) se representan como columnas.
Así, el vector de Rk cuya primera componente es x1 , cuya segunda componente es x2 , . . ., cuya k
componente es xk , se representa como
 
x1
 x2 
 ..  ∈ Rk .
 
 . 
xk
Recordemos también que el traspuesto de un vector (columna) es un vector fila, de modo que
 
x1
 x2 
x =  .  ⇐⇒ xt = x1 x2 · · · xk = (x1 , x2 , . . . , xk ).
  
.
 . 
xk

Sobre la base de lo anterior, cuando sea necesario y por conveniencia en la notación, en vez de
usar columnas para representar vectores usaremos su traspuesto para  mostrarlos
 como filas. Así, por
x1
ejemplo, diremos “para (x1 , x2 , x3 )t ∈ R3 tal que...” en vez de “para x2  ∈ R3 tal que...”.
x3

4.2.1.2 Funciones de varias variables


Las funciones de varias variables son aquellas cuyo argumento son vectores. El conjunto de llegada de
esas funciones puede ser R, en cuyo caso se habla de funciones de varias variables a valores reales,
o bien Rs con s > 1, en cuyo caso se habla de funciones de varias variables a valores vectoriales
(las imágenes de la función son elementos de Rs ). Por razones que quedaran claro más adelante, las
funciones relevantes para nuestro análisis son aquellas a valores reales.
Definición 4.1 Para A ⊂ Rk , una función f : A → R es aquella que asocia elementos de A con
números reales, de modo que para (x1 , x2 , . . . , xk )t ∈ A se tiene que
 
x1
 x2 
f  .  ∈ R.
 
 .. 
xk

Las variables de f son las componentes del vector, es decir, variable 1, variable 2, · · · , variable
4.2 Conceptos relevantes 65

k; las cantidades genéricas de cada variable son los valores de las componentes, que para el caso
son x1 , x2 , . . . , xk .
Como casos relevantes a considerar, el conjunto A será A = Rk (todo el espacio), A = Rk+ (vectores
cuyas componentes son no negativas) o bien A = Rk++ (vectores cuyas componentes son positivas).

Importante 4.1 Claramente la notación anterior es inadecuada para representar una función
evaluada en un vector de . Por conveniencia, de ahora en adelante el argumento de una función de
x1
varias variables se presentará como una fila, de modo que, por ejemplo, en vez de escribir f ,
x2
escribiremos f (x1 , x2 ). Más general, en todo lo que sigue escribiremos

f (x1 , x2 , x3 , · · · , xk )
 
x1
 x2 
para denotar a la función f evaluada en el vector  .  ∈ Rk . Se insiste que la notación azul no
 
 .. 
xk
inhibe el hecho de que el argumento de la función es un vector.

Respecto de la definición anterior, se tiene lo siguiente:

Importante 4.2
(a) En vez de hablar de una función f de Rk en R es usual decir que “ f es una función de
k-variables en R”.
(b) Es usual confundir variable con valor de la variable: la variable es la componente del vector
(la 1, la 2, etc.), mientras que x1 , x2 , etc. es el valor que dicha variable está tomando. A pesar
de esto, con frecuencia, y abusando del lenguaje, uno dirá que la variable es “x1 ”, “x2 ”, etc.

Para f : Rk → R, de la expresión general de la función podemos identificar el número de variables


que la definen, y cómo cada una de ellas interviene en su expresión. Por ejemplo, cuando uno dice

“considere la función f (x, y) = ln(1 + x2 ) + x · y”, está informando que:
(i) Primero, ya que la función está evaluada genéricamente en dos argumentos, “x” e “y”, se trata
entonces de una función de dos variables, que toma valores reales: f : R2 → R.

(ii) Segundo, la expresión f (x, y) = ln(1 + x2 ) + x · y informa que si la primera variable toma
el valor “x” y la segunda variable toma el valor “y”, entonces evaluada en ellas ocurre que

f (x, y) = ln(1 + x2 ) + x · y. Por lo tanto, si la primera variable toma el valor △ y la segunda
variable toma el valor ◦, se tiene que
p
f (△, ◦) = ln(1 + △2 ) + △ · ◦.

Note además que si la primera variable toma el valor “z” y la segunda variable también toma el
valor “z” entonces
f (z, z) = ln(1 + z2 ) + z3/2 .
Ejemplo 4.4 Suponga que

f (x, y, z) = xy2 z + xeyz ,
es decir, la función f es tal que al vector cuya primera componente es “x”, cuya segunda componente
es “y”, y cuya tercera componente es “z” lo asocia en el número real que se obtiene multiplicando la
66 Capítulo 4. Conceptos básicos

primera componente con el cuadrado de la segunda y con la raíz cuadrada de la tercera, y ese resultado
se suma con el producto de la primera componente por la exponencial del producto entre la segunda y
la tercera. Ya que esta función depende de tres variables, se tiene que f : R3 → R. Note también que

f (z, x, y) = zx2 y + zexy ,

pues la expresión f (z, x, y) es el resultado de evaluar f cuando la primera variable vale “z”, la segunda
vale “x” y la tercera vale “y”. ■

Ejemplo 4.5
(a) Función lineal
Una función lineal f : Rk → R es de la forma

f (x1 , x2 , · · · , xk ) = β0 + β1 x1 + β2 x2 + · · · + βk xk ,

donde β0 , β1 , β2 , . . . , βk ∈ R son constantes dadas. Definiendo b = (β1 , β2 , . . . , βk )t ∈ Rk , para


x = (x1 , x2 , . . . , xk )t ∈ Rk (x es un vector columna) notamos que

f (x1 , x2 , . . . , xk ) = β0 + b · x,

donde b · x es el producto interno de b con x.


(b) Formas cuadráticas
Dado x = (x1 , x2 , . . . , xk )t ∈ Rk y dada la matriz A ∈ Rk×k , entonces la forma cuadrática definida
por
f (x1 , x2 , . . . , xk ) = xt Ax
 
2 7
k
es una función de R en R. Por ejemplo, si k = 2 y A = ∈ R2×2 , entonces
7 3
  
 2 7 x1
f (x1 , x2 ) = x1 x2 = 2x12 + 3x22 + 14x1 x2 ∈ R.
| {z } 7 3 x2
xt | {z } | {z }
A x

En general, una función f : R2 → R tal que

f (x1 , x2 ) = αx12 + β x22 + γx1 x2

es una forma cuadrática cuya matriz es


 γ
α 2
A=  .
γ
2 β

(c) Cobb - Douglas (generalizada)


Dados constantes αi > 0, i = 1, 2, . . . , k, definamos f : Rk+ → R tal que

f (x1 , x2 , . . . , xk ) = x1α1 x2α2 · · · xkαk .

Si k = 2, corresponde a f : R2+ → R tal que f (x1 , x2 ) = x1α1 x2α2 .



4.2 Conceptos relevantes 67

Ejercicio 4.1 Dada


x12 x2 ln(x3 )
g(x1 , x2 , x3 ) =
x1 + x22 + ex3
(a) Indique el número de variables de la función.
(b) Obtenga el valor de las siguientes expresiones:

g(1, 1, 1), g(1, 0, 1), g(x3 , x1 , x2 ), g(g(1, 1, 1), g(1, 0, 1), e).

Ejercicio 4.2 Suponga que α, β > 0 y sea f : R2++ → R tal que f (K, L) = K α Lβ .
(a) Muestre que f (K, K) = K α+β .
(b) Dados K0 , L0 ∈ R++ , encuentre L1 tal que f (2K0 , L1 ) = f (K0 , L0 ).
(c) Encuentre K si sabemos que f (K 2 , K) = 2.

 
a11 a12
Ejercicio 4.3 Dados A = ∈ R2×2 una matriz simétrica y b = (b1 , b2 )t ∈ R2 (vector
a12 a22
columna), para x = (x, y)t ∈ R2 definamos

h(x, y) = xt Ax + b · x.

(a) Muestre que h(x, y) = a11 x2 + a22 y2 + 2a12 xy + b1 x + b2 y.



(b) Encuentre la expresión de h(y2 , x).

(c) Encuentre la expresión de h(1, x + y).

4.2.1.3 Funciones a valores vectoriales


El concepto de funciones de k variables en R se puede extender para considerar una función que sea a
valores vectoriales. Por ejemplo, dados k, n ∈ N, cuando uno escribe

f : Rk → Rn

está informando que la función f transforma vectores de Rk en vectores de Rn . Para definir funciones a
valores vectoriales se debe especificar cada componente de la imagen, de modo que, en términos
simples, una función a valores vectoriales queda definida por funciones de varias variables a valores
reales. Por ejemplo, para definir una función de R3 en R2 uno debe definir las dos componentes de la
imagen, cada una de las cuales es una función de R3 en R. Para fijar ideas, la siguiente es una función
que toma elementos de R3 y los convierte en elementos de R2 : F : R3 → R2 tal que

x 1 x 2 + e x3
 

F(x1 , x2 , x3 ) =   ∈ R2 .
2
x1 − x2 x3

Note que F : R3 → R2 queda definida por las funciones f1 : R3 → R y f2 : R3 → R tal que

f1 (x1 , x2 , x3 ) = x1 x2 + ex3 , f2 (x1 , x2 , x3 ) = x12 − x2 x3 ,


68 Capítulo 4. Conceptos básicos

de modo que
 
f1 (x1 , x2 , x3 )
F(x1 , x2 , x3 ) =   ∈ R2 .
f2 (x1 , x2 , x3 )

En lo que sigue, el estudio se restringe, básicamente, a funciones que toman valores reales, sin
perjuicio de que en algunas partes requiramos usar funciones a valores vectoriales para introducir
algunos conceptos.

4.2.2 Dominio de funciones de varias variables

Definición 4.2 Para una expresión algebraica f (x1 , x2 , · · · , xk ) que define una función de k variables
en R, el dominio de f es el conjunto de puntos de Rk donde tiene sentido realizar la evaluación de
f (x1 , x2 , · · · , xk ). Se denota como Dom( f ) ⊂ Rk .

El concepto de dominio se puede extender de manera directa a funciones que toman valores
vectoriales. En ese caso, el dominio son los puntos donde cada componente está bien definida.
Ejemplo 4.6 Para f (x1 , x2 ) = ln(x1 − 2) + x1 x2 , el dominio de f es dado por los valores de x1 , x2 tal
que la expresión está bien definida. Para ello, x1 debe ser tal que x1 − 2 > 0, mientras que x2 puede
tomar valores arbitrarios. El dominio es entonces Dom( f ) =]2, +∞[×R.
Por otro lado, dados α1 , α2 , · · · , αn constantes positivas y dada g(x1 , x2 , · · · , xn ) = x1α1 x2α2 · · · xnαn , el
dominio de g es tal que cada componente donde se evalúa debe ser mayor o igual a cero (dado αi > 0
arbitrario, la expresión xiαi está bien definida cuando xi ≥ 0). Luego, Dom(g) = Rn+ . ■

Ejercicio 4.4 Encuentre el dominio de las siguientes funciones:

√ K
f (x1 , x2 ) = x1 + ln(x12 (x2 − 1)), g(K, L) = .
1+L

Ejercicio 4.5 Dados α, β > 0, encuentre el dominio de las siguientes funciones:


x1 − 1
g(x1 , x2 , x3 ) = + x3 , h(K, L) = (K − 1)α (L + 1)β , z(x1 , x2 ) = α ln(x1 + 2) + β ln(x2 ).
ln(x2 + 2)

4.3 Operaciones con funciones de varias variables


4.3.1 Suma y ponderación, producto y cociente de funciones
Dadas funciones f , g : Rk → R, podemos entonces construir nuevas funciones a partir de las originales.
• La suma de las funciones f y g es la función
f + g : Rk → R

tal que
( f + g)(x1 , x2 , . . . , xk ) = f (x1 , x2 , . . . , xk ) + g(x1 , x2 , . . . , xk ).
4.3 Operaciones con funciones de varias variables 69

• El producto de f con g es la función f · g, de modo que


( f · g)(x1 , x2 , . . . , xk ) = f (x1 , x2 , . . . , xk ) · g(x1 , x2 , . . . , xk ).

• El cociente de f con g es la función gf , definida donde g es diferente de cero, tal que


 
f f (x1 , x2 , . . . , xk )
(x1 , x2 , . . . , xk ) = .
g g(x1 , x2 , . . . , xk )
En general, a partir de funciones originales podemos construir nuevas funciones realizando opera-
ciones algebraicas sencillas. Lo importante a tener presente es que el dominio y el recorrido de las
funciones deben ser consistentes para que tenga sentido hacer la operación que se considera.
Ejemplo 4.7 En lo que sigue, abusando del lenguaje, las funciones de varias variables se definen a
partir de su expresión algebraica. Dados α, β > 0 y dado A > 0, definamos
β

f (x1 , x2 ) = x1α x2 , g(K, L) = A K + L, h(x) = ln(x),
de modo que f y g son funciones de dos variables a valores reales y h es una función de una variable a
valores reales. Se tiene entonces que:
α β β √
f (2, 3) + g(1, 1) = 2
| {z3 } + A + 1}, f (x1 , x2 ) · g(x1 , x2 ) = (x1α x2 ) · (A x1 + x2 ).
| {z
f (2,3) g(1,1)

Por otro lado,


f (K, K) K α+β  
= √ , h( f (x, y)) = ln xα yβ = α ln(x) + β ln(y).
g(K, K) A K + K
Finalmente, note que
p
g( f (a, b), f (x, x)) = A(aα bβ ) + xα+β , f (h(y), h(z2 + 1)) = (ln(y))α (ln(z2 + 1))β .

4.3.2 Composición de funciones


La idea ahora es explicar la composición de funciones. Para eso, dados k, s, n ∈ N consideremos las
funciones
f 1 : Rk → Rs , f 2 : Rs → Rn .
Dado esto, podemos definir la composición de f2 con f1 como la función f2 ◦ f1 : Rk → Rn tal que
( f2 ◦ f1 )(x1 , x2 , . . . , xk ) = f2 ( f1 (x1 , x2 , . . . , xk )) ∈ Rn .
Respecto de lo anterior, note que si k ̸= n, entonces no tiene sentido realizar la composición de f1
con f2 : como f2 toma valores de Rs y los lleva a Rn , ocurre que esos resultados no están en el dominio
de f1 cuando k ̸= n.
Un caso particular relevante para definir la composición ocurre cuando f1 : Rk → R y f2 : R → R:
la composición de f2 con f1 es tal que f2 ◦ f1 : Rk → R, de modo que
( f2 ◦ f1 ) (x1 , x2 , . . . , xk ) = f2 ( f1 (x1 , x2 , . . . , xk )).
En lo anterior, la función f1 “toma” el vector (x1 , x2 , . . . , xk )t ∈ Rk y lo “convierte” en un número
real, f1 (x1 , x2 , . . . , xk ) ∈ R. Finalmente, la función f2 “toma” ese número real y convierte en el resultado
final, f2 ( f1 (x1 , x2 , . . . , xk )) ∈ R.
70 Capítulo 4. Conceptos básicos

Ejemplo 4.8 Dados α, β > 0, definamos f : R2+ → R2+ y g : R2+ → R de modo que
x 2 + y2
 
β
f (x, y) =  , g(x1 , x2 ) = x1α x2 .
√ 1+y2
xe
Se tiene entonces la composición g ◦ f está bien definida: la función f toma un vector de R2 y lo lleva
a un vector de R2 ; este último lo toma la función g y lo lleva a un número real. Así, g ◦ f : R2+ → R es
tal que
√ 2 β

(g ◦ f )(K, L) = g( f (K, L)) = (K 2 + L2 )α K e1+L .
En este caso no tiene sentido evaluar f ◦ g, ya que el conjunto de llegada de g es R, mientras que el
dominio de f es R2 . ■

Ejemplo 4.9 Suponga que f : R2++ → R tal que f (x1 , x2 ) = x12 + ln(x1 + x2 ). Supongamos además que
“x1 ” y “x2 ” son, a su vez, funciones que dependen de las variables p, q, digamos x1 : R2++ → R tal que
p
x1 (p, q) = p2 q y que x2 : R2++ → R tal que x2 (p, q) = q+1 . Con esto, definamos h : R2 → R tal que
h(p, q) = f (x1 (p, q), x2 (p, q)). Por lo indicado, se tiene entonces que
 
2 2
 2 p
h(p, q) = p q + ln p q + .
q+1
Sobre la base de lo expuesto, cabe señalar que la función h(p, q) es una composición de funciones.
En efecto, definiendo la función (valores vectoriales) g : R2++ → R2++ tal que
   2 
x1 (p, q) p q
g(p, q) =   =   ∈ R2 ,
p
x2 (p, q) q+1
se tiene que
h(p, q) = ( f ◦ g)(p, q) = f (g(p, q)) = f (x1 (p, q), x2 (p, q)).

¿Por qué es relevante el ejemplo anterior? Supongamos que una firma produce cierto producto
usando dos insumos, digamos, capital y trabajo. El capital es una variable cuya cantidad genérica
denotamos como x1 , y el trabajo es una variable cuya cantidad genérica denotamos como x2 . Si la firma
utiliza x1 cantidad de capital y x2 cantidad de trabajo, entonces elabora f (x1 , x2 ) = x12 + ln(x1 + x2 )
cantidad de producto. La función f es la función de producción de la firma.
Supongamos ahora que la cantidad de capital y que la cantidad de trabajo que utiliza la firma
dependen de los precios de esos factores. Si esos precios son p para el capital y q para el trabajo,
la demanda por esos insumos es x1 (p, q) y x2 (p, q). Por lo tanto, lo que en definitiva determina la
cantidad de producto que elabora la firma son los precios de los insumos, y la forma en que uno
establece la relación entre precios y producto es a través de la función h que definimos, es decir, la
composición de la función de producción f con la función de demanda por insumos, g.
A este respecto, con mucha frecuencia uno estudiará diversos modelos económicos donde cierta
función que nos interesa analizar depende variables que identificamos como variables de consumo si
trata de analizar a un individuos, o como insumos de producción si trata de analizar a una firma, pero
donde, a su vez, esas variables dependen de otras variables, que usualmente serán precios, tasas de
interés, impuestos, subsidios, etc. Así, lo que en definitiva determina el bienestar de los individuos, o
los beneficios de las firmas, son los precios, impuestos, etc. El canal que lleva de los precios, impuestos,
etc., a los beneficios o producción es la composición de funciones.
4.3 Operaciones con funciones de varias variables 71

4.3.3 Ejercicios de la sección


Ejercicio 4.6 Dadas las constantes α ∈]0, 1[ y A > 0, considere las siguientes funciones:

f (K, L) = K α L1−α , g(x1 , x2 ) = ln(x1 x2 ) ∧ h(z) = A z,
Se pide lo siguiente:
1. obtenga f (g(a, b), h(△)),
2. obtenga (h ◦ g)(2, 1),
3. explique por qué g( f (x, 1), f (1, x)) = ln(x),
4. explique por qué f ( f (x, x), f (y, y)) = f (x, y),
5. dado t ∈ R, muestre que f (tx1 ,tx2 ) = t f (x1 , x2 ).

(x1 , x2 ) = x12 + ln(1 + x1 x2 ),


Ejercicio 4.7 Para f √
1. obtenga f (K 2 , L),
2. obtenga f (1, 1),
3. obtenga f (x2 , x1 ),
4. obtenga f (x, x),
5. obtenga f ( f (1, z), h2 ),
6. explique por qué se cumple lo siguiente: para todo x2 ∈ R, f (0, x2 ) = 0.

Ejercicio 4.8 Dadas f : Rk → Rm , g : Rs → Rn y h : R → R, se pide:


1. Indique las condiciones sobre el número de variables para que se pueda obtener ( f ◦ g)(x).
2. Indique las condiciones sobre el número de variables para que se pueda obtener (g ◦ f )(x).
3. Indique las condiciones sobre el número de variables para que se pueda obtener (g ◦ h)(x).

Ejercicio 4.9 Suponga que

x2 y
 
K z
f (x, y) = ∈ R2 , g(K, L) = K 2 + ,, h(z) = .
ex ln(2 + y) L 1+z

Determine las siguientes expresiones:


1. (g ◦ f )(a, b),
2. (g ◦ f )(1, 0),
3. (h ◦ g)(1, 1),
4. h(g(2, 2)),
5. g(h(1), h(2)),
6. f (g(K, K), h(1)),
7. f (g(L, h(1)), 1),
8. g(h(1), K)).

Ejercicio 4.10 Dadas las constantes α, β ∈ R++ y a, b ∈ R, considere las funciones f : R2++ → R y
72 Capítulo 4. Conceptos básicos

g : R2 → R tal que f (x, y) = xα yβ y g(x1 , x2 ) = a x12 + b x22 + x1 x2 .


1. Muestre que para todo s > 0 se cumple que f (sx1 , sx2 ) = sα+β f (x1 , x2 ).
2. Muestre que para todo t ∈ R se cumple que g(tx,ty) = t 2 g(x, y).

Ejercicio 4.11 Suponga que f (x, y) = xα yβ y que g(α, β ) = xα yβ .


1. Determine f (1, 1).
2. Determine g(1, 1).

4.4 Aspectos gráfico de funciones de varias variables


4.4.1 Consideraciones generales
Para graficar funciones reales, f : R → R, grosso modo, para x ∈ R se obtiene la imagen respectiva,
f (x), y el punto (x, f (x))t ∈ R2 –vector columna cuya primera componente es “x” y cuya segunda
componente es “ f (x)”– se “dibuja” en el plano cartesiano. Con esto, “recorriendo” los valores de “x” y
dibujando el punto (x, f (x))t ∈ R2 se obtiene el gráfico de la función f .

¿Cómo se extiende lo anterior para una función de varias variables, digamos, f : Rk → R? Sigu-
iendo la lógica del caso función de real de una variable, dado (x1 , x2 , · · · , xk )t ∈ Rk , uno obtiene
y = f (x1 , x2 , · · · , xk ) ∈ R y se “dibuja” el punto

(x1 , x2 , · · · , xk , f (x1 , x2 , · · · , xk ))t ∈ Rk+1 .


| {z }
y

Notemos entonces que si k = 1 (caso funciones reales de una variable) entonces el punto (x1 , f (x1 ))t es
un elemento de R2 , mientras que si k = 2, el punto que se gráfica es (x1 , x2 , f (x1 , x2 ))t ∈ R3 . Por otro
lado, cuando k = 3 ocurre (x1 , x2 , x3 , f (x1 , x2 , x3 ))t ∈ R4 .

Sobre la base de lo anterior, ya que no podemos ilustrar puntos de R4 (en general, de Rk con k > 3),
ocurre que los gráficos de funciones solo se pueden ilustrar cuando k = 1 (funciones f : R → R), o
bien cuando k = 2, es decir, para funciones f : R2 → R. Sin perjuicio de este hecho, el gráfico de una
función es un concepto que se puede definir para funciones que dependen de una cantidad arbitraria de
variables. El punto de lo anterior es que la ilustración del gráfico se puede realizar solo cuando k = 2,
y obviamente cuando k = 1.

4.4.2 Gráfico de funciones: caso dos variables


Lo que sigue ilustra el procedimiento general para obtener gráficos de funciones de dos variables,
digamos, f : R2 → R.
Primero, el dominio de f se dibuja en el “piso”. La primera componente (variable 1) es el eje
Norte - Sur, mientras que la segunda componente (variable 2) es el eje Este - Oeste. Si el dominio es
un subconjunto de R2 , se obtiene una “región del piso”. De manera intuitiva, es como “si la pizarra se
traslada al piso de la sala”. La Figura 4.1 muestra el dominio, R2 , que estamos analizando (presentado
como “piso” en la figura). En ella, el eje Norte - Sur se llama eje X1 (primera variable, primera
componente), mientras que el eje Este - Oeste se llama X2 (segunda variable, segunda componente).
La Figura 4.1 muestra también un punto del “piso” que tiene coordenadas (x1 , x2 ), ambas positivas.
4.4 Aspectos gráfico de funciones de varias variables 73

Figura 4.1: R2 PUESTO EN EL “ PISO ”

Segundo, evaluando la función f : R2 → R en el punto (x1 , x2 ) de la figura anterior se obtiene


el valor f (x1 , x2 ). Si entendemos f (x1 , x2 ) como una tercera componente, altura, con lo anterior se
obtiene un punto que está en el espacio, R3 . La tercera coordenada, dibujada en el eje vertical, X3 , es
f (x1 , x2 ). Con todo esto, (x1 , x2 , f (x1 , x2 ))t ∈ R3 es un punto del gráfico de f (ver Figura 4.2).

Figura 4.2: I MAGEN DE (x1 , x2 ) POR f : PUNTO EN EL ESPACIO

De esta manera, (i) haciendo variar x1 y haciendo variar x2 dentro del rango de sus valores, (ii)
evaluando f (x1 , x2 ) en cada punto que se esté considerando y (iii) graficando (en el espacio) el punto
(x1 , x2 , f (x1 , x2 ))t ∈ R3 se obtiene una superficie en R3 , la que corresponde al gráfico de la función f .
La siguiente figura es ilustrativa.

Figura 4.3: G RÁFICO DE f : R2 → R EN ALGUNOS PUNTOS DEL DOMINIO

En general, esbozar el gráfico de una función de dos variables es un problema relativamente


complicado. Sin embargo, existe software gratuito que, de manera sencilla, permite obtener las gráficos
a partir de expresiones algebraicas que definen la función de dos variables. Para propósitos del curso,
lo relevante sobre esta parte de la materia es:
(a) conocer y entender cómo se podría obtener el gráfico de funciones de dos variables,
(b) conocer el hecho que los gráficos de funciones de dos variables corresponden a superficies en el
espacio (digamos, “alfombras voladoras”).
74 Capítulo 4. Conceptos básicos

Importante 4.3 Desde un punto de vista intuitivo, sabemos que los gráficos de funciones de una
variable (a valores reales), son curvas en el plano real (es decir, curvas en R2 ). Por lo antes indicado,
los gráficos de funciones de dos variables (a valores reales) son superficies en el espacio, es decir,
superficies en R3 . Así, la superficie de un cerro podría corresponder al gráfico de cierta función
f : R2 → R, como también un domo, una carpa, un valle, la superficie de un lago, etc.

x2
Ejemplo 4.10 La Figura 4.4 muestra el gráfico de la función f : R2 → R tal que f (x1 , x2 ) = 1+x
1
2.
2

x12
Figura 4.4: G RÁFICO DE f : R2 → R TAL QUE f (x1 , x2 ) = 1+x22
.

La lectura de lo anterior es como sigue:

(a) los puntos del dominio están en el piso (eje rojo para la primera variable y eje verde para la
segunda variable);
(b) la función f (x1 , x2 ) se evalúa en cada “punto del piso”, y el valor que se obtiene define una altura
asociada al punto del piso. La altura se muestra en el eje azul (vertical);
(c) recorriendo los valores del dominio, los puntos de R3 que se obtienen según lo anterior definen
la superficie de la Figura 4.4, es decir, el gráfico de f .

Importante 4.4 Identificar si una superficie en R3 corresponde al gráfico de alguna función de dos
variables es relativamente directo: ya que las funciones de dos variables asocian un vector con una
cantidad (real) única, en la superficie que se analiza debe ocurrir que trazando una línea vertical
por un punto cualquiera del dominio, la intersección con la superficie debe darse en un único punto.
Por ejemplo, la superficie de una pelota de fútbol no representa (no corresponde) al gráfico de una
función, ni tampoco un plano vertical. Es como si las superficies que representan funciones no se
“voltean” o “retuercen”, de modo que tienen varios “pliegues” o “capas” superpuestas.

4.4.3 Curvas de nivel

Consideremos la función f : R2 → R tal que f (x1 , x2 ) = x12 + x1 + x2 , cuyo gráfico es una superficie en
R3 que se muestra en la Figura 4.5.
4.4 Aspectos gráfico de funciones de varias variables 75

Figura 4.5: G RÁFICO DE f : R2 → R TAL QUE f (x1 , x2 ) = x12 + x1 + x2 .

En la Figura 4.5 fijemos un nivel en el eje X3 , digamos, una altura h > 0. Nos preguntamos
entonces por los puntos del dominio tal que la función evaluada en ellos es igual a h; es decir, nos
interesa conocer (x1 , x2 )t ∈ R2 tal que
f (x1 , x2 ) = h ⇐⇒ x12 + x1 + x2 = h.
Desde un punto de vista geométrico, la altura h > 0 define una curva en el espacio, que son los puntos
del gráfico de f que están a esa altura (curva roja en la Figura 4.6). Note que dicha curva roja induce, a
su vez, una curva en el piso, conformada por los puntos del dominio donde la función evaluada en ellos
genera los puntos de la curva roja: es la sombra de la curva roja en el piso, la curva punteada en la
Figura 4.6. La curva de nivel h de f es, precisamente, esa curva punteada.

Figura 4.6: C URVA DE NIVEL h DE f (x1 , x2 ) = x12 + x1 + x2 .

Note que haciendo variar la altura h se obtienen otras curvas en el espacio, que a su vez generan
nuevas curvas en el piso. En la Figura 4.7 se dibujan dos curvas en el espacio, con alturas diferentes: la
altura de la curva roja es mayor que la altura de la curva azul. Las curvas de nivel correspondientes a
esas alturas se dibujan con línea punteada en el piso, R2 .

Figura 4.7: C URVA DE NIVEL DE f (x1 , x2 ) = x12 + x1 + x2 VARIANDO EL NIVEL


76 Capítulo 4. Conceptos básicos

Definición 4.3 Dada f : R2 → R y dado un valor h, la curva de nivel h de la función f : R2 → R


es aquella “curva del piso” conformada por todos los puntos (x1 , x2 )t ∈ R2 tal que

f (x1 , x2 ) = h.

Importante 4.5 Desde un punto de vista práctico, obtener una curva de nivel es un ejercicio
relativamente sencillo. Si uno fija el nivel h, entonces de la relación

f (x1 , x2 ) = h

podemos, en principio, despejar x2 en función de x1 . Si fuera el caso, al realizar ese despeje


obtenemos una función de x2 en términos de x1 , digamos

x2 (x1 ).

La curva de nivel es el gráfico de la función x2 (x1 ) que se obtuvo del despeje anterior.

Ejemplo 4.11 En relación con el ejemplo anterior, para la función f : R2 → R tal que f (x1 , x2 ) =
x12 + x1 + x2 , la curva de nivel h de la función f queda definida por los puntos (x1 , x2 ) tales que
f (x1 , x2 ) = h, es decir, aquellos que cumplen x12 + x1 + x2 = h. De esto, despejando x2 en términos de
x1 , los puntos de la curva nivel h cumplen que
x2 = −x12 − x1 + h.
En el sistema coordenado X1 − X2 (el “piso”), lo anterior define una parábola: x2 es como si fuera
el “y” y x1 es como si fuera el “x”. Así, desde un punto de vista geométrico, las curvas de nivel de la
función f (x1 , x2 ) son parábolas, de modo que al nivel h la ecuación es
x2 = −x12 − x1 + h.
La Figura 4.8 muestra las curvas de nivel de f para niveles h1 < h2 < h3 .

Figura 4.8: F ORMA FUNCIONAL DE CURVAS DE NIVEL DE f (x1 , x2 ) = x12 + x1 + x2

La lectura de lo anterior es la siguiente: para cualquier punto de la curva roja, la función f evaluada
en ellos es igual a h1 , mientras que para cualquier punto de la curva azul, la función f evaluada en ellos
es igual a h2 . Por lo mismo, para el punto (x̄1 , x̄2 ) de la Figura 4.8 sabemos que
f (x̄1 , x̄2 ) ̸= h1 , f (x̄1 , x̄2 ) ̸= h2 , f (x̄1 , x̄2 ) ̸= h3 ,
4.4 Aspectos gráfico de funciones de varias variables 77

ya que ese punto no está en ninguna de las curvas de nivel que se muestran en la figura. A este respecto,
¿cuál es nivel h∗ para cual (x̄1 , x̄2 ) pertenece la curva de nivel h∗ ? La función evaluada en (x̄1 , x̄2 ) es
igual a
f (x̄1 , x̄2 ) = x̄12 + x̄1 + x̄2 ∈ R,

y esa cantidad define el nivel h∗ para el cual el punto en cuestión está en la curva de nivel correspondiente.
Por ejemplo, si x̄1 = 2 y x̄2 = 3, entonces f (2, 3) = 4 + 2 + 3 = 9, por lo que para h = 9 ocurre que
(2, 3) es un punto de la curva de nivel h = 9. ■

β
Ejemplo 4.12 Dados α, β > 0, considere la función f : R2+ → R tal que f (x1 , x2 ) = x1α x2 . Para un
nivel h > 0, la curva de nivel correspondiente está conformada por todos los puntos (x1 , x2 )t ∈ R2+
β
tales que f (x1 , x2 ) = h, es decir, tales que x1α x2 = h. A partir esto, despejando x2 en términos de x1 se
obtiene que la curva nivel h cumple que:

h1/β
x2 = α/β
.
x1

β
Como el numerador de esa expresión es una constante, la curva de nivel de f (x1 , x2 ) = x1α x2 es, desde
un punto de vista geométrico, una hipérbole (potencia negativa de la variable explicativa, x1 ). Así, de
β
manera genérica, una curva de nivel de la función f (x1 , x2 ) = x1α x2 tiene la siguiente forma.

β
Figura 4.9: C URVA DE NIVEL h DE f (x1 , x2 ) = x1α x2

En la Figura 4.9, el hecho que (x̄1 , x̄2 ) esté en la curva de nivel h, informa que f (x̄1 , x̄2 ) = h, y el
hecho que (x1∗ , x2∗ ) no esté en esa curva de nivel informa que

f (x1∗ , x2∗ ) ̸= h.

Respecto de lo anterior, notemos que si h aumenta de valor, entonces la curva de nivel correspondiente
se modifica. ¿Qué formas van tomando las curvas de nivel en la medida que h aumenta? Dado h > 0,
1/β
la curva de nivel es dada por la expresión x2 = hα/β , de modo si h aumenta ocurre que el numerador es
x1
cada vez mayor, mientras que el denominador se mantiene. Eso implica que la curva de nivel se va
“desplazando hacia arriba” en la medida que h aumenta. La siguiente figura es ilustrativa.
78 Capítulo 4. Conceptos básicos
β
Figura 4.10: C URVAS DE NIVEL DE f (x1 , x2 ) = x1α x2 ANTE CAMBIOS EN NIVEL

Ejemplo 4.13 Dado α, β ∈ R, diferentes de cero,considere la función lineal f : R2 → R tal que


f (x1 , x2 ) = αx1 + β x2 . El gráfico de f es un plano en el espacio R3 . Por otro lado, dado c ∈ R, la
curva de nivel al valor c queda definida por la relación

f (x1 , x2 ) = c ⇐⇒ αx1 + β x2 = c.

Despejando x2 en función de x1 , la curva de nivel c corresponde a x2 = − αβ x1 + βc , que en el plano


cartesiano es una recta con pendiente m = − αβ y coeficiente de posición n = βc . Luego, si el nivel c
aumenta implica que la curva de nivel se desplaza paralelamente hacia “arriba”. Suponiendo α, β > 0,
dados 0 < c1 < c2 < c3 , para valores positivos de las variables en la Figura 4.11 se muestran las curvas
de nivel
αx1 + β x2 = c1 , αx1 + β x2 = c2 , αx1 + β x2 = c3 .

Figura 4.11: C URVAS DE NIVEL DE f (x1 , x2 ) = αx1 + β x2 ANTES CAMBIOS EN NIVEL

¿Para qué nivel “c” ocurre que la curva de nivel de f (x1 , x2 ) = αx1 + β x2 pasa por el punto
(a, b)t ∈ R2 ? Para responder, la función evaluada en el punto (a, b) es

f (a, b) = α a + β b ∈ R,

por lo que el nivel que buscamos es c = α a + β b. ■


4.4 Aspectos gráfico de funciones de varias variables 79

Ejercicio 4.12 Dibuje la curva de nivel h > 0 de la función f : R2++ → R tal que f (x, y) = xy. Dado
esto, dibuje la curvas de nivel para los niveles h = 1, h = 2, h = 3. ■

Ejercicio 4.13 Dada f : R2 → R una función cualquiera y dados h1 ̸= h2 , explique por la curva de
nivel h1 de f no se intersecta con la curva de nivel h2 de f . ■

Ejercicio 4.14 Dado c ∈ R una constante, considere f : R2 → R tal que f (x, y) = c (función
constante). ¿Cómo son las curvas de nivel de f para distintos valores del nivel? ■

Ejercicio 4.15 Considere las siguientes funciones f , g : R2+ → R tal que



g(x1 , x2 ) = x1 + x2 , f (x1 , x2 ) = x1 + x22 .

(a) para h > 1, explique por qué la curva de nivel “h” de la función f (x) y la curva de nivel “h” de
la función g(x) tienen la siguiente forma:

Figura 4.12: C URVAS DE NIVEL h > 1 DE f Y g

(b) Suponiendo que 0 < h < 1, dibuje las curvas de nivel h de las funciones f (x) y g(x).

Ejercicio 4.16 Dados α, β > 0, la función Leontiev es dada por L : R2+ → R tal que L(x1 , x2 ) =
min{αx1 , β x2 }. Es decir, evaluada en el par ordenado (x1 , x2 )t ∈ R2+ , se calcula el valor αx1 y se
calcula el valor β x2 . La función es el menor de ellos.
(a) Dados α = 1 y β = 2, encuentre L(2, 2) y encuentre L(4, 1).
(b) Para los vectores (x1 , x2 )t ∈ R2+ tal que αx1 = β x2 , muestre que

L(x1 , x2 ) = αx1 = β x2 .

(c) Explique por qué para todo ε > 0 se cumple que si L(x1 , x2 ) = αx1 , entonces

L(x1 , x2 + ε) = αx1 .

(d) Explique por qué para todo ε > 0 se cumple que si L(x1 , x2 ) = β x2 , entonces

L(x1 + ε, x2 ) = β x2 .
80 Capítulo 4. Conceptos básicos

(e) Usando lo anterior, dado h > 0 explique por qué la curva de nivel h de L(x1 , x2 ) tiene la
siguiente forma:

Figura 4.13: C URVAS DE NIVEL DE LA L EONTIEV

Ejercicio 4.17 Dada f : R2+ → R tal que f (x, y) = x2 + y2 , muestre que la curva de nivel h > 0, es la
porción de círculo como en la siguiente figura.

Figura 4.14: C URVA DE NIVEL h > 0 DE f (x, y) = x2 + y2

Ejercicio 4.18 Dado β > 1, para g : R2+ → R tal que g(x1 , x2 ) = β x12 + x22 , explique por qué la curva
de nivel h > 0 de g tiene la siguiente forma:

Figura 4.15: C URVA DE NIVEL h > 1DE g(x1 , x2 ) = β x12 + x22


4.4 Aspectos gráfico de funciones de varias variables 81

4.4.4 *Regiones definidas por desigualdades de funciones de varias variables


Partamos con un ejemplo sencillo e ilustrativo.
Ejemplo 4.14 Suponiendo que las canastas de consumo son elementos de R2+ y que los precios son
p1 > 0 y p2 > 0, el costo de una canasta (x1 , x2 )t ∈ R2+ es C(x1 , x2 ) = p1 x1 + p2 x2 . Con esto, las
canastas (vectores) que cuestan exactamente R pesos definen la curva de nivel R de la función C(x1 , x2 ).
Dicha curva cumple con que p1 x1 + p2 x2 = R, lo cual implica que x2 = − pp12 x1 + pR2 .
Desde un punto de vista geométrico, la curva de nivel R es una recta con pendiente negativa. Para
dibujarla, basta con darse dos puntos y unirlos por un segmento. ¿Qué puntos? Cuando x1 = 0 ocurre
que x2 correspondiente cumple que

R
p1 0 + p2 x2 = R ⇒ x2 = ,
p2

mientras que cuando x2 = 0 ocurre que x1 correspondiente cumple que

R
p1 x1 + p2 0 = R ⇒ x1 = .
p1

Luego, los puntos    


R R
0, , ,0
p2 p1
están en la recta que buscamos, por lo que es directo realizar su dibujo (tener presente que las variables
son mayor o igual que cero). La Figura 4.16 muestra la recta que define la curva de nivel R. En ella, el
punto (x̄1 , x̄2 ) está en esa recta, por lo que p1 x̄1 + p2 x̄2 = R.

Figura 4.16: R ECTA p1 x1 + p2 x2 = R, CON x1 , x2 ≥ 0

Sobre la base de lo anterior, cualquier punto (x1 , x2 )t ∈ R2+ que no está en recta roja es tal que

p1 x1 + p2 x2 ̸= R.

Si esa cantidad fuese igual a R, el punto debería estar en la recta roja. Por lo tanto, para los puntos
(x1 , x2 )t ∈ R2+ que no están en la recta roja ocurre que, o bien p1 x1 + p2 x2 > R o bien p1 x1 + p2 x2 < R.
Decidir si el costo del punto es mayor o menor que R se obtiene evaluando el punto a los precios
indicados. A este respecto, si el punto está “arriba” de la recta, claramente será un punto caro que no
alcanza con R pesos, mientras que si está por “debajo” de la recta, será un punto barato, de modo que
sobra con los R pesos. De esta manera, la Figura 4.17 muestra que un punto (x1∗ , x2∗ )t ∈ R2+ sobre la
82 Capítulo 4. Conceptos básicos

recta roja es tal que p1 x1∗ + p2 x2∗ > R, mientras que un punto (x̃1 , x̃2 )t ∈ R2+ que está “debajo” de la
recta roja es tal que p1 x̃1 + p2 x̃2 < R.

Figura 4.17: P UNTOS ARRIBA Y DEBAJO DE CURVA DE NIVEL

De hecho, para todos los puntos (x1 , x2 )t ∈ R2+ que están arriba la recta roja se tiene que p1 x1 +
p2 x2 > R, y para todos los puntos debajo de la recta roja se cumple que p1 x1 + p2 x2 < R. En conse-
cuencia, si el problema es dibujar todos los puntos que cuestan más que R se obtiene una región del
plano, que está arriba de la recta indicada. Eso se presenta en la siguiente figura: la región oscurecida
muestra los puntos (x1 , x2 )t ∈ R2+ para los cuales p1 x1 + p2 x2 > R. En esa figura no se consideran los
puntos de la recta, pues en ellos se cumple la igualdad: la región gris muestra los puntos donde la
desigualdad es estricta.

Figura 4.18: R EGIÓN DONDE p1 x1 + p2 x2 > R, CON x1 , x2 ≥ 0

La región de los puntos (x1 , x2 )t ∈ R2+ para los cuales p1 x1 + p2 x2 < R se muestra a continuación.

Figura 4.19: R EGIÓN DONDE p1 x1 + p2 x2 < R, CON x1 , x2 ≥ 0


4.4 Aspectos gráfico de funciones de varias variables 83

Lo anterior se puede extender para funciones (de dos variables) cualquiera. En el ejemplo anterior
estudiamos el caso cuando C(x1 , x2 ) = p1 x1 + p2 x2 (función lineal en dos variables). Para una función
f : R2+ → R, dado un nivel h obtener la región donde se cumple que f (x1 , x2 ) > h, pasa, primero, por
construir la curva de nivel h. Digamos que esa curva es dada por el gráfico de x2 (x1 ) que se obtiene
despejando x2 en función de x1 a partir de la relación f (x1 , x2 ) = h. Con esto, para saber cuál es la
región que nos interesa, evaluamos la función f en algún punto de la región bajo análisis: si el resultado
de esa evaluación es mayor que h, entonces todos los puntos en la región “donde está el punto evaluado
hasta la curva sin incluirla” cumplen la desigualdad que se indica. Cabe señalar que el punto donde
evaluamos para tomar la decisión puede ser cualquiera, incluso lo podemos hacer tender a infinito. Por
otro lado, los puntos que están en el lado opuesto de lo anterior son aquellos para los cuales f (x, y) < h.
El siguiente ejemplo es ilustrativo.
β
Ejemplo 4.15 Dados α, β > 0, y dada f : R2+ → R tal que f (x1 , x2 ) = x1α x2 ,, “dibujemos” la región de
t 2
los puntos (x1 , x2 ) ∈ R+ tal que f (x1 , x2 ) > 1. Para esto, primero, la curva de nivel h = 1 de f cumple
β 1
que x1α x2 = 1, por lo que x2 = α/β . El gráfico de “x2 ” como función de “x1 ” se muestra en la figura a
x1
continuación.
1
Figura 4.20: G RÁFICO DE x2 = α/β , CON x1 , x2 ≥ 0
x1

Dado lo anterior, si evaluamos f en x1 “muy grande” y en x2 “muy grande”, entonces f (x1 , x2 ) > 1,
por lo que todos los puntos que están arriba de la curva roja (sin tocarla) cumplen la condición
f (x1 , x2 ) > 1. La región que buscamos se muestra a continuación.
β
Figura 4.21: G RÁFICO DE x1α x2 > 1, CON x1 , x2 ≥ 0

N Cuando uno dibuja la región {(x1 , x2 )t ∈ R2 : f (x1 , x2 ) > h} no debe considerar el “borde”
definido por la curva de nivel f (x1 , x2 ) = h. Esta se toma en cuenta solo si nos interesa obtener la
región
{(x1 , x2 )t ∈ R2 : f (x1 , x2 ) ≥ h}.
Por otro lado, si uno conoce la región {(x1 , x2 )t ∈ R2 : f (x1 , x2 ) > h}, entonces, de inmediato,
conoce la región {(x1 , x2 )t ∈ R2 : f (x1 , x2 ) < h}, que es el complemento de la primera sin incluir
la curva de nivel.
5. Cálculo diferencial

5.1 Derivadas parciales (primer orden) y gradiente


5.1.1 Intuición y concepto de las derivadas parciales (primer orden)
Ud. está parado en cierto punto de la superficie de un cerro. Dicha superficie se entiende como el
gráfico de una función de dos variables, digamos f : R2 → R, de modo que el punto donde Ud. está
tiene coordenadas
(x̄1 , x̄2 , f (x̄1 , x̄2 ))t ∈ R3
para ciertos valores de x̄1 y x̄2 . Estando allí, supongamos que quiere moverse en la dirección Norte
- Sur, es decir, en la dirección del eje X1 . Al moverse en esa dirección solo se modifica la primera
coordenada de su posición, manteniendo constante la segunda. ¿Cuál es la pendiente de ese sendero?
Es decir, parado en el punto (x̄1 , x̄2 , f (x̄1 , x̄2 ))t ∈ R3 de la superficie del cerro, ¿que pendiente tiene el
sendero que hay en la dirección del eje X1 ?
Entendiendo que el sendero es una curva en el espacio que se obtiene modificando el valor de la
primera componente pero manteniendo constante el valor de la segunda componente, la pendiente que
nos interesa obtener es simplemente la derivada de la curva que define el sendero. Note que si decide
moverse en la dirección Este - Oeste, la pendiente del sendero es la derivada de la curva que se obtiene
manteniendo fija la primera componente pero modificando la segunda.
En resumen, parado en el punto (x̄1 , x̄2 , f (x̄1 , x̄2 ))t ∈ R3 , la pendiente del sendero, a partir de ese
punto, en la dirección Norte - Sur se obtiene haciendo variar la primera componente y manteniendo
constante la segunda, es decir

f (x̄1 + h, x̄2 ) − f (x̄1 , x̄2 )


Pendiente Norte Sur = lim ,
h→0 h
mientras que
f (x̄1 , x̄2 + h) − f (x̄1 , x̄2 )
Pendiente Este Oeste = lim .
h→0 h
La pendiente Norte - Sur se llama derivada parcial con respecto a la primera variable evaluada
en (x̄1 , x̄2 ), mientras que la pendiente Este - Oeste es la derivada parcial con respecto a la segunda
86 Capítulo 5. Cálculo diferencial

variable, evaluada en (x̄1 , x̄2 ), que se representan, de manera respectiva, como:

∂ f (x̄1 , x̄2 ) f (x̄1 + h, x̄2 ) − f (x̄1 , x̄2 ) ∂ f (x̄1 , x̄2 ) f (x̄1 , x̄2 + h) − f (x̄1 , x̄2 )
= lim , = lim .
∂ x1 h→0 h ∂ x2 h→0 h

Definición 5.1 Para una función f : Rk → R, la derivada parcial de f respecto de la variable


i ∈ {1, 2, . . . , k} evaluada en el vector (x̄1 , x̄2 , · · · , x̄k )t ∈ Rk se define como

∂ f (x̄1 , x̄2 , · · · , x̄k ) f (x̄1 , x̄2 , · · · , x̄i−1 , x̄i + h, x̄i+1 , · · · , x̄k ) − f (x̄1 , x̄2 , · · · , x̄i−1 , x̄i , x̄i+1 , · · · , x̄k )
= lim .
∂ xi h→0 h

En términos prácticos, ¿cómo se encuentra una derivada parcial respecto de cierta variable? Por la
definición, el cálculo de derivadas parciales de funciones de varias variables es análogo al cálculo de
derivadas de funciones de una variable, solo que el ejercicio se repite tantas veces como variables haya:
se deriva respecto de la variable de interés suponiendo que las demás variables son constantes. Por este
hecho, cuando uno desea obtener
∂ f (x1∗ , x2∗ )
∂ x1
se encuentra la derivada de la función f (x1 , x2 ) con respecto a x1 suponiendo que x2 es constante, y ese
resultado, una vez obtenido en términos generales, se evalúa en (x1∗ , x2∗ ).

Importante 5.1 Para f : R2++ → R tal que f (x1 , x2 ) = x12 x2 +ln(x2 ), abusando del lenguaje tenemos
que las variables de la función son x1 y x2 . A este respecto, uno escribe

∂ f (x̄1 , x̄2 )
∂ x1
para indicar que la derivada parcial de f se está calculando respecto a la primera variable, y que
una vez calculada, de manera general, el resultado se evalúa en (x̄1 , x̄2 ). Más aun, con frecuencia
escribiremos una expresión de la forma

∂ f (x1 , x2 )
∂ x2
donde entendemos que las variables de f las hemos denotado como “x1 ” (primera variable) y “x2 ”
(segunda variable), de modo que la derivada anterior se realiza respecto de la segunda variable, y ese
resultado es evaluado en (x1 , x2 ), eso a pesar de que la variable y el punto donde se evalúa se denotan
de la misma manera. Identificar las variables respecto de las que se deriva y distinguirlas del valor
donde se calcula la derivada es una cuestión importante a tener presente en lo que sigue.

Ejemplo 5.1 Para la función


f (x1 , x2 ) = x12 x2 + ln(x2 ),

la derivada parcial con respecto a la primera variable se obtiene derivando la expresión de f (x1 , x2 )
con respecto a x1 suponiendo que x2 es constante, mientras que la derivada parcial de f (x1 , x2 ) con
respecto a la segunda variable se obtiene derivando la expresión con respecto a x2 suponiendo que x1 es
constante. Así,
∂ f (x1 , x2 ) ∂ f (x1 , x2 ) 1
= 2x1 x2 , = x12 + .
∂ x1 ∂ x2 x2
5.1 Derivadas parciales (primer orden) y gradiente 87

Usando lo anterior (recuerde que primero se deriva en general y luego se evalúa), tenemos que

∂ f (5, 3) ∂ f (5, 3) 1 76
= 2 · 5 · 3 = 30, = 52 + = .
∂ x1 ∂ x2 3 3

Por otro lado, Ud. puede verificar que

∂ f (K, L) ∂ f (s,t) 1 ∂ f (x, x) ∂ f (n, n) 1


= 2K L, = s2 + , = 2x2 , = n2 + .
∂ x1 ∂ x2 t ∂ x1 ∂ x2 n

Ejemplo 5.2 Para f : R2 → R tal que f (x, y) = x e xy2 , obtener

∂ f (x, y) ∂ f (x, y)
, .
∂x ∂y

En este ejemplo, abusando del lenguaje, las dos variables de la función son “x” (la primera) e “y”
(la segunda). La expresión ∂ f∂(x,y)
x se entiende como la “derivada de f respecto de su primera variable,
∂ f (x,y)
evaluada en (x, y)”, mientras que ∂y se entiende como “derivada de f respecto de su segunda
variable, evaluada en (x, y)”.

Para efectos prácticos, ∂ f∂(x,y)


x se obtiene derivando la expresión de f (x, y) respecto de “x” suponiendo
que y es constante, por lo que

2 ∂ f (x, y) 2 2
f (x, y) = x exy ⇒ = exy + xy2 exy ,
∂x
∂ f (x,y)
mientras que ∂y se obtiene derivando la expresión de f (x, y) respecto de “y” suponiendo que x es
constante:
2 ∂ f (x, y)  2
 2
f (x, y) = x exy ⇒ = x x 2y exy = 2x2 yexy .
∂y
Para obtener
∂ f (y, x)
,
∂x
es decir la derivada de f (x, y) con respecto a la primera variable pero evaluada en (y, x) en vez de
(x, y), usamos el resultado anterior y reemplazamos “x por y” e “y por x”. De esta manera:

∂ f (x, y) 2 2 x=y, y=x ∂ f (y, x) 2 2


= exy + xy2 exy =⇒ = eyx + yx2 eyx .
∂x ∂x
Otra forma de ver el resultado anterior. Primero que todo, cuando se definió la función se dijo que la
primera variable es “x” y que la segunda variable es “y”, de modo que f (x, y) es igual al “producto de
la primera variable por la exponencial de la primera variable multiplicada por la segunda variable al
cuadrado”:
2
f (x, y) = x exy
Por lo tanto, ya que

∂ f (x, y) 2 2 x=□, y=△ ∂ f (□, △) 2 2


= ex y + x y 2 ex y =⇒ = e□ △ + □ △2 e□ △ .
∂x ∂x
88 Capítulo 5. Cálculo diferencial

Haciendo □ = y, △ = x se obtiene
□ △
z}|{ z}|{
∂ f( y , x ) 2 2
= eyx + yx2 eyx .
∂x | {z }
2 2
e□ △ +□ △2 e□ △

Ejemplo 5.3 Dados α1 , α2 , · · · , αn constantes positivas, y dada g : Rn++ → R tal que

g(x1 , x2 , · · · , xn ) = x1α1 x2α2 · · · xnαn ,

para i ∈ {1, . . . , n} se tiene que

∂ g(x1 , x2 , · · · , xn ) αi−1 αi −1 αi+1


= αi x1α1 x2α2 · · · xi−1 xi xi+1 · · · xnαn .
∂ xi
En particular, para n = 2 y g : R2+ → R tal que g(x1 , x2 ) = x1α1 x2α2 se tiene que

∂ g(x1 , x2 ) ∂ g(x1 , x2 )
= α1 x1α1 −1 x2α2 ∧ = α2 x1α1 x2α2 −1 .
∂ x1 ∂ x2
Para este caso, note que
∂ g(x1 ,x2 )
∂ x1 α1 x1α1 −1 x2α2 α1 x2
= = .
∂ g(x1 ,x2 )
∂ x2
α2 x1α1 x2α2 −1 α2 x1

αKL
Ejemplo 5.4 Dados α, β ∈ R++ y dada g(K, L) = 1+β KL2
, se tiene que

∂ g(K, L) (1 + β KL2 )(αL) − (αKL) (β L2 ) αL


= =
∂K (1 + β KL2 )2 (1 + β KL2 )2
mientras que
∂ g(K, L) (1 + β KL2 ) (αK) − (αKL)(2 β KL) αK − αβ K 2 L2
= = .
∂L (1 + β KL2 )2 (1 + β KL2 )2
∂ g(K,L)
De esta manera, al reemplazar K por L en la expresión de ∂L se tiene que

∂ g(L, L) αL − αβ L4
= .
∂L (1 + β L3 )2

Ejercicio 5.1 Dadas constantes α, β , γ ∈ R+ , para las funciones

eαx 2 αx + γ
f1 (x, y) = αx2 + β y2 + γxy, f2 (x, y) = , f3 (x, y) = ex + γ ln(y), f4 (x, y) = ,
1 + eβ y βy+1
se pide obtener las siguientes derivadas para i = 1, 2, 3, 4:

∂ fi (x, y) ∂ fi (x, y) ∂ fi (0, 1) ∂ fi (0, 1)


, , , .
∂x ∂y ∂x ∂y

5.1 Derivadas parciales (primer orden) y gradiente 89

Ejercicio 5.2 Para f (x, y) = xy muestre que


∂ f (x,y)
1. ∂x = yxy−1 ,
∂ f (x,y)
2. ∂y = ln(x) xy .

Ejercicio 5.3 Suponga que g(x, y) = xα yβ y que h(α, β ) = xα yβ . Obtenga entonces lo siguiente:

∂ g(x, y) ∂ g(x, y) ∂ h(α, β ) ∂ h(α, β )


, , , .
∂x ∂y ∂α ∂β


Ejercicio 5.4 Para la función f : R2++ → R tal que f (x, y) = xy muestre que
∂ f (x,y)
∂x y
∂ f (x,y)
= .
x
∂y


Por otro lado, dado n ∈ N y g : R2+ → R tal que g(x, y) = n xy muestre que

∂ g(x,y)
∂x y
∂ g(x,y)
= .
x
∂y

Ejercicio 5.5 Para


2
exy ln(x1 + ex2 )
f (x, y) = 2 , g(x1 , x2 ) = q ,
1 + ex y x1 + x22
se pide lo siguiente:
1. calcular ∂ f (x∂ 1x,x2 ) ,
∂ g(x,y)
2. calcular ∂ x2 ,
∂ f (h,h)
3. calcular ∂y
∂ f (1,2)
4. calcular ∂x ,
∂ g(h,h)
5. calcular ∂ x2 .

q
Ejercicio 5.6 Dado x = (x1 , x2 , . . . , xk )t ∈ Rk , recordemos que ∥x∥ = x12 + x22 + · · · + xk2 es la norma
Euclidiana de x. Vista como una función de Rk en R, para i ∈ {1, 2, . . . , k} se pide mostrar que

∂ ∥x∥ xi
= .
∂ xi ∥x∥

90 Capítulo 5. Cálculo diferencial

5.1.2 Gradiente de una función de Rk en R


Para f : Rk → R, dado x = (x1 , x2 , . . . , xk )t ∈ Rk , las k derivadas parciales de f en x se denotan como
∂ f (x)
, i ∈ {1, . . . , k}.
∂ xi
Ya que el conjunto de llegada de f es R, cada una de esas derivadas parciales evaluadas en puntos
del dominio son elementos de R.
El vector (columna) de Rk cuyas componentes son las derivadas parciales de f , evaluadas en x, es
el gradiente de la función f en ese punto.
Definición 5.2 Para f : Rk → R, el gradiente de f evaluado en x = (x1 , x2 , . . . , xk )t ∈ Rk es el
vector de las derivadas parciales respecto de cada variable, evaluadas en x. Se denota como
 ∂ f (x) 
∂x
 1 
 
 ∂ f (x)  k
 ∂ x2  ∈ R .
∇ f (x) =  
 .. 
 . 
∂ f (x)
∂ xk

La expresión ∇ f (x) también se lee como “nabla f en x”.

Ejemplo 5.5 Para f : R2++ → R tal que f (x1 , x2 ) = x1 ln(x1 ) + ex1 x2 , determine ∇ f (2, 3). Para esto,
primero, obtenemos de manera genérica las derivadas parciales de f :
∂ f (x1 , x2 ) 1 ∂ f (x1 , x2 )
= x1 + ln(x1 ) + x2 ex1 x2 = 1 + ln(x1 ) + x2 ex1 x2 , = x1 ex1 x2 .
∂ x1 x1 ∂ x2
Luego,
1 + ln(x1 ) + x2 ex1 x2
 

∇ f (x1 , x2 ) =   ∈ R2 ,
x1 ex1 x2
por lo que
1 + ln(2) + 3e6
 

∇ f (2, 3) =   ∈ R2 .
2 e6
x2
Ejemplo 5.6 Dado β > 0 y f (x, y) = 1+β y2
, encontrar (x, y)t ∈ R2 tal que ∇ f (x, y) = 02 (vector nulo■
de R2 ). Para esto,
 2x 
1+β y2
∂ f (x, y) 2x ∂ f (x, y) x2 (2β y) 2
= , =− ⇒ ∇ f (x, y) =  ∈R .
 
∂x 1 + β y2 ∂y (1 + β y2 )2 x2 (2β y)
− (1+β y2 )2

Lo que se pide corresponde a encontrar “x” e “y” tal que


 2x 
1+β y2
x2 (2β y)
 
0 2x
= ⇐⇒ = 0, − = 0.
 
0 1 + β y2 (1 + β y2 )2

x2 (2β y)
− (1+β y2 )2
5.1 Derivadas parciales (primer orden) y gradiente 91
2x
Del hecho que 1+β y2
= 0 se concluye que x = 0 (el denominador nunca es cero). Usando esto en
x2 (2β y)
− (1+β y2 )2 = 0 se concluye que y ∈ R es arbitrario. En consecuencia, hemos probado que para todo
y ∈ R se cumple que ∇ f (0, y) = 02 ∈ R2 . ■

Ejemplo 5.7 Para f (x, y) = x2 + 2y2 + xy − 2x − y, encuentre x e y de modo que ∇ f (x, y) = 02 . Para
esto, del hecho que
 
2x + y − 2
∂ f (x, y) ∂ f (x, y)  ∈ R2 .
= 2x + y − 2, = 4y + x − 1 ⇒ ∇ f (x, y) = 
∂x ∂y
4y + x − 1

Luego, ∇ f (x, y) = 02 cuando se cumple que 2x + y − 2 = 0 y que 4y + x − 1 = 0, es decir, el punto que


buscamos resuelve el siguiente sistema de ecuaciones

2x + y = 2 (5.1)
4y + x = 1 (5.2)

Resolviendo el sistema de ecuaciones (5.1) – (5.2) se tiene que: de (5.1) tenemos que y = 2 − 2x, y eso
en (5.1) implica que

4(2 − 2x) + x − 1 = 0 ⇒ 8 − 8x + x − 1 = 0 ⇒ 7x = 7 ⇒ x = 1.

Usando esto en la ecuación (5.1) se tiene que y = 0. Por lo tanto, ∇ f (x, y) = 02 cuando x = 1 e y = 0,
es decir, ∇ f (1, 0) = 02 . ■

Ejemplo 5.8 Dada f (x, y) = x2 exy se tiene que

(2x + x2 y)exy
 
∂ f (x, y) ∂ f (x, y)
= (2x + x2 y)exy , = x3 exy ⇒ ∇ f (x, y) =   ∈ R2 .
∂x ∂y
x3 exy

Por lo tanto, para que ∇ f (x, y) = 02 se debe cumplir que

(2x + x2 y)exy = 0 (5.3)


3 xy
x e = 0 (5.4)

Teniendo presente que las exponenciales nunca son cero, de la ecuación (5.4) se tiene que x = 0. Por
otro lado, usando este resultado, de la ecuación (5.3) tenemos que “y” es arbitrario. Con todo esto
se concluye que ∇ f (x, y) = 02 cuando x = 0 e y es arbitrario, es decir, para todo y ∈ R se tiene que
∇ f (0, y) = 02 . ■

Ejercicio 5.7 Obtenga ∇ f (x, y) para los siguientes casos

1+x
f (x, y) = xy , f (x, y) = yx , f (x, y) = ax + by, f (x, y) = .
1+y

92 Capítulo 5. Cálculo diferencial

Ejercicio 5.8 Dadas constantes a, b, c, obtenga ∇ f (x, y) cuando f (x, y) = ax2 + 2bxy + cy2 . Además,
obtenga
∇ f (0, 0), ∇ f (1, 1), ∇ f (1, y).

Ejercicio 5.9 Dado a = (a1 , a2 , . . . , ak )t ∈ Rk , para x = (x1 , x2 , . . . , xk )t ∈ Rk definimos la función


lineal f : Rk → R tal que

f (x) = a · x = a1 x1 + a2 x2 + · · · + ak xk .

Muestre entonces que ∇ f (x) = a. ■

 
a b
Ejercicio 5.10 Dada A = ∈ R2×2 , la forma cuadrática asociada a la matriz A, evaluadas en
b c
x = (x1 , x2 )t ∈ R2 es
qA (x) = xt Ax = ax12 + 2bx1 x2 + cx22 .
(i) Muestre que
∂ qA (x1 , x2 ) ∂ qA (x1 , x2 )
= 2ax1 + 2bx2 , = 2bx1 + 2cx2 .
∂ x1 ∂ x2
(ii) Concluya que ∇qA (x1 , x2 ) = 2Ax ∈ R2 .

Ejercicio
q 5.11 La función norma Euclidiana evaluada en x = (x1 , x2 , . . . , xk )t ∈ Rk es ∥x∥ =
x12 + x22 + · · · + xk2 . Dado esto, muestre que

1
∇∥x∥ = x ∈ Rk .
∥x∥

Ejercicio 5.12 Obtenga ∇ f (1, 1) para los siguientes casos

1+x
f (x, y) = xy , f (x, y) = yx , f (x, y) = ax + by, f (x, y) = .
1+y

p √ √
Ejercicio 5.13 Dado f (x, y) = 2x − x 1 + y2 , muestre que ∇ f (x, y) = 02 en (0, 3) y (0, − 3). ■

Ejercicio 5.14 Encuentre “x” e “y” de modo que ∇ f (x, y) = 02 para los siguiente casos:

f (x, y) = x2 + y2 + 2xy + x − y, f (x, y) = x2 ln(1 + y2 ).


5.2 Reglas de derivación 93

Ejercicio 5.15 Suponga que α, β , p1 , p2 , R son constantes positivas. Definamos L : R3 → R tal que

β
L(x1 , x2 , λ ) = x1α x2 + λ (p1 x1 + p2 x2 − R).

(i) Muestre que


∂ L(x1 , x2 , λ ) β
= αx1α−1 x2 + λ p1 .
∂ x1
(ii) Muestre que
∂ L(x1 , x2 , λ ) β −1
= β x1α x2 + λ p2 .
∂ x2
(ii) Muestre que
∂ L(x1 , x2 , λ )
= p1 x1 + p2 x2 − R.
∂λ

5.2 Reglas de derivación


5.2.1 Regla de la suma (y ponderación), producto y cociente
Ya que las derivadas parciales son, en definitiva, una serie de derivadas de funciones de una variable, las
reglas de derivación que teníamos para funciones de R en R siguen aplicando. Así, dadas f : Rk → R,
g : Rk → R, β ∈ R una constante y x = (x1 , x2 , . . . , xk )t ∈ Rk , para todo i ∈ {1, . . . , k} se tiene lo
siguiente:

Importante 5.2
(a) Regla de la suma y ponderación:

∂ ( f (x) + β g(x)) ∂ f (x) ∂ g(x)


= +β .
∂ xi ∂ xi ∂ xi
(b) Regla del producto:

∂ ( f (x) · g(x)) ∂ f (x) ∂ g(x)


= · g(x) + f (x) · .
∂ xi ∂ xi ∂ xi
(c) Regla del cociente:
 
f (x) ∂ f (x)
∂ g(x) ∂ xi · g(x) − f (x) · ∂∂g(x)
xi
= .
∂ xi [g(x)]2

Ejercicio 5.16 Para f : Rk → R y g : Rk → R, dado x ∈ Rk muestre que

∇( f (x) + g(x)) = ∇ f (x) + ∇g(x).

Ejercicio 5.17 Primero, usando la regla del producto para derivadas parciales, para f : Rk → R y
94 Capítulo 5. Cálculo diferencial

g : Rk → R, dado x = (x1 , x2 , . . . , xk )t ∈ Rk explique por qué se cumple lo siguiente:

∇( f (x) · g(x)) = g(x) ∇ f (x) + f (x) ∇g(x) ∈ Rk .

Segundo, dadas las funciones f (x, y) = x2 ey , g(x, y) = y ln(x), se pide:


(a) obtenga ∇ f (x, y) y ∇g(x, y),
(b) obtenga g(x, y) ∇ f (x, y) + f (x, y) ∇g(x, y),
(c) muestre que h(x, y) = f (x, y) · g(x, y) = x2 ey y ln(x), y obtenga directamente ∇h(x, y). Con
esto, compruebe que ∇h(x, y) coincide con lo obtenido en la parte roja de este ejercicio.

5.2.2 Regla de la cadena


La regla de la cadena aplica a la composición de funciones. Es la regla de derivación “más complicada”,
y requiere estudio aparte. Jugará un papel muy importante en una serie de aplicaciones que verá en este
y otros cursos.
Para presentar el resultado general, considere una función g : Rk → R cuyo argumento es x =
(x1 , x2 , . . . , xk )t ∈ Rk , de modo que
g(x1 , x2 , . . . , xk ) ∈ R.
Supongamos además que cada una de esas k variables depende de otras m variables, digamos

xi (p1 , p2 , . . . , pm ) ∈ R, i ∈ {1, . . . , k}.

Definamos entonces la función H : Rm → R que al vector p = (p1 , p2 , . . . , pm )t ∈ Rm le asocia

H(p1 , p2 , . . . , pm ) = g(x1 (p1 , p2 , . . . , pm ), x2 (p1 , p2 , . . . , pm ), . . . , xk (p1 , p2 , . . . , pm )) ∈ R.

En lo que sigue denotamos p = (p1 , p2 , . . . , pm )t ∈ Rm y x(p) = (x1 (p), x2 (p), . . . , xk (p))t ∈ Rk .


Dado esto, la regla de la cadena sostiene que la derivada de H con respecto a la variable p j es igual a

∂ H(p) ∂ g(x(p)) ∂ x1 (p) ∂ g(x(p)) ∂ x2 (p) ∂ g(x(p)) ∂ xk (p)


= · + · +···+ · .
∂ pj ∂ x1 ∂ pj ∂ x2 ∂ pj ∂ xk ∂ pj
La lectura del este resultado es como sigue:

Importante 5.3
(a) primero, la función “g” depende de k variables, de modo a x = (x1 , x2 , . . . , xk )t ∈ Rk asocia la
cantidad g(x1 , x2 , . . . , xk ) ∈ R,
(b) segundo, a su vez, cada variable “xi ” depende de otras m variables, p1 , p2 , · · · , pm , siendo la
relación de la forma xi (p1 , p2 , . . . , pm ), con i = 1, 2, . . . , k,
(c) tercero, la función “g” evaluada en xi (p1 , p2 , . . . , pm ) es una expresión que, finalmente, solo
depende de las variables p1 , p2 , . . . , pm , digamos,

H(p1 , p2 , . . . , pm ),

(d) cuarto, si “movemos” la variable p j ocurre que la función H se mueve, y el efecto neto es
dado por
∂ H(p1 , p2 , . . . , pm )
,
∂ pj
5.2 Reglas de derivación 95

(e) quinto, al mover p j también ocurre que cada variable “xi ” se mueve, y el efecto es dado por

∂ xi (p)
,
∂ pj

(f) sexto, el hecho que cada variable “xi ” se haya movido implica que la función g también “se
mueve”: el efecto del “movimiento” de la variable xi sobre “g” es dado por

∂ g(x(p))
.
∂ xi
(g) Finalmente, la relación entre todos los movimientos que han ocurrido es dado por (regla de la
cadena):

∂ H(p) ∂ g(x(p)) ∂ x1 (p) ∂ g(x(p)) ∂ x2 (p) ∂ g(x(p)) ∂ xk (p)


= · + · +···+ · .
∂ pj ∂ x1 ∂ pj ∂ x2 ∂ pj ∂ xk ∂ pj

N Notemos que la función H(p) anterior es una composición de funciones. En efecto, definiendo
X : Rm → Rk tal que
   
x1 (p1 , p2 , . . . , pm ) x1 (p)
x2 (p1 , p2 , . . . , pm ) x2 (p)
X(p1 , p2 , . . . , pm ) =   =  ..  ∈ Rk ,
   
..
 .   . 
xk (p1 , p2 , . . . , pm ) xk (p)

se tiene que
H(p) = (g ◦ X)(p) = g(X(p)) = g(x1 (p), x2 (p), . . . , xk (p)).
Ejemplo 5.9 Dada f (x, y) una función de dos variables a valores reales, supongamos que “x” e “y”
dependen de las variables w, r, digamos, x(w, r) e y(w, r). Con esto, consideremos la función

h(w, r) = f (x(w, r), y(w, r)).

Por lo anterior, un movimiento de w provoca un movimiento de h(w, r), el cual medimos por la
derivada parcial
∂ h(w, r)
.
∂w
A su vez, el movimiento de w provoca un movimiento de x e y, que medimos por las derivadas parciales
∂ x(w, r) ∂ y(w, r)
, .
∂w ∂w
Por último, el movimiento de x e y provoca un movimiento de f que medimos por las derivadas
∂ f (x(w, r), y(w, r)) ∂ f (x(w, r), y(w, r))
, .
∂x ∂y
La relación entre todos los movimientos que se han identificado es dado por la regla de la cadena:
∂ h(w, r) ∂ f (x(w, r), y(w, r)) ∂ x(w, r) ∂ f (x(w, r), y(w, r)) ∂ y(w, r)
= · + · .
∂w ∂x ∂w ∂y ∂w

96 Capítulo 5. Cálculo diferencial

Ejemplo 5.10 Supongamos que f (x, y) es una función de dos variables a valores reales, y supongamos
que “y” depende de “x”, digamos y(x). Dado esto, la función

h(x) = f (x, y(x))

solo depende de la variable “x”. Para este caso, el efecto relevante a considerar es el movimiento de la
variable “x”. Primero, al mover “x” se mueve h, de modo que el efecto es dado por
∂ h(x)
.
∂x
Por otro lado, el movimiento de “x” obviamente afecta a la variable “x”, y también a la variable “y”;
esos efectos son dados por las derivadas
∂x ∂ y(x)
= 1, .
∂x ∂x
A su vez, ya que “x” e “y” se mueven, ocurre que f se mueve, y los efectos son
∂ f (x, y(x)) ∂ f (x, y(x))
, .
∂x ∂y
La regla de la cadena sostiene que la relación entre todos estos movimientos es
∂ h(x) ∂ f (x, y(x)) ∂ x ∂ f (x, y(x)) ∂ y(x) ∂ f (x, y(x)) ∂ f (x, y(x)) ∂ y(x)
= · + · = + · .
∂x ∂x ∂x ∂y ∂x ∂x ∂y ∂x

Ejemplo 5.11 Suponga que hay dos bienes de consumo, el bien 1 es alimento sólido (cantidad genérica
x1 ) y el bien 2 es líquidos (cantidad genérica x2 ). Cada unidad de sólido tiene precio p1 ∈ R++ y
cada unidad de líquido tiene precio p2 ∈ R++ . La cantidad del bien i ∈ {1, 2} que se consumiría si los
precios son p1 y p2 es la demanda de ese bien, la que denotamos como

xi (p1 , p2 ) ∈ R+ .

En general, en economía ocurre que la demanda por cierto bien de consumo depende del precio propio
y también del precio de los otros bienes: si disminuye el precio de los sólidos seguramente aumentará
la demanda por sólidos pero afectará negativamente la demanda de los líquidos.
Usando lo anterior, si u : R2 → R es una función de utilidad de cierto agente (ver Ejemplo 4.1), la
satisfacción que el individuo logra si, de manera respectiva, los precios de los bienes son p1 y p2 es
dada por
V (p1 , p2 ) = u(x1 (p1 , p2 ), x2 (p1 , p2 )) ∈ R.
De esta manera, la satisfacción es la función de utilidad evaluada en la demanda. Así, la composición de
funciones que hubo para obtener la satisfacción en términos de los precios es el siguiente: (i) el precio
determina la demanda y, luego, (ii) evaluando la utilidad en la demanda se obtiene la satisfacción. Sobre
la base de este encadenamiento uno tiene que, en definitiva, los precios determinan la satisfacción.
El punto ahora es el siguiente: ya que la función de satisfacción V (p1 , p2 ) depende de los precios
p1 , p2 , un cambio marginal (“movimiento”) del precio del bien uno implica un cambio en la satisfacción.
Ese cambio (efecto) se mide por la derivada parcial de V (p1 , p2 ) con respecto a p1 :
∂V (p1 , p2 )
.
∂ p1
5.2 Reglas de derivación 97

Sin embargo, debido al “movimiento” que hubo en precio p1 ocurre que la demanda por el bien
uno, y por el bien dos, también se “mueve”. El efecto del movimiento de p1 sobre las demandas es
dado, respectivamente, por
∂ x1 (p1 , p2 ) ∂ x2 (p1 , p2 )
, .
∂ p1 ∂ p1
Por otro lado, el movimiento de las demandas tiene, a su vez, efecto en el valor de la función de
utilidad: el efecto sobre la utilidad por el cambio en la demanda es dado por (note que la derivada de
la utilidad se evalúa en la demanda):

∂ u(x1 (p1 , p2 ), x2 (p1 , p2 )) ∂ u(x1 (p1 , p2 ), x2 (p1 , p2 ))


, .
∂ x1 ∂ x2

En resumen, a partir del hecho que V (p1 , p2 ) = u(x1 (p1 , p2 ), x2 (p1 , p2 ), un movimiento del precio
p1 provoca cinco movimientos, dados por –en lo que sigue, denotamos p = (p1 , p2 )–:

∂V (p) ∂ u(x1 (p), x2 (p)) ∂ x1 (p) ∂ u(x1 (p), x2 (p)) ∂ x2 (p)


.
∂p ∂ x1 ∂p ∂ x2 ∂p
| {z1 } | {z } | {z1 } | {z } | {z1 }
(1) (2) (3) (4) (5)

La relación que existe entre ese cinco efectos (derivadas parciales) es dado por la regla de la
cadena:
∂V (p) ∂ u(x1 (p), x2 (p)) ∂ x1 (p) ∂ u(x1 (p), x2 (p)) ∂ x2 (p)
= · + · . (5.5)
∂ p1 ∂ x1 ∂ p1 ∂ x2 ∂ p1

De manera análoga se puede probar que

∂V (p) ∂ u(x1 (p), x2 (p)) ∂ x1 (p) ∂ u(x1 (p), x2 (p)) ∂ x2 (p)


= · + · . (5.6)
∂ p2 ∂ x1 ∂ p2 ∂ x2 ∂ p2

A través de un ejemplo concreto veamos que efectivamente se cumple la propiedad (5.5), la regla
de la cadena para la derivada de la satisfacción respecto del precio p1 . Para esto, supongamos que la
β
utilidad es u(x1 , x2 ) = x1α + x2 , donde α, β ∈ R++ , y supongamos que

x1 (p1 , p2 ) = p1 p22 , x2 (p1 , p2 ) = ln(p1 ) + e p2 .

Notamos entonces que



V (p1 , p2 ) = u(x1 (p1 , p2 ), x2 (p1 , p2 )) = p1 p22 + (ln(p1 ) + e p2 )β ,

por lo que, derivando directamente se tiene


∂V (p1 , p2 ) 1
· p2 + β (ln(p1 ) + e p2 )β −1 · .
α α−1 2
V (p1 , p2 ) = p1 p22 + (ln(p1 ) + e p2 )β ⇒ = α p1 p22
∂ p1 p1
| {z }
(1)

Por otro lado:

β ∂ u(x1 , x2 ) ∂ u(x1 , x2 ) β −1
u(x1 , x2 ) = x1α + x2 ⇒ = αx1α−1 , = β x2 ,
∂ x1 ∂ x2
98 Capítulo 5. Cálculo diferencial

por lo que
∂ u(x1 (p1 , p2 ), x2 (p1 , p2 )) ∂ u(x1 (p1 , p2 ), x2 (p1 , p2 ))
= (ln(p1 ) + e p2 )β −1 .
α−1
= α p1 p22 ,
∂ x1 ∂ x2
| {z } | {z }
(2) (4)

En complemento, es directo ver que


∂ x1 (p1 , p2 ) ∂ x2 (p1 , p2 ) 1
= p22 , = .
∂ p1 ∂ p1 p1
| {z } | {z }
(3) (5)

La propiedad indicada en (5.5) sostiene que (1) = (2) · (3) + (4) · (5). Para comprobar esto, ya
conocemos (1) de la parte roja, mientras que
1
· p22 + (ln(p1 ) + e p2 )β −1 ·
α−1
(2) · (3) + (4) · (5) = α p1 p22 .
| {z } |{z} | {z } p1
(2) (3) (4) |{z}
(5)

Como la parte roja coincide con la parte azul hemos comprobado la identidad que se indicó en
(5.5), que es la regla de la cadena aplicada a la función V (p1 , p2 ) al derivarla con respecto a p1 . ■

Ejemplo 5.12 Para la función g(x1 , x2 ) = x12 ex1 x2 se tiene que

∂ g(x1 , x2 ) ∂ g(x1 , x2 )
= 2x1 ex1 x2 + x12 x2 ex1 x2 , = x13 ex1 x2 .
∂ x1 ∂ x2
La lectura de lo anterior es que un “pequeño cambio” en el valor de x1 (cambio marginal) tiene
1 ,x2 )
efecto sobre el valor que toma la función g, el cual es dado por ∂ g(x ∂ x1 (mismo con cambio en la
variable x2 ): las derivadas parciales dan cuenta del efecto (cambio) en el valor de la función debido a
cambios marginales en las variables.
Supongamos ahora que las componentes donde se evalúa la función g dependen de otra variable,
t, digamos x1 (t) y x2 (t) tal que
x1 (t) = t 2 , x2 (t) = ln(t).
En este caso, ocurre que g(x1 (t), x2 (t)) es una función que solo depende de t, que denotamos

f (t) = g(x1 (t), x2 (t)).

Sobre la base de lo anterior, si “movemos la variable” t ocurre que la función f se “mueve”, y el


efecto sobre ella es dado por la derivada f ′ (t). Sin embargo, si “movemos” la variable t también ocurre
que la función x1 (t) se “mueve”, y el efecto es dado por x1′ (t). Además, también se mueve la segunda
componente, y el efecto es dado por x2′ (t). Más aun, el hecho que se “mueva” la primera variable
provoca un cambio en la función g, dado por (note que la función g está evaluada en x1 (t), x2 (t))
∂ g(x1 (t), x2 (t))
,
∂ x1
mientras que el efecto sobre g por el movimiento de la segunda variable es
∂ g(x1 (t), x2 (t))
.
∂ x2
5.2 Reglas de derivación 99

En resumen, sobre la base de lo anterior, “mover la variable” t implica cinco efectos:

∂ g(x1 (t), x2 (t)) ∂ g(x1 (t), x2 (t))


f ′ (t) x1′ (t) x2′ (t),
|{z} ∂ x1 |{z} ∂ x2 |{z}
(1) (3) (5)
| {z } | {z }
(2) (4)

donde (1) es el efecto total (el neto) debido al “movimiento” de t, (2) es el efecto sobre g que hubo
por un cambio en la primera variable, (3) es el efecto en la primera variable por el cambio en t, (4)
es el efecto sobre g que hubo por un cambio en la segunda variable y (5) es el efecto en la segunda
variable por el cambio en t. Los cambios (2) – (5) son cambios parciales, mientras que el efecto total
es (1). La regla de la cadena sostiene que

(1) = (2) · (3) + (4) · (5),

es decir
∂ g(x1 (t), x2 (t)) ′ ∂ g(x1 (t), x2 (t)) ′
f ′ (t) = · x1 (t) + · x2 (t).
∂ x1 ∂ x2
Verifiquemos que se cumple lo anterior. Primero, tenemos que
2 ln(t)
g(x1 , x2 ) = x12 ex1 x2 , x1 (t) = t 2 , x2 (t) = ln(t) ⇒ f (t) = g(x1 (t), x2 (t)) = t 4 et ,

por lo que
 
3 t 2 ln(t) 21 2

 2
f (t) = 4t e 4
+ t t + 2t ln(t) et ln(t) = 4t 3 + t 5 + 2t 5 ln(t) et ln(t) .
t

Segundo, se tiene que:


∂ g(x1 , x2 ) x1 =t 2 , x2 =ln(t)∂ g(x1 (t), x2 (t)) 2 2
= 2x1 ex1 x2 + x12 x2 ex1 x2 =⇒ = 2t 2 et ln(t) + t 4 ln(t)et ln(t)
∂ x1 ∂ x1
∂ g(x1 , x2 ) x1 =t 2 , x2 =ln(t) ∂ g(x1 (t), x2 (t)) 2
= x13 ex1 x2 =⇒ = t 6 et ln(t)
∂ x2 ∂ x2
Luego,
∂ g(x1 (t), x2 (t)) ′ ∂ g(x1 (t), x2 (t)) ′  2 2
  2
1
· x1 (t) + · x2 (t) = 2t 2 et ln(t) + t 4 ln(t)et ln(t) 2t + t 6 et ln(t)
∂ x1 x2 t
   
3 t 2 ln(t) 5 t 2 ln(t) 5 t 2 ln(t)
= 4t e + 2t ln(t)e + t e

Es directo ver que la parte azul es igual a la parte roja, lo que comprueba la regla de la cadena. ■

Ejemplo 5.13 Suponga que F(K, L) = K α Lβ (dos variables) y suponga además que

K(p) = 1 + p2 , L(p) = ln(1 + p).

Con lo anterior, definamos


f (p) = F(K(p), L(p)).
Determinemos directamente la derivada de f (p) y comprobemos que se cumple la regla de la
cadena. Así, para lo primero se tiene que

f (p) = (K(p))α (L(p))β = (1 + p2 )α (ln(1 + p))β ⇒


100 Capítulo 5. Cálculo diferencial
1
f ′ (p) = α 2p(1 + p2 )α−1 (ln(1 + p))β + (1 + p2 )α β (ln(1 + p))β −1 .
1+ p
Por otro lado, usando la regla de la cadena tenemos que
∂ F(K(p), L(p)) ∂ F(K(p), L(p)) ∂ K(p) ∂ F(K(p), L(p)) ∂ L(p)
= · + · .
∂p ∂K ∂p ∂L ∂p

Ahora bien, como F(K, L) = K α Lβ se tiene que


∂ F(K, L) ∂ F(K, L)
= αK α−1 Lβ , = β K α Lβ −1 ,
∂K ∂L
por lo que evaluado en K(p) y L(p) se obtiene (primero se deriva y luego se evalúa):

∂ F(K(p), L(p)) ∂ F(K(p), L(p))


= α(1 + p2 )α−1 (ln(1 + p))β , = β (1 + p2 )α (ln(1 + p))β −1 .
∂K ∂L
Note ahora que (se mantiene la notación de “derivada parcial”, a pesar de que K y L dependen solo
de una variable; la derivada en ese caso es la ”usual”):
∂ K(p) ∂ L(p) 1
= 2p, = .
∂p ∂p 1+ p
Con todo lo anterior, tenemos que:
∂ F(K(p), L(p)) ∂ K(p) ∂ F(K(p), L(p)) ∂ L(p)
· + · =
∂K ∂p ∂L ∂p
     1 
2 α−1 β 2 α β −1
α(1 + p ) (ln(1 + p)) · (2p) + β (1 + p ) (ln(1 + p)) · .
1+ p
Es directo ver que la cantidad roja coincide con la cantidad azul, por lo que se verifica la regla de
la cadena. ■

Ejemplo 5.14 Suponga que



f (x, y) = xy + ln(1 + x2 + y2 ).
Primero, de manera directa se tiene que
√ √
∂ f (x, y) y 2x ∂ f (x, y) x 2y
= √ + , = √ + .
∂x 2 x 1 + x2 + y2 ∂y 2 y 1 + x2 + y2

Segundo, suponga ahora que “y” depende de “x”, digamos

y(x) = x2 − e2x .

En tal caso, definamos


g(x) = f (x, y(x))
y nos preguntamos por la derivada de g(x). A este respecto un movimiento de “x” obviamente afecta a
la primera componente (es ella misma) y afecta a la segunda componente, y(x). El movimiento de “x”
afecta la primera componente de la siguiente manera:
∂x
x=x ⇒ = 1,
∂x
5.2 Reglas de derivación 101

y afecta a la segunda componente de la siguiente manera

∂ y(x)
y(x) = x2 − e2x ⇒ = 2x − 2e2x .
∂x
A su vez, el “movimiento” de la primera componente afecta a la función f de la siguiente manera:
√ √
∂ f (x, y) y 2x x=x, y=x2 −e2x ∂ f (x, y(x)) x2 − e2x 2x
= √ + =⇒ = √ +
∂x 2 x 1 + x 2 + y2 ∂x 2 x 1 + x2 + (x2 − e2x )2

mientras que el “movimiento” de la segunda componente afecta a la función f de la siguiente manera:


√ √
∂ f (x, y) x 2y x=x, y=x2 −e2x ∂ f (x, y(x)) x 2 (x2 − e2x )
= √ + =⇒ = √ + .
∂y 2 y 1 + x2 + y2 ∂y 2 x2 − e2x 1 + x2 + (x2 − e2x )2
f (x,y(x)) f (x,y(x))
Usando todo lo anterior, del hecho que g′ (x) = ∂x + ∂y · ∂ ∂y(x)
x , se concluye
√ !  √
x2 − e2x 2 (x2 − e2x )

′ 2x x
· 2x − 2e2x .

g (x) = √ + 2 2 2x 2
+ √ + 2 2 2x 2
2 x 1 + x + (x − e ) 2 x2 − e2x 1 + x + (x − e )

Se insiste que, en lo anterior, hemos usado el hecho que la dependencia de la primera componente
es la función identidad, de modo que su derivada es 1. Por otro lado, a pesar de que y(x) depende
solo de una variable, se mantiene la notación ∂ ∂y(x)
x cuando, en estricto rigor, se trata de una derivada
estándar. ■

Ejemplo 5.15 Suponga que F(K, L) = K α Lβ (dos variables) y suponga además que
p
K(p, R) = pR + R2 , L(p, R) = pR + eR .

A diferencia del ejemplo anterior, en este caso ocurre que las variables K y L dependen de otras dos
variables, p, R. Con todo esto, definamos

g(p, R) = F(K(p, R), L(p, R)).

A este respecto, si bien es cierto que la función F depende de K y de L, el resultado final de la


composición de F con las funciones que definen sus componentes, es decir, la función g, solo depende
de p y de R: esas son las variables con respecto a las cuales nos interesa derivar. Lo relevante es
que al derivar con respecto a “p”, uno debe tener en cuenta que un “movimiento” de esa variable afecta
a la componentes K y L, pues ambas dependen de “p” y que, a su vez, como K y L se “mueven” ya que
se mueve p, implica que F se debe “mover”.
El efecto neto del movimiento de “p” es sobre la función g es ∂ g(p,R)
∂ p . A su vez, dicho efecto neto
se descompone en una serie de efectos (movimientos) parciales. La regla de la cadena establece una
relación entre el efecto neto y los efectos parciales. Para el caso, derivando con respecto a “p” se tiene
que
∂ g(p, R) ∂ F(K(p, R), L(p, R)) ∂ K(p, R) ∂ F(K(p, R), L(p, R)) ∂ L(p, R)
= · + · .
∂p ∂K ∂p ∂L ∂p
∂ F(K(p,R),L(p,R))
Se insiste que ∂K es la derivada de F(K, L) evaluada en K(p, R) y L(p, R). Así

∂ F(K, L) K=pR+R2 , L= pR+eR ∂ F(K(p, R), L(p, R)) p
= αK α−1 Lβ =⇒ = α(pR + R2 )α−1 ( pR + eR )β ,
∂K ∂K
102 Capítulo 5. Cálculo diferencial

∂ F(K, L) K=pR+R2 , L= pR+eR ∂ F(K(p, R), L(p, R))
= β K α Lβ −1 = β (pR + R2 )α ( pR + eR )β −1 .
p
=⇒
∂L ∂L
Por otro lado, los efectos parciales de p sobre K(p, R) y L(p, R) son dados por
∂ K(p, R) ∂ K(p, R)
K(p, R) = pR + R2 ⇒ = R, = p + 2R,
∂p ∂R
√ √
p ∂ L(p, R) R ∂ L(p, R) p
L(p, R) = pR + eR ⇒ = √ , = √ + eR .
∂p 2 p ∂R 2 R
Por lo tanto,
√ !
∂ g(p, R)     R
α(pR + R2 )α−1 ( pR + eR )β · (R) + β (pR + R2 )α ( pR + eR )β −1 ·
p p
= √
∂p 2 p
∂ g(p, R)      √p 
R β −1
2 α−1
p R β 2 α
p R
= α(pR + R ) ( pR + e ) · (p + 2R) + β (pR + R ) ( pR + e ) · √ +e .
∂R 2 R

Ejemplo 5.16 Suponga que H(r, w) = f (x1 (r, w), x2 (w)), es decir, f es una función de dos variables
(x1 y x2 ), pero donde x1 depende de r y de w y x2 depende solo de w. La función H depende entonces
de r y de w. Dado esto, obtengamos la expresión de
∂ H(r, w) ∂ H(r, w)
, .
∂r ∂w
Por regla de la cadena se tiene que
∂ H(r, w) ∂ f (x1 (r, w), x2 (w)) ∂ x1 (r, w) ∂ f (x1 (r, w), x2 (w)) ∂ x2 (w)
= · + · ,
∂r ∂ x1 ∂r ∂ x2 | ∂{zr }
0

por lo que
∂ H(r, w) ∂ f (x1 (r, w), x2 (w)) ∂ x1 (r, w)
= · .
∂r ∂ x1 ∂r
Por otro lado,
∂ H(r, w) ∂ f (x1 (r, w), x2 (w)) ∂ x1 (r, w) ∂ f (x1 (r, w), x2 (w)) ∂ x2 (w)
= · + · .
∂w ∂ x1 ∂w ∂ x2 ∂w

Ejemplo 5.17 Dado α > 0, suponga que g(x1 , x2 ) = x1α x2 + ln(x2 ). Usando esto, definamos

f (x, y) = g(x2 + xy, xey ).

Se pide encontrar las derivadas parciales de f (x, y) con respecto a “x” y con respecto a “y”. Para
esto, notamos que la función g depende de dos variables, x1 y x2 , las que a su vez dependen de otras
dos variables, x e y. De de esta manera, se tiene que f (x, y) = g(x1 (x, y), x2 (x, y)), donde

x1 (x, y) = x2 + xy, x2 (x, y) = xey .

Por lo tanto:
∂ f (x, y) ∂ g(x1 (x, y), x2 (x, y)) ∂ x1 (x, y) ∂ g(x1 (x, y), x2 (x, y)) ∂ x2 (x, y)
= · + · .
∂x ∂ x1 ∂x ∂ x2 ∂x
5.2 Reglas de derivación 103

Ya que
∂ g(x1 , x2 ) ∂ g(x1 , x2 ) 1
g(x1 , x2 ) = x1α x2 + ln(x2 ) ⇒ = αx1α−1 x2 , = x1α + ,
∂ x1 ∂ x2 x2
se obtiene que
∂ g(x1 (x, y), x2 (x, y)) ∂ g(x1 (x, y), x2 (x, y)) 1
= α(x2 + xy)α−1 (xey ) , = (x2 + xy)α + y .
∂ x1 ∂ x2 xe
Por otro lado, ya que
∂ x1 (x, y) ∂ x2 (x, y)
= 2x + y, = ey
∂x ∂x
por regla de la cadena se concluye que
 
∂ f (x, y) 1
= α(x2 + xy)α−1 (xey ) · (2x + y) + (x2 + xy)α + y · (ey ).

∂x xe
De manera análoga, es fácil ver que
 
∂ f (x, y) 2 2 1
(xe ) · (x) + (x + xy) + y · (xey ).
y
α−1
 α
= α(x + xy)
∂y xe

Ejemplo 5.18 Si f (x, y) = x2 + exy , dada g(x) = f (x, x2 ) se tiene que:


∂ f (x, y) x=x, y=x2 ∂ f (x, x2 ) 3
= 2x + yexy =⇒ = 2x + x2 ex
∂x ∂x
y además

∂ f (x, y) x=x, y=x2 ∂ f (x, x2 ) 3


= xexy =⇒ = xex .
∂y ∂y
Por otro lado,
∂ (x) ∂ (x2 )
= 1, = 2x,
∂x ∂x
por lo que
∂ f (x, x2 ) ∂ f (x, x2 )  3
  3 3
g′ (x) = ·1+ · (2x) = 2x + x2 ex + xex · (2x) = 2x + 3x2 ex .
∂x ∂y

Ejercicio 5.18 Dadas constantes α, β , suponga que f (x, y) = x2 + αy2 + β xy.


(a) Obtenga las derivadas parciales

∂ f (x, y) ∂ f (x, y)
, .
∂x ∂y

Suponga ahora que x(p, r) = p2 e pr y que y(p, r) = pr. Con eso, defina

H(p, r) = f (x(p, r), y(p, r)).

(b) Encuentre la expresión de


∂ H(p, r) ∂ H(p, r)
, .
∂p ∂r
104 Capítulo 5. Cálculo diferencial

(c) Encuentre el valor de


∂ H(1, 1) ∂ H(1, 1)
, .
∂p ∂r
Finalmente, supongamos que y(x) = x2 + ln(x) y definamos G(x) = f (x, y(x)).
(d) Usando la regla de la cadena muestre que

∂ f (x, y(x)) ∂ f (x, y(x)) ′


G′ (x) = + · y (x),
∂x ∂y
a partir de lo cual concluya que
 
′ 2
 2
 1
G (x) = 2x + β (x + ln(x)) + 2α(x + ln(x)) + β x · 2x + .
x

Ejercicio 5.19 Dada g(p, q) = f (p2 − ln(q), pe pq ), obtenga

∂ g(1, 1) ∂ g(1, 1)
,
∂p ∂q
cuando
x ex
f (x, y) = x2 y, f (x, y) = , f (x, y) = ..
1 + y2 1 + e2y

Ejercicio 5.20 Suponga que f (x, y) = x2 + xy + 2y2 y que g(x1 , x2 ) = x1 x2 + x12 .


(a) Obtenga las derivadas parciales de f y g con respecto a sus variables. Con eso, determine

∂ f (1, 1) ∂ g(1, 1)
.
∂x ∂ x1
Suponga ahora que h(x, y) = g( f (x, y), y).
(b) Encuentre la expresión de h(x, y) en términos de x e y. Con eso, obtenga directamente la
expresión de
∂ h(x, y)
.
∂y
(c) Usando la regla de la cadena, explique por qué se cumple

∂ h(x, y) ∂ g( f (x, y), y) ∂ f (x, y) ∂ g( f (x, y), y)


= · + .
∂y ∂ x1 ∂y ∂ x2
(d) Con el resultado de la parte (b), compruebe que se cumple la igualdad que obtuvo en (c).

p
Ejercicio 5.21 Definamos f (x, y) = x 2 + y2 .
(a) Encuentre
∂ f (x, y) ∂ f (x, y)
, .
∂x ∂y
5.2 Reglas de derivación 105

Suponga ahora que x(t) = 1 + t 2 y que y(t) = ln(2 + t 2 ). Con esto defina g(t) = f (x(t), y(t)).
(b) Usando la regla de la cadena, encuentre

g′ (t), g′ (0).

Suponga ahora que y(x) = x2 + ln(x) y defina h(x) = f (x, y(x)).


(c) Usando la regla de la cadena, encuentre h′ (1).

Ejercicio 5.22 Dada H(x, y) = f (x2 + ex y, ln(1 + x)ey ), usando la regla de la cadena encontrar

∂ H(1, 1) ∂ H(1, 1)
,
∂x ∂y

cuando (en lo que sigue α, β > 0 son constantes dadas)


√ x1
f (x1 , x2 ) = x12 + x1 x2 + x22 ,
β
f (x1 , x2 ) = x1 x2 , f (x1 , x2 ) = x1α x2 , f (x1 , x2 ) = .
x2

Ejercicio 5.23 Suponiendo que h(p1 , p2 ) = f (x1 (p1 , p2 ), x2 (p1 , p2 )), usando la regla de la cadena
obtenga el valor de
∂ h(p1 , p2 )
∂ p1
cuando
(a)
x1 √ p
f (x1 , x2 ) = , x1 (p1 , p2 ) = p1 p2 , x2 (p1 , p2 ) = e p1 1 + p2 ,
x2
(b)
2
f (x1 , x2 ) = 2x1 + 3x2 , x1 (p1 , p2 ) = ln(p1 ), x2 (p1 , p2 ) = e p2 ,
(c)
2 2
f (x1 , x2 ) = ln(x1 + x22 ), x1 (p1 , p2 ) = ln(p1 + p2 ), x2 (p1 , p2 ) = e p1 p2 .

2
Ejercicio 5.24 Suponga que f (x, y) = x2 y + exy . Dadas constantes a1 , a2 , b1 , b2 , definamos

g(x) = f (a1 x + b1 , a2 x + b2 ).

Explique por qué se cumple lo siguiente:

∂ f (a1 x + b1 , a2 x + b2 ) ∂ f (a1 x + b1 , a2 x + b2 )
g′ (x) = a1 · + a2 · .
∂x ∂y

Ejercicio 5.25 En función de los precios p1 , p2 y del ingreso R > 0, la demanda por los bienes de
106 Capítulo 5. Cálculo diferencial

consumo 1 y 2 es x1 (p1 , p2 , R) ∈ R+ y x2 (p1 , p2 , R) ∈ R+ . Dada u : R2+ → R una función de utilidad,


de modo que u(x1 , x2 ) es la satisfacción de consumir x1 del bien uno y x2 del bien dos. Con todo esto,
la función de utilidad indirecta es dada por

v(p1 , p2 , R) = u(x1 (p1 , p2 , R), x2 (p1 , p2 , R)) ∈ R.

En lo que sigue, denotamos p = (p1 , p2 ).


(a) Explique por qué se cumple lo siguiente:

∂ v(p, R) ∂ u(x1 (p, R), x2 (p, R)) ∂ x1 (p, R) ∂ u(x1 (p, R), x2 (p, R)) ∂ x2 (p, R)
= · + · .
∂ p1 ∂ x1 ∂ p1 ∂ x2 ∂ p1
Suponga ahora que
γ1 R γ2 R
x1 (p1 , p2 , R) = , x2 (p1 , p2 , R) = ,
p1 p2
donde γ1 , γ2 son parámetros conocidos.
(b) Explique por qué se cumple
∂ v(p, R) ∂ u(x1 (p, R), x2 (p, R)) γ1 R
= − · 2
∂ p1 ∂ x1 p1
∂ v(p, R) ∂ u(x1 (p, R), x2 (p, R)) γ2 R
= − · 2 .
∂ p2 ∂ x2 p2
(c) Usando la regla de la cadena, para las funciones de demanda indicadas muestre que

∂ v(p, R) ∂ u(x1 (p, R), x2 (p, R)) γ1 ∂ u(x1 (p, R), x2 (p, R)) γ2
= · + · .
∂R ∂ x1 p1 ∂ x1 p2

Ejercicio 5.26 Dada f : R2 → R, definamos H : R3 → R tal que

H(t, x, y) = f (tx,ty).

(a) Explique por qué se cumple lo siguiente:

∂ H(t, x, y) ∂ f (tx,ty) ∂ f (tx,ty)


= ·x+ · y.
∂t ∂x ∂y
Suponga ahora que la función f cumple lo siguiente: existe una constante r ∈ R tal que para todo
t ∈ R se cumple que
f (tx,ty) = t r f (x, y).
La funciones que cumplen esa condición se llaman funciones homogéneas de grado r. Por
ejemplo, la función Cobb-Douglas f (x, y) = xα yβ es homogénea de grado r = α + β , pues

f (tx,ty) = (tx)α (ty)β = t α+β xα yβ = t α+β f (x, y).


5.3 Derivadas parciales de segundo orden 107

(b) Explique por qué si f (x, y) es una función homogénea de grado r se cumple que

∂ H(t, x, y)
= r t r−1 f (x, y).
∂t
(c) Usando las partes (b) y (c) concluya que si f (x, y) es una función homogénea de grado r se
tiene que
∂ f (tx,ty) ∂ f (tx,ty)
rt r−1 f (x, y) = ·x+ · y.
∂x ∂y
(d) Finalmente, haciendo t = 1 en lo anterior concluya que si f (x, y) es una función homogénea
de grado r entonces
∂ f (x, y) ∂ f (x, y)
r f (x, y) = ·x+ · y.
∂x ∂y
Esta última relación es conocida como la identidad de Euler para funciones homogéneas.

Ejercicio 5.27 Dadas f : R2 → R y g : R → R, definamos

h(x, y) = g( f (x, y)).

Usando la regla de la cadena, explique por qué

∂ h(x, y) ∂ f (x, y) ∂ h(x, y) ∂ f (x, y)


= g′ ( f (x, y)) · ∧ = g′ ( f (x, y)) · ,
∂x ∂x ∂y ∂y
y concluya que:
∂ h(x,y) ∂ f (x,y)
∂x ∂x
∂ h(x,y)
= ∂ f (x,y)
.
∂y ∂y

5.3 Derivadas parciales de segundo orden


5.3.1 Idea y concepto
Dados α, β ∈ R++ , para la función f : R2+ → R tal que f (x, y) = xα yβ sabemos que
∂ f (x, y) ∂ f (x, y)
= αxα−1 yβ , = β xα yβ −1 .
∂x ∂y
Vistas esas derivadas parciales como nuevas funciones de x e y, podemos volver a derivarlas con
respecto a las variables. Así por ejemplo, si definimos

f1 (x, y) = αxα−1 yβ , f2 (x, y) = β xα yβ −1 ,

se tiene que
∂ f1 (x, y) ∂ f1 (x, y)
= α(α − 1)xα−2 yβ , = αβ xα−1 yβ −1 ,
∂x ∂y
mientras que
∂ f2 (x, y) ∂ f2 (x, y)
= β αxα−1 yβ −1 , = β (β − 1) xα yβ −2 .
∂x ∂y
108 Capítulo 5. Cálculo diferencial

En vez de introducir las funciones f1 (x, y) y f2 (x, y), uno pudo haber escrito directamente
   
∂ f (x,y) ∂ f (x,y)
∂ ∂x ∂ ∂x
= α(α − 1)xα−2 yβ , = αβ xα−1 yβ −1 ,
∂x ∂y
y    
∂ f (x,y) ∂ f (x,y)
∂ ∂y ∂ ∂y
= β αxα−1 yβ −1 , = β (β − 1) xα yβ −2 .
∂x ∂y
Esas últimas expresiones son derivadas parciales de segundo orden de la función f (x, y) = xα yβ .
Para encontrarlas, primero se obtienen las derivadas parciales correspondientes (de primer orden) y
luego, cada una de ellas se vuelve a derivar con respecto a las variables de la función. Note que si la
función es de 2 variables, entonces se obtienen dos derivadas parciales de primer orden. Si cada una de
esas derivadas de primer orden se vuelve a derivar con respecto a cada variable, se obtienen entonces 4
derivadas de segundo orden. En general, para una función f : Rk → R uno obtiene k derivadas parciales
de primer orden y k2 derivadas parciales de segundo orden.
Definición 5.3 Dada f : Rk → R, la derivada parcial de segundo orden respecto de las variables
xi y x j (es decir, variables “i” y “ j”), en esa secuencia, es dada por
 
∂ f (x1 ,x2 ,...,xk )
2
∂ f (x1 , x2 , . . . , xk ) ∂ ∂xj
= .
∂ xi ∂ x j ∂ xi
∂ 2 f (x1 ,x2 ,...,xk )
Ejemplo 5.19 Por ejemplo, para calcular ,
primero se debe encontrar la derivada parcial
∂ x3 ∂ x5
de f con respecto a x5 (variable más a la derecha) y luego, el resultado se deriva con respecto a x3 . ■

N Cuando se deriva dos veces respecto a la misma variable es usual denotar de la siguiente manera:
para f : Rk → R, dado x = (x1 , x2 , . . . , xk )t ∈ Rk ,

∂ 2 f (x) ∂ 2 f (x)
= .
∂ xi2 ∂ xi ∂ xi

Para esas derivadas parciales de segundo orden preferiremos la notación de la derecha, que nunca
lleva a confusión.
Ejemplo 5.20 Para f (x, y) = xα yβ las variables son x e y. A este respecto, como
   
∂ f (x,y) ∂ f (x,y)
∂ ∂x ∂ ∂x
= α(α − 1)xα−2 yβ , = αβ xα−1 yβ −1 ,
∂x ∂y

uno denota:
∂ 2 f (x, y) ∂ 2 f (x, y)
= α(α − 1)xα−2 yβ , = αβ xα−1 yβ −1 .
∂ x∂ x ∂ y∂ x

∂ f (x,y) 1 ∂ f (x,y) 2y
Ejemplo 5.21 Para f (x, y) = x2 y + ln(x + y2 ), como ∂x = 2xy + x+y 2, ∂y = x2 + x+y 2,
tenemos que    
∂ f (x,y) 1
∂ 2 f (x, y) ∂ ∂x ∂ 2xy + x+y 2 1
= = = 2y − ,
∂ x∂ x ∂x ∂x (x + y2 )2
5.3 Derivadas parciales de segundo orden 109

y además    
∂ f (x,y) 1
∂ 2 f (x, y) ∂ ∂x ∂ 2xy + x+y 2 2y
= = = 2x − .
∂ y∂ x ∂y ∂y (x + y2 )2
Por otro lado,    
∂ f (x,y) 2y
∂ 2 f (x, y) ∂ ∂y ∂ x2 + x+y 2 2y
= = = 2x − ,
∂ x∂ y ∂x ∂x (x + y2 )2
y además
   
∂ f (x,y) 2y
∂ 2 f (x, y) ∂ ∂y ∂ x2 + x+y 2 2 (x + y2 ) − (2y) (2y) 2x − 2y2
= = = 0+ = .
∂ y∂ y ∂y ∂y (x + y2 )2 (x + y2 )2

Importante 5.4 En el ejemplo anterior destaca un hecho notable:

∂ 2 f (x, y) ∂ 2 f (x, y)
= ,
∂ x∂ y ∂ y∂ x
es decir, las derivadas cruzadas son iguales. Esa es una propiedad que se cumplirá para todas las
funciones con que uno usualmente trabaja. Siendo rigurosos, el resultado general se llama Teorema
de Clairaut - Schwarz, y establece que si las derivadas parciales cruzadas existen y son continuas
en su dominio, entonces coinciden. En todo lo que sigue de este curso, uno asumirá esas condiciones,
de modo que, en general, será cierto que para f : Rk → R y para todo i, j ∈ {1, . . . , k} se cumple que

∂ 2 f (x1 , x2 , . . . , xk ) ∂ 2 f (x1 , x2 , . . . , xk )
= .
∂ xi ∂ x j ∂ x j ∂ xi

∂ g(x,y) ∂ g(x,y)
Ejemplo 5.22 Si g(x, y) = 3x + 2y se tiene que ∂x =3y ∂y = 2, por lo que
∂ 2 g(x, y) ∂ 2 g(x, y) ∂ 2 g(x, y) ∂ 2 g(x, y)
= = = = 0.
∂ x∂ x ∂ y∂ y ∂ y∂ x ∂ x∂ y

Ejemplo 5.23 Dadas constantes α, β , γ, si f (x1 , x2 ) = αx12 + β x22 + γx1 x2 , uno tiene que
∂ f (x1 , x2 ) ∂ f (x1 , x2 )
= 2αx1 + γx2 , = 2β x2 + γx1 ,
∂ x1 ∂ x2
por lo que (ahora calculamos solo una derivada cruzada, pues la otra debe coincidir)
∂ 2 f (x1 , x2 ) ∂ 2 f (x1 , x2 ) ∂ 2 f (x1 , x2 ) ∂ 2 f (x1 , x2 )
= 2α, = = γ, = 2β.
∂ x1 ∂ x1 ∂ x1 ∂ x2 ∂ x2 ∂ x1 ∂ x2 ∂ x2

Ejemplo 5.24 Si f (x, y) = exy , se tiene que


∂ f (x, y) ∂ f (x, y)
= yexy , = xexy ,
∂x ∂y
por lo que
∂ 2 f (x, y) ∂ 2 f (x, y) ∂ 2 f (x, y) ∂ 2 f (x, y)
= y2 exy , = = exy + xyexy , = x2 exy .
∂ x∂ x ∂ y∂ x ∂ x∂ y ∂ y∂ y

110 Capítulo 5. Cálculo diferencial

5.3.2 Matriz de Hesse de una función


Usando el ejemplo anterior, desplegando las cuatro segundas derivadas parciales que se obtuvieron
para f (x, y) = exy en una matriz de 2 × 2 se obtiene la matriz de Hesse la función f evaluada en
(x, y)t ∈ R2 , la que se denota como:

y2 exy exy + xyexy


 

H f (x, y) =   ∈ R2×2 .
xy
e + xye xy 2
x e xy

En general, para una función de k variables en R, digamos, f (x1 , x2 , . . . , xk ), uno puede calcular las
segundas derivadas parciales respecto de xi y de x j , variando i y variando j, de modo de obtener k2
resultados. Desplegando esos resultados en una matriz de k × k se obtiene la matriz de Hesse de esa
función.
Definición 5.4 Para f : Rk → R, la matriz de Hesse de f evaluada en x = (x1 , x2 , . . . , xk )t ∈ Rk se
define como
∂ 2 f (x) ∂ 2 f (x) ∂ 2 f (x)
 
∂ x1 ∂ x1 ∂ x1 ∂ x2 ··· ∂ x1 ∂ xk
 
 
∂ 2 f (x) ∂ 2 f (x) ∂ 2 f (x)
 
H f (x) = 

∂ x2 ∂ x1 ∂ x2 ∂ x2 ··· ∂ x2 ∂ xk  ∈ Rk×k .

 .. .. .. 

 . . ··· . 

∂ 2 f (x) ∂ 2 f (x) ∂ 2 f (x)
∂ xk ∂ x1 ∂ xk ∂ x2 ··· ∂ xk ∂ xk

Importante 5.5 El hecho que, en general y para nuestros propósitos, las derivadas cruzadas coinciden
implica matriz de Hesse es simétrica.

Importante 5.6 Note lo siguiente: para una función f : R → R, la primera y segunda derivada
de f evaluada en cualquier punto es un número real: para todo x ∈ R se tiene que f ′ (x) ∈ R y
f ′′ (x) ∈ R. Más aún, la derivada de orden n ∈ N de f evaluada en x ∈ R sigue siendo un número real:
f (n) (x) ∈ R.
Sin embargo, para el caso de una función g : Rk → R, evaluada en x = (x1 , x2 , . . . , xk )t ∈ Rk
ocurre que la primera derivada de “g” es el gradiente y la segunda derivada de “g” es la matriz de
Hesse, por lo que la primera derivada de una función de varias variables (valores reales) es un vector
y la segunda derivada es una matriz:

∇g(x) ∈ Rk , Hg (x) ∈ Rk×k .

Siguiendo con esa lógica, la tercera derivada de g : Rk → R sería un cubo, la cuarta derivada un
“hipercubo”, etc. Entre otros, ya que esos objetos son “difíciles de representar”, lo usual es que con
funciones de varias variables uno trabaje, básicamente, con primeras y segundas derivadas.

Ejemplo 5.25 Sobre la base de los ejemplos anteriores, tenemos que


(a) Si f (x, y) = xα yβ , entonces

αβ xα−1 yβ −1
 
α (α − 1)xα−2 yβ
H f (x, y) =   ∈ R2×2 .
αβ xα−1 yβ −1 β (β − 1) xα yβ −2
5.3 Derivadas parciales de segundo orden 111

(b) Si f (x1 , x2 ) = αx12 + β x22 + γx1 x2 , entonces


 
2α γ
H f (x1 , x2 ) =   ∈ R2×2 .
γ 2β

 
a b
Ejemplo 5.26 Dada A = ∈ R2×2 , la forma cuadrática asociada a la matriz A es la función
b c
qA : R2 → R tal que qA (x1 , x2 ) = a x12 + 2b x1 x2 + c x22 . Por lo tanto:

∂ qA (x1 , x2 ) ∂ qA (x1 , x2 )
= 2ax1 + 2bx2 , = 2cx2 + 2bx1 ,
∂ x1 ∂ x2
por lo que

∂ qA (x1 , x2 ) ∂ qA (x1 , x2 ) ∂ qA (x1 , x2 ) ∂ qA (x1 , x2 )


= 2a, = = 2b, = 2c.
∂ x1 ∂ x1 ∂ x2 ∂ x1 ∂ x1 ∂ x2 ∂ x2 ∂ x2
Usando lo anterior, se tiene que
 
2a 2b
HqA (x1 , x2 ) = = 2 A.
2b 2c

De esta manera, la matriz de Hesse de una forma cuadrática es dos veces la matriz de la forma cuadrática,
que no depende del punto donde se evalúe. A este respecto, note la analogía con la función cuadrática
f : R → R tal que f (x) = ax2 , para la cual f ′′ (x) = 2a. ■
 
2 3
Ejemplo 5.27 Extendamos el ejemplo anterior. Si A = y b = (7, 4)t ∈ R2 , denotando x =
3 5
(x, y)t ∈ R2 definimos

f (x) = xt Ax + b · x = 2x2 + 6xy + 5y2 + 7x + 4y.

Para este caso, se tiene que

∂ f (x, y) ∂ f (x, y)
= 4x + 6y + 7, = 10y + 6x + 4,
∂x ∂y
por lo que
∂ 2 f (x, y) ∂ 2 f (x, y) ∂ 2 f (x, y)
= 4, = 6, = 10.
∂ x∂ x ∂ x∂ y ∂ y∂ y
De esta manera,  
4 6
H f (x, y) = = 2 A.
6 10
Más general, dadas A ∈ Rk×k y b ∈ Rk , para x = (x1 , x2 , . . . , xk )t ∈ Rk se tiene que

f (x) = xt Ax + b · x ⇒ H f (x) = 2 A.


112 Capítulo 5. Cálculo diferencial

Ejemplo 5.28 Dada f : R2++ → R tal que f (x, y) = x1/2 y1/3 , obtengamos H f (1, 1). Ya que

∂ f (x, y) 1 −1/2 1/3 ∂ f (x, y) 1 1/2 −2/3


= x y , = x y ,
∂x 2 ∂y 3
se obtiene
∂ 2 f (x, y) 1 ∂ 2 f (x, y) ∂ 2 f (x, y) 1 −1/2 −2/3 ∂ 2 f (x, y) 2
= − x−3/2 y1/3 , = = x y , = − x1/2 y−5/3 ,
∂ x∂ x 4 ∂ x∂ y ∂ y∂ x 6 ∂ y∂ y 9
implicando que
− 14 x−3/2 y1/3 1 −1/2 −2/3
 
6x y
H f (x, y) =  .
1 −1/2 −2/3
6x y − 29 x1/2 y−5/3
− 14 1
 
6
Por lo tanto, evaluando en x = 1 e y = 1 se obtiene H f (1, 1) =  . ■
1
6 − 29

Ejemplo 5.29 Encuentre H f (1, 1) cuando f (x, y) = xy + x2 y. Para responder debemos obtener la
expresión general de H f (x, y) y luego evaluar en x = 1 e y = 1. Se tiene entonces que
√ √
∂ f (x, y) y ∂ f (x, y) x
= √ + 2xy ∧ = √ + x2 ,
∂x 2 x ∂y 2 y

por lo que
√ √
∂ 2 f (x, y) y ∂ 2 f (x, y) ∂ 2 f (x, y) 1 ∂ 2 f (x, y) x
= − 3/2 + 2y, = = √ + 2x, = − 3/2 .
∂ x∂ x 4x ∂ x∂ y ∂ y∂ x 4 xy ∂ y∂ y 4y
Por lo tanto √
 y 1

− 4x3/2 + 2y √
4 xy + 2x
H f (x, y) =  ,
 

1 x

4 xy + 2x − 4y3/2
de modo que evaluando lo anterior en x = 1 e y = 1 se tiene que
 1
− 4 + 2 14 + 2
  
7 9
H f (1, 1) =  = 1  .
1 1 4
4 +2 −4 9 −1

Ejercicio 5.28 Dadas constantes a1 , a2 , a3 , a4 y a5 ∈ R, definamos

f (x, y) = a1 x2 + a2 xy + a3 y2 + a4 x + a5 y.

Explique por qué  a2 


a1 2
H f (x, y) = 2  .
a2
2 a3

5.4 Complementos 113

Ejercicio 5.29 Dadas constantes α, β , encuentre H f (1, 1) cuando f (x, y) = α ln(x) + β ln(y). ■

Ejercicio 5.30 Encuentre H f (1, 2) cuando

√ x
f (x, y) = xy, f (x, y) = ln(1 + x + y2 ), f (x, y) = , f (x, y) = xey .
y

√ x
Ejercicio 5.31 Encuentre H f (0, 1) cuando f (x, y) = ye . ■

Ejercicio 5.32 Dado α ∈]0, 1[, se pide H f (2, 1) cuando f (x, y) = xα y1−α . ■

Ejercicio 5.33 Encuentre H f (1, 0) cuando


p ex
f (x, y) = x2 + y2 , f (x, y) = .
1 + ey

5.4 Complementos
5.4.1 Derivadas implícitas
Para la función
f (x, y) = x2 y − ln(x + y + 1),
la curva de nivel h de f corresponde a los puntos (x, y) tal que

x2 y − ln(x + y + 1) = h.

En este caso, claramente es “muy complejo” (si es que se pudiese!) obtener “y” en función de “x”.
Lo cierto es que de la relación anterior sabemos que “y” debe depender de “x”. Por lo tanto, teniendo
en cuenta ese hecho, lo anterior se puede escribir como

x2 y(x) − ln(x + y(x) + 1) = h.

Se insiste que en lo anterior no (necesariamente) podemos hacer explícita la forma funcional de


y(x): eso sería posible si despejamos y en términos de x. Ya que esto no es posible, uno dice que la
función y(x) está implícitamente definida por la relación anterior.
La pregunta ahora es la siguiente: dada la relación x2 y(x) − ln(x + y(x) + 1) = h que define
implícitamente la función y(x), ¿cuál es la derivada de y(x)? Obviamente si podemos hacer el despeje
para obtener y(x) la respuesta sería trivial. Pero, si no podemos hacer el despeje, notamos que esta
relación combina diversas funciones donde está presente la variable x. “Derivando esta relación” con
respecto a “x” uno debe tener presente que, por ejemplo, la derivada de x2 y(x) es la derivada de un
producto de funciones (la función “x2 ” y la función y(x)), y que la derivada de ln(x + y(x) + 1) es la
derivada de una composición y una suma de funciones. Por otra parte, ya que el lado derecho es una
114 Capítulo 5. Cálculo diferencial

constante, al derivarlo con respecto a “x” se obtiene 0. De esta manera, teniendo presente que “y” es
una función de “x”, digamos, y(x), se tiene que

derivar c.r. a x 1 + y′ (x)


x2 y(x) − ln(x + y(x) + 1) = h =⇒ 2x y(x) + x2 y′ (x) − = 0,
x + y(x) + 1

a partir de lo cual, despejando la derivada, se obtiene

2x · y(x) · (x + y(x) + 1) − 1
y′ (x) = .
1 − x2 · (x + y(x) + 1)

Abusando del lenguaje, usualmente lo anterior se escribe como (se omite la dependencia de “y” en
términos de “x”):
2x y (x + y + 1) − 1
y′ = .
1 − x2 (x + y + 1)
Ejemplo 5.30 Supongamos que x2 + y2 = 1. Dado esto, ya que “y” depende de “x”, derivando con
respecto a x tenemos que (abusando del lenguaje, se omite la dependencia de y en términos de x, de
modo que en vez de escribir y(x) uno simplemente escribe “y”)

2x x
x2 + y2 = 1 ⇒ 2x + 2yy′ = 0 ⇒ y′ (x) = − =− .
2y y
Comprobemos el resultado. Primero, en el dominio adecuado, en este caso podemos obtener “y” en
términos de “x”: despejando se tiene que
p
y = 1 − x2 ,

por lo que
−2x x
y′ = √ = −√ ,
2 1−x 2 1 − x2

que coincide con lo anterior dado que y = 1 − x2 . ■

2
Ejemplo 5.31 Obtener y′ (x) si sabemos que xy − ex y = 0. Para esto, la notación que sigue omite la
dependencia de “y” en términos de “x”, de modo que uno escribe y en vez de y(x) y escribe y′ en vez
de y′ (x). Dado esto, primero notamos que la expresión x y es el producto de la función “x” (identidad)
por la función y(x), por lo que
(xy)′ = xy′ + y.
Con esto en mente, se tiene que
2 2 2
xy − ex y = 0 ⇒ (xy′ + y) − (x2 y)′ ex y = 0 ⇒ x y′ + y − (2xy + x2 y′ )ex y = 0,

por lo que
2
′y − 2xy ex y
y = 2 x2 y .
x e −x
¿Cómo se interpreta lo anterior? Si uno pudiese hacer el despeje de “y” en términos de “x”, de de
modo de hacer explícita la función y(x), la derivada de y(x) estaría dada por la expresión anterior, que
solo dependerá de x. ■
5.4 Complementos 115

Ejercicio 5.34 Obtenga y′ (x) sabiendo que x2 ln(y) + xy = 1.


Ejercicio 5.35 Dados α, β > 0, usando derivación implícita obtenga y′ (x) sabiendo que

xα yβ = 1.

Por otro lado, despejado y en función de x, obtenga la derivada de “y”, y compruebe que los resultados
coinciden.

Ejercicio 5.36 Sabiendo que xy + ey = 1, obtenga y′ (x). Usando ese resultado, obtenga y′′ (x). ■

5.4.2 Interpretación geométrica del gradiente de una función


Para el caso g(x) = f (x, y(x)), es decir, cuando una de las variables depende de la otra, la regla de la
cadena implica que
∂ f (x, y(x)) ∂ f (x, y(x)) ∂ y(x)
g′ (x) = + · .
∂x ∂y | ∂{zx }
y′ (x)

Este resultado tiene una implicancia una importante. Para una función f : R2 → R, dado h ∈ R, la
curva de nivel h de f es el conjunto de puntos (x1 , x2 ) tal que f (x1 , x2 ) = h. Por lo tanto, a partir de
esta relación, dado x1 queda automáticamente definido el valor de x2 (despejar x2 en términos de x1
usando la igualdad f (x1 , x2 ) = h). Visto de otra manera, los puntos que están en la curva de nivel h
son tal que x2 es una función de x1 , digamos, x2 (x1 ), cumpliendo que f (x1 , x2 (x1 )) = h, por lo que el
gráfico de la función x2 (x1 ), una función real usual, es la curva de nivel h que buscamos.
La pregunta ahora es, ¿cuál es la derivada de la curva de nivel? Es decir, ¿cuál es la derivada de x2
respecto de x1 ? Ya que f (x1 , x2 (x1 )) = h, derivando con respecto a x1 , la derivada al lado derecho de
lo anterior es cero (h es constante), y la derivada al lado izquierdo se obtiene por la regla de la cadena.
Se tiene entonces que
∂ f (x1 ,x2 (x1 ))
∂ f (x1 , x2 (x1 )) ∂ f (x1 , x2 (x1 )) ∂ x2 (x1 ) ∂ x2 (x1 ) ∂x
+ · =0 ⇒ = − ∂ f (x ,x1 (x )) .
∂ x1 ∂ x2 ∂ x1 ∂ x1 1 2 1
∂ x2

Considere (x1∗ , x2∗ ) en la curva de nivel h de función f (x1 , x2 )h (la Figura 5.1 ilustra el caso).

Figura 5.1: C URVA DE NIVEL : f (x1 , x2 ) = h


116 Capítulo 5. Cálculo diferencial

Ya que la derivada de la curva de nivel de la figura anterior por el punto (x1∗ , x2∗ ) es
∂ f (x∗ ,x∗ )
∂ x2 (x1∗ ) ∂x
1 2

= − ∂ f (x∗1,x∗ )
∂ x1 1 2
∂ x2

la ecuación de la recta azul en la Figura 5.1, tangente a la curva de nivel h por el punto (x1∗ , x2∗ ), es
∂ f (x1∗ ,x2∗ )
∂x ∂ f (x1∗ , x2∗ ) ∂ f (x1∗ , x2∗ )
x2 − x2∗ = − ∂ f (x∗1,x∗ ) · (x1 − x1∗ ) ⇐⇒ (x2 − x2∗ ) + (x1 − x1∗ ) = 0.
1 2 ∂ x2 ∂ x1
∂ x2

Visto lo anterior en términos vectoriales, si x = (x1 , x2 ) es un punto de la recta azul y x∗ = (x1∗ , x2∗ ),
que también es un punto de la recta azul, ocurre que x − x∗ ∈ R2 tiene la misma “dirección” de la recta.
Recordando que ∇ f (x, y) es el vector de derivadas parciales, lo anterior es equivalente a decir que

∇ f (x1∗ , x2∗ ) · (x − x∗ ) = 0,

es decir, el gradiente ∇ f (x1∗ , x2∗ ) es perpendicular a la curva de nivel por el punto (x1∗ , x2∗ ). La siguiente
figura es ilustrativa.

Figura 5.2: G RADIENTE ES ORTOGONAL A LA CURVA DE NIVEL

Ejemplo 5.32 Para f : R2++ → R tal que f (x1 , x2 ) = x12 x2 . La curva de nivel, al nivel h = 4, es dada
por
4
x12 x2 = 4 ⇒ x2 = .
x12
Notamos entonces que el punto cuyas coordenadas son x1 = 2 y x2 = 1 está en la curva de nivel
indicada (en él se cumple la ecuación roja). Por otro lado, el gradiente de f (x1 , x2 ) es
 
2 x1 x2
∇ f (x1 , x2 ) = ∈ R2
x12

por lo que evaluado en (2, 1) resulta


 
4
∇ f (2, 1) = ∈ R2 .
4
4
Por lo visto previamente, el vector ∇ f (2, 1) = (4, 4)t ∈ R2 es ortogonal a la curva de nivel x2 = x12
por
el punto (2, 1). La siguiente figura es ilustrativa.
5.4 Complementos 117

Figura 5.3: G RADIENTE ES ORTOGONAL A LA CURVA DE NIVEL

5.4.3 Derivadas direccionales


Dados una función f : Rk → R y un vector v ∈ Rk , evaluada en x = (x1 , x2 , . . . , xk )t ∈ Rk , la derivada
direccional de f en la dirección v se define como
f (x + tv) − f (x)
Dv f (x) = lim .
h→0 t
En términos geométricos, “parado” en (x, f (x))t ∈ Rk+1 , si el vector v tiene norma uno (es decir,
∥v∥ = 1 por lo que dicho vector es “unitario”) , entonces la derivada direccional es la pendiente del
sendero que hay en la superficie definida por el gráfico de la función en la dirección v. A este respecto,
denotando ei ∈ Rk como el i-ésimo vector de la base canónica de Rk (es decir, ei ∈ Rk es un vector de
ceros salvo en la componente i donde vale 1), es directo ver que
∂ f (x)
= Dei f (x).
∂ xi
Más aún, “haciendo un poco de álgebra” se puede demostrar que

Dv f (x) = ∇ f (x) · v,

es decir, la derivada direccional de f en la dirección v ∈ Rk , evaluada en el punto de interés, es igual al


producto interno del gradiente de f en ese punto con la dirección v.
En particular, para f : R2 → R y para v = (v1 , v2 )t ∈ R2 , lo anterior informa que (el producto a
continuación es el usual entre números reales)
∂ f (x1 , x2 ) ∂ f (x1 , x2 )
Dv f (x1 , x2 ) = · v1 + · v2 .
∂ x1 ∂ x2
Ejemplo 5.33 Para obtener la derivada direccional de f (x, y) = x2 ey + y en la la dirección v = (1, 2)t ∈
R2 , primero debemos obtener las derivadas parciales de f :
∂ f (x, y) ∂ f (x, y)
= 2xey , = x2 ey + 1.
∂x ∂y
118 Capítulo 5. Cálculo diferencial

Luego,
Dv f (x, y) = ∇ f (x, y) · v = 2xey · 1 + (x2 ey + 1) · 2 = 2xey + 2x2 ey + 2.
De esta manera, y a modo de ejemplo, evaluando en x = 1, y = 0 se obtiene que
x=1, y=0
Dv f (x, y) = 2xey + 2x2 ey + 2 =⇒ Dv f (1, 0) = 6.
La lectura de lo anterior es como sigue: parado en el punto (1, 0) de la superficie que define el
gráfico de la función f (x, y), al movernos en la dirección (1, 2) ocurre que la “pendiente del sendero”
es igual a 6. ■

Ejercicio 5.37 Para f (x, y) = x2 + 2y2 − xy, encuentre Dv f (x, y) cuando v = (1, 1), cuando v = (1, 0)
y cuando v = (0, 1). ■

Ejercicio 5.38 Para f (x, y) = x2 + y + yex , encuentre v ∈ R2 tal que Dv f (0, 1) = 0. ■


6. Aplicaciones del cálculo

6.1 Análisis del crecimiento


El índice de masa corporal (ver Ejemplo 4.3) es
m
IMC(m, h) = ,
h2
donde m es la masa y h la altura. Usando esta definición, es claro que a mayor estatura menor es
el índice, mientras que a mayor masa, mayor es el índice. Por este hecho, uno tiene que el IMC es
creciente en la masa y es decreciente en la estatura.
Note ahora lo siguiente: si un individuo tiene masa m∗ y estatura h∗ su indice de masa corporal es
igual a aquel de un individuo que tiene masa 4m∗ y estatura 2h∗ :

IMC(m∗ , h∗ ) = IMC(4m∗ , 2h∗ ),

es decir, a pesar de que ambas variables aumentan (en esas proporciones), el IMC se mantiene. Cuando
se concluyó que el IMC era creciente en la masa se supuso un aumento en la masa pero que la estatura
se mantenía constante, y cuando se concluyó que el índice es decreciente en la estatura es porque si
aumentaba dicha variable pero se mantenía constante la masa. En ambos casos, el análisis es parcial.
El hecho que IMC(m∗ , h∗ ) = IMC(4m∗ , 2h∗ ) muestra que si aumentamos ambas variables a la vez
(para el caso, en esas proporciones), las conclusiones indicadas pueden variar.
En general, el análisis del crecimiento de funciones de varias variables tiene sentido, primero, para
funciones cuyo recorrido es R (es decir, valores reales) y, segundo, el crecimiento (decrecimiento) se
estudia / analiza componente a componente.
Lo primero, recorrido R, es porque si la función toma valores reales entonces es posible decidir si
tiene máximos o mínimos (locales o globales), cosa que, en general, no se puede hacer si la función
toma valores vectoriales. Si bien existe lo que se llama optimización vectorial, en la práctica se trata de
problemas donde el orden entre vectores (es decir, qué se entiende por un vector mayor que otro) es
una cuestión que puede depender de criterios externos.
Respecto de lo segundo, análisis por componentes, cuando la función depende de varias variables
ocurre que aumentar todas a la vez para estudiar el efecto en el resultado final no necesariamente
120 Capítulo 6. Aplicaciones del cálculo

informa el comportamiento de la función en cuanto a su crecimiento: al mover todas las variables


a la vez puede darse que una de ellas crezca más rápido que la otra de modo que, en el global, el
resultado esté aumentando a pesar de que, parcialmente, la función aumenta respecto de una variable
pero decrece respecto de la otra. Por ejemplo, para la función f : R2++ → R tal que
x
f (x, y) = ,
y
ocurre que si “x” e “y” crecen a la misma tasa, entonces el valor de la función se mantiene constante.
Por ejemplo, dados x, y > 0, notamos que
f (x, y) = f (2x, 2y),
es decir, duplicando “x” e “y” (ambas creciendo) ocurre que la función mantiene el valor original. Por
otro lado, del hecho que
2x 3x
f (2x, 3y) = < f (x, y), f (3x, 2y) = > f (x, y),
3y 2y
se concluye que la función sería decreciente en la medida que la tasa con que crece “x” es menor que
la tasa con que crece “y”, y sería creciente en la medida que la tasa con que crece “x” es mayor que la
tasa con que crece “y”. ¿La función es entonces creciente en los vectores? Depende de cómo sea la
razón de crecimiento de las componentes.
En definitiva, para simplificar el análisis del crecimiento de funciones de varias variables (a valores
reales), resulta más sencillo, e informativo, realizar el análisis por componentes, es decir, por
variables.
Sobre la base de lo anterior, para estudiar el crecimiento de f : Rk → R con respecto a la variable
i ∈ {1, . . . , k}, uno fija las componentes x1 , x2 , · · · , xi−1 , xi+1 , · · · , xk y analiza el comportamiento de la
función respecto a la variable xi . Como cuestión relevante, cabe señalar que el crecimiento parcial de
una función respecto de cierta variable podría depender del valor que uno está fijando para las demás
variables. Por ejemplo, para f : R2 → R tal que
f (x, y) = xy,
notamos que
(a) Dado y > 0 ocurre que f (x, y) es creciente en “x” (primera variable), eso porque con “y” fijo y
positivo, la dependencia de f en su primera variable es una función lineal ( f es lineal en x), con
pendiente positiva (la cantidad “y” es la pendiente de la recta “y x”).
(b) Dado y < 0 ocurre que f (x, y) es decreciente en “x”, eso porque con “y” fijo y negativo la
dependencia de f en su primera variable es una función lineal con pendiente negativa.
Note también que si modificamos el dominio, la conclusión anterior se puede modificar. Por
ejemplo, la función g : R2++ → R tal que
g(x, y) = xy
(note que el dominio es ahora R2++ ) es creciente en “x” independiente del valor de “y”, y además es
creciente en “y” independiente del valor de “x”.
Sobre la base de lo expuesto, ya que el análisis del crecimiento se hará por componentes, serán
entonces la derivadas parciales de la función las que nos informarán el tipo de crecimiento que tiene.
Una precaución es tener presente que, como se ha indicado, el comportamiento respecto de cierta
variable puede depender del valor de las otras.
6.1 Análisis del crecimiento 121

Definición 6.1 Para f : R2 → R (puede ser otro dominio) se tiene que:


(a) condicional en x2 (es decir, dado x2 ), la función f es creciente en la primera componente si
para todo x1 < x̄1 se cumple que

f (x1 , x2 ) < f (x̄1 , x2 ).

Si la desigualdad anterior es válida para todo x2 en el dominio (es decir, no depende de


x2 ), entonces uno dice que la función es creciente en la primera componente (sin hablar de
“condicional ”).
(b) condicional en x1 , la función f es creciente en la segunda componente si para todo x2 < x̄2 se
cumple que
f (x1 , x2 ) < f (x1 , x̄2 ).
Si la desigualdad anterior es válida para todo x1 en el dominio (es decir, no depende de esa
variable) entonces uno dice que la función es creciente en la segunda componente.

Lo anterior se puede extender de manera directa a funciones que dependen de k ∈ N variables, o


bien cuando el dominio es un subconjunto de Rk . Por otro lado, ya que el análisis del crecimiento se
realiza de manera parcial, se tendrá que:
Importante 6.1
(i) condicional en x2 , f (x1 , x2 ) es creciente en la primera variable cuando

∂ f (x1 , x2 )
> 0,
∂ x1
(ii) condicional en x1 , f (x1 , x2 ) es creciente en la segunda variable cuando

∂ f (x1 , x2 )
> 0.
∂ x2

N De manera análoga se introduce el concepto de función decreciente por componentes: las


desigualdades y signos de las derivadas cambian de manera consecuente. Así:
(i) condicional en x2 , f (x1 , x2 ) es decreciente en la primera variable cuando

∂ f (x1 , x2 )
< 0,
∂ x1
(ii) condicional en x1 , f (x1 , x2 ) es decreciente en la segunda variable cuando

∂ f (x1 , x2 )
< 0.
∂ x2
Finalmente, cabe señalar que es perfectamente posible que una función sea, por ejemplo,
creciente en una variable y decreciente en la otra.
Ejemplo 6.1 Sean α, β ∈ R y sea f (x, y) = αx + β y. Ya que

∂ f (x, y) ∂ f (x, y)
= α, = β,
∂x ∂y
se concluye que
(a) independiente de “y”, f (x, y) es creciente en “x” cuando α > 0 y es decreciente en “x” cuando
α < 0,
122 Capítulo 6. Aplicaciones del cálculo

(b) independiente de “x”, f (x, y) es creciente en “y” cuando β > 0 y es decreciente en “y” cuando
β < 0.
Por ejemplo, la función f : R2 → R tal que f (x, y) = 3x − 2y es creciente en la primera variable
(creciente en “x”) y es decreciente en la segunda variable (decreciente en “y”). Note que, por lo
indicado, el crecimiento en “x” es independiente del valor de “y”, y que el decrecimiento en “y” es
independiente del valor que tome “x”. ■

Ejemplo 6.2 Analicemos el crecimiento de f : R2 → R tal que f (x1 , x2 ) = x12 + 12 x22 − x1 x2 . Para esto,
primero se tiene que
∂ f (x1 , x2 ) ∂ f (x1 , x2 )
= 2x1 − x2 , = x2 − x1 .
∂ x1 ∂ x2
Luego:
(a) dado x2 , f (x1 , x2 ) es creciente en x1 toda vez que 2x1 > x2 ,
(b) dado x1 , f (x1 , x2 ) es creciente en x2 toda vez que x2 > x1 .
Usando lo anterior, dado (5, 4)t ∈ R2 , un incremento en la variable 1 a partir de x1 = 5, ¿qué efecto
tiene sobre la función? Ya que
2 · |{z}
5 > |{z}
4
x1 x2

por la parte (a) ocurre que f (x1 , 4) es creciente en la primera variable cuando x1 > 5, es decir,
aumentando el valor de la primera componente a partir de x1 = 5 y manteniendo x2 = 4, el valor de la
función aumenta. Visto de otra manera, para todo ε > 0 se tiene que

f (5 + ε, 4) > f (5, 4).

Por otro lado, ya que x2 = 4 no es mayor que x1 = 5, por la parte (b) tenemos que f (x1 , x2 ) es
decreciente a partir de (5, 4) cuando aumentamos el valor de la segunda variable y mantenemos
constante el valor de la primera. Es decir, para δ > 0 se tiene que f (5, 4 + δ ) < f (5, 4). ■

Ejemplo 6.3 Dados α1 , α2 , · · · , αk ∈ R++ , analicemos el crecimiento de f : Rk++ → R tal que

f (x1 , x2 , · · · , xk ) = x1α1 x2α2 · · · xkαk .

Note que el dominio considera que ambas variables son positivas.Para el caso, analicemos el
crecimiento con respecto a la variable i ∈ {1, 2, . . . , k}. Denotando x = (x1 , x2 , . . . , xk ) se tiene que

∂ f (x) αi−1 αi −1 αi+1


= αi x1α1 x2α2 · · · xi−1 xi xi+1 · · · xkαk .
∂ xi

Ya que x j > 0 para todo j ∈ {1, . . . , k} y αi > 0, se tiene que

∂ f (x)
> 0,
∂ xi
por lo que f es creciente en cada variable xi , independiente del valor que tomen las otras variables en el
dominio. Recuerde que si xi > 0 entonces cualquier potencia de este es positiva, independiente del
signo del exponente.
En particular, haciendo k = 2, α1 = α, α2 = β , hemos probado que f : R2++ → R tal que
β
f (x1 , x2 ) = x1α x2
6.1 Análisis del crecimiento 123

es creciente en ambas componentes: para todo x1 > 0 y x2 > 0 se tiene que


∂ f (x1 , x2 ) β ∂ f (x1 , x2 ) β −1
= α x1α−1 x2 > 0, = β x1α x2 > 0,
∂ x1 ∂ x2
β
es decir, dado cualquier x2 > 0 ocurre que la función f (x1 , x2 ) = x1α x2 es creciente en la variable x1 , y
β
dado dado cualquier x1 > 0, la función f (x1 , x2 ) = x1α x2 es creciente en la variable x2 . ■

x
Ejemplo 6.4 Analicemos el crecimiento de la función f : R2 → R tal que f (x, y) = 1+y 2 . Para el caso,
se tiene que
∂ f (x, y) 1 ∂ f (x, y) 2xy
= , =− .
∂x 1 + y2 ∂y (1 + y2 )2
Primero, ya que para todo y ∈ R se tiene que 1 + y2 > 0, se concluye que independiente de esa
variable ocurre que
∂ f (x, y) 1
= > 0,
∂x 1 + y2
por lo que f (x, y) es creciente con respecto a “x”. Por otro lado, ya que
∂ f (x, y) 2 xy
=−
∂y (1 + y2 )2
el signo de esta derivada parcial lo manda el numerador de la expresión. Así, f (x, y) es creciente en la
segunda componente cuando
−2xy > 0 ⇐⇒ xy < 0,
es decir, cuando (i) x < 0 e y > 0 o bien cuando (ii) x > 0 e y < 0. Por otro lado, si xy > 0 (que se
cumple cuando x > 0 e y > 0 o bien cuando x < 0 e y < 0) ocurre que la función f (x, y) es decreciente
en la segunda componente.
x
En resumen, la función f : R2 → R tal que f (x, y) = 1+y2
cumple que:
(i) es creciente en “x”, independiente del valor de “y”,
(ii) es creciente en “y” cuando x < 0 e y > 0 o bien cuando x > 0 e y < 0,
(iii) es decreciente en “y” cuando x > 0 e y > 0 o bien cuando x < 0 e y < 0.
x
Note ahora lo siguiente: dada g : R2+ → R tal que g(x, y) = 1+y 2 (es decir, modificamos el dominio

respecto de la función anterior), por lo visto previamente tenemos que g(x, y) es creciente en la primera
componente y, además, g(x, y) es decreciente en la segunda componente: cuando x > 0 e y > 0 se tiene
que
∂ f (x, y) x2y
=− < 0.
∂y (1 + y2 )2
La Figura 6.1 es el gráfico de la función, y es ilustrativa sobre lo expuesto.
x
Figura 6.1: G RÁFICO DE f (x, y) = 1+y2
124 Capítulo 6. Aplicaciones del cálculo

Ejemplo 6.5 Analicemos el crecimiento de f : R2 → R tal que f (x, y) = e−xy . Para esto, ya que

∂ f (x, y) ∂ f (x, y)
= −ye−xy , = −xe−xy ,
∂x ∂y
∂ f (x,y) ∂ f (x,y)
el signo de ∂x lo manda −y: si −y > 0, es decir, y < 0, ocurre que ∂x > 0, por lo que f es
∂ f (x,y)
creciente en x cuando y < 0. Por otro lado, > 0 cuando
∂y −xe−xy > 0, es decir, cuando x < 0. Así,
f es creciente en y cuando x < 0, y decreciente en caso contrario. ■

Ejercicio 6.1 Analice el crecimiento, por componente, de las siguiente funciones:


(a) f : R2++ → R tal que f (x, y) = x ey .
(b) g : R2 → R tal que g(x, y) = x ey .
(c) h : R2 → R tal que h(x, y) = x e−y .

Ejercicio 6.2 Dados a, b, α, β constantes positivas, analice el crecimiento (por componentes) de la


función g : R2++ → R tal que
a − bx1
g(x1 , x2 ) = .
α + β x2

Ejercicio 6.3 Analice el crecimiento por componente de las siguiente funciones:


(a) f : R2++ → R tal que f (x, y) = xy .
ex
(b) g : R2 → R tal que g(x, y) = 1+e y.
2 ex
(c) h : R++ → R tal que h(x, y) = 1+ey .

Ejercicio 6.4 Para α, β ∈]0, 1[, analice el crecimiento de f : R2++ → R tal que f (K, L) = K α Lβ . ■

Ejercicio 6.5 Dadas f : R2 → R y g : R → R, definamos h : R2 → R tal que

h(x1 , x2 ) = g( f (x1 , x2 )).

(a) Usando la regla de la cadena, explique por qué se cumple lo siguiente:

∂ h(x1 , x2 ) ∂ f (x1 , x2 ) ∂ h(x1 , x2 ) ∂ f (x1 , x2 )


= g′ ( f (x1 , x2 )) · , = g′ ( f (x1 , x2 )) · .
∂ x1 ∂ x1 ∂ x2 ∂ x2
(b) Concluya que si g es creciente y f es creciente en ambas componentes, entonces h(x1 , x2 ) es
creciente en ambas componentes.

Ejercicio 6.6 Si t ≥ 0 es el tiempo que dedica a estudiar y c ≥ 0 es la cantidad de calorías que


6.2 Polinomio de Taylor 125

consume, entonces la nota que obtiene en la prueba (se admiten notas negativas) es

(c2 − αc)et
N(c,t) = 7 · ,
(1 + c2 ) (1 + et )

donde α > 0 es un parámetro. ¿Siempre le conviene estudiar más? ¿Siempre le conviene aumentar
el consumo de calorías? Si la nota fuera
c2 et
N(c,t) = 7 · ,
(1 + c2 ) (1 + et )

¿siempre le conviene estudiar más? ¿Siempre le conviene aumentar el consumo de calorías? ■

6.2 Polinomio de Taylor


Para la función f : R → R, el polinomio de Taylor de orden 1 (grado 1) de f (x) en torno a x̄ ∈ R es

P1 (x) = f (x̄) + f ′ (x − x̄),

mientras que el polinomio de Taylor de orden 2 (grado 2) en torno a x̄ ∈ R es

f ′′ (x̄)
P2 (x) = f (x̄) + f ′ (x − x̄) + (x − x̄)2 .
2
Desde un punto de vista geométrico, P1 (x) es la recta tangente al gráfico de la función por el punto
(x̄, f (x̄)), de modo que f (x̄) = P1 (x̄) y f ′ (x̄) = P1′ (x̄). Por otro lado, P2 (x) es una parábola tal que

f (x̄) = P2 (x̄), f ′ (x̄) = P2′ (x̄), f ′′ (x̄) = P2′′ (x̄).

Destaca el hecho que P1 (x) es una aproximación lineal de f (x) y que P2 (x) es una aproximación
cuadrática de f (x).
Para una función de dos variables, f (x1 , x2 ), la “primera derivada” de f evaluada en (x̄1 , x̄2 ) ∈ R2
es el gradiente de la función, en ese punto,
 ∂ f (x̄ ,x̄ ) 
1 2
∂ x1
2
∇ f (x̄1 , x̄2 ) =  ∈R ,
 
∂ f (x̄1 ,x̄2 )
∂ x2

mientras que la “segunda derivada” de f (x1 , x2 ) evaluada en (x̄1 , x̄2 ) es la matriz de Hesse

∂ 2 f (x̄1 ,x̄2 ) ∂ 2 f (x̄1 ,x̄2 )


 
∂ x1 ∂ x1 ∂ x1 ∂ x2
2×2
H f (x̄1 , x̄2 ) =  ∈R .
 
∂ 2 f (x̄1 ,x̄2 ) ∂ 2 f (x̄1 ,x̄2 )
∂ x1 ∂ x2 ∂ x2 ∂ x2

Note que si (x̄1 , x̄2 ) es conocido (dado), entonces ∇ f (x̄1 , x̄2 ) ∈ R2 y H f (x̄1 , x̄2 ) ∈ R2×2 son un
vector y una matriz conocidos, es decir, corresponden a expresiones numéricas. Usando este hecho, de
manera natural el polinomio de Taylor de orden 1 de f (x1 , x2 ) en torno a (x̄1 , x̄2 ) ∈ R2 es

P1 (x1 , x2 ) = f (x̄1 , x̄2 ) + ∇ f (x̄1 , x̄2 ) · ((x1 , x2 ) − (x̄1 , x̄2 )),


126 Capítulo 6. Aplicaciones del cálculo

mientras que el polinomio de Taylor de orden 2 de f (x1 , x2 ) en torno a (x̄1 , x̄2 ) es


1
P2 (x1 , x2 ) = f (x1 , x2 ) + ∇ f (x̄1 , x̄2 ) · ((x1 , x2 ) − (x̄1 , x̄2 )) + ((x1 , x2 ) − (x̄1 , x̄2 ))t H f (x̄1 , x̄2 )((x1 , x2 ) − (x̄1 , x̄2 )).
2

Haciendo x = (x1 , x2 )t ∈ R2 y x̄ = (x̄1 , x̄2 )t ∈ R2 , lo anterior se reescribe de la siguiente manera:

P1 (x) = f (x̄) + ∇ f (x̄) · (x − x̄)


1
P2 (x) = f (x̄) + ∇ f (x̄) · (x − x̄) + (x − x̄)t H f (x̄)(x − x̄).
2

Importante 6.2 De lo anterior destaca que:


(i) Se entiende que P1 (x1 , x2 ) y P2 (x1 , x2 ) son polinomios en varias variables. El primero solo
contiene términos lineales, y el segundo incluye además términos cuadráticos y cruzados de
las variables.
(ii) La expresión ∇ f (x̄) · (x − x̄) es un producto interno de vectores. Corresponde a lo siguiente:

∂ f (x̄1 , x̄2 ) ∂ f (x̄1 , x̄2 )


∇ f (x̄) · (x − x̄) = (x1 − x̄1 ) + (x2 − x̄2 ).
∂ x1 ∂ x2

(iii) La expresión (x − x̄)t H f (x̄)(x − x̄) es la forma cuadrática asociada a la matriz de Hesse de la
función, evaluada en (x − x̄)t ∈ R2 . Desarrollando los productos:

(x − x̄)t H f (x̄)(x − x̄) =

∂ 2 f (x̄1 , x̄2 ) ∂ 2 f (x̄1 , x̄2 ) ∂ 2 f (x̄1 , x̄2 )


· (x1 − x̄1 )2 + 2 · (x1 − x̄1 ) · (x2 − x̄2 ) + · (x2 − x̄2 )2 .
∂ x1 ∂ x1 ∂ x1 ∂ x2 ∂ x2 ∂ x2
(iv) P1 (x) es la ecuación del plano tangente a la superficie que define f (x1 , x2 ) por el punto
(x̄, f (x̄)), mientras que P2 (x) es una forma cuadrática (más un término lineal) que aproxima
a la función por el punto (x̄, f (x̄)).

Ejemplo 6.6 Considere f (x, y) = ln(1 + x + y2 ). Encontremos el polinomio de Taylor de orden 2 de


f (x, y) en torno a (1, 1). Para esto, primero, debemos encontrar el gradiente y la matriz de Hesse de f .
Se tiene que

 1

1+x+y2
∂ f (x, y) 1 ∂ f (x, y) 2y 2
= , = ⇒ ∇ f (x, y) =  ∈R .
 
∂x 1 + x + y2 ∂y 1 + x + y2 2y
1+x+y2

Usando las derivadas parciales que se han obtenido, se tiene que:

∂ 2 f (x, y) 1 ∂ 2 f (x, y) 2y ∂ 2 f (x, y) 2 + 2x − 2y2


=− , =− , = ,
∂ x∂ x (1 + x + y2 )2 ∂ x∂ y (1 + x + y2 )2 ∂ y∂ y (1 + x + y2 )2

por lo que
 1 2y 
− (1+x+y2 )2 − (1+x+y2 )2
2×2
H f (x, y) =  ∈R .
 
2y 2+2x−2y2
− (1+x+y2 )2 (1+x+y2 )2
6.3 Convexidad (concavidad) de funciones de varias variables 127

De esta manera, evaluando en x̄ = 1 e ȳ = 1 se tiene que


 
 t −1/9 −2/9
1 2
∇ f (1, 1) = , ∈ R2 , H f (1, 1) =   ∈ R2×2 ,
3 3
−2/9 2/9

por lo que
  
−1/9 −2/9 x−1
1
P2 (x, y) = f (1, 1) + (1/3, 2/3)t · (x − 1, y − 1)t + x − 1 y − 1 

 
} 2
−2/9 2/9 y−1
| {z } | {z
1
ln(3) (x−1)+ 2 (y−1)
3 3

1 2 1 
−(x − 1)2 + 2 (y − 1)2 − 4 (x − 1)(y − 1) .

= ln(3) + (x − 1) + (y − 1) +
3 3 18
 
−1 0
Si tomamos x̄ = 0 e ȳ = 0 se tiene que ∇ f (0, 0) = (1, 0)t ∈ R2 y H f (0, 0) =   ∈ R2×2 , de
0 2
modo que el polinomio de Taylor de orden de 2 de f (x, y) = ln(1 + x + y2 ) en torno a (0, 0) es
  
−1 0 x
1
P2 (x, y) = f (0, 0) + (1, 0)t · (x, y)t + x y 

 
} 2
0 2 y
| {z } | {z
ln(1)=0 1·x+0·y=x
| {z }
−x2 +2y2

x2
= x− + y2 .
2

Ejercicio 6.7 Para la función f (x, y) = ln(1 + x + y2 ), obtenga el polinomio de Taylor de orden 2 en
torno a (0, 1). ■

Ejercicio 6.8 Para la función f (x, y) = x2 ey , obtenga el polinomio de Taylor de orden 2 en torno a
(1, 0). ■

Ejercicio 6.9 Para la función f (x, y) = x2 − y2 + xy, obtenga el polinomio de Taylor de orden 2 en
torno a (0, 0). ■

Ejercicio 6.10 Para la función f (x, y) = ex + ln(1 + y), obtenga el polinomio de Taylor de orden 2
en torno a (1, 1). ■

6.3 Convexidad (concavidad) de funciones de varias variables


6.3.1 Motivación
¿Por qué es importante el estudio de la convexidad (concavidad) de funciones de varias variables? Una
cuestión que Ud. tratará en prácticamente todos los cursos de su carrera, sea en temas de microeconomía,
macroeconomía, finanzas, manejo de portafolios, asignación de recursos, estadística, etc., tendrá alguna
relación con la elección de variables que maneja de modo de lograr algún objetivo que depende de la
128 Capítulo 6. Aplicaciones del cálculo

elección de esas variables. Por ejemplo, las personas observan los precios de los bienes de consumo y
disponen de dinero para comprarlos. Dado esto, cada uno debe decidir cómo gastar el dinero de modo
de obtener la mayor satisfacción posible. Otro ejemplo: el Gobierno debe decidir cómo gastar los
recursos que dispone en, digamos, colegios y hospitales, de modo de lograr el mayor beneficio posible
para la ciudadanía.
En definitiva, muchos problemas que Ud. estudiará a lo largo de su carrera tienen que ver con la
elección de variables, que Ud. maneja, con el fin de cumplir algún objetivo. Esos problemas, desde un
punto de vista matemático, se llaman problemas de optimización: elegir el valor que deben tomar las
variables, x1 , x2 , . . . , xk de modo que cierta función f (x1 , x2 , . . . , xk ), que define su objetivo, alcance el
mayor valor posible, o el menor valor posible si el problema es, por ejemplo, minimizar un gasto, una
pérdida, etc.
Una cuestión relevante es entonces conocer cómo se resuelven los problemas de optimización, y
si tienen solución: algunos problemas pueden ser muy complejos de modo que no sabemos cómo
resolverlos ni cómo caracterizar (obtener) su solución. Incluso en el caso de que haya solución,
una cuestión muy importante es saber si esta es única. A este respecto, en general, no existe teoría
comprehensiva que nos permita caracterizar soluciones de problemas de optimización cuando el
objetivo es dado por una función arbitraria. Sin embargo, en el caso de que los objetivos (funciones)
sean definidos por funciones convexas cuando se trata de minimizar, o cóncavas cuando se trata de
maximizar, ocurren cosas extraordinarias. En general, bajo supuestos de convexidad, o concavidad,
de las funciones involucradas, los problemas de optimización son tal que, primero, bajo condiciones
adecuadas ocurre que, efectivamente, hay solución y, más aún, que dicha solución es única. No solo
eso, bajo ciertos supuestos generales uno puede, además, desarrollar métodos sencillos para encontrar
la solución de los problemas.

6.3.2 Recapitulación sobre convexidad de funciones de una variable


Recordemos que la convexidad de una función f : R → R se puede ver desde tres puntos de vista
equivalentes:
(a) la función f es convexa si para todo x1 , x2 ∈ R y para todo λ ∈]0, 1[ se tiene que

f (λ x1 + (1 − λ )x2 ) < λ f (x1 ) + (1 − λ ) f (x2 );

(b) la función f es convexa si para todo x1 , x2 ∈ R, x1 ̸= x2 , el segmento que une los puntos
(x1 , f (x1 )) y (x2 , f (x2 )) está “sobre” de la porción del gráfico de f entre esos puntos, salvo,
obviamente, en los puntos (x1 , f (x1 )) y (x2 , f (x2 ));
(c) la función f es convexa si la derivada f ′ (x) es creciente, es decir,

f ′′ (x) > 0.

Para funciones cóncavas, las desigualdades van en sentido contrario, de modo que, por ejemplo, f
es cóncava cuando f ′′ (x) < 0.

6.3.3 Convexidad (concavidad): caso varias variables


La idea de funciones convexas (cóncavas) se puede extender de manera natural para el caso de funciones
de varias variables. Lo novedoso es que ahora, primero, en vez de evaluar en un promedio ponderado
de números reales, λ x1 + (1 − λ )x2 , se evalúa en promedio ponderado de vectores y, segundo, se debe
tener presente que la “segunda derivada” de funciones de varias variables es una matriz.
6.3 Convexidad (concavidad) de funciones de varias variables 129

Definición 6.2 La función f : Rk → R se dice convexa si para todo λ ∈]0, 1[ y para todo x =
(x1 , x2 , . . . , xk )t ∈ Rk e y = (y1 , y2 , . . . , yk )t ∈ Rk se cumple que

f (λ x + (1 − λ )y) < λ f (x) + (1 − λ ) f (y).

Por otro lado, la función f : Rk → R se dice cóncava si para todo λ ∈]0, 1[ y para todo
x = (x1 , x2 , . . . , xk )t ∈ Rk e y = (y1 , y2 , . . . , yk )t ∈ Rk se cumple que

f (λ x + (1 − λ )y) > λ f (x) + (1 − λ ) f (y).

N Análogo al caso de funciones de una variable, la definición de función débilmente convexa


corresponde al caso cuando en la definición de convexa se reemplaza < por ≤ (similar con
débilmente cóncava).

Como una extensión natural y directa de la propiedad que se tiene para funciones de una variable,
sobre la base de lo anterior se tiene el siguiente resultado.

Proposición 6.1 Caracterización de convexidad usando la matriz de Hesse


(a) La función f : Rk → R es convexa si para todo x = (x1 , x2 , . . . , xk )t ∈ Rk ocurre que

H f (x) ∈ Rk×k

es definida positiva.
(b) La función f : Rk → R es cóncava si para todo x ∈ Rk ocurre que

H f (x) ∈ Rk×k

es definida negativa.

N La función f : Rk → R es débilmente convexa si para todo x = (x1 , x2 , . . . , xk )t ∈ Rk se tiene que


H f (x) ∈ Rk×k es semidefinida positiva, mientras que f : Rk → R es débilmente cóncava si para
todo x ∈ Rk , H f (x) ∈ Rk×k es semidefinida negativa.
Recordemos que una matriz es definida positiva cuando sus valores propios son mayores que cero
(definida negativa cuando son menores que cero), y que es semidefinida positiva si sus valores propios
son mayor o igual a cero, alguno de ellos cero (o ambos). Por otro lado, si uno de los valores propios es
positivo y el otro es negativo, ocurre que la matriz no tiene signo.
Sobre la base de lo anterior, lo que sigue requiere entonces investigar el signo de la matriz de Hesse
de una función. Ya que esa matriz puede depender de variables, encontrar su signo se puede convertir
en algo dificultoso. Sin embargo, la siguiente proposición será útil para caracterizar el signo de la
matriz de Hesse de una función de dos variables.
Proposición 6.2 Dada f : R2 → R, cuya matriz de Hesse (simétrica) es

∂ 2 f (x,y) ∂ 2 f (x,y)
 
∂ x∂ x ∂ x∂ y
2×2
H f (x, y) =  ∈R ,
 
∂ 2 f (x,y) ∂ 2 f (x,y)
∂ y∂ x ∂ y∂ y

se tiene que:
130 Capítulo 6. Aplicaciones del cálculo

(i) H f (x, y) es definida positiva si

∂ 2 f (x, y)
H11 (x, y) = > 0, det (H f (x, y)) > 0.
∂ x∂ x
(ii) H f (x, y) es semidefinida positiva si

∂ 2 f (x, y)
H11 (x, y) = > 0, det (H f (x, y)) = 0.
∂ x∂ x
(iii) H f (x, y) es definida negativa si

∂ 2 f (x, y)
H11 (x, y) = < 0, det (H f (x, y)) > 0.
∂ x∂ x
(iv) H f (x, y) es semidefinida negativa si

∂ 2 f (x, y)
H11 (x, y) = < 0, det (H f (x, y)) = 0.
∂ x∂ x
(v) H f (x, y) no tiene signo si
det (H f (x, y)) < 0.

Importante 6.3 Ya que el determinante de una matriz es igual al producto de sus valores propios, si
2
∂ 2 f (x, y) ∂ 2 f (x, y)
 2
∂ f (x, y)
det(H f (x, y)) = · − <0
∂ x∂ x ∂ y∂ y ∂ y∂ x

entonces uno de los valores propios de la matriz de Hesse de f (x, y) es positivo y el otro es negativo,
razón la cual H f (x, y) no tiene signo. Esto explica la parte (v) de la Proposición 6.2. A este respecto,
si la matriz de Hesse de una función no tiene signo, esa función no es ni cóncava, ni convexa.

Ejemplo 6.7 Considere f : R2 → R tal que f (x, y) = 4x2 + y2 + xy + 2x + 3y. De manera directa,

∂ f (x, y) ∂ f (x, y)
= 8x + y + 2, = 2y + x + 3,
∂y ∂x
 
8 1
por lo que H = H f (x, y) = . Como H11 = 8 > 0 y det(H) = 15 > 0, se concluye que f (x, y) =
1 2
4x2 + y2 + xy + 2x + 3y es convexa (ver Proposición 6.2, (i)). La Figura 6.2 es ilustrativa.

Figura 6.2: G RÁFICO DE f (x, y) = 4x2 + y2 + xy + 2x + 3y


6.3 Convexidad (concavidad) de funciones de varias variables 131

x
Ejemplo 6.8 Para g(x, y) = 1+y 2 , se tiene

∂ g(x, y) 1 ∂ g(x, y) 2xy


= , =− ,
∂x 1 + y2 ∂y (1 + y2 )2

por lo que:

∂ 2 g(x, y) ∂ 2 f (x, y) 2y ∂ 2 f (x, y) 2x(1 + y2 )2 − (2xy)2(2y)(1 + y2 )


= 0, =− , =− ,
∂ x∂ x ∂ y∂ x (1 + y2 )2 ∂ y∂ y (1 + y2 )4

y así
 2y 
0 − (1+y2 )2

Hg (x, y) =  .
 
2 2 2)
2y
− (1+y2 )2 − 2x(1+y ) −(2xy)2(2y)(1+y
(1+y2 )4

Ya que
2 2
2x(1 + y2 )2 − (2xy)2(2y)(1 + y2 )
   
2y 2y
det(Hg (x, y)) = 0 · − − − = − < 0,
(1 + y2 )4 (1 + y2 )2 (1 + y2 )2
x
la función g(x, y) no es ni cóncava, ni convexa. La Figura 6.3 muestra el gráfico de g(x, y) = 1+y2
.

x
Figura 6.3: G RÁFICO DE g(x, y) = 1+y2

Ejemplo 6.9 Dados α > 0 y β > 0, sea g : R2++ → R tal que g(K, L) = α ln(K) + β ln(L). Note que
∂ g(K,L) ∂ g(K,L)
el dominio de g considera que K > 0 y que L > 0. Como ∂K = α
K y ∂L = βL , tenemos
 α
− K2

0
∂ 2 g(K, L) α ∂ 2 g(K, L) β ∂ 2 g(K, L) ∂ 2 g(K, L)
= − 2, = − 2, = =0 ⇒ Hg (K, L) =  .
∂ K∂ K K ∂ L∂ L L ∂ K∂ L ∂ L∂ K
0 − Lβ2

Ya que Hg (K, L) es una matriz diagonal, sus valores propios son los elementos de la diagonal, que para
el caso son ambos negativos. Por lo tanto, la matriz Hg (K, L) es definida negativa, implicando que la
función g(K, L) = α ln(K) + β ln(L) es cóncava. Note que esta conclusión se pudo obtener usando
Proposición 6.2, pues
α αβ
H11 = − 2 < 0, det(Hg (K, L)) = 2 2 > 0.
K K L

132 Capítulo 6. Aplicaciones del cálculo

Ejemplo 6.10 Importante


Dados α, β ∈ R+ , definamos f : R2++ → R tal que f (x, y) = xα yβ . Para estudiar la concavidad o
convexidad de f (x, y) debemos obtener la matriz de Hesse H f (x, y) y estudiar su signo. Ya que

∂ f (x, y) ∂ f (x, y)
= αxα−1 yβ , = β xα yβ −1 ,
∂x ∂x
se obtiene
∂ f (x, y) ∂ f (x, y) ∂ f (x, y)
= α(α − 1)xα−2 yβ , = αβ xα−1 yβ −1 , = β (β − 1)xα yβ −2 ,
∂ x∂ x ∂ y∂ x ∂ y∂ y
por lo que
αβ xα−1 yβ −1
 
α(α − 1)xα−2 yβ
H = H f (x, y) =   ∈ R2×2 .
αβ xα−1 yβ −1 β (β − 1)xα yβ −2
Usando lo anterior,

H11 = α(α − 1)xα−2 yβ . (6.1)

Por otro lado, el determinante de H f (x, y) cumple que


     2
det(H f (x, y)) = α(α − 1)xα−2 yβ · β (β − 1)xα yβ −2 − αβ xα−1 yβ −1
= α β (α − 1)(β − 1)x2α−2 y2β −2 − α 2 β 2 x2α−2 y2β −2
= α β (α − 1)(β − 1) − α 2 β 2 x2α−2 y2β −2


= αβ [(α − 1)(β − 1) − αβ ] x2α−2 y2β −2


= αβ (1 − α − β ) x2α−2 y2β −2 . (6.2)

Así, dados α, β > 0, partiendo de la base que x > 0 e y > 0 notamos entonces que:
(a) Si α + β < 1, es decir 1 − α − β > 0, se tiene que α y β son menores que uno (y positivos
como se ha supuesto). Por lo tanto, por (6.1) tenemos que H11 < 0 y por (6.2) tenemos que
det(H f (x, y)) > 0. De esta manera, para f : R2++ → R tal que f (x, y) = xα yβ se tiene que

si α + β < 1 ⇒ f (x, y) = xα yβ es cóncava.

(b) Si α + β > 1, es decir, 1 − α − β < 0, por (6.2) el determinante de la matriz de Hesse de f (x, y)
es negativo, implicando que la función no es ni cóncava, ni convexa.
(c) Si α + β = 1, es decir, 1 − α − β = 0, ocurre que 0 < α < 1 (estamos suponiendo que los
exponentes son positivos), de modo que por (6.1) uno tiene que H11 < 0. Sin embargo, bajo lo
indicado, por (6.2) se tiene que det(H f (x, y)) = 0. Por lo tanto, teniendo presente que β = 1 − α,
ocurre que f (x, y) = xα y1−α es débilmente cóncava, pero no cóncava (la matriz de Hesse es
semidefinida negativa).
Por ejemplo, la función f : R2++ → R tal que f (x, y) = x1/2 y1/3 es cóncava (exponentes suman
menos que uno), mientras que g : R2++ → R tal que g(x, y) = x1/2 y no es ni cóncava ni convexa
(exponentes suman más que uno). Por otro lado, para α ∈]0, 1[, la función h : R2++ → R tal que
h(x, y) = xα y1−α es débilmente cóncava, pero no es cóncava. ■
6.3 Convexidad (concavidad) de funciones de varias variables 133

N Suponga que f : R2 → R es cóncava. En ese caso, sabemos que la matriz de Hesse de f (x, y) es
definida negativa, por lo que (ver Proposición 6.2)

∂ f (x, y) 2
    
∂ f (x, y) ∂ f (x, y) ∂ f (x, y)
< 0, − > 0.
∂ x∂ x ∂ x∂ x ∂ y∂ y ∂ x∂ y
(x,y)
Luego, ya que ∂∂f x∂ x < 0, de la desigualdad anterior a la derecha se tiene que (la “desigualdad
al medio” cambia de sentido ya que el divisor es negativo)

∂ f (x,y) 2
 
    2
∂ f (x, y) ∂ f (x, y) ∂ f (x, y) ∂ f (x, y) ∂ x∂ y ∂ f (x, y)
> ⇒ <   ⇒ < 0.
∂ x∂ x ∂ y∂ y ∂ x∂ y ∂ y∂ y ∂ f (x,y) ∂ y∂ y
∂ x∂ x

Desde un punto de vista geométrico, la condición sobre la segunda derivada respecto de “x”
informa que condicional en “y” (es decir, dado “y”), ocurre que la función dependiendo de “x”
es una función cóncava (en una variable), mientras que la condición sobre la segunda derivada
respecto de “y” informa que condicional en “x” ocurre que la función dependiendo de “y” es una
función cóncava. Visto de otra manera, cuando una función es cóncava en sus dos variables,
entonces es cóncava con respecto a cada una de ellas.
Ahora bien, si la función es cóncava respecto de cada una de sus variables, ¿es cóncava
respecto de las dos variables a la vez? La respuesta es no necesariamente. Usando el Ejemplo
6.10, f : R2++ → R tal que
f (x, y) = x1/2 y3/4
no es una función cóncava (exponentes suman más que uno). Sin embargo, dado “y”, la función

f1 (x) = x1/2 y3/4

es cóncava en “x”, mientras que dado “x”, f2 (y) = x1/2 y3/4 es cóncava en “y”. Así, la concavidad
por componentes es una condición necesaria para la concavidad en las dos variables, pero no es
una condición suficiente. Mismo ocurre con la convexidad.
Por otro lado, note que la función f : R2++ → R tal que f (x, y) = x2 y2 es convexa en cada
componente: dado “y” es convexa en “x” (función cuadrática); dado “x” es convexa en “y”. Sin
embargo, como los exponentes suman más que uno, está función, vista a nivel vectorial, no es ni
cóncava ni convexa en ambas variables (ver Ejemplo 6.10, conclusión (b)).

Ejercicio 6.11 Analice la concavidad (convexidad) de las siguientes funciones:


(a) f : R2 → R tal que f (x1 , x2 ) = x12 + x22 + x1 x2 .
(b) f : R2 → R tal que f (x1 , x2 ) = x12 + x22 + 2x1 x2 .
(c) f : R2 → R tal que f (K, L) = L2 + 5K 2 + 3KL − 3K − 10L.
(d) f : R2 → R tal que f (x, y) = 2x + 4y.

Ejercicio 6.12
(a) Muestre que f : R2 → R tal que f (x, y) = x2 − y2 no es ni cóncava, ni convexa.
(b) Para α ∈]0, 1[, muestre que f : R2++ → R tal que f (x, y) = xα + y2 no es ni cóncava, ni convexa.
(c) Para α > 1, muestre que f : R2++ → R tal que f (x, y) = xα + y2 es convexa.

Ejercicio 6.13 Encuentre las condiciones sobre β ∈ R para que la función f (x, y) = x2 + 4y2 + β xy
sea convexa. ■
134 Capítulo 6. Aplicaciones del cálculo

Ejercicio 6.14 Explique por qué f : R2++ → R tal que f (x, y) =
xy es débilmente cóncava pero no
2 √
es cóncava. Explique por qué g : R++ → R tal que g(x, y) = xy es cóncava.
3 ■

2 2
Ejercicio 6.15 Explique por qué f (x, y) = ex +2y es convexa. ¿Qué se puede decir de la función
2 +2y2 )
g(x, y) = e−(x ? ■

Ejercicio 6.16 Suponga que las funciones f : R → R y g : R → R son convexas. Definamos


h : R2 → R tal que h(x, y) = f (x) + g(y). Explique entonces por qué h(x, y) es convexa. Aplique este
resultado para mostrar que la función h : R2 → R tal que g(x, y) = ex + y2 es convexa. ■

Ejercicio 6.17 Suponga que f (x, y) es cóncava. Dados a, b ∈ R, definamos

g(x, y) = f (x, y) + ax + by.

(a) Explique por qué Hg (x, y) = H f (x, y) y concluya que g(x, y) es cóncava.
(b) Usando lo anterior y el resultado del Ejemplo 6.10, explique por qué g : R2++ → R tal que

g(x, y) = x1/4 y1/2 − 6x + 4y

es cóncava.

6.3.4 Convexidad de curvas de nivel, funciones “cuasicóncavas”


Una cuestión que jugará un papel importante en el estudio de algunos problemas de optimización es el
análisis de la convexidad (concavidad) de las curvas de nivel.
Ejemplo 6.11 Para α, β > 0 y f : R2++ → R tal que f (x, y) = xα yβ , la curva de nivel h > 0 es

h1/β − αβ
x α yβ = h ⇒ y(x) = α = h1/β x .
x β

La curva de nivel, en este caso, es una función de una variable, por lo que el análisis de la convexidad
requiere solo el cálculo de la segunda derivada (usual). Por lo tanto,
   
′ α − α −1 ′′ α α α
1/β − β −2 α α − α −2
y (x) = − h1/β x β ⇒ y (x) = − − −1 h x = + 1 h1/β x β > 0.
β β β β β

En consecuencia, independiente de si f (x, y) es cóncava o convexa (ver Ejemplo 6.10), la curva de


nivel h > 0 es convexa (segunda derivada es positiva). ■

Definición 6.3 Una función f : R2 → R (u otro dominio) se dice cuasicóncava si sus curvas de
nivel son convexas.
Dados α, β > 0, el ejemplo anterior mostró que la función f : R2++ → R tal que f (x, y) = xα yβ
es cuasicóncava, independiente de los valores de los exponentes. Note entonces que si α + β > 1
ocurre que f (x, y) no es cóncava. Por lo tanto, una función cuasicóncava no tiene por qué ser una
función cóncava. Sin embargo, el siguiente resultado muestra que si una función es cóncava entonces
es cuasicóncava. La prueba se entiende como un ejercicio complejo de derivación.
6.3 Convexidad (concavidad) de funciones de varias variables 135

Proposición 6.3 Si función f : R2 → R es cóncava y creciente por componentes, entonces f es


cuasicóncava.

Demostración. La curva de nivel h de f (x, y), que denotamos y(x), cumple que f (x, y(x)) = h, de
modo que derivando esta relación usando la regla de la cadena se tiene que:
∂ f (x,y(x))
∂ f (x, y(x)) ∂ f (x, y(x)) ∂ y(x) ′ ∂ y(x) ∂x
+ =0 ⇒ y (x) = = − ∂ f (x,y(x)) .
∂x ∂y ∂x ∂x
∂y

En lo que sigue, por simplicidad para la notación se usará “y” en vez de y(x) y se denotará

∂ f (x, y) ∂ f (x, y) ∂ 2 f (x, y) ∂ 2 f (x, y) ∂ 2 f (x, y)


fx = , fy = , fxx = , fyy = , fxy = fyx = .
∂x ∂y ∂ x∂ x ∂ y∂ y ∂ y∂ x

Sobre la base de lo anterior, note que cada una de las expresiones anteriores depende solo de “x” (eso
ya que “y” depende de “x”). Se tiene entonces que

fx ( fx )′ · fy − fx · ( fy )′
y′ (x) = − ⇒ y′′ (x) = − .
fy ( fy )2
∂ f (x,y(x)) ∂ f (x,y(x))
Por regla de la cadena, recordando que fx = ∂x , fy = ∂y y que y′ = − ffxy , uno tiene

∂ fx ∂ fx ∂ y fx ∂ fy ∂ fy ∂ y fx
( fx )′ = + · = fxx − fyx · , ( fy )′ = + · = fxy − fyy · ⇒
∂x ∂y ∂x fy ∂x ∂y ∂x fy
   
fx
fxx − fyx · fy · fy − fx · fxy − fyy · ffxy
1 fx ( fx )2
 
′′
y (x) = − =− fxx − 2 fxy + · fyy .
( fy )2 fy ( fy )2 ( fy )3
 t  
fx fxx fxy
Definiendo z = − √1
, 2
∈R yH = , es fácil ver que y′′ (x) = −zt Hz. Ya que f
fy ( fy )3/2 fxy fyy
es cóncava ocurre que H es definida negativa, por lo que zt Hz < 0, implicando que y′′ (x) > 0, y así y(x)
es convexa. Se requiere es crecimiento por componentes para que fx y fy sean positivos. ■

Importante 6.4 Investigar si las curvas de nivel de una función de dos variables son convexas, o
cóncavas, requiere, en principio, investigar la convexidad/concavidad de la función y el crecimiento
por componentes: si f (x, y) es cóncava y creciente por componentes entonces sus curvas de nivel
son convexas; si f (x, y) es convexa y creciente por componentes, entonces sus curvas de nivel son
cóncavas. Sin embargo, si la función no es ni cóncava, ni convexa, el problema se convierte en
estudiar el signo de la segunda derivada de y(x), la curva de nivel que se obtiene de la relación
f (x, y) = h: la curva de nivel es convexa cuando y′′ (x) > 0, mientras que es cóncava cuando y′′ (x) < 0.

Importante 6.5 En lo que sigue, para simplificar el análisis de las curvas de nivel, se asume que el
dominio donde se trabaja es tal que las funciones bajo análisis son crecientes por componentes, de
modo que estudio de la concavidad/convidad de las curvas de nivel se circunscribe solo al estudio de
la concavidad/convexidad de la función. Este será el caso frecuente en los análisis que uno realiza,
en particular cuando se considera las que variables están en Rk+ o en Rk++ .
136 Capítulo 6. Aplicaciones del cálculo

Ejemplo 6.12 Determine el “tipo de convexidad” de las curvas de nivel de la función f : R2++ → R tal
que f (x, y) = −x2 − 4y2 + xy. A este respecto, es directo ver que
 
−2 1
H f (x, y) =
1 −8

por lo que f (x, y) es una función cóncava (determinante de la matriz de Hesse es positivo y H11 < 0),
de modo que las curvas de nivel son convexas. En este caso, no es necesario despejar “y” en función de
“x” e investigar el signo de la segunda derivada de y(x) para obtener el tipo de convexidad de la curva de
nivel: basta con saber que la función es cóncava para concluir que sus curvas de nivel son convexas. ■
Ejemplo 6.13 Definida en R2+ , determine el “tipo de convexidad” de las curvas de nivel de la función
f (x, y) = x2 + y2 . En este caso, ya que
 
2 0
H f (x, y) =
0 2

ocurre que f (x, y) es convexa, por lo que las curvas de nivel son cóncavas.
Si bien lo anterior es conclusivo respecto del tipo de convexidad - concavidad de la curva de nivel,
de manera complementaria haremos el ejercicio de estudiar la propiedad a partir de las derivadas de la
curva de nivel. Como la curva de nivel h > 0 cumple que (x debe estar entre 0 y h)
p 2x −x
x2 + y2 = h ⇒ y(x) = h − x2 ⇒ y′ (x) = − √ =√ ,
2 h − x2 h − x2
derivando nuevamente para estudiar la “convexidad-concavidad” se tiene que (recuerde que h > 0)
√ √ √ 
−x

′ − h − x 2 + x · √
( h − x2 ) · (−1) − (−x) · ( h − x2 ) h−x2 −h
y′′ (x) = √ = 2
= < 0.
( h − x2 )2 h−x (h − x2 )3/2

Como la segunda derivada de y(x) es negativa, ocurre que y(x) es cóncava, es decir, la curva de nivel es
cóncava. La siguiente figura es ilustrativa.

Figura 6.4: C URVA DE NIVEL h > 0 DE f (x, y) = x2 + y2

Obviamente que en este ejemplo resultó mucho más simple establecer la concavidad de la curva de
nivel usando la concavidad de la función que determinando la segunda derivada de la curva de nivel. ■
6.4 Máximos y mínimos de funciones de varias variables 137

Ejemplo 6.14 Estudiar el “tipo de concavidad - convexidad” de las curvas de nivel h > 0 de la función
f (x, y) = ey − ex . Para eso, ya que

−ex 0
 
H f (x, y) = ,
0 ey

ocurre que f (x, y) no es ni cóncava, ni convexa (un valor propio de H es negativo y el otro es positivo),
de modo que no podemos concluir la “forma” de las curvas de nivel a partir de las propiedades conocidas
(“función cóncava (convexa) implica curva de nivel convexa (cóncava”). Debemos entonces obtener la
segunda derivada de y(x). Para eso, la curva de nivel h > 0 cumple que

ey − ex = h ⇒ ey = e|x{z
+ h} ⇒ y(x) = ln(ex + h).
>0

Luego,

ex (ex + h) · (ex )′ − ex · (ex + h)′ h · ex


y′ (x) = ⇒ y′′ (x) = = > 0.
ex + h (ex + h)2 (ex + h)2

Así, para cualquier h > 0 ocurre que las curvas de nivel de f (x, y) = ey − ex son convexas. ■

Ejercicio 6.18
(a) Para f : R2++ → R tal que f (x, y) = x2 + 4y2 + 3xy,
1. explique por qué f (x, y) es convexa,
2. explique por qué las curvas de nivel h > 0 de f (x, y) son cóncavas.
(b) Para f : R2++ → R tal que f (x, y) = 5 − x2 − 4y2 ,
1. explique por qué f (x, y) es cóncava,
2. explique por qué las curvas de nivel h > 0 de f (x, y) son convexas.
(c) Para f : R2++ → R tal que f (x, y) = ln(x) + 3 ln(y),
1. explique por qué f (x, y) es cóncava.
2. explique por qué las curvas de nivel h > 0 de f (x, y) son convexas.

Ejercicio 6.19 Para la función f : R2++ → R tal que f (x, y) = x + ln(y),


(a) explique por qué esta función no es ni cóncava, ni convexa,
(b) muestre que la curva de nivel h es dada por y(x) = eh−x ,
(c) muestre que las curvas de nivel de la función f (x, y) = x + ln(y) son convexas.

Ejercicio 6.20 Muestre que las curvas de nivel h > 0de la función f : R2++ → R tal que f (x, y) =
x1/3 y2/3 son convexas. ■

6.4 Máximos y mínimos de funciones de varias variables


6.4.1 Puntos críticos
Para una función f : R → R, x̄ ∈ R es punto crítico (también llamado punto estacionario) de f (x) si
se cumple que f ′ (x̄) = 0. La extensión natural para funciones de varias variables es la siguiente.
138 Capítulo 6. Aplicaciones del cálculo

Definición 6.4 Dada f : Rk → R, un vector x̄ = (x̄1 , x̄2 , . . . , x̄k )t ∈ Rk es un punto crítico de f si

∇ f (x̄) = 0k ,
∂ f (x̄1 ,x̄2 ,...,x̄k )
es decir, si para todo i = 1, 2, . . . , k se cumple que ∂ xi = 0.

Sobre la base de lo anterior, obtener puntos críticos de funciones de varias variables requiere,
usualmente, resolver sistemas de ecuaciones, con ecuaciones no necesariamente lineales. De todas
maneras, lo usual será que esos sistemas de ecuaciones sean sencillos.
Ejemplo 6.15 Para f (x, y) = x2 + 3y2 + 4xy − x + y, los puntos críticos cumplen que

∂ f (x, y) ∂ f (x, y)
= 0, =0 ⇒ 2x + 4y − 1 = 0, 6y + 4x + 1 = 0.
∂x ∂y
Luego, para obtenerlos uno debe resolver el sistema de ecuaciones
2x + 4y = 1
4x + 6y = −1
Como sabemos, hay diversas maneras de resolver ese sistema de ecuaciones. Por ejemplo, usando la
regla de Cramer se tiene que
   
1 4 2 1
det det
−1 6 4 −1 10 5 −6 3
x=   , y=   ⇒ x= =− , y= = .
2 4 2 4 −4 2 −4 2
det det
4 6 4 6
t
Luego, el punto crítico de f (x, y) es el vector x̄ = − 52 , 32
∈ R2 . ■

Ejemplo 6.16 Dados r, w > 0 y f : R2++ → R tal que f (K, L) = K + ln(L) − r K − w L, encontremos
los puntos críticos de f (K, L). Para el caso, se tiene que
∂ f (K, L) 1 ∂ f (K, L) 1
= √ − r, = − w,
∂K 2 K ∂L L
de modo lo que los puntos críticos de f (K, L) cumplen que
1 1 1 1
√ = r, =w ⇒ K̄ = , L̄ = .
2 K L 4 r2 w
Note que evaluando la función f (K, L) en el punto crítico se tiene que
r  
1 1 1 1 1
f (K̄, L̄) = + ln −r 2 −w = − 1 − ln(w).
4 r2 w 4r w 4r

Ejemplo 6.17 Dada f : R2 → R tal que f (x, y) = exy , los puntos críticos de f (x, y) cumplen que
∂ f (x, y) ∂ f (x, y)
= 0, =0 ⇒ yexy = 0, xexy = 0.
∂x ∂y
Ya que las exponenciales nunca son cero, la solución del sistema anterior es cuando x = 0 e y = 0.
Por lo tanto, el único punto crítico de f (x, y) = exy es el vector x̄ = (0, 0)t ∈ R2 . ■
6.4 Máximos y mínimos de funciones de varias variables 139

Ejemplo 6.18 Dada f : R2++ → R tal que f (x, y) = x y − x − 2y, se tiene que

∂ f (x, y) √ ∂ f (x, y) x
= y − 1, = √ − 2,
∂x ∂y 2 y

por lo que los puntos críticos de f (x, y) cumplen que



y = 1 (6.3)

x
√ = 2 (6.4)
2 y
De esta manera, de la ecuación (6.3) se tiene que ȳ = 1, y eso en la ecuación (6.4) implica que x̄ = 4.

El punto crítico de f (x, y) = x y − x − 2y es el vector (4, 1)t ∈ R2 . ■

Ejemplo 6.19 Dadas las constantes α, β , w, r > 0, definamos la función f : R2++ → R tal que f (x, y) =
xα yβ − rx − wy. Las derivadas parciales de f (x, y) son

∂ f (x, y) ∂ f (x, y)
= αxα−1 yβ − r, = β xα yβ −1 − w,
∂x ∂y

por lo que los puntos críticos de f (x, y) cumplen que

(i) : αxα−1 yβ − r = 0 ⇒ αxα−1 yβ = r, (ii) : β xα yβ −1 − w = 0 ⇒ β xα yβ −1 = w.

Dividiendo la cantidad roja con la cantidad azul, los puntos críticos cumplen que

αxα−1 yβ r αy r βr
−1
= ⇒ = ⇒ y= x. (6.5)
βx y
α β w βx w αw

Usando esto último en la expresión roja (puede ser la azul si prefiere) se tiene que

βr
 β  −β ! α+β1 −1
y= αw x βr r βr
αxα−1 yβ = r =⇒ αxα−1 x =r ⇒ x̄ = .
αw α αw

Usando esto en la parte derecha de (6.5) se obtiene

 −α ! α+β1 −1
βr w αw
ȳ = x̄ ⇒ ȳ = .
αw β βr

Ejercicio 6.21 Encuentre los puntos críticos de las siguientes funciones:


(a) f : R2 → R tal que f (x1 , x2 ) = x12 − x22 − x1 x2 .
(b) dado α ∈]0, 1[, f : R2++ → R tal que f (K, L) = Lα + ln(K) − 2L − 4K.
(c) para a, b, c, w, r > 0, g : R2++ → R tal que g(x, y) = xa + eby − wx − ry.

(d) f : R2++ → R tal que f (x1 , x2 ) = x12 x2 − x1 − x2 .

140 Capítulo 6. Aplicaciones del cálculo

βr
Ejercicio 6.22 En el Ejemplo 6.19, reemplace y = αw x en la parte azul y compruebe que resultado
de x̄ y de ȳ que se obtiene con este reemplazo coincide con el mostrado en el ejemplo. ■

Ejercicio 6.23
(a) Encuentre el punto crítico de f : R2++ → R tal que f (x, y) = x1/2 y1/3 − x − 2y.
(b) Dados r, w > 0, encuentre el punto crítico de g : R2++ → R tal que g(x, y) = x1/2 y1/3 − r x − w y.
(c) Dados r, w > 0, encuentre el punto crítico de f : R2++ → R tal que f (K, L) = K 1/2 L2 −r K −w L.

Ejercicio 6.24
(a) Obtenga los puntos críticos de la función f : R2 → R tal que f (x, y) = 2x2 + xy + y2 − x − 2y.
2 2
(b) Obtenga los críticos de la función g : R2 → R tal que g(x, y) = e2x +xy+y −x−2y .
(c) Obtenga los críticos de la función h : R2 → R tal que g(x, y) = (2x2 + xy + y2 − x − 2y)3 .

Ejercicio 6.25 Dados w, r > 0, y dado α ∈]0, 1[,


(a) obtenga los puntos críticos de f : R2++ → R tal que f (x, y) = xα y − wx − ry,
(b) obtenga los puntos críticos de f : R2++ → R tal que f (x, y) = xα yα − wx − ry,
(c) obtenga los puntos críticos de f : R2++ → R tal que f (x, y) = xα y1−α − wx − ry. ¿Qué ocurre
en este caso?

6.4.2 Óptimos locales de funciones de varias variables


Recordemos que xm ∈ R es un punto donde la función f : R → R (una variable) tiene un mínimo local
si existe ε1 > 0 tal que para todo x ∈]xm − ε1 , xm + ε1 [ se cumple que

f (xm ) ≤ f (x),

mientras que xM ∈ R es un punto donde f tiene un máximo local si existe ε2 > 0 tal que para todo
x ∈]xM − ε2 , xM + ε2 [ se cumple que
f (x) ≤ f (xM ).
En otras palabras, en el punto xm ocurre que f tiene un mínimo local cuando en el entorno de dicho
punto ocurre que la función toma el valor más pequeño en dicho punto; por otro lado, en el punto xM
ocurre que f tiene un máximo local cuando en el entorno de dicho punto ocurre que la función toma el
valor más grande en dicho punto.
Como sabemos, una función f de una variable tiene mínimo local en xm ∈ R cuando f ′ (xm ) = 0
(condición de primer orden) y f ′′ (xm ) > 0 (condición de segundo orden), mientras que tiene máximo
local en xM ∈ R cuando f ′ (xM ) = 0 y f ′′ (xM ) < 0.
La extensión de lo anterior para funciones de varias variables es directo. Antes de explicar esas
condiciones, para f : Rk → R veamos qué se entiende por punto donde la función tiene máximo
(mínimo) local. Para ello, primero explicamos la idea de estar en “entorno a un punto” en el espacio.
Primero, dado un vector x∗ = (x1∗ , x2∗ , . . . , xk∗ )t ∈ Rk y dado ε > 0, los puntos x ∈ Rk que están a
una distancia menor que ε del punto x∗ son aquellos que cumplen

∥x∗ − x∥ < ε,
6.4 Máximos y mínimos de funciones de varias variables 141
q
donde ∥ · ∥ es la norma Euclidiana (es decir, para x = (x1 , x2 , . . . , xk )t ∈ Rk , ∥x∥ = x12 + x22 + · · · + xk2 ).
Segundo, desde un punto de vista geométrico, el conjunto de puntos x ∈ Rk tal que ∥x∗ − x∥ < ε
definen una bola abierta de radio ε y centro x∗ , que se representa como

B(x∗ , ε) = {x ∈ Rk : ∥x − x∗ ∥ < ε} ⊂ Rk .

Por ejemplo, cuando k = 1, la bola abierta de centro x∗ ∈ R y radio ε es el intervalo (en R la norma
Euclidiana se define por el valor absoluto)

B(x∗ , ε) = {x ∈ R : |x∗ − x| < ε} = ]x∗ − ε, x∗ + ε[,

mientras que si k = 2, la bola abierta B(x∗ , ε) es un círculo, sin el borde, cuyo centro x∗ y cuyo radio
es ε. La Figura 6.5 es ilustrativa.

Figura 6.5: B(x∗ , ε): BOLA ABIERTA DE CENTRO (x1∗ , x2∗ )t ∈ R2 Y RADIO ε

Usando lo anterior, de manera similar a lo que se tiene para funciones de una variable, se tiene la
siguiente definición.
Definición 6.5 Para f : Rk → R, se dice que xm ∈ Rk es un punto donde f tiene un mínimo local
si existe ε1 > 0 tal que para todo x ∈ B(x∗ , ε1 ) se cumple que

f (xm ) ≤ f (x).

Para f : Rk → R, se dice que xM ∈ Rk es un punto donde f tiene un máximo local si existe


ε2 > 0 tal que para todo x ∈ B(x∗ , ε2 ) se cumple que

f (x) ≤ f (xM ).

Siguiendo lo que se tiene para funciones de una variable, ocurre que f : Rk → R tiene un mínimo
local en xm ∈ Rk si en ese punto ocurre que la primera derivada de f es cero y si la segunda derivada
es “positiva”, mientras que f : Rk → R tiene un máximo local en xM ∈ Rk si en ese punto ocurre que
la primera derivada de f es cero y si la segunda derivada es “negativa” Ya que la primera derivada
de f es el gradiente y la segunda derivada es la matriz de Hesse de la función, tenemos entonces el
siguiente resultado.
142 Capítulo 6. Aplicaciones del cálculo

Proposición 6.4
(a) La función f : Rk → R tiene un mínimo local en xm ∈ Rk si se cumple que ∇ f (xm ) = 0k y si
además H f (xm ) es definida positiva.
(b) La función f : Rk → R tiene un máximo local en xM ∈ Rk si se cumple que ∇ f (xM ) = 0k y
si además H f (xM ) es definida negativa.

Importante 6.6 ¿Qué se puede decir si en un punto crítico ocurre que la matriz de Hesse no tiene
signo? Si esto ocurre es debido a que uno de los valores propios es negativo y el otro es positivo.
Visto geométricamente, es como si la función fuese convexa en una dirección y cóncava en otra,
de modo que en el punto crítico habría máximo local en cierta dirección y habría mínimo local
en otra dirección. Esos puntos se llaman puntos silla de la función, y en ellos no hay ni máximo
local ni mínimo local. La Figura 6.6 muestra que el el vector (0, 0) es punto silla de la función
f (x, y) = x2 − y2 − xy. En ese punto es como si hubiese un mínimo local en el eje X y máximo local
en el eje Y, aunque la función no tiene ni mínimo ni máximo local en él.

Figura 6.6: G RÁFICO DE f (x, y) = x2 − y2 − xy

Ejemplo 6.20 Para f : R2 → R tal que f (x, y) = x2 + 12 y2 + x − y, el punto crítico cumple que

∂ f (x, y) ∂ f (x, y) 1
= 2x + 1 = 0, = y−1 = 0 ⇒ x̄ = − , ȳ = 1.
∂x ∂y 2
Por otro lado, como la matriz de Hesse de f es
 
2 0
H f (x, y) = ,
0 1
ocurre que (la matriz de Hesse es constante)
 
2 0
H f (−1/2, 1) = .
0 1
Puesto que H f (−1/2, 1) es una matriz definida positiva (matriz diagonal de elementos mayor que
cero), en el punto  t
1
− , 1 ∈ R2
2
ocurre que la función f (x, y) = x2 + 12 y2 + x − y tiene un mínimo local. ■
6.4 Máximos y mínimos de funciones de varias variables 143

Ejemplo 6.21 Para la función f : R2 → R tal que f (x1 , x2 ) = x12 + 12 x22 + 2x1 x2 + x1 − 2x2 , el punto
crítico cumple que
∂ f (x1 , x2 ) ∂ f (x1 , x2 )
= 2x1 + 2x2 + 1 = 0, = x2 + 2x1 − 2 = 0,
∂ x1 ∂ x2
es decir, la solución del sistema de ecuaciones
2x1 + 2x2 = −1
2x1 + x2 = 2
De esta manera, el punto crítico tiene componentes
   
−1 2 2 −1
det det
2 1 5 2 2
x̄1 =   = ∧ x̄2 =   = −3.
2 2 2 2 2
det det
2 1 2 1
 
2 2
Como H f (x1 , x2 ) = , se tiene que det(H f (x1 , x2 )) = −2, por lo que H f (x1 , x2 ) no tiene signo
2 1
(si el determinante es negativo, uno de los valores propios es positivo y el otro es negativo). Por lo
tanto, la función no tiene ni máximo, ni mínimo local en el punto crítico (es un punto silla). ■

Ejemplo 6.22 Dado β ∈ R,β ̸= 21 , definamos la función f : R2 → R tal que

β 2
f (x1 , x2 ) = x12 + x + x1 x2 + x1 − x2 .
2 2
El punto crítico de f (x1 , x2 ) cumple que
∂ f (x1 , x2 ) ∂ f (x1 , x2 )
= 2x1 + x2 + 1 = 0, = β x2 + x1 − 1 = 0,
∂ x1 ∂ x2
es decir, es la solución del sistema de ecuaciones
2x1 + x2 = −1
x1 + β x2 = 1,
por lo que (la solución existe pues β ̸= 1/2)
   
−1 1 2 −1
det det
1 β 1+β 1 1 3
x̄1 =   =− , x̄2 =   = .
2 1 2β − 1 2 1 2β − 1
det det
1 β 1 β
Por otro lado, como (matriz de Hesse es constante)
   
2 1 2 1
H f (x1 , x2 ) = ⇒ H f (x̄1 , x̄2 ) = .
1 β 1 β

Ya que H11 = 2 > 0 y det(H f (x̄1 , x̄2 )) = 2β − 1, se concluye entonces que si 2β − 1 > 0, es decir, β > 12 ,
entonces H f (x̄1 , x̄2 ) es definida positiva, en cuyo caso la función f (x1 , x2 ) = x12 + β2 x22 + x1 x2 + x1 − x2
tiene mínimo local en  
1+β 3
(x̄1 , x̄2 ) = − , .
2β − 1 2β − 1
144 Capítulo 6. Aplicaciones del cálculo

Note que si β < 1/2 entonces el determinante de la matriz de Hesse es negativo, por lo que, bajo
ese caso, ocurre que la función no tiene ni máximo, ni mínimo local en el punto crítico. De esta manera,
cuando β < 1/2 ocurre que(x̄1 , x̄2 ) anterior es un punto silla). ■

Ejemplo 6.23 Dados p, α, r, w > 0, definamos f : R2++ → R tal que



f (K, L) = p K + α ln(L) − rK − wL.

Como
∂ f (K, L) p ∂ f (K, L) α
= √ − r, = − w,
∂K 2 K ∂L L
el punto crítico de f (k, L) cumple que

p α p2 α
√ = r, =w ⇒ K̄ = , L̄ = .
2 K L 4r2 w
Por otro lado, ya que

∂ f (K, L) p ∂ 2 f (K, L) p ∂ 2 f (K, L)


= √ −r ⇒ = − 3/2 , = 0,
∂K 2 K ∂ K∂ K 4K ∂ L∂ K
y además
∂ f (K, L) α ∂ 2 f (K, L) α ∂ 2 f (K, L)
= −w ⇒ = − 2, = 0,
∂L L ∂ L∂ L L ∂ K∂ L
se tiene que
− 4Kp3/2
 
0
H f (K, L) =   ∈ R2×2 .
0 − Lα2
Como H f (K, L) es una matriz diagonal de elementos negativos entonces es definida negativa, indepen-
2
diente del valor de K y de L. Por lo tanto, en K̄ = 4rp 2 , L̄ = αw ocurre que f (K, L) tiene máximo local.

Ejemplo 6.24 Dados r, w > 0 y α > 1, definamos f : R2++ → R tal que

f (K, L) = K α + L2 − rK − wL.
∂ f (K,L) ∂ f (K,L)
Como ∂K = αK α−1 − r y ∂L = 2L − w, el punto crítico de f (k, L) cumple que
1
 r  α−1 w
αK α−1 = r, 2L = w ⇒ K̄ = , L̄ = .
α 2
Por otro lado, ya que

∂ f (K, L) ∂ 2 f (K, L) ∂ 2 f (K, L)


= αK α−1 − r ⇒ = α(α − 1)K α−2 , = 0,
∂K ∂ K∂ K ∂ L∂ K
y además
∂ f (K, L) ∂ 2 f (K, L) ∂ 2 f (K, L)
= 2L − w ⇒ = 2, = 0,
∂L ∂ L∂ L ∂ K∂ L
se tiene que  
α(α − 1)K α−2 0
H f (K, L) = ∈ R2×2 .
0 2
6.4 Máximos y mínimos de funciones de varias variables 145

Como H f (K, L) es una matriz diagonal de elementos positivos (α > 1) entonces es definida positiva,
independiente del valor de K y de L. Por lo tanto, f (K, L) tiene mínimo local en el punto crítico (K̄, L̄)
que hemos encontrado.
Note que si α ∈]0, 1[, entonces det(H f (K, L)) = 2 · α(α − 1)K α−2 < 0. Por lo tanto, ya que el
determinante es negativo ocurre que la función f (K, L) tiene punto silla en el K̄, L̄ (en el punto crítico
no hay máximo ni mínimo local para la función). ■

Ejemplo 6.25 Para f (x, y) = exy se tiene que

∂ f (x, y) ∂ f (x, y)
= yexy , = xexy ,
∂x ∂y

por lo que el punto crítico de f (x, y) es (0, 0)t ∈ R2 . Por otro lado, como

∂ f (x, y) ∂ f (x, y) ∂ f (x, y)


= y2 exy , = x2 exy , = exy + xyexy ,
∂ x∂ x ∂ y∂ y ∂ y∂ x
tenemos
y2 exy exy + xyexy
   
0 1
H f (x, y) = xy ⇒ Hg (0, 0) = .
e + xye xy x2 exy 1 0
Como H f (0, 0) no tiene signo (determinante negativo), en el punto crítico no hay ni máximo, ni
mínimo local. De hecho, el punto crítico es un punto silla. La Figura 6.7 es ilustrativa.

Figura 6.7: G RÁFICO DE f (x, y) = exy

Ejercicio 6.26 Para las siguientes funciones, encuentre los puntos críticos, e informe si en ellos hay
máximo local, mínimo local o punto silla.
(a) f : R2 → R tal que f (x, y) = x2 − y2 + x + 2y.
(b) f : R2 → R tal que f (x, y) = x2 + y2 − 13 xy − x − y.
(c) f : R2 → R tal que f (x, y) = x2 + 6y2 + 4xy + 2y − 5.

Ejercicio 6.27 Para las siguientes funciones, encuentre los puntos críticos, e informe si en ellos hay
máximo local, mínimo local o punto silla.
(a) f : R2++ → R tal que f (x, y) = x1/2 y1/3 − x − 2y.
(b) f : R2++ → R tal que f (x, y) = x2 y3 − x − y.
(c) f : R2++ → R tal que f (x, y) = xy − x − y.

146 Capítulo 6. Aplicaciones del cálculo

Ejercicio 6.28 Para las siguientes funciones, encuentre los puntos críticos, e informe si en ellos hay
máximo local, mínimo local o punto silla.
2
(a) f : R2 → R tal que f (x, y) = 1+x
1+y2
.
1−x2
(b) f : R2 → R tal que f (x, y) = 1+y2
.

Ejercicio 6.29 Dadas constantes w, r > 0 y α, β > 0, para las siguientes funciones, encuentre los
puntos críticos, e informe si en ellos hay máximo local, mínimo local o punto silla.
(a) f : R2 → R tal que f (x, y) = αx√2 + β ey − rx − wy.
(b) f : R2++ → R tal que f (x, y) = x + 1 + β ln(y + 2) − x − wy.
(c) f : R2++ → R tal que f (x, y) = xα + yβ − wx − ry.
(d) f : R2++ → R tal que f (x, y) = xα − yβ − wx − ry.

6.4.3 Óptimos globales de funciones de varias variables


Definición 6.6 Para f : Rk → R (pudiendo ser otro dominio), se dice que xm ∈ Rk minimiza
globalmente a la función (o, de manera equivalente, que f tiene mínimo global en xm ) si para
todo x ∈ Rk se cumple que
f (xm ) ≤ f (x).
Por otro lado, se dice que xM ∈ Rk maximiza globalmente a la función (o, de manera equiva-
lente, que f tiene máximo global en xM ) si para todo x ∈ Rk se cumple que

f (x) ≤ f (xM ).

La diferencia entre un punto que minimiza localmente y un punto que minimiza globalmente a
una función es que con el primero ocurre que la función toma el mínimo valor en un entorno del punto
en cuestión, mientras que con el segundo ocurre que la función alcanza el mínimo valor en todo el
dominio. Similar para distinguir en un punto que maximiza localmente versus un punto que maximiza
globalmente a una función.

N Un hecho relevante a considerar es que una función puede tener puntos donde se minimiza
localmente, pero no necesariamente donde se minimiza globalmente (mismo con máximos). Por
ejemplo (caso una variable) la función f (x) = x3 − 2x2 + 1 es tal que

f ′ (x) = 3x2 − 4x, f ′′ (x) = 6x − 4.

Luego, sus puntos críticos son

4
x1 = , x2 = 0.
3

Como f ′′ (x1 ) = 4, en x1 hay un mínimo local. Sin embargo, notamos que cuando x → −∞
ocurre que f (x) → −∞, de modo que no hay un punto donde f (x) se minimice globalmente.
Informalmente, el valor mínimo que puede tomar la función es −∞, y ese se alcanza cuando
“x = −∞”, es decir, no existe un punto que la minimice de manera global. El gráfico a continuación
es ilustrativo.
6.4 Máximos y mínimos de funciones de varias variables 147

Figura 6.8: Ó PTIMOS LOCALES DE f (x) = x3 − 2x2 + 1

Las condiciones de optimalidad que teníamos para encontrar puntos donde hay máximos o mínimos
locales, no necesariamente aplican para obtener óptimos globales. Sin embargo, a pesar de esto, hay un
resultado sencillo que nos permite caracterizar (si es que existen) puntos que maximizan o minimizan
globalmente a una función. La clave para este resultado es la concavidad o convexidad de la función.

Proposición 6.5 Dada f : Rk → R, se tiene que:


(a) Si f es convexa (o bien es cóncava), entonces tiene, a lo más, un único punto crítico.
(b) Si f es convexa y xm ∈ Rk es un punto crítico de f entonces xm es un punto donde f tiene un
mínimo global, es decir, para todo x ∈ Rk se cumple que f (xm ) ≤ f (x).
(c) Si f es cóncava y xM ∈ Rk es un punto crítico de f , entonces xM es un punto donde f tiene
un máximo global, es decir, para todo x ∈ R se cumple que f (x) ≤ f (xM ).

Algunos comentarios sobre lo anterior:


(a) La proposición anterior no dice que una función convexa (cóncava) debe tener puntos críticos;
dice que si lo tiene, entonces es único. Por ejemplo, la función f (x, y) = ex ey no tiene puntos
críticos, a pesar de que es convexa.
(b) Cuando la función es convexa, el punto crítico (si lo hay) minimiza globalmente a la función.
(c) Cuando la función es cóncava, el punto crítico (si lo hay) maximiza globalmente a la función.
Ejemplo 6.26 Expliquemos por qué las funciones que son formas cuadráticas con matriz definida
positiva se minimizan globalmente en (0, 0), es decir, en (0, 0) esasfunciones
 alcanzan el menor valor
a b
posible en todo R2 . En efecto, dado x = (x1 , x2 )t ∈ R2 y dada A = una matriz definida positiva,
b c
para
f (x) = xAxt = ax12 + 2bx1 x2 + cx22
se tiene que

∇ f (x1 , x2 ) = (2ax1 + 2bx2 , 2bx1 + 2cx2 )t ∈ R2 , H f (x1 , x2 ) = 2A ∈ R2×2 .


Resolviendo el sistema
2ax1 + 2bx2 = 0
2bx1 + 2cx2 = 0
se obtiene fácilmente que x1 = 0 y que x2 = 0, de modo que (0, 0) es el (único) punto crítico de f (x1 , x2 ).
Como H f (x1 , x2 ) = 2A, por hipótesis tenemos que H f (x1 , x2 ) es definida positiva, por lo que la función
es convexa. Luego, en (0, 0) hay un mínimo global de la función. ■
148 Capítulo 6. Aplicaciones del cálculo

Ejemplo 6.27 Dado r > 0, encontremos el punto crítico de f : R2++ → R tal que

f (x, y) = x1/4 y1/2 − x − 2y,


∂ f (x,y)
y veamos si en él hay máximo o mínimo global. Para esto, como ∂x = 41 x−3/4 y1/2 − 1, y además
∂ f (x,y)
∂y = 12 x1/4 y−1/2 − 2, el punto crítico cumple que

1 1
(i) : x−3/4 y1/2 = 1, (ii) : x1/4 y−1/2 = 2.
4 2
Para resolver este sistema, dividiendo ambos lados de (i) con aquellos de (ii) se tiene que
1 −3/4 1/2
4x y 1 1/4 y 1
1 1/4 −1/2
= ⇒ = ⇒ y = x.
2x y 2 1/2 x 2

Reemplazando esta igualdad en (i) se obtiene el punto crítico que buscamos:


1 −3/4 1/2 y=x 1 −3/4 1/2 1 −1/4 1
x y =1 =⇒ x (x) = 1 ⇒ x =1 ⇒ x̄ = ȳ = .
4 4 4 44
Por otro lado, ya que

∂ 2 f (x, y) 3 ∂ 2 f (x, y) ∂ 2 f (x, y) 1 −3/4 −1/2 ∂ 2 f (x, y) 1


= − x−7/4 y1/2 , = = x y , = − x1/4 y−3/2 ,
∂ x∂ x 16 ∂ y∂ x ∂ x∂ y 8 ∂ y∂ y 4
tenemos
3 −7/4 1/2 1 −3/4 −1/2
 
− 16 x y 8x y
H f (x, y) =  .
1 −3/4 −1/2
8x y − 41 x1/4 y−3/2
Como x > 0, y > 0, se tiene que
3 −7/4 1/2
H11 = − x y < 0.
16
Por otro lado, el determinante de la matriz de Hesse de f cumple que

1 −3/4 −1/2 2
     
3 1
det(H f (x, y)) = − x−7/4 y1/2 · − x1/4 y−3/2 − x y
16 4 8
3 −6/4 −1 1 −6/4 −1
= x y − x y
64 64
1 −3/2 −1
= x y .
32
De esta manera det(H f (x, y)) > 0, lo que junto al hecho que H11 < 0 implican que f (x, y) = x1/4 y1/2 −
x − 2y es cóncava. Así, en x̄ = 414 , ȳ = 414 ocurre que la función f (x, y) tiene un máximo global, es
decir, para todo x > 0, y > 0 se cumple que
 
1/4 1/2 1 1
x y − x − 2y ≤ f , .
44 44

6.4 Máximos y mínimos de funciones de varias variables 149

N En el Ejemplo 6.10 se probó que la función g(x, y) = xα yβ es cóncava cuando 0 < α + β < 1. A
partir de este hecho, es fácil ver que para cualquier par de constantes a, b ∈ R, la función

h(x, y) = xα yβ + ax + by
es cóncava cuando 0 < α + β < 1. Este es precisamente el caso de la función f (x, y) que se
estudió en el ejemplo anterior: α = 1/4, β = 1/2, a = −1 y b = −2.

Ejercicio 6.30
(a) Para f (x, y) = x2 + 5y2 + xy − x − 3y se pide:
1. Encuentre el punto crítico de la función.
2. Muestre que en el punto crítico la función tiene un mínimo global.
3. Encuentre el mínimo valor que alcanza la función en su dominio.
(b) Para f (x, y) = 2x + 3y − x2 − 5y2 − 2xy se pide:
1. Encuentre el punto crítico de la función.
2. Muestre que en el punto crítico la función tiene un máximo global.
3. Encuentre el máximo valor que alcanza la función en su dominio.

Ejercicio 6.31
(a) Para f : R2++ → R tal que f (x, y) = ln(x) + 3 ln(y) − 4x − 6y se pide:
1. Encuentre el punto crítico de la función.
2. Muestre que en el punto crítico la función tiene un máximo global.
3. Encuentre el máximo valor que alcanza la función en su dominio.
(b) Para f : R2++ → R tal que f (x, y) = x1/3 + y1/2 − 6x − 4y se pide:
1. Encuentre el punto crítico de la función.
2. Muestre que en el punto crítico la función tiene un máximo global.
3. Encuentre el máximo valor que alcanza la función en su dominio.
(c) Para f : R2++ → R tal que f (x, y) = x1/3 · y1/6 − x − 2y se pide:
1. Encuentre el punto crítico de la función.
2. Muestre que en el punto crítico la función tiene un máximo global.
3. Encuentre el máximo valor que alcanza la función en su dominio.

Suponga ahora que f : Rk → R tiene un máximo global en xM ∈ Rk , y suponga que g : R → R es


una función creciente. Ya que para todo x ∈ Rk se cumple que f (x) ≤ f (xM ), como g es creciente se
tiene que para todo x se cumple que
g( f (x)) ≤ g( f (xM )),
es decir, xM es un punto donde g ◦ f : Rk → R tiene un máximo global. De manera análoga, si g es
creciente y xM es un punto donde g( f (x)) tiene un máximo global, entonces xM es un punto donde f
tiene un máximo global. En resumen:

Importante 6.7 Suponga que g : R → R creciente. Se tiene entonces que


(a) f : Rk → R tiene máximo global en xM ∈ Rk sí y solo sí la función g( f (x)) tiene máximo
global en xM .
(b) f : Rk → R tiene mínimo global en xm ∈ Rk sí y solo sí la función g( f (x)) tiene mínimo
global en xm .

Un ejemplo es ilustrativo para mostrar la relevancia de lo anterior.


150 Capítulo 6. Aplicaciones del cálculo
2 2
Ejemplo 6.28 Considere f (x, y) = e−x −y . Se tiene que
∂ f (x, y) 2 2 ∂ f (x, y) 2 2
= −2xe−x −y , = −2ye−x −y ,
∂x ∂y
por lo que el punto crítico de f (x, y) es el vector
(0, 0)t ∈ R2 .
Por otro lado, para obtener la matriz de Hesse de f (x, y) se tiene:
∂ 2 f (x, y) 2 2 2 2 ∂ 2 f (x, y) 2 2 ∂ 2 f (x, y) 2 2 2 2
= 4x2 e−x −y − 2 e−x −y , = 4xy e−x −y , = 4y2 e−x −y − 2 e−x −y ,
∂ x∂ x ∂ x∂ y ∂ y∂ y
por lo que
2 −y2 2 −y2 2 −y2
4x2 e−x − 2 e−x 4xy e−x (4x2 − 2)
   
4xy
−x2 −y2
H f (x, y) =  =e  .
2
4xy e−x −y
2 2
4y2 e−x −y
2 2
− 2 e−x −y
2
4xy (4y2 − 2)
2 2
Sobre la base de lo anterior, ya que e−x −y > 0, el signo del determinante de la matriz de Hesse lo
“manda” el determinante de la matriz a la derecha:
(4x2 − 2) · (4y2 − 2) − (4xy)2 = 16x2 y2 − 8x2 − 8y2 − 16x2 y2 + 4 = −8(x2 + y2 ) + 4.
Luego, ya que el determinante de la matriz de Hesse puede ser negativo o positivo dependiendo de los
valores de x e y (por ejemplo, si x = y = 0 el determinante es positivo, pero si x = y = 1 es negativo),
2 2
ocurre que la función f (x, y) = e−x −y no es ni cóncava, ni convexa. Por lo tanto, a partir de lo expuesto
no podemos concluir que el punto crítico maximiza o minimiza a la función bajo análisis.
A pesar de lo anterior, notamos que h(x, y) = −x2 − y2 es cóncava, por lo que (0, 0) maximiza
globalmente a la función h(x, y). Como
f (x, y) = eh(x,y) ,
del hecho que g(x) = ex es creciente tenemos que (0, 0) maximiza globalmente la función f (x, y). Es
2 2
decir, a pesar de que f (x, y) = e−x −y no es ni cóncava ni convexa, como f (x, y) es la composición
de una función creciente, g(x) = ex , con la función cóncava h(x, y) = −x2 − y2 , como el punto (0, 0)
maximiza globalmente h(x, y), entonces maximiza globalmente la función f (x, y). ■

Ejemplo 6.29 Encontrar el punto donde se minimiza globalmente a la función

f (x, y) = ln(2x2 + 4y2 + 3xy + 8)


es equivalente a encontrar el punto donde se minimiza globalmente la función
g(x, y) = 2x2 + 4y2 + 3xy + 8,
eso pues f (x, y) = ln(g(x, y)), siendo ln(x) creciente. Para el caso, como g(x, y) es convexa (forma
cuadrática con matriz definida positiva), ocurre que el punto crítico de esta función es aquel donde se
minimiza globalmente. Este se obtiene de la identidad ∇g(x, y) = 02 , es decir, resolviendo el sistema
de ecuaciones
4x + 3y = 0
3x + 8y = 0
La solución de lo anterior es x̄ = 0 e ȳ = 0. En síntesis, la función f (x, y) = ln(2x2 + 4y2 + 3xy + 8) se
minimiza globalmente en el origen, y el valor de dicho mínimo es ln(8). ■
6.5 Problema de optimización con restricción lineal 151

Ejercicio 6.32 Encontrar el punto donde


2 +3y2 +xy+3x−2y
f (x, y) = ex

tiene mínimo global. Justifique su respuesta. ■

p
Ejercicio 6.33 Encontrar el punto donde f (x, y) = x2 + 3y2 + 12 tiene mínimo global. Justifique
su respuesta. ■

 
a b
Ejercicio 6.34 Suponga que A = ∈ R2×2 es una matriz definida positiva y que µ =
b c
(µ1 , µ2 )t ∈ R2 es un vector dado. Para x = (x1 , x2 )t ∈ R2 definamos
t
f (x) = e−(x−µ) A(x−µ) .
(a) Encuentre la expresión de la función f (x) en términos de x1 y x2 .
(b) Explique por qué
g(x1 , x2 ) = −(x − µ)t A(x − µ)
es cóncava. Concluya que g(x1 , x2 ) tiene mínimo global en x1 = µ1 , x2 = µ2 .
t
(c) Explique por qué f (x) = e−(x−µ) A(x−µ) tiene mínimo global en x̄ = µ.

Ejercicio 6.35 Dados α, β ∈]0, 1[ y dados p, q > 0, considere f : R2+ → R tal que
α +yβ −px−qy
f (x, y) = ex .

1. Encuentre el punto crítico de g(x, y) = xα + yβ − px − qy, que denotará como x̄, ȳ.
2. Muestre que g(x, y) = xα + yβ − px − qy es cóncava.
3. Explique por qué f (x, y) tiene mínimo global en x̄, ȳ.

6.5 Problema de optimización con restricción lineal


En lo que sigue, sin pérdida de generalidad asumimos que el dominio de las funciones que se analizan
es R2+ , es decir, reales no negativos. Ese será el caso para la mayoría de los problemas de optimización
que Ud. abordará en cursos posteriores.
El objetivo de lo siguiente es encontrar máximos (o mínimos) de una función f : R2+ → R, llamada
función objetivo, pero donde se asume que las variables cumplen una restricción lineal. Formalmente,
dados p, q, r ∈ R++ ciertos parámetros, supondremos que las variables x1 , x2 ≥ 0 cumplen la siguiente
restricción:
p r
px1 + qx2 = r ⇐⇒ x2 = − x1 + .
q q
Con esto, el conjunto de los puntos factibles para el análisis que nos interesa es dado por los vectores
(x1 , x2 )t ∈ R2+ que cumplen la restricción recién indicada. Desde un punto de vista geométrico, el
conjunto de los puntos factibles (es decir, que cumplen la restricción) es un trazo recto que en el
sistema coordenado X1 − X2 es definido por las componentes mayores o iguales a cero que están en la
152 Capítulo 6. Aplicaciones del cálculo

recta anterior. La siguiente figura es ilustrativa.

Figura 6.9: C ONJUNTO DE PUNTOS FACTIBLES : {(x1 , x2 )t ∈ R2+ : px1 + qx2 = r}

Desde un punto de vista geométrico, el gráfico de f (x1 , x2 ) es una superficie en el espacio. Con
esto, los puntos en el conjunto factible inducen una curva en el espacio, que yace sobre la superficie
que corresponde al gráfico de la función. Esta se muestra como la curva azul en la Figura 6.10.

Figura 6.10: C URVA EN EL ESPACIO QUE INDUCE EL CONJUNTO A SOBRE EL GRÁFICO DE f (x1 , x2 )

La pregunta es entonces: ¿cuál es el punto del conjunto factible donde la curva azul tiene la mayor
altura? La Figura 6.11 muestra dicho punto: en (x̄1 , x̄2 ) ocurre que la curva azul tiene la “mayor altura”
posible.

Figura 6.11: (x̄1 , x̄2 ): PUNTO DONDE LA CURVA AZUL TIENE LA MAYOR ALTURA

Visto de otra manera: el punto factible (x̄1 , x̄2 ) (es decir, que está en el trazo rojo) es aquel donde
la función objetivo f (x1 , x2 ) alcanza el mayor valor posible. Esto se resume diciendo que (x̄1 , x̄2 )
6.5 Problema de optimización con restricción lineal 153

resuelve el siguiente problema de optimización:

max f (x1 , x2 )
s.a px1 + px2 = r.

Resolver el problema anterior consiste en encontrar las variables x̄1 y x̄2 que hacen máxima a
la función, bajo la condición de que cumplen la (restricción) lineal que se ha indicado. En lo que
sigue presentaremos una estrategia general que nos ayudará a encontrar la solución del problema de
optimización.

Primero, cualquiera que sea la solución del problema, esta debe yacer en la recta roja de la Figura
6.9, es decir, si la solución es x̄1 , x̄2 , se debe cumplir que

px̄1 + qx̄2 = r.

Segundo, suponiendo que las curvas de nivel de la función objetivo son convexas, consideremos una
curva de nivel h1 como en la Figura 6.12. El hecho que los puntos de la curva de nivel h1 en la Figura
6.12 están arriba de la recta roja informa que ningún punto de esa curva de nivel es factible, es decir,
la solución no yace en la curva de nivel h1 .

Figura 6.12: C ONJUNTO DE PUNTOS FACTIBLES Y CURVA DE NIVEL h1

Sobre la base de lo expuesto, para h2 con h2 < h1 , la curva de nivel h2 se desplaza hacia abajo de
la curva de nivel h1 . Si persiste el hecho que esta nueva curva está arriba de la recta roja, entonces la
solución que buscamos no está en ella, y debemos continuar bajando el nivel.

La pregunta es entonces, ¿qué nivel es el mayor posible de modo que en la curva del nivel
correspondiente haya puntos en la recta roja? La respuesta es que esa curva de nivel debe ser tangente
a la recta roja. Con esto, el correspondiente punto de tangencia es la solución del problema. En
efecto, ese punto (de tangencia) es, primero que todo, factible (está en la recta roja). Segundo, por lo
anterior, el óptimo que buscamos no puede pertenecer a una curva de nivel que esté sobre la recta roja,
la restricción del problema. Tercero, si el punto óptimo perteneciese a una curva de nivel que está bajo
la curva tangente, entonces la función no se estaría maximizando en él, ya que hay otro punto factible
(aquel en curva tangente) donde la función alcanza mayor valor. Luego, la única opción que queda es
el punto donde hay tangencia entre la curva de nivel y la recta que define la restricción del problema.

La siguiente figura es ilustrativa sobre lo anterior. Ella informa que el punto x̄1 , x̄2 que maximiza la
función objetivo sujeto a la restricción es aquel donde hay tangencia entre la curva de nivel, que pasa
por ese punto, y la recta que define la restricción del problema.
154 Capítulo 6. Aplicaciones del cálculo

Figura 6.13: (x̄1 , x̄2 ) MAXIMIZA LA FUNCIÓN f (x1 , x2 ) EN LA RECTA ROJA

Desde un punto de vista algebraico, la condición de tangencia que se ha indicado corresponde a


decir que la derivada de la curva de nivel, evaluada en la solución del problema, debe ser igual a la
pendiente de la recta roja. Por lo visto en la Sección 5.4.2, la derivada de la curva de nivel en el punto
x̄1 , x̄2 es igual a
∂ f (x̄1 ,x̄2 )
∂x
− ∂ f (x̄ 1,x̄ ) ,
1 2
∂ x2
mientras que la pendiente de la recta roja es − qp . Por lo
tanto, la condición de tangencia que se ha
indicado corresponde a decir que en la solución del problema se cumple que
∂ f (x̄1 ,x̄2 ) ∂ f (x̄1 ,x̄2 )
∂x p ∂ x1 p
− ∂ f (x̄ 1,x̄ =− ⇐⇒ = .
1 2) q ∂ f (x̄1 ,x̄2 ) q
∂ x2 ∂ x2
El hecho clave para aplicar las condiciones de tangencia con el fin de determinar la solución del
problema es que las curvas de nivel de la función objetivo son convexas, y esto se garantiza cuando
dicha función es cóncava (o cuasicóncava) y creciente por componentes. Sobre esto último, los
dominios que se consideran usualmente son tal que la función objetivo es creciente por componentes,
de modo que, en definitiva, lo relevante resulta ser la concavidad (cuasiconcavidad) de la función
objetivo. La siguiente proposición resume todo lo expuesto.

Proposición 6.6 Para el problema de maximización

max f (x1 , x2 )
s.a px1 + qx2 = r.

ocurre que si f (x1 , x2 ) es cóncava (o cuasicóncava) entonces la solución se obtiene a partir de las
siguientes condiciones:

px1 + qx2 = r (6.6)

∂ f (x1 ,x2 )
∂ x1 p
∂ f (x1 ,x2 )
= (6.7)
q
∂ x2

Estas condiciones siguen aplicando para resolver el problema de minimización cuando la función
f (x1 , x2 ) es convexa.

Las condiciones (6.6) – (6.7) definen un sistema de ecuaciones, cuya solución resuelve el problema
de optimización.
6.5 Problema de optimización con restricción lineal 155

Ejemplo 6.30 Se pide resolver el problema de optimización

max x + 2y + xy − x2 − 3y2 .
s.a ax + by = c.

Ya que se trata de un problema de maximización, con el fin de aplicar las condiciones de la Proposición
6.6 debemos establecer, en primer lugar, si la función objetivo f (x, y) = x + 2y + xy − x2 − 3y2 es
cóncava (o bien, según el caso, si las curvas de nivel son convexas). Partamos por estudiar la
concavidad; si esto se cumple no es necesario investigar la “forma” de las curvas de nivel. Se tiene
entonces que:
∂ f (x, y) ∂ f (x, y)
= 1 + y − 2x, = 2 + x − 6y,
∂x ∂y
a partir de lo cual es directo que
 
−2 1
H f (x, y) = ∈ R2×2 .
1 −6

Como H11 = −2 < 0 y det(H f (x, y)) = 11 > 0, ocurre que H f (x, y) es definida negativa, por lo que
f (x, y) es cóncava. Así, por la Proposición 6.6 tenemos que la solución del problema es la solución del
sistema de ecuaciones

ax + by = c (6.8)
∂ f (x,y)
∂x a
∂ f (x,y)
= (6.9)
b
∂y

La ecuación (6.9) corresponde a

1 + y − 2x a 2a a 6a
= ⇒ 1 + y − 2x = + x− y ⇒ (−a − 2b)x + (6a + b)y = (2a − b).
2 + x − 6y b b b b

Luego, la solución del problema es la solución del sistema lineal

ax + by = c
(−a − 2b)x + (6a + b)y = (2a − b)

Usando regla de Cramer, el máximo de f (x, y) se tiene en el punto x̄, ȳ tal que
 
c b
det
2a − b 6a + b c · (6a + b) − b · (2a − b)
x̄ =  =
a b a · (6a + b) + b · (a + 2b)
det
−a − 2b 6a + b
 
a c
det
−a − 2b 2a − b a · (2a − b) + c · (a + 2b)
ȳ =  =
a b a · (6a + b) + b · (a + 2b)
det
−a − 2b 6a + b

156 Capítulo 6. Aplicaciones del cálculo

Ejemplo 6.31 Dado p, r > 0, resolver el siguiente problema de optimización:

min x + xy + x2 + 2y2 .
s.a x + py = r.
Ya que se trata de un problema de minimización, para aplicar las condiciones de la Proposición 6.6
debemos establecer si la función objetivo f (x, y) = x + xy + x2 + 2y2 es convexa (o bien si las curvas
de nivel son cóncavas). Para el caso, se tiene que
 
∂ f (x, y) ∂ f (x, y) 2 1
= 1 + y + 2x, = x + 4y ⇒ H f (x, y) = .
∂x ∂y 1 4
Como H11 > 0 y det(H f (x, y)) = 7, la matriz de Hesse de la función objetivo es definida positiva,
por lo que f (x, y) es convexa. Por este hecho, las condiciones de la Proposición 6.6 aplican para
minimizar la función objetivo. La solución del problema cumple que
x + py = r (6.10)
∂ f (x,y)
∂x 1
∂ f (x,y)
= (6.11)
p
∂y

La condición (6.11) corresponde a


1 + y + 2x 1
= ⇒ p + py + 2px = x + 4y ⇒ (1 − 2p)x + (4 − p)y = p,
x + 4y p
por lo que la solución del problema de optimización satisface el siguiente sistema de ecuaciones:
x + py = r
(1 − 2p)x + (4 − p)y = p
Usando la regla de Cramer, la solución del problema es
 
r p
det
p 4− p 4r − pr − p2 4r − pr − p2
x̄ = = = .
(4 − p) − p · (1 − 2p) 4 − 2p + 2p2

1 p
det
(1 − 2p) (4 − p)
 
1 r
det
(1 − 2p) p p − r + 2pr
ȳ = = .
4 − 2p + 2p2

1 p
det
(1 − 2p) (4 − p)

Ejemplo 6.32 Resolver el siguiente problema de optimización:

max ex y2
s.a x + 2y = 3.
Ya que se trata de un problema de maximización, para aplicar las condiciones de la Proposición 6.6
la función objetivo f (x, y) = ex y2 debe ser cóncava, o bien sus curvas de nivel deben ser convexas.
Ya que  x 2
e y 2yex

∂ f (x, y) ∂ f (x, y)
= ex y2 , = 2yex ⇒ H f (x, y) = .
∂x ∂y 2yex 2ex
6.5 Problema de optimización con restricción lineal 157

Puesto que H11 = ex y2 > 0 y

det(H f (x, y)) = (y2 ex ) · (2ex ) − (2yex )2 = 2y2 e2x − 4y2 e2x = −2y2 e2x < 0,

ocurre que la función f (x, y) = ex y2 no es ni cóncava, ni convexa. Por este hecho, si pretendemos
aplicar las condiciones de la Proposición 6.6 nos queda verificar directamente si las curvas de nivel de
f (x, y) = ex y2 son convexas. Para ello, dado h > 0 se tiene que

h √
e y = h ⇒ y(x) = √ x = he−x/2 ,
x 2
e
por lo que
1 √ −x/2 1 √ −x/2
y′ (x) = −
he ⇒ y′′ (x) = he > 0.
2 4
De esta manera, a pesar de que la función objetivo no es cóncava, sus curvas de nivel son convexas,
por lo que podemos aplicar la Proposición 6.6. La solución del problema cumple entonces que
x + 2y = 3 (6.12)
∂ f (x,y)
∂x 1
∂ f (x,y)
= (6.13)
2
∂y

La condición (6.13) corresponde a

ex y2 1 y2 1
= ⇒ = ⇒ ȳ = 1,
ex 2y 2 2y 2
con lo cual, usando (6.12), se obtiene que x̄ = 1. ■

Ejemplo 6.33 El problema del consumidor


Suponga que hay dos bienes de consumo, cuyas cantidades genéricas son x1 ≥ 0 para el bien
uno y x2 ≥ 0 para el bien dos. La función de utilidad de cierto individuo es u : R2+ → R tal que
β
u(x1 , x2 ) = x1α x2 . Esta función informa el nivel de satisfacción (felicidad, placer, utilidad, beneficio,
etc.) que se logra con el consumo de bienes, de modo que si el individuo “consume” x1 cantidad del
bien uno y x2 cantidad de bien dos, entonces su satisfacción es u(x1 , x2 ).
Ahora bien, el consumo de bienes no es gratuito. Supongamos entonces que el individuo tiene R
recursos (dinero, ingreso, riqueza) para comprar los bienes de consumo. Supongamos además que cada
unidad de bien uno cuesta p1 y que cada unidad de bien dos cuesta p2 (precios). Con esto, dados los
recursos del individuo, las canastas (vectores) de bienes que puede comprar deben cumplir la siguiente
restricción (que en economía se llama restricción presupuestaria):

p1 x1 + p2 x2 = R.

Lo anterior informa que el pago por los bienes de consumo debe alcanzar con los recursos que dispone:
el individuo no puede consumir canastas que cuesten más que los recursos que tiene, de modo que para
consumir gasta exactamente los recursos que tiene.
Sobre la base de lo anterior, el problema del individuo es buscar la combinación de bienes que
puede comprar que hacen máximo su nivel de satisfacción. Es decir, el problema del individuo es
β
max x1α x2
s.a p1 x1 + p2 x2 = R.
158 Capítulo 6. Aplicaciones del cálculo

Cabe destacar que las condiciones de la Proposición 6.6 aplican cuando las curvas de nivel de la
función objetivo son convexas, que es el caso para funciones Cobb - Douglas (ver Sección 6.3.4). Por
lo tanto, para encontrar la solución del problema debemos resolver el sistema de ecuaciones

p1 x1 + p1 x2 = R
∂ u(x1 ,x2 )
∂ x1 p1
∂ u(x1 ,x2 )
=
p2
∂ x2

Notando que
∂ u(x1 ,x2 ) β
∂ u(x1 , x2 ) β ∂ u(x1 , x2 ) β −1 ∂ x1 αx1α−1 x2 αx2
= αx1α−1 x2 , = β x1α x2 =⇒ ∂ u(x1 ,x2 )
= β −1
= ,
∂ x1 ∂ x2 β x1α x2 β x1
∂ x2

se tiene que el sistema de ecuaciones anterior equivale a lo siguiente:

p1 x1 + p1 x2 = R (6.14)

αx2 p1
= (6.15)
β x1 p2
De la condición (6.15) tenemos que
p1 β
x2 = x1 ,
p2 α
y usando esto en (6.14) se tiene que
 
p1 β p1 β αR
p1 · x1 + p2 · x1 = R ⇒ p1 x1 + x1 = R ⇒ x̄1 = .
p2 α α (α + β )p1
p1 β
Finalmente, con x̄1 podemos obtener x̄2 usando el hecho que x2 = p2 α x1 . Así,

p1 β βR
x̄2 = x̄1 = .
p2 α (α + β ) p2


Ejercicio 6.36 Sean p > 0 y R > 0 y considere f : R2+ → R tal que f (x1 , x2 ) = x1 + x2 .

(a) Muestre que la función f (x1 , x2 ) = x1 + x2 no es ni cóncava, ni convexa.
(b) Muestre que las curvas de nivel de f (x1 , x2 ) son convexas.
(c) Encuentre la solución de

max x1 + x2
s.a x1 + px2 = R.

Ejercicio 6.37 Dados p > 0, q > 0, considere f : R2+ → R tal que f (x1 , x2 ) = x1 x2 .
(a) Muestre que la función f (x1 , x2 ) = x1 x2 no es ni cóncava, ni convexa.
(b) Muestre que las curvas de nivel de f (x1 , x2 ) son convexas.
6.5 Problema de optimización con restricción lineal 159

(c) Encuentre la solución del siguiente problema de optimización:


max x1 x2
s.a px1 + qx2 = 1.

Ejercicio 6.38 Dados p, q, R > 0, y dados α, β > 0 considere f : R2++ → R tal que

f (x1 , x2 ) = α ln(x1 ) + β ln(x2 ).

(a) Muestre que f (x1 , x2 ) es cóncava.


(b) Encuentre la solución del siguiente problema de optimización:
max α ln(x1 ) + β ln(x2 )
s.a px1 + qx2 = R.

Ejercicio 6.39 Dada f (x1 , x2 ) = −x1 + x1 x2 − x12 − 2x22 , se pide:


(a) Muestre que f (x1 , x2 ) es cóncava.
(b) Dados p > 0 y r > 0, encuentre la solución del problema
max −x1 + x1 x2 − x12 − 2x22
s.a x1 + px2 = r.

√ y
Ejercicio 6.40 Sea f : R2+ → R tal que f (x, y) = xe .
(a) Muestre que " 1 #
1 y
− 4x3/2 ey √
2√ x
e
H f (x, y) = 1 y ∈ R2×2 ,

2 x
e xey

con lo cual concluya que f (x, y) no es ni cóncava, ni convexa.


(b) Muestre que la curva de nivel h > 0 de f (x, y) es y(x) = − 12 ln(x) + ln(h), y concluya que las
curvas de nivel de f (x, y) son convexas.
(c) ¿Cuál de los siguientes problemas de optimización se puede resolver usando las condiciones
de la Proposición √
6.6? Una vez identificado, resuélvalo.
max xey
s.a x + 2y = 4.
√ y
min xe
s.a x + 2y = 4.

Ejercicio 6.41 Resuelva el siguiente problema del consumidor:

max x1 x22
s.a x1 + px2 = 1.


III
Integrales múltiples

7 Integrales (definidas) dobles . . . . . . . . 163


7.1 Idea y concepto . . . . . . . . . . . . . . . . . . . . . . . 163
7.2 Cálculo de integrales dobles: Teorema de Fu-
bini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
7. Integrales (definidas) dobles

7.1 Idea y concepto


En lo que sigue, el eje X1 lo identificamos con el eje X, y el eje X2 lo identificamos con el eje Y, de
modo que las variables de una función f : R2 → R son “x” e “y”.

Sea A ⊂ R2 rectángulo dado por

A = [a1 , a2 ] × [b1 , b2 ] ⊂ R2 ,

donde a1 , a2 , b1 , b2 ∈ R tal que a1 < a2 y b1 < b2 . Dado esto, evaluando la función f (x, y) en los puntos
del “rectángulo” A se obtiene una región sobre la superficie que define el gráfico de la función. La
Figura 7.1 es ilustrativa.

Figura 7.1: R EGIÓN EN LA SUPERFICIE DEL GRÁFICO DE f (x1 , x2 ) INDUCIDA POR A

El problema que nos interesa es obtener el volumen de la figura (tridimensional) cuya base es
el rectángulo A, y cuya cara superior es la región que se ha mencionado. El volumen en cuestión se
164 Capítulo 7. Integrales (definidas) dobles

representa como una integral doble (definida), que se denota como


ZZ
Volumen = f (x, y)dydx.
A

A este respecto, el hecho que A = [a1 , a2 ] × [b1 , b2 ] informa que el volumen se calcula considerando
que la variable “x” se mueve entre a1 y a2 , y que la variable “y” se mueve entre b1 y b2 , razón por la
cual la expresión de la integral doble se reescribe como
ZZ Z a2 Z b2
A = [a1 , a2 ] × [b1 , b2 ] ⇒ f (x, y)dydx = f (x, y)dydx.
a1 b1
A

Para obtener el volumen en cuestión, haremos una aproximación por sumas de Riemann como
se hizo para obtener la integral definida para una función real. Así, sobre el intervalo [a1 , a2 ] se
considera una “partición” dada por la secuencia de puntos x0 , x1 , . . . , xn de modo que xi < xi+1 , con
i = 0, · · · , n − 1 y tal que x0 = a1 y xn = a2 , mientras que sobre el intervalo [b1 , b2 ] se considera una
partición y0 , y1 , . . . , ym de modo que y j < y j+1 , con j = 0, · · · , m − 1 y tal que y0 = b1 e ym = b2 .
Con lo anterior, el rectángulo A es particionado n · m “pequeños rectángulos”, cada uno definido
por el producto cartesiano del intervalo [xi , xi+1 ], con i = 0, 2, . . . , n − 1, con el intervalo [y j , y j+1 ], con
j = 0, 2, . . . , m − 1:
Ai j = [xi , xi+1 ] × [y j , y j+1 ].

Siguiendo con la lógica que se utilizó para obtener el área bajo una curva, tomamos

(x̄i , ȳ j ) ∈ [xi , xi+1 ] × [y j , y j+1 ]

y consideramos el paralelepípedo cuya base es el rectángulo Ai j y cuya altura es f (x̄i , ȳ j ). Dado esto,
el volumen de este paralelepípedo es (área de la base por la altura)

f (x̄i , ȳ j ) · (xi+1 − xi ) · (y j+1 − y j ),

por lo que la siguiente doble sumatoria es una aproximación del volumen que queremos encontrar:
Z a2 Z b2 n−1 m−1
f (x, y)dydx ≈ ∑∑ f (x̄i , ȳ j ) · (xi+1 − xi ) · (y j+1 − y j ).
a1 b1 i=0 j=0
| {z }
Volumen

Sobre la base de lo anterior, si continuamos agregando puntos para particionar los intervalos [a1 , a2 ] y
[b1 , b2 ], la aproximación anterior es igual al volumen cuando n y m tienden a infinito, es decir,
!
a2
Z Z b2 n−1 m−1
f (x, y)dydx = lim lim ∑∑ f (x̄i , ȳ j ) · (xi+1 − xi ) · (y j+1 − y j ) .
a1 b1 n→∞ m→∞
i=0 j=0

7.2 Cálculo de integrales dobles: Teorema de Fubini


Suponiendo que f (x, y) es continua en sus variables (cosa que cumplen las funciones que “nor-
malmemte” uno utiliza), se puede demostrar que los límites anteriores son intercambiables y, además,
7.2 Cálculo de integrales dobles: Teorema de Fubini 165

que cada uno de ellos puede entrar en la sumatoria. La consecuencia de esto es que, bajo la condición
indicada, intercambiando límites y sumatorias se tiene que
!
Z Z a2 b2 n−1 m−1
f (x, y)dydx = lim lim ∑∑ f (x̄i , ȳ j ) · (xi+1 − xi ) · (y j+1 − y j )
a1 b1 n→∞ m→∞
i=0 j=0
!
n−1 m−1
= lim ∑ lim ∑ f (x̄i , ȳ j ) · (xi+1 − xi ) · (y j+1 − y j ) (7.1)
n→∞ m→∞
i=0 j=0
!
m−1 n−1
= lim
m→∞
∑ lim
n→∞
∑ f (x̄i , ȳ j ) · (xi+1 − xi ) · (y j+1 − y j ) . (7.2)
j=0 i=0

Notemos ahora que en (7.1) ocurre que (xi+1 − xi ) es constante para la sumatoria a la derecha,
mientras que en (7.2) ocurre que (y j+1 − y j ) es constante para la sumatoria a la derecha. De esta
manera, lo anterior se puede reescribir como

!
Z a2 Z b2 n−1 m−1
f (x, y)dydx = lim ∑ lim ∑ f (x̄i , ȳ j ) · (y j+1 − y j ) · (xi+1 − xi ) (7.3)
a1 b1 n→∞ m→∞
i=0 j=0
!
m−1 n−1
= lim
m→∞
∑ lim
n→∞
∑ f (x̄i , ȳ j ) · (xi+1 − xi ) · (y j+1 − y j ) (7.4)
j=0 i=0

Notamos ahora que dado x̄i , la expresión roja en (7.3) es la integral definida de la “función” f (x̄i , y),
es decir, una “integral definida” estándar, cuyo resultado depende de x̄i :
m−1 Z b2
lim ∑ f (x̄i , ȳ j ) · (y j+1 − y j ) = f (x̄i , y)dy.
m→∞ b1
j=0

Usando esto en (7.3) implica que


Z a2 Z b2 n−1 Z b2 
f (x, y)dydx = lim ∑ f (x̄i , y)dy · (xi+1 − xi ).
a1 b1 n→∞ b1
i=0

A su vez, como bb12 f (x̄i , y)dy es el resultado de evaluar la función g(x) = bb12 f (x, y)dy en x = x̄i (el
R R

resultado de bb12 f (x, y)dy depende de x), el lado derecho de lo anterior es simplemente la integral
R

definida de la función g(x), con x variando entre a1 y a2 , es decir:


Z a2 Z b2 n−1 Z b2  Z a2 Z a2 Z b2 
f (x, y)dydx = lim ∑ f (x̄i , y)dy ·(xi+1 −xi ) = g(x)dx = f (x, y)dy dx.
a1 b1 n→∞ b1 a1 a1 b1
i=0

De manera análoga, trabajando sobre la expresión azul en (7.4) se puede concluir que
Z a2 Z b2 Z b2 Z a2 
f (x, y)dydx = f (x, y)dx dy.
a1 b1 b1 a1

El resultado anterior se conoce como Teorema de Fubini, que para el caso se presenta de la siguiente
manera.
166 Capítulo 7. Integrales (definidas) dobles

Teorema 7.1 Si f : R2 → R es continua en sus variables, entonces, dados a1 < a2 y b1 < b2 , se


cumple que
Z a2 Z b2 Z a2 Z b2  Z b2
Z a2

f (x, y)dydx = f (x, y)dy dx. = f (x, y)dx dy.
a1 b1 a1 b1 b1 a1

Importante 7.1 ¿Por qué es relevante lo anterior? Simplemente porque nos entrega un método para
el cálculo de una integral (definida) doble: calcular la “integral (definida) de una función de dos
variables” se convierte en calcular dos integrales de funciones de una variable.
Por ejemplo, cuando uno calcula
Z b2
f (x, y)dy
b1

está asumiendo que “x” es una constante en la expresión de la función, de modo que en esa integral
la variable de integración es “y”. Una vez que se obtiene esa integral, cuyo resultado depende de
“x”, para obtener el resultado final se debe volver a integrar ese resultado respecto de la variable “x”.
El teorema anterior sostiene, además, que el orden en que se calculan las integrales no altera el
resultado final.

N Cuando uno escribe Z a2 Z b2


f (x, y)dydx,
a1 b1

el orden en que aparecen las integrales y la expresión “dydx” informa que “y” varía entre b1 y b2 ,
mientras que “x” varía entre a1 y a2 . Por este hecho ocurre que, en general,
Z a2 Z b2 Z a2 Z b2
f (x, y)dydx ̸= f (x, y)dxdy,
a1 b1 a1 b1

pues la integral a la derecha informa que la primera variable es “x”, la que que varía entre b1 y b2 ,
y la segunda variable es “y”, la que varía entre a1 y a2 .
Ejemplo 7.1 Dados a, b > 0, calcular
Z aZ b
(xy + y2 )dydx.
0 0

Por Fubini se tiene que


Z aZ b Z a Z b  Z b Z a 
2 2 2
(xy + y )dydx = (xy + y )dy dx = (xy + y )dx dy.
0 0 0 0 0 0

Comenzamos con el siguiente cálculo:


Z aZ b Z b Z a 
2 2
(xy + y )dydx = (xy + y )dx dy.
0 0 0 0

Se tiene entonces que (se calcula la integral suponiendo que “y” es constante)

x2 a2
Z a  
x=a
2
(xy + y )dx = · y + x · y2 = · y + a · y2 ,
0 2 x=0 2
7.2 Cálculo de integrales dobles: Teorema de Fubini 167

por lo que
Z b 2
a2 y2 y3 a2 b2 ab3
Z aZ b   
y=b
2 a 2
(xy + y )dydx = ·y+a·y dy = · +a· = + .
0 0 0 2 2 2 3 y=0 4 3

En complemento, haremos el cálculo usando la expresión


Z aZ b Z a Z b 
2 2
(xy + y )dydx = (xy + y )dy dx.
0 0 0 0

Se tiene entonces que (se calcula la integral suponiendo que “x” es constante)

y2 y3 y=b b2 b3
Z b  
(xy + y2 )dy = x · + = x· + ,
0 2 3 y=0 2 3

por lo que

b2 b3 x 2 b2 b3 a2 b2 ab3
Z aZ b Z a   
x=a
2
(xy + y )dydx = x· + dx = · +x· = + .
0 0 0 2 3 2 2 3 x=0 4 3

¿Cómo se interpreta lo anterior? El volumen de figura cuya base es [0, a] × [0, b] y cuya cara
superior es la superficie que define la función f (x, y) = xy + y2 evaluada en los puntos de ese rectángulo,
2 2 3
es igual a a 4b + ab3 .

Ejemplo 7.2 Dados a > 0 y b > 1, se pide calcular

x2
Z aZ b 
xy + dydx.
0 1 y

Por Fubini:
x2 x2
Z aZ b  Z a Z b   
xy + dydx = xy + dy dx.
0 1 y 0 1 y
Como (integrar suponiendo que “x” es constante)

x2
 2
b2 − 1
Z b  
y=b
 
y 2
xy + dy = x + x ln(y) = · x + ln(b) · x2 ,
1 y 2 y=1 2

se tiene que,

x2
Z a  2  2  2
x3
Z aZ b    
b −1 2 b −1 x x=a
xy + dydx = · x + ln(b) · x dx = · + ln(b) · ,
0 1 y 0 2 2 2 3 x=0

es decir,

x2 b2 − 1
 2
a3 (b2 − 1) · a2 ln(b) · a3
Z aZ b  
a
xy + dydx = · + ln(b) · = + .
0 1 y 2 2 3 4 3

Solo como una cuestión complementaria, hagamos el cálculo usando el hecho que

x2 x2
Z aZ b  Z b Z a   
xy + dydx = xy + dx dy.
0 1 y 1 0 y
168 Capítulo 7. Integrales (definidas) dobles

Se tiene entonces que (integrar suponiendo que “y” es constante)

x2
 2
x3 x=a a2 a3
Z a  
x
xy + dx = ·y+ = ·y+ ,
0 y 2 3y x=0 2 3y
por lo que
x2
Z b 2
a3
 2 2
a3 ln(y) (b2 − 1) · a2 ln(b) · a3
Z aZ b   
y=b
a a y
xy + dydx = ·y+ dy = + = + .
0 1 y 1 2 3y 4 3 y=1 4 3

¿Cómo se interpreta lo anterior? El volumen de figura cuya base es [0, a] × [1, b] y cuya cara
2
superior es la superficie que define la función f (x, y) = xy + xy evaluada en los puntos de ese rectángulo,
(b2 −1)·a2 3
es igual a 4 + ln(b)·a
3 . ■

Ejemplo 7.3 Dado a > 1, calcular


Z 1Z a
xexy dydx.
0 1
Por Fubini tenemos que:
Z 1Z a Z 1 Z a  Z a Z 1 
xy xy xy
xe dydx = xe dy dx = xe dx dy.
0 1 0 1 1 0

Hay entonces dos caminos para obtener la respuesta. Comencemos por calcular la integral doble usando
la expresión a la derecha en lo anterior:
Z 1Z a Z a Z 1 
xy xy
xe dydx = xe dx dy.
0 1 1 0

Debemos obtener la primitiva de xexy suponiendo que “y” es constante: xexy dx. Usando la regla de
R

“integración por partes” (producto de las funciones “x” y “exy ”), definiendo u = x y dv = exy dx se tiene
que du = dx y que
1
Z
v = exy dx = exy .
y
Por lo tanto,
exy x · exy 1 x · exy 1 exy x · exy exy
Z  
1 xy
Z Z
xy
xe dx = x · − e dx = − exy dx = − · = − 2.
y y y y y y y y y
Luego,

x · exy exy 1 · e1·y e1·y 0 · e0 e0 ey ey


Z 1  
x=1
   
1
xexy dx = − 2 = − 2 − − 2 = − + .
0 y y x=0 y y y y y y2 y2
Por lo tanto,
Z a y
ey
Z 1Z a 
xy e 1
xe dydx = − 2+ 2 dy.
0 1 1 y y y
R −1 y
Esta última integral es complicada, pues requiere calcular dos integrales por partes:
R −2 y
y e dy y
y e dy. Probemos entonces usando la alternativa que nos da Fubini:
Z 1Z a Z 1 Z a 
xy xy
xe dydx = xe dy dx
0 1 0 1
7.2 Cálculo de integrales dobles: Teorema de Fubini 169

de modo que necesitamos la primitiva de xexy suponiendo que “x” es constante: xexy dy. A este
R

respecto, es directo que


1
Z
xexy dy = x · exy = exy ,
x
por lo que Z a y=a
xexy dy = exy = eax − ex .
1 y=1
Luego,
eax ea ea
Z 1Z a Z 1  
x=1
   
xy ax x 1 1
xe dydx = (e − e ) dx = − ex = −e − − 1 = − e − + 1.
0 1 0 a x=0 a a a a

El siguiente resultado aplica para calcular integrales en un caso particular relevante: funciones
separables.
Definición 7.1 La función f : R2 → R se dice separable si existen funciones f1 : R → R y
f2 : R → R tal que
f (x, y) = f1 (x) · f2 (y).

Dado esto, se tiene lo siguiente.

Proposición 7.1 Si f : R2 → R es separable, de modo que f (x, y) = f1 (x) · f2 (y), entonces, dados
a1 , a2 , b1 , b2 tal que a1 < a2 y b1 < b2 , se tiene que
Z a2 Z b2 Z a
2
 Z b2

f1 (x) · f2 (y) dydx = f1 (x)dx · f2 (y) dy .
a1 b1 a1 b1

Proof. Bajo lo indicado, por Fubini se tiene que


Z a2 Z b2 Z a2 Z b2 Z a2 Z b2 
f (x, y) dydx = f1 (x) · f2 (y) dydx = f1 (x) · f2 (y) dy dx.
a1 b1 a1 b1 a1 b1

Como f1 (x) es constante para la integral respecto de “y”, se tiene que


Z a2 Z b2  Z a2 Z b
2

f1 (x) · f2 (y) dy dx = f1 (x) f2 (y) dy dx.
a1 b1 a1 b1
R b2
Por último, como b1 f2 (y) dy es una constante que no depende de x, se tiene que
Z a2 Z b
2
 Z b
2
 Z a
2

f1 (x) f2 (y) dy dx = f2 (y) dy · f1 (x)dx .
a1 b1 b1 a1

Ordenando lo términos se concluye el resultado. ■

Ejemplo 7.4 Dados a > 0 y b > 1, calcular


Z aZ b
xey dydx.
0 1

Notando que f (x, y) = xey es separable, con f1 (x) = x, f2 (y) = ey , se tiene que
x2 x=a y y=b a2
Z aZ b Z a  Z b 
y y
xe dydx = xdx · e dy = ·e = · (eb − e).
0 1 0 1 2 x=0 y=1 2

170 Capítulo 7. Integrales (definidas) dobles

N Comentarios finales: cultura general


(a) Los conceptos y resultados vistos para introducir integrales dobles, es decir, integrales
definidas de funciones de dos variables, se pueden extender para definir integrales de
funciones de más variables. Por ejemplo, para una función f : R3 → R, la integral (triple)
correspondiente es el hipervolumen en R4 de la “figura” cuya cara superior es la hipersuper-
ficie que define la función y cuya base es la región donde se integra. Ciertamente que el
cálculo de esta integral se hace engorroso. Sin embargo, cuando la función es separable y la
región donde se calcula es el producto cartesiano de intervalos, entonces una integral tripe
es el producto de tres integrales de funciones de una variable. Esta idea se puede extender
para calcular integrales de funciones de k variables, con k > 2.
(b) La región A ⊂ R2 donde se calcula la integral doble puede ser un conjunto arbitrario, no
necesariamente el producto cartesiano de intervalos como hemos supuesto. Sin embargo,
en ese caso general ocurre que calcular la integral doble se hace más complejo, pues, entre
otros, requiere hacer explícita, en términos de las variables, la “forma” que tiene el conjunto
donde se integra. Además, en eso casos (generales) no necesariamente sigue aplicando el
Teorema de Fubini.
(c) La integrales impropias también se pueden definir, y calcular, para funciones de varias
variables. La idea que aplica es similar a lo que utilizó para la integral impropia de
funciones de una variable. Por ejemplo, para una integral doble impropia se calcula una
integral estándar, y luego, sobre el resultado obtenido, se hace tender a infinito el límite de
integración correspondiente.

Ejercicio 7.1 Dados a > 0 y b > 0, calcular las siguientes integrales:


Z aZ b Z aZ b Z aZ b Z aZ b
−xy xy xy
xe dydx, xe dydx, ye dxdy, yexy dydx.
0 0 0 0 0 0 0 0

Ejercicio 7.2 Para a, b > 0, calcular las siguientes integrales:


Z aZ b Z aZ b
2
(x y + xy + y)dxdy, (x2 y + xy + y)dydx.
0 0 0 0

Ejercicio 7.3 Explique por qué se tiene lo siguiente: dados a1 < a2 y b1 < b2 ,
Z a2 Z b2 Z a2 Z b2
( f (x) + g(y))dydx = (b2 − b1 ) f (x)dx + (a2 − a1 ) g(y)dy.
a1 b1 a1 b1

Ejercicio 7.4 Suponiendo que a, b, c, d ∈ R++ tal que a < b y c < d, y dado α > 0, encuentre las
siguientes integrales (aplicar resultado para funciones separables):
Z bZ d Z bZ d 2 Z b Z d αx Z bZ d
x e y
ex+α y dydx, dydx, dydx, dydx.
a c a c y a c y a c eαx

También podría gustarte