Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Calculo 3 PDF
Calculo 3 PDF
CÁLCULO III
Doris Hinestroza
Diego L. Hoyos
1
Índice general
1. Funciones Vectoriales 5
1.1. El Espacio Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Funciones Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1. Operaciones algebraicas. . . . . . . . . . . . . . . . . . . 8
1.2.2. Límites, derivadas e integrales. . . . . . . . . . . . . . . 9
1.2.2.1. Teoremas básicos . . . . . . . . . . . . . . . . . 10
1.3. Curvas y Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Longitud de arco y reparametrización de una curva. . . . . . . 14
1.5. Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.1. Triedro de Frenet . . . . . . . . . . . . . . . . . . . . . . 19
1.5.2. El vector aceleración. . . . . . . . . . . . . . . . . . . . 20
1.5.3. *Ecuaciones de Frenet para una curva plana. . . . . . . 21
2. Campos Escalares en R2 y R3 24
2.1. Gráfica de z = f (x, y). Curvas y superficies de nivel. . . . . . . 24
2.1.1. Superficies cuádricas. . . . . . . . . . . . . . . . . . . . . 31
2.2. Límites y Continuidad . . . . . . . . . . . . . . . . . . . . . . . 31
2.3. Funciones Diferenciables . . . . . . . . . . . . . . . . . . . . . . 34
2.3.1. Derivadas parciales . . . . . . . . . . . . . . . . . . . . . 34
2.3.2. Superficies parametrizadas . . . . . . . . . . . . . . . . . 35
2.3.3. El plano tangente . . . . . . . . . . . . . . . . . . . . . . 38
2.3.4. El concepto de diferenciabilidad . . . . . . . . . . . . . . 39
2.4. La Regla de la Cadena . . . . . . . . . . . . . . . . . . . . . . . 44
2.4.1. El vector gradiente . . . . . . . . . . . . . . . . . . . . . 46
2.5. Derivadas Direccionales . . . . . . . . . . . . . . . . . . . . . . 48
2.6. Máximos y Mínimos. . . . . . . . . . . . . . . . . . . . . . . . . 51
2.6.1. Criterio para determinar extremos de funciones de dos
variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.6.2. Extremos condicionados. . . . . . . . . . . . . . . . . . 55
2.7. *Temas de Lectura . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.7.1. Campos Escalares y Campos Vectoriales . . . . . . . . . 65
2
2.7.2. Derivada en una dirección de un campo escalar en Rn .
Derivadas direccionales y parciales. . . . . . . . . . . . . 66
2.7.3. Diferenciabilidad de un campo escalar en Rn . . . . . . . 68
2.7.4. Regla de la cadena para campos escalares en Rn . . . . . 71
2.7.5. Derivada en una dirección de un campo vectorial. Deriva-
da direccional . . . . . . . . . . . . . . . . . . . . . . . . 73
2.7.6. Diferenciabilidad de un campo vectorial . . . . . . . . . 74
2.7.7. Regla de la cadena para campos vectoriales. . . . . . . . 76
2.7.8. Fórmula de Taylor de orden dos para campos escalares . 80
2.7.9. Naturaleza de un punto crítico teniendo como criterio los
valores propios de la matriz Hessiana . . . . . . . . . . . 82
2.7.10. Criterio para determinar extremos de funciones de dos
variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.7.11. Ley de la conservación de la energía. Campos conservativos 85
3. Integrales Múltiples 87
3.1. Integrales Dobles . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.1.1. Propiedades de la Integral doble . . . . . . . . . . . . . 88
3.1.2. Integración en regiones más generales . . . . . . . . . . 89
3.1.3. Cálculo de integrales dobles: áreas y volúmenes. . . . . . 91
3.1.4. Cambio de variable . . . . . . . . . . . . . . . . . . . . 95
3.1.4.1. La fórmula del cambio de variable . . . . . . . 97
3.2. Integrales Triples . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.2.1. Regiones más generales . . . . . . . . . . . . . . . . . . 102
3.2.2. Cambio de variable en integrales triples. . . . . . . . . . 104
3.2.2.1. Coordenadas cilíndricas. . . . . . . . . . . . . . 105
3.2.2.2. Coordenadas esféricas. . . . . . . . . . . . . . . 106
3.3. Aplicaciones de las integrales múltiples. . . . . . . . . . . . . . 107
3.3.1. Momentos y centros de masa. . . . . . . . . . . . . . . . 107
3.3.2. Densidad y masa. . . . . . . . . . . . . . . . . . . . . . . 109
3.3.3. Momento de Inercia. . . . . . . . . . . . . . . . . . . . 112
3.3.4. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . 116
3.3.4.1. Valores esperados . . . . . . . . . . . . . . . . 116
3
4.6.1. Integral de superficie de una función escalar . . . . . . . 133
4.6.2. Integral de superficie de un campo vectorial . . . . . . . 134
4
Capítulo 1
Funciones Vectoriales
1.1. El Espacio Rn
El espacio Rn es el conjunto de todas las n-uplas de números reales:
−
→ −
→
a + b = (x1 + y1 , x2 + y2 , ..., xn + yn ).
λ−
→
a = (λx1 , λx2 , ..., λxn ).
5
−
→ −
→ −
→ −
a · b = b ·→a
−
→ −
→ →
(−
→
a + b )·−
→c = −
→
a · c + b ·−
−
→ c
−
→ − → −
→ −
→
λ −→
a · b =−→
λa · b = a · λb
√ q
||−
→ −
→a .−
→ 2 2 2
a || = a = (x1 ) + (x2 ) + ... + (xn )
o
||−
→
a ||2 = −
→
a ·−
→
a.
−
→
La distancia entre −
→
a y b se define por
−
→ −
→
dist(−
→
a , b ) = k−
→
a − b k,
−
→
para cada −
→
a y b ∈ Rn
Propiedades importantes de la definición de longitud o norma son las siguientes:
||−
→
a || ≥ 0, ∀− →a ∈ Rn
−
→
||λ a || = |λ| ||−
→a ||
−
→ −
→ −
→ −
→
|| a + b || ≤ || a || + || b ||
− −
→ −
→
→a · b ≤ ||−
→
a || || b ||
−
→
El ángulo θ entre los vectores −
→
a y b está dado por la relación.
−
→ −
→
a · b
cos θ = −
→
k−
→
a kk b k
−
→
En el caso que −
→
a y b ∈ R3 definiremos otro producto entre vectores conocido
−
→
como producto vectorial que se denota por −
→
a × b y lo definimos como
i j k
−
→ −
→
a × b = x1 x2 x3 = (x2 y3 − x3 y2 ,
x3 y1 − x1 y3 , x1 y2 − x2 y1 ).
y1 y2 y3
6
Recordemos algunas propiedades del producto vectorial
−
→ −
→ −
→ − →
a × b ⊥ −
→
a y − →
a × b ⊥ b
−
→ −
→ −
→ →
a × b = − b ×− a
−
→ −
→ →
(−
→a + b)×− →c = a × c + b ×−
−
→ −
→ c
−→ − −
→ − −
→ →
−
→ → −
→ −
→ →
= (a · c) b − a · b −
a × b × c c
−
→ −
→ −
→
(λ−
→
a)× b =λ − → = −
→
a × b a × λb
−
→ → −
→ →
(−
→
a × b)·−
c = −
→
a · b ×− c .
−
→
La norma de −
→
a × b está dada por
−
→ −
→
||−
→
a × b || = ||−
→
a || || b ||sen θ
x1 = f1 (t)
x2 = f2 (t)
..
.
xn = fn (t)
llamadas ecuaciones paramétricas con parámetro t.
En algunos casos representaremos las funciones vectoriales como combinación
lineal de la base usual en Rn . Por ejemplo cuando n = 2 algunas veces uti-
−
→
lizaremos la representación F (t) = (x(t), y(t)) = x(t)i + y(t)j donde i = (1, 0)
7
−
→
y j = (0, 1) y cuando n = 3 utilizaremos F (t) = (x(t),y(t),z(t)) =x(t)i +
y(t)j+z(t)k donde i = (1, 0, 0), j = (0, 1, 0), k =(0, 0, 1).
x = a + lt,
y = b + mt,
z = c + nt.
−
→
El vector F (t) describe una circunferencia de radio 1 en sentido contrario a
las manecillas del reloj dando una vuelta completa cuando t aumenta de 0 a
2π.
8
(El producto aquí́ considerado es el de producto escalar).
Observemos que el producto escalar de funciones vectoriales es una función
real.
−
→ − →
Además en el caso de que F y G tengan sus valores en R3 podemos definir el
producto vectorial −
→ − → −
→ −
→
F × G (t) = F (t) × G (t).
−
→ −
→
Igualmente, la derivada F 0 (t) de una función vectorial F (t) se define exacta-
−
→
mente de la misma forma que la derivada de una función real, es decir F (t) es
diferenciable en t, si
−
→ −
→
−
→ F (t + h) − F (t)
F 0 (t) = lı́m
h→0 h
9
Denotaremos las derivadas por
−
→
−
→0 −
→ dF
F (t) = Dt F = .
dt
−
→
En el caso de n = 2, si F (t) = (x(t), y(t)) = x(t)i + y(t)j,
−
→
−
→0
−
→ dF dx dy dx dy
F (t) = Dt F = = , = i + j.
dt dt dt dt dt
−
→
En el caso de n = 3, si F (t) = (x(t), y(t), z(t)) = x(t)i + y(t)j+z(t)k,
−
→
−
→0
−
→ dF dx dy dz dx dy dz
F (t) = Dt F = = , , = i + j+ k.
dt dt dt dt dt dt dt
−
→ − →
Si F y G tienen valores en R3 , entonces
−
→ − →0 −
→ − → − → − →
F × G = F 0 × G + F × G0
10
−
→
Teorema 1.2.2 Una función vectorial F (t) diferenciable tiene longitud con-
−
→ −
→
stante en un intervalo abierto I, si y sólo si F (t) · F 0 (t) = 0. Esto significa que
−
→ −
→
los vectores F (t) y F 0 (t) son perpendiculares para cada t ∈ I.
−
→
Demostración. Vamos inicialmente a suponer que la longitud de F (t) es
−
→ −
→ −
→
constante. Definamos la función g(t) = || F (t)||2 = F (t) · F (t). De acuerdo a
la hipótesis g(t) = c para todo t ∈ I donde c es una constante. Por lo tanto
g 0 (t) = 0 en I. Como g es un producto escalar, tenemos que
−
→ −
→ −
→ −
→ −
→ −
→
g 0 (t) = F 0 (t) · F (t) + F (t) · F 0 (t) = 2 F (t) · F 0 (t) = 0,
−
→ −
→
entonces F (t) · F 0 (t) = 0 en I.
−
→ −
→
Para mostrar el recí́proco consideremos que F (t) · F 0 (t) = 0 en I y definamos
−
→
2
−
→ −
→
g(t) =
F (t)
. Derivando g(t) tenemos que g 0 (t) = 2 F (t) · F 0 (t) y aplicando
−
→
la hipótesis tenemos que g 0 (t) = 0 para todo t ∈ I. Así́ la longitud de F (t) es
constante.
11
o
t −
→
−
→ −
→
Z
F (t) = F (a) + F 0 (s)ds.
a
C = {−
→
x :−
→
x =−
→
r (t) para algún t ∈ I}.
12
Investigamos el comportamiento de este cociente cuando h → 0. El cociente es
el producto del vector −
→
r (t0 + h) − −
→r (t0 ) por el escalar 1/h. Observemos que
el numerador es paralelo a este cociente. Si hacemos que h → 0 tenemos que
−
→
r (t0 + h) − −
→
r (t0 ) −→
lı́m = r0 (t0 )
h→0 h
13
−
→
rapidez de la curva y se denota v(t). La segunda derivada r00 (t) es la aceleración
−
→
de la curva y se denota a (t).
Si conocemos la aceleración de una partícula en un tiempo t y si también sabe-
mos su velocidad y su posición en un tiempo específico t0 , entonces podemos
conocer su velocidad y su posición en cualquier tiempo t, como se muestra en
el siguiente ejemplo.
t3 −
→ → 1
− −
→
Z
−
→
r (t) = −
→
v (t)dt = ( + t) i + (t − sent) j − cos 2t k + (c1 , c2 , c3 )
3 4
y puesto que por hipótesis − →r (0) = (0, 1, 0), y por otro lado −
→
r (0) = (c1 , c2 , − 41 +
t3 −
→
c3 ) tenemos que la posición en un tiempo t está dada por − →
r (t) = ( + t) i +
−
→ 3
−
→
(t − sent + 1) j + ( 14 − 41 cos 2t) k .
14
h invierte la orientación.
√
Ejemplo 1.4.1 Sabemos que la ecuación y = 1 − x2 , x ∈ [−1, 1] repre-
senta la mitad superior de un círculo
√ de radio 1. Podemos parametrizar di-
cho semicírculo por − →r (t) = (t, 1 − t2 ), t ∈ [−1, 1] con orientación del
punto (−1, 0) al punto (1, 0). Escribiendo
√ t = t(u) = cos u obtenemos la
reparametrización − →r (u) = (cos u, 1 − cos2 u) = (cos u, sen u). Si tomamos
u ∈ [0, π] = [arc cos(1), arc cos(−1)] obtenemos una reparametrización que in-
vierte la orientación pues en dicho intervalo cos es decreciente.
La longitud de una curva −
→
r =−
→
r (t) para t ∈ [a, b] se define por
Zb
−
→
L(−
→
r)= || r0 (t)||dt
a
Z 2π
L(−
→
r)= adt = 2πa
0
y en el caso de la hélice −→r (t) = (acost, asent, bt), su longitud desde el punto
(1, 0, 0) hasta el punto (1, 0, 2π) es
Z 2π p p
a2 + b2 dt = 2π a2 + b2 .
0
Nótese que al reparametrizar una curva, ni su forma ni su longitud cambian.
Esto último se deduce del hecho de que haciendo t = h(u) y suponiendo h
creciente
Zd
Zd
Zd Zb
−→0
−
→0 −
→0
−→
0 0
α (u)
du =
r (h(u))h (u)
du = || r (h(u))||h (u)du =
r0 (t)
dt
c c c a
15
El estudiante puede hacer algo análogo para h decreciente.
Sin embargo, escribiendo − →
r (u) = −→
r (t(u)) se tiene que
−
d→
−
→
r
=
d r
dt
du
dt
du
dt
lo que muestra que su rapidez sí cambia por el factor du ; incluso la velocidad
puede invertir su sentido en el caso en que t = t(u) sea decreciente pues en este
dt
caso < 0.
du
Pregunta: Se podrá reparametrizar una curva cualquiera de tal manera que
su rapidez sea constante? La respuesta es sí, como veremos a continuación.
−
→
Sea −
→r =− → Rt
r (t), t ∈ [a, b] una curva cualquiera, y sea s = s(t) = a
r0 (u)
du.
d−→r d−
→r dt
=
ds dt ds
−
d→
dt 1 1
r
= 1. Así vemos que cuando la
Como = ds =
−
→
, tenemos que
ds dt
0
r (t)
ds
curva está parametrizada por longitud de arco, su rapidez
− es constante e igual
→
a 1. Recíprocamente, si −→r =− →
r (t) es una curva tal que
r0 (t)
= 1, entonces
−
Rt
→
Rt
s = 0
r0 (u)
du = 0 du = t, es decir el parámetro t es la longitud del arco
s. Hemos demostrado el siguiente teorema:
16
1.5. Curvatura
La curvatura es el concepto más importante de la teoría de curvas y mide
qué tanto se dobla una curva en un punto determinado. Puesto que la forma
como se dobla una curva tiene que ver con su concavidad, es apenas natural
pensar que la segunda derivada tiene que estar involucrada, esto es, la razón de
cambio del vector tangente. Definiremos inicialmente la curvatura de una curva
parametrizada por la longitud de arco s y luego deduciremos una fórmula para
la curvatura de una curva con cualquier parámetro t.
Definición −
→ − →
1.5.1 Sea C una curva parametrizada por r = r (s) donde s =
Rt
−
→0
r (u)
du. Definimos la curvatura de C por
0
−
→
k(s) =
r00 (s)
(1.1)
Reparametrizando entonces por longitud de arco, tenemos que − →r (s) = −→r (t(s))
donde t = t(s) es la inversa de la función longitud de arco s = s(t); se tiene en-
17
−
→ −
→
tonces también que el vector tangente unitario tiene la forma T (s) = T (t(s)).
−
→0 −
→
Entonces r (s) = T (s) y la segunda derivada de − →
r es
−
→ −
→0
−
→00
−
→0 d T dt T (t)
r (s) = T (s) = =
−
→
dt ds
r0 (t)
Esta fórmula nos permite calcular la curvatura de una curva cualquiera sin tener
que reparametrizarla por longitud de arco. Podemos encontrar una fórmula
−
→
más sencilla que sólo involucre r y sus derivadas (y no el vector T ) dada en el
siguiente teorema.
Teorema 1.5.1
−
→0 −
→
r (t) × r00 (t)
k(t) =
− (1.4)
→0
3
r (t)
−
→
−
→ −
→
Demostración. Escribiendo v(t) =
r0 (t)
tenemos que r0 (t) = v(t) T (t);
derivando obtenemos
−
→ −
→ −
→
r00 (t) = v 0 (t) T (t) + v(t)T 0 (t)
.
Entonces
−
→0 −→ −
→ − → −
→
r × r00 = v T × v 0 T + v T 0
−
→ − → → −
− →
= vv 0 T × T + v 2 T × T 0
→ −
− →
= v2 T × T 0
Por lo tanto
−
→0 − →
→ − →
−
→
2
−
→
−
−
→
r × r00
= v 2
T × T 0
=
r0
T
T 0
sen(π/2)
−
→ −
→
−
→
puesto que T es perpendicular a T 0 . Y como
T
= 1 se tiene que
18
−
→0 − →
−
→
2
−
→
r × r00
=
r0
T 0
.
−
→
3
Dividiendo a ambos lados de esta última ecuación por
r0
se obtiene la fór-
mula deseada.
La curvatura de una curva con cualquier parámetro t está bien definida por
la ecuación 1.3, en el sentido de que es independiente de la parametrización
elegida, es decir, que para calcular la curvatura no interesa qué parametrización
tomemos. Esto se demuestra de la siguiente manera: si − →
α es una reparametrización
−
→ −
→ −
→
de r , esto es, α (u) = r (h(u)) con h(u) = t y llamamos kα ,kr ,Tα y Tr a las
curvaturas y al vector tangente unitario en las dos parametrizaciones, entonces:
−
→0
−
→0
−
→0
Tα (u)
Tr (h(u))h0 (u)
Tr (t)
kα (u) =
−→
=
−
→
=
−
→0
= kr (t)
α0 (u)
r0 (h(u))h0 (u)
r (t)
19
−
→ −
→ n−→ −→ → −o
vector que es perpendicular tanto a T como a N . La tripla T , N , B se de-
nomina triedro de Frenet y juega un papel central en el estudio de la geometría
de curvas.
n−→ − →o
El plano generado por el par T , N se denomina plano osculador .
n−→ − →o
El plano generado por el par N , B se denomina plano normal.
n−→ − →o
El plano generado por el par T , B se denomina plano rectificante.
Las ecuaciones de dichos planos en un punto − →
r (t0 ) son
−
→ −
→ −
→
plano osculador: ( x − r (t0 )) · B (t0 ) = 0.
−
→
plano normal: (−→x −− →
r (t0 )) · T (t0 ) = 0.
−
→
plano rectificante: (−
→
x −− →r (t0 )) · N (t0 ) = 0.
−
→ −
→ −
→
a = v 0 T + kv 2 N
20
Escribiendo aT = v 0 y aN = kv 2 tenemos que la aceleración es una combinación
−
→ − → −
→ −
→
lineal de los vectores T y N de la forma − →a = aT T + aN N , lo que nos dice
que el vector aceleración está siempre sobre el plano osculador.
Podemos encontrar expresiones para aT y aN en términos solamente de las
derivadas de −→r así:
−
→ −
→ − → −
→
v ·−→
a = v T · v 0 T + kv 2 N
−
→ − → −
→ − →
= vv 0 T · T + kv 3 T · N
0
= vv
−
→ −
→0 − →
0 v ·−→
a r · r00
Así, aT = v = =
−
→
.
v
r0
−
→0 − →
−
→
2
−
→0 − →
r × r00
r0
r × r00
2
Para aN , observemos que aN = kv =
− =
→0
.
−
→0
3
r
r
El estudiante puede demostrar fácilmente que también se tiene que k−
→ 2
ak =
a2T + a2N .
21
−
→ −
→
N 0 = −vk T (1.7)
Las ecuaciones 6 y 7, llamadas Ecuaciones de Frenet se pueden escribir en la
forma matricial
−
→ !
− → !
T0
−
→0
0 k T
−→ =
r
−
→
N0 −k 0 N
Ejercicio
1
Demostrar que si una curva tiene curvatura k = (constante) entonces es un
−
→ a
círculo de radio a (con centro en algún punto P ).
Puesto que la curvatura
−
es independiente de la parametrización, podemos
→0
suponer v(t) =
r (t)
= 1. Para demostrar que − →
r es un círculo de radio
−
→ −
→ −
→ −
→
a con centro en P , debemos
probar que
r (t) + a N (t) = P pues entonces
−
→ −
→ −
→ −
→
r (t) − P = −a N (t) y así,
−
→
r (t) − P
= a, como se observa en la figura
abajo.
d − −
→ −
→ −→
Para ver esto, observe que (→
r (t) + a N (t)) = r0 (t) + aN 0 (t). Pero la se-
dt
−→ 1−→
gunda ecuación de Frenet (ecuación 1.7) es N 0 (t) = − T (t), por lo tanto
a
−
→0 −
→ −
→ 1−→ −
→
r (t) + aN 0 (t) = T (t) − a. T (t) = 0 y por lo tanto −
→r (t) + a N (t) =constante.
−
→ a
Llamando P a dicha constante, se tiene lo que se quiere demostrar.
Observación.
22
Se definió la curvatura de una curva parametrizada por longitud de arco como
la norma del cambio en el vector tangente (ecuación 1.1). Esta definición no
funciona
− para
una curva con cualquier parámetro t. Para veresto basta observar
→
que
r (t)
= 2 (constante) para la parábola −
00 →
r (t) = t, t2 , lo que significaría
que la parábola es un círculo!!
23
Capítulo 2
Campos Escalares en R2 y R3
24
con planos paralelos al plano xy se denominan curvas de nivel, que se obtienen
intersectando la gráfica de f con los planos z = c (constante), esto es, la curva
de nivel en el nivel c es el subconjunto del plano definido por
Para las trazas con planos paralelos a los planos coordenados xz y yz hacemos
y = c y x = c. Veamos algunos ejemplos.
z = f (x, y) = x2 + y 2 .
25
Sin embargo, esto no es suficiente. Necesitamos ver las trazas con los planos
coordenados yz y xz. Para ver el corte con el plano yz, hacemos x = 0 en la
función f ; tenemos entonces que dicho corte es la parábola z = y 2 . Igualmente,
para el corte con el plano xz, hacemos y = 0 para obtener la parábola z = x2 .
Abajo puede verse la gráfica de dicha función, llamada paraboloide.
p
Ejemplo 2.1.2 Hagamos la gráfica de la función z = f (x, y) = x2 + y 2 .
Las curvas de nivel están dadas por el conjunto
p
Lf (c) = {(x, y) : x2 + y 2 = c} = {(x, y) : x2 + y 2 = c2 }
26
Observe que esta gráfica aparentemente es igual a la del paraboloide, sin em-
bargo la gráfica de f no es un paraboloide como lo muestran
p los cortes con los
otros planos coordenados: Si x = 0, obtenemos z = y 2 = |y|, esto es, las dos
rectas z = y y z = −y. De la misma manera, si y = 0 obtenemos las rectas
z = x, y z = −x. Vemos la gráfica abajo, que evidentemente es un cono.
27
Note que en el caso c = 0 obtenemos la hipérbola degenerada x2 = y 2 que
corresponde a las dos rectas y = x y y = −x.
El corte con el plano yz es la parábola z = y 2 y el corte con el plano xz es
la parábola z = −x2 . Esta gráfica se llama paraboloide hiperbólico o silla de
montar y tiene el aspecto que se muestra abajo.
28
todos los valores reales. Superficies de este tipo se llaman cilindros. ¿Cuales
son las curvas de nivel? Su gráfica puede verse abajo.
Para el caso de una función de tres variables w = f (x, y, z), su gráfica se define
por el conjunto
Por supuesto no podemos hacer un dibujo de ella por estar en el espacio cu-
atridimensional R4 . Sin embargo tenemos el concepto de superficie de nivel
definido de forma análoga al de curva de nivel así:
29
De la misma manera obtenemos círculos al cortar la superficie con planos par-
alelos a los otros dos planos coordenados. La figura obtenida es una esfera de
radio 1.
30
Observemos que la gráfica de una función de dos variables puede verse como
la superficie de nivel de una función de tres variables. Si f : Ω ⊂ R2 → R,
recordemos que la gráfica de f es
donde g(x, y, z) = z − f (x, y). Así la gráfica de una función de dos variables es
una superficie de nivel de una función de tres variables.
31
(x0 , y0 ). En otras palabras, f (x, y) está cerca de L si (x, y) está cerca de (x0 , y0 )
y entre más cerca esté (x, y) de (x0 , y0 ), más cerca está f (x, y) de L. Esto sig-
nifica que podemos tomar la distancia entre f (x, y) y L tan pequeña como
queramos siempre y cuando la distancia entre (x, y) y (x0 , y0 ) sea lo suficien-
temente pequeña. Tenemos entonces la equivalencia
Así, el límite de una función de dos variables se reduce al límite usual del
cálculo de una variable, y es por esta razón que las propiedades usuales de los
límites unidimensionales también son válidas para límites de funciones de dos
variables. Claramente se ve que la definición anterior de límite es válida para
cualquier campo escalar en Rn , con solo reemplazar la pareja (x, y) por un
vector −→
x ∈ Rn y la pareja (x0 , y0 ) por cualquier vector −
→
a ∈ Rn .
Las propiedades de los límites y de la continuidad las resumimos en los sigu-
ientes teoremas:
1. →lı́m− (f (−
− →
→
x ) + g(−
→
x )) = b + c,
x→a
2. →lı́m− λf (−
− →
→
x ) = λb para todo escalar λ,
x→a
3. →lı́m− f (−
− →
→
x )g(−
→
x ) = b · c,
x→a
4. →lı́m− |f (−
− →
→
x )| = |b| ,
x→a
32
Decir que f es continua sobre un conjunto U significa que f (−
→
x ) es continua en
cada punto del conjunto.
x2 − y 2 0
Ejemplo 2.2.1 Para probar que lı́m 2 2
(que es de la forma ) no
(x,y)→(0,0) x + y 0
existe, observamos resultados distintos si nos acercamos al origen por el eje x
y por el eje y así:
Acercamiento por el eje x: tomamos y = 0
x2
lı́m f (x, 0) = lı́m 2 = 1
(x,0)→(0,0) x→0 x
Acercamiento por el eje y: tomamos x = 0
−y 2
lı́m f (0, y) = lı́m 2 = −1
(0,y)→(0,0) y→0 y
B(x; r) = {−
→
x ∈ Rn : k −
→
x −−
→
a k < r}.
33
es abierto si todos sus puntos son interiores y un conjunto es cerrado
si contiene todos sus puntos frontera. Por ejemplo en los números reales , R,
los tipos más sencillos de conjuntos abiertos son los intervalos abiertos. La
unión de dos o más intervalos abiertos es también abierto. El intervalo [a, b]
es un intervalo cerrado. El conjunto U = (x, y) : x2 + y 2 ≤ 1 es un conjunto
cerrado en R2 .
34
∂f f (x0 , y0 + 4y) − f (x0 , y0 )
(x0 , y0 ) = lı́m . (2.2)
∂y 4y→0 4y
Puesto que las derivada parciales son también funciones de las variables x y y,
podemos también derivarlas parcialmente para obtener derivadas parciales de
segundo orden denotadas como se muestra a continuación:
∂2f ∂2f
(x0 , y0 ) = (x0 , y0 ).
∂x∂y ∂y∂x
35
la recta real, tenemos un solo parámetro que denotamos con la letra t y escribi-
mos −→r (t) = (x(t), y(t), z(t)). Análogamente tenemos el concepto de superficie
parametrizada como una función − →r : U ⊆ R2 → R3 . Como el dominio es un
subconjunto del plano, tenemos ahora dos parámetros que denotamos con las
letras u y v, y escribimos
−
→
r (u, v) = (x(u, v), y(u, v), z(u, v))
−
→
r (u, v) = (a cos u, a sen u, v), u ∈ [0, 2π], −∞ < v < ∞
2. La esfera.
Para la parametrización de la esfera observe la gráfica abajo.
36
En el triángulo rectángulo 4OAB se tiene que x = h cos θ y y = h sen θ
y en el triángulo rectángulo 4OBC se tiene que z = a cos ϕ. Pero de
nuevo en 4OBC se tiene que h = a sen ϕ, de manera que las
ecuaciones paramétricas de la esfera son
x = a cos θ sen ϕ
y = a sen θ sen ϕ
z = a cos ϕ
en donde θ ∈ [0, 2π] y ϕ ∈ [0, π]. Así la función −
→
r tiene la forma
−
→
r (θ, ϕ) = (a cos θ sen ϕ, a sen θ sen ϕ, a cos ϕ)
x = cos u cosh v
y = sen u cosh v
z = senh v
37
para u ∈ [0, 2π], −∞ < v < +∞.
∂−
→
r ∂x ∂y ∂z
(u0 , v0 ) = (u0 , v0 ), (u0 , v0 ), (u0 , v0 )
∂u ∂u ∂u ∂u
−
→
∂r ∂x ∂y ∂z
(u0 , v0 ) = (u0 , v0 ), (u0 , v0 ), (u0 , v0 )
∂v ∂v ∂v ∂v
∂−
→
r ∂−
→
r
(x − x0 , y − y0 , z − z0 ) · (u0 , v0 ) × (u0 , v0 ) = 0
∂u ∂v
38
En el caso particular en el que tenemos la gráfica de z = f (x,y), con la
∂−
→
r ∂− →
r ∂f
parametrización −
→r (x, y) = (x, y, f (x, y)) tenemos que × = 1, 0, ×
∂x ∂y ∂x
∂f ∂f ∂f
0, 1, = − , − , 1 . Si escribimos z0 = f (x0 , y0 ), la ecuación del
∂y ∂x ∂y
plano tangente es
∂f ∂f
z = f (x0 , y0 ) + (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) (2.3)
∂x ∂y
Diferenciabilidad de y = f (x).
39
El error cometido en la aproximación está dado por
f (x) ≈ L(x)
40
zoom cerca del origen de coordenadas. Se dará cuenta de que entre mayor sea
el zoom, la gráfica de la parábola será cada vez más recta.
Esto no sucede por ejemplo con la función f (x) = |x| pues no importa qué tan
cerca se esté del origen, la gráfica de f siempre se verá como una punta (dos
rectas).
dy = f 0 (x)4x
y se toma generalmente como una aproximación para 4y; entre más pequeño
sea 4x mejor es la aproximación.
f (x, y) ≈ A + Bx + Cy.
Para encontrar tal aproximación, le aplicamos el mismo análisis anterior a las
derivadas parciales, ecuaciones 2.1 y 2.2, y obtenemos formas análogas a la
ecuación 2.4 para los incrementos parciales
∂f
f (x0 + 4x, y0 ) − f (x0 , y0 ) = (x0 , y0 )4x + ε1 4x
∂x
∂f
f (x0 , y0 + 4y) − f (x0 , y0 ) = (x0 , y0 )4y + ε2 4y
∂y
donde ε1 y ε2 → 0 cuando 4x y 4y→ 0.
Tenemos así aproximaciones lineales para los incrementos parciales. Parece nat-
ural pensar que el incremento de f en ambas variables simultáneamente, pueda
aproximarse por la suma (ya que necesitamos que la aproximación sea lineal)
de las dos aproximaciones parciales. Esto no siempre sucede, pero cuando es
así, tenemos nuestra definición de diferenciabilidad:
41
incremento de z, 4z = f (x0 + 4x, y0 + 4y) − f (x0 , y0 ) puede escribirse en la
forma
∂f ∂f
4z = (x0 , y0 )4x + (x0 , y0 )4y + ε1 4x + ε2 4y (2.5)
∂x ∂y
∂f ∂f
f (x, y) = f (x0 , y0 )+ (x0 , y0 )(x−x0 )+ (x0 , y0 )(y−y0 )+ε1 (x−x0 )+ε2 (y−y0 )
∂x ∂y
(2.6)
donde (ε1 , ε2 ) → (0, 0) cuando (x, y) → (x0 , y0 ).
f (x, y) ≈ L(x, y)
en una vecindad de (x0 , y0 ). Note que la función L es precisamente el plano
tangente en el punto (x0 , y0 ) (vea de nuevo la ecuación 2.3). Tenemos así, que
f es diferenciable si puede linealizarse localmente, esto es, si en una vecindad
de un punto (x0 , y0 ) la gráfica de f se ve “casi” plana, siendo dicho plano
precisamente el plano tangente.
Los dos primeros términos de la derecha de la ecuación 2.5 se denomina la
diferencial de f y se denota df o más comúnmente dz así:
∂f ∂f
dz = (x0 , y0 )4x + (x0 , y0 )4y
∂x ∂y
y es una aproximación para el incremento 4z. Si le aplicamos esta definición a
∂x ∂x
las variables independientes x y y obtenemos que dx = 4x + 4y = 4x
∂x ∂y
y de la misma manera, dy = 4y. Por esta razón, es común que la diferencial
en cualquier punto (x, y) se escriba en la forma
∂f ∂f
dz = dx + dy. (2.7)
∂x ∂y
Nota. A veces, por abuso de notación, la ecuación 2.7 se escribe
42
∂z ∂z
dz = dx + dy
∂x ∂y
Si f es diferenciable en (x0 , y0 ), de la ecuación 2.6 se deduce de forma inmediata
que f es continua en dicho punto pues claramente f (x, y) → f (x0 , y0 ) cuando
(x, y) → (x0 , y0 ).
0.4
0.2
z 0.0
−0.2
−0.4
0.010
0.005
0.010
0.000 0.005
y −0.005 0.000
−0.005 x
−0.010 −0.010
43
2.4. La Regla de la Cadena
Sea z = f (x, y) un campo escalar diferenciable en un conjunto abierto U ∈ R2 ,
y supongamos que x = x(t) y y = y(t) son funciones diferenciables de t. Se
tiene entonces que z = z(t) = f (x(t), y(t)), esto es, tenemos la composición
z(t) = f ◦ h(t) donde h es la función vectorial definida por h(t) = (x(t), y(t)).
El teorema siguiente establece la forma como se calcula la derivada z 0 (t):
dz ∂f dx ∂f dy
= + (2.8)
dt ∂x dt ∂y dt
∂f ∂f
4z = 4x + 4y + ε1 4x + ε2 4y
∂x ∂y
donde (ε1 , ε2 ) → (0, 0) cuando (4x, 4y) → (0, 0).
Dividiendo ambos miembros de la ecuación por 4t y tomando el límite cuando
4t → 0 obtenemos
dz ∂f 4x ∂f 4y 4x 4y
= lı́m + lı́m + lı́m ε1 + lı́m ε2 (2.9)
dt ∂x 4t→0 4t ∂y 4t→0 4t 4t→0 4t 4t→0 4t
donde (ε1 , ε2 ) → (0, 0) cuando (4x, 4y) → (0, 0).
4x dx 4y dy
Por un lado, lı́m = y lı́m = . Por otro lado,
4t→0 4t dt 4t→0 4t dt
lı́m 4x = lı́m x(t + 4t) − x(t) = 0
4t→0 4t→0
puesto que x = x(t) es una función continua (por ser diferenciable). De la mis-
ma manera, lı́m 4y = 0, lo que significa que lı́m ε1 = lı́m ε2 = 0 por lo que
4t→0 4t→0 4t→0
la ecuación 2.9 se convierte en la ecuación 2.8.
dz ∂z dx ∂z dy
= +
dt ∂x dt ∂y dt
En el caso en que x y y sean funciones diferenciables de dos variables s y t,
x = x(s, t), y = y(s, t), entonces z = z(s, t) = f (x(s, t), y(s, t)) y las derivadas
parciales de z con respecto a s y t están dadas por:
44
∂z ∂z ∂x ∂z ∂y
= +
∂s ∂x ∂s ∂y ∂s (2.10)
∂z ∂z ∂x ∂z ∂y
= +
∂t ∂x ∂t ∂y ∂t
dy
Podemos utilizar la regla de la cadena para encontrar en el caso en que la
dx
ecuación F (x, y) = k defina y como función implícita de x. Derivando a ambos
lados de la ecuación F (x, y(x)) = k (aplicando la ecuación 2.8 obtenemos
∂F dx ∂F dy
+ =0
∂x dx ∂y dx
Así tenemos que
∂F
dy
= − ∂x . (2.11)
dx ∂F
∂y
Análogamente, si la ecuación F (x, y, z) = k define z como función implícita
de x y y, podemos encontrar fórmulas para las derivadas parciales de z con
respecto a x y y aplicando las fórmulas dadas por las ecuaciones 2.10 a la
ecuación F (x, y, z(x, y)) = k para obtener
∂F ∂F
∂z ∂z ∂y
= − ∂x =−
∂x ∂F ∂y ∂F
∂z ∂z
d2 z
Ejercicio. Si z(t) = f (x(t), y(t)), calcular 2 .
dt
dz ∂z dx ∂z dy
Tenemos que = + . Derivando a ambos lados de esta ecuación,
dt ∂x dt ∂y dt
aplicando la regla de la derivada de un producto, obtenemos:
d2 z ∂z d2 x ∂z d2 y
d ∂z dx d ∂z dy
= + + + (2.12)
dt2 dt ∂x dt ∂x dt2 dt ∂y dt ∂y dt2
∂z ∂z
Para las derivadas con respecto a t de y , debemos aplicar de nuevo la
∂x ∂y
∂z ∂z
regla de la cadena (ecuación 2.8) porque y son funciones de x y y y
∂x ∂y
estas a su vez son funciones de t así:
∂ 2 z dx ∂ 2 z dy
d ∂z
= +
dt ∂x ∂x2 dt ∂y∂x dt
45
∂ 2 z dx ∂ 2 z dy
d ∂z
= + 2
dt ∂y ∂x∂y dt ∂y dt
reemplazando estas dos expresiones en la ecuación 2.12, asumiendo que las
derivadas parciales mixtas son iguales y reduciendo términos semejantes, obten-
emos la expresión
2 2
d2 z ∂2z ∂ 2 z dx dy ∂2z ∂z d2 x ∂z d2 y
dx dy
= +2 + 2 + +
dt2 ∂x2 dt ∂x∂y dt dt ∂y dt ∂x dt2 ∂y dt2
La regla de la cadena para una función de tres variables w = w(t) = f (x(t), y(t), z(t))
tiene una forma análoga a la ecuación 2.8:
dw ∂w dx ∂w dy ∂w dz
= + + (2.13)
dt ∂x dt ∂y dt ∂z dt
46
supongamos que dicha curva de nivel está descrita por la función vectorial
−
→r (t) = (x(t), y(t)) que pasa por P en un tiempo t0 , esto es, P = − →
r (t0 ) =
−
→
(x0 , y0 ). Es claro entonces que debe ser f (x(t), y(t)) = f ( r (t)) = k. Derivando
a ambos lados de esta ecuación tenemos que
d −
f (→
r (t)) = 0 (2.15)
dt
−
→
∇f (x0 , y0 ) · r0 (t0 ) = 0
−
→
∇F (x0 , y0 , z0 ) · r0 (t0 ) = 0 (2.16)
47
Como la ecuación 2.16 es válida para todas las curvas sobre S que pasan por P ,
resulta natural definir el plano tangente a S en el punto P como el plano que
pasa por P (x0 , y0 , z0 ) y que tiene por vector normal el gradiente ∇F (x0 , y0 , z0 ),
por lo que su ecuación será
(−
→
x − P ) · ∇F (P ) = 0
siendo su expresión cartesiana
∂F ∂F ∂F
(x0 , y0 , z0 )(x − x0 ) + (x0 , y0 , z0 )(y − y0 ) + (x0 , y0 , z0 )(z − z0 ) = 0.
∂x ∂y ∂z
(2.17)
Observe que como la gráfica de una función de dos variables z = f (x, y) puede
verse como la superficie de nivel F (x, y, z) = 0 donde F (x, y, z) = f (x, y) − z,
al aplicar la ecuación 2.17 a esta F en particular, obtenemos la ecuación 2.3.
∂f f (x0 + t, y0 ) − f (x0 , y0 )
(x0 , y0 ) = lı́m
∂x t→0 t
Esta es la misma ecuación 2.1 en donde hemos reemplazado 4x por t. Esta
expresión puede escribirse en la forma
48
−
→ −
→ −
→
∂f − →) = lı́m f (x0 + t i ) − f (x0 )
(x0
∂x t→0 t
−
→
De la misma manera, escribiendo j = (0, 1) la derivada parcial con respecto a
y se escribe
−
→ −
→ −
→
∂f −→) = lı́m f (x0 + t j ) − f (x0 )
(x0
∂y t→0 t
Esta forma de expresar las derivadas parciales muestran que dichas derivadas
se calculan tomando la variación de f a lo largo de las rectas − → → + t−
α (t) = −
x
→
i
0
−
→ → + t−→
y β (t) = −x0 j , esto es, rectas paralelas a los ejes coordenados que pasan
por −x→. Podemos pensar en generalizar esto, calculando la variación de f a
0
lo largo de cualquier recta que pase por − →, esto es, una recta de la forma
x 0
−
→ −
→ −
→ −
→
r (t) = x0 + t u donde u es un vector unitario cualquiera. Esto nos conduce
al concepto de derivada direccional en la dirección de un vector unitario − →u en
−
→
un punto x0 , denotada D→ − f (−
x→ ) y definida de la manera natural
u 0
−
→ f (−
→ + t−
x0
→
u ) − f (−
→)
x0
u f (x0 ) = lı́m
D→
− (2.18)
t→0 t
y se puede interpretar geométricamente como la pendiente de la tangente de
la curva de intersección de la gráfica de f con un plano perpendicular al plano
coordenado xy en el punto − →.
x0
49
∂f −→) = D→ −
→
(x0 − f (x0 )
i
∂x
∂f −→) = D→ −
→
(x0 − f (x0 )
j
∂y
esto es, las derivadas parciales son las derivadas direccionales en las direcciones
−
→ − →
i y j , que corresponden a las pendientes de las tangentes de las curvas de
intersección de la gráfica de f con planos perpendiculares al plano coordenado
xy paralelos a los planos coordenados xz y yz respectivamente, como se explicó
en la sección 2.3.1.
Teorema 2.5.1
−
→ −
→ − → (2.19)
u f (x0 ) = ∇f (x0 ) · u
D→
−
Demostración. Si llamamos − →
r (t) = −
→ + t−
x0
→
u a la recta que pasa por −
→ con
x0
−
→ −
→ −
→ −
→0 −
→
vector director u , entonces r (0) = x0 y r (0) = u . Entonces
d f (−
→r (t)) − f (−→
r (0))
|t=0 f (−
→
r (t)) = lı́m
dt t→0 t
f (−
→ + t−
x0
→u ) − f (−
→)
x0
= lı́m
t→0 t−
→
= D→ u f (x0 )
−
D→ −
→ ∇f (−
→) · − →
u f (x0 )
− = x 0 u
−
→
= k∇f (x0 )k cos θ
50
dónde θ es el ángulo entre ∇f (−
→) y −
x 0
→
u . Puesto que el coseno oscila entre −1 y
1, la razón máxima se obtiene cuando cos θ = 1, esto es θ = 0, es decir, cuando
−
→u y ∇f (−→) tienen la misma dirección y es mínima cuando cos θ = −1, esto es
x0
θ = π, es decir, cuando −→
u y ∇f (− →) tienen direcciones opuestas. Resumiendo,
x0
la derivada direccional máxima se obtiene en la dirección del gradiente, esto es,
−
→ ∇f
u = y su valor es D ∇f f = k∇f k; la derivada direccional mínima se
k∇f k ||∇f ||
2. f (−→
a ) es un valor mínimo global de f en U si f (−
→
a )≤f (x, y) para todo
(x, y) ∈ U.
3. f (−
→
a ) es un valor extremo global de f en U si es un valor máximo global
o mínimo global.
Son válidas las mismas definiciones, sustituyendo la palabra global por local en
(1) y (2), cuando las desigualdades se cumplen en alguna vecindad abierta de
−
→a.
La definición es una generalización natural de las mismas nociones para fun-
ciones de una sola variable; y aún más, las generalizaciones para funciones de
tres y más variables son claras.
51
Teorema 2.6.2 (Condiciones necesarias para los extremos) Sea f una
función definida en un conjunto U que contiene a − →
a . Si f (−
→
a ) es un valor
−
→
extremo, entonces a deberá ser un punto frontera de U, o un punto crítico de
f, o un punto singular de f.
Demostración. Supongamos que − →
a = (x0 , y0 ) no es punto frontera ni singular
(por lo que a será un punto interior en el que ∇f existe) y veremos si ∇f (−
−
→ →
a)=
−
→
0 Puesto que f tiene un valor extremo en (x0 , y0 ), la función g(x) = f (x, y0 )
tiene un valor extremo en x0 . Además, g es diferenciable en x0 puesto que f lo
es para (x0 , y0 ) y por lo tanto, por el teorema del punto crítico para funciones
de una variable,
g 0 (x0 ) = fx (x0 , y0 ) = 0
En forma análoga, la función h(y) = f (x0 , y) tiene un valor extremo en y0 y
satisface la expresión
h0 (x0 ) = fy (x0 , y0 ) = 0
El gradiente es cero, ya que ambas derivadas parciales son 0.
Ejemplo 2.6.1 Encuentre el valor máximo o mínimo local de f (x, y) = x2 −
2x + y 2 /4.
Solución La función dada es derivable en todo el plano xy. Por lo tanto,
los únicos puntos críticos posibles son los puntos críticos que se obtienen al
igualar a cero fx (x, y) y fy (x, y). Pero fx (x, y) = 2x − 2 y fy (x, y) = y/2 son
iguales a cero sólo cuando x = 1 e y = 0. Falta por decidir si (1, 0) es un
máximo, un mínimo o nada de esto. Pronto desarrollaremos un instrumento
para esto, pero por ahora debemos proceder con un poco de ingenio. Obsérvese
que f (1, 0) = −1 y que
y2 y2 y2
f (x, y) = x2 − 2x + = x2 − 2x + 1 − 1 = (x − 1)2 + − 1 ≥ −1
4 4 4
Por lo tanto, f (1, 0) es en realidad un mínimo global de f. No hay valores
máximos locales.
Ejemplo 2.6.2 Encuentre los valores máximo o mínimo locales de f (x, y) =
−x2 /a2 + y 2 /b2 .
Solución. Los únicos puntos críticos se obtienen al igualar a cero fx (x, y) =
−2x/a2 y fy (x, y) = 2y/b2. Esto produce el punto (0, 0) que no da máximo ni
mínimo (vea la figura 11). Se llama punto de silla. Debe notarse que en toda
vecindad de (0, 0) hay puntos en los que f (x, y) < f (0, 0), y otros puntos en
los que f (x, y) > f (0, 0). La función dada no tiene extremos locales.
Este ejemplo ilustra la dificultad de que ∇f (x0 , y0 ) = 0 no garantiza que exista
un extremo local en (x0 , y0 ). Por fortuna, existe un criterio regular para decidir
lo que sucede en un punto crítico. El próximo teorema es un análogo a la prueba
de segunda derivada para funciones de una variable.
52
2.6.1. Criterio para determinar extremos de funciones de
dos variables
Teorema 2.6.3 [Condiciones suficientes para los extremos] Supóngase que f (x, y)
tiene segundas derivadas parciales continuas en una vecindad de −→
a ∈ R2 y que
2 −→ 2 −→ 2 −→
∂ f( a ) ∂ f( a ) ∂ f( a )
∇f (−
→a ) = 0. Sea A = , B= , C = y sea Hf (−
→
a)
∂x2 ∂x∂y ∂y 2
la matriz definida por
A B
Hf (− →
a)=
B D
−
→ −
→
Escribamos D( a ) = det(Hf ( a )). Entonces
∂ 2 f (−
→
a)
1. Si D(−→
a)>0 y > 0, entonces tiene un mínimo relativo en −
→
a.
∂x2
∂ 2 f (−
→
a)
2. Si D(−→
a)>0 y 2
< 0, entonces tiene un máximo relativo en −
→
a.
∂x
3. Si Si D(−
→
a ) < 0, entonces tiene un punto silla en −
→a.
4. Si D(−
→
a ) = 0, el criterio no decide nada.
Nota. La matriz Hf (− →
a ) se denomina matriz hessiana de f en −
→
a.
Para su demostración, remitimos al lector al apéndice. Sin embargo, podemos
ver de manera intuitiva porqué es cierto. D es
a ) ∂ 2 f (−
∂ 2 f (−
→ → 2 −
∂ f (→
2
−
→ a) a)
D( a ) = · −
∂x2 ∂y 2 ∂x∂y
∂ 2 f (−
→
a)
Para los casos 1 y 2, en los cuales D(− →a ) > 0, se tiene entonces que 2
·
∂x
∂ 2 f (−
→ ∂ 2 f (−
→ a ) ∂ 2 f (−
∂ 2 f (−
→ →
2
a) a) a)
2
> ≥ 0, por lo que las dos derivadas 2
y
∂y ∂x∂y ∂x ∂y 2
∂ 2 f (−
→
a)
deben tener el mismo signo. Así, si > 0, se tiene concavidad hacia
∂x2
arriba en las direcciones de ambos ejes, por lo que se puede sospechar que
∂ 2 f (−
→
a)
en − →
a existe un mínimo. Y si 2
< 0, se tiene concavidad hacia abajo
∂x
en la dirección de ambos ejes, por lo que se puede sospechar la existencia
de un máximo en − →a . En el caso 3, en el cual D(− →
a ) < 0, el producto de
2 − → 2 − →
∂ f( a ) ∂ f( a )
las dos derivadas y debe ser negativo y por lo tanto deben
∂x2 ∂y 2
tener signos opuestos; de tal manera que tenemos concavidad hacia arriba en la
dirección de uno de los ejes y concavidad hacia abajo en la dirección del otro,
por lo que sospechamos un punto silla en − →
a . Se deja al estudiante comprobar
la parte 4.
53
Ejemplo 2.6.3 Encuentre los extremos, si los hay, de la función f (x, y) =
3x3 + y 2 − 9x + 4y.
Solución. Puesto que fx (x, y) = 9x2 − 9 y fy (x, y) = 2y + 4, los puntos críticos
que se obtienen al resolver las ecuaciones simultáneas fx (x, y) = fy (x, y) = 0
son (1, −2) y (−1, −2).Ahora bien, fxx (x, y) = 18x, fyy (x, y) = 2 y fxy (x, y) =
fyx (x, y) = 0. Por lo tanto, en el punto crítico (1, −2) tenemos
2
D(1, −2) = fxx (1, −2)fyy (1, −2) − fxy (1, −2) = 18(2) − 0 = 36 > 0
Además, fxx (1, −2) = 18 > 0, por lo que según el teorema anterior, f (1, −2) =
−10 es un valor mínimo local de f. En la comprobación de la función dada en
otro punto crítico (−1, −2) encontramos que fxx (−1, −2) = −18, fyy (−1, −2) =
2 y fxy (−1, −2) = 0, lo cual produce D(−1, −2) = −36 < 0. Entonces, (−1, −2)
es un punto de silla y f (−1, −2) no es valor extremo.
Ejemplo 2.6.4 Encuentre los valores máximo y mínimo de f (x, y) = 2x2 +
y 2 − 4x − 2y + 5 en el conjunto cerrado U = {(x, y)| x2 + y 2 /2 ≤ 1}.
54
Ejemplo 2.6.5 Encuentre la distancia mínima entre el origen y la superficie
z 2 = x2 y + 4.
55
Dichas curvas tienen una recta tangente común y, por consecuencia, tienen una
perpendicular común. Pero en cualquier punto de una curva de nivel, el vector
gradiente ∇f es perpendicular a ella (ver sección 2.4.1) y en forma similar ∇g
es perpendicular a la curva de restricción g(x, y) = 0, pues dicha curva puede
verse como curva de nivel de la función z = g(x, y). Por lo tanto, ∇f y ∇g son
paralelos en p0 , es decir,
∇f (p0 ) = λ0 ∇g(p0 )
para algún número no nulos λ0 . Esto sugiere la siguiente formulación del método
de Lagrange.
∇f = λ ∇g
56
Teniendo en cuenta el método de multiplicadores de Lagrange observemos que
podemos formar la siguiente función
L(x, y, z, λ) = x2 + y 2 + z 2 − λ (2x − 2y + z − 4)
∂L ∂L ∂L
= 2x − 2λ = 0, = 2y + 2λ = 0, = 2z − λ = 0,
∂x ∂y ∂z
∂L
= −2x + 2y − z + 4 = 0
∂λ
Si se sustituyen los valores de 2x, 2y y z de las tres primeras ecuaciones en la
cuarta, se obtiene
λ 9 8
−2λ − 2λ − + 4 = 0, o − λ + 4 = 0, o λ=
2 2 9
Por tanto, x = 8/9, y = −8/9 y z = 4/9, así́ (8/9, −8/9, 4/9) es el punto
requerido, y la distancia de dicho punto al origen es
r r r
64 + 64 + 16 4+4+1 1 4
=4· = 4· =
81 81 9 3
Ejemplo 2.6.7 ¿ Cual es el área máxima que puede tener un rectángulo si la
longitud de su diagonal es 2?
57
maximización de f (x, y) = xy sujeta a la restricción g(x, y) = x2 + y 2 − 4 = 0.
Formando la función de Lagrange
L(x, y, λ) = xy − λ x2 + y 2 − 4
Calculando las derivadas parciales e igualando a cero para hallar los puntos
críticos de L obtenemos
∂L
(1) = 1 + λ1 + 2λ2 x = 0
∂x
∂L
(2) = 1 + 2λ1 + 2λ2 y = 0
∂y
∂L
(3) = 1 − λ1 = 0
∂z
∂L
(4) = x + 2y − z = 0
∂λ1
∂L
(5) = x2 + y 2 − 1 = 0
∂λ2
58
Al tomar λ1 = 1 (de (3)) en (1) obtenemos λ2 x = −1, o sea que x = −1/λ2 .
Similarmente, (2) nos da y = −3/(2λ2 ). Substituyendo en (5) tenemos
1 9
2 + 2 =1
(λ2 ) 4 (λ2 )
2 √
así́ que (λ2 ) = 13/4, λ2 = ± 13/2. Por tanto x = ∓ √213 , y = ∓ √313 y de (4)
tenemos z = x + 2y = ∓ √513 . Los valores que le corresponden para la función
f son
2 3 5 10
∓√ ∓ √ ∓ √ = ∓√ .
13 13 13 13
Solución.
Definimos las funciones f y g como sigue:
F:=x^3-x*y+y^2+3-z
x3 − xy + y 2 − z + 3
g:=x^2+2*y^2-1
x2 + 2y 2 − 1
plot(
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2))
59
Recordemos que las curvas de nivel se obtienen intersectando la superficie con
planos z = constante. Abajo se ve un ejemplo para z = 3,5:
plot(
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Surface([x,y,3.5],x=-1.2..1.2,y=-1.2..1.2,Color=RGB::Yellow),
plot::Implicit3d(F|z=3.5, x =-1.2..1.2, y=-1.2..1.2,z=3.45..3.55))
Resolvemos el sistema
∇f (x, y) = λ∇g(x, y)
g(x, y) = 0
que corresponde al sistema
60
3x2 − y = 2λx
−x + 2y = 4λy
2
x + 2y 2 = 1
tt:=numeric::solve([3*x^2-y=2*λa*x,-x+2*y=4*λ*y,x^2+2*y^2=1],[x,y,λ])
Como se ve, se tienen dos soluciones complejas y cuatro reales. Aislamos las
cuatro reales en la siguiente tabla:
table(1=tt[3],2=tt[4],3=tt[5],4=tt[6])
table(1=F|(x=0.9468,y=-0.2275,z=0),2=F|(x=0.5440,y=0.5933,z=0),
3=F|(x=-0.9853,y=-0.1207,z=0),4=F|(x=-0.3106,y=0.6721,z=0))
1 4,1158
2 3,1902
3 1,9390
4 3,6305
La gráfica siguiente muestra las cuatro curvas de nivel y la curva de restricción
con los puntos de tangencia en donde se encuentran los extremos.
plot(plot::Implicit2d(F|z=4.1158,x=-2..2,y=-2..2),
plot::Implicit2d(g,x=-2..2,y=-2..2,Color=RGB::Black),
plot::Implicit2d(F|z=3.1902,x=-2..2,y=-2..2,Color=RGB::Green),
plot::Implicit2d(F|z=3.6305,x=-2..2,y=-2..2,Color=RGB::Red),
plot::Implicit2d(F|z=1.939,x=-2..2,y=-2..2,Color=RGB::Brown),
plot::Point2d([0.94,-0.22],Color=RGB::Blue),
plot::Point2d([0.54,0.59],Color=RGB::Green),
61
plot::Point2d([-0.98,-0.12],Color=RGB::Brown),
plot::Point2d([-0.31,0.67],Color=RGB::Red))
plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),
62
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(F|z=4.1158, x =-1.2..1.2, y=-1.2..1.2,z=4.1..4.2),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue),
plot::Implicit3d(F|z=4.1158,x=-2..2,y=-2..2,z=0..0.1))
plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(F|z=3.1902, x =-1.2..1.2, y=-1.2..1.2,z=3.1..3.2),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue),
plot::Implicit3d(F|z=3.1902,x=-2..2,y=-2..2,z=0..0.1))
plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),
63
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(F|z=1.939, x =-1.2..1.2, y=-1.2..1.2,z=1.9..2),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue),
plot::Implicit3d(F|z=1.939,x=-2..2,y=-2..2,z=0..0.1))
plot(plot::Curve3d([cos(t),(1/sqrt(2))*sin(t),
(cos(t))^3-cos(t)*(1/sqrt(2))*sin(t)+(1/2)*(sin(t))^2+3], t = 0..2*PI,LineWidth=1),
plot::Surface([x,y,F|z=0],x=-1.2..1.2,y=-1.2..1.2),
plot::Implicit3d(F|z=3.6305, x =-1.2..1.2, y=-1.2..1.2,z=3.6..3.7),
plot::Implicit3d(g,x=-2..2,y=-2..2,z=0..0.1,LineColor=RGB::Blue),
plot::Implicit3d(F|z=3.6305,x=-2..2,y=-2..2,z=0..0.1))
64
Observe en este ejemplo que existen otros dos puntos de tangencia en donde
no hay extremos; esto demuestra que la condición de tangencia de la curva de
nivel con la curva de restricción para la existencia de un extremo, es solamente
una condición necesaria pero no suficiente.
f: U ⊂ Rn → R
−
→x → f (−
→
x)
−
→
x = (x1 , x2 , ..., xn ), le llamaremos campos escalares o funciones de varias vari-
ables. Un campo escalar asigna a cada vector − →
x un número real f (− →x ) ∈ R.
Cuando m > 1, definiremos los campos vectoriales como funciones
−
→
F : U ⊂ Rn → Rm
−
→ −
→
x → F (−
→
x)
−
→−
F (→
x ) = (f1 (−
→
x ), f2 (−
→
x ), ..., fm (−
→
x ))
−
→
donde cada una de las componentes de F , fi : U ⊂ Rn → R son campos
escalares o funciones de varias variables. Hablaremos de un campo vectorial
−
→
sobre Rn cuando F : U ⊂ Rn → Rn . Un campo vectorial asigna a cada
−
→→
vector −
→
x un vector F (−x ) ∈ Rm . Ver la figura en caso de campo vectorial sobre
R2 y R3 respectivamente.
65
De acuerdo a la definición de campo vectorial, podemos inicialmente hacer un
análisis de los campos escalares que naturalmente extenderemos a los campos
vectoriales.
Veamos algunos ejemplos de campos escalares y campos vectoriales:
o
−
→− → −
→
− = { F ( x ) ∈ Rm : x ∈ U }
R→
F
respectivamente.
66
a partir de −→a . Supongamos que se presenta esa dirección mediante un vector
−
→y . Esto es, supongamos que nos movemos desde − →
a hacia otro punto −
→a +−→y,
−
→ −
→ −
→
siguiendo el segmento de recta que une a con a + y . Cada punto de este
segmento tiene la forma − →a + t−
→
y , donde t es un número real. Mantengamos
t 6= 0 pero lo bastante pequeño para que −→
a + t−→y ∈ U y definamos el cociente
de diferencias
f (−
→
a + t−→
y ) − f (−
→
a)
t
El numerador de este cociente pone de manifiesto el cambio de la función cuando
nos desplazamos desde −→a a−→
a + t−
→
y . El cociente denomina a su vez el promedio
de variación de f en el segmento de recta que une − →
a a−→
a +− →
y . Nos interesa
el comportamiento de esa cociente cuando t → 0.
f (−
→
a + t−
→
y ) − f (−
→
a)
f 0 (a; −
→
y ) = lı́m
t→0 t
∂f ∂f
(x0 , y0 , z0 ) = fx (x0 , y0 , z0 ), (x0 , y0 , z0 ) = fy (x0 , y0 , z0 ),
∂x ∂y
∂f
(x0 , y0 , z0 ) = fz (x0 , y0 , z0 )
∂z
67
De acuerdo a la definición de derivada en una dirección, las derivadas parciales
fx (x0 , y0 ) y fy (x0 , y0 ) pueden expresarse
f (x0 + h, y0 ) − f (x0 , y0 )
fx (x0 , y0 ) = lı́m para y = y0 fijo
h→0 h
f (x0 , y0 + h) − f (x0 , y0 )
fy (x0 , y0 ) = lı́m para x = x0 fijo
h→0 h
En lugar de calcular fx (x0 , y0 ) y fy (x0 , y0 ) en forma directa a partir de las
definiciones, lo usual es encontrar fx (x0 , y0 ) y fy (x0 , y0 ) mediante las reglas
ordinarias de derivación; después se sustituyen x = x0 e y = y0 .
π π π π 2 π √2(π 2 + 8π)
2 2 2
fx ( , 1) = 2 · sen ·1 + · 1 · cos ·1 =
4 4 4 4 4 32
π 3 √
π π 2 3
fy ( , 1) = 2 · · cos · 12 = π
4 4 4 64
Si definimos
−
→ −
→
f (−
→
a + h )−f (−
→
a )−∇f (−
→
a )· h
E(a; h) = −
→ ,
khk
tendríamos de acuerdo a la definición, f es diferenciable en −
→
a si y sólo si
−
→
→
−
lı́m E(−
→
a; h)=0
h →0
68
Podemos escribir
−
→ −
→
f (−
→
a + h ) − f (−
→
a ) − ∇f (−
→
a ) · h = khkE(−
→
a ; h ),
o equivalentemente,
−
→ −
→
f (−
→
a + h ) = f (−
→
a ) − ∇f (−
→
a ) · h + khkE(−
→
a ; h ),
Además
−
→ −
→ −
→
f (−
→
a + h )=f (−
→
a )−∇f (−
→
a )· h +khkE(−
→
a ; h ),
−
→
y tomando el limite cuando h → 0 tenemos que
−
→
→
−
lı́m f (−
→
a + h ) =f (−
→
a ).
h →0
∂f (−
→
n
a)
f 0 (−
→
a ;−
→
y )=∇f (−
→
a )·−
→
X
y = yk
∂xk
k=1
f (−
→
a + t−
→
y )−f (−
→
a )=∇f (−
→
a )·t−
→
y + |t|E(−
→
a ;−
→
y ).
69
Dividiendo por t tenemos
f (−
→
a + t−
→
y )−f (−
→
a) |t| → −
= ∇f (−
→
a )·−
→
y + E(−a ;→
y ).
t t
|t|
Puesto que lı́mt→0 = ±1 tenemos que
t
f (−
→
a + t−
→
y )−f (−
→
a)
lı́m = ∇f (−
→
a )·−
→
y.
t→0 t
Por lo tanto
f 0 (−
→
a ;−
→
y )=∇f (− →a )·−
→
y.
∂f (−
→
a) −
Además, teniendo en cuenta que f 0 (−
→
a ; ek ) = y→
y = u 1 e1 + · · · + u n en
∂xk
concluimos que
f 0 (−
→
a ;−
→
y) = ∇f (−
→
a)·−→ e1 + · · · +un −
a )· (u1 −
y = ∇f (−
→ → e→
n)
n
uk ∇f (−
→
a)·−
→
X
= ek
k=1
∂f (−
→ ∂f (−
→ ∂f (−
→
n n
a) a) a)
uk f (−
→
a ;−
→
X X
0
= ek ) = uk = ,..., · (u1 , . . . , un ).
∂xk ∂xk ∂xn
k=1 k=1
∂f (−
→ ∂f (−
→
−
→ a) a)
∇f ( a )= ,...,
∂x1 ∂xn
Si f es diferenciable en −
→
a , existen todas las derivadas parciales. No obstante la
existencia de todas las derivadas parciales no garantiza que f sea diferenciable
en −
→a .
∂f ∂f
Mostremos que (0, 0) y (0, 0) existen. Por definición
∂x ∂y
70
y
∂f f ((0, 0) + tj) − f (0, 0) f (tj) f (0, t)
(0, 0) = lı́m = lı́m = lı́m = 0.
∂y t→0 t t→0 t t→0 t
Sin embargo la función no es continua en (0, 0) . Observemos que f (x, 0) = 0 y
f (0, y) = 0 . Así́ a través de los ejes coordenados f → 0 cuando nos acercamos
al origen. Sin embargo si nos acercamos al origen sobre la parábola x = y 2
tenemos que f (y 2 , y) = 1/2 . Así́ f (x, y) → 1/2 cuando x = y 2 y y → 0 .
Puesto que f (0, 0) 6= 1/2, f no es continua en (0, 0) y por lo tanto no puede
ser diferenciable en (0, 0) .
Teorema 2.7.3 (Condición suficiente de diferenciabilidad). Si existen
∂f ∂f
las derivadas parciales ,..., en cierta n-bola B(−
→
a ;−
→
r ) y son continuas
∂x1 ∂xn
en −→
a , entonces f es diferenciable en −→a .
Como f es diferenciable en −
→
a entonces
f (−
→
a +−
→
y ) − f (−
→
a ) = ∇f (−
→
a)·−
→
y + k−
→
y kE(−
→
a ; y).
71
donde E(−
→
a ; y) → 0 cuando |yk → 0. Ahora,
g(t + h) − g(t) = ∇f (−
→
a ) · (−
→
r (t + h) − −
→
r (t)) + k−
→
r (t + h) − −
→
r (t)kE(−
→
a ;−
→
y ).
g(t + h) − g(t) (−
→
r (t + h)) − −
→
r (t)) −
→
r (t + h)) − −
→
r (t)
= ∇f (−
→
a )· +k kE(−
→
a ;−
→
y ).
h h h
Tomando h → 0 tenemos que
−−→
g 0 (t) = ∇f (−
→
r (t)) · r0 (t)).
Si escribimos −
→
r en sus ecuaciones paramétricas x1 = x1 (t), x2 = x2 (t), ..., xn =
xn (t) podemos escribir g 0 (t) en la forma
∂f − dx1 ∂f − dxn
g 0 (t) = (→
a) + ... + (→
a)
∂x1 dt ∂xn dt
Cuando − →
a describe una curva C , la derivada direccional de f en la dirección
−
→
del vector tangente unitario T (t) se llama derivada direccional de f a lo largo
de la curva C .
72
Solución: La fórmula del área total de un cilindro es S(r, h) = 2πrh + 2πr2 .
En consecuencia,
dS ∂S dr ∂S dh
= + = (2πh + 4πr)(0,2) + (2πr)(0,5)
dt ∂r dt ∂h dt
Cuando r = 10 y h = 100,
dS
= (2π · 100 + 4π · 10)(0,2) + (2π · 10)(0,5) = 58π cm2 por hora
dt
Ejemplo 2.7.9 Suponga que w = x2 y + y + xz, donde x = cos θ, y = sen θ, y
z = θ2 . Encuentre dw/dθ y la evalúe para θ = π/3.
Solución.
dw ∂w dx ∂w dy ∂w dz
= + + = (2xy + z)(−sen θ) + (x2 + 1)(cos θ) + (x)(2θ)
dθ ∂x dθ ∂y dθ ∂z dθ
= −2 cos θ sen2 θ − θ2 sen θ + cos3 θ + cos θ + 2θ cos θ
En θ = π/3,
√ √
1 1 π2 1 π2 3 π
dw 3 1 1 2π 1
= −2 · · − · + +1 + · =− − +
dθ 2 3 3 2 4 2 3 2 8 18 3
Suponemos en seguida que z = f (x, y), donde x = x(s, t) e y = y(s, t) de modo
que z es una función de dos variables z = f [x(s, t), y(s, t)] = h(s, t). Entonces,
tiene sentido preguntar por ∂z/∂s y ∂z/∂t.
−
→− −
→→
−
→0 −→ −
→ F (→
a + t−
→
y ) − F (−
a)
F ( a ; y ) = lı́m
t→0 t
Siempre que el límite exista. Observemos que esta derivada es un vector de Rm .
De acuerdo a la definición de límites para campos vectoriales podemos observar
que
−
→0 −
F (→a ;→
−
y ) = (f10 (−
→
a ;−
→
y ), f20 (−
→
a ;−
→ 0 −
y ), ..., fm (→
a ;−
→
y ))
−
→0 −
En el caso que y es un vector unitario, es decir k y k = 1, F (→
−
→ −
→ a ;−
→
y ) se llama
derivada direccional de un campo vectorial.
73
2.7.6. Diferenciabilidad de un campo vectorial
−
→
Definición 2.7.6 Diremos que un campo vectorial F es diferenciable en −
→
a si
−−→ −
existe una matriz DF (→
a ) m × n (la matriz Jacobiana) tal que
−
→− −
→ −
→→ −−→ → − →
F (→ a ) − DF (−
a + h ) − F (− a)· h
lı́m
→
−
=0
h →0 khk
De esta definición y por las propiedades de los límites diremos que está defini-
−
→
ción implica que cada componente de F , fi , es diferenciable en −
→
a.
Denotemos por
−
→− −
→ −
→→ −−→ → − →
−
→
−
→− −
→ F (→
a + h ) − F (−
a ) − DF (−
a)· h
E (→
a, h)= .
khk
−
→
→→ −
− →
Observemos que E (−
a , h ) es un vector de Rm . Esto nos permite escribir
−
→− −
→ −
→→ −−→ → − → −
→→ → −
F (→
a + h ) = F (−
a ) + DF (−
a ) · h + khk E (−
a, h)
−
→
y decir que un un campo vectorial F es diferenciable en −
→a si existe una matriz
−−→ − −
→
−
→− −
→
→
DF ( a ) m×n tal que la igualdad anterior se cumple donde lı́m→ − E (→
a, h) =
h →0
0. Esta fórmula es
conocida como fórmula de Taylor de primer orden. válida
−
→
−→
−−→ →
para todo h con
h
< r para cierto r > 0. La matriz DF (− a ) la llamaremos
−
→ − →
la derivada de F en a .
∇f1
−−→ → −−→ →
Vamos a demostrar que la matriz DF (− a ) = ...
a ) es DF (− donde ∇fi
∇fm
(i = 1, ..., m) es el gradiente de la función fi (i = 1, ..., m).
Observemos que
−
→− −
→ −
→→ −
→ −
→
F (→
a + h ) − F (−
a) = (f1 (−
→
a + h ), ..., fm (−
→
a + h )) − (f1 (−→
a ), ..., fm (−
→
a ))
−
→ −
→
= (f (−
1
→
a + h ) − f (−
1
→a ), ..., f (−
m
→
a + h ) − f (−
m
→
a ))
−
→ −
→ −
→
fi (−
→
a + h ) − fi (−
→
a ) = ∇fi · h + khk Ei (−
→
a, h)
−
→
donde lı́m→
− E (−
h →0 i
→
a , h ) = 0. Por lo tanto
74
−
→− −
→ −
→→ −
→ −
→
F (→
a + h ) − F (−
a) = (f1 (−
→a + h ), ..., fm (−
→a + h )) − (f1 (− →a ), ..., fm (−
→
a ))
−
→ −
→ −
→ −
→ −
→ −
→
= (f1 ( a + h ) − f1 ( a ), ..., fm ( a + h ) − fm ( a ))
−
→ −
→ −
→ −
→
= (∇f1 · h + khk E1 (− →a , h ), ..., ∇fm · h + khk Em (− →
a , h ))
−
→ −
→ −
→ −
→
= (∇f1 · h , ..., ∇fm · h ) + (khk E1 (− →
a , h ), ..., khk Em (−→a , h ))
−
→ −
→ −
→ →
−
= (∇f1 · h , ..., ∇fm · h ) + khk (E1 (− →
a , h ), ..., Em (−→
a , h ))
−−→ → − → −
→ −
→ − →→ − → −
→ −
→
Si DF (−
a )· h = (∇f1 · h , ..., ∇fm · h ) y E (−
a , h ) = (E1 (−
→
a , h ), ..., Em (−
→
a , h ))
tenemos que
−
→− −
→ −
→→ −−→ → − → →→ −
− →
F (→a + h ) = F (− a ) + DF (−
a ) · h + khk E (−
a, h)
−
→− →
−
donde lı́m→
−
h →0
E (→a , h ) = 0. Esto implica que
∇f1
−−→ − ∇f2
DF (→
T
a)= .. = ∇f1 ∇f2 ··· ∇fm .
.
∇fm
−
→0 −
F (→
a ;−
→
y) = (f10 (−
→
a ;−
→
y ), f20 (−
→
a ;−
→ 0 −
y ), ..., fm (→a ;−
→
y ))
−
→ −
→ −
→ −−→ → −→
= (∇f1 · h , ∇f2 · h , ..., ∇fm · h ) = DF (− a)· h
−
→ → −
Esta fórmula nos permite determinar fácilmente la derivada F 0 (−
a ;→
y ).
−
→
Ejemplo 2.7.10 Supongamos que T : Rn → Rm es una transformación lineal.
(Una transformación lineal es un ejemplo
−
→
particular de campo vectorial). Vamos a mostrar que T es difenciable y que
−−→ − −
→ −
→→
DT (→x)=− →a donde −
→
a es la matriz m×n asociada a T ,esto es T (−
x)=− →a−
→x.
→−
− → − → −
→→ −
→ −
→− −
→ −
→
T (x + h ) − T (−
x)−−
→
a h A (→x + h)−− →
a−→
x −−
→
a h
lı́m
→
−
−
→
= lı́m
→
−
−
→
h →0
h
h →0
h
−
→ −
→ →− −
→
a−→x +−→
a h −− a→
x −−
→a h
= →
lı́m
−
−
→
=0
h →0
h
75
−−→ → −
→
entonces DT (− x)= A
Así todos las transformaciones lineales son campos vectoriales diferenciables.
donde E(−
→
a ; y) → 0 cuando |yk → 0. Ahora,
−
→ −
→ −
→→ −
→→ −
G (t + h) − G (t) = D F (−
a ) · (r(t + h) − r(t)) + kr(t + h) − r(t)k E (−
a ;→
y ).
76
Dividiendo por h obtenemos
−
→ −
→
G (t + h) − G (t) → → (−
− →
r (t + h)) − −
→
r (t)) −
→
r (t + h)) − −
→
r (t)
= D F (−
a )· +k kE(−
→
a ;−
→
y ).
h h h
Tomando h → 0 tenemos que
−
→0 −
→→
G (t) = D F (−
r (t)) · −
→
r 0 (t).
−
→ − →
Teorema 2.7.6 [Regla de la cadena general] Sea F y G dos campos vec-
−
→ −
→ − →
toriales en un abierto U donde la función compuesta H = F ◦ G esta bien
−
→− −
→ −
→ −
→
definida por H (→x ) = F ( G (−
→
x )) donde x ∈ U.. Sea x ∈ U en el que D G 0 (x)
−
→ −
→→ −
→→
existe y tal que F es diferenciable en G (−
x ) . Entonces D H (−
x ) existe y
−
→→ −
→− →→ −
→→
D H (−
x ) = D F ( G (−
x ))D G (−
x ).
−
→→
Demostración. Sea − →a = G (− x ) . Puesto que U es abierto existe una bola
−
→→
B(−→
a ) ⊂ U y tomemos h 6= 0 tal que − →r (t + h) ∈ B(− →
a ) . Sea −
→y = G (− x +
−
→ −
→ − → −
→ −
→
h ) − G (( x ) . Claramente si h → 0 entonces y → 0 . ahora consideremos
−
→− −
→ −
→→ −
→− →→ − → −
→− →→ −
→→ − −
→→
H (→x + h ) − H (− x ) = F ( G (−
x + h )) − F ( G (− x )) = F (−a +→ y ) − F (−
a ).
−
→ −
→
Como F es diferenciable en a entonces
−
→− −
→→ −
→→− −
→→ −
F (→
a +−
→
y ) − F (−
a ) = D F (−
a )→
y + k−
→
y k E (−
a ;→
y ).
−
→→
donde E (−
a ; y) → 0 cuando |yk → 0. Ahora,
−
→− −
→ −
→→ −
→→ − → −
→
H (→
x + h ) − H (−
x) = D F (−a ) · G ((x + h) − G ((x) +
−
→ −
→ −
→→ −
k G ((x + h) − G ((x)k E (− a ;→y ).
−
→− → −
→
−
→
h
i
= D F ( a ) · D G (x) · h +
h
E(x, h) +
h − →
−
→
−
→ i −→→ −
kD G(x) · h +
h
E (x, h) k E (− a ;→y)
−
→→ −
→ → →
−
− →
= D F (−a ) · D G (x) · h + D F (−
a ) ·
h
E(x, h) +
−
→
−
h − →
→ i −→→ −
kD G(x) · h +
h
E (x, h) k E (− a ;→y ).
77
−
→
Dividiendo por
h
obtenemos
−
→− −
→ −
→→ −
→→ −
→
H (→
x + h ) − H (−
x ) − D F (−
a ) · D G (x) · h −
→→
−
→
= D F (−
a ) · E(x, h) +
h
−
−
→
→
kD G(x) · h +
h
E(x, h) −
→−
−
→
E (→
a ;−
→y ).
h
−
→ −
→
Tomando h → 0 tenemos que
−
→→ −
→− →→ −
→→
D H (−
x ) = D F ( G (−
x ))D G (−
x)
−
→
Definición 2.7.7 Divergencia de un campo vectorial. Sea F : U ⊂ Rn →
−
→→
Rn donde U es un subconjunto de Rn un campo vectorial dado por F (− x)=
(f1 (−
→
x ), f2 (−
→
x ), ..., fn (−
→
x )) −
→
x = (x1 , x2 , ..., xn ). Definimos la divergencia
−
→
de F como
→ ∂f1 (−
− →
x ) ∂f2 (− →
x) ∂fn (−
→
x)
div F = + + ... + .
∂x1 ∂x2 ∂xn
∂ ∂ ∂
Si representamos ∇ = , , ..., observemos que podemos denotar
∂x1 ∂x2 ∂xn
divF = ∇ · F. Hay que tener en cuenta que la divergencia es un campo escalar.
−
→ −
→
Ejemplo 2.7.12 Sea F (x, y, z) = (x2 y, xyz, x2 z). La divergencia de F es
−
→
div F = 2xy + xz + x2 .
Ejemplo 2.7.13 Sea
−
→
!
−
→ r x y z x y z
F (x, y, z) = − = , , = , , ,.
k→ k−
→r k k− →
r k k− →
3 3 3 3 r3 r3 r3
rk rk
x y z
donde r = k−→ p
r k = x2 + y 2 + z 2 . Sean f1 = 3 , f1 = 3 , f2 = 3 . Entonces
r r r
3
∂ r ∂ (r) x
r3 − x r3 − 3xr2 r3 − 3xr2 3 2
∂f1
= ∂x = ∂x = r = r − 3x r ,
∂x r6 r6 r6 r6
3
∂ r ∂ (r) y
r3 − x r3 − 3yr2 r3 − 3yr2 3 2
∂f2
=
∂y
=
∂y
= r = r − 3y r ,
∂y r6 r6 r6 r6
3
∂ r ∂ (r) z
r3 − x r3 − 3zr2 r3 − 3yr2 3 2
∂f 3
= ∂z = ∂z = r = r − 3z r .
∂z r6 r6 r6 r6
78
Sumando estas derivadas tenemos que
−
→ ∂f1 ∂f2 ∂f2 3r3 − 3r3
div F = + + = = 0.
∂x ∂y ∂y r6
−
→
Definición 2.7.8 Rotacional de un campo vectorial. Sea F : U ⊂ R3 →
R3 donde U es un subconjunto de Rn un campo vectorial dado por
−
→
F (x, y, z) = (P (x, y, z), Q(x, y, z), R(x, y, z)
−
→
Definimos el rotacional de F al vector definido por
−
→
∂R ∂Q ∂P ∂R ∂Q ∂P
rot F = − , − , −
∂y ∂z ∂z ∂x ∂x ∂y
i j k
−
→ −
→ ∂ ∂ ∂
rot F = ∇ × F =
∂x ∂y ∂z
P Q R
−
→
Observación 2.7.2 En el caso que F (x, y) = (P (x, y), Q(x, y)) definiremos
−
→
el rotacional de F como
i j k
−
→ ∂
∂ ∂Q ∂P
rot F = 0 = − k
∂x ∂y ∂x ∂y
P Q 0
−
→ −
→
Observación 2.7.3 Si el vector rot F = 0 , diremos que es campo vectorial
es un campo irrotacional.
.
−
→
Ejemplo 2.7.14 Sea F (x, y, z) = (−x, xy + y, 2x − xz), entonces el rotacional
es dado por
i j k
−
→ ∂ ∂ ∂
rot F = = (−x, xy + y, 2x − xy) = −xi+ (xy + y) j−xyk.
∂x ∂y ∂z
xyz x2 −xy
79
Definición 2.7.9 Laplaciano de un Campo Escalar. Sea f (x, y, z) un
campo escalar.diferenciable con derivadas de orden dos, definimos el Lapla-
ciano de f, ∆f, como la divergencia del gradiente de f, esto es
∂2f ∂2f
∆f = div (∇f ) = +
∂x2 ∂y 2
∂f ∂2f
= 3x2 − 3y 2 2
= 6x
∂x ∂x
2
∂f ∂ f
= −6xy = −6x
∂ ∂y 2
Entonces
∆f = 0.
Demostración. Fijemos −
→
y ∈ Rn . Definamos la función
g(t) = f (−
→
a + t−
→
y ), 0 ≤ t ≤ 1.
80
Claramente g(0) = f (a) y g(1) = f (−
→
a +−
→
y ). Por lo tango f (−
→
a +−
→
y ) − f (−
→
a)=
g(1) − g(0).
Como g es una función real, aplicamos la fórmula de Taylor de orden 2 en el
intervalo [0, 1]. Así́
1 00
g(1) = g(0) + g 0 (0) + g (c), 0<c<1
2!
(Resultado de Cálculo I).
Aplicando regla de la cadena a g tenemos que
∂f (−
→
a + t−
→
n
y)
∇f (−
→
a + t−
→
y )·−
→
X
0
g (t) = y = yi
∂xi
i=1
∂f (−
→
a + t−
→
y) ∂f (−
→
a + t−
→
y) ∂f (−
→
a + t−
→
y)
= y1 + y2 + · · · + yn
∂x1 ∂x2 ∂xn
∂f (−→a + t−→ ∂f (−
→a + t−→
y) − y) −
g 00 (t) = ∇ ·→ y y1 + ∇ ·→y y2 + · · · +
∂x1 ∂x2
−
→ −
→
∂f ( a + t y ) −
∇ ·→ y yn
∂xn
2 −
∂ f (→ a + t−→ ∂ 2 f (−
→a + t−→ ∂ 2 f (−
→a + t−→
y) y) y)
= y1 + y2 + · · · + yn y1
∂x21 ∂x2 ∂x1 ∂xn ∂x1
2 −
∂ f (→ a + t−
→ ∂ 2 f (−
→
a + t−→ ∂ 2 f (−
→
a + t−→
y) y) y)
+ y1 + y2 + · · · + yn y2
∂x1 ∂x2 ∂x22 ∂xn ∂x2
..
.
∂ 2 f (−
→a + t−
→ ∂ 2 f (−
→
a + t−→ ∂ 2 f (−
→
a + t−→
y) y) y)
+ y1 + y2 + · · · + y n yn .
∂x1 ∂xn ∂x2 ∂xn ∂x2n
∂ 2 f (−
→
a + t−
→
n X
n
y)
yi yj = −
→
y H(−
→
a + c−
→
y )−
→
X
00
g (t) = y |.
i=1 j=1
∂xi ∂xj
Así́,
g 00 (c) = −
→
y H(−
→
a + c−
→
y )−
→
y |.
y por lo tanto así́ demostramos que
1→ −
f (−
→
a +−
→
y ) = f (−
→
a ) + ∇f (−
→ y + −
a)·−
→ y H(→
a + c−
→
y )−
→
y |, 0 < c < 1.
21
81
Para demostrar la segunda parte, definamos
1− −
→
k−
→
y k E2 (−
→
a ;−
→
y)= →
y [H(−
→
a + c−
→
y ) − H(a)] −
→
y |, −
→ 6 0
y =
21
y
→
−
E2 (−
→
a; 0)=0 .
En este caso tenemos que
1 →| −
f (−
→
a +−→
y ) = f (−
→
a ) + ∇f (−
→
a)·−→y + − y H(→
a )−
→
y + k−
→
y k E2 (−
→
a ;−
→
y ).
2!
Vamos a mostrar que lı́m E (−
→
−
→a ;→
−
y ) = 0.
2
→
−
y→0
n 2 − → −
→ 2 − →
n X
X
∂ f ( a + t y ) ∂ f ( a )
k−
→
y k |E2 (−
→
a ;−
→
2
y )| = − yi yj
i=1 j=1 ∂xi ∂xj ∂xi ∂xj
n X n
∂ 2 f (−
→
a + t− →
y ) ∂ 2 f (− →
X a ) − → 2
≤ − k y k .
i=1 j=1
∂x i ∂xj ∂x i ∂x j
∂ 2 f (−
→
a + t−→
y) ∂ 2 f (−
→
a)
lı́m→
−
=
→
−
y→0 ∂xi ∂xj ∂xi ∂xj
82
−
→
1. Q(−
→
y ) > 0 ∀−
→ 6 0 ⇐⇒los valores propios de A son positivos.
y =
−
→
2. Q(−
→
y ) < 0 ∀−
→y 6= 0 ⇐⇒los valores propios de A son negativos.
−
→ → − →
Claramente ∀−→y 6= 0 , − x 6= 0 . Si los valores propios de A son positivos entonces
−
→
Q(y) > 0. Ahora si Q(y) > 0 ∀− →y 6= 0 , tenemos en particular que si y = ei P > ,
donde ei = (0, · · · , 1, · · · 0) es el k-esimo vector unitario de la base usual tenemos
que Q(y) = λi > 0.
La parte (2) se prueba de manera similar.
Teorema 2.7.9 Sea f un campo escalar con derivadas de orden dos continuas
en una bola Br (−
→
a ). Sea H(−
→
a ) la matriz Hessiana en un punto estacionario
−
→a . Entonces:
3. Si H(−
→a ) tiene valores propios negativos y positivos entonces f tiene un
punto silla en −→
a.
−
→
Demostración. sea Q(y) = − →
y H(−
→
a )−
→y > y puesto que ∇f (a) = 0 , tenemos
que
1 →| −
f (−
→
a +−→ a)= −
y ) − f (−
→ y H(→ a )−
→
y + k−→
y k E2 (−
→
a ;−
→
y ).
2!
donde lı́m→
−
E2 (−
→
a ;−
→y ) = 0 . Vamos a mostrar que existe r > 0, tal que
→
−
y→0
0 < k− →y k < r, talque f (− →a +−→y ) − f (−
→
a ) tiene el mismo signo que Q(y).
Supongamos que los valores propios de H(− →a ) son positivos λ1 , λ2 , · · · , λn .Si
h = mı́n{λ1 , λ2 , · · · , λn } y 0 < t < h entonces λ1 − t, λ2 − t, · · · , λn − t son
también positivos. Estos son los valores propios de H(− →
a ) − tI, siendo I la ma-
triz idéntica n × n. Por lo tanto la forma cuadrática − →
y (H(− →a ) − tI) − →y> > 0
−
→ −
→
∀ y 6= 0 de acuerdo al teorema anterior. Por lo que concluimos que
−
→
y H(−
→
a )−
→
y > > t k−
→
yk
2
∀0 < t < h.
83
−
→
Tomando t = 12 h tenemos Q(y) > 21 h k−
→
y k ∀−
2 →
y 6= 0 . Puesto que lı́m→
−
E2 (−
→
a ;−
→
y)=
→
−
y→0
0, existe r > 0 tal que |E2 (−
→
a ;−
→y )| < 41 h con tal que 0 < k−
→
y k < r. Para tales
−
→
y tenemos
1 1
0 ≤ k−
→y k E2 (−
→
a ;→
−
y ) < h < Q(y).
4 2
Esto demuestra que
1
f (−
→
a +−→y ) − f (−
→
a ) ≥ Q(y) − k− →
y k E2 (−
→
a ;−
→
y)>0
2
Por consiguiente f tiene un mínimo relativo en − →
a.
En la misma forma se prueba (2).
Para mostrar (c) supongamos que λ1 y λ2 son valores propios de H(− →a ) con
signos opuestos. Sea h = mı́n{|λ1 | , |λ2 |}, para 0 < t < h entonces λ1 − t, λ2 − t
son valores propios de H(− →a ) − tI de signos opuestos. Por lo tanto La for-
ma cuadrática y (H( a ) + tI)−
−
→ −
→ →y | toma valores positivos en una vecindad
−
→
de a . Nuevamente, puesto que lı́m→ E2 (−
→a ;−
→
y ) = 0, existe r > 0 tal que
→
− −
y→0
|E2 (−
→ y )| < 41 h con tal que 0 < k−
a ;−
→ →
y k < r. Para tales −
→y tenemos que el signo
−
→ −
→ −
→
de f ( a + y ) − f ( a ) es el mismo que el de Q(y). Entonces tenemos en la
vecindad de − →a valores positivos y negativos de f. por lo tanto f tiene un punto
−
→
silla en a .
y D = det(H(−
→
a )). Entonces
∂ 2 f (−
→a)
1. Si D > 0 y 2
> 0, entonces tiene un mínimo relativo en −
→
a.
∂x
∂ 2 f (−
→a)
2. Si D > 0 y < 0, entonces tiene un máximo relativo en −
→
a.
∂x2
3. Si Si D < 0, entonces tiene un punto silla en −→a.
4. Si D = 0, el criterio no decide nada.
84
Demostración. Para calcular los valores propios de la matriz Hessiana, hal-
lamos la ecuación característica det(λI − H(− →a )) = 0, teniendo la ecuación en
λ,
λ2 − (A + C)λ + D = 0
donde D = det(H(− →a )). Los valores propios λ y λ están ligados por la relación
1 2
λ1 + λ2 = A + C y λ1 λ2 = D.
Observando que
1 dv 2 (t) −−−→ −−→
m = mr00 (t) · r0 (t)
2 dt
y
−−→
dϕ(r0 (t)) −−→ −−→
= ∇ϕ(r(t)) · r0 (t),
dt
85
tenemos que
−−→
d 1
mv 2 (t) + ϕ(r0 (t)) = 0
dt 2
−−→
De lo cual concluimos que la función 12 mv 2 (t) + ϕ(r0 (t)) es una constante.
Este resultado se conoce como la ley de la conservación de la energía.
−−→
La función 12 mv 2 (t) se le llama la energía cinética y a la función ϕ(r0 (t))
energía potencia. Por lo tanto la ley de la conservación dice que la suma de
la energía cinética y potencial es una constante.
−
→− 1 −
→
x
F (→
x)=C −
→ 2 k−
→
kxk xk
→
−
ya que x
es un vector unitario en la dirección de −
→
x . Así
k→
−
xk
−
→− 1 −
F (→
x)=C −
→
→
3 x.
kxk
86
Capítulo 3
Integrales Múltiples
Formemos la suma
N
X
f (xk , yk )∆Ak
k=1
87
RDefinición
R 3.1.1R R.Definimos la integral doble de f sobre S, denotada por
S f (x, y)dA ó S f (x, y)dxdycomo
Z Z N
X
f (x, y)dA = lim||P ||→0 f (xk , yk )∆Ak
S k=1
1.
RR RR RR
S [c1 f (x, y) + c2 g(x, y)]dxdy = c1 S f (x, y)dxdy + c2 S g(x, y)dxdy
2. Si S = S1 ∪ S2 y S1 ∩ S2 = φ, entonces
Z Z Z Z Z Z
f (x, y)dxdy = f (x, y)dxdy + f (x, y)dxdy
S S1 S2
88
3. si f ≤ g entonces
Z Z Z Z
f (x, y)dxdy ≤ g(x, y)dxdy
S S
En particular si f ≥ 0 entonces
Z Z
f (x, y)dxdy ≥ 0
S
Región tipo I.
esto es, la región acotada a izquierda y derecha por líneas rectas y arriba y
abajo por las funciones φ2 (x) y φ1 (x) como se muestra en la figura abajo.
89
En este caso las integrales iteradas toman la forma
!
Z Z Z b Z φ2 (x)
f (x, y)dxdy = f (x, y)dy dx
S a φ1 (x)
esto es, la región acotada arriba y abajo por lineas rectas horizontales y a
izquierda y a derecha por las funciones φ1 (y) y φ2 (y) como se ve esquematizado
en la gráfica abajo.
90
En este caso, las integrales iteradas toman la forma
!
Z Z Z d Z φ2 (y)
f (x, y)dxdy = f (x, y)dx dy
S c φ1 (y)
Una región puede ser al mismo tiempo de tipo I ó tipo II. Por ejemplo, la región
que se muestra en la figura abajo.
S = (x, y) : 0 ≤ x ≤ 1, x2 ≤ y ≤ x
y de tipo II en la forma
√
S = {(x, y) : y ≤ x ≤ y, 0 ≤ y ≤ 1}
91
Por lo tanto podemos definir el volumen del sólido como
Z b Z φ2 (x) Z Z
V ol(Sol) = [ f (x, y)dy]dx = f (x, y)dxdy
a φ1 (x) S
x2 + y 2 + z 2 = R2
Solución.
p El sólido está comprendido
p entre las gráficas de z = f (x, y) =
R − x − y y z = g(x, y) = − R − x2 − y 2 . La región S = (x, y) : x2 + y 2 ≤ R2 .
2 2 2 2
RR RR
V ol (V ) = S [f (x, y) − g(x, y)]dxdy = 2 S f (x, y)dxdy
R R R √R2 −x2 p
=8 0 [ 0 R2 − x2 − y 2 dy]dx
√ p
Hagamos A = R2 − x2 o sea A2 = R2 − x2 por lo tanto r2 − x2 − y 2 =
y 2
p p
A2 − y 2 = A 1 − ( A ) . Si hacemos el cambio de variable y = asenθ en-
92
tonces dy = a cos θdθ y obtenemos
Z Z
V ol(V ) = 2 f (x, y)dxdy
S
Z R Z √R2 −x2 p
" # Z R
"Z √
R2 −x2 p
#
= 8 R2 − x2 − y 2 dy dx = 8 A2 − y 2 dy dx
0 0 0 0
"Z #
Z R π/2 p
2
= 8 A 1 − sen θ cos θdθ dx
2
0 0
π/2
R π ZR Zπ/2
1 − cos 2θ 1
Z Z
= 8 [ A2 cos2 θdθ]dx = 8 A2 = θ dx
0 0 2 2
0 0
0
R R
π 2 π
Z Z
= 8 A dx = 8 (R2 − x2 )dx
0 4 4 0
R
x3 R3 2 4
= 2π (R x − ) = 2π(R3 −
2
) = 2π R3 = πR3 .
3 0 3 3 3
Ejemplo 3.1.2 . Dibujemos la región de integración de
Z 1Z x
[ f (x, y)dy]dx
0 x2
La región de integración está dada por
S = (x, y) : 0 ≤ x ≤ 1, x2 ≤ y ≤ x
93
A este cambio en los limites de integración se le conoce como cambio en el orden
de integración (invertir el orden de integración), lo que puede hacerse cuando
la región es de los dos tipos al mismo tiempo. Muchas veces integrales que no
podemos calcular en un orden determinado, podemos resolverla invirtiendo su
orden como se puede ver en el ejemplo a continuación:
p
Observemos que la integral y 3 + 1 no tiene antiderivada elemental. Como S
también es de tipo II, podemos invertir el orden de integración y obtenemos la
descripción
S = {(x, y) : 0 ≤ y ≤ 2, 0 ≤ x ≤ 3y}
Así la integral la podemos expresar como
Z 6Z 2 p Z 2 Z 3y p Z 2 p Z 3y
[ x y 3 + 1dy]dx = [ x y 3 + 1dx]dy = y 3 + 1[ xdx]dy
0 x/3 0 0 0 0
2 Z 2
x2 3y 9 2p 3
Z p
= 3
y + 1[ |0 ]dy = y y + 1dy
0 2 0 2
2
= (y 3 + 1)3/2 = 27 − 1 = 26
0
94
3.1.4. Cambio de variable
x = r cos θ
y = rsenθ.
95
Observemos que también podríamos escoger en lugar del intervalo [0, 2π) para
los valores de θ, cualquier intervalo de longitud 2π. Otro intervalo que se utiliza
también es el intervalo (−π, π) .
Definamos la función
(x, y) = T (r, θ) = (r cos θ, rsenθ)
como un cambio de coordenadas polares a las coordenadas cartesianas. Ob-
servemos que en este caso la matriz Jacobiana está dada por
sen θ
∂(x, y) cos θ
=
∂(r, θ) −rsen θ r cos θ
sen θ
cos θ
y su Jacobiano está dado por J = det = r.
−rsen θ r cos θ
La función T transforma regiones rectangulares en el plano r − θ en regiones
circulares en el plano x − y.
Ejemplo 3.1.5 La región rectangular para a > 0
U = {(r, θ) : 0 ≤ r ≤ a, 0 ≤ θ < 2π}
se transforma en la región
S = Br (a) = (x, y) : x2 + y 2 ≤ a2 .
96
3.1.4.1. La fórmula del cambio de variable
Consideremos el cambio de variable
x = h1 (u, v)
(u, v) ∈ U
y = h2 (u, v)
donde asumimos que las funciones h1 , h2 son campos escalares continuos y
diferenciables y tal que a cada punto (x, y) ∈ S está en correspondencia 1-1
con los puntos (u, v) de U y además la curva que limita a U se envía en la
curva que limita a S. Esto lo podemos definir más concretamente definiendo
−
→
el campo vectorial F : U → S dado por
−
→
F (u, v) = (h1 (u, v), h2 (u, v))
−
→
tal que F es un campo invertible es decir existe
−
→−1
F : S → U.
97
En la gráfica abajo vemos un zoom de este pequeño rectángulo y su correspon-
diente imagen curvilínea.
Usando diferenciales, (ver sección 2.3.4), los puntos x2 , y2 los podemos aproxi-
mar por
∂h1 ∂h1
x2 = h1 (u + ∆u, v) ≈ h1 (u, v) + (u, v)∆u = x1 + (u, v)∆u
∂u ∂u
∂h2 ∂h2
y2 = h2 (u + ∆u, v) ≈ h2 (u, v) + (u, v)∆u = y1 + (u, v)∆u
∂u ∂u
Así
∂h1 ∂h2
Q2 ≈ (x1 + (u, v)∆u, y1 + (u, v)∆u)
∂u ∂u
98
Haciendo lo mismo con el punto Q4 tenemos
∂h1 ∂h2
Q4 ≈ (x1 + (u, v)∆v, y1 + (u, v)∆v).
∂v ∂v
Ahora
−−−→
∂h1 ∂h2
Q1 Q2 = Q2 − Q1 ≈ (u, v)∆u, (u, v)∆u
∂u ∂u
−−−→
∂h1 ∂h2
Q1 Q4 = Q4 − Q1 ≈ (u, v)∆v, (u, v)∆v
∂v ∂v
y
∂h1 ∂h1
−
−−−→ −−−→ →
Q1 Q2 × Q1 Q4 ≈ ∆u∆v ∂u ∂v
∂h2 ∂h2 k.
∂u ∂v
Z SZ XX
f (x, y)dxdy ≈ f (xi , yj ).(área(Ri,j )) ≈
S
PP
≈ f (h1 (ui , vj ), h2 (ui , vj )) |J(u, v)| área(Tij )
Esta fórmula es conocida como la fórmula de cambio de variable para las inte-
grales dobles.
x = r cos θ, y = rsenθ
99
En este ejemplo r, θ hacen el papel de las variables u, v. Si r > 0 y 0 ≤ θ ≤ 2π
tenemos una aplicación 1-1 y sobre. El Jacobiano de la transformación está
dado por
cos θ sen θ
∂(x, y)
J(r, θ) = = |∇x ∇y| = =r
∂(r, θ) −rsen θ
r cos θ
√
donde S = (x, y); 0 ≤ x ≤ a, 0 ≤ y ≤ a2 − x2 . Al hacer el cambio a coor-
denadas polares, tenemos que la región T que se transforma en S por dicho
cambio es T = {(r, θ) : 0 ≤ r ≤ a, 0 ≤ θ ≤ π/2}y la integral se transforma en
Z Z p Z a pZ π/2 Z ap
a2 − r2 rdrdθ = [ a2 − r2 rdθ]dr = π/2 a2 − r2 rdr
T 0 0 0
a
−(a2 − r2 )3/2 π 3
= π/2 = 6a
3 0
100
Hallando el Jacobiano tenemos que J(u, v) = 1/2 Así la integral la podemos
resolver en la forma
u 1 1 2 v u 1 2 u v
Z Z Z Z Z Z Z
y−x
e y+x dxdy = e dudv =
v e dudv =
v ve v |−v dv
S T 2 2 0 −v 2 0
1 2 1 1
Z
= v(e − )dv = e −
2 0 e e
101
3.2.1. Regiones más generales
Consideraremos tres tipos de regiones:
Región tipo I
Región tipo II
102
Entonces la integral se calcula en la forma
!
Z Z Z Z Z Z y1 (x,z)
f (x, y, z)dxdydz = f (x, y, z)dy dA.
V S y1 (x,z)
103
Claramente podemos observar que la variable z está limitada por 0 ≤ z ≤ 1−x−
y. La proyección S está definida por S = {(x, y) : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x}.
Así, la integral triple la calculamos así:
Z Z Z Z 1 Z 1−x Z 1−x−y
f (x, y, z)dxdydz = xydzdydx
V 0 0 0
Z 1 Z 1−x
= xy(1 − x − y)dydx
0 0
1
1
Z
= (1/6)x(1 − x)3 dx =
0 120
104
3.2.2.1. Coordenadas cilíndricas.
Estas coordenadas están ligadas a las coordenadas (x, y, z) mediante las ecua-
ciones dadas por
x = r cos θ, y = rsenθ, z = z
J(r, θ, z) = |∇x∇y∇z| = r
Z Z Z Z Z Z
f (x, y, z)dxdydz = f (r cos θ, rsenθ, z)rdrdθdz
V T
105
Utilizando coordenadas cilíndricas tenemos que este volumen puede verse como
p
T = (r, θ, z) : 0 ≤ r ≤ 1, 0 ≤ θ ≤ 2π, 0 ≤ z ≤ 4 − r2
y están ligadas con las coordenadas cartesianas mediante las siguientes ecua-
ciones
106
x = ρ cos θ sen ϕ, y = ρ sen θ senϕ, z = ρ cos ϕ,
con
0 ≤ θ ≤ 2π, 0 ≤ ϕ ≤ π, 0 ≤ ρ ≤ a
En coordenadas esféricas, la esfera de radio a tiene ecuación ρ = a. El Jacobiano
en coordenadas esféricas está dado por
Z Z Z Z Z Z
f (x, y, z)dxdydz = f (ρ cos θ sen ϕ, ρ sen θ senϕ, ρ cos ϕ)ρ2 sen ϕ dρ dθ dϕ
V T
p
Ejemplo 3.2.3 Hallar el volumen de la parte del cono z = x2 + y 2 inter-
sectada por la esfera x2 + y 2 + z 2 = a2 .
Z Z Z Z Z Z
V ol = dxdydz = ρ2 senφ dρ dθ dϕ
V T
donde T = (ρ, θ, ϕ) : 0 ≤ ρ ≤ a, 0 ≤ θ ≤ 2π, 0 ≤ ϕ ≤ π/4 entonces
Z 2π Z a Z π/4 √ √
2 a3 2 2− 2 3
V ol = ρ senϕ dϕ dρ dθ = 2π( (1 − )= πa .
0 0 0 3 2 3
107
gravedad) de la placa. Vamos a suponer inicialmente que tenemos dos masas
m1 y m2 ubicadas sobre una varilla de masa despreciable en los lados opuestos
de un fulcro (de un balancín) y a una distancia d1 y d2 respectivamente. De
acuerdo al principio de Arquímedes, la varilla se equilibra si
m1 d1 = m2 d2
m1 (x − x1 ) = m2 (x2 − x)
m1 x + m2 x = m1 x1 + m2 x2
m1 x1 + m2 x2
x =
m1 + m2
Los números m1 x1 y m2 x2 se conocen como momentos de las masa m1 y m2
( con respecto al origen). Es claro que el centro de masa se obtiene de sumar
los momentos y de dividir por la masa total m = m1 + m2 .
108
n
donde m = mk la la masa total del sistema y la suma de los momentos
P
k=1
n
mk xk se llama el momento del sistema respecto al origen. Observemos
P
M=
k=1
que en este caso podemos escribir mx = M, lo cual significa que si la masa total
se concentra en el sistema en el centro de masa x, entonces su momento sería
el mismo que el momento del sistema.
n
P n
P
mk xk mk y k
k=1 k=1
x= y= .
m m
n n
Si escribimos My = mk xk , y Mx = mk yk , diremos que My es el
P P
k=1 k=1
momento del sistema respecto al eje y y mide la tendencia del sistema a
girar sobre el eje y y Mx es el momento del sistema respecto al eje x y
mide la tendencia del sistema a girar sobre el eje x.
Observemos que mx = My y my = Mx , lo cual implica que
m(x, y) = (My , Mx )
Supongamos que tenemos una lamina delgada ocupa una región plana S. Subdi-
vidamos la región S en N subregiones S1 , S2 , ....SN donde cada una de ellas está
acotada por una curva simple cerrada suave a trozos y de área ∆Ak = area(Sk ).
en donde (xk , yk ) es cualquier punto en la subregión Sk . Denotemos por dk el
diámetro de la región Sk ( la mayor distancia entre dos puntos cualesquiera en
Sk ) y por norma de la partición definiremos
109
Definimos la densidad ρ(x, y) (en unidades de masa por unidad de área) en
cada punto (x, y). por
∆m
ρ(x, y) = lı́m
||P ||→0 ∆A
n
X n
X n
X
My ≈ mk xk ≈ ρ(xk , yk )∆Ak xk = xk ρ(xk , yk )∆Ak ,
k=1 k=1 k=1
Xn Xn Xn
Mx ≈ mk y k ≈ ρ(xk , yk )∆Ak yk = yk ρ(xk , yk )∆Ak .
k=1 k=1 k=1
110
Así podemos definir los momentos del sistema como
n
X Z Z
My = lı́m xk ρ(xk , yk )∆Ak = xρ(x, y)dxdy
||P ||→0
k=1 S
n
X Z Z
Mx = lı́m yk ρ(xk , yk )∆Ak = yρ(x, y)dxdy
||P ||→0
k=1 S
My 1 Mx 1
Z Z Z Z
x= = xρ(x, y)dxdy y y= = yρ(x, y)dxdy
m m m m
S S
donde
Z Z
m= ρ(x, y)dxdy
S
En el caso que la densidad sea constante llamaremos al centro de masa cen-
troide.
Ejemplo 3.3.1 Si la densidad de una lámina semicircular es proporcional a la
distancia desde el centro del círculo. Determine el centro de masa de la lámina.
Solución. Si consideramos la lámina como la mitad de círculo x2 +yp 2
≤ a2 . La
distancia desde un punto (x, y) del círculo al origen 2 2
p está dada por x + y .
2 2
Por lo tanto la densidad está dada por ρ(x, y) = K x + y , donde K es una
constante de proporcionalidad. Así, la masa está dada por
Z Z p
m= K x2 + y 2 dxdy
S
Para calcular esta integral hacemos un cambio de variable a coordenadas po-
lares. En este caso la región estaría dada por 0 ≤ r ≤ a y 0 ≤ θ ≤ π, y esta
integral sería
Z Z
p Z πZ a
m = 2 2
K x + y dxdy = K r rdrdθ
S 0 0
Z π Z a a
r3 Kπa3
= K dθ r2 dr = Kπ = .
0 0 3 0 3
Puesto que la lámina y la función de densidad es simétrica respecto al eje y, el
centro de masa está sobre el eje y, esto es x = 0. Puesto que
111
1 3
Z Z Z Z p
y = yρ(x, y)dxdy = 3
yK x2 + y 2 dxdy
m Kπa
Z SZ p ZSπ Z a
3 2 2
3
= y x + y dxdy = rsen θ r rdrdθ
πa3 S πa3 0 0
Z π Z a 4 a
3 a4
3 3 3 π r 3a
= 3
sen θdθ r dr = 3
− cos θ| 0 = 2 =
3 4
.
πa 0 0 πa 4
0 πa 2π
−−→ →
− −−→ −
→
2
El vector velocidad es dado por v(t) = ddtx y la aceleración es a(t) = ddt2x . La
fuerza relacionada con la aceleración según la ley de Newton está dada por
−
→ 1−→
F = m−
→
a o −
→
a = F.
m
Como se muestra en la segunda fórmula, la fuerza es directamente proporcional
a la fuerza pero inversamente proporcional a la masa. Por lo tanto podemos
pensar en la masa m de la partícula, como una medida de su capacidad para
resistir la aceleración, por que si la fuerza es la misma y m aumenta, entonces
−
→a disminuye.
112
Recordemos que el vector posición está dado por
−−→
r(t) = r(cos θ(t), sen θ(t))
2
Sea w = dθ d θ
dt la velocidad angular (no se supones constante) y α = dt2 la
aceleración angular. Los vector velocidad y aceleración están dados por
−−→ dθ
v(t) = r (−sen θ(t), cos θ(t)) = rw(−sen θ(t), cos θ(t))
dt
y
T = maT r = mr2 α
113
Si escribimos por
I = mr2
tenemos que
T = Iα.
n
X n
X
mk x2k + yk2 = lı́m ρ(xk , yk ) x2k + yk2 ∆Ak
Io = lı́m
||P ||→0 ||P ||→0
k=1 k=1
Z Z
= (x2 + y 2 )ρ(x, y)dxdy = Ix + Iy .
S
Observemos que Io = Ix + Iy .
114
Z Z Z Z Z 2π Z a
2 2 2 2
Io = (x + y )ρ(x, y)dxdy = ρ (x + y )dxdy = ρ r2 rdrdθ
D 0 0
D
Z2π Za
a4 πρa4
= ρ dθ r3 dr = 2πρ = .
4 2
0 0
Io πρa4
=
Ix = ly =
2 4
4
Puesto que Io = πρa ρ πa2 . Entonces Io = 21 ma2 .
2 y la masa del disco es m =
Por lo tanto si incrementamos la masa o el radio, aumentamos el momento de
inercia. El momento de inercia de una rueda es lo que dificultad comenzar el
movimiento de un automóvil o detenerlo.
Las definiciones de centro de masa, momentos y momentos de inercia se extien-
den rápidamente al espacio. Si una región V es un cuerpo sólido de densidad
variable ρ(x, y, z) (=masa por unidad de volumen), la masa total está dada por
Z Z Z
m= ρ(x, y, z)dV.
V
Los momentos respectos a los diversos planos coordenados están dados por
Myz , Mxz , Mxy ; y también las fórmulas para los momentos de inercia respecto
a los diversos ejes, denotados por Ix , Iy y Iz . Estas fórmulas son
Z Z Z
Myz = xρ(x, y, z)dxdydz,
V
Z Z Z
Mxz = yρ(x, y, z)dxdydz,
Z Z ZV
Mxz = zρ(x, y, z)dxdydz
V
y
Z Z Z
Ix = (y 2 + z 2 )ρ(x, y, z)dxdydz,
V
Z Z Z
Iy = (x2 + z 2 )ρ(x, y, z)dxdydz,
Z Z ZV
IZ = (x2 + y 2 )ρ(x, y, z)dxdydz.
V
115
Además, las ecuaciones
Myz Mxz Mxy
x= , y= , z=
m m m
definen el centro de masa de un cuerpo o el centroide en el caso que ρ sea
constante.
3.3.4. Probabilidad.
Toda variable
R∞ aleatoria continua X tiene un función de densidad f (x) ≥ 0 y
tal que −∞ f (x) = 1 y la probabilidad de que X esté entre a y b se calcula por
Z b
P (a ≤ X ≤ b) = f (x)dx.
a
Cuando se tienen dos variables aleatorias continuas X y Y , la función de
densidad conjunta de X y Y es una función f de dos variables (f (x, y) ≥ 0 y
y)dxdy = 1) tal que la probabilidad de (X, Y ) esté en una región S
RR
R2 f (x,
es dada por
Z Z
P ((X, Y ) ∈ S) = f (x, y)dxdy.
S
116
Capítulo 4
Zb
−→
Z
F · d−
→
r = F(−
→
r (t)) · r0 (t)dt.
C a
Z Zb
−→
f ds = f (−
→
r (t))
r0 (t)
dt.
C a
117
Zb
−→
Z
F · d−
→
r = F(−
→
r (t)) · r0 (t)dt
C a
Zb
dx dy dz
= (f1 (x, y, z), f2 (x, y, z), f3 (x, y, z)) · , , dt
dt dt dt
a
Zb
dx dy dz
= f1 (x, y, z) + f2 (x, y, z) +, f3 (x, y, z) dt
dt dt dt
a
Z
= f1 (x, y, z)dx + f2 (x, y, z)dy + f3 (x, y, z)dz
C
Zb
−
→ −−→
−→
Z
F (−
→
F · T ds = r (t)) · T (t)
r0 (t)
dt
C a
Zb
−−→
Z
= F (−
→
r (t)) · r0 (t)dt = F · d−
→
r
a C
√
Ejemplo 4.1.1 Sea F(x, y) = y, x3 + y . Calcular las integral de línea
118
(1,1) Z1
−→
Z
F · d−
→
r = F(−
→
r (t)) · r0 (t)dt
(0,0) 0
Z1 √
= ( t, t3 + t) · (1, 1)dt
0
Z1
√ 17
= ( t + t3 + t)dt =
12
0
Ahora
(1,1) Z1
−
→ −
→ −−→
Z
F·dβ = F( β (t)) · β 0 (t)dt
(0,0) 0
Z1
= (t3/2 , t6 + t3 ) · (2t, 3t2 )dt
0
Z1
59
= (2t5/2 + 3t8 + 3t5 )dt =
52
0
Observemos de estas dos integrales de línea que la integral depende del camino
que escojamos para ir del punto (0, 0) al punto (1, 1).
119
entonces Z Z Z
F · d−
→
r = F · d−
→
r + F · d−
→
r
C C1 C2
Zd Zd
−
→ −
→ −−→ −
→
Z
F·dβ = F( β (τ )) · β 0 (τ )dτ = F(−
→
r (h(τ ))) · r0 (h(τ ))h0 (τ )dτ.
C c c
Zd
−
→ −
→ −−→
Z
F·dβ = F( β (τ )) · β 0 (τ )dτ
C c
Zd
−
→
= F(−
→
r (h(τ ))) · r0 (h(τ ))h0 (τ )dτ
c
Zb
−
→
Z
= F(−
→
r (t)) · r0 (t)dt = F · d−
→
r.
a C
Zd
−
→ −
→ −−→
Z
F·dβ = F( β (τ )) · β 0 (τ )dτ
C c
Zd
−
→
= F(−
→
r (h(τ ))) · r0 (h(τ ))h0 (τ )dτ
c
120
Zd
−
→ −
→ −−→
Z
F·dβ = F( β (τ )) · β 0 (τ )dτ
C c
Zd
−
→
= F(−
→
r (h(τ ))) · r0 (h(τ ))h0 (τ )dτ
c
Za
−
→
= F(−
→
r (t)) · r0 (t)dt
b
Zb
−
→
Z
= − F(−
→
r (t)) · r0 (t)dt = − F · d−
→
r
a C
En el caso que la fuerza F esté aplicada sobre una curva parametrizada por
una función vectorial − →r , consideramos una partición sobre la curva C dada
−−→ −−→
por los puntos {Po , P1 , P2 , ...PN −1 , PN } tales que Po = r(a)
−−−y−→PN
=
r(b). y
−−→
los demás puntos están sobre la curva C de tal forma que
Po Pi−1
≤
Po Pi
−−→
(i = 2, ..., N ). Escojamos en cada segmento un punto r(t∗k ) y podemos con-
siderar que el trabajo realizado sobre el arco P\ k−1 Pk es aproximadamente
−−→
WPk−1 Pk ≈ F(r(tk ) · T ∆Sk donde ∆Sk = longitud(P\
∗
k−1 Pk ). Así el tra-
−−→
bajo total realizado sobre la curva por la fuerza F desde el punto r(a) hasta
121
−−→ N −−→
el punto r(b), W ≈ F(r(t∗k ) · T ∆Sk . Esto nos permite claramente definir
P
k=1
el trabajo realizado
−
→
Z Z
W = F · T ds = F · d−
→
r.
C C
Zb
−
→
Z
W = F · d−
→
r = F(−
→
r (t)) · r0 (t)dt
C a
Zb
−
→
= (c1 , c2 , c3 ) · r0 (t)dt
a
(c1 , c2 , c3 ) · −
→ b
= r (t)|a
−−→ −−→
= F · (r(a) − r(b)),
Como podemos observar aquí el trabajo solo depende de los puntos extremos
de la curva.
Solución: Si −→
r (t) es el vector posición de la partícula en el instante t, entonces
el trabajo realizado durante el intervalo de tiempo [a, b] es dado por Wab =
−−→
r(b)
F · d−
→
r . Vamos a mostrar que Wab = K(b) − K(a) = 21 mv 2 (b) − 12 mv 2 (a).
R
−−→
r(a)
−
→
De acuerdo a la segunda ley de Newton F(−
→
r (t)) = mr00 (t), entonces
122
−−→
r(b) Za
−
→ −
→
Z
Wab = F · d−
→
r = mr00 (t) · r0 (t)dt
−−→ b
r(a)
Za
1 d −
→0 −
→
= m r (t) · r0 (t) dt
2 dt
b
Za
1
−
d
→
= m
r0 (t)
dt
2 dt
b
Za b
1 dv 2 (t) 1
dt = mv 2 (t)
= m
2 dt 2 a
b
1 1
= mv 2 (b) − mv 2 (a) = K(b) − K(a).
2 2
−−→
r(b) Zb
−
→
Z
Wab = −
→
F · d r = − ∇ϕ(−
→
r (t)) · r0 (t)dt
−−→ a
r(a)
Zb
d
(ϕ(−
→
r (t))) dt = − ϕ(−
→ b
= − r (t)|a
dt
a
= − [ϕ(−
→
r (b) − ϕ(−
→
r (a)] = ϕ(−
→
r (a) − ϕ(−
→
r (b)
123
Observación 4.3.2 De acuerdo al ejemplo 3 y a la observación 4,
o sea
K(b) + ϕ(−
→
r (b) = K(a) + ϕ(−
→
r (a))
Esta fórmula es conocida como la ley de la conservación de la energía
mecánica para una partícula que se mueve bajo la influencia de un campo
de fuerzas conservativo. La suma de la energía cinética y la energía potencial
permanece constante.
124
Sea C una curva cerrada simple regular a trozos orientada positivamente en el
plano R2 que acota una región Ω en el plano. Si F :Ω ⊆ R2 → R2 es un campo
vectorial diferenciable dado por F(x, y) = (P (x, y), Q(x, y)), entonces
Z Z
∂Q ∂P
I
P dx + Qdy = − dxdy
∂x ∂y
C Ω
−
→
Observemos que si F = (P, Q) tenemos que
Zb
−
→ − −
→ −−→
−
→
I
F ·→
n ds = F (r(t)) · n(t)
r0 (t)
dt
C a
Zb
−
→ −−→
= F (r(t)) · n(t)dt
a
Zb
−
→
= F (r(t)) · (y 0 (t), −x0 (t))dt
a
Zb
= [P (−
→
r (t)) y 0 (t) − Q (−
→
r (t)) x0 (t)] dt
Ia
= −Qdx + P dy.
C
125
donde C es una circunferencia unitaria orientada positivamente. Aplicando el
teorema de Green y teniendo en cuenta que P = −x2 y y Q = y 2 x tenemos
que
Z Z Z
−x2 ydx + y 2 xdy y 2 + x2 dxdy
=
C Ω
Z2πZ1
= r3 drdθ = 2π.
0 0
Z Z Z
−ydx + xdy = 2dxdy
C Ω
Z Z
= 2 dxdy = 2area(Ω) = 2.
Ω
Ejemplo 4.4.3 Sea F(x, y) = (x, y). y C una circunferencia de radio a. Sea
Ω la bola cerrada Ba (0). La divergencia de F está dada por divF = ∇ · F =
∇ · (x, y) = 1 + 1 = 2 entonces
Z Z Z Z
divFdxdy = 2dxdy = 2área(Ω) = 2πa2
Ω Ω
F·−
→
R
Ahora calculemos n ds, teniendo en cuenta que el vector normal exterior
C
(x, y)
a la circunferencia es dado por −
→
n = , entonces
a
126
(x, y)
Z Z
F·−
→
n ds = (x, y) ·
a
C C
1
Z
x2 + y 2 ds
=
a
C
1
Z Z
2
= a ds = a ds
a
C C
= a (2πa) = 2πa2
Aunque el teorema se puede demostrar para regiones más generales aquí́ vamos
a restringirnos a la figura dada. La región Ω es descrita como
Zb ϕZ1 (x)
∂P ∂P
Z Z
− dxdy = − dy dx
∂y ∂y
Ω a ϕ1 (x)
Zb
ϕ (x)
= −P (x, y)|ϕ21 (x) dx
a
Zb
= {P [(x, ϕ1 (x)] − P [x, ϕ2 (x)]} dx
a
127
Por otra parte, la integral de línea P (x, y)dx la podemos escribir como
R
C
Z Z Z
P (x, y)dx = P (x, y)dx + P (x, y)dx.
C C1 C2
Z Zb
P (x, y)dx = P [(t, ϕ1 (t)] dt.
C1 a
Z Zb
P (x, y)dx = − P [(t, ϕ2 (t)] dt.
C2 a
Por lo tanto
Z Zb Zb
P (x, y)dx = P [(t, ϕ1 (t)] dt − P [(t, ϕ2 (t)] dt.
C a a
∂P
Z Z Z
− dxdy = P (x, y)dx
∂y
Ω C
∂Q
Z Z Z
dxdy = Q(x, y)dy.
∂x
Ω C
Así́ Z Z
∂Q ∂P
I
P dx + Qdy = − dxdy
∂x ∂y
C Ω
Ejemplo 4.4.4 Por medio del teorema de Green calcular el trabajo realizado
por un campo de fuerza F(x, y) = (3x + y, 2y − x) al moverse una partícula
sobre una elipse x2 + 4y 2 = 4 en sentido contrario a las manecillas del reloj.
128
∂Q ∂P
En este caso P (x, y) = 3x + y, Q(x, y) = 2y − x. − = −1 − 1 = −2.
∂x ∂y
Entonces
Z Z
∂Q ∂P
− dxdy = −2area(Ω) = −2π2 = −4π
∂x ∂y
Ω
1
Z
A= −ydx + xdy
2
C
129
Similarmente
R si P (x, y) = −y y Q(x, y) = 0, el teorema de Green implica que
−ydx = A
C
Así́ tenemos que
1
Z Z Z
A= −ydx + xdy = −ydx = xdy.
2
C C C
k−
→
ru ∆u × −
→
rv ∆vk = k−
→
ru × −
→
rv k ∆u∆v
N
k−
→
ru × −
→
X
rv k ∆u∆v
k=1
130
−
→ −
→ −
→ −
→
r (u, v) = (x(u, v), y(u, v), y(u, v)) = x(u, v) i + y(u, v) j + y(u, v) k
una parametrización de una superficie suave que se cubre una sola vez cuando
(u, v) recorre el dominio Ω, entonces se define el área superficial por
ZZ
A(S) = k−
→
ru × −
→
rv k dudv
Ω
donde
∂x −
→ ∂y − → ∂z − → ∂x −
→ ∂y − → ∂z − →
ru = i + j + k rv = i + j + k
∂u ∂u ∂u ∂v ∂v ∂v
Ω = {(θ, ϕ) 0 ≤ θ ≤ 2π, 0 ≤ ϕ ≤ π}
i j k
−
→ −
→
rθ × rϕ = xθ yθ zθ
xϕ yϕ zϕ
i j k
= −asen θsen ϕ a cos θsen ϕ 0
a cos θ cos ϕ asen θ cos ϕ −asen ϕ
= −a2 senθsen2 ϕi−a2 senθ sen2 ϕj−a2 senϕ cos ϕk
k−
→
rθ × −
r→ 2
ϕ k = a senϕ.
131
ZZ
A(S) = k−
→
ru × −
→
rv k dudv
Ω
Z2πZπ
= a2 senϕdϕdθ
0 0
Z2π Zπ
2
= a dθ senϕdϕ = 4πa2
0 0
−
→
r (x, y) = (x, y, f (x, y)) con (x, y) ∈ Ω.
Observemos
i j k
i j k ∂f
−
→ −
→
∂f ∂f
zx = 1 0
rx × ry = xx yx =− i− j+k
∂x ∂x ∂x
xy yy zy 0
∂f
1
∂y
ZZ
A(S) = k−
→
rx × −
→
ry k dxdy
Ω
s 2 2
∂f ∂f
ZZ
= 1+ + dxdy
Ω ∂x ∂y
132
Así́ el área superficial es dada por
s 2 2
∂f ∂f
ZZ
A = 1+ + dxdy
Ω ∂x ∂y
ZZ p
= 1 + (2x)2 + (2y)2 dxdy
Ω
ZZ p
= 1 + 4x2 + 4y 2 dxdy.
Ω
Usando coordenadas polares tenemos
ZZ p
A = 1 + 4x2 + 4y 2 dxdy
Ω
Z2πZ3 p
= 1 + 4r2 rdrdθ
0 0
Z2π Z3 p
= dθ 1 + 4r2 rdr
0 0
π √
= (37 37 − 1)
6
donde
−
→ ∂x ∂y ∂y
ru = , ,
∂u ∂u ∂u
y
−
→ ∂x ∂y ∂y
rv = , , .
∂v ∂v ∂v
133
4.6.2. Integral de superficie de un campo vectorial
→ = ru × rv
−
n → = − ru × rv ,
o −
n (kru × rv k =
6 0)
1 2
kru × rv k kru × rv k
134
Definición 4.6.1 Una superficie parametrizada S se dice que es simple si ex-
iste un conjunto abierto y acotado Ω de 2 cuya frontera es una curva cerrada
simple regular a trozos tal que la parametrización −
→r : Ω ⊂ R2 → R3 es
−
→ −
→
inyectiva, ru × rv 6= 0 , S = r (Ω).
Sea −
→
n uno de los dos vectores normales − →o−
n n→ a la superficie S. Sea −
→
F un
1 2
campo vectorial definido en un conjunto abierto U que contiene a S.
−
→
Definición 4.6.2 Sea F : U ⊂ Rn → Rn un vectorial continuo, definimos la
integral de superficie del campo vectorial a la integral
−
→ − −
→−
Z Z Z Z
→
F · n dS = F (→r (u, v)) · −
→
n kru × rv k dudv
S
ZΩ Z
−
→−
= ± F (→
r (u, v)) · ru × rv dudv,
Ω
donde el signo es + si −
→
n =−
→ y el signo es − si −
n 1
→
n =−
→.
n 2
Los dos teoremas básicos del cálculo vectorial y permite calcular la integral de
una "derivada" en términos de integrales en la frontera de la superficie son los
siguientes:
Teorema 4.6.1 (de Stokes): Sea S una superficie acotada en R3 cuya frontera
−
→
∂S es una curva regular, entonces para todo campo vectorial en R3 , F ∈ C1 ,
se cumple donde se considera en ∂S la orientación inducida por S. Entonces
−
→ − −
→→
Z Z Z
→
F .d α = Rot F .−
n dS
∂S S
−
→− −
→
Z Z Z Z Z
F .→
n dS = div (F )dV.
S V
135
−
→
Considere el campo vectorial F = (yz, xz, xy) y S es la superficie determinada
por parte de la esfera x + y + z 2 = 4 que está dentro del cilindro x2 + y 2 = 1
2 2
136
Sea F (x, y, z) = x2 , y 2 , z 2 . Hallemos F ·−
→
RR
n ds, en donde S
S
indica las seis paredes del cubo. De acuerdo al teorema de la Diver-
gencia tenemos que :
−
→
div F = 2x + 2y + 2z
Por lo tanto
−
→ − −
→
ZZ ZZZ
F ·→
n ds = div F dxdydz
S
Z Z ZV
= (2x + 2y + 2z) dxdydz
V
Z 1 Z 1 Z 1
= (2x + 2y + 2z) dxdydz
0 0 0
=3
137
RR RR
5. f ∇g · n = g∇f · n si f y g son armónicas.
S S
cq
F (x, y, z) = 3 (x, y, z)
kx, y, zk
138
Observemos que la frontera de V − Br () está compuesta por S y
∂Br () y el vector normal unitario sobre la frontera ∂Br () es
−
→ −1
n = (x, y, z)
kx, y, zk
Z Z −
→
Z Z Z Z
div F dxdydz = F ·−
→
n ds + F ·−
→
n ds
V −Br () S ∂Br ()
−
→
Un cálculo fácil nos muestra que div F = 0 y por lo tanto ten-
emos que
Z Z Z Z
F ·−
→
n ds = − F ·−
→
n ds
S S
cq (x, y, z) −1 (x, y, z)
Z Z
=− 3 · 1 dS
(x2 + y2 + z 2) 2 (x2 + y2 + z 2) 2
∂Br ()
x2 + y 2 + z 2
Z Z
= cq 2 dS
(x2 + y 2 + z 2 )
∂Br ()
cq
Z Z
= 2 dS
∂Br ()
cq
= 2 4π2 = 4cπq.
F ·−
→
RR
Por lo tanto el flujo n dS = 4cπq sólo depende de la
S
carga q y no del tamaño o forma de S.
139