Está en la página 1de 40

INTRODUCCION AL CALCULO VARIACIONAL

M. Santander
Departamento de Fı́sica Teórica, Universidad de Valladolid

Versión 3. Original 1 Marzo 1998, basado en notas de M. Gadella. Revisión y adición


de la sección sobre superficies mı́nimas 22 Febrero 2000. Revisión y adición del método
heurı́stico siguiendo a Feynmann 13 Febrero 2001. Correcciones de detalle y erratas 20
Febrero 2002, 27 Febrero 2002, 14 Febrero 2003

Problemas Variacionales en Fı́sica

El principio de mı́nima acción.


En Mecánica clásica, cuando una partı́cula se mueve bajo la acción de un
potencial V (x), el movimiento real es el dado por las ecuaciones de Newton, que
expresan la aceleración de la partı́cula en términos de las fuerzas. Cuando las
fuerzas derivan de un potencial V (x), el movimiento real t → x(t) satisface la
ecuación diferencial:
d2 x(t) ∂V (x(t))
m 2
=− .
dt ∂x
cuya solución determina el movimiento real que sigue una partı́cula que en un
instante inicial t1 sale del punto x1 , se mueve bajo la acción del potencial, y llega
en un instante final t2 al punto x2 .
Una pregunta interesante es: ¿Podemos singularizar el movimiento real dado
por las soluciones de esta ecuación, entre todos los movimientos que la partı́cula
podrı́a seguir, para ir desde el punto inicial x1 en el instante t1 al punto final x2
en el instante t2 ?
La respuesta a esta pregunta es un principio básico en Fı́sica, que en Mecánica
se denomina principio de Hamilton, o principio de mı́nima acción. Este principio
caracteriza a los movimientos reales entre todos los movimientos imaginables que
llevarı́an a la partı́cula del estado inicial (posición x1 en el instante t1 ) al estado
final (posición x2 en el instante t2 ), ambos dados.
La caracterización dada por el principio de Hamilton asocia una cantidad,
denominada acción a cada movimiento imaginable. La acción es una cantidad de
naturaleza bastante diferente a las cantidades que usualmente describen el estado
de la partı́cula, como posición y/o velocidad. A diferencia de ellas, la acción no
se asocia al estado, sino a la historia completa de la particula entre dos instantes
inicial y final. Para cada movimiento imaginable, descrito por t → x(t) con las
condiciones x(t1 ) = x1 , x(t2 ) = x2 , la acción de ese movimiento se define como:

   2 
t2
1 dx(t)
S[x(t)] = m − V (x(t)) dt
t1 2 dt

Typeset by AMS-TEX

1
Cálculo Variacional 2002/2003 2

El principio de mı́nima acción dice: entre todos los movimientos imagina-


bles, la propiedad que distingue al movimiento real es que el valor de la
acción S[x(t)] es menor para el movimiento real que para cualquier otro.
¿Cuál es la relación entre este principio y la forma newtoniana de plantear las
ecuaciones del movimiento? Resulta que ambas maneras de describir el movimiento
son equivalentes. Para verlo, necesitamos abordar el problema de la búsqueda de
la función x(t) con las condiciones requeridas, que minimice el valor de la acción.
No se trata de un problema ordinario de mı́nimo, ya que la acción depende del
movimiento como un todo, esto es, depende de la función x(t).
Principio de Fermat.
Según la Óptica Geométrica, la luz se propaga a lo largo de rayos. Entre todos
los rayos posibles que unen dos puntos dados, ¿cuál es el escogido realmente por la
luz? En la antigüedad clásica se observó que en ciertas circunstancias la luz viaja
a lo largo del camino geométricamente más corto entre dos puntos extremos A, B.
• Ejercicio 1. Derivar la ley de igualdad de ángulos de incidencia y reflexión para la
luz propagándose en un medio homogéneo, a partir de la exigencia de que la longitud
del camino recorrido por la luz entre dos puntos dados A, B pasando por un espejo, es
la mı́mima posible. (Comentario: en realidad, este problema puede resolverse sin hacer
uso siquiera del cálculo ordinario de máximos y mı́nimos, siempre que admitamos que el
camino de longitud mı́nima entre dos puntos (sin condiciones adicionales) es la linea recta
que les une; la idea que tiene multitud de aplicaciones inesperadas se denomina principio
de reflexión)

Pero basta observar la propagación de la luz en una interfase entre aire y agua
(en un rı́o), para concluir que la luz no siempre sigue el camino más corto; el
ejemplo más evidente es la refracción, pero hay otros, como los espejismos.
Se atribuye a Fermat el primer enunciado del principio general que la trayecto-
ria real seguida por un rayo de luz entre dos puntos dados en un medio posiblemente
inhomogéneo es aquella que hace mı́nimo el tiempo total invertido. Se trata de un
enunciado notable, ya que cuando Fermat lo formuló, se comprendı́an aún muy
mal los elementos implicados en el proceso de propagación. Por ejemplo, el que la
velocidad de la luz en un medio material es siempre menor que la velocidad de la
luz en el vacı́o sólo se decidió experimentalmente en el S. XIX.
Con la perspectiva actual podemos traducir a ecuaciones el principio de Fermat
ası́: La velocidad de la luz en el vacı́o es constante c. En un medio material, su
velocidad v es menor que c, y el cociente c/v es igual al ı́ndice de refracción n del
medio; para medios no homogéneos, este ı́ndice es una función de la posición n(x).
Supongamos una trayectoria posible para un rayo luminoso en un medio in-
homogéneo, en el que el ı́ndice de refracción dependerá de la posición. Tomando
la coordenada z como parámetro a lo largo del rayo (cuya dirección supondremos
cercana al eje z), podemos describir tal trayectoria como z → (x(z), y(z), z). La
longitud del rayo entre los puntos de parámetro z y z + dz es:

ds = x (z)2 + y  (z)2 + 1 dz
Cálculo Variacional 2002/2003 3

El tiempo requerido para viajar entre estos dos puntos está dado por:

ds ds n(z; x, y) n(z; x, y)   2
dτ = = c = ds = x (z) + y  (z)2 + 1 dz
v n(z;x,y) c c

y el tiempo total invertido en viajar desde un punto inicial (x1 , y1 , z1 ) hasta otro
final (x2 , y2 , z2 ), a lo largo del rayo descrito por z → (x(z), y(z), z) (que debe
satisfacer las condiciones x(z1 ) = x1 , y(z1 ) = y1 ; x(z2 ) = x2 , y(z2 ) = y2 ) es
 
1 z2
T = n(z; x, y) x (z)2 + y  (z)2 + 1 dz
c z1

Ası́ pues, el principio de Fermat reduce el problema de encontrar la trayectoria


seguida por un rayo luminoso al problema de encontrar, entre todas las curvas
z → (x(z), y(z), z) que unan los puntos dados (x1 , y1 , z1 ) y (x2 , y2 , z2 ), aquella
para la cual el valor de esta integral sea mı́nimo.
En el vacı́o, o en cualquier medio que sea homogéneo, el indice de refracción
es constante, y no depende de la posición. En este caso, el principio de tiempo
mı́nimo se reduce al principio de longitud mı́nima, y las trayectorias seguidas por
los rayos son, en el espacio euclı́deo, lı́neas rectas.
• Ejercicio 2. Derivar la ley de Snell para la refracción a partir del principio de Fermat.
(Comentario: en realidad, el cálculo ordinario de máximos y mı́nimos es suficiente para
discutir este caso, en el que separadamente para cada tramo situado en un medio homogeneo
(aire o agua, digamos) el camino más rápido es tambien el más corto)

El problema de la braquistócrona.
Sean dos puntos P y Q situados en el mismo plano vertical, P más alto que Q
y no directamente sobre Q. Un punto material se mueve sin fricción entre P y Q
a lo largo de una curva determinada que une P con Q, bajo la acción de la fuerza
de la gravedad, que supondremos uniforme, y partiendo de P con velocidad inicial
nula. De entre todas las curvas posibles que unen P con Q, ¿sobre cuál de ellas
el tiempo que tarda la partı́cula en ir desde P hasta Q es el menor posible? Esta
curva tiene un nombre especial: braquistócrona.
Denotemos por z la altura, y por x la coordenada horizontal sobre el plano.
Cualquier curva que una P con Q estará descrita por una función x → z(x), que
deberá satisfacer las dos condiciones z(xP ) = zP , z(xQ ) = zQ . En el punto inicial,
la energı́a de la partı́cula vale E = mgzP . Cuando la partı́cula se encuentra en el
punto genérico (x, z(x)) sobre la curva, su velocidad v(x) está determinada por el
principio de conservación de la energı́a
1
E = mgzP = mgz(x) + mv(x)2 ,
2
de donde resulta 
v(x) = 2g(zP − z(x))
Cálculo Variacional 2002/2003 4

El tiempo invertido en llegar desde el punto de coordenada x al punto de coorde-


nada x + dx es:

ds ds 1 + z  (x)2
dt = = = dx,
v(x) 2g(zP − z(x)) 2g(zP − z(x))

y el tiempo total invertido en llegar desde el punto P al punto Q a lo largo de la


curva dada vale:  xQ 
1 1 + z  (x)2
T =  dx
2g xP zP − z(x)
¿Para qué curva este tiempo toma el valor mı́nimo?
• Ejercicio 3. Escribir la expresión análoga para el tiempo invertido e llegar de P a Q si
se supone que la partı́cula comienza su caı́da con velocidad inicial no nula.

La catenaria.
¿Cómo cuelga un hilo inextensible y flexible, de longitud total L, suspendido
entre dos torres con separación horizontal d, y alturas dadas, A y B? Claramente,
el principio que determina la forma de equilibrio del hilo es que su energı́a potencial
sea la menor posible. Cada forma posible del hilo está descrita por una función
x → z(x) que debe satisfacer las condiciones z(a) = A, z(b) = B (donde a, b
son las coordenadas horizontales de las torres, d = b − a, y además otra condición
importante, a saber, la longitud total del hilo debe ser L; esta condición se traduce
en:  b
L= 1 + z  (x)2 dx
a

Veamos ahora cómo se expresa la energı́a potencial del hilo cuando su forma es
la función z(x). Suponiendo el hilo de densidad
 lineal ρ constante, la masa del
elemento entre las coordenadas  2
 x y x+dx es ρ 1 + z (x) dx, y la energı́a potencial
de ese elemento es z(x)gρ 1 + z  (x)2 dx. Ası́ pues, la energı́a potencial total es:
 b 
E = ρg z(x) 1 + z  (x)2 dx.
a

La forma real será aquella curva que, satisfaciendo la condición adicional de tener
longitud total L, haga mı́nima la energı́a potencial. Conviene notar que este prob-
lema es más complicado que los anteriores, ya que interviene en él una ligadura, o
condicion auxiliar.
Los problemas isoperimétricos clásicos
A los problemas variacionales con ligaduras se les suele denominar problemas
isoperimétricos. Su proptotipo son los problemas clásicos de Dido (“te concederé
tanto terreno cuanto puedas encerrar con la piel de este buey”), que fueron plantea-
dos y resueltos en la antiguedad clásica. Consideremos una curva cerrada en el
Cálculo Variacional 2002/2003 5

plano, de longitud total L. ¿Qué figura de la curva hace máxima el área encerrada
por la curva? O, inversamente, consideremos una curva cerrada de área dada S.
¿Cuándo la longitud de la curva es mı́nima? En ambos casos la respuesta es un
cı́rculo. En tres dimensiones, la superficie cerrada de área dada que encierra mayor
volumen es la esfera, y la forma de volumen dado que tiene menor área superficial
es también la esfera; estos resultados subyacen a la explicación de que la forma de
la esfera se encuentre por doquier en la Naturaleza.
• Ejercicio 4. ¿Cual es el principio fı́sico que explica que, en ausencia de gravedad, una
gota de un lı́quido adopte forma esférica?

• Ejercicio 5. Con argumentos elementales y directos, ver que la curva cerrada de longitud
dada 2L que encierre un área máxima debe ser convexa, y que toda recta que divida la
curva en dos arcos de igual longitud debe también dividir el área encerrada en dos partes
de igual área.

En vista del resultado indicado en el ejercicio, podemos plantear formalmente


el problema isoperimétrico anterior buscando, entre las curvas que unan dos puntos
P , Q situados sobre el eje real (de coordenadas (a, 0) y (b, 0)), una curva y = y(x),
tal que y(a) = y(b) = 0, que no corte en otros puntos intermedios al eje real (por
ejemplo, imponiendo y(x) > 0 en todo el intervalo [a, b]), y que tenga longitud
total dada L. Esta última condición se expresa por la ecuación
 b  b
ds = 1 + (y  )2 dx = L
a a
y el problema a resolver es: entre todas las curvas que satisfagan esta condición,
encuéntrese aquella que maximiza el área comprendida entre ella y el eje real, es
decir, la que proporcione un valor mayor para la integral
 b
y(x) dx.
a

Recapitulación.
En todos los casos, el problema propuesto se reduce a buscar, entre todas las
funciones f : x → f (x) definidas en un intervalo [a, b], y con condiciones del tipo
f (a) = A, f (b) = B (además de otras condiciones de continuidad, regularidad, etc.
que se precisarán a su tiempo), aquellas que minimizan o maximizan una expresion
del tipo
 b
Φ(x, f (x), f  (x)) dx.
a
En algunos casos, la función f : x → f (x) debe satisfacer ciertas condiciones
adicionales, que pueden imaginarse como ligaduras; en todos los casos que hemos
discutido las ligaduras están expresadas también por condiciones del tipo
 b
Ξ(x, f (x), f  (x)) dx = cte
a
Cálculo Variacional 2002/2003 6

Derivación ‘a la Feynmann’ de las ecuaciones de Euler-La-


grange para el principio de menor acción
Imaginemos el caso más sencillo de una partı́cula que se mueve en una di-
mensión (coordenada posición x) bajo un potencial V (x). Por ejemplo, un objeto
que sube y baja verticalmente en el campo gravitatorio terrestre bajo la acción
de la gravedad. Para cada movimiento imaginable, descrito por t → x(t) con las
condiciones x(t1 ) = x1 , x(t2 ) = x2 , la acción de ese movimiento se define como:
 t2   2 
1 dx(t)
S[x(t)] = m − V (x(t)) dt
t1 2 dt
El principio de mı́nima acción dice: entre todos los movimientos imaginables, la
propiedad que distingue al movimiento real es que el valor de la acción S[x(t)] es
menor para el movimiento real que para cualquier otro. Antes mencionamos que
aunque no lo parezca, esta manera de singularizar el movimiento real entre todos
los posibles es equivalente a las leyes de Newton, que en este caso serı́an
d2 x(t) ∂V (x(t))
m 2
=− .
dt ∂x
Vamos ahora a presentar un argumento heurı́stico, siguiendo a Feynmann, para
convencer al lector de que el movimiento que minimice la acción debe satisfacer
las ecuaciones de Newton. Comenzamos con una situación familiar que debe ser
bien conocida; la búsqueda de mı́nimos de funciones de varias variables. Sea una
función x → F (x) de varias variables x = (x1 , x2 , . . . , xi , . . . ), supuesta continua
y con derivadas continuas. Queremos encontrar un punto x0 en el cual se verifique
F (x) > F (x0 )
para cualquier x cercano a x0 . Una condicion necesaria es que todas las derivadas
parciales de F se anulen en x0 ; imaginemos que no lo supieramos y veamos cómo
podrı́amos obtener tal condicion partiendo sólo del conocimientomás básico de la
df 
condición de mı́nimo para funciones de una variable, a saber dx  0 = 0.
x
¿Cómo podrı́amos aprovechar tal conocimiento? La idea básica, que en los
apartados siguientes trasladaremos al caso de minimizar la acción, es: Supongamos
que realmente el punto x0 es un mı́nimo de F cuando x varı́a en las cercanı́as de
x0 . Entonces también x0 es un mı́nimo de F cuando x varı́a sólo a lo largo de la
recta !: xi = x0i + "hi , donde los hi son arbitrarios. La restricción de F a la recta
! nos da una función de una sola variable ":
fh (") := F (x0 + "h)
dfh
que debe tener un mı́nimo en " = 0. La condición para ello es que la derivada d
se anule en " = 0. La derivada se calcula mediante la regla de la cadena:
dfh ∂F ∂F
= h1 + h2 + . . .
d" ∂x1 ∂x2
Cálculo Variacional 2002/2003 7

de manera que la condición de mı́nimo es:


  
dfh  ∂F  ∂F 
0= = h1 + h2 + . . .
d" =0 ∂x1 x0 ∂x2 x0

Como esta condición debe satisfacerse para h arbitrario, basta con tomar sucesi-

xi  0 = 0.
vamente h = (0, 0, . . . , hi = 1, 0, . . . , 0) con i = 1, 2, . . . para obtener ∂F
x
Naturalmente desde el momento en que todas las derivadas parciales se anulan
en x0 , entonces es claro que la ecuación anterior se verifica para h arbitrario.
Ası́ lo que hemos (re)encontrado es una condición necesaria para que una función
de varias variables tenga un mı́nimo en x0 : todas las derivadas parciales deben
anularse en ese punto.
Repitamos el mismo proceso con la acción. Para evitar complicaciones inesen-
ciales supondremos el movimiento en una dimensión (esto es la función incógnita
x(t) es una función de una variable) y buscamos un movimiento t → x0 (t) dado
por una función continua, con derivada continua que lleve de xa en el instante ta
a xb en el instante tb y tal que para cualquier otro movimiento cercano se verifique
 tb   2 
1 dx(t)
S[x(t)] > S[x0 (t)], S[x(t)] = m − V (x(t)) dt
ta 2 dt

La idea es construir una familia uniparamétrica de movimientos cercanos a


x0 (t), en la cual cada movimiento esté etiquetado por un sólo parámetro ", im-
itando a la expresión usada para funciones de varias variables; esto se consigue
definiendo:
x(t) = x0 (t) + "h(t)
donde h(t) debe ser una función fijada, suficientemente regular (continua, con
derivada continua) satisfaciendo las condiciones h(ta ) = 0, h(tb ) = 0. Ahora res-
tringimos la acción a los movimientos de esta familia unidimensional, obteniendo
una función que depende de una sola variable ":

Sh(t) (") := S[x0 (t) + "h(t)]

y que debe tener un mı́nimo en " = 0, lo que implica:


  tb   2  
dsh(t)  
d 1 d(x0 (t) + "h(t)) 
0= = m − V (x0 (t) + "h(t)) dt 
d" =0 d" ta 2 dt 
=0

Efectuando la derivación con respecto a " y evaluando en " = 0 lo que se encuentra


es  tb   
dx0 (t) dh(t) dV 
0= m − h(t) dt
ta dt dt dx  x0 (t)
Cálculo Variacional 2002/2003 8

Ahora la idea clave es realizar una integración por partes para transformar el
término que involucra la derivada dh(t)
dt de h(t) en un término que involucre direc-
tamente a h(t), y otro que desaparece por las condiciones de frontera. En efecto,
0 (t)
efectuando el cambio estandar u = m dxdt , v = h(t) en el primer término de la
integral, resulta:
 tb  tb  tb
tb
dx0 (t) dh(t) dx0 (t)  d2 x0 (t) d2 x0 (t)
m dt = m 
h(t) − m h(t)dt = − m h(t)dt
ta dt dt dt ta ta dt2 ta dt2

y en consecuencia la condición de que la función sh(t) (") tenga un mı́nimo en " = 0


es:  tb   
d2 x0 (t) dV 
m + h(t) = 0.
ta dt2 dx  x0 (t)

Esta condición debe satisfacerse para todo h(t) con las condiciones de contorno
adecuadas, lo que sólo puede ocurrir si la parte entre llaves del integrando se anula
idénticamente. Demostrar esto con rigor requiere cierto cuidado —lo haremos
después—, pero podemos de todas maneras ver que si el término entre llaves del
integrando fuera diferente de 0 en un cierto instante, entonces podrı́amos tomar
una función h(t) que fuera diferente de 0 sólo en un entorno muy pequeño de
dicho instante, lo que llevarı́a a un valor no nulo para la integral; como esto
no debe ocurrir, parece claro que el término entre llaves debe anularse siempre.
Aunque este argumento sea poco riguroso, la conclusión a se llega es correcta: de
la exigencia de anulación de la integral anterior para todo h(t) se concluye una
condición necesaria de mı́nimo para el funcional de acción, que es que se verifique
la llamada ecuación de Euler-Lagrange del problema variacional:

d2 x0 (t) dV 
m + = 0,
dt2 dx x0 (t)

que por supuesto es simplemente la ecuación de Newton que gobierna el movimien-


to de la partı́cula en el campo de potencial V (x). Ası́ pues, matemáticamente la
descripción a través del principio de mı́nima acción y a través de las ecuaciones
de Newton son equivalentes.

Introducción a las Matemáticas del Cálculo Variacional


Ejemplos como el principio de mı́nima acción, el principio de Fermat, y proble-
mas como la determinación de la forma de equilibrio de un hilo flexible e inexten-
sible o la determinación de la curva que encierra un área máxima con perı́metro
dado, muestran la necesidad de considerar, junto con las funciones de varias vari-
ables, un tipo más general de aplicaciones, que a cada función de un determinado
conjunto de funciones le asocian un número real. Desde un punto de vista for-
mal, se trata simplemente de aplicaciones de ciertos conjuntos de funciones en
Cálculo Variacional 2002/2003 9

la recta real R, y por tanto encajan dentro de la definición general de función,


como aplicación entre conjuntos. Pero es tradicional y resulta conveniente usar en
estos casos el nombre de funcional, para enfatizar aquellos aspectos en los que el
cálculo con funciones de varias variables difiera del cálculo con este nuevo tipo de
“funciones” definidas en espacios de funciones cuya dimensión es infinita.
La idea de diferenciabilidad para funcionales puede desarrollarse de manera
semejante a cómo se hace para funciones de varias variables en el caso de que el
espacio de funciones en el que el funcional está definido tenga estructura de espacio
de Banach (espacio vectorial, en general de dimensión infinita, normado y com-
pleto). Afortunadamente, en muchos de los casos de interés en Fı́sica, incluyendo
todos los ejemplos presentados más arriba, se da tal circunstancia. Supondremos
en lo sucesivo que los funcionales que vamos a considerar están definidos en un
espacio de Banach. [Recordemos que un espacio de Banach es un espacio vectorial
V , a cuyos elementos f ∈ V se les puede dotar de una norma f , que satisface
ciertas condiciones que son familiares en el ejemplo de la norma natural del espacio
Rn : Para todo elemento f , f  es un número real positivo, nulo sólo cuando f = 0,
con la propiedad de homogeneidad λf  = |λ|f  y satisfaciendo la desigualdad
triangular. Con la topologı́a asociada a esa norma el espacio es completo, es de-
cir, toda sucesión de Cauchy tiene lı́mite en el espacio V . Es importante tener
presente que en cuanto se consideran situaciones en donde intervienen espacios
de dimensión infinita, los problemas asociados con los dominios de definición no
pueden dejarse de lado].
Definición. Sea V un cierto conjunto de funciones, que supondremos con
estructura de espacio de Banach de dimensión infinita sobre los reales.
Un funcional real F es una aplicación F : D(F) → R, que a cada función f del
dominio D(F) le asocia un valor real.
El dominio de F, D(F) es un cierto subconjunto del espacio V , en el que F(f )
está definido.
Diremos que F es un funcional lineal si para cada par de funciones f, g ∈ D(F),
se verifica F(λf + µg) = λF(f ) + µF(g); ∀λ, µ ∈ R.
Un ejemplo importante de funcional
Sea C 1 [a, b] el espacio de las funciones continuas de [a, b] en R que admitan
derivada primera continua en todo el intervalo [a, b]. C 1 [a, b] admite la estructura
de espacio de Banach cuando le dotamos de la norma definida por:

||f || = sup |f (x)| + sup |f  (x)|. (1)


x∈[a,b] x∈[a,b]

En la topologı́a inducida por esta norma, dos funciones son próximas cuando
en todo el intervalo [a, b], tanto las funciones como sus derivadas toman valores
próximos; la distancia entre dos funciones f, g se define como la norma de la
diferencia f − g.
Cálculo Variacional 2002/2003 10

Esta norma se encuadra dentro de una familia de normas no equivalentes que pueden
definirse en el espacio de funciones continuas y con derivadas parciales continuas de
cualquier orden, C ∞ [a, b]. Se define la norma de orden k, k = 0, 1, 2, . . . , mediante
  k 
 d f (x) 
f k = sup 
sup |f (x)|, sup |f (x)|, . . . sup   
x∈[a,b] x∈[a,b] x∈[a,b] dxk 

La norma f k está definida en el espacio C k [a, b] de funciones continuas y con derivadas


continuas hasta el orden k. La norma dada en (1) es equivalente a la de esta familia con
k = 1. La proximidad entre dos funciones f, g asociada a la norma f k se denomina
proximidad de orden k, y significa que en el intervalo [a, b] tanto los valores de las dos
funciones como los valores de todas sus derivadas hasta el orden k son próximos. Es claro
que dos funciones próximas de orden dado lo son tambien para todos los órdenes menores,
pero no recı́procamente.

Vamos ahora a introducir un funcional F de un tipo particular, que ha sido


sugerido por los ejemplos presentados en la introducción. A este tipo de funcionales
se referirá la mayor parte de los resultados concretos expuestos más adelante.
Comenzamos por definir su dominio, es decir, el conjunto sobre el que el funcional
está definido:
D(F) = {f ∈ C 1 [a, b] / f (a) = A; f (b) = B} (2)
donde A, B son constantes fijas. Consideremos a continuación una función de R3 a
R que denotaremos como Φ(x, y, z). Supondremos que esta función es continua y
admite derivadas parciales continuas de primer orden. Es por lo tanto una función
de clase uno en R3 , propiedad que denotaremos como Φ(x, y, z) ∈ C 1 (R3 ). La
forma explı́cita del funcional F está dada por:
 b
F(f ) = Φ(x, f (x), f  (x)) dx, ∀f ∈ D(F), (3)
a

donde f  (x) indica la derivada de la función f (x). La integral está bien definida
∀f ∈ D(F), pues el integrando es una función continua de x en el intervalo com-
pacto [a, b], y por lo tanto la correspondiente integral de Riemann siempre existe.
Nótese que pueden existir funcionales de muchos otros tipos. Por ejemplo, el
funcional podrı́a estar dado por una expresión en donde la función f no aparezca
bajo una integral (ejemplo, el funcional F(f ) = f (c), donde c es un punto dado del
intervalo [a, b]; tales funcionales aparecen en relación con la teorı́a de distribuciones
y la delta de Dirac) o bien podrı́a estar dado por una integral cuyo integrando
dependiera de la derivada segunda o incluso de derivadas de órdenes superiores de
la función f . A lo largo de estas notas, aunque daremos las definiciones en la forma
general, nos restringiremos a la consideración de funcionales como el definido en
(2)-(3)
En general D(F) no es un subespacio vectorial de C 1 [a, b], salvo que f (a) = 0
y f (b) = 0. Sin embargo, el dominio D(F) está asociado muy directamente a un
cierto subespacio vectorial M de C 1 [a, b]: M = {h ∈ C 1 [a, b] / h(a) = h(b) = 0}.
Cálculo Variacional 2002/2003 11

Es claro que M sı́ que es es un subespacio vectorial. Todo entorno de f en D(F)


es de la forma h + U donde U es un entorno de 0 en M. El subespacio lineal M
es denso en C 1 [a, b]; análogamente, el dominio D(F) es denso en C 1 [a, b].
Diferenciabilidad de Funcionales
Comencemos recordando la definición de diferenciabilidad para funciones reales
de varias variables. Se dice que una función f : Rn → R es diferenciable en el punto
x = (x1 , x2 , . . . , xn ) si existe una función lineal denotada dfx : Rn → R tal que en
un cierto entorno de x se tenga

f (x + h) − f (x) = dfx (h) + "(x, h)h,



donde "(x, h) → 0 cuando h = h21 + h22 + · · · + h22 → 0. Geométricamente,
supuesto el punto x fijo, la función afı́n dada en un cierto entorno de x por
x + h → f (x) + dfx (h) es la aplicación tangente a la función f en el punto f (x),
y su gráfica es el hiperplano tangente a la gráfica de f en el punto (x, f (x)). En
cualquier texto de Análisis Matemático pueden encontrarse las demostraciones de
las siguientes propiedades importantes:
• Si f es diferenciable en x, entonces dfx es única.
• Si la función f tiene un mı́nimo en el punto x (o un máximo, o en general
un valor estacionario), entonces en el punto x la diferencial dfx (h) se anula,
dfx (h) = 0.
• La expresión explı́cita de la diferencial dfx es:
  
∂f  ∂f  ∂f 
dfx (h) = h1 + h2 + · · · + hn ,
∂x1 x ∂x2 x ∂xn x

es decir, dfx es una función lineal de h = (h1 , h2 , . . . , hn ) cuyos coeficientes son


las derivadas parciales de f en el punto x. En particular, esta relación implica
que si x es un mı́nimo de la función f (o en general un punto estacionario de
f ), todas las derivadas parciales de f en el punto x se anulan.
Los puntos en los que la diferencial de la función diferenciable f se anula se
denominan puntos crı́ticos de la función f . Para funciones de una variable los pun-
tos crı́ticos aislados son, bien máximos relativos estrictos, bien mı́nimos relativos
estrictos, bien puntos de inflexión con tangente horizontal. Para funciones de dos
variables puede haber puntos crı́ticos aislados (bien máximos relativos estrictos,
mı́nimos relativos estrictos o puntos de ensilladura), o lı́neas crı́ticas, formadas por
puntos crı́ticos no aislados (tı́picamente, cuando la función presenta un compor-
tamiento tipo bañera, con una lı́nea de mı́nimos relativos no estrictos).
Pasemos ahora a dar las definiciones pertinentes para funcionales:
Definición. Diremos que un funcional F en D(F) es continuo en f ∈ D(F)
si ∀ " > 0, ∃ δ > 0 tal que si g ∈ D(F) con la condición que f − g < δ, entonces
Cálculo Variacional 2002/2003 12

|F(f ) − F(g)| < ". Equivalentemente si limg→f F(g) = F(f ). Un funcional es


continuo si lo es en todos los elementos de D(F).
La idea de continuidad de un funcional hace referencia a la norma f  del espacio de
funciones. En estas notas siempre nos referiremos a la norma (1), pero conviene tener este
hecho presente, ya que un determinado funcional podrı́a ser continuo para ciertas normas
y no continuo para otras.

Definición. Diremos que un funcional F es diferenciable en la función f ∈


D(F) si existe un funcional lineal denotado δFf : M → R tal que en un cierto
entorno de f en D(F) (asociado a un cierto entorno de 0 en M) se tenga:

F(f + h) − F(f ) = δFf (h) + E(f, h) h

donde E(f, h) → 0 cuando h → 0.


Aquı́ la norma de la función h hace referencia a la norma del espacio de Banach
de funciones. Geométricamente, podemos imaginar el funcional lineal afı́n dado
en un cierto entorno de la función f por f + h → F(f ) + δFf (h) como el funcional
tangente al funcional F en la función f . El funcional lineal δFf : M → R se
denomina variación primera del funcional F en la función f ; el uso de un término
especı́fico pretende que el lenguaje transmita que estamos discutiendo funcionales
y no funciones de varias variables.
Extremales de funcionales
Para funciones de varias variables, los puntos crı́ticos incluyen aquellos en los
que la función alcanza bien un máximo o bien un mı́nimo relativo. La idea análoga
para funcionales es la de función extremal de un funcional, que también se denom-
inan puntos crı́ticos o funciones crı́ticas del funcional. Las extremales más simples
son los máximos y mı́nimos, cuyas definiciones son evidentes:
Definición. Diremos que el funcional F tiene un mı́nimo absoluto en la
función f ∈ D(F) si para cualquier función g ∈ D(F) se verifica F(g) > F(f ). Di-
remos que el funcional F tiene un mı́nimo relativo en la función f ∈ D(F) si para
cualquier función g ∈ D(F) en un cierto entorno de f se verifica F(g) > F(f ).
Las definiciones de máximo absoluto y relativo son análogas. No vamos a entrar
en las modificaciones para distinguir entre mı́nimos estrictos (<) o no estrictos
(≤) que son completamente análogas a las pertinentes para funciones de varias
variables.
Ahora podemos investigar los análogos de los tres resultados básicos enunciados
antes para funciones de varias variables. Vamos a enunciarles primero, y luego
pasaremos a su demostración.
• Si el funcional F es diferenciable en la función f , la variación primera δFf (h)
es única.
• Si el funcional F tiene un mı́nimo (o un máximo) relativo estricto en la función
f , entonces la variación primera δFf (h) del funcional F en la función f se anula
idénticamente, δFf (h) = 0.
Cálculo Variacional 2002/2003 13

• Para el funcional dado en (2-3), la expresión explı́cita de la variación primera


δFf (h) es el funcional lineal:
 b  
∂Φ d ∂Φ
δFf (h) = − h(x) dx,
a ∂f dx ∂f 

Conviene notar que el papel de las n derivadas parciales de la función F eval-


uadas en el punto x que aparecı́an en la expresión de la diferencial de una función
de varias variables F , lo juega para este funcional la función ∂Φ∂f − dx ∂f  de la
d ∂Φ

variable x. Esta analogı́a motiva la introducción de la idea de derivada variacional


del funcional F, que para el caso que nos ocupa se define mediante:

δF ∂Φ d ∂Φ
:= −
δf ∂f dx ∂f 

expresión que permite escribir la variación primera en la forma:


 b
δF
δFf (h) = h(x) dx.
a δf

En el resto de estas notas no usaremos explı́citamente la idea de derivada varia-


cional, pero conviene tener presente que el sı́mbolo δfδF(t) , es en nuestro problema
variacional para el funcional F(f ) el más cercano “análogo” de la derivada parcial
∂f
ordinaria ∂x n
para una función de varias variables f (x).
La expresión para la variación primera del funcional tipo (2)-(3) implica que
si en la función f el funcional tiene un mı́nimo o un máximo entonces debe satis-
facerse la ecuación llamada de Euler-Lagrange:

∂Φ d ∂Φ
− =0
∂f dx ∂f 

Pasemos a indicar las demostraciones de estos resultados.


Teorema. Si el funcional F es diferenciable en la función f , entonces la
variación primera δFf (h) es única.
La demostración de este teorema resulta más clara usando un lema previo.
Lema. Sea ϕ un funcional lineal en un espacio de Banach real. Si se verifica la
propiedad ϕ(h)
h
→ 0 cuando h → 0, entonces ϕ(h) = 0, ∀h.
La idea en este lema es que cuando h → 0, cualquier funcional lineal tiende a 0
linealmente con la norma de h. Por tanto, la única posibilidad de que un funcional lineal
tienda a 0 más rápidamente que la norma de h es que el funcional sea idénticamente
nulo. La prueba formal procede por reducción al absurdo. Supongamos que ϕ es un
funcional no idénticamente nulo que satisface la condición. Entonces existe una función
no nula h0 = 0 tal que ϕ(h0 ) = 0. Consideremos ahora la sucesión de funciones hn = hn0 ,
que tiende a la función cero cuando n → ∞, ya que  hn0 − 0 = n 1
h0  → 0. Por
Cálculo Variacional 2002/2003 14

ϕ(hn )
hipótesis, la sucesión hn 
→ 0. Pero por otro lado, supuesta linealidad, se tiene que
1 ϕ(h )
ϕ(hn ) ϕ(h0 ) ϕ(hn )
hn 
= n 0
1 h  = h0 
= 0. Ası́ pues, vemos que la sucesión hn 
no depende de n,
n n
y por tanto no puede tender a 0 cuando n → ∞. en contra de la hipótesis. Ello implica
que ϕ(h) = 0, ∀h.
Prueba del Teorema. Supongamos que F es diferenciable en f y que la corre-
spondiente variación primera no es única. Si es ası́, habrá por lo menos dos variaciones
primeras, que denotaremos como ϕ1 y ϕ2 . Se tendrá:

F (f + h) − F (f ) = ϕ1 (h) + 1 (h, f ) h = ϕ2 (h) + 2 (h, f ) h

En la primera de las fórmulas h ∈ U  , mientras que en la segunda h ∈ U  siendo U  y


U  sendos entornos de 0 en M. Ambas son válidas en un entorno U = U  ∩ U  . De
esta manera si h ∈ V , el funcional lineal (ϕ1 − ϕ2 )(h) vale ϕ1 (h) − ϕ2 (h) = (2 − 1 ) h,
que verifica la condición del lema anterior y por tanto debe ser idénticamente nulo. Esto
demuestra el teorema.

Teorema. Sea F un funcional diferenciable. Una condición necesaria para


que tenga un máximo o un mı́nimo relativo en f ∈ D(F) es que δFf = 0, es decir,
que la variación primera de F en f se anule.
Vamos a probar el teorema para el caso de que F tenga un mı́nimo en f . Si f fuere
un máximo, la demostración serı́a análoga.
Como F es diferenciable, lo es en particular en f . De esta manera, existe un funcional
lineal ϕ en M y un entorno de cero U en M, tal que ∀h ∈ U se tiene que:

F (f + h) − F (f ) = ϕ(h) + (h, f )h

Escojamos h0 ∈ M arbitrario en M. Para λ suficientemente pequeño en valor abso-


luto, h = λh0 está en el entorno U , y a él se le puede aplicar la condición de diferencia-
bilidad
F (f + λh0 ) − F (f ) = δFf (λh0 ) + E(f, λh0 )λh0 
Dividamos ambos miembros por la norma de h, h = λh0  = |λ|h0 , y notemos que la
variación primera es lineal, y por tanto δFf (λh0 ) = λ δFf (h0 ). Ası́ se obtiene que para λ
suficientemente pequeño,

λ δFf (h0 ) F (f + λh0 ) − F (f )


+ E(f, λh0 ) =
|λ| h0  |λ|h0 

Por otro lado, en la hipótesis de que f es un mı́nimo del funcional, se tiene que para
todo λ, F (f + λh0 ) − F (f ) > 0. Ası́ pues, para cualquier λ = 0, el valor del segundo
miembro es siempre positivo, independientemente del signo de λ. Distingamos ahora las
dos posibilidades en las que λ → 0 manteniendose bien positivo o bien negativo. En la
primera, se tiene que

δFf (h0 )
+ E(f, λh0 ) ≥ 0 cuando λ > 0, suficientemente pequeño
h0 

mientras que en la segunda lo que resulta es

δFf (h0 )
− + E(f, λh0 ) ≥ 0 cuando λ < 0, suficientemente pequeño
h0 
Cálculo Variacional 2002/2003 15

Tomando ahora los lı́mites λ → 0+ , λ → 0− y recordando que E(f, λh0 ) → 0 cuando λ →


δFf (h0 ) δFf (h0 )
0, se encuentra respectivamente que h0 
≥0 y h0 
≤ 0. Estas dos condiciones
δFf (h0 )
solamente serán compatibles si h0 
= 0. Ası́ pues la primera variación se anula en
M, como querı́amos demostrar.

Variación primera y ecuación de Euler-Lagrange


Vamos ahora a calcular la variación primera del funcional del tipo importante
que hemos presentado en (3). Se trata del funcional definido en C 1 [a, b], espacio
de funciones continuas de [a, b] en R que admitan derivada primera continua en
todo el intervalo [a, b], con dominio y definición siguientes:
 b
D(F) = {f ∈ C [a, b] / f (a) = A; f (b) = B},
1
F(f ) = Φ(x, f (x), f  (x)) dx,
a

donde A, B son constantes fijas y la función Φ(x, y, z) : R3 → R admite derivadas


parciales continuas de primer orden. Vamos a:
• Demostrar que este funcional siempre es diferenciable.
• Calcular su variación primera.
Comencemos dando una expresión auxiliar importante. Para ello tomaremos
un punto (x, y, z) de R3 . Puesto que Φ(x, y, z) es continua y admite derivadas
parciales continuas en todo R3 , es diferenciable en todos los puntos. Existirá
entonces un entorno de (x, y, z), tal que si (x1 , y1 , z1 ) pertenece a este entorno se
verifica:
  
∂Φ  ∂Φ  ∂Φ 
Φ(x1 , y1 , z1 )−Φ(x, y, z) = (x1 −x)+ (y1 −y)+ (z1 −z)+" (x1 −x, y1 −y, z1 −z)
∂x x ∂y x ∂z x
(4)
donde las derivadas parciales están evaluadas en el punto (x, y, z) y " es una función
dependiente de (x, y, z; x1 , y1 , z1 ) y que tiende a cero cuando (x1 , y1 , z1 ) → (x, y, z).
La norma (x1 − x, y1 − y, z1 − z) se refiere a la norma canónica del espacio R3 ,
esto es (x1 − x, y1 − y, z1 − z) = (x1 − x)2 + (y1 − y)2 + (z1 − z)2 .
Vamos ahora a usar esta fórmula para evaluar la diferencia entre el valor del
funcional en la función f y en otra función f + h en un cierto entorno de f (o lo
que es lo mismo, para h en un cierto entorno de cero en M):
 b
F(f + h) − F(f ) = {Φ(x, f (x) + h(x), f  (x) + h (x)) − Φ(x, f (x), f  (x))} dx.
a

Ahora llevamos (4) a esta fórmula, a condición de que h(x) esté en un cierto
entorno de 0 en M. De esta manera, para h en dicho entorno:

 b
b
∂Φ ∂Φ  
F(f +h)−F(f ) = h(x) + h (x) dx+ "(x) (h(x))2 + (h (x))2 dx,
a ∂f ∂f  a
Cálculo Variacional 2002/2003 16

en donde las derivadas de Φ están evaluadas ambas en el punto (x, f (x), f  (x)), y
en el término de la derecha "(x) ≡ "(x, f (x) + h(x), f  (x) + h (x); x, f (x), f  (x))
tiende a cero cuando h → 0. Nótese que para f, h fijas, podemos considerar " como
una función de x. Denotemos ahora:
 b
 b 
∂Φ ∂Φ 
ϕf (h) = h+ 
h dx, C(f, h) = "(x) (h(x))2 + (h (x))2 dx.
a ∂f ∂f a

En cuanto a ϕf (h), se trata de un funcional lineal que está bien definido en todo
M. En efecto, la integral que lo define existe ya que el integrando es una función
continua de x en el intervalo [a, b]. Su linealidad es evidente.
Si demostramos que cuando h → 0 el término restante C(f, h) tiende a 0 más
rápidamente que la norma de h, entonces, identificando con la descomposición
en la definición de funcional diferenciable, habremos demostrado que el funcional
F es diferenciable, y de paso habremos obtenido una expresión para la variación
primera de F en f .
Escribamos el término extra C(f, h) en la forma C(f, h) = E(f, h)h. Debemos
probar que E(f, h) tiende a 0 cuando h → 0. Para ver que esto es cierto, escribamos:
  
C(f, h) 1 b b h2 + (h )2
E(f, h) = = (x) h2 + (h )2 dx = (x) dx
h h a a h

el último paso dado que h es una constante. Observemos ahora que para todo valor de
x en el intervalo [a, b]:

(h(x))2 + (h (x))2 ≤ |h(x)| + |h (x)| ≤ sup |h(x)| + sup |h (x)| = h
x∈[a,b] x∈[a,b]

puesto que por ser h(x) una función real, se tiene que h2 + (h )2 = |h|2 + |h |2 , y ası́

(|h| + |h |)2 = |h|2 + |h |2 + 2|hh | ≥ |h|2 + |h |2 = h2 + (h )2


√ 2
h +(h )2
De aquı́ se deriva que en todo el intervalo [a, b], el cociente h
< 1. Como el
módulo de una integral es menor o igual que la integral del módulo, se tiene que:
      b
 b h2 + (h )2  b h2 + (h )2
 
|E(f, h)| =  (x) dx ≤ |(x)| dx ≤ |(x)| dx
 a h  a h a

Esta expresión es la integral en un compacto de una función de x que tiende a cero cuando
h → 0, luego resulta que E(f, h) → 0 cuando h → 0, como querı́amos demostrar.

Ası́ pues, queda probado que F es diferenciable y que su variación primera en


f viene dada por el término ϕf (h), es decir
 b

∂Φ ∂Φ 
δFf (h) = h+ h dx
a ∂f ∂f 

donde, insistimos, las derivadas parciales se evalúan en el punto (x, f (x), f  (x)).
Cálculo Variacional 2002/2003 17

Vamos ahora a transformar esta expresión, haciendo uso del recurso de eliminar
la derivada h mediante una integración por partes:
 b  b  b
b
∂Φ  ∂Φ  d ∂Φ d ∂Φ

h dx = 
h − 
h dx = − 
h dx.
a ∂f ∂f a a dx ∂f a dx ∂f

Sustituyendo en la expresión para la variación primera del funcional F se obtiene


 b

∂Φ d ∂Φ
δFf (h) = − h(x) dx (5)
a ∂f dx ∂f 

Tenemos ya los ingredientes necesarios para determinar las funciones que hacen
máximo o mı́nimo el funcional F. En dichas funciones, la primera variación del
funcional debe ser idénticamente nula, lo que significa que si en la función f el
funcional F es mı́nimo o máximo, debe satisfacerse la condición
 b

∂Φ d ∂Φ
δFf (h) = − h(x) dx = 0
a ∂f dx ∂f 

para cualquier h ∈ M, esto es, satisfaciendo las condiciones h(a) = h(b) = 0.


Vamos a demostrar rigurosamente que esto implica que el término entre corchetes
en el integrando debe ser nulo. La demostración se basa en dos lemas:
Lema I. Sea γ(x) una función continua en el intervalo [a, b] tal que para toda
función h(x) ∈ C 1 [a, b] con h(a) = h(b) = 0 se satisface la condición
 b
γ(x) h (x) dx = 0
a

Entonces γ(x) es una constante.


Lema II. Sean α(x) y β(x) dos funciones continuas en el intervalo [a, b] tales
que para toda función h(x) ∈ C 1 [a, b] con h(a) = h(b) = 0 se satisface la condición:
 b
{α(x) h(x) + β(x) h (x)} dx = 0.
a

Entonces β(x) es diferenciable y β  (x) = α(x); ∀x ∈ [a, b].


Demostración de los dos lemas. b
1
Lema I. Definamos la constante C = b−a a γ(x) dx y la función auxiliar H(x) =
x
a [γ(τ )−C] dτ . Por construcción, la función H(x) tiene como derivada a H  (x) = γ(x)−C,
luego es una función continua, H(x) ∈ C 1 [a, b]. En x = a esta funcion vale H(a) = 0

obviamente, y en x = b se tiene H(b) = ab γ(τ ) dτ − ab C dτ = ab γ(τ ) dτ −C(b−a) = 0 De
esta manera, H(x) satisface las propiedades exigidas a h(x) en el enunciado del lema, de
Cálculo Variacional 2002/2003 18

b
manera que H(x) ha de satisfacer la condición del lema, a γ(x) H  (x) dx = 0. Calculemos
ahora la integral
 b  b
{γ(x) − C}H  (x) dx = γ(x) H  (x) dx − C{H(b) − H(a)} = 0.
a a

Pero la misma integral puede calcularse también sustituyendo H  (x) = γ(x) − C:


 b  b

0= {γ(x) − C} H (x) dx = (γ(x) − C)2 dx
a a

ecuación que implica que α(x)−C = 0 (ya que (α(x)−C)2 ≥ 0), salvo quizá en un conjunto
de medida nula en el intervalo [a, b]. Como α(x) es continua por hipótesis, resulta que
α(x) = C ∀x ∈ [a, b]. De esta manera
queda probado el lema.
Lema II. Definamos A(x) = ax α(τ ) dτ . Como en la demostración del lema anterior,

tenemos ab A(x) h (x) dx = A(x) h(x)|ba − ab α(x) h(x) dx. El primer término del miembro
de la derecha es nulo debido a las propiedades de h(x); de esta manera la condición del
Lema II puede reescribirse como
 b
{−A(x) + β(x)} h (x) dx = 0.
a

Aplicando ahora el lema I, se tiene que β(x) − A(x) = C, es decir, β(x) = A(x) + C, con
lo que β(x) es diferenciable y β  (x) = A (x) = α(x), como querı́amos demostrar.

Vamos ahora a usar estos dos lemas para demostrar la condición necesaria
conocida como ecuación de Euler-Lagrange para que un funcional del tipo (2-3)
tenga un máximo o un mı́nimo en f . En la expresión obtenida antes,
 b

∂Φ ∂Φ 
δFf (h) = h+ h dx = 0,
a ∂f ∂f 

aplicamos el Lema II, con α(x) en el papel de ∂Φ∂f mientras que β(x) hace el papel
∂Φ ∂Φ
de ∂f  . Obtenemos ası́ que que ∂f  es diferenciable con respecto a x y que su
derivada con respecto a x debe ser igual a ∂Φ
∂f . Esto es,

d ∂Φ ∂Φ
el funcional F del tipo (2)(3) tiene un máximo o un mı́nimo en f ⇒ − =0
dx ∂f  ∂f

Esta es la llamada ecuación de Euler-Lagrange, ecuación diferencial para la función


f (x) en la cual el funcional F alcanza mı́nimos o máximos relativos.
En el caso de las funciones f (x), en un máximo o un mı́nimo la diferencial en el
punto x, dfx se anula. Pero de la anulación de la diferencial en x no se sigue que la
función tenga en x un máximo o un mı́nimo, sino sólo que el punto x es un punto
crı́tico. Para funcionales, la situación es semejante, y mientras que la primera
variación del funcional F se anula en un mı́nimo o un máximo, de la anulación de
la primera variación no se sigue que el funcional F tenga un máximo o un mı́nimo.
Se definen en general las extremales del funcional diferenciable F como aquellas
Cálculo Variacional 2002/2003 19

funciones en las que la primera variación δFf se anula idénticamente. Además


de las funciones en las que el funcional tiene un mı́nimo o un máximo relativo,
las extremales incluyen otras funciones en las que el funcional es estacionario,
de manera análoga al caso de los puntos crı́ticos que además de los mı́nimos o
máximos incluyen puntos de inflexión con tangente horizontal, puntos de silla con
diferentes signaturas, etc.
Podemos formular el resultado importante obtenido en esta sección mediante:

d ∂Φ ∂Φ
el funcional F tiene una extremal en f ⇔ 
− =0
dx ∂f ∂f

• Ejercicio 6. En ocasiones, la función Φ no depende explı́citamente de x. Demostrar que


en ese caso la ecuación de Euler-Lagrange admite una integral primera dada por f  ∂f ∂Φ
 − Φ.
Ası́, en dicho caso las extremales
 del funcional deben satisfacer también la ecuación de
d 
primer orden dx f ∂f  − Φ = 0 que suele resultar más manejable que la propia ecuación
∂Φ

de Euler-Lagrange. En el caso del principio de mı́nima acción, en el que el funcional accion


es la integral del Lagrangiano a lo largo del intervalo de tiempo dado, ¿qué significado tiene
la constante de éste tipo que aparece cuando el Lagrangiano no depende explı́citamente de
t?

• Ejercicio 7. Escribir las ecuaciones de Euler-Lagrange para el problema de la braquis-


tocrona. Resolverlas. Demostrar que la curva buscada es siempre una cicloide. Si la
velocidad inicial es nula, la cúspide de la cicloide está en el punto inicial P .

• Ejercicio 8. Determinar las curvas de longitud extremal sobre una esfera, escribiendo el
funcional de longitud y resolviendo las ecuaciones de Euler-Lagrange. Deben obtenerse los
cı́rculos máximos sobre la esfera.

Extremales que no sean de clase C 1


La exigencia que hemos hecho a las funciones de ser continuas y con derivada
continua es una exigencia técnica, que permite dar una condición necesaria muy
simple —la ecuación de Euler-Lagrange– para la existencia de extremales. Pero
conviene mencionar que en muchos casos los problemas variacionales nos obligan
a salirnos de este marco. Es decir, hay casos en los que no existen extremales
que sean suficientemente regulares, pero hay extremales que no son regulares. Un
ejemplo muy sencillo se plantea en los siguientes ejercicios.
• Ejercicio 9. Demuéstrese que si Φ(x, y(x), y  (x)) = Φ(x, y(x)), el funcional F [y(x)] sólo
puede tener funciones y(x) extremales que sean suficientemente regulares (al menos de
clase C 1 ) si la función Φ es independiente de la variable y(x); en este caso resulta que el
funcional F [y(x)] es realmente constante. Por tanto, para tener un problema variacional
que admita extremales suficientemente regulares, es esencial que el integrando Φ dependa
de las derivadas de la función y(x).

 b
• Ejercicio 10. Pruébese que el funcional F [y(x)] = y(x) dx con las condiciones de
a
contorno usuales no posee extremales, ni siquiera si se admiten en su dominio funciones
Cálculo Variacional 2002/2003 20
 b
que no sean continuas. Sin embargo, el funcional F [y(x)] = y 2 (x) dx, con las mismas
a
condiciones de contorno sı́ que admite extremales; se trata de encontrar una función x →
y(x) que haga extremal este funcional y demostrar que realmente es extremal. Nótese que
esta funcion no es continua; por ello es imposible encontrar la extremal a partir de las
ecuaciones de Euler-Lagrange. Nótese tambien que esta extremal es semejante a la solución
de Goldschmidt para el problema de la superficie de jabón sobre dos aros paralelos.

Variación segunda de un funcional


La anulación de la variación primera de un funcional en la función f es una
condición necesaria para que el funcional F sea extremal en f . Pero esa anulación
no garantiza que el funcional tenga un mı́nimo relativo en f . Se trata de la misma
situación que ocurre para las funciones, donde un mı́nimo relativo en el punto x
requiere la anulación de la diferencial dfx en x como condición suficiente, pero tal
condición se da también en un máximo y en un punto estacionario; si deseamos
que la función tenga un mı́nimo debemos exigir la condición de que la diferencial
segunda dfx2 (h) sea una forma cuadrática definida positiva. Aunque en la mayor
parte de las aplicaciones lo que resulta ser realmente importante es la condición de
extremalidad (y no la de ser precisamente mı́nimo), resulta conveniente conocer
el análogo de la diferencial segunda de una función de varias variables, que para
funcionales se denomina variación segunda.
Comenzamos recordando la situación para funciones de varias variables. En primer
lugar recordamos qué es una forma cuadrática de varias variables. Una forma bilineal
B : Rn × Rn → R es una aplicación (x, y ) → B(x, y ) que es lineal en las dos variables;

su expresión genérica es B(x, y ) = n i,j=1 Bij xi yj .Toda forma bilineal tiene asociada
una forma cuadrática, dada por C(x) := B(x, x) = n i,j=1 Bij xi xj . (Recordemos que la
forma bilineal está completamente determinada por su forma cuadrática asociada, medi-
ante la llamada identidad de polarización). Se dice que la forma cuadrática C es definida
positiva si para todo x = (x1 , x2 , . . . , xn ) diferente del vector 0 se tiene C(x) > 0.
Se dice que una función f : Rn → R es diferenciable dos veces en el punto x =
(x1 , x2 , . . . , xn ) si existen una función lineal denotada dfx : Rn → R y una forma
cuadrática denotada dfx 2 : Rn → R tal que en un cierto entorno de x se tenga

2
f (x + h) − f (x) = dfx (h) + dfx (h) + (x, h)h2 ,

donde (x, h) → 0 cuando h → 0. Esta definición lleva un paso más adelante la idea
de función diferenciable, siendo el término extra (x, h)h2 cuadrático en h, en vez
de lineal. Geométricamente, en un cierto entorno de x supuesto fijado, la función dada
por x + h → f (x) + dfx (h) + dfx 2 (h) es la funcion cuadrática en h osculatriz a la función

f en el punto f (x). En cualquier texto de análisis matemático pueden encontrarse las


demostraciones de las siguientes propiedades importantes:
• Si f es diferenciable dos veces en x, entonces dfx 2 es única.

• Si la función f tiene un mı́nimo en el punto x, entonces en el punto x la diferencial


segunda dfx 2 (h) es una forma cuadrática definida positiva.

• La expresión explı́cita de la diferencial segunda dfx2 es:


1  ∂ 2 f 
n
2
dfx (h) = hi hj ,
2! i,j=1 ∂xj ∂xi x
Cálculo Variacional 2002/2003 21

es decir, se expresa como la forma cuadrática en h cuyos coeficientes son las derivadas
parciales segundas de f en el punto x (con un factor 1/2!). En particular, esta relación
implica que si x es un mı́nimo de la función f la matriz formada por las derivadas segundas
(matriz hessiana de f en el punto x) es una matrix definida positiva.

Pasamos ahora a discutir la situación con funcionales:


Definición. Diremos que un funcional F es dos veces diferenciable en la función
f ∈ D(F ) si existen un funcional lineal denotado δFf : M → R y un funcional cuadrático,
denotado δ 2 Ff : M → R tales que en un cierto entorno de f en D(F ) (asociado a un
cierto entorno de 0 en M) se tenga:

F (f + h) − F (f ) = δFf (h) + δ 2 Ff (h) + E(f, h)h2

donde E(f, h) → 0 cuando h → 0.


Geométricamente, podemos imaginar el funcional dado en un cierto entorno de la
función f , supuesta fija, por f +h → F (f )+δFf (h)+δ 2 Ff (h) como el funcional osculador
al funcional F en la función f .
Vamos a presentar a continuación los enunciados que corresponden a los tres teoremas
discutidos al hablar de la variación primera.

Teorema. Si el funcional F es diferenciable dos veces en la función f , entonces la


variación segunda δ 2 Ff (h) es única.
Este resultado se demuestra de manera paralela al correspondiente para la variación
primera.

Para formular una condición de mı́nimo (y no sólo de extremal) necesitamos enunciar


la condición que reemplaza para nuestro caso de funcionales a la condición de que una
forma cuadrática sea definida positiva. Tal condición es:
Definición. Un funcional cuadrático C en M se dice fuertemente positivo si existe
K > 0 tal que C(h) ≥ Kh2 para cualquier h ∈ M.
Teorema. Una condición suficiente para que un funcional F dos veces diferenciable
tenga un mı́nimo en f ∈ D(F ) (supuesto que se anula la variación primera de F en f ) es
que la variación segunda δ 2 Ff de F en f sea fuertemente positiva.

Prueba. Si la primera variación de F en f se anula, δFf (h) = 0, existe un entorno


de cero W en M tal que ∀ h ∈ W se tiene que:

F (f + h) − F (f ) = δ 2 Ff (h) + (f, h) ||h||2 .

Supongamos que la variación segunda de F en f es fuertemente positiva. Entonces


δ 2 Ff (h) ≥ Kh2 , de manera que podemos escribir:

F (f + h) − F (f ) ≥ {K + (f, h)} ||h||2 ,

con (f, h) → 0 para h → 0. En particular, si h es suficientemente cercano al cero en M,


el valor absoluto de (f, h) llegará a ser menor que la constante positiva K, y por tanto
{K + (y, h)} > 0, de donde F (f + h) − F (y) > 0 y el funcional tiene un mı́nimo en f .
El cambio necesario para obtener una condición suficiente de máximo es evidente:
−δ 2 Ff debe ser fuertemente positivo.

Para acabar esta sección, vamos a obtener una fórmula para la variación se-
gunda del funcional (2-3). Ya que en el contexto que nos interesa aquı́ la segunda
variación sólo se necesita para discriminar entre los diversos tipos de extremales
Cálculo Variacional 2002/2003 22

(máximos, mı́nimos o tipo silla), basta con calcular la segunda variación en fun-
ciones f para las que la primera variación es ya idénticamente nula.
El procedimiento es una extensión del usado para encontrar una expresión de la
variación primera. Supongamos ahora que Φ(x, y, z) ∈ C 2 (R3 ), es decir que posee
derivadas parciales continuas hasta orden 2. Entonces Φ es dos veces diferenciable, lo
que equivale a decir que si h pertenece a un cierto entorno W de cero en M, tenemos:
 b  
F (f + h) − F (y) = Φ(x, f + h, f  + h ) − Φ(x, f, f  ) dx =
a
 b
 b

∂Φ ∂Φ  1 ∂2Φ 2 ∂2Φ  ∂2Φ  2


= h+ h dx + h + 2 h h + (h ) dx
a ∂f ∂f  2 a ∂f 2 ∂f ∂f  ∂(f  )2
 b
+ (x) ||(0, h(x), h (x))||2 dx.
a

La primera y segunda integrales están definidas para todo h ∈ M, y puede probarse


fácilmente que son respectivamente un funcional lineal en M y una forma cuadrática en
M. Ellas son, respectivamente la variación primera y la segunda de F en f . Ello es debido
a que la última integral puede ponerse como E(f, h) ||h||2 donde E(f, h) → 0 cuando h → 0,
lo que se comprueba de manera completamente semejante al caso de la variación primera.
Se obtiene ası́ la siguiente expresión para la variación segunda:
 b

1 ∂2Φ 2 ∂2Φ  ∂2Φ


δ 2 Ff (h) = h + 2 h h + (h )2 dx.
2 a ∂f 2 ∂f ∂f  ∂(f  )2

El segundo término en la integral puede transformarse mediante una integración por


partes, de la siguiente manera:
 b
 b
 b 

∂2Φ d ∂2Φ 2 d ∂2Φ
2 h h dx = h dx − h2 dx,
a ∂f ∂f  a dx ∂f ∂f  a dx ∂f ∂f 
b
∂2Φ 
y la primera integral en el segundo miembro de esta ecuación resulta ser igual a ∂f ∂f 
h2 
a
que se anula debido a las condiciones h(a) = h(b) = 0.

De esta manera nos queda la siguiente expresión para la variación segunda de


un funcional del tipo usual en una función f que anule la variación primera, en
estos términos:
  2 

1 b ∂ Φ d ∂2Φ ∂2Φ  2
δ Ff (h) =
2
− 2
h + (h ) dx, cuando δFf = 0
2 a ∂f 2 dx ∂f ∂f  ∂(f  )2

Problemas variacionales con ligaduras (Problemas isoperimétricos)


Se presenta con frecuencia el problema de encontrar los puntos crı́ticos (mı́ni-
mos, máximos, etc) de una función de varias variables que no son independientes
sino que están sujetas a una o varias condiciones adicionales, conocidas como
ligaduras. El ejemplo más sencillo y fácil de visualizar es el de la búsqueda del
máximo (o mı́nimo) de una función de dos variables f (x, y) sobre una determinada
curva Γ en el plano x, y; tales máximos y mı́nimos condicionados ocurren en puntos
Cálculo Variacional 2002/2003 23

en los que la función considerada como función de dos variables independientes no


tiene máximos ni mı́nimos. Un ejemplo de comprensión inmediata: cuando se
sigue un camino en la ladera de una montaña, la altura puede tener máximos o
mı́nimos relativos a lo largo del camino, que en general no corresponden a máximos
o mı́nimos de la función que da la altura de la superficie en cada punto de la
montaña.
La condición de anulación de la diferencial (o la equivalente de anulación de
todas las derivadas parciales) no resulta aplicable en tales casos; geométricamente
esto es claro, ya que un máximo o mı́nimo a lo largo de la curva sólo debe traducirse
en la anulación de la derivada direccional de la función a lo largo de la dirección
de la curva.
Procedimiento de fuerza bruta: usemos la condición adicional para eliminar
una de las dos variables, y consideremos la función, ya restringida a la curva,
como una función de una variable independiente, a la que se le puedan aplicar
las condiciones usuales de máximo o mı́nimo. Este método de fuerza bruta dista
de ser práctico. Aunque se pueda eliminar la variable (o variables) que debido a
las ligaduras resultan dependientes, las expresiones que se obtienen en términos
de variables independientes pueden ser poco manejables. Y además puede ocurrir
que las ligaduras estén dadas en forma implı́cita, que no admita la eliminación
explı́cita.
Se debe a Lagrange un método de determinación de máximos y mı́nimos de
funciones sometidas a ciertas condiciones adicionales que se conoce como método
de los multiplicadores de Lagrange, y consiste esencialmente en que si un punto
x = (x1 , x2 , . . . , xn ) es un máximo o mı́nimo de la función f (x1 , x2 , . . . , xn ) so-
bre la subvariedad determinada por las condición adicional g(x1 , x2 , . . . , xn ) = 0,
entonces el punto x = (x1 , x2 , . . . , xn ) es un máximo o mı́nimo de la función
f (x1 , x2 , . . . , xn ) + λg(x1 , x2 , . . . , xn ), considerada como función de n variables in-
dependientes. La constante λ, conocida como multiplicador de Lagrange, queda
determinada junto con la posición de los posibles puntos estacionarios, al resolver
las ecuaciones que establecen que en tales puntos todas las derivadas parciales de
la función f (x1 , x2 , . . . , xn ) + λg(x1 , x2 , . . . , xn ) deben anularse. Los detalles de
este método pueden consultarse en cualquier texto de Análisis Matemático.
En el cálculo variacional aparecen también naturalmente problemas con condi-
ciones adicionales. Hemos visto dos. En el problema de la catenaria, es evidente
por razones fı́sicas que sin ninguna condición adicional, el funcional “energı́a po-
tencial” de un hilo en un campo gravitatorio uniforme no presenta mı́nimos (entre
dos puntos dados, para cualquier hilo con energı́a potencial dada, siempre podemos
tender un hilo más largo, cuya energı́a potencial sea menor). Pero si consideramos
hilos de longitud prefijada, entonces sı́ que debemos esperar un mı́nimo para cierta
forma del hilo, especificada por cierta función z = f (x), que deberá satisfacer la
condición adicional de tener la longitud dada. En el problema de determinar la
curva que encierre un área máxima, es de nuevo claro que sin ninguna condición
adicional, podemos encerrar áreas cada vez mayores y mayores. Sólo si imponemos
Cálculo Variacional 2002/2003 24

una condición extra (longitud prefijada) debemos esperar que cierta forma de la
curva encierre un área máxima. En ambos casos, la condición adicional está dada
por otro funcional. Vamos a discutir este problema en el caso más sencillo de que
tanto el funcional a minimizar como la ligadura sean del tipo (2-3).
Consideremos pues un funcional en el espacio C 1 [a, b], del tipo
 b
F(f ) = Φ(x, f (x), f  (x)) dx, D(F) = {f ∈ C 1 [a, b] / f (a) = A; f (b) = B}.
a

y consideremos otro funcional G, cuyo dominio supondremos el mismo que el de


F y dado por
 b
G(f ) = Γ(x, f (x), f  (x)) dx
a

donde Γ es una función continua y con derivadas continuas que juega, para el
funcional G, un papel análogo al que Φ juega para F.
Problema isoperimétrico. Entre todas las funciones que satisfagan la cond-
ición G(f ) = G donde G es una constante real, encontrar las extremales del fun-
cional F.
En estas condiciones puede demostrarse el siguiente:
Teorema. Sea f ∈ D(F) una función extremal del funcional F satisfaciendo
la condición G(f ) = G. Supongamos además que la primera variación del funcional
G en f no es idénticamente nula. Entonces existe un número real λ de manera que
f es un extremal del nuevo funcional
 b
 )=
F(f {Φ(x, f (x), f  (x)) + λΓ(x, f (x), f  (x))} dx,
a

en el que ya no se considera ninguna condición subsidiaria.


La demostración de este teorema, ası́ como su extensión para el caso de que
existan varias condiciones de ligadura puede consultarse en el libro de Troutman.
• Ejercicio 11. Encontrar la curva entre dos puntos (−a, 0), (a, 0) del eje x, que no corta
al eje, tiene longitud dada L > 2a y que encierra entre ella y el eje x el área máxima.

• Ejercicio 12. Un hilo flexible e inextensible, de densidad lineal constante y longitud dada
L, se suspende entre dos torres de alturas A y B, separadas por una distancia horizontal d
en el campo gravitatorio (supuesto uniforme) de la tierra. Determinar la forma que adopta
el hilo.

• Ejercicio 13. Principio de reciprocidad en los problemas isoperimétricos. Supongamos


dados dos funcionales, F y G, y nos limitamos a funciones que no sean extremales ni de F
ni de G. En estas condiciones las extremales del funcional F (f ) con la condición subsidiaria
G(f ) = G son las mismas que las extremales del funcional G(f ) con la condición subsidiaria
F (f ) = F . ¿Porqué? Como aplicación, demostrar que entre las curvas que encierra un área
dada, la circunferencia es la que tiene longitud estacionaria (de hecho mı́nima).
Cálculo Variacional 2002/2003 25

Problemas Variacionales con varios grados de libertad


Hasta ahora nos hemos limitado a considerar funcionales definidos en espacios
de funciones reales de una variable, f : R → R. Pero pueden darse funcionales de
tipos más generales, por ejemplo funcionales del tipo (2-3) en las que Φ dependa
de funciones con varias componentes (vectoriales) pero de una sola variable, o bien
funcionales definidos sobre espacios de funciones de más de una variable.
En tanto intervengan funciones de una sola variable, posiblemente con varias
componentes, esto es, funciones de f : R → Rn , la mayor parte de las técnicas y
resultados descritos en estas notas se extienden directamente y de manera casi in-
mediata. Por ejemplo, el principio de mı́nima acción determina el movimiento real
que sigue una partı́cula en un potencial externo V (x, t); este movimiento es una
función x : R → R3 , que puede describirse mediante tres funciones componentes,
x(t), y(t), z(t). En este caso el funcional que se pretende minimizar es siempre
del tipo (2-3), donde ahora la función Φ depende de t y de las tres componentes
x(t), y(t), z(t), ası́ como de las tres derivadas dx(t) dy(t) dz(t)
dt , dt , dt . En el principio de
Fermat, la trayectoria seguida por un rayo de luz está descrita tambien por una
función que podemos describir dando las dos funciones y(x), z(x), y el funcional a
minimizar involucra las dos funciones y(x), z(x) y sus derivadas dy(x) dz(x)
dx , dx .
Estos ejemplos sugieren extender el tipo usual de funcionales (2-3) de la siguien-
te manera: Denotemos C 1 ([a, b], Rn ) el espacio de las funciones definidas en un
intervalo [a, b] y con valores en Rn que sean continuas y todas cuyas funciones
componentes admitan derivada primera continua en todo el intervalo [a, b]. Este
espacio admite la estructura de espacio de Banach cuando le dotamos de la norma
definida por:
f  = sup(f1 , f2 , . . . fn ),
donde para cada función componente la norma es la usada en (1). Es fácil de-
mostrar que se trata de una norma, y menos fácil de demostrar aunque también
cierto, que dotado de esta norma, el espacio C 1 ([a, b], Rn ) es un espacio de Banach.
En la topologı́a inducida por esta norma, dos funciones f , g son próximas cuando
en todo el intervalo [a, b], tanto cada una de las componentes de f , g como sus
derivadas toman valores próximos.
Vamos ahora a definir un funcional F que es la extensión del tipo descrito en
(2-3). Comenzamos por definir su dominio, es decir, el conjunto sobre el que el
funcional está definido:

D(F) = {f (x) ∈ C 1 ([a, b], Rn )/ fi (a) = Ai ; fi (b) = Bi ; i = 1, 2, . . . , n}.

Notemos que este dominio no es un subespacio vectorial salvo en el caso Ai =


Bi = 0, i = 1, 2, . . . , n. Sea ahora:

M = {h(x) ∈ C 1 ([a, b], Rn )/ hi (a) = hi (b) = 0, i = 1, 2, . . . , n}.

Obviamente D(F) = f + M para todo f ∈ D(F)


Cálculo Variacional 2002/2003 26

Sea ahora Φ(x1 , x2 , . . . , x2n+1 ) una función de R2n+1 a R que sea continua y
admita derivadas parciales continuas. Escribamos
 b
F(f ) = F(f1 , f2 , . . . , fn ) = Φ(x, f1 (x), . . . , fn (x), f1 (x), . . . , fn (x)) dx.
a

F está bien definido ∀f ∈ D(F), puesto que la función bajo el signo integral es
continua en todo el intervalo [a, b].
Repitiendo lo hecho en el caso de una función de una componente, se demuestra
que este funcional es diferenciable en todos los puntos de su dominio. Sea entonces
f = (f1 , f2 , . . . , fn ) ∈ D(F) y h = (h1 , h2 , . . . , hn ) ∈ M. Como Φ es una función
continua con derivadas parciales continuas, es diferenciable. Razonando como en
la derivación de (5) existirá un entorno de cero en M tal que

F(f1 + h1 , . . . , fn + hn ) − F(f1 , . . . , fn ) =
 b
{Φ(x, f1 + h1 , . . . , fn + hn , f1 + h1 , . . . , fn + hn ) − Φ(x, f1 , . . . , fn , f1 , . . . , fn )} dx =
a
 n
b
 b
∂Φ ∂Φ 
hi + h dx + " (0, h1 , . . . , hn , h1 , . . . , hn ) dx,
a i=1 ∂fi ∂fi i a

para todo h en dicho entorno. La primera integral está bien definida para todo
h = (h1 , . . . , hn ) ∈ M y es una aplicación lineal de M en R. La segunda puede
ponerse en la forma E(f , h) ||h||, con E(f , h) → 0 si h → 0. De esta manera, para
h en un entorno de 0 en M,

F(f1 + h1 , . . . , fn + hn ) − F(f1 , . . . , fn ) = ϕf (h) + E(f , h) h,

con
 n
b

∂Φ ∂Φ 
ϕf (h) = hi + h dx
a i=1 ∂fi ∂fi i

Esta expresión muestra que F es diferenciable, y su diferencial primera viene dada


por:
 b n

∂Φ ∂Φ 
δFf (h) = hi + h dx.
a i=1 ∂fi ∂fi i

Supongamos que F admite un extremal en f = (f1 , . . . , fn ) ∈ D(F). Entonces,


la variación primera de F en f se ha de anular. Esto significa que para todo h ∈ M,
tenemos:
 bn

∂Φ ∂Φ 
hi + h dx = 0
a i=1 ∂fi ∂fi i
Cálculo Variacional 2002/2003 27

Las derivadas parciales se evalúan en (x, f1 (x), . . . , fn (x), f1 (x), . . . , fn (n)). Es-
cogiendo hi (x) = 0 para todo i salvo para i = j, queda
 b 
∂Φ ∂Φ 
hj + h dx = 0.
a ∂fj ∂fj j

Esto implica, tras el Lema II visto antes que

d ∂Φ ∂Φ
 − = 0.
dx ∂fj ∂fj

Realizando la misma operación para todos los j = 1, 2, . . . , n resulta un sistema


de n ecuaciones en las n funciones incógnitas f1 , f2 , . . . , fn entre cuyas soluciones
están los extremales f = (f1 , f2 , . . . , fn ) del funcional F. A dicho sistema de
ecuaciones se le conoce como sistema de Euler-Lagrange, o simplemente, ecuaciones
de Euler-Lagrange:

∂Φ d ∂Φ
f es un extremal del funcional F ⇔ − = 0, i = 1, 2, . . . , n.
∂fi dx ∂fi

Problemas Variacionales con varias variables: superficies mı́nimas


Otros problemas variacionales involucran funciones de dos o más variables como
los objetos primitivos de los cuales depende algún funcional que se trata de mini-
mizar. Tal situación resulta ser mucho más complicada que el caso de funciones de
una variable. El prototipo es el problema de las superficies mı́nimas: De entre
todas las superficies en el espacio R3 con un borde dado, encontrar
aquellas que tengan área mı́nima. En este caso, el funcional a minimizar
depende de una función de dos variables.
Históricamente, es notable que las ideas básicas del cálculo variacional, en
la forma que las hemos expuesto, aparecieran por primera vez en un trabajo de
Lagrange (1760) dedicado precisamente al estudio del problema nada trivial de las
superficies mı́nimas. Este trabajo despertó el interés de Euler, dando lugar a un
desarrollo por parte de ambos autores, que culminó en la sistematización de las
condiciones hoy llamadas de Euler-Lagrange.
Vamos a limitarnos a derivar, de manera directa, la ecuación diferencial que
debe satisfacer cualquier superficie mı́nima, y lo vamos a hacer poniendo solamente
el énfasis en las ideas relevantes desde el punto de vista del cálculo variacional,
eludiendo discutir detalles adicionales.
Localmente cualquier superficie puede describirse en la forma denominada
de Monge, como la gráfica de una función (x, y) → (x, y, f (x, y)), pero posible-
mente tal representacion puede no cubrir la superficie “completa”. Por ejemplo
un plano puede representarse de manera completa en forma de Monge: (x, y) →
Cálculo Variacional 2002/2003 28

(x, y, f (x, y) = z0 ), pero para una esfera la región máxima representable de esta
manera
 es un hemisferio, excluido su borde ecuatorial: (x, y) → (x, y, f (x, y) =
R2 − x2 − y 2 ).
Para simplicidad, nos limitaremos a estudiar porciones de superficie que sean
representables de dicha forma, lo que no constituye ninguna limitación importante,
ya que como veremos la condición de superficie mı́nima se traduce en una ecuación
diferencial que determina f localmente.
• Ejercicio 14. Encontrar la expresión del funcional que da el área de una superficie
descrita en el espacio ordinario R3 por la función (u, v) → (x(u, v), y(u, v), z(u, v)), como
una integral extendida a cierto dominio del espacio de parámetros (u, v). Particularizar
para el caso de que la superficie se describa en forma de Monge: (x, y) → (x, y, f (x, y)).

Como deberá haberse concluido en el ejercicio anterior, el area de la porción


de superficie que corresponde a un dominio D del plano de parámetros x, y es:

A= dx dy 1 + (fx )2 + (fy )2
D

con la integral doble extendida al dominio D y en donde para abreviar la escritura


denotamos fx ≡ ∂f ∂x , etc. Nótese la analogı́a de esta expresión con la que da
la longitud
 de una curva plana descrita en la forma x → (x, f (x)), dada por
L = dx 1 + (fx )2 .
Consideremos una curva Γ dada en espacio R3 . Esta curva se supondrá cerrada,
sin autointersecciones y suficientemente regular, y es quien va a jugar el papel
que los dos extremos ta , xa ; tb , xb jugaban para problemas variacionales del tipo
implicado en el principio de mı́nima acción. La proyección de Γ sobre el plano
x, y es una curva plana, que llamaremos γ, que también supondremos cerrada, sin
autointersecciones y suficientemente regular. La propia curva Γ puede describirse
como el conjunto de puntos (x, y, zγ (x, y)) en donde se supone que (x, y) ∈ γ y
donde z(x, y) es la función fija, definida solamente en γ y que describe la altura
de la curva Γ. Denotemos D el dominio del plano cuyo borde es γ: este dominio
es homeomorfo a un disco ya que la curva γ no tiene autointersecciones.
La forma general de la descripción de Monge de una superficie que tenga a Γ
como borde está dada por una función de dos variables, suficientemente regular,
en la forma:

(x, y) ∈ D → (x, y, z(x, y)), donde z(x, y) = zγ (x, y) para (x, y) ∈ γ

La idea esencial de la derivación de Lagrange es la siguiente. Supongamos que


la función f (x, y) (aún desconocida) corresponde a una superficie Σf con borde
Γ y de área mı́nima entre todas las que satisfagan las condiciones anteriores. Sea
h(x, y) una función fija, suficientemente regular, definida en el dominio D, y a la
que exigimos satisfacer la condición

h(x, y) = 0 para (x, y) ∈ γ


Cálculo Variacional 2002/2003 29

En estas condiciones, tenemos una familia de superficies, que podemos denotar


mediante Σf (h, ") cuya descripción de Monge es:

(x, y) ∈ D → (x, y, f (x, y) + "h(x, y)),

que se construyen a partir de la superficie Σf (aún desconocida), tomando como


dato de deformación la función h(x, y); aquı́ " juega el papel de un parámetro,
de manera que esta familia es una familia uniparamétrica de superficies, todas las
cuales tienen a la curva Γ como borde, ya que para cualquier valor del parámetro
" se verifica la condición

f (x, y) + "h(x, y)) = z(x, y) para (x, y) ∈ γ

El área de la superficie Σf (h, ") está dada por:



Ah, = dxdy 1 + (fx + "hx )2 + (fy + "hy )2

Si la superficie Σf (descrita por f (x, y)) tiene realmente area mı́nima entre
todas las superficies con el mismo borde, también debe tener área mı́nima entre
las de la familia uniparamétrica anterior Σf (h, "). Esto significa que la función
Ah, debe tener un mı́nimo en " = 0, es decir

dAh, 
0= .
d" =0

Derivando con respecto a " en Ah, y evaluando en " = 0 la condición anterior


se transforma en: 
fx hx + fy hy
dx dy  =0 (6)
D 1 + (fx )2 + (fy )2
Ası́ pues, si la superficie Σf es mı́nima, la condición (6) debe satisfacerse para
cualquier elección de la función auxiliar h que satisfaga la condición de anulación
sobre γ.
Por analogı́a con lo estudiado anteriormente, el paso siguiente debe ser trans-
formar la integral en (6) en otra integral que sea lineal en h, pero en donde no
aparezcan las derivadas de h. La manera más clara de hacerlo es la siguiente. Con-
sideremos la integral en (6) (que debe anularse) como una suma de dos sumandos:
 
fx hx fy hy
dx dy  + dx dy 
2
1 + (fx ) + (fy )2 1 + (fx )2 + (fy )2
D D

Vamos a realizar la transformación de manera ligeramente diferente, aunque per-


fectamente análoga, sobre cada uno de estos dos sumandos. Comenzemos con

fx hx
dx dy 
D 1 + (fx )2 + (fy )2
Cálculo Variacional 2002/2003 30

que escribiremos como (hágase un diagrama que aclare el uso de los lı́mites de
integración):
 ymax  xb (y)
fx
dy  hx dx.
ymin xa (y) 1 + (fx )2 + (fy )2
donde ymin , ymax son los valores mı́nimo y máximo de la coordenada y sobre la
curva γ, mientras que xa (y), xb (y) son los valores mı́nimo y máximo de x sobre el
segmento de recta paralela al eje x y que tiene ordenada y. (Nota: para simplificar
la discusión estamos suponiendo que el dominio es convexo, y que la intersección
con las rectas paralelas a los ejes tiene sólo dos puntos; esta restricción simplifica
la discusión pero no es esencial al resultado).
Hacemos ahora la integración en x por partes, tomando u = √ fx
2 2
,
1+(fx ) +(fy )
v = h. Ası́ obtenemos para la integral en x lo siguiente:
xb (y)   
 xb (y)
fx  ∂ fx
 h −  h dx.
1 + (fx )2 + (fy )2  xa (y)
xa (y) ∂x 1 + (fx )2 + (fy )2

El término de borde no contribuye debido a que los dos puntos (xa (y), y),
(xb (y), y) están por construcción sobre el borde γ y la función h(x, y) se anula
sobre γ. Integrando ahora con respecto a y lo que obtenemos es que el término
que implicaba a la derivada con respecto a x de h puede reescribirse como una
integral en la que es la propia función h (y no su derivada) quien aparece como
factor:
   
fx hx ∂ fx
dx dy  =− dx dy  h
1 + (fx )2 + (fy )2 ∂x 1 + (fx )2 + (fy )2

La derivada parcial que aparece ahora en el integrando se calcula fácilmente: con-


viene recordar que tanto fx como fy son funciones de x, y. El resultado es:

∂ fx fxx (1 + fy2 ) − fx fy fxy


 =  3
∂x 1 + (fx )2 + (fy )2
1 + (fx )2 + (fy )2

de manera que finalmente, lo que encontramos es:


 
fx hx fxx (1 + fy2 ) − fx fy fxy
dx dy  =− dx dy  3 h(x, y)
1 + (fx )2 + (fy )2 1 + (f )2 + (f )2
x y

Para el otro sumando que involucra hy se procede de manera análoga, pero


intercambiando y por x. Es bastante evidente que tal procedimiento conduce a:
 
fy hy fyy (1 + fx2 ) − fy fx fxy
dx dy  =− dx dy  3 h(x, y)
1 + (fx )2 + (fy )2 2
1 + (f ) + (f ) 2
x y
Cálculo Variacional 2002/2003 31

Ası́ pues, la condición de que la superficie sea mı́nima, contenida en la ecuación


(6), se convierte en:

fxx (1 + fy2 ) − 2fx fy fxy + fyy (1 + fx2 )
dx dy  3 h(x, y) = 0
1 + (fx )2 + (fy )2

y como esta ecuación debe satisfacerse para cualquier función h(x, y) (con la sola
exigencia de anularse sobre el borde γ), parece claro que la única posibilidad de
que tal cosa ocurra es que el integrando se anule, esto es, que la función f (x, y)
satisfaga la ecuación:

fxx (1 + fy2 ) − 2fx fy fxy + fyy (1 + fx2 ) = 0

que se conoce como ecuación de Lagrange para las superficies mı́nimas. A pesar
de su aspecto superficialmente inocente, como ecuación diferencial es bastante
complicada: es muy no lineal y se conocen muy pocas soluciones explı́citas. La
búsqueda efectiva de superficies mı́nimas requiere el uso de técnicas mucho más
avanzadas y elaboradas.
Un dominio cualquiera de un plano es evidentemente una superficie mı́nima,
cuyo borde es una curva plana. Escogiendo adecuadamente las coordenadas, esta
porción de superficie está descrita por f (x, y) = z0 , que satisface trivialmente la
ecuación de Lagrange. Es decir, si la curva Γ es una curva plana, la superficie
mı́nima con borde Γ es una porción de plano. Este ejemplo es absolutamente
trivial.
A finales del S. XVIII se obtuvieron otras dos superficies mı́nimas relativamente
sencillas. Una es el catenoide, que es la única superficie mı́nima de revolución.
• Ejercicio 15. La búsqueda de superficies mı́nimas con un borde dado tiene como caso
especialmente sencillo el de las superficies mı́nimas de revolución (En éste caso el borde
son dos cı́rculos paralelos y coaxiales). En este caso no es conveniente utilizar la ecuación
de Lagrange, ya que la descripción de Monge de la superficie no es posible (y además
el borde consta de dos curvas desconectadas). Es más fácil escribir directamente el área
de la superficie de revolución obtenida rotando alrededor del eje y la curva y = y(x),
entre los puntos x1 , y1 y x2 , y2 , como un funcional de la función y(x). Se pide escribir
este funcional, comprobar que formalmente coincide con el del problema de la catenaria y
encontrar las soluciones en el caso particular “simétrico” entre los puntos (R, A) y (R, −A).
Este problema es interesante ya que dependiendo de los valores de R, A, puede ocurrir que
el mı́nimo absoluto del funcional área se alcance sobre una superficie de revolución cuya
generatriz no sea una curva con derivada continua (solución de Goldschmidt).

El otro ejemplo de superficie mı́nima es el helicode recto, que es la superficie


engendrada por una recta “horizontal” que se desliza a velocidad constante a lo
largo de un “eje” vertical al tiempo que gira alrededor de dicho eje, en un plano
“horizontal” y a velocidad angular constante.
Durante más de 200 años el catenoide y el helicoide han sido las únicas su-
perficies mı́nimas conocidas que satisfacen las condiciones de ser embebidas en
Cálculo Variacional 2002/2003 32

R3 , completas y sin autointersecciones. Por ello ha resultado una agradable noti-


cia para la comunidad matemática el descubrimiento a principios de los 80 del
siglo pasado de una nueva superficie mı́nima que satisface la exigencias anteri-
ores: la superficie de Costa. Las técnicas, apoyadas en el análisis de funciones de
variable compleja, que han llevado a este descubrimiento han abierto la puerta a
una auténtica eclosión de un mundo fascinante y mucho más rico de superficies
mı́nimas. Una descripción puede verse en el libro El turista matemático de I. Pe-
tersen, y sobre la superficie de Costa hay un artı́culo de C. J. Costa en La Gaceta
Matemática, 4 (1999)). Actualmente se conocen multitud de nuevos ejemplos. La
portada del Notices of the American Mathematical Society de Diciembre de 2000
se dedica a una de ellas. En http://www.susqu.edu/brakke hay cantidad de
información sobre superficies mı́nimas triplemente periódicas.
En particular, merece la pena indicar que para una porción de superficie arbi-
traria Σf pero con borde fijo Γ, la variación primera del funcional area está dada
por:
 
A(Σf ) = 2
dx dy 1 + (fx ) + (fy ) 2 δAΣf (h) = dΣf HΣf h
D Σf

donde la función HΣf es la llamada curvatura media de la superficie, Σf , definida


como la semisuma de las dos curvaturas principales, que a su vez son las curvaturas
máxima y mı́nima de las curvas planas que se obtienen como secciones normales de
la superficie. La interpretación geométrica de la condición de Lagrange, dada por
vez primera por Meusnier, es que las superficies mı́mimas tienen curvatura media
igual a cero en todos sus puntos, lo que evidentemente garantiza la anulación del
funcional variación primera.
Para acabar, conviene mencionar que las ideas básicas (diferenciabilidad de
funcionales, funcional lineal variación primera, anulación de dicho funcional como
condición de extremalidad, etc,) se extienden a estos problemas. Aunque no hemos
escrito de manera general el problema, puede comprobarse que para un funcional
del tipo 
F(f ) = dx dy Φ(x, y; f (x, y), fx (x, y), fy (x, y)) dx,
D
sobre un dominio D del plano y con condiciones de frontera sobre el borde γ de
D del tipo

(x, y) ∈ D → (x, y, z(x, y)), donde f (x, y) = fγ (x, y) para (x, y) ∈ γ

las ecuaciones de Euler-Lagrange que se obtienen son:


∂Φ ∂ ∂Φ ∂ ∂Φ
− − = 0.
∂f ∂x ∂fx ∂y ∂fy
forma de la que la extensión a más variables independientes, o a funciones vecto-
riales de varias variables resulta ya evidente.
Cálculo Variacional 2002/2003 33

Bibliografı́a
La fı́sica que contienen los problemas variacionales está expuesta de manera
insuperable en las “Lectures” de Feynmann. Resultan de lectura obligada en
relación con este tipo de problemas los Capı́tulos “Optica, el principio del tiempo
mı́nimo” Cap. 26 del Vol I y “El principio de mı́nima acción”, Cap. 16, Vol II.
1. R.P. Feynmann, R. B. Leighton y M. Sands, Lectures on Physics, Fondo Ed-
ucativo Interamericano, 1971.
La mayor parte de los textos de Mecánica Clásica dedican cierto tiempo a la
exposición de las técnicas del cálculo variacional. Por ejemplo:
2. H. Goldstein, Classical Mechanics, Addison Wesley, 1980.
Un resumen excelente, incluyendo con detalle aplicaciones a la Fisica y con
una lista de referencias de los textos clásicos del Cálculo de Variaciones en Fisica
Matematica (Lanczos, Yourgrau y Mandelstam):
3. G. Arfken, Mathematical Methods for Physicists, Academic Press, New York,
1985.
Sobre la matemáticas del cálculo variacional, los tres textos siguientes contienen
el material fundamental.
4. I. M. Gelfand, S.V. Fomin, Calculus of Variations, Prentice Hall, New York.
5. J.L. Troutman, Variational Calculus with Elementary Convexity, Springer Ver-
lag, Berlin.
6. L. Elsgoltz, Ecuaciones Diferenciales y Cálculo Variacional., MIR, Moscú.
El librito siguiente tiene una gran colección de problemas:
7. M.L. Krasnov, G.I. Makarenko y A.I. Kiseliov, Cálculo Variacional (Ejemplos
y Problemas)., MIR, Moscú, 1976.
Finalmente, mencionemos el artı́culo
8. S. Hildebrandt, ¿Es minimalista el mejor de los mundos?., Mundo Cientı́fico
188, Marzo, 1998.
Cálculo Variacional 2002/2003 34

Problemas
Recopilación de L. M. Nieto
1 Dado el funcional  b
F[y(x)] = Φ(x, y(x), y  (x)) dx,
a

demuéstrese la equivalencia de las dos formas siguientes de las ecuaciones de


Euler-Lagrange
 
∂Φ d ∂Φ ∂Φ d  ∂Φ
a) − =0 b) − Φ−y = 0.
∂y dx ∂y  ∂x dx ∂y 

2 Si la función Φ(x, y(x), y  (x)) en el funcional F[y(x)] es del tipo


Φ(x, y(x), y  (x)) = Φ1 (x, y(x)) + Φ2 (x, y(x)) y  (x),
∂Φ1 ∂Φ2
demuéstrese que la ecuación de Euler-Lagrange conduce a = ¿Qué
∂y ∂x
implica este hecho sobre la dependencia de la integral respecto a la elección del
camino?
4 Obténgase la forma que adopta la ecuación de Euler-Lagrange en los siguientes
casos particulares:
a) Φ sólo depende de y  .
b) Φ no depende de y.
c) Φ no depende
 explı́citamente de x.
d) Φ = G(x, y) 1 + y  2 .
5 Aplı́quense los resultados anteriores a los ejemplos siguientes:
a) F[y(x)] = y(2x − y)dx, y(0) = 0, y(π/2) = π/2.
b) F[y(x)] = (y 2 + 2xyy  )dx, y(a) = A, y(b) = B.

c) F[y(x)] = (1 + y  )1/2 dx, y(a) = A, y(b) = B.
2

d) F[y(x)] = y  (1 + x2 y  )dx, y(1) = 3, y(2) = 5.


6 Encuéntrense los extremales de los siguientes funcionales:
b
a) F[y(x)] = a [y 2 + y  − 2y sin x]dx.
2
b 2
b) F[y(x)] = a [y − y  − 2y cosh x]dx.
2
b
c) F[y(x)] = a [y 2 + y  + 2yex ]dx.
2
b 2
d) F[y(x)] = a [y − y  − 2y sin x]dx.
2

7 Demuéstrese que dados dos puntos cualesquiera del plano de abscisas diferentes,
en general no hay extremal del funcional
 b
F[y(x)] = (y + 1 + y  2 )dx
2
a
que pase por dichos puntos.
Cálculo Variacional 2002/2003 35

8 Demuéstrese que la solución de un problema variacional de extremos fijos no


depende de la forma en que se exprese la relación entre las variables x e y, es
decir, se obtiene la misma solución cuando se expresa y como función de x que
cuando se utiliza una representación paramétrica para x e y.

9 Demuéstrese la invariancia de la ecuación de Euler frente a cambios de coor-


denadas.

10 Hállense las ecuaciones de Euler-Lagrange para el funcional “de orden superior”


 b
F[y(x)] = Ψ(x, y(x), y  (x), y  (x)) dx.
a

con las condiciones de frontera y(a) = A, y(b) = B; y  (a) = A , y  (b) = B  .

11 Pruébese que la lı́nea recta es el camino más corto entre dos puntos en el plano
euclı́deo.

12 Haciendo pompas de jabón. Considérese una superficie de revolución generada


al girar alrededor del eje x una curva y(x) que pasa por dos puntos dados
(x1 , y1 ) y (x2 , y2 ). Determı́nese la curva y(x) de manera que la superficie
lateral de la figura engendrada sea mı́nima. Particuları́cese a los siguientes
casos:
a) (x1 , y1 ) = (−1, 1) y (x2 , y2 ) = (1, 1) ;
b) (x1 , y1 ) = (−1/2, 1) y (x2 , y2 ) = (1/2, 1).
Usando los resultados anteriores para el caso particular “simétrico” (−p, 1) y
(p, 1), hállese la ecuación transcendente en p que resulta al imponer que el área
de la superficie de revolución coincida con el área de los dos discos cuyos bordes
son los dos cı́rculos laterales.

14 Consideremos otra configuración de una pelı́cula de jabón (que es una superficie


mı́nima) montada sobre dos aros de radio unidad colocados perpendicularmente
al eje x con sus centros sobre él, en x = ±p (como en ejercicios precedentes) y
un tercer aro de radio a, paralelo a los aros anteriores y centrado en el origen.
La configuración consiste en tres superficies: el disco central y dos catenoides
que unen el aro central a cada uno de los laterales; cada uno de ellos está
descrito por sus secciones en el plano x–y mediante ecuaciones del tipo
x 
y = c cosh +k .
c
a) Impónganse las condiciones de contorno en x = 0 y x = ±p para que los
catenoides se apoyen en los aros correspondientes.
b) Aunque no es imprescindible (ya que es consecuencia de suponer que la su-
perficie que ası́ se obtiene es mı́nima), simplifica mucho los cálculos suponer
que los catenoides forman entre sı́ y con el disco central ángulos de 120o .
Exprésese esta condición en forma algebraica.
Cálculo Variacional 2002/2003 36

c) Demuéstrese que el área total de la configuración (los dos catenoides más


el del disco central) es
   
2 2p 2p
A = c sinh + 2k +
c c
d) Encuéntrese de forma numérica el valor máximo de p que permite esta
configuración
Nota: la configuración de las pompas de jabón que acabamos de describir es
fı́sicamente realizable y es estable.
15 Una manera de enunciar el principio de Fermat en Óptica es decir que para ir
de un punto P a otro Q los rayos de luz seguirán el camino γ para el cual
 Q
T [γ] = n(x, y, z) ds
P
es un mı́nimo, siendo n(x, y, z) el ı́ndice de refracción del medio y s la longitud
de arco medido a lo largo de la trayectoria de la luz γ. Para el caso de propa-
gación de la luz en un plano y tomando los puntos inicial y final P ≡ (−1, 1),
Q ≡ (1, 1), encuéntrese el camino cuando a) n = ey , b) n = ay, c) n = a/y,
√ √
d) n = a y, e) n = a/ y.
16 Una partı́cula se mueve sin rozamiento desde un punto A a un punto B, ambos
en la superficie de la Tierra, a través de un túnel en el interior de la tierra,
bajo la acción exclusiva de la gravedad. Determı́nese la ecuación diferencial
que determina la forma del túnel si se desea que el tiempo del viaje entre A
y B sea mı́nimo (supóngase que la Tierra es una esfera de densidad uniforme
y despréciese su movimiento de rotación). Demuéstrese que la solución es una
hipocicloide y hállese el tiempo que dura el viaje entre A y B.
17 Pruébese que el principio de mı́nima acción asociado al lagrangiano
  
v 2
L = mc2 1 − 1 − 2 − V (:r )
c
conduce a una versión relativista de la segunda ley de Newton que es
 
d mvk ∂V
 = Fk = −
dt 1 − v 2 /c2 ∂xk

18 Sabiendo que el lagrangiano de una partı́cula de carga q que se encuentra en


un campo electromagnético descrito por un potencial escalar ϕ y un potencial
vector A: es
1 : · :v ,
L = mv 2 − q ϕ + q A
2
hállense las ecuaciones de movimiento de la partı́cula cargada. Recuérdese que
:
E : − ∂A ,
: = −∇ϕ B: =∇ : × A.
:
∂t
Cálculo Variacional 2002/2003 37

20 Al estudiar las pequeñas vibraciones de una cuerda, el lagrangiano que aparece


es    2  2 
1 ∂u 1 ∂u
L= < − τ dx,
2 ∂t 2 ∂x

siendo < la densidad lineal de masa y τ la tensión (supuestas ambas constantes a


lo largo de la cuerda). La integración se extiende a toda la longitud de la cuerda.
Pruébese que aplicando el principio de Hamilton a la densidad lagrangiana (el
integrando en la anterior expresión) se llega a la ecuación clásica para la cuerda
vibrante
∂2u < ∂2u
= .
∂x2 τ ∂t2
21 La densidad lagrangiana por unidad de volumen de un campo electromagnético
en el vacı́o con densidad de carga < es
 
1 B2 :
L= "0 E −
2
− < ϕ + < :v · A,
2 µ0
siendo "0 la permitividad del vacı́o y µ0 la permeabilidad del vacı́o. Pruébese
que las ecuaciones de Lagrange conducen a dos de las ecuaciones de Maxwell
(las otras dos son precisamente una consecuencia de las definiciones de E : yB :
:
en términos del potencial escalar ϕ y del potencial vector A).
22 Encuéntrese la ecuación de Euler-Lagrange para el problema mecano-cuántico
consistente en imponer que el valor esperado de la energı́a para un hamiltoniano
arbitrario independiente del tiempo H = −(/2m)∇2 + V (x, y, z) en un estado
estacionario descrito por una función de onda ψ(x, y, z),

ψ ∗ (x, y, z)Hψ(x, y, z) dx dy dz,
R3
sea un mı́nimo, estando sujeta la función de onda ψ(x, y, z) a la condición
habitual de normalización

|ψ(x, y, z)|2 dx dy dz = 1.
R3
Nota: las funciones ψ y ψ ∗ deben tratarse como independientes. Las derivadas
segundas del funcional que hay que considerar pueden convertirse en derivadas
primeras integrando por partes.
23 Un volumen dado de agua se encuentra dentro de un cilindro situado vertical-
mente en el campo gravitatorio, que rota con velocidad angular constante ω.
Calcúlese la forma que adopta la superficie del agua de manera que se minimice
la energı́a potencial total de la masa de agua.
24 Demuéstrese que dado el funcional
 b
F[y(x)] = [p(x) y  (x) − q(x) y 2 (x)] dx,
a
Cálculo Variacional 2002/2003 38

con p(x), q(x) funciones dadas, al determinar las funciones y(x) que hacen
F[y(x)] estacionario con las condiciones adicionales
 b
y 2 (x) w(x) dx = 1, p(a) y  (a) y(a) = p(b) y  (b) y(b),
a
se llega a una ecuación del tipo Sturm-Liouville.
25 Determı́nese la ecuación que resulta al buscar la función ϕ(x) que hace esta-
cionario el funcional
 b b
F[ϕ(x)] = K(x, y) ϕ(x) ϕ(y) dxdy,
a a
siendo el núcleo integral K(x, y) = K(y, x) una función conocida y estando la
función incógnita ϕ(x) sujeta a la condición de normalización
 b
ϕ2 (x) dx = 1.
a

26 Supongamos que una onda sı́smica viaja a través de la Tierra (supuesta plana)
con una velocidad que es directamente proporcional a la profundidad. Calcúlese
la trayectoria que seguirá la perturbación para ir desde un punto A a otro B,
ambos arbitrarios y en el interior de la Tierra, con la exigencia de que el tiempo
de propagación sea mı́nimo.
27 Bajo determinadas aproximaciones (pequeñas desviaciones respecto a la posición
horizontal), se puede demostrar que las energı́as cinética y potencial de una
viga de longitud L, módulo de elasticidad K y densidad lineal < son
  2   2 2
1 L ∂y(t, x) 1 L ∂ y(t, x)
T = <(x) dx, V = K dx.
2 0 ∂t 2 0 ∂x2
Usando el principio de mı́nima acción, determı́nese la ecuación diferencial en
derivadas parciales que rige el movimiento de la viga.
28 Hállense las curvas que en el campo de fuerzas definido por
F: (:r) = (X(:r ), Y (:r ), Z(:r )) con :r = (x, y, z),
hacen extremal el trabajo entre dos puntos cualesquiera :r0 y :r1 . ¿Pueden ser
arbitrarios estos dos puntos? ¿Qué ocurre si el campo admite función potencial?
29 Queremos determinar la forma del morro de un avión, supuesto dado por una
superficie de revolución que minimice la resistencia al avance en el seno de
un gas de densidad pequeña, a velocidad v. Si tomamos la dirección del
movimiento como eje x (en sentido negativo) y el morro como la superficie de
revolución alrededor del eje x con generatriz y = y(x) con y(0) = 0, y(l) = R,
encontrar el funcional la fuerza de resistencia, dependiendo de la forma y = y(x)
de la generatriz.
 Resolver la ecuación de Euler-Lagrange haciendo la apro-

ximación 1 + (y (x))2 ≈ 1. (Nota: supóngase que el gas es ideal y que los
Cálculo Variacional 2002/2003 39

choques de las moléculas del mismo con el cuerpo son elásticos; asimismo,
supóngase que el cuerpo es “afilado”)
30 Entre todas las curvas que unen dos puntos dados A y B, encuéntrese aquella
que genera la superficie de revolución de área mı́nima cuando se gira en torno a
una recta r. Supóngase que esta recta no pasa por A ni B, y que las curvas no
cortan a r en ningún punto. Nota: sin pérdida de generalidad se puede elegir
r coincidente con el eje OX.
31 Consideremos una partı́cula material en una dimensión y de masa m. Encuén-
trense las ecuaciones de Lagrange en los siguientes casos:
a) La partı́cula está sometida a una fuerza F (x) = −kx.
b) Además de la fuerza anterior sometemos la partı́cula a una fuerza propor-
cional a la velocidad.
c) Además de las dos fuerzas anteriores, tenemos una fuerza periódica del tipo
F (t) = cos αt, con α constante.
d) Supongamos ahora que habita en un espacio tridimensional y que está some-
tida a una fuerza F: = −k:x. Hállense las ecuaciones de Lagrange.
e) Resuélvanse las ecuaciones de Lagrange en los cuatro casos anteriores.
32 Hállense las geodésicas del cono circular z 2 = a2 (y 2 + x2 ). Pruébese que
cualquier geodésica sobre una rama del cono tiene la siguiente propiedad: si la
rama se corta desde el vértice a lo largo de un generador y la superficie del cono
se desarrolla hasta que constituya una superficie plana, la geodésica se convierte
en una recta. (Nota: si [r, ψ, z] son las coordenadas con que describimos el cono
y [<, ϕ] son coordenadas polares en la superficie plana, antes de demostrar la
propiedad pedida muéstrese que < = r(1 + a2 )1/2 y ϕ = ψ/(1 + a2 )1/2 ).
33 Problema de Kelvin: supongamos que en el plano XOY está distribuı́da una
masa de densidad continua µ(x, y) y supongamos que se tiene en el plano una
curva Γ suave a trozos y dos puntos P1 y P2 sobre la misma. Entre todas las
curvas C de longitud fija L que unen estos puntos, hállese la que, conjuntamente
con el arco P1 P2 de la curva Γ, forme un recinto D de masa máxima. Los puntos
P1 y P2 pueden coincidir. Nota: utilı́cese el hecho de que la curvatura de una
curva plana descrita paramétricamente es:
|ẋÿ − ẍẏ|
k= .
(ẋ2 + ẏ 2 )3/2

34 En uno de los numerosos viajes que el doctor Zarkov efectuó con Flash Gordon
más allá de los lı́mites del universo conocido, detectó la existencia de un uni-
verso bidimensional asentado sobre una superficie elipsoidal que quedaba bien
descrita por la ecuación:
x2 + y 2 z2
+ = 1, (R = cte. > 0), (a = cte. ≈ 1),
R2 (aR)2
Cálculo Variacional 2002/2003 40

donde a era una constante de valor muy próximo a 1. El doctor Zarkov se


sentı́a intrigado por conocer qué forma adoptarı́an en este universo los rayos
luminosos que, partiendo de un sol S, alcanzan un planeta P .

P
x

Encontró evidencias de que en dicho universo se verificaba el principio de Fer-


mat y de que el ı́ndice de refracción era constante en toda su extensión (igual
a un valor n0 ), pero no supo hallar las trayectorias de la luz pues no dominaba
las técnicas del cálculo variacional. Ayúdele a calcular e interpretar las trayec-
torias de los rayos luminosos en dicho universo.