FM03Tema1 PDF

INTRODUCCION AL CALCULO VARIACIONAL
M. Santander
Departamento de Fı́sica Teórica, Universidad de Valladolid
Versión 3. Original 1 Marzo 1998, basado en notas de M. Gadella. Revisión y adición

de la sección sobre superficies mı́nimas 22 Febrero 2000. Revisión y adición del método
heurı́stico siguiendo a Feynmann 13 Febrero 2001. Correcciones de detalle y erratas 20
Febrero 2002, 27 Febrero 2002, 14 Febrero 2003
Problemas Variacionales en Fı́sica
El principio de mı́nima acción.

En Mecánica clásica, cuando una partı́cula se mueve bajo la acción de un
potencial V (x), el movimiento real es el dado por las ecuaciones de Newton, que
expresan la aceleración de la partı́cula en términos de las fuerzas. Cuando las
fuerzas derivan de un potencial V (x), el movimiento real t → x(t) satisface la
ecuación diferencial:
d2 x(t) ∂V (x(t))
m 2
=− .
dt ∂x
cuya solución determina el movimiento real que sigue una partı́cula que en un
instante inicial t1 sale del punto x1 , se mueve bajo la acción del potencial, y llega
en un instante final t2 al punto x2 .
Una pregunta interesante es: ¿Podemos singularizar el movimiento real dado
por las soluciones de esta ecuación, entre todos los movimientos que la partı́cula
podrı́a seguir, para ir desde el punto inicial x1 en el instante t1 al punto final x2
en el instante t2 ?
La respuesta a esta pregunta es un principio básico en Fı́sica, que en Mecánica
se denomina principio de Hamilton, o principio de mı́nima acción. Este principio
caracteriza a los movimientos reales entre todos los movimientos imaginables que
llevarı́an a la partı́cula del estado inicial (posición x1 en el instante t1 ) al estado
final (posición x2 en el instante t2 ), ambos dados.
La caracterización dada por el principio de Hamilton asocia una cantidad,
denominada acción a cada movimiento imaginable. La acción es una cantidad de
naturaleza bastante diferente a las cantidades que usualmente describen el estado
de la partı́cula, como posición y/o velocidad. A diferencia de ellas, la acción no
se asocia al estado, sino a la historia completa de la particula entre dos instantes
inicial y final. Para cada movimiento imaginable, descrito por t → x(t) con las
condiciones x(t1 ) = x1 , x(t2 ) = x2 , la acción de ese movimiento se define como:
2
t2
1 dx(t)
S[x(t)] = m − V (x(t)) dt
t1 2 dt
Typeset by AMS-TEX
1
Cálculo Variacional 2002/2003 2
El principio de mı́nima acción dice: entre todos los movimientos imagina-

bles, la propiedad que distingue al movimiento real es que el valor de la
acción S[x(t)] es menor para el movimiento real que para cualquier otro.
¿Cuál es la relación entre este principio y la forma newtoniana de plantear las
ecuaciones del movimiento? Resulta que ambas maneras de describir el movimiento
son equivalentes. Para verlo, necesitamos abordar el problema de la búsqueda de
la función x(t) con las condiciones requeridas, que minimice el valor de la acción.
No se trata de un problema ordinario de mı́nimo, ya que la acción depende del
movimiento como un todo, esto es, depende de la función x(t).
Principio de Fermat.
Según la Óptica Geométrica, la luz se propaga a lo largo de rayos. Entre todos
los rayos posibles que unen dos puntos dados, ¿cuál es el escogido realmente por la
luz? En la antigüedad clásica se observó que en ciertas circunstancias la luz viaja
a lo largo del camino geométricamente más corto entre dos puntos extremos A, B.
• Ejercicio 1. Derivar la ley de igualdad de ángulos de incidencia y reflexión para la
luz propagándose en un medio homogéneo, a partir de la exigencia de que la longitud
del camino recorrido por la luz entre dos puntos dados A, B pasando por un espejo, es
la mı́mima posible. (Comentario: en realidad, este problema puede resolverse sin hacer
uso siquiera del cálculo ordinario de máximos y mı́nimos, siempre que admitamos que el
camino de longitud mı́nima entre dos puntos (sin condiciones adicionales) es la linea recta
que les une; la idea que tiene multitud de aplicaciones inesperadas se denomina principio
de reflexión)
Pero basta observar la propagación de la luz en una interfase entre aire y agua
(en un rı́o), para concluir que la luz no siempre sigue el camino más corto; el
ejemplo más evidente es la refracción, pero hay otros, como los espejismos.
Se atribuye a Fermat el primer enunciado del principio general que la trayecto-
ria real seguida por un rayo de luz entre dos puntos dados en un medio posiblemente
inhomogéneo es aquella que hace mı́nimo el tiempo total invertido. Se trata de un
enunciado notable, ya que cuando Fermat lo formuló, se comprendı́an aún muy
mal los elementos implicados en el proceso de propagación. Por ejemplo, el que la
velocidad de la luz en un medio material es siempre menor que la velocidad de la
luz en el vacı́o sólo se decidió experimentalmente en el S. XIX.
Con la perspectiva actual podemos traducir a ecuaciones el principio de Fermat
ası́: La velocidad de la luz en el vacı́o es constante c. En un medio material, su
velocidad v es menor que c, y el cociente c/v es igual al ı́ndice de refracción n del
medio; para medios no homogéneos, este ı́ndice es una función de la posición n(x).
Supongamos una trayectoria posible para un rayo luminoso en un medio in-
homogéneo, en el que el ı́ndice de refracción dependerá de la posición. Tomando
la coordenada z como parámetro a lo largo del rayo (cuya dirección supondremos
cercana al eje z), podemos describir tal trayectoria como z → (x(z), y(z), z). La
longitud del rayo entre los puntos de parámetro z y z + dz es:

ds = x (z)2 + y (z)2 + 1 dz
El tiempo requerido para viajar entre estos dos puntos está dado por:
ds ds n(z; x, y) n(z; x, y) 2
dτ = = c = ds = x (z) + y (z)2 + 1 dz
v n(z;x,y) c c
y el tiempo total invertido en viajar desde un punto inicial (x1 , y1 , z1 ) hasta otro
final (x2 , y2 , z2 ), a lo largo del rayo descrito por z → (x(z), y(z), z) (que debe
satisfacer las condiciones x(z1 ) = x1 , y(z1 ) = y1 ; x(z2 ) = x2 , y(z2 ) = y2 ) es

1 z2
T = n(z; x, y) x (z)2 + y (z)2 + 1 dz
c z1
Ası́ pues, el principio de Fermat reduce el problema de encontrar la trayectoria

seguida por un rayo luminoso al problema de encontrar, entre todas las curvas
z → (x(z), y(z), z) que unan los puntos dados (x1 , y1 , z1 ) y (x2 , y2 , z2 ), aquella
para la cual el valor de esta integral sea mı́nimo.
En el vacı́o, o en cualquier medio que sea homogéneo, el indice de refracción
es constante, y no depende de la posición. En este caso, el principio de tiempo
mı́nimo se reduce al principio de longitud mı́nima, y las trayectorias seguidas por
los rayos son, en el espacio euclı́deo, lı́neas rectas.
• Ejercicio 2. Derivar la ley de Snell para la refracción a partir del principio de Fermat.
(Comentario: en realidad, el cálculo ordinario de máximos y mı́nimos es suficiente para
discutir este caso, en el que separadamente para cada tramo situado en un medio homogeneo
(aire o agua, digamos) el camino más rápido es tambien el más corto)
El problema de la braquistócrona.
Sean dos puntos P y Q situados en el mismo plano vertical, P más alto que Q
y no directamente sobre Q. Un punto material se mueve sin fricción entre P y Q
a lo largo de una curva determinada que une P con Q, bajo la acción de la fuerza
de la gravedad, que supondremos uniforme, y partiendo de P con velocidad inicial
nula. De entre todas las curvas posibles que unen P con Q, ¿sobre cuál de ellas
el tiempo que tarda la partı́cula en ir desde P hasta Q es el menor posible? Esta
curva tiene un nombre especial: braquistócrona.
Denotemos por z la altura, y por x la coordenada horizontal sobre el plano.
Cualquier curva que una P con Q estará descrita por una función x → z(x), que
deberá satisfacer las dos condiciones z(xP ) = zP , z(xQ ) = zQ . En el punto inicial,
la energı́a de la partı́cula vale E = mgzP . Cuando la partı́cula se encuentra en el
punto genérico (x, z(x)) sobre la curva, su velocidad v(x) está determinada por el
principio de conservación de la energı́a
1
E = mgzP = mgz(x) + mv(x)2 ,
2
de donde resulta
v(x) = 2g(zP − z(x))
El tiempo invertido en llegar desde el punto de coordenada x al punto de coorde-

nada x + dx es:

ds ds 1 + z (x)2
dt = = = dx,
v(x) 2g(zP − z(x)) 2g(zP − z(x))
y el tiempo total invertido en llegar desde el punto P al punto Q a lo largo de la

curva dada vale: xQ
1 1 + z (x)2
T = dx
2g xP zP − z(x)
¿Para qué curva este tiempo toma el valor mı́nimo?
• Ejercicio 3. Escribir la expresión análoga para el tiempo invertido e llegar de P a Q si
se supone que la partı́cula comienza su caı́da con velocidad inicial no nula.
La catenaria.
¿Cómo cuelga un hilo inextensible y flexible, de longitud total L, suspendido
entre dos torres con separación horizontal d, y alturas dadas, A y B? Claramente,
el principio que determina la forma de equilibrio del hilo es que su energı́a potencial
sea la menor posible. Cada forma posible del hilo está descrita por una función
x → z(x) que debe satisfacer las condiciones z(a) = A, z(b) = B (donde a, b
son las coordenadas horizontales de las torres, d = b − a, y además otra condición
importante, a saber, la longitud total del hilo debe ser L; esta condición se traduce
en: b
L= 1 + z (x)2 dx
a
Veamos ahora cómo se expresa la energı́a potencial del hilo cuando su forma es
la función z(x). Suponiendo el hilo de densidad
lineal ρ constante, la masa del
elemento entre las coordenadas 2
x y x+dx es ρ 1 + z (x) dx, y la energı́a potencial
de ese elemento es z(x)gρ 1 + z (x)2 dx. Ası́ pues, la energı́a potencial total es:
b
E = ρg z(x) 1 + z (x)2 dx.
a
La forma real será aquella curva que, satisfaciendo la condición adicional de tener
longitud total L, haga mı́nima la energı́a potencial. Conviene notar que este prob-
lema es más complicado que los anteriores, ya que interviene en él una ligadura, o
condicion auxiliar.
Los problemas isoperimétricos clásicos
A los problemas variacionales con ligaduras se les suele denominar problemas
isoperimétricos. Su proptotipo son los problemas clásicos de Dido (“te concederé
tanto terreno cuanto puedas encerrar con la piel de este buey”), que fueron plantea-
dos y resueltos en la antiguedad clásica. Consideremos una curva cerrada en el
plano, de longitud total L. ¿Qué figura de la curva hace máxima el área encerrada
por la curva? O, inversamente, consideremos una curva cerrada de área dada S.
¿Cuándo la longitud de la curva es mı́nima? En ambos casos la respuesta es un
cı́rculo. En tres dimensiones, la superficie cerrada de área dada que encierra mayor
volumen es la esfera, y la forma de volumen dado que tiene menor área superficial
es también la esfera; estos resultados subyacen a la explicación de que la forma de
la esfera se encuentre por doquier en la Naturaleza.
• Ejercicio 4. ¿Cual es el principio fı́sico que explica que, en ausencia de gravedad, una
gota de un lı́quido adopte forma esférica?
• Ejercicio 5. Con argumentos elementales y directos, ver que la curva cerrada de longitud
dada 2L que encierre un área máxima debe ser convexa, y que toda recta que divida la
curva en dos arcos de igual longitud debe también dividir el área encerrada en dos partes
de igual área.
En vista del resultado indicado en el ejercicio, podemos plantear formalmente

el problema isoperimétrico anterior buscando, entre las curvas que unan dos puntos
P , Q situados sobre el eje real (de coordenadas (a, 0) y (b, 0)), una curva y = y(x),
tal que y(a) = y(b) = 0, que no corte en otros puntos intermedios al eje real (por
ejemplo, imponiendo y(x) > 0 en todo el intervalo [a, b]), y que tenga longitud
total dada L. Esta última condición se expresa por la ecuación
b b
ds = 1 + (y )2 dx = L
a a
y el problema a resolver es: entre todas las curvas que satisfagan esta condición,
encuéntrese aquella que maximiza el área comprendida entre ella y el eje real, es
decir, la que proporcione un valor mayor para la integral
b
y(x) dx.
a
Recapitulación.
En todos los casos, el problema propuesto se reduce a buscar, entre todas las
funciones f : x → f (x) definidas en un intervalo [a, b], y con condiciones del tipo
f (a) = A, f (b) = B (además de otras condiciones de continuidad, regularidad, etc.
que se precisarán a su tiempo), aquellas que minimizan o maximizan una expresion
del tipo
b
Φ(x, f (x), f (x)) dx.
a
En algunos casos, la función f : x → f (x) debe satisfacer ciertas condiciones
adicionales, que pueden imaginarse como ligaduras; en todos los casos que hemos
discutido las ligaduras están expresadas también por condiciones del tipo
b
Ξ(x, f (x), f (x)) dx = cte
a
Derivación ‘a la Feynmann’ de las ecuaciones de Euler-La-

grange para el principio de menor acción
Imaginemos el caso más sencillo de una partı́cula que se mueve en una di-
mensión (coordenada posición x) bajo un potencial V (x). Por ejemplo, un objeto
que sube y baja verticalmente en el campo gravitatorio terrestre bajo la acción
de la gravedad. Para cada movimiento imaginable, descrito por t → x(t) con las
condiciones x(t1 ) = x1 , x(t2 ) = x2 , la acción de ese movimiento se define como:
t2 2
1 dx(t)
S[x(t)] = m − V (x(t)) dt
t1 2 dt
El principio de mı́nima acción dice: entre todos los movimientos imaginables, la
propiedad que distingue al movimiento real es que el valor de la acción S[x(t)] es
menor para el movimiento real que para cualquier otro. Antes mencionamos que
aunque no lo parezca, esta manera de singularizar el movimiento real entre todos
los posibles es equivalente a las leyes de Newton, que en este caso serı́an
d2 x(t) ∂V (x(t))
m 2
=− .
dt ∂x
Vamos ahora a presentar un argumento heurı́stico, siguiendo a Feynmann, para
convencer al lector de que el movimiento que minimice la acción debe satisfacer
las ecuaciones de Newton. Comenzamos con una situación familiar que debe ser
bien conocida; la búsqueda de mı́nimos de funciones de varias variables. Sea una
función x → F (x) de varias variables x = (x1 , x2 , . . . , xi , . . . ), supuesta continua
y con derivadas continuas. Queremos encontrar un punto x0 en el cual se verifique
F (x) > F (x0 )
para cualquier x cercano a x0 . Una condicion necesaria es que todas las derivadas
parciales de F se anulen en x0 ; imaginemos que no lo supieramos y veamos cómo
podrı́amos obtener tal condicion partiendo sólo del conocimientomás básico de la
df
condición de mı́nimo para funciones de una variable, a saber dx 0 = 0.
x
¿Cómo podrı́amos aprovechar tal conocimiento? La idea básica, que en los
apartados siguientes trasladaremos al caso de minimizar la acción, es: Supongamos
que realmente el punto x0 es un mı́nimo de F cuando x varı́a en las cercanı́as de
x0 . Entonces también x0 es un mı́nimo de F cuando x varı́a sólo a lo largo de la
recta !: xi = x0i + "hi , donde los hi son arbitrarios. La restricción de F a la recta
! nos da una función de una sola variable ":
fh (") := F (x0 + "h)
dfh
que debe tener un mı́nimo en " = 0. La condición para ello es que la derivada d
se anule en " = 0. La derivada se calcula mediante la regla de la cadena:
dfh ∂F ∂F
= h1 + h2 + . . .
d" ∂x1 ∂x2
de manera que la condición de mı́nimo es:

dfh ∂F ∂F
0= = h1 + h2 + . . .
d" =0 ∂x1 x0 ∂x2 x0
Como esta condición debe satisfacerse para h arbitrario, basta con tomar sucesi-

xi 0 = 0.
vamente h = (0, 0, . . . , hi = 1, 0, . . . , 0) con i = 1, 2, . . . para obtener ∂F
x
Naturalmente desde el momento en que todas las derivadas parciales se anulan
en x0 , entonces es claro que la ecuación anterior se verifica para h arbitrario.
Ası́ lo que hemos (re)encontrado es una condición necesaria para que una función
de varias variables tenga un mı́nimo en x0 : todas las derivadas parciales deben
anularse en ese punto.
Repitamos el mismo proceso con la acción. Para evitar complicaciones inesen-
ciales supondremos el movimiento en una dimensión (esto es la función incógnita
x(t) es una función de una variable) y buscamos un movimiento t → x0 (t) dado
por una función continua, con derivada continua que lleve de xa en el instante ta
a xb en el instante tb y tal que para cualquier otro movimiento cercano se verifique
tb 2
1 dx(t)
S[x(t)] > S[x0 (t)], S[x(t)] = m − V (x(t)) dt
ta 2 dt
La idea es construir una familia uniparamétrica de movimientos cercanos a

x0 (t), en la cual cada movimiento esté etiquetado por un sólo parámetro ", im-
itando a la expresión usada para funciones de varias variables; esto se consigue
definiendo:
x(t) = x0 (t) + "h(t)
donde h(t) debe ser una función fijada, suficientemente regular (continua, con
derivada continua) satisfaciendo las condiciones h(ta ) = 0, h(tb ) = 0. Ahora res-
tringimos la acción a los movimientos de esta familia unidimensional, obteniendo
una función que depende de una sola variable ":
Sh(t) (") := S[x0 (t) + "h(t)]
y que debe tener un mı́nimo en " = 0, lo que implica:

tb 2
dsh(t)
d 1 d(x0 (t) + "h(t))
0= = m − V (x0 (t) + "h(t)) dt
d" =0 d" ta 2 dt
=0
Efectuando la derivación con respecto a " y evaluando en " = 0 lo que se encuentra

es tb
dx0 (t) dh(t) dV
0= m − h(t) dt
ta dt dt dx x0 (t)
Ahora la idea clave es realizar una integración por partes para transformar el
término que involucra la derivada dh(t)
dt de h(t) en un término que involucre direc-
tamente a h(t), y otro que desaparece por las condiciones de frontera. En efecto,
0 (t)
efectuando el cambio estandar u = m dxdt , v = h(t) en el primer término de la
integral, resulta:
tb tb tb
tb
dx0 (t) dh(t) dx0 (t) d2 x0 (t) d2 x0 (t)
m dt = m
h(t) − m h(t)dt = − m h(t)dt
ta dt dt dt ta ta dt2 ta dt2
y en consecuencia la condición de que la función sh(t) (") tenga un mı́nimo en " = 0

es: tb
d2 x0 (t) dV
m + h(t) = 0.
ta dt2 dx x0 (t)
Esta condición debe satisfacerse para todo h(t) con las condiciones de contorno
adecuadas, lo que sólo puede ocurrir si la parte entre llaves del integrando se anula
idénticamente. Demostrar esto con rigor requiere cierto cuidado —lo haremos
después—, pero podemos de todas maneras ver que si el término entre llaves del
integrando fuera diferente de 0 en un cierto instante, entonces podrı́amos tomar
una función h(t) que fuera diferente de 0 sólo en un entorno muy pequeño de
dicho instante, lo que llevarı́a a un valor no nulo para la integral; como esto
no debe ocurrir, parece claro que el término entre llaves debe anularse siempre.
Aunque este argumento sea poco riguroso, la conclusión a se llega es correcta: de
la exigencia de anulación de la integral anterior para todo h(t) se concluye una
condición necesaria de mı́nimo para el funcional de acción, que es que se verifique
la llamada ecuación de Euler-Lagrange del problema variacional:

d2 x0 (t) dV
m + = 0,
dt2 dx x0 (t)
que por supuesto es simplemente la ecuación de Newton que gobierna el movimien-

to de la partı́cula en el campo de potencial V (x). Ası́ pues, matemáticamente la
descripción a través del principio de mı́nima acción y a través de las ecuaciones
de Newton son equivalentes.
Introducción a las Matemáticas del Cálculo Variacional

Ejemplos como el principio de mı́nima acción, el principio de Fermat, y proble-
mas como la determinación de la forma de equilibrio de un hilo flexible e inexten-
sible o la determinación de la curva que encierra un área máxima con perı́metro
dado, muestran la necesidad de considerar, junto con las funciones de varias vari-
ables, un tipo más general de aplicaciones, que a cada función de un determinado
conjunto de funciones le asocian un número real. Desde un punto de vista for-
mal, se trata simplemente de aplicaciones de ciertos conjuntos de funciones en
la recta real R, y por tanto encajan dentro de la definición general de función,

como aplicación entre conjuntos. Pero es tradicional y resulta conveniente usar en
estos casos el nombre de funcional, para enfatizar aquellos aspectos en los que el
cálculo con funciones de varias variables difiera del cálculo con este nuevo tipo de
“funciones” definidas en espacios de funciones cuya dimensión es infinita.
La idea de diferenciabilidad para funcionales puede desarrollarse de manera
semejante a cómo se hace para funciones de varias variables en el caso de que el
espacio de funciones en el que el funcional está definido tenga estructura de espacio
de Banach (espacio vectorial, en general de dimensión infinita, normado y com-
pleto). Afortunadamente, en muchos de los casos de interés en Fı́sica, incluyendo
todos los ejemplos presentados más arriba, se da tal circunstancia. Supondremos
en lo sucesivo que los funcionales que vamos a considerar están definidos en un
espacio de Banach. [Recordemos que un espacio de Banach es un espacio vectorial
V , a cuyos elementos f ∈ V se les puede dotar de una norma f , que satisface
ciertas condiciones que son familiares en el ejemplo de la norma natural del espacio
Rn : Para todo elemento f , f es un número real positivo, nulo sólo cuando f = 0,
con la propiedad de homogeneidad λf = |λ|f y satisfaciendo la desigualdad
triangular. Con la topologı́a asociada a esa norma el espacio es completo, es de-
cir, toda sucesión de Cauchy tiene lı́mite en el espacio V . Es importante tener
presente que en cuanto se consideran situaciones en donde intervienen espacios
de dimensión infinita, los problemas asociados con los dominios de definición no
pueden dejarse de lado].
Definición. Sea V un cierto conjunto de funciones, que supondremos con
estructura de espacio de Banach de dimensión infinita sobre los reales.
Un funcional real F es una aplicación F : D(F) → R, que a cada función f del
dominio D(F) le asocia un valor real.
El dominio de F, D(F) es un cierto subconjunto del espacio V , en el que F(f )
está definido.
Diremos que F es un funcional lineal si para cada par de funciones f, g ∈ D(F),
se verifica F(λf + µg) = λF(f ) + µF(g); ∀λ, µ ∈ R.
Un ejemplo importante de funcional
Sea C 1 [a, b] el espacio de las funciones continuas de [a, b] en R que admitan
derivada primera continua en todo el intervalo [a, b]. C 1 [a, b] admite la estructura
de espacio de Banach cuando le dotamos de la norma definida por:
||f || = sup |f (x)| + sup |f (x)|. (1)

x∈[a,b] x∈[a,b]
En la topologı́a inducida por esta norma, dos funciones son próximas cuando
en todo el intervalo [a, b], tanto las funciones como sus derivadas toman valores
próximos; la distancia entre dos funciones f, g se define como la norma de la
diferencia f − g.
Esta norma se encuadra dentro de una familia de normas no equivalentes que pueden
definirse en el espacio de funciones continuas y con derivadas parciales continuas de
cualquier orden, C ∞ [a, b]. Se define la norma de orden k, k = 0, 1, 2, . . . , mediante
k
d f (x)
f k = sup
sup |f (x)|, sup |f (x)|, . . . sup
x∈[a,b] x∈[a,b] x∈[a,b] dxk
La norma f k está definida en el espacio C k [a, b] de funciones continuas y con derivadas

continuas hasta el orden k. La norma dada en (1) es equivalente a la de esta familia con
k = 1. La proximidad entre dos funciones f, g asociada a la norma f k se denomina
proximidad de orden k, y significa que en el intervalo [a, b] tanto los valores de las dos
funciones como los valores de todas sus derivadas hasta el orden k son próximos. Es claro
que dos funciones próximas de orden dado lo son tambien para todos los órdenes menores,
pero no recı́procamente.
Vamos ahora a introducir un funcional F de un tipo particular, que ha sido

sugerido por los ejemplos presentados en la introducción. A este tipo de funcionales
se referirá la mayor parte de los resultados concretos expuestos más adelante.
Comenzamos por definir su dominio, es decir, el conjunto sobre el que el funcional
está definido:
D(F) = {f ∈ C 1 [a, b] / f (a) = A; f (b) = B} (2)
donde A, B son constantes fijas. Consideremos a continuación una función de R3 a
R que denotaremos como Φ(x, y, z). Supondremos que esta función es continua y
admite derivadas parciales continuas de primer orden. Es por lo tanto una función
de clase uno en R3 , propiedad que denotaremos como Φ(x, y, z) ∈ C 1 (R3 ). La
forma explı́cita del funcional F está dada por:
b
F(f ) = Φ(x, f (x), f (x)) dx, ∀f ∈ D(F), (3)
a
donde f (x) indica la derivada de la función f (x). La integral está bien definida
∀f ∈ D(F), pues el integrando es una función continua de x en el intervalo com-
pacto [a, b], y por lo tanto la correspondiente integral de Riemann siempre existe.
Nótese que pueden existir funcionales de muchos otros tipos. Por ejemplo, el
funcional podrı́a estar dado por una expresión en donde la función f no aparezca
bajo una integral (ejemplo, el funcional F(f ) = f (c), donde c es un punto dado del
intervalo [a, b]; tales funcionales aparecen en relación con la teorı́a de distribuciones
y la delta de Dirac) o bien podrı́a estar dado por una integral cuyo integrando
dependiera de la derivada segunda o incluso de derivadas de órdenes superiores de
la función f . A lo largo de estas notas, aunque daremos las definiciones en la forma
general, nos restringiremos a la consideración de funcionales como el definido en
(2)-(3)
En general D(F) no es un subespacio vectorial de C 1 [a, b], salvo que f (a) = 0
y f (b) = 0. Sin embargo, el dominio D(F) está asociado muy directamente a un
cierto subespacio vectorial M de C 1 [a, b]: M = {h ∈ C 1 [a, b] / h(a) = h(b) = 0}.
Es claro que M sı́ que es es un subespacio vectorial. Todo entorno de f en D(F)

es de la forma h + U donde U es un entorno de 0 en M. El subespacio lineal M
es denso en C 1 [a, b]; análogamente, el dominio D(F) es denso en C 1 [a, b].
Diferenciabilidad de Funcionales
Comencemos recordando la definición de diferenciabilidad para funciones reales
de varias variables. Se dice que una función f : Rn → R es diferenciable en el punto
x = (x1 , x2 , . . . , xn ) si existe una función lineal denotada dfx : Rn → R tal que en
un cierto entorno de x se tenga
f (x + h) − f (x) = dfx (h) + "(x, h)h,

donde "(x, h) → 0 cuando h = h21 + h22 + · · · + h22 → 0. Geométricamente,
supuesto el punto x fijo, la función afı́n dada en un cierto entorno de x por
x + h → f (x) + dfx (h) es la aplicación tangente a la función f en el punto f (x),
y su gráfica es el hiperplano tangente a la gráfica de f en el punto (x, f (x)). En
cualquier texto de Análisis Matemático pueden encontrarse las demostraciones de
las siguientes propiedades importantes:
• Si f es diferenciable en x, entonces dfx es única.
• Si la función f tiene un mı́nimo en el punto x (o un máximo, o en general
un valor estacionario), entonces en el punto x la diferencial dfx (h) se anula,
dfx (h) = 0.
• La expresión explı́cita de la diferencial dfx es:

∂f ∂f ∂f
dfx (h) = h1 + h2 + · · · + hn ,
∂x1 x ∂x2 x ∂xn x
es decir, dfx es una función lineal de h = (h1 , h2 , . . . , hn ) cuyos coeficientes son

las derivadas parciales de f en el punto x. En particular, esta relación implica
que si x es un mı́nimo de la función f (o en general un punto estacionario de
f ), todas las derivadas parciales de f en el punto x se anulan.
Los puntos en los que la diferencial de la función diferenciable f se anula se
denominan puntos crı́ticos de la función f . Para funciones de una variable los pun-
tos crı́ticos aislados son, bien máximos relativos estrictos, bien mı́nimos relativos
estrictos, bien puntos de inflexión con tangente horizontal. Para funciones de dos
variables puede haber puntos crı́ticos aislados (bien máximos relativos estrictos,
mı́nimos relativos estrictos o puntos de ensilladura), o lı́neas crı́ticas, formadas por
puntos crı́ticos no aislados (tı́picamente, cuando la función presenta un compor-
tamiento tipo bañera, con una lı́nea de mı́nimos relativos no estrictos).
Pasemos ahora a dar las definiciones pertinentes para funcionales:
Definición. Diremos que un funcional F en D(F) es continuo en f ∈ D(F)
si ∀ " > 0, ∃ δ > 0 tal que si g ∈ D(F) con la condición que f − g < δ, entonces
|F(f ) − F(g)| < ". Equivalentemente si limg→f F(g) = F(f ). Un funcional es

continuo si lo es en todos los elementos de D(F).
La idea de continuidad de un funcional hace referencia a la norma f del espacio de
funciones. En estas notas siempre nos referiremos a la norma (1), pero conviene tener este
hecho presente, ya que un determinado funcional podrı́a ser continuo para ciertas normas
y no continuo para otras.
Definición. Diremos que un funcional F es diferenciable en la función f ∈

D(F) si existe un funcional lineal denotado δFf : M → R tal que en un cierto
entorno de f en D(F) (asociado a un cierto entorno de 0 en M) se tenga:
F(f + h) − F(f ) = δFf (h) + E(f, h) h
donde E(f, h) → 0 cuando h → 0.

Aquı́ la norma de la función h hace referencia a la norma del espacio de Banach
de funciones. Geométricamente, podemos imaginar el funcional lineal afı́n dado
en un cierto entorno de la función f por f + h → F(f ) + δFf (h) como el funcional
tangente al funcional F en la función f . El funcional lineal δFf : M → R se
denomina variación primera del funcional F en la función f ; el uso de un término
especı́fico pretende que el lenguaje transmita que estamos discutiendo funcionales
y no funciones de varias variables.
Extremales de funcionales
Para funciones de varias variables, los puntos crı́ticos incluyen aquellos en los
que la función alcanza bien un máximo o bien un mı́nimo relativo. La idea análoga
para funcionales es la de función extremal de un funcional, que también se denom-
inan puntos crı́ticos o funciones crı́ticas del funcional. Las extremales más simples
son los máximos y mı́nimos, cuyas definiciones son evidentes:
Definición. Diremos que el funcional F tiene un mı́nimo absoluto en la
función f ∈ D(F) si para cualquier función g ∈ D(F) se verifica F(g) > F(f ). Di-
remos que el funcional F tiene un mı́nimo relativo en la función f ∈ D(F) si para
cualquier función g ∈ D(F) en un cierto entorno de f se verifica F(g) > F(f ).
Las definiciones de máximo absoluto y relativo son análogas. No vamos a entrar
en las modificaciones para distinguir entre mı́nimos estrictos (<) o no estrictos
(≤) que son completamente análogas a las pertinentes para funciones de varias
variables.
Ahora podemos investigar los análogos de los tres resultados básicos enunciados
antes para funciones de varias variables. Vamos a enunciarles primero, y luego
pasaremos a su demostración.
• Si el funcional F es diferenciable en la función f , la variación primera δFf (h)
es única.
• Si el funcional F tiene un mı́nimo (o un máximo) relativo estricto en la función
f , entonces la variación primera δFf (h) del funcional F en la función f se anula
idénticamente, δFf (h) = 0.
• Para el funcional dado en (2-3), la expresión explı́cita de la variación primera

δFf (h) es el funcional lineal:
b
∂Φ d ∂Φ
δFf (h) = − h(x) dx,
a ∂f dx ∂f
Conviene notar que el papel de las n derivadas parciales de la función F eval-

uadas en el punto x que aparecı́an en la expresión de la diferencial de una función
de varias variables F , lo juega para este funcional la función ∂Φ∂f − dx ∂f de la
d ∂Φ
variable x. Esta analogı́a motiva la introducción de la idea de derivada variacional

del funcional F, que para el caso que nos ocupa se define mediante:
δF ∂Φ d ∂Φ
:= −
δf ∂f dx ∂f
expresión que permite escribir la variación primera en la forma:

b
δF
δFf (h) = h(x) dx.
a δf
En el resto de estas notas no usaremos explı́citamente la idea de derivada varia-

cional, pero conviene tener presente que el sı́mbolo δfδF(t) , es en nuestro problema
variacional para el funcional F(f ) el más cercano “análogo” de la derivada parcial
∂f
ordinaria ∂x n
para una función de varias variables f (x).
La expresión para la variación primera del funcional tipo (2)-(3) implica que
si en la función f el funcional tiene un mı́nimo o un máximo entonces debe satis-
facerse la ecuación llamada de Euler-Lagrange:
∂Φ d ∂Φ
− =0
∂f dx ∂f
Pasemos a indicar las demostraciones de estos resultados.

Teorema. Si el funcional F es diferenciable en la función f , entonces la
variación primera δFf (h) es única.
La demostración de este teorema resulta más clara usando un lema previo.
Lema. Sea ϕ un funcional lineal en un espacio de Banach real. Si se verifica la
propiedad ϕ(h)
h
→ 0 cuando h → 0, entonces ϕ(h) = 0, ∀h.
La idea en este lema es que cuando h → 0, cualquier funcional lineal tiende a 0
linealmente con la norma de h. Por tanto, la única posibilidad de que un funcional lineal
tienda a 0 más rápidamente que la norma de h es que el funcional sea idénticamente
nulo. La prueba formal procede por reducción al absurdo. Supongamos que ϕ es un
funcional no idénticamente nulo que satisface la condición. Entonces existe una función
no nula h0 = 0 tal que ϕ(h0 ) = 0. Consideremos ahora la sucesión de funciones hn = hn0 ,
que tiende a la función cero cuando n → ∞, ya que hn0 − 0 = n 1
h0 → 0. Por
ϕ(hn )
hipótesis, la sucesión hn
→ 0. Pero por otro lado, supuesta linealidad, se tiene que
1 ϕ(h )
ϕ(hn ) ϕ(h0 ) ϕ(hn )
hn
= n 0
1 h = h0
= 0. Ası́ pues, vemos que la sucesión hn
no depende de n,
n n
y por tanto no puede tender a 0 cuando n → ∞. en contra de la hipótesis. Ello implica
que ϕ(h) = 0, ∀h.
Prueba del Teorema. Supongamos que F es diferenciable en f y que la corre-
spondiente variación primera no es única. Si es ası́, habrá por lo menos dos variaciones
primeras, que denotaremos como ϕ1 y ϕ2 . Se tendrá:
F (f + h) − F (f ) = ϕ1 (h) + 1 (h, f ) h = ϕ2 (h) + 2 (h, f ) h
En la primera de las fórmulas h ∈ U , mientras que en la segunda h ∈ U siendo U y

U sendos entornos de 0 en M. Ambas son válidas en un entorno U = U ∩ U . De
esta manera si h ∈ V , el funcional lineal (ϕ1 − ϕ2 )(h) vale ϕ1 (h) − ϕ2 (h) = (2 − 1 ) h,
que verifica la condición del lema anterior y por tanto debe ser idénticamente nulo. Esto
demuestra el teorema.
Teorema. Sea F un funcional diferenciable. Una condición necesaria para

que tenga un máximo o un mı́nimo relativo en f ∈ D(F) es que δFf = 0, es decir,
que la variación primera de F en f se anule.
Vamos a probar el teorema para el caso de que F tenga un mı́nimo en f . Si f fuere
un máximo, la demostración serı́a análoga.
Como F es diferenciable, lo es en particular en f . De esta manera, existe un funcional
lineal ϕ en M y un entorno de cero U en M, tal que ∀h ∈ U se tiene que:
F (f + h) − F (f ) = ϕ(h) + (h, f )h
Escojamos h0 ∈ M arbitrario en M. Para λ suficientemente pequeño en valor abso-

luto, h = λh0 está en el entorno U , y a él se le puede aplicar la condición de diferencia-
bilidad
F (f + λh0 ) − F (f ) = δFf (λh0 ) + E(f, λh0 )λh0
Dividamos ambos miembros por la norma de h, h = λh0 = |λ|h0 , y notemos que la
variación primera es lineal, y por tanto δFf (λh0 ) = λ δFf (h0 ). Ası́ se obtiene que para λ
suficientemente pequeño,
λ δFf (h0 ) F (f + λh0 ) − F (f )

+ E(f, λh0 ) =
|λ| h0 |λ|h0
Por otro lado, en la hipótesis de que f es un mı́nimo del funcional, se tiene que para
todo λ, F (f + λh0 ) − F (f ) > 0. Ası́ pues, para cualquier λ = 0, el valor del segundo
miembro es siempre positivo, independientemente del signo de λ. Distingamos ahora las
dos posibilidades en las que λ → 0 manteniendose bien positivo o bien negativo. En la
primera, se tiene que
δFf (h0 )
+ E(f, λh0 ) ≥ 0 cuando λ > 0, suficientemente pequeño
h0
mientras que en la segunda lo que resulta es
δFf (h0 )
− + E(f, λh0 ) ≥ 0 cuando λ < 0, suficientemente pequeño
h0
Tomando ahora los lı́mites λ → 0+ , λ → 0− y recordando que E(f, λh0 ) → 0 cuando λ →

δFf (h0 ) δFf (h0 )
0, se encuentra respectivamente que h0
≥0 y h0
≤ 0. Estas dos condiciones
δFf (h0 )
solamente serán compatibles si h0
= 0. Ası́ pues la primera variación se anula en
M, como querı́amos demostrar.
Variación primera y ecuación de Euler-Lagrange

Vamos ahora a calcular la variación primera del funcional del tipo importante
que hemos presentado en (3). Se trata del funcional definido en C 1 [a, b], espacio
de funciones continuas de [a, b] en R que admitan derivada primera continua en
todo el intervalo [a, b], con dominio y definición siguientes:
b
D(F) = {f ∈ C [a, b] / f (a) = A; f (b) = B},
1
F(f ) = Φ(x, f (x), f (x)) dx,
a
donde A, B son constantes fijas y la función Φ(x, y, z) : R3 → R admite derivadas

parciales continuas de primer orden. Vamos a:
• Demostrar que este funcional siempre es diferenciable.
• Calcular su variación primera.
Comencemos dando una expresión auxiliar importante. Para ello tomaremos
un punto (x, y, z) de R3 . Puesto que Φ(x, y, z) es continua y admite derivadas
parciales continuas en todo R3 , es diferenciable en todos los puntos. Existirá
entonces un entorno de (x, y, z), tal que si (x1 , y1 , z1 ) pertenece a este entorno se
verifica:

∂Φ ∂Φ ∂Φ
Φ(x1 , y1 , z1 )−Φ(x, y, z) = (x1 −x)+ (y1 −y)+ (z1 −z)+" (x1 −x, y1 −y, z1 −z)
∂x x ∂y x ∂z x
(4)
donde las derivadas parciales están evaluadas en el punto (x, y, z) y " es una función
dependiente de (x, y, z; x1 , y1 , z1 ) y que tiende a cero cuando (x1 , y1 , z1 ) → (x, y, z).
La norma (x1 − x, y1 − y, z1 − z) se refiere a la norma canónica del espacio R3 ,
esto es (x1 − x, y1 − y, z1 − z) = (x1 − x)2 + (y1 − y)2 + (z1 − z)2 .
Vamos ahora a usar esta fórmula para evaluar la diferencia entre el valor del
funcional en la función f y en otra función f + h en un cierto entorno de f (o lo
que es lo mismo, para h en un cierto entorno de cero en M):
b
F(f + h) − F(f ) = {Φ(x, f (x) + h(x), f (x) + h (x)) − Φ(x, f (x), f (x))} dx.
a
Ahora llevamos (4) a esta fórmula, a condición de que h(x) esté en un cierto
entorno de 0 en M. De esta manera, para h en dicho entorno:

b
b
∂Φ ∂Φ
F(f +h)−F(f ) = h(x) + h (x) dx+ "(x) (h(x))2 + (h (x))2 dx,
a ∂f ∂f a
en donde las derivadas de Φ están evaluadas ambas en el punto (x, f (x), f (x)), y
en el término de la derecha "(x) ≡ "(x, f (x) + h(x), f (x) + h (x); x, f (x), f (x))
tiende a cero cuando h → 0. Nótese que para f, h fijas, podemos considerar " como
una función de x. Denotemos ahora:
b
b
∂Φ ∂Φ
ϕf (h) = h+
h dx, C(f, h) = "(x) (h(x))2 + (h (x))2 dx.
a ∂f ∂f a
En cuanto a ϕf (h), se trata de un funcional lineal que está bien definido en todo
M. En efecto, la integral que lo define existe ya que el integrando es una función
continua de x en el intervalo [a, b]. Su linealidad es evidente.
Si demostramos que cuando h → 0 el término restante C(f, h) tiende a 0 más
rápidamente que la norma de h, entonces, identificando con la descomposición
en la definición de funcional diferenciable, habremos demostrado que el funcional
F es diferenciable, y de paso habremos obtenido una expresión para la variación
primera de F en f .
Escribamos el término extra C(f, h) en la forma C(f, h) = E(f, h)h. Debemos
probar que E(f, h) tiende a 0 cuando h → 0. Para ver que esto es cierto, escribamos:

C(f, h) 1 b b h2 + (h )2
E(f, h) = = (x) h2 + (h )2 dx = (x) dx
h h a a h
el último paso dado que h es una constante. Observemos ahora que para todo valor de
x en el intervalo [a, b]:

(h(x))2 + (h (x))2 ≤ |h(x)| + |h (x)| ≤ sup |h(x)| + sup |h (x)| = h
x∈[a,b] x∈[a,b]
puesto que por ser h(x) una función real, se tiene que h2 + (h )2 = |h|2 + |h |2 , y ası́
(|h| + |h |)2 = |h|2 + |h |2 + 2|hh | ≥ |h|2 + |h |2 = h2 + (h )2

√ 2
h +(h )2
De aquı́ se deriva que en todo el intervalo [a, b], el cociente h
< 1. Como el
módulo de una integral es menor o igual que la integral del módulo, se tiene que:
b
b h2 + (h )2 b h2 + (h )2

|E(f, h)| = (x) dx ≤ |(x)| dx ≤ |(x)| dx
a h a h a
Esta expresión es la integral en un compacto de una función de x que tiende a cero cuando
h → 0, luego resulta que E(f, h) → 0 cuando h → 0, como querı́amos demostrar.
Ası́ pues, queda probado que F es diferenciable y que su variación primera en

f viene dada por el término ϕf (h), es decir
b
∂Φ ∂Φ
δFf (h) = h+ h dx
a ∂f ∂f
donde, insistimos, las derivadas parciales se evalúan en el punto (x, f (x), f (x)).
Vamos ahora a transformar esta expresión, haciendo uso del recurso de eliminar
la derivada h mediante una integración por partes:
b b b
b
∂Φ ∂Φ d ∂Φ d ∂Φ

h dx =
h −
h dx = −
h dx.
a ∂f ∂f a a dx ∂f a dx ∂f
Sustituyendo en la expresión para la variación primera del funcional F se obtiene

b
∂Φ d ∂Φ
δFf (h) = − h(x) dx (5)
a ∂f dx ∂f
Tenemos ya los ingredientes necesarios para determinar las funciones que hacen
máximo o mı́nimo el funcional F. En dichas funciones, la primera variación del
funcional debe ser idénticamente nula, lo que significa que si en la función f el
funcional F es mı́nimo o máximo, debe satisfacerse la condición
b
∂Φ d ∂Φ
δFf (h) = − h(x) dx = 0
a ∂f dx ∂f
para cualquier h ∈ M, esto es, satisfaciendo las condiciones h(a) = h(b) = 0.

Vamos a demostrar rigurosamente que esto implica que el término entre corchetes
en el integrando debe ser nulo. La demostración se basa en dos lemas:
Lema I. Sea γ(x) una función continua en el intervalo [a, b] tal que para toda
función h(x) ∈ C 1 [a, b] con h(a) = h(b) = 0 se satisface la condición
b
γ(x) h (x) dx = 0
a
Entonces γ(x) es una constante.

Lema II. Sean α(x) y β(x) dos funciones continuas en el intervalo [a, b] tales
que para toda función h(x) ∈ C 1 [a, b] con h(a) = h(b) = 0 se satisface la condición:
b
{α(x) h(x) + β(x) h (x)} dx = 0.
a
Entonces β(x) es diferenciable y β (x) = α(x); ∀x ∈ [a, b].

Demostración de los dos lemas. b
1
Lema I. Definamos la constante C = b−a a γ(x) dx y la función auxiliar H(x) =
x
a [γ(τ )−C] dτ . Por construcción, la función H(x) tiene como derivada a H (x) = γ(x)−C,
luego es una función continua, H(x) ∈ C 1 [a, b]. En x = a esta funcion vale H(a) = 0

obviamente, y en x = b se tiene H(b) = ab γ(τ ) dτ − ab C dτ = ab γ(τ ) dτ −C(b−a) = 0 De
esta manera, H(x) satisface las propiedades exigidas a h(x) en el enunciado del lema, de
b
manera que H(x) ha de satisfacer la condición del lema, a γ(x) H (x) dx = 0. Calculemos
ahora la integral
b b
{γ(x) − C}H (x) dx = γ(x) H (x) dx − C{H(b) − H(a)} = 0.
a a
Pero la misma integral puede calcularse también sustituyendo H (x) = γ(x) − C:

b b

0= {γ(x) − C} H (x) dx = (γ(x) − C)2 dx
a a
ecuación que implica que α(x)−C = 0 (ya que (α(x)−C)2 ≥ 0), salvo quizá en un conjunto
de medida nula en el intervalo [a, b]. Como α(x) es continua por hipótesis, resulta que
α(x) = C ∀x ∈ [a, b]. De esta manera
queda probado el lema.
Lema II. Definamos A(x) = ax α(τ ) dτ . Como en la demostración del lema anterior,

tenemos ab A(x) h (x) dx = A(x) h(x)|ba − ab α(x) h(x) dx. El primer término del miembro
de la derecha es nulo debido a las propiedades de h(x); de esta manera la condición del
Lema II puede reescribirse como
b
{−A(x) + β(x)} h (x) dx = 0.
a
Aplicando ahora el lema I, se tiene que β(x) − A(x) = C, es decir, β(x) = A(x) + C, con
lo que β(x) es diferenciable y β (x) = A (x) = α(x), como querı́amos demostrar.
Vamos ahora a usar estos dos lemas para demostrar la condición necesaria
conocida como ecuación de Euler-Lagrange para que un funcional del tipo (2-3)
tenga un máximo o un mı́nimo en f . En la expresión obtenida antes,
b
∂Φ ∂Φ
δFf (h) = h+ h dx = 0,
a ∂f ∂f
aplicamos el Lema II, con α(x) en el papel de ∂Φ∂f mientras que β(x) hace el papel
∂Φ ∂Φ
de ∂f . Obtenemos ası́ que que ∂f es diferenciable con respecto a x y que su
derivada con respecto a x debe ser igual a ∂Φ
∂f . Esto es,
d ∂Φ ∂Φ
el funcional F del tipo (2)(3) tiene un máximo o un mı́nimo en f ⇒ − =0
dx ∂f ∂f
Esta es la llamada ecuación de Euler-Lagrange, ecuación diferencial para la función

f (x) en la cual el funcional F alcanza mı́nimos o máximos relativos.
En el caso de las funciones f (x), en un máximo o un mı́nimo la diferencial en el
punto x, dfx se anula. Pero de la anulación de la diferencial en x no se sigue que la
función tenga en x un máximo o un mı́nimo, sino sólo que el punto x es un punto
crı́tico. Para funcionales, la situación es semejante, y mientras que la primera
variación del funcional F se anula en un mı́nimo o un máximo, de la anulación de
la primera variación no se sigue que el funcional F tenga un máximo o un mı́nimo.
Se definen en general las extremales del funcional diferenciable F como aquellas
funciones en las que la primera variación δFf se anula idénticamente. Además

de las funciones en las que el funcional tiene un mı́nimo o un máximo relativo,
las extremales incluyen otras funciones en las que el funcional es estacionario,
de manera análoga al caso de los puntos crı́ticos que además de los mı́nimos o
máximos incluyen puntos de inflexión con tangente horizontal, puntos de silla con
diferentes signaturas, etc.
Podemos formular el resultado importante obtenido en esta sección mediante:
d ∂Φ ∂Φ
el funcional F tiene una extremal en f ⇔
− =0
dx ∂f ∂f
• Ejercicio 6. En ocasiones, la función Φ no depende explı́citamente de x. Demostrar que

en ese caso la ecuación de Euler-Lagrange admite una integral primera dada por f ∂f ∂Φ
− Φ.
Ası́, en dicho caso las extremales
del funcional deben satisfacer también la ecuación de
d
primer orden dx f ∂f − Φ = 0 que suele resultar más manejable que la propia ecuación
∂Φ
de Euler-Lagrange. En el caso del principio de mı́nima acción, en el que el funcional accion

es la integral del Lagrangiano a lo largo del intervalo de tiempo dado, ¿qué significado tiene
la constante de éste tipo que aparece cuando el Lagrangiano no depende explı́citamente de
t?
• Ejercicio 7. Escribir las ecuaciones de Euler-Lagrange para el problema de la braquis-

tocrona. Resolverlas. Demostrar que la curva buscada es siempre una cicloide. Si la
velocidad inicial es nula, la cúspide de la cicloide está en el punto inicial P .
• Ejercicio 8. Determinar las curvas de longitud extremal sobre una esfera, escribiendo el
funcional de longitud y resolviendo las ecuaciones de Euler-Lagrange. Deben obtenerse los
cı́rculos máximos sobre la esfera.
Extremales que no sean de clase C 1

La exigencia que hemos hecho a las funciones de ser continuas y con derivada
continua es una exigencia técnica, que permite dar una condición necesaria muy
simple —la ecuación de Euler-Lagrange– para la existencia de extremales. Pero
conviene mencionar que en muchos casos los problemas variacionales nos obligan
a salirnos de este marco. Es decir, hay casos en los que no existen extremales
que sean suficientemente regulares, pero hay extremales que no son regulares. Un
ejemplo muy sencillo se plantea en los siguientes ejercicios.
• Ejercicio 9. Demuéstrese que si Φ(x, y(x), y (x)) = Φ(x, y(x)), el funcional F [y(x)] sólo
puede tener funciones y(x) extremales que sean suficientemente regulares (al menos de
clase C 1 ) si la función Φ es independiente de la variable y(x); en este caso resulta que el
funcional F [y(x)] es realmente constante. Por tanto, para tener un problema variacional
que admita extremales suficientemente regulares, es esencial que el integrando Φ dependa
de las derivadas de la función y(x).
b
• Ejercicio 10. Pruébese que el funcional F [y(x)] = y(x) dx con las condiciones de
a
contorno usuales no posee extremales, ni siquiera si se admiten en su dominio funciones
b
que no sean continuas. Sin embargo, el funcional F [y(x)] = y 2 (x) dx, con las mismas
a
condiciones de contorno sı́ que admite extremales; se trata de encontrar una función x →
y(x) que haga extremal este funcional y demostrar que realmente es extremal. Nótese que
esta funcion no es continua; por ello es imposible encontrar la extremal a partir de las
ecuaciones de Euler-Lagrange. Nótese tambien que esta extremal es semejante a la solución
de Goldschmidt para el problema de la superficie de jabón sobre dos aros paralelos.
Variación segunda de un funcional

La anulación de la variación primera de un funcional en la función f es una
condición necesaria para que el funcional F sea extremal en f . Pero esa anulación
no garantiza que el funcional tenga un mı́nimo relativo en f . Se trata de la misma
situación que ocurre para las funciones, donde un mı́nimo relativo en el punto x
requiere la anulación de la diferencial dfx en x como condición suficiente, pero tal
condición se da también en un máximo y en un punto estacionario; si deseamos
que la función tenga un mı́nimo debemos exigir la condición de que la diferencial
segunda dfx2 (h) sea una forma cuadrática definida positiva. Aunque en la mayor
parte de las aplicaciones lo que resulta ser realmente importante es la condición de
extremalidad (y no la de ser precisamente mı́nimo), resulta conveniente conocer
el análogo de la diferencial segunda de una función de varias variables, que para
funcionales se denomina variación segunda.
Comenzamos recordando la situación para funciones de varias variables. En primer
lugar recordamos qué es una forma cuadrática de varias variables. Una forma bilineal
B : Rn × Rn → R es una aplicación (x, y ) → B(x, y ) que es lineal en las dos variables;

su expresión genérica es B(x, y ) = n i,j=1 Bij xi yj .Toda forma bilineal tiene asociada
una forma cuadrática, dada por C(x) := B(x, x) = n i,j=1 Bij xi xj . (Recordemos que la
forma bilineal está completamente determinada por su forma cuadrática asociada, medi-
ante la llamada identidad de polarización). Se dice que la forma cuadrática C es definida
positiva si para todo x = (x1 , x2 , . . . , xn ) diferente del vector 0 se tiene C(x) > 0.
Se dice que una función f : Rn → R es diferenciable dos veces en el punto x =
(x1 , x2 , . . . , xn ) si existen una función lineal denotada dfx : Rn → R y una forma
cuadrática denotada dfx 2 : Rn → R tal que en un cierto entorno de x se tenga
2
f (x + h) − f (x) = dfx (h) + dfx (h) + (x, h)h2 ,
donde (x, h) → 0 cuando h → 0. Esta definición lleva un paso más adelante la idea
de función diferenciable, siendo el término extra (x, h)h2 cuadrático en h, en vez
de lineal. Geométricamente, en un cierto entorno de x supuesto fijado, la función dada
por x + h → f (x) + dfx (h) + dfx 2 (h) es la funcion cuadrática en h osculatriz a la función
f en el punto f (x). En cualquier texto de análisis matemático pueden encontrarse las

demostraciones de las siguientes propiedades importantes:
• Si f es diferenciable dos veces en x, entonces dfx 2 es única.
• Si la función f tiene un mı́nimo en el punto x, entonces en el punto x la diferencial

segunda dfx 2 (h) es una forma cuadrática definida positiva.
• La expresión explı́cita de la diferencial segunda dfx2 es:

1 ∂ 2 f
n
2
dfx (h) = hi hj ,
2! i,j=1 ∂xj ∂xi x
es decir, se expresa como la forma cuadrática en h cuyos coeficientes son las derivadas
parciales segundas de f en el punto x (con un factor 1/2!). En particular, esta relación
implica que si x es un mı́nimo de la función f la matriz formada por las derivadas segundas
(matriz hessiana de f en el punto x) es una matrix definida positiva.
Pasamos ahora a discutir la situación con funcionales:

Definición. Diremos que un funcional F es dos veces diferenciable en la función
f ∈ D(F ) si existen un funcional lineal denotado δFf : M → R y un funcional cuadrático,
denotado δ 2 Ff : M → R tales que en un cierto entorno de f en D(F ) (asociado a un
cierto entorno de 0 en M) se tenga:
F (f + h) − F (f ) = δFf (h) + δ 2 Ff (h) + E(f, h)h2
donde E(f, h) → 0 cuando h → 0.

Geométricamente, podemos imaginar el funcional dado en un cierto entorno de la
función f , supuesta fija, por f +h → F (f )+δFf (h)+δ 2 Ff (h) como el funcional osculador
al funcional F en la función f .
Vamos a presentar a continuación los enunciados que corresponden a los tres teoremas
discutidos al hablar de la variación primera.
Teorema. Si el funcional F es diferenciable dos veces en la función f , entonces la

variación segunda δ 2 Ff (h) es única.
Este resultado se demuestra de manera paralela al correspondiente para la variación
primera.
Para formular una condición de mı́nimo (y no sólo de extremal) necesitamos enunciar

la condición que reemplaza para nuestro caso de funcionales a la condición de que una
forma cuadrática sea definida positiva. Tal condición es:
Definición. Un funcional cuadrático C en M se dice fuertemente positivo si existe
K > 0 tal que C(h) ≥ Kh2 para cualquier h ∈ M.
Teorema. Una condición suficiente para que un funcional F dos veces diferenciable
tenga un mı́nimo en f ∈ D(F ) (supuesto que se anula la variación primera de F en f ) es
que la variación segunda δ 2 Ff de F en f sea fuertemente positiva.
Prueba. Si la primera variación de F en f se anula, δFf (h) = 0, existe un entorno

de cero W en M tal que ∀ h ∈ W se tiene que:
F (f + h) − F (f ) = δ 2 Ff (h) + (f, h) ||h||2 .
Supongamos que la variación segunda de F en f es fuertemente positiva. Entonces

δ 2 Ff (h) ≥ Kh2 , de manera que podemos escribir:
F (f + h) − F (f ) ≥ {K + (f, h)} ||h||2 ,
con (f, h) → 0 para h → 0. En particular, si h es suficientemente cercano al cero en M,

el valor absoluto de (f, h) llegará a ser menor que la constante positiva K, y por tanto
{K + (y, h)} > 0, de donde F (f + h) − F (y) > 0 y el funcional tiene un mı́nimo en f .
El cambio necesario para obtener una condición suficiente de máximo es evidente:
−δ 2 Ff debe ser fuertemente positivo.
Para acabar esta sección, vamos a obtener una fórmula para la variación se-
gunda del funcional (2-3). Ya que en el contexto que nos interesa aquı́ la segunda
variación sólo se necesita para discriminar entre los diversos tipos de extremales
(máximos, mı́nimos o tipo silla), basta con calcular la segunda variación en fun-
ciones f para las que la primera variación es ya idénticamente nula.
El procedimiento es una extensión del usado para encontrar una expresión de la
variación primera. Supongamos ahora que Φ(x, y, z) ∈ C 2 (R3 ), es decir que posee
derivadas parciales continuas hasta orden 2. Entonces Φ es dos veces diferenciable, lo
que equivale a decir que si h pertenece a un cierto entorno W de cero en M, tenemos:
b
F (f + h) − F (y) = Φ(x, f + h, f + h ) − Φ(x, f, f ) dx =
a
b
b
∂Φ ∂Φ 1 ∂2Φ 2 ∂2Φ ∂2Φ 2

= h+ h dx + h + 2 h h + (h ) dx
a ∂f ∂f 2 a ∂f 2 ∂f ∂f ∂(f )2
b
+ (x) ||(0, h(x), h (x))||2 dx.
a
La primera y segunda integrales están definidas para todo h ∈ M, y puede probarse

fácilmente que son respectivamente un funcional lineal en M y una forma cuadrática en
M. Ellas son, respectivamente la variación primera y la segunda de F en f . Ello es debido
a que la última integral puede ponerse como E(f, h) ||h||2 donde E(f, h) → 0 cuando h → 0,
lo que se comprueba de manera completamente semejante al caso de la variación primera.
Se obtiene ası́ la siguiente expresión para la variación segunda:
b
1 ∂2Φ 2 ∂2Φ ∂2Φ

δ 2 Ff (h) = h + 2 h h + (h )2 dx.
2 a ∂f 2 ∂f ∂f ∂(f )2
El segundo término en la integral puede transformarse mediante una integración por

partes, de la siguiente manera:
b
b
b

∂2Φ d ∂2Φ 2 d ∂2Φ
2 h h dx = h dx − h2 dx,
a ∂f ∂f a dx ∂f ∂f a dx ∂f ∂f
b
∂2Φ
y la primera integral en el segundo miembro de esta ecuación resulta ser igual a ∂f ∂f
h2
a
que se anula debido a las condiciones h(a) = h(b) = 0.
De esta manera nos queda la siguiente expresión para la variación segunda de

un funcional del tipo usual en una función f que anule la variación primera, en
estos términos:
2
1 b ∂ Φ d ∂2Φ ∂2Φ 2
δ Ff (h) =
2
− 2
h + (h ) dx, cuando δFf = 0
2 a ∂f 2 dx ∂f ∂f ∂(f )2
Problemas variacionales con ligaduras (Problemas isoperimétricos)

Se presenta con frecuencia el problema de encontrar los puntos crı́ticos (mı́ni-
mos, máximos, etc) de una función de varias variables que no son independientes
sino que están sujetas a una o varias condiciones adicionales, conocidas como
ligaduras. El ejemplo más sencillo y fácil de visualizar es el de la búsqueda del
máximo (o mı́nimo) de una función de dos variables f (x, y) sobre una determinada
curva Γ en el plano x, y; tales máximos y mı́nimos condicionados ocurren en puntos
en los que la función considerada como función de dos variables independientes no

tiene máximos ni mı́nimos. Un ejemplo de comprensión inmediata: cuando se
sigue un camino en la ladera de una montaña, la altura puede tener máximos o
mı́nimos relativos a lo largo del camino, que en general no corresponden a máximos
o mı́nimos de la función que da la altura de la superficie en cada punto de la
montaña.
La condición de anulación de la diferencial (o la equivalente de anulación de
todas las derivadas parciales) no resulta aplicable en tales casos; geométricamente
esto es claro, ya que un máximo o mı́nimo a lo largo de la curva sólo debe traducirse
en la anulación de la derivada direccional de la función a lo largo de la dirección
de la curva.
Procedimiento de fuerza bruta: usemos la condición adicional para eliminar
una de las dos variables, y consideremos la función, ya restringida a la curva,
como una función de una variable independiente, a la que se le puedan aplicar
las condiciones usuales de máximo o mı́nimo. Este método de fuerza bruta dista
de ser práctico. Aunque se pueda eliminar la variable (o variables) que debido a
las ligaduras resultan dependientes, las expresiones que se obtienen en términos
de variables independientes pueden ser poco manejables. Y además puede ocurrir
que las ligaduras estén dadas en forma implı́cita, que no admita la eliminación
explı́cita.
Se debe a Lagrange un método de determinación de máximos y mı́nimos de
funciones sometidas a ciertas condiciones adicionales que se conoce como método
de los multiplicadores de Lagrange, y consiste esencialmente en que si un punto
x = (x1 , x2 , . . . , xn ) es un máximo o mı́nimo de la función f (x1 , x2 , . . . , xn ) so-
bre la subvariedad determinada por las condición adicional g(x1 , x2 , . . . , xn ) = 0,
entonces el punto x = (x1 , x2 , . . . , xn ) es un máximo o mı́nimo de la función
f (x1 , x2 , . . . , xn ) + λg(x1 , x2 , . . . , xn ), considerada como función de n variables in-
dependientes. La constante λ, conocida como multiplicador de Lagrange, queda
determinada junto con la posición de los posibles puntos estacionarios, al resolver
las ecuaciones que establecen que en tales puntos todas las derivadas parciales de
la función f (x1 , x2 , . . . , xn ) + λg(x1 , x2 , . . . , xn ) deben anularse. Los detalles de
este método pueden consultarse en cualquier texto de Análisis Matemático.
En el cálculo variacional aparecen también naturalmente problemas con condi-
ciones adicionales. Hemos visto dos. En el problema de la catenaria, es evidente
por razones fı́sicas que sin ninguna condición adicional, el funcional “energı́a po-
tencial” de un hilo en un campo gravitatorio uniforme no presenta mı́nimos (entre
dos puntos dados, para cualquier hilo con energı́a potencial dada, siempre podemos
tender un hilo más largo, cuya energı́a potencial sea menor). Pero si consideramos
hilos de longitud prefijada, entonces sı́ que debemos esperar un mı́nimo para cierta
forma del hilo, especificada por cierta función z = f (x), que deberá satisfacer la
condición adicional de tener la longitud dada. En el problema de determinar la
curva que encierre un área máxima, es de nuevo claro que sin ninguna condición
adicional, podemos encerrar áreas cada vez mayores y mayores. Sólo si imponemos
una condición extra (longitud prefijada) debemos esperar que cierta forma de la
curva encierre un área máxima. En ambos casos, la condición adicional está dada
por otro funcional. Vamos a discutir este problema en el caso más sencillo de que
tanto el funcional a minimizar como la ligadura sean del tipo (2-3).
Consideremos pues un funcional en el espacio C 1 [a, b], del tipo
b
F(f ) = Φ(x, f (x), f (x)) dx, D(F) = {f ∈ C 1 [a, b] / f (a) = A; f (b) = B}.
a
y consideremos otro funcional G, cuyo dominio supondremos el mismo que el de

F y dado por
b
G(f ) = Γ(x, f (x), f (x)) dx
a
donde Γ es una función continua y con derivadas continuas que juega, para el
funcional G, un papel análogo al que Φ juega para F.
Problema isoperimétrico. Entre todas las funciones que satisfagan la cond-
ición G(f ) = G donde G es una constante real, encontrar las extremales del fun-
cional F.
En estas condiciones puede demostrarse el siguiente:
Teorema. Sea f ∈ D(F) una función extremal del funcional F satisfaciendo
la condición G(f ) = G. Supongamos además que la primera variación del funcional
G en f no es idénticamente nula. Entonces existe un número real λ de manera que
f es un extremal del nuevo funcional
b
)=
F(f {Φ(x, f (x), f (x)) + λΓ(x, f (x), f (x))} dx,
a
en el que ya no se considera ninguna condición subsidiaria.

La demostración de este teorema, ası́ como su extensión para el caso de que
existan varias condiciones de ligadura puede consultarse en el libro de Troutman.
• Ejercicio 11. Encontrar la curva entre dos puntos (−a, 0), (a, 0) del eje x, que no corta
al eje, tiene longitud dada L > 2a y que encierra entre ella y el eje x el área máxima.
• Ejercicio 12. Un hilo flexible e inextensible, de densidad lineal constante y longitud dada
L, se suspende entre dos torres de alturas A y B, separadas por una distancia horizontal d
en el campo gravitatorio (supuesto uniforme) de la tierra. Determinar la forma que adopta
el hilo.
• Ejercicio 13. Principio de reciprocidad en los problemas isoperimétricos. Supongamos

dados dos funcionales, F y G, y nos limitamos a funciones que no sean extremales ni de F
ni de G. En estas condiciones las extremales del funcional F (f ) con la condición subsidiaria
G(f ) = G son las mismas que las extremales del funcional G(f ) con la condición subsidiaria
F (f ) = F . ¿Porqué? Como aplicación, demostrar que entre las curvas que encierra un área
dada, la circunferencia es la que tiene longitud estacionaria (de hecho mı́nima).
Problemas Variacionales con varios grados de libertad

Hasta ahora nos hemos limitado a considerar funcionales definidos en espacios
de funciones reales de una variable, f : R → R. Pero pueden darse funcionales de
tipos más generales, por ejemplo funcionales del tipo (2-3) en las que Φ dependa
de funciones con varias componentes (vectoriales) pero de una sola variable, o bien
funcionales definidos sobre espacios de funciones de más de una variable.
En tanto intervengan funciones de una sola variable, posiblemente con varias
componentes, esto es, funciones de f : R → Rn , la mayor parte de las técnicas y
resultados descritos en estas notas se extienden directamente y de manera casi in-
mediata. Por ejemplo, el principio de mı́nima acción determina el movimiento real
que sigue una partı́cula en un potencial externo V (x, t); este movimiento es una
función x : R → R3 , que puede describirse mediante tres funciones componentes,
x(t), y(t), z(t). En este caso el funcional que se pretende minimizar es siempre
del tipo (2-3), donde ahora la función Φ depende de t y de las tres componentes
x(t), y(t), z(t), ası́ como de las tres derivadas dx(t) dy(t) dz(t)
dt , dt , dt . En el principio de
Fermat, la trayectoria seguida por un rayo de luz está descrita tambien por una
función que podemos describir dando las dos funciones y(x), z(x), y el funcional a
minimizar involucra las dos funciones y(x), z(x) y sus derivadas dy(x) dz(x)
dx , dx .
Estos ejemplos sugieren extender el tipo usual de funcionales (2-3) de la siguien-
te manera: Denotemos C 1 ([a, b], Rn ) el espacio de las funciones definidas en un
intervalo [a, b] y con valores en Rn que sean continuas y todas cuyas funciones
componentes admitan derivada primera continua en todo el intervalo [a, b]. Este
espacio admite la estructura de espacio de Banach cuando le dotamos de la norma
definida por:
f = sup(f1 , f2 , . . . fn ),
donde para cada función componente la norma es la usada en (1). Es fácil de-
mostrar que se trata de una norma, y menos fácil de demostrar aunque también
cierto, que dotado de esta norma, el espacio C 1 ([a, b], Rn ) es un espacio de Banach.
En la topologı́a inducida por esta norma, dos funciones f , g son próximas cuando
en todo el intervalo [a, b], tanto cada una de las componentes de f , g como sus
derivadas toman valores próximos.
Vamos ahora a definir un funcional F que es la extensión del tipo descrito en
(2-3). Comenzamos por definir su dominio, es decir, el conjunto sobre el que el
funcional está definido:
D(F) = {f (x) ∈ C 1 ([a, b], Rn )/ fi (a) = Ai ; fi (b) = Bi ; i = 1, 2, . . . , n}.
Notemos que este dominio no es un subespacio vectorial salvo en el caso Ai =

Bi = 0, i = 1, 2, . . . , n. Sea ahora:
M = {h(x) ∈ C 1 ([a, b], Rn )/ hi (a) = hi (b) = 0, i = 1, 2, . . . , n}.
Obviamente D(F) = f + M para todo f ∈ D(F)

Sea ahora Φ(x1 , x2 , . . . , x2n+1 ) una función de R2n+1 a R que sea continua y
admita derivadas parciales continuas. Escribamos
b
F(f ) = F(f1 , f2 , . . . , fn ) = Φ(x, f1 (x), . . . , fn (x), f1 (x), . . . , fn (x)) dx.
a
F está bien definido ∀f ∈ D(F), puesto que la función bajo el signo integral es
continua en todo el intervalo [a, b].
Repitiendo lo hecho en el caso de una función de una componente, se demuestra
que este funcional es diferenciable en todos los puntos de su dominio. Sea entonces
f = (f1 , f2 , . . . , fn ) ∈ D(F) y h = (h1 , h2 , . . . , hn ) ∈ M. Como Φ es una función
continua con derivadas parciales continuas, es diferenciable. Razonando como en
la derivación de (5) existirá un entorno de cero en M tal que
F(f1 + h1 , . . . , fn + hn ) − F(f1 , . . . , fn ) =
b
{Φ(x, f1 + h1 , . . . , fn + hn , f1 + h1 , . . . , fn + hn ) − Φ(x, f1 , . . . , fn , f1 , . . . , fn )} dx =
a
n
b
b
∂Φ ∂Φ
hi + h dx + " (0, h1 , . . . , hn , h1 , . . . , hn ) dx,
a i=1 ∂fi ∂fi i a
para todo h en dicho entorno. La primera integral está bien definida para todo
h = (h1 , . . . , hn ) ∈ M y es una aplicación lineal de M en R. La segunda puede
ponerse en la forma E(f , h) ||h||, con E(f , h) → 0 si h → 0. De esta manera, para
h en un entorno de 0 en M,
F(f1 + h1 , . . . , fn + hn ) − F(f1 , . . . , fn ) = ϕf (h) + E(f , h) h,
con
n
b
∂Φ ∂Φ
ϕf (h) = hi + h dx
a i=1 ∂fi ∂fi i
Esta expresión muestra que F es diferenciable, y su diferencial primera viene dada

por:
b n
∂Φ ∂Φ
δFf (h) = hi + h dx.
a i=1 ∂fi ∂fi i
Supongamos que F admite un extremal en f = (f1 , . . . , fn ) ∈ D(F). Entonces,

la variación primera de F en f se ha de anular. Esto significa que para todo h ∈ M,
tenemos:
bn
∂Φ ∂Φ
hi + h dx = 0
a i=1 ∂fi ∂fi i
Las derivadas parciales se evalúan en (x, f1 (x), . . . , fn (x), f1 (x), . . . , fn (n)). Es-
cogiendo hi (x) = 0 para todo i salvo para i = j, queda
b
∂Φ ∂Φ
hj + h dx = 0.
a ∂fj ∂fj j
Esto implica, tras el Lema II visto antes que
d ∂Φ ∂Φ
− = 0.
dx ∂fj ∂fj
Realizando la misma operación para todos los j = 1, 2, . . . , n resulta un sistema

de n ecuaciones en las n funciones incógnitas f1 , f2 , . . . , fn entre cuyas soluciones
están los extremales f = (f1 , f2 , . . . , fn ) del funcional F. A dicho sistema de
ecuaciones se le conoce como sistema de Euler-Lagrange, o simplemente, ecuaciones
de Euler-Lagrange:
∂Φ d ∂Φ
f es un extremal del funcional F ⇔ − = 0, i = 1, 2, . . . , n.
∂fi dx ∂fi
Problemas Variacionales con varias variables: superficies mı́nimas

Otros problemas variacionales involucran funciones de dos o más variables como
los objetos primitivos de los cuales depende algún funcional que se trata de mini-
mizar. Tal situación resulta ser mucho más complicada que el caso de funciones de
una variable. El prototipo es el problema de las superficies mı́nimas: De entre
todas las superficies en el espacio R3 con un borde dado, encontrar
aquellas que tengan área mı́nima. En este caso, el funcional a minimizar
depende de una función de dos variables.
Históricamente, es notable que las ideas básicas del cálculo variacional, en
la forma que las hemos expuesto, aparecieran por primera vez en un trabajo de
Lagrange (1760) dedicado precisamente al estudio del problema nada trivial de las
superficies mı́nimas. Este trabajo despertó el interés de Euler, dando lugar a un
desarrollo por parte de ambos autores, que culminó en la sistematización de las
condiciones hoy llamadas de Euler-Lagrange.
Vamos a limitarnos a derivar, de manera directa, la ecuación diferencial que
debe satisfacer cualquier superficie mı́nima, y lo vamos a hacer poniendo solamente
el énfasis en las ideas relevantes desde el punto de vista del cálculo variacional,
eludiendo discutir detalles adicionales.
Localmente cualquier superficie puede describirse en la forma denominada
de Monge, como la gráfica de una función (x, y) → (x, y, f (x, y)), pero posible-
mente tal representacion puede no cubrir la superficie “completa”. Por ejemplo
un plano puede representarse de manera completa en forma de Monge: (x, y) →
(x, y, f (x, y) = z0 ), pero para una esfera la región máxima representable de esta
manera
es un hemisferio, excluido su borde ecuatorial: (x, y) → (x, y, f (x, y) =
R2 − x2 − y 2 ).
Para simplicidad, nos limitaremos a estudiar porciones de superficie que sean
representables de dicha forma, lo que no constituye ninguna limitación importante,
ya que como veremos la condición de superficie mı́nima se traduce en una ecuación
diferencial que determina f localmente.
• Ejercicio 14. Encontrar la expresión del funcional que da el área de una superficie
descrita en el espacio ordinario R3 por la función (u, v) → (x(u, v), y(u, v), z(u, v)), como
una integral extendida a cierto dominio del espacio de parámetros (u, v). Particularizar
para el caso de que la superficie se describa en forma de Monge: (x, y) → (x, y, f (x, y)).
Como deberá haberse concluido en el ejercicio anterior, el area de la porción

de superficie que corresponde a un dominio D del plano de parámetros x, y es:

A= dx dy 1 + (fx )2 + (fy )2
D
con la integral doble extendida al dominio D y en donde para abreviar la escritura

denotamos fx ≡ ∂f ∂x , etc. Nótese la analogı́a de esta expresión con la que da
la longitud
de una curva plana descrita en la forma x → (x, f (x)), dada por
L = dx 1 + (fx )2 .
Consideremos una curva Γ dada en espacio R3 . Esta curva se supondrá cerrada,
sin autointersecciones y suficientemente regular, y es quien va a jugar el papel
que los dos extremos ta , xa ; tb , xb jugaban para problemas variacionales del tipo
implicado en el principio de mı́nima acción. La proyección de Γ sobre el plano
x, y es una curva plana, que llamaremos γ, que también supondremos cerrada, sin
autointersecciones y suficientemente regular. La propia curva Γ puede describirse
como el conjunto de puntos (x, y, zγ (x, y)) en donde se supone que (x, y) ∈ γ y
donde z(x, y) es la función fija, definida solamente en γ y que describe la altura
de la curva Γ. Denotemos D el dominio del plano cuyo borde es γ: este dominio
es homeomorfo a un disco ya que la curva γ no tiene autointersecciones.
La forma general de la descripción de Monge de una superficie que tenga a Γ
como borde está dada por una función de dos variables, suficientemente regular,
en la forma:
(x, y) ∈ D → (x, y, z(x, y)), donde z(x, y) = zγ (x, y) para (x, y) ∈ γ
La idea esencial de la derivación de Lagrange es la siguiente. Supongamos que

la función f (x, y) (aún desconocida) corresponde a una superficie Σf con borde
Γ y de área mı́nima entre todas las que satisfagan las condiciones anteriores. Sea
h(x, y) una función fija, suficientemente regular, definida en el dominio D, y a la
que exigimos satisfacer la condición
h(x, y) = 0 para (x, y) ∈ γ

En estas condiciones, tenemos una familia de superficies, que podemos denotar

mediante Σf (h, ") cuya descripción de Monge es:
(x, y) ∈ D → (x, y, f (x, y) + "h(x, y)),
que se construyen a partir de la superficie Σf (aún desconocida), tomando como

dato de deformación la función h(x, y); aquı́ " juega el papel de un parámetro,
de manera que esta familia es una familia uniparamétrica de superficies, todas las
cuales tienen a la curva Γ como borde, ya que para cualquier valor del parámetro
" se verifica la condición
f (x, y) + "h(x, y)) = z(x, y) para (x, y) ∈ γ
El área de la superficie Σf (h, ") está dada por:

Ah, = dxdy 1 + (fx + "hx )2 + (fy + "hy )2
Si la superficie Σf (descrita por f (x, y)) tiene realmente area mı́nima entre
todas las superficies con el mismo borde, también debe tener área mı́nima entre
las de la familia uniparamétrica anterior Σf (h, "). Esto significa que la función
Ah, debe tener un mı́nimo en " = 0, es decir

dAh,
0= .
d" =0
Derivando con respecto a " en Ah, y evaluando en " = 0 la condición anterior

se transforma en:
fx hx + fy hy
dx dy =0 (6)
D 1 + (fx )2 + (fy )2
Ası́ pues, si la superficie Σf es mı́nima, la condición (6) debe satisfacerse para
cualquier elección de la función auxiliar h que satisfaga la condición de anulación
sobre γ.
Por analogı́a con lo estudiado anteriormente, el paso siguiente debe ser trans-
formar la integral en (6) en otra integral que sea lineal en h, pero en donde no
aparezcan las derivadas de h. La manera más clara de hacerlo es la siguiente. Con-
sideremos la integral en (6) (que debe anularse) como una suma de dos sumandos:

fx hx fy hy
dx dy + dx dy
2
1 + (fx ) + (fy )2 1 + (fx )2 + (fy )2
D D
Vamos a realizar la transformación de manera ligeramente diferente, aunque per-

fectamente análoga, sobre cada uno de estos dos sumandos. Comenzemos con

fx hx
dx dy
D 1 + (fx )2 + (fy )2
que escribiremos como (hágase un diagrama que aclare el uso de los lı́mites de
integración):
ymax xb (y)
fx
dy hx dx.
ymin xa (y) 1 + (fx )2 + (fy )2
donde ymin , ymax son los valores mı́nimo y máximo de la coordenada y sobre la
curva γ, mientras que xa (y), xb (y) son los valores mı́nimo y máximo de x sobre el
segmento de recta paralela al eje x y que tiene ordenada y. (Nota: para simplificar
la discusión estamos suponiendo que el dominio es convexo, y que la intersección
con las rectas paralelas a los ejes tiene sólo dos puntos; esta restricción simplifica
la discusión pero no es esencial al resultado).
Hacemos ahora la integración en x por partes, tomando u = √ fx
2 2
,
1+(fx ) +(fy )
v = h. Ası́ obtenemos para la integral en x lo siguiente:
xb (y)
xb (y)
fx ∂ fx
h − h dx.
1 + (fx )2 + (fy )2 xa (y)
xa (y) ∂x 1 + (fx )2 + (fy )2
El término de borde no contribuye debido a que los dos puntos (xa (y), y),
(xb (y), y) están por construcción sobre el borde γ y la función h(x, y) se anula
sobre γ. Integrando ahora con respecto a y lo que obtenemos es que el término
que implicaba a la derivada con respecto a x de h puede reescribirse como una
integral en la que es la propia función h (y no su derivada) quien aparece como
factor:

fx hx ∂ fx
dx dy =− dx dy h
1 + (fx )2 + (fy )2 ∂x 1 + (fx )2 + (fy )2
La derivada parcial que aparece ahora en el integrando se calcula fácilmente: con-

viene recordar que tanto fx como fy son funciones de x, y. El resultado es:
∂ fx fxx (1 + fy2 ) − fx fy fxy

= 3
∂x 1 + (fx )2 + (fy )2
1 + (fx )2 + (fy )2
de manera que finalmente, lo que encontramos es:

fx hx fxx (1 + fy2 ) − fx fy fxy
dx dy =− dx dy 3 h(x, y)
1 + (fx )2 + (fy )2 1 + (f )2 + (f )2
x y
Para el otro sumando que involucra hy se procede de manera análoga, pero

intercambiando y por x. Es bastante evidente que tal procedimiento conduce a:

fy hy fyy (1 + fx2 ) − fy fx fxy
dx dy =− dx dy 3 h(x, y)
1 + (fx )2 + (fy )2 2
1 + (f ) + (f ) 2
x y
Ası́ pues, la condición de que la superficie sea mı́nima, contenida en la ecuación

(6), se convierte en:

fxx (1 + fy2 ) − 2fx fy fxy + fyy (1 + fx2 )
dx dy 3 h(x, y) = 0
1 + (fx )2 + (fy )2
y como esta ecuación debe satisfacerse para cualquier función h(x, y) (con la sola
exigencia de anularse sobre el borde γ), parece claro que la única posibilidad de
que tal cosa ocurra es que el integrando se anule, esto es, que la función f (x, y)
satisfaga la ecuación:
fxx (1 + fy2 ) − 2fx fy fxy + fyy (1 + fx2 ) = 0
que se conoce como ecuación de Lagrange para las superficies mı́nimas. A pesar
de su aspecto superficialmente inocente, como ecuación diferencial es bastante
complicada: es muy no lineal y se conocen muy pocas soluciones explı́citas. La
búsqueda efectiva de superficies mı́nimas requiere el uso de técnicas mucho más
avanzadas y elaboradas.
Un dominio cualquiera de un plano es evidentemente una superficie mı́nima,
cuyo borde es una curva plana. Escogiendo adecuadamente las coordenadas, esta
porción de superficie está descrita por f (x, y) = z0 , que satisface trivialmente la
ecuación de Lagrange. Es decir, si la curva Γ es una curva plana, la superficie
mı́nima con borde Γ es una porción de plano. Este ejemplo es absolutamente
trivial.
A finales del S. XVIII se obtuvieron otras dos superficies mı́nimas relativamente
sencillas. Una es el catenoide, que es la única superficie mı́nima de revolución.
• Ejercicio 15. La búsqueda de superficies mı́nimas con un borde dado tiene como caso
especialmente sencillo el de las superficies mı́nimas de revolución (En éste caso el borde
son dos cı́rculos paralelos y coaxiales). En este caso no es conveniente utilizar la ecuación
de Lagrange, ya que la descripción de Monge de la superficie no es posible (y además
el borde consta de dos curvas desconectadas). Es más fácil escribir directamente el área
de la superficie de revolución obtenida rotando alrededor del eje y la curva y = y(x),
entre los puntos x1 , y1 y x2 , y2 , como un funcional de la función y(x). Se pide escribir
este funcional, comprobar que formalmente coincide con el del problema de la catenaria y
encontrar las soluciones en el caso particular “simétrico” entre los puntos (R, A) y (R, −A).
Este problema es interesante ya que dependiendo de los valores de R, A, puede ocurrir que
el mı́nimo absoluto del funcional área se alcance sobre una superficie de revolución cuya
generatriz no sea una curva con derivada continua (solución de Goldschmidt).
El otro ejemplo de superficie mı́nima es el helicode recto, que es la superficie

engendrada por una recta “horizontal” que se desliza a velocidad constante a lo
largo de un “eje” vertical al tiempo que gira alrededor de dicho eje, en un plano
“horizontal” y a velocidad angular constante.
Durante más de 200 años el catenoide y el helicoide han sido las únicas su-
perficies mı́nimas conocidas que satisfacen las condiciones de ser embebidas en
R3 , completas y sin autointersecciones. Por ello ha resultado una agradable noti-

cia para la comunidad matemática el descubrimiento a principios de los 80 del
siglo pasado de una nueva superficie mı́nima que satisface la exigencias anteri-
ores: la superficie de Costa. Las técnicas, apoyadas en el análisis de funciones de
variable compleja, que han llevado a este descubrimiento han abierto la puerta a
una auténtica eclosión de un mundo fascinante y mucho más rico de superficies
mı́nimas. Una descripción puede verse en el libro El turista matemático de I. Pe-
tersen, y sobre la superficie de Costa hay un artı́culo de C. J. Costa en La Gaceta
Matemática, 4 (1999)). Actualmente se conocen multitud de nuevos ejemplos. La
portada del Notices of the American Mathematical Society de Diciembre de 2000
se dedica a una de ellas. En http://www.susqu.edu/brakke hay cantidad de
información sobre superficies mı́nimas triplemente periódicas.
En particular, merece la pena indicar que para una porción de superficie arbi-
traria Σf pero con borde fijo Γ, la variación primera del funcional area está dada
por:

A(Σf ) = 2
dx dy 1 + (fx ) + (fy ) 2 δAΣf (h) = dΣf HΣf h
D Σf
donde la función HΣf es la llamada curvatura media de la superficie, Σf , definida

como la semisuma de las dos curvaturas principales, que a su vez son las curvaturas
máxima y mı́nima de las curvas planas que se obtienen como secciones normales de
la superficie. La interpretación geométrica de la condición de Lagrange, dada por
vez primera por Meusnier, es que las superficies mı́mimas tienen curvatura media
igual a cero en todos sus puntos, lo que evidentemente garantiza la anulación del
funcional variación primera.
Para acabar, conviene mencionar que las ideas básicas (diferenciabilidad de
funcionales, funcional lineal variación primera, anulación de dicho funcional como
condición de extremalidad, etc,) se extienden a estos problemas. Aunque no hemos
escrito de manera general el problema, puede comprobarse que para un funcional
del tipo
F(f ) = dx dy Φ(x, y; f (x, y), fx (x, y), fy (x, y)) dx,
D
sobre un dominio D del plano y con condiciones de frontera sobre el borde γ de
D del tipo
(x, y) ∈ D → (x, y, z(x, y)), donde f (x, y) = fγ (x, y) para (x, y) ∈ γ
las ecuaciones de Euler-Lagrange que se obtienen son:

∂Φ ∂ ∂Φ ∂ ∂Φ
− − = 0.
∂f ∂x ∂fx ∂y ∂fy
forma de la que la extensión a más variables independientes, o a funciones vecto-
riales de varias variables resulta ya evidente.
Bibliografı́a
La fı́sica que contienen los problemas variacionales está expuesta de manera
insuperable en las “Lectures” de Feynmann. Resultan de lectura obligada en
relación con este tipo de problemas los Capı́tulos “Optica, el principio del tiempo
mı́nimo” Cap. 26 del Vol I y “El principio de mı́nima acción”, Cap. 16, Vol II.
1. R.P. Feynmann, R. B. Leighton y M. Sands, Lectures on Physics, Fondo Ed-
ucativo Interamericano, 1971.
La mayor parte de los textos de Mecánica Clásica dedican cierto tiempo a la
exposición de las técnicas del cálculo variacional. Por ejemplo:
2. H. Goldstein, Classical Mechanics, Addison Wesley, 1980.
Un resumen excelente, incluyendo con detalle aplicaciones a la Fisica y con
una lista de referencias de los textos clásicos del Cálculo de Variaciones en Fisica
Matematica (Lanczos, Yourgrau y Mandelstam):
3. G. Arfken, Mathematical Methods for Physicists, Academic Press, New York,
1985.
Sobre la matemáticas del cálculo variacional, los tres textos siguientes contienen
el material fundamental.
4. I. M. Gelfand, S.V. Fomin, Calculus of Variations, Prentice Hall, New York.
5. J.L. Troutman, Variational Calculus with Elementary Convexity, Springer Ver-
lag, Berlin.
6. L. Elsgoltz, Ecuaciones Diferenciales y Cálculo Variacional., MIR, Moscú.
El librito siguiente tiene una gran colección de problemas:
7. M.L. Krasnov, G.I. Makarenko y A.I. Kiseliov, Cálculo Variacional (Ejemplos
y Problemas)., MIR, Moscú, 1976.
Finalmente, mencionemos el artı́culo
8. S. Hildebrandt, ¿Es minimalista el mejor de los mundos?., Mundo Cientı́fico
188, Marzo, 1998.
Problemas
Recopilación de L. M. Nieto
1 Dado el funcional b
F[y(x)] = Φ(x, y(x), y (x)) dx,
a
demuéstrese la equivalencia de las dos formas siguientes de las ecuaciones de

Euler-Lagrange

∂Φ d ∂Φ ∂Φ d ∂Φ
a) − =0 b) − Φ−y = 0.
∂y dx ∂y ∂x dx ∂y
2 Si la función Φ(x, y(x), y (x)) en el funcional F[y(x)] es del tipo

Φ(x, y(x), y (x)) = Φ1 (x, y(x)) + Φ2 (x, y(x)) y (x),
∂Φ1 ∂Φ2
demuéstrese que la ecuación de Euler-Lagrange conduce a = ¿Qué
∂y ∂x
implica este hecho sobre la dependencia de la integral respecto a la elección del
camino?
4 Obténgase la forma que adopta la ecuación de Euler-Lagrange en los siguientes
casos particulares:
a) Φ sólo depende de y .
b) Φ no depende de y.
c) Φ no depende
explı́citamente de x.
d) Φ = G(x, y) 1 + y 2 .
5 Aplı́quense los resultados anteriores a los ejemplos siguientes:
a) F[y(x)] = y(2x − y)dx, y(0) = 0, y(π/2) = π/2.
b) F[y(x)] = (y 2 + 2xyy )dx, y(a) = A, y(b) = B.

c) F[y(x)] = (1 + y )1/2 dx, y(a) = A, y(b) = B.
2
d) F[y(x)] = y (1 + x2 y )dx, y(1) = 3, y(2) = 5.

6 Encuéntrense los extremales de los siguientes funcionales:
b
a) F[y(x)] = a [y 2 + y − 2y sin x]dx.
2
b 2
b) F[y(x)] = a [y − y − 2y cosh x]dx.
2
b
c) F[y(x)] = a [y 2 + y + 2yex ]dx.
2
b 2
d) F[y(x)] = a [y − y − 2y sin x]dx.
2
7 Demuéstrese que dados dos puntos cualesquiera del plano de abscisas diferentes,
en general no hay extremal del funcional
b
F[y(x)] = (y + 1 + y 2 )dx
2
a
que pase por dichos puntos.
8 Demuéstrese que la solución de un problema variacional de extremos fijos no

depende de la forma en que se exprese la relación entre las variables x e y, es
decir, se obtiene la misma solución cuando se expresa y como función de x que
cuando se utiliza una representación paramétrica para x e y.
9 Demuéstrese la invariancia de la ecuación de Euler frente a cambios de coor-

denadas.
10 Hállense las ecuaciones de Euler-Lagrange para el funcional “de orden superior”

b
F[y(x)] = Ψ(x, y(x), y (x), y (x)) dx.
a
con las condiciones de frontera y(a) = A, y(b) = B; y (a) = A , y (b) = B .
11 Pruébese que la lı́nea recta es el camino más corto entre dos puntos en el plano
euclı́deo.
12 Haciendo pompas de jabón. Considérese una superficie de revolución generada

al girar alrededor del eje x una curva y(x) que pasa por dos puntos dados
(x1 , y1 ) y (x2 , y2 ). Determı́nese la curva y(x) de manera que la superficie
lateral de la figura engendrada sea mı́nima. Particuları́cese a los siguientes
casos:
a) (x1 , y1 ) = (−1, 1) y (x2 , y2 ) = (1, 1) ;
b) (x1 , y1 ) = (−1/2, 1) y (x2 , y2 ) = (1/2, 1).
Usando los resultados anteriores para el caso particular “simétrico” (−p, 1) y
(p, 1), hállese la ecuación transcendente en p que resulta al imponer que el área
de la superficie de revolución coincida con el área de los dos discos cuyos bordes
son los dos cı́rculos laterales.
14 Consideremos otra configuración de una pelı́cula de jabón (que es una superficie

mı́nima) montada sobre dos aros de radio unidad colocados perpendicularmente
al eje x con sus centros sobre él, en x = ±p (como en ejercicios precedentes) y
un tercer aro de radio a, paralelo a los aros anteriores y centrado en el origen.
La configuración consiste en tres superficies: el disco central y dos catenoides
que unen el aro central a cada uno de los laterales; cada uno de ellos está
descrito por sus secciones en el plano x–y mediante ecuaciones del tipo
x
y = c cosh +k .
c
a) Impónganse las condiciones de contorno en x = 0 y x = ±p para que los
catenoides se apoyen en los aros correspondientes.
b) Aunque no es imprescindible (ya que es consecuencia de suponer que la su-
perficie que ası́ se obtiene es mı́nima), simplifica mucho los cálculos suponer
que los catenoides forman entre sı́ y con el disco central ángulos de 120o .
Exprésese esta condición en forma algebraica.
c) Demuéstrese que el área total de la configuración (los dos catenoides más

el del disco central) es

2 2p 2p
A = c sinh + 2k +
c c
d) Encuéntrese de forma numérica el valor máximo de p que permite esta
configuración
Nota: la configuración de las pompas de jabón que acabamos de describir es
fı́sicamente realizable y es estable.
15 Una manera de enunciar el principio de Fermat en Óptica es decir que para ir
de un punto P a otro Q los rayos de luz seguirán el camino γ para el cual
Q
T [γ] = n(x, y, z) ds
P
es un mı́nimo, siendo n(x, y, z) el ı́ndice de refracción del medio y s la longitud
de arco medido a lo largo de la trayectoria de la luz γ. Para el caso de propa-
gación de la luz en un plano y tomando los puntos inicial y final P ≡ (−1, 1),
Q ≡ (1, 1), encuéntrese el camino cuando a) n = ey , b) n = ay, c) n = a/y,
√ √
d) n = a y, e) n = a/ y.
16 Una partı́cula se mueve sin rozamiento desde un punto A a un punto B, ambos
en la superficie de la Tierra, a través de un túnel en el interior de la tierra,
bajo la acción exclusiva de la gravedad. Determı́nese la ecuación diferencial
que determina la forma del túnel si se desea que el tiempo del viaje entre A
y B sea mı́nimo (supóngase que la Tierra es una esfera de densidad uniforme
y despréciese su movimiento de rotación). Demuéstrese que la solución es una
hipocicloide y hállese el tiempo que dura el viaje entre A y B.
17 Pruébese que el principio de mı́nima acción asociado al lagrangiano

v 2
L = mc2 1 − 1 − 2 − V (:r )
c
conduce a una versión relativista de la segunda ley de Newton que es

d mvk ∂V
= Fk = −
dt 1 − v 2 /c2 ∂xk
18 Sabiendo que el lagrangiano de una partı́cula de carga q que se encuentra en

un campo electromagnético descrito por un potencial escalar ϕ y un potencial
vector A: es
1 : · :v ,
L = mv 2 − q ϕ + q A
2
hállense las ecuaciones de movimiento de la partı́cula cargada. Recuérdese que
:
E : − ∂A ,
: = −∇ϕ B: =∇ : × A.
:
∂t
20 Al estudiar las pequeñas vibraciones de una cuerda, el lagrangiano que aparece

es 2 2
1 ∂u 1 ∂u
L= < − τ dx,
2 ∂t 2 ∂x
siendo < la densidad lineal de masa y τ la tensión (supuestas ambas constantes a

lo largo de la cuerda). La integración se extiende a toda la longitud de la cuerda.
Pruébese que aplicando el principio de Hamilton a la densidad lagrangiana (el
integrando en la anterior expresión) se llega a la ecuación clásica para la cuerda
vibrante
∂2u < ∂2u
= .
∂x2 τ ∂t2
21 La densidad lagrangiana por unidad de volumen de un campo electromagnético
en el vacı́o con densidad de carga < es

1 B2 :
L= "0 E −
2
− < ϕ + < :v · A,
2 µ0
siendo "0 la permitividad del vacı́o y µ0 la permeabilidad del vacı́o. Pruébese
que las ecuaciones de Lagrange conducen a dos de las ecuaciones de Maxwell
(las otras dos son precisamente una consecuencia de las definiciones de E : yB :
:
en términos del potencial escalar ϕ y del potencial vector A).
22 Encuéntrese la ecuación de Euler-Lagrange para el problema mecano-cuántico
consistente en imponer que el valor esperado de la energı́a para un hamiltoniano
arbitrario independiente del tiempo H = −(/2m)∇2 + V (x, y, z) en un estado
estacionario descrito por una función de onda ψ(x, y, z),

ψ ∗ (x, y, z)Hψ(x, y, z) dx dy dz,
R3
sea un mı́nimo, estando sujeta la función de onda ψ(x, y, z) a la condición
habitual de normalización

|ψ(x, y, z)|2 dx dy dz = 1.
R3
Nota: las funciones ψ y ψ ∗ deben tratarse como independientes. Las derivadas
segundas del funcional que hay que considerar pueden convertirse en derivadas
primeras integrando por partes.
23 Un volumen dado de agua se encuentra dentro de un cilindro situado vertical-
mente en el campo gravitatorio, que rota con velocidad angular constante ω.
Calcúlese la forma que adopta la superficie del agua de manera que se minimice
la energı́a potencial total de la masa de agua.
24 Demuéstrese que dado el funcional
b
F[y(x)] = [p(x) y (x) − q(x) y 2 (x)] dx,
a
con p(x), q(x) funciones dadas, al determinar las funciones y(x) que hacen
F[y(x)] estacionario con las condiciones adicionales
b
y 2 (x) w(x) dx = 1, p(a) y (a) y(a) = p(b) y (b) y(b),
a
se llega a una ecuación del tipo Sturm-Liouville.
25 Determı́nese la ecuación que resulta al buscar la función ϕ(x) que hace esta-
cionario el funcional
b b
F[ϕ(x)] = K(x, y) ϕ(x) ϕ(y) dxdy,
a a
siendo el núcleo integral K(x, y) = K(y, x) una función conocida y estando la
función incógnita ϕ(x) sujeta a la condición de normalización
b
ϕ2 (x) dx = 1.
a
26 Supongamos que una onda sı́smica viaja a través de la Tierra (supuesta plana)
con una velocidad que es directamente proporcional a la profundidad. Calcúlese
la trayectoria que seguirá la perturbación para ir desde un punto A a otro B,
ambos arbitrarios y en el interior de la Tierra, con la exigencia de que el tiempo
de propagación sea mı́nimo.
27 Bajo determinadas aproximaciones (pequeñas desviaciones respecto a la posición
horizontal), se puede demostrar que las energı́as cinética y potencial de una
viga de longitud L, módulo de elasticidad K y densidad lineal < son
2 2 2
1 L ∂y(t, x) 1 L ∂ y(t, x)
T = <(x) dx, V = K dx.
2 0 ∂t 2 0 ∂x2
Usando el principio de mı́nima acción, determı́nese la ecuación diferencial en
derivadas parciales que rige el movimiento de la viga.
28 Hállense las curvas que en el campo de fuerzas definido por
F: (:r) = (X(:r ), Y (:r ), Z(:r )) con :r = (x, y, z),
hacen extremal el trabajo entre dos puntos cualesquiera :r0 y :r1 . ¿Pueden ser
arbitrarios estos dos puntos? ¿Qué ocurre si el campo admite función potencial?
29 Queremos determinar la forma del morro de un avión, supuesto dado por una
superficie de revolución que minimice la resistencia al avance en el seno de
un gas de densidad pequeña, a velocidad v. Si tomamos la dirección del
movimiento como eje x (en sentido negativo) y el morro como la superficie de
revolución alrededor del eje x con generatriz y = y(x) con y(0) = 0, y(l) = R,
encontrar el funcional la fuerza de resistencia, dependiendo de la forma y = y(x)
de la generatriz.
Resolver la ecuación de Euler-Lagrange haciendo la apro-

ximación 1 + (y (x))2 ≈ 1. (Nota: supóngase que el gas es ideal y que los
choques de las moléculas del mismo con el cuerpo son elásticos; asimismo,
supóngase que el cuerpo es “afilado”)
30 Entre todas las curvas que unen dos puntos dados A y B, encuéntrese aquella
que genera la superficie de revolución de área mı́nima cuando se gira en torno a
una recta r. Supóngase que esta recta no pasa por A ni B, y que las curvas no
cortan a r en ningún punto. Nota: sin pérdida de generalidad se puede elegir
r coincidente con el eje OX.
31 Consideremos una partı́cula material en una dimensión y de masa m. Encuén-
trense las ecuaciones de Lagrange en los siguientes casos:
a) La partı́cula está sometida a una fuerza F (x) = −kx.
b) Además de la fuerza anterior sometemos la partı́cula a una fuerza propor-
cional a la velocidad.
c) Además de las dos fuerzas anteriores, tenemos una fuerza periódica del tipo
F (t) = cos αt, con α constante.
d) Supongamos ahora que habita en un espacio tridimensional y que está some-
tida a una fuerza F: = −k:x. Hállense las ecuaciones de Lagrange.
e) Resuélvanse las ecuaciones de Lagrange en los cuatro casos anteriores.
32 Hállense las geodésicas del cono circular z 2 = a2 (y 2 + x2 ). Pruébese que
cualquier geodésica sobre una rama del cono tiene la siguiente propiedad: si la
rama se corta desde el vértice a lo largo de un generador y la superficie del cono
se desarrolla hasta que constituya una superficie plana, la geodésica se convierte
en una recta. (Nota: si [r, ψ, z] son las coordenadas con que describimos el cono
y [<, ϕ] son coordenadas polares en la superficie plana, antes de demostrar la
propiedad pedida muéstrese que < = r(1 + a2 )1/2 y ϕ = ψ/(1 + a2 )1/2 ).
33 Problema de Kelvin: supongamos que en el plano XOY está distribuı́da una
masa de densidad continua µ(x, y) y supongamos que se tiene en el plano una
curva Γ suave a trozos y dos puntos P1 y P2 sobre la misma. Entre todas las
curvas C de longitud fija L que unen estos puntos, hállese la que, conjuntamente
con el arco P1 P2 de la curva Γ, forme un recinto D de masa máxima. Los puntos
P1 y P2 pueden coincidir. Nota: utilı́cese el hecho de que la curvatura de una
curva plana descrita paramétricamente es:
|ẋÿ − ẍẏ|
k= .
(ẋ2 + ẏ 2 )3/2
34 En uno de los numerosos viajes que el doctor Zarkov efectuó con Flash Gordon
más allá de los lı́mites del universo conocido, detectó la existencia de un uni-
verso bidimensional asentado sobre una superficie elipsoidal que quedaba bien
descrita por la ecuación:
x2 + y 2 z2
+ = 1, (R = cte. > 0), (a = cte. ≈ 1),
R2 (aR)2
donde a era una constante de valor muy próximo a 1. El doctor Zarkov se

sentı́a intrigado por conocer qué forma adoptarı́an en este universo los rayos
luminosos que, partiendo de un sol S, alcanzan un planeta P .
P
x
Encontró evidencias de que en dicho universo se verificaba el principio de Fer-

mat y de que el ı́ndice de refracción era constante en toda su extensión (igual
a un valor n0 ), pero no supo hallar las trayectorias de la luz pues no dominaba
las técnicas del cálculo variacional. Ayúdele a calcular e interpretar las trayec-
torias de los rayos luminosos en dicho universo.

FM03Tema1 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

FM03Tema1 PDF

Cargado por

Copyright:

Formatos disponibles

INTRODUCCION AL CALCULO VARIACIONAL

Versión 3. Original 1 Marzo 1998, basado en notas de M. Gadella. Revisión y adición

Problemas Variacionales en Fı́sica

El principio de mı́nima acción.

El principio de mı́nima acción dice: entre todos los movimientos imagina-

Ası́ pues, el principio de Fermat reduce el problema de encontrar la trayectoria

El tiempo invertido en llegar desde el punto de coordenada x al punto de coorde-

y el tiempo total invertido en llegar desde el punto P al punto Q a lo largo de la

En vista del resultado indicado en el ejercicio, podemos plantear formalmente

Derivación ‘a la Feynmann’ de las ecuaciones de Euler-La-

de manera que la condición de mı́nimo es:

La idea es construir una familia uniparamétrica de movimientos cercanos a

Sh(t) (") := S[x0 (t) + "h(t)]

y que debe tener un mı́nimo en " = 0, lo que implica:

Efectuando la derivación con respecto a " y evaluando en " = 0 lo que se encuentra

y en consecuencia la condición de que la función sh(t) (") tenga un mı́nimo en " = 0

que por supuesto es simplemente la ecuación de Newton que gobierna el movimien-

Introducción a las Matemáticas del Cálculo Variacional

la recta real R, y por tanto encajan dentro de la deﬁnición general de función,

||f || = sup |f (x)| + sup |f (x)|. (1)

La norma f k está deﬁnida en el espacio C k [a, b] de funciones continuas y con derivadas

Vamos ahora a introducir un funcional F de un tipo particular, que ha sido

Es claro que M sı́ que es es un subespacio vectorial. Todo entorno de f en D(F)

f (x + h) − f (x) = dfx (h) + "(x, h)h,

es decir, dfx es una función lineal de h = (h1 , h2 , . . . , hn ) cuyos coeﬁcientes son

|F(f ) − F(g)| < ". Equivalentemente si limg→f F(g) = F(f ). Un funcional es

Deﬁnición. Diremos que un funcional F es diferenciable en la función f ∈

F(f + h) − F(f ) = δFf (h) + E(f, h) h

donde E(f, h) → 0 cuando h → 0.

• Para el funcional dado en (2-3), la expresión explı́cita de la variación primera

Conviene notar que el papel de las n derivadas parciales de la función F eval-

variable x. Esta analogı́a motiva la introducción de la idea de derivada variacional

expresión que permite escribir la variación primera en la forma:

En el resto de estas notas no usaremos explı́citamente la idea de derivada varia-

Pasemos a indicar las demostraciones de estos resultados.

F (f + h) − F (f ) = ϕ1 (h) + 1 (h, f ) h = ϕ2 (h) + 2 (h, f ) h

En la primera de las fórmulas h ∈ U , mientras que en la segunda h ∈ U siendo U y

Teorema. Sea F un funcional diferenciable. Una condición necesaria para

F (f + h) − F (f ) = ϕ(h) + (h, f )h

Escojamos h0 ∈ M arbitrario en M. Para λ suﬁcientemente pequeño en valor abso-

λ δFf (h0 ) F (f + λh0 ) − F (f )

mientras que en la segunda lo que resulta es

Tomando ahora los lı́mites λ → 0+ , λ → 0− y recordando que E(f, λh0 ) → 0 cuando λ →

Variación primera y ecuación de Euler-Lagrange

donde A, B son constantes ﬁjas y la función Φ(x, y, z) : R3 → R admite derivadas

(|h| + |h |)2 = |h|2 + |h |2 + 2|hh | ≥ |h|2 + |h |2 = h2 + (h )2

Ası́ pues, queda probado que F es diferenciable y que su variación primera en

Sustituyendo en la expresión para la variación primera del funcional F se obtiene

para cualquier h ∈ M, esto es, satisfaciendo las condiciones h(a) = h(b) = 0.

Entonces γ(x) es una constante.

Entonces β(x) es diferenciable y β (x) = α(x); ∀x ∈ [a, b].

Pero la misma integral puede calcularse también sustituyendo H (x) = γ(x) − C:

Esta es la llamada ecuación de Euler-Lagrange, ecuación diferencial para la función

funciones en las que la primera variación δFf se anula idénticamente. Además

• Ejercicio 6. En ocasiones, la función Φ no depende explı́citamente de x. Demostrar que

de Euler-Lagrange. En el caso del principio de mı́nima acción, en el que el funcional accion

• Ejercicio 7. Escribir las ecuaciones de Euler-Lagrange para el problema de la braquis-

Extremales que no sean de clase C 1

Variación segunda de un funcional

f en el punto f (x). En cualquier texto de análisis matemático pueden encontrarse las

• Si la función f tiene un mı́nimo en el punto x, entonces en el punto x la diferencial

• La expresión explı́cita de la diferencial segunda dfx2 es:

Pasamos ahora a discutir la situación con funcionales:

f (x + h) − f (x) = dfx (h) + "(x, h)h,

F(f + h) − F(f ) = δFf (h) + E(f, h) h

donde E(f, h) → 0 cuando h → 0.

F (f + h) − F (f ) = ϕ1 (h) + 1 (h, f ) h = ϕ2 (h) + 2 (h, f ) h

F (f + h) − F (f ) = ϕ(h) + (h, f )h

F (f + h) − F (f ) = δ 2 Ff (h) + (f, h) ||h||2 .

F (f + h) − F (f ) ≥ {K + (f, h)} ||h||2 ,

con (f, h) → 0 para h → 0. En particular, si h es suﬁcientemente cercano al cero en M,

F(f1 + h1 , . . . , fn + hn ) − F(f1 , . . . , fn ) = ϕf (h) + E(f , h) h,

Derivando con respecto a " en Ah, y evaluando en " = 0 la condición anterior