Está en la página 1de 205

Repaso de análisis complejo

Derivada e integral complejas. Función analı́tica


Se introduce la generalización al plano complejo de los conceptos de derivada e integral y se enuncian las
consecuencias más relevantes.

Definición: Una función compleja f (z) de variable compleja z se define como una aplicación

f: C ! C
z 7! f (z)

Comentarios:

Una función compleja se puede asociar con un campo vectorial real bidimensional en el plano: si se intro-
ducen las partes reales e imaginarias como

x := Re z, y := Im z, u := Re f, v := Im f,

se pueden definir los vectores tridimensionales

r := (x, y, 0), A := (u, v, 0), E := (u, v, 0), B := (v, u, 0),

que son en realidad bidimensionales, porque la tercera componente es nula siempre. Entonces la función
compleja f (z) se puede asociar a algún campo vectorial, por ejemplo,

A(r) = (u(x, y), v(x, y), 0), E(r) = (u(x, y), v(x, y), 0), B(r) = (v(x, y), u(x, y), 0).

Algunos ejemplos:

f (z) = z + z ⇤ , u = 2x, v = 0 ) A(r) = E(r) = (2x, 0, 0), B(r) = (0, 2x, 0).

f (z) = ez = ex [cos y + i sen y] , u = ex cos y, v = ex sen y


) A(r) = (ex cos y, ex sen y, 0) E(r) = (ex cos y, ex sen y, 0) B(r) = (ex sen y, ex cos y, 0).

Surge entonces la pregunta de cuál es la diferencia entre funciones complejas y campos vectoriales bidi-
mensionales: la diferencia radica en que se puede definir el cociente de números complejos, mientras que no
existe la noción de “división de vectores”. Esto permite introducir conceptos sin análogo vectorial, siendo
el más relevante el de la derivada de una función compleja:

f (z) f (z0 )
f 0 (z0 ) := lı́m .
z!z0 z z0
Este concepto generaliza la definición de la derivada para funciones reales de variable real y representa el
punto de partida para construir el análisis complejo (derivadas, integrales y desarrollos en potencias en el
plano complejo).

1
2 c Alvaro Domı́nguez, Univ. Sevilla

Definición: [2, p.90], [3, p.608] Una función compleja f (z) de variable compleja z se dice analı́tica (también se
dice holomorfa) en el punto z0 si existe el lı́mite

f (z) f (z0 ) f
f 0 (z0 ) := lı́m = lı́m .
z!z0 z z0 z!0 z

La función se denomina analı́tica u holomorfa en un dominio abierto D ⇢ C si lo es en cada uno de los puntos
del dominio.
Comentarios: se escribe el número complejo z := z z0 = "ei' , esto es, en forma polar con módulo " 0 y
fase ' 2 [0, 2⇡). Entonces se tiene
f (z0 + "ei' ) f (z0 )
f 0 (z0 ) := lı́m .
"!0 "ei'
La existencia de este lı́mite significa tanto que f 0 (z0 ) es finito como que no depende del valor arbitrario de
la fase '. Esta representa la dirección a lo largo de la cual el punto z se aproxima a z0 : en el caso real solo
hay dos direcciones (por la derecha o por la izquierda), mientras que en el caso complejo hay una infinidad de
posibilidades. Esta infinidad es la causa de que el concepto de derivada en el plano complejo sea mucho más
restrictivo que en el eje real, como ponen de manifiesto los siguientes resultados:

Teorema: [2, p.88], [3, p.606] Supongamos que la función f (z) = u(x, y) + iv(x, y) es derivable como campo
vectorial real de dos variables reales, es decir, que existen las derivadas @u/@x, @u/@y, @v/@x, @v/@y. Entonces,
f (z) es analı́tica si, y solo si se verifican las ecuaciones de Cauchy–Riemann:

@u @v @v @u
= , = .
@x @y @x @y

Demostración: Como existen las derivadas de las partes real e imaginaria, se puede escribir

f u(x + " cos ', y + " sen ') u(x, y) v(x + " cos ', y + " sen ') v(x, y)
lı́m = e i' lı́m +i
z!0 z "!0 " "
 ✓ ◆
@u @u @v @v
= e i' lı́m cos ' + sen ' + i cos ' + sen '
"!0 @x @y @x @y
✓ ◆  ✓ ◆  ✓ ◆
2 cos ' = ei' + e i' 1 @u @v @v @u 1 @u @v @v @u
i' i' = + +i + e 2i' +i + .
2i sen ' = e e 2 @x @y @x @y 2 @x @y @x @y

Para que esta expresión no dependa de la fase arbitraria ', se debe anular el factor que acompaña al término e 2i' , lo cual es
precisamente la condición de Cauchy–Riemann. Aplicando las ecuaciones de Cauchy–Riemann a esta expresión, se obtienen dos
formas equivalentes de calcular la derivada:
8
> @u @v
>
> +i correspondiente a tomar z = x,
f < @x @x
lı́m =
z!0 z > @v
> @u
>
: i correspondiente a tomar z = i y,
@y @y
es decir, tomando el lı́mite a lo largo del eje real o del imaginario, respectivamente.

Teorema: [2, p.102], [3, p.631] Una función analı́tica posee derivadas de orden arbitrario.

Definición: [3, p.616] Se define la integral de una función compleja f (z) a lo largo de un camino C en el plano
complejo como la expresión
Z Z Z Z Z Z
dz f (z) := (dx + idy) (u + iv) = (u dx v dy) + i (v dx + u dy) = dr · E + i dr · B,
C C C C C C

expresada como circulaciones a lo largo del camino de los campos vectoriales E := (u, v, 0) y B := (v, u, 0),
respectivamente.
c Alvaro Domı́nguez, Univ. Sevilla 3

Teorema de Cauchy: [2, p.98], [3, p.618] Si la función f (z) es analı́tica en un dominio abierto y simplemente
conexo1 D, entonces
I
dz f (z) = 0, 8C = camino cerrado dentro del dominio D.
C

Demostración: por las ecuaciones de Cauchy–Riemann (C-R), los campos vectoriales E, B introducidos antes son conservativos:

ex ey ez ex ey ez
C-R C-R
r⇥E= @x @y @z = ez (@x v + @y u) = 0, r⇥B= @x @y @z = ez (@x u @y v) = 0.
u v 0 v u 0
Por tanto, como el dominio es simplemente conexo, la circulación de estos campos alrededor de cualquier camino cerrado dentro del
dominio se anula, ası́ que I I I
dz f (z) = dr · E + i dr · B = 0.
C C C

Corolario: si tenemos un camino abierto Cz0 !z que conecta un punto fijo z0 y otro arbitrario z, tiene sentido
definir la función Z
g(z) := d⇠ f (⇠),
Cz0 !z

pues no depende del camino que una z0 con z, sino solo de los puntos extremos. Esta función verifica además
g 0 (z) = f (z), es decir, es también analı́tica y, por tanto, también verifica el teorema de Cauchy y se puede
integrar. Ası́ pues, la conclusión final es que si f (z) es analı́tica, se puede derivar o integrar tantas veces como
se quiera.

Fórmula de Cauchy: [2, p.99], [3, p.630] Si f (z) es una función analı́tica en un dominio abierto y simplemente
conexo D, entonces se verifica
I
1 f (⇠)
f (z) = d⇠ , 8z 2 D, 8C = camino cerrado antihorario dentro del dominio D.
2⇡i C z ⇠

Comentarios:

El camino debe ser cerrado y recorrido en sentido antihorario.

Este resultado ejemplifica lo restrictiva que es la propiedad de analiticidad: el conocimiento de la función


f (z) a lo largo de un camino cerrado es suficiente para reconstruir la función en todo el interior del camino.

Singularidades. Desarrollos en serie


Se discuten algunos tipos de singularidades y la representación de una función mediante un desarrollo en serie.

Definición: [2, 108-110], [3, p.637] Sea una función compleja f (z) de variable compleja z que es analı́tica en un
entorno del punto z0 , pero no necesariamente en ese punto. Entonces, solo se puede dar alguno de los siguientes
tres casos excluyentes (teorema de Casorati–Weierstrass):

La función es analı́tica también en el punto z0 si lı́mz!z0 |f (z)| es finito.

La función posee un polo de orden N en el punto z0 si lı́mz!z0 |f (z)| = +1 pero la función (z z0 )N f (z)
es analı́tica en z0 , esto es, si lı́mz!z0 |(z z0 )N f (z)| es finito.

La función posee una singularidad esencial si no existe lı́mz!z0 |f (z)|.

Comentarios:
1 Recordemos que un dominio es simplemente conexo si no posee agujeros y cualesquiera dos puntos del mismo se pueden conectar

por un camino completamente contenido en ella. La condición de que el dominio sea abierto excluye la frontera del dominio.
4 c Alvaro Domı́nguez, Univ. Sevilla

Ejemplo: los cocientes de polinomios tienen polos. Ası́, la función


 2
1 1
f (z) = =
z 2 (z 2 1)2 z(z 1)(z + 1)

tiene un polo de segundo orden en z = 1, porque su módulo verifica


 2
p 1 1 z!1
|f (z)| = f (z)f ⇤ (z) = = ! +1
zz ⇤ (z 1)(z ⇤ 1)(z + 1)(z ⇤ + 1) |z||z 1||z + 1|

pero la función
1 z!1 1
(z 1)2 f (z) = !
z 2 (z + 1)2 4
es analı́tica en z = 1.
2
Ejemplo: la función f (z) = e1/z tiene una singularidad esencial en z = 0: escribiendo z = Rei' en forma
polar, resulta

2 2i'
)/R2 2 2 2 2 +1 si cos 2' > 0,
e1/z = e(e = e(cos 2')/R e i(sen 2')/R ) lı́m e1/z = lı́m e(cos 2')/R =
z!0 R!0 0 si cos 2' < 0,

es decir, el lı́mite no existe.

Los polos y las singularidades esenciales se denominan singularidades aisladas, porque están completamente
rodeadas por un entorno donde la función es analı́tica. Por tanto, el teorema establece que, si existen una
singularidad de otro tipo, entonces no puede estar aislada. Los ejemplos más simples son el logaritmo y las
potencias no enteras:
ln z
f (z) = ln z, f (z) = z = e , con 6= 0, ±1, ±2, . . .

Estas funciones poseen en z = 0 un punto de ramificación, correspondiente a una lı́nea de singularidades


desde z = 0 hasta el infinito. Ası́, el logaritmo y las potencias no enteras no están definidos en todo el eje
real negativo: introduciendo la representación polar del número z se puede escribir

z = Rei' ) ln z = ln R + i',

de manera que el logaritmo es discontinuo en el eje real negativo porque se puede tomar tanto ' = ⇡ (nos
aproximamos “desde arriba”) como ' = ⇡ (nos aproximamos “desde abajo”).

Teorema: [2, p.112], [3, p.636] si la función f (z) es analı́tica en un disco centrado en el punto z0 (es decir, en
el peor caso z0 es una singularidad aislada), entonces la función se puede representar de manera única mediante
una serie de Laurent,
1
X a 2 a 1
f (z) = an (z z0 ) n = · · · + + + a0 + a1 (z z0 ) + a2 (z z0 ) 2 + · · · ,
n= 1
(z z0 )2 z z0

Los coeficientes de la serie vienen dados por la expresión


I
1 f (⇠)
an = d⇠
2⇡i C (⇠ z0 )n+1

para cualquier camino cerrado C dentro del disco y que rodea el punto z0 en sentido antihorario. Más aún:
c Alvaro Domı́nguez, Univ. Sevilla 5

Si la función es analı́tica también en el punto z0 , entonces la representación solo posee potencias no


negativas,
1
X
f (z) = an (z z0 )n = a0 + a1 (z z0 ) + a2 (z z0 )2 + · · ·
n=0

y los coeficientes se pueden calcular como


1 dn f
an = (z0 ).
n! dz n
Es decir, se trata de una serie de Taylor o de potencias.

Si el punto z0 es un polo de orden N , entonces la serie de Laurent solo tiene N potencias negativas,
1
X a N a N +1 a 1
f (z) = an (z z0 ) n = + + ··· + + a0 + a1 (z z0 ) + a2 (z z0 ) 2 + · · ·
(z z0 ) N (z z0 ) N 1 z z0
n= N

Si el punto z0 es una singularidad esencial, la serie de Laurent tiene infinitas potencias negativas.

Comentario: el teorema enfatiza que la función se puede representar de manera única como una serie (de Laurent
en general, de Taylor si es analı́tica en z0 ) en todo un disco. El tamaño de este disco viene limitado por las
condiciones del teorema, esto es, que la función sea analı́tica en su interior (excepto, quizás, en z0 ). Se denomina
radio de convergencia R de la serie alrededor de z0 al máximo valor de |z z0 | tal que la serie converge a la
función.
Ejemplos:

1. Las funciones elementales (potencia, cociente de polinomios, exponencial, logaritmo, funciones trigonométri-
cas) son analı́ticas en casi todos los puntos del plano. A continuación algunas series de Taylor con su radio
de convergencia:
1 ✓ ◆
X ✓ ◆
( 1) ( 1) · · · ( n + 1)
(1 + z) = zn = 1 + z + z2 + . . . , := , |z| < 1,
n=0
n 2! n n!

1
X
1
= ( 1)n z n = 1 z + z2 ..., |z| < 1,
1 + z n=0
X1
z 1 n z2 z3
e = z =1+z+ + + ··· , |z| < 1,
n=0
n! 2 6
X1
( 1)n+1 n z2 z3
ln(1 + z) = z =z + ··· , |z| < 1,
n=1
n 2 3

X1 1
X X1
(iz)n 1 1
cos z + i sen z = eiz = = (iz)2k + (iz)2k+1
n=0
n! (2k)! | {z } (2k + 1)! | {z }
| {z } k=0 ( 1)k z 2k
k=0
( 1)k iz 2k+1
par+impar
X1 X1
( 1)k 2k ( 1)k 2k+1
= z +i z , |z| < 1.
(2k)! (2k + 1)!
k=0 k=0
| {z } | {z }
cos z sen z

2. La función
1
f (z) =
z 2 (z 2 1)2
6 c Alvaro Domı́nguez, Univ. Sevilla

que posee un polo de segundo orden en z = 1, se puede representar como sigue (este ejemplo ilustra cómo
emplear los desarrollos anteriores para obtener el desarrollo alrededor de z = 1):
 2  2
1 1 1 1 1 1 1
= = =
z 2 (z 2 1)2 2 2
z (z 1) (z + 1) 2 2
(z 1) z(z + 1) (z 1) z 2 z+1
 2
1 1 1 1
=
(z 1)2 1 + (z 1) 2 1 + (z 1)/2
✓ ◆ "1 1 ✓ ◆n # 2
|z 1| < 1 1 X 1 X z 1
= ( 1)n (z 1)n ( 1)n
|z 1| < 2 (z 1)2 n=0 2 n=0 2
"1 ✓ ◆ # 2
1 X 1
n n
= ( 1) 1 (z 1)
(z 1)2 n=0 2n+1
 2
1 1 3 7 2
= (z 1) + (z 1) + · · ·
(z 1)2 2 4 8

1 1 3 23
= 2
(z 1) + (z 1)2 + · · ·
(z 1) 4 4 16
1 3 23
= + + ···
4(z 1)2 4(z 1) 16

2
3. La función f (z) = e1/z , que tiene una singularidad esencial en z = 0, se puede representar como

X1
1/z 2 1 2n 1 1
e = z =1+ + 4 + ···
n=0
n! z2 2z

Teorema: [3, p.632-635] Las series de Taylor de funciones analı́ticas se pueden sumar, multiplicar, derivar e
integrar término a término dentro de su intervalo de convergencia.
Es decir, una serie de Taylor se puede manipular como si fuera un polinomio dentro de su intervalo de conver-
gencia. Se trata de una afirmación no trivial porque la serie es una suma infinita y establece que es irrelevante
el orden en que se evalúan esta suma infinita y la correspondiente operación (suma, multiplicación, derivación o
integración).

Serie de Taylor para funciones reales: el concepto de serie de Taylor también tiene sentido para funciones
reales de variable real y se empleará para representar soluciones de EDOs que no se pueden resolver explı́citamente
en términos de funciones elementales. Sin embargo, la extensión al plano complejo es necesaria para entender
completamente el comportamiento de este tipo de series:
1. Supongamos que la función compleja de argumento complejo f (z) es analı́tica en el punto real z = x0 y en
un entorno (complejo) del mismo, de manera que se puede escribir
1
X
f (z) = an (z x0 ) n , |z x0 | < R.
n=0

Entonces es evidente que las dos funciones reales u(x) := Re f (z = x), v(x) := Im f (z = x) de argumento
real x también se pueden expresar como series de potencias,
1
X 1
X
n
u(x) = (Re an ) (x x0 ) , v(x) = (Im an ) (x x0 ) n ,
n=0 n=0

en un intervalo no nulo 0 < |x x0 | < R.


c Alvaro Domı́nguez, Univ. Sevilla 7

2. De hecho, se verifica también el resultado inverso: si la función real y(x) de argumento real x se puede
representar como una serie de Taylor,
1
X
y(x) = an (x x0 ) n , 0 < |x x0 | < R, an 2 R,
n=0

entonces la función compleja definida como


1
X
f (z) = an (z x0 ) n , 0 < |z x0 | < R,
n=0

es analı́tica. Este resultado permite decir que una función real es analı́tica si se puede representar mediante
una serie de Taylor, y de hecho el concepto de analiticidad, propio de funciones complejas, es útil para en-
tender el desarrollo de Taylor de funciones reales de variable real, aunque no todos los resultados complejos
son extrapolables al caso real. Los siguientes ejemplos ilustran esto:
3. Consideremos la función real y(x) = 1/(1+x2 ), que existe en todo el eje real. Su serie de potencias alrededor
del origen es
X1
1
= ( 1)n x2n ,
1 + x2 n=0
pero tiene un radio de convergencia unidad, como se comprueba empleando el criterio del cociente:
x2n+2 !
lı́m = |x|2 < 1,
n!1 x2n
es decir, esta serie no puede representar la función en puntos fuera del intervalo 1 < x < 1: ¿por qué sucede
esto, si la función original sı́ existe en todo el eje real? Para entender la respuesta, hay que considerar la
función compleja f (z) := y(z) = 1/(1 + z 2 ), que tiene el mismo desarrollo de Taylor alrededor de z = 0. Sin
embargo, f (z) tiene polos en z = ±i, de manera que el disco de convergencia de la serie es necesariamente
|z| < 1.
1/x2
4. Consideremos la función y(x) = e , que está definida en todo el eje real y es infinitamente derivable
(como función real):
 ✓ ◆
2 6 4 1
y 0 (x) = y(x), y 00 (x) = + 6 y(x), ... y (n) (x) = polinomio en ⇥ y(x).
x3 x4 x x
Por tanto, los coeficientes de la serie de Taylor alrededor de x = 0 están bien definidos,

y (n) (x)
an = lı́m
= 0,
x!0 n!
P1
pero conducen a una serie que no representa la función, n=0 an xn ⌘ 0. La razón es que la función compleja
2
f (z) := y(z) = e 1/z posee una singularidad esencial en z = 0 y por tanto solo se la puede representar
mediante una serie de Laurent. Este ejemplo ilustra que una función real infinitamente derivable no es
necesariamente analı́tica.

Definición: el residuo de una función f (z) en el punto z0 , denotado Res f (z0 ) o Resz0 , es el coeficiente a 1 de
la serie de Laurent de la función f (z) alrededor del punto z0 .

Teorema de los residuos: si la función f (z) es analı́tica en el contorno cerrado C y en todos los puntos
interiores del mismo excepto en los polos z1 , z2 , · · · zM , entonces
I M
X
dz f (z) = 2⇡i Reszn ,
C n=1
8 c Alvaro Domı́nguez, Univ. Sevilla

cuando C se recorre en sentido antihorario. Se trata de una extensión del teorema de Cauchy, pues cuando la
función es analı́tica en todos los puntos, sus residuos son nulos (la serie de Laurent se reduce a una serie de
Taylor).
Demostración: Construimos el nuevo contorno Cˆ que coincide con C pero que además incluye circunferencias Kn
de radio " ! 0 centradas en cada polo zn ; como todos se recorren en sentido antihorario, se puede escribir
C = Cˆ [ K1 [ K2 [ · · · [ KM .
Por lo tanto,
I I M I
X
dz f (z) = dz f (z) + dz f (z).
C Ĉ n=1 Kn

Dentro del nuevo contorno C, ˆ la función f (z) es analı́tica y por tanto la integral sobre el mismo se anula. Para
las otras integrales podemos usar las series de Laurent para representar f (z) como sigue: llamando " al radio de
las circunferencias Kn , que será suficientemente pequeño para que no se solapen, se puede escribir
z 2 Kn ) s := z zn = "ei' , 0  '  2⇡.
I I I 1
X 1
X I 1
X Z 2⇡
dz f (z) = ds f (zn + s) = ds an s n = an ds sn = an d' i" ei' "n ein'
Kn Kn Kn n= 1 n= 1 Kn n= 1 0
1
X Z 2⇡
= i an "n+1 d' ei(n+1)' .
n= 1 0

Ahora bien, si n = 1 se tiene la integral angular


Z 2⇡
d' = 2⇡,
0

mientras que si n 6= 1, se tiene


2 3
Z 2⇡ 2⇡
1 1 4 ei2⇡(n+1)
d' ei(n+1)' = ei(n+1)' = 15 = 0.
0 i(n + 1) 0 i(n + 1) | {z }
cos 2⇡(n+1)

Por tanto, el único término que contribuye de la serie es n = 1, es decir, el del residuo a1 . En conclusión,
I I XM I XM
dz f (z) = dz f (z) + dz f (z) = 2⇡i Reszn .
C Ĉ Kn
| {z } n=1 | {z } n=1
0 2⇡ia 1

Ejemplo: Calcular la integral


8
I izk < LR = {z = x | R  x  +R} ,
e +
dz , k > 0, C = L R [ KR ,
z2 + 1 : +
C KR = z = Rei' | 0  '  ⇡ .
El integrando es analı́tico en todo el plano complejo excepto en dos polos simples en z = ±i,
eizk eizk
= .
z2 +1 (z i)(z + i)
El camino C solo encierra el polo en z = i. Por tanto, se verifica
I I ⇢ Z 2⇡ i'
eizk eizk z = i + "ei' e k eik" e
dz 2 = dz 2 = i' = d' i" ei'
C z +1 Kz=i z +1 dz = i" e d' 0 (i + " ei' )2 + 1
Z 2⇡ Z 2⇡
"!0 e k (1 + ik"ei' + · · · ) 1
= d' i" ei' i' 2 2i'
= e k d' = ⇡e k .
0 2i" e + " e 2 0
c Alvaro Domı́nguez, Univ. Sevilla 9

Continuación analı́tica: [3, p.639] como se ha visto, la serie de Laurent (o de Taylor) define una función
analı́tica en el disco de convergencia de la serie. La continuación analı́tica es el procedimiento que permite
construir la función más allá de este disco. Sea pues la función analı́tica f (z) (excepto quizás en z0 ) definida por
una serie alrededor de z0 y radio de convergencia R0 , esto es, en el disco |z z0 | < R0 . Con esta información,
es posible deducir la serie de potencias de f (z) alrededor de cualquier otro punto z1 dentro del disco (esto es,
0 < |z1 z0 | < R0 ), puesto que los coeficientes está dados de manera única por las derivadas de f (z) en z1 , las
cuales existen por analiticidad. Esta nueva serie convergerá en otro disco |z z1 | < R1 , que contendrá en general
puntos que no estaban en el disco original, es decir, se ha podido obtener f (z) en puntos fuera del disco original.
Por reiteración del procedimiento, se puede ir extendiendo la función analı́tica f (z) de manera única más allá de
la región original de definición. Esto no significa que la función vaya a ser analı́tica en todo el plano complejo,
pues podrá ocurrir que la función ası́ construı́da tenga singularidades. Por ejemplo, la función f (z) = 1/(1 + z)
tiene un desarrollo de Taylor alrededor de z = 0 y convergente en el disco |z| < 1, el cual se puede continuar
analı́ticamente a todo el plano complejo excepto al punto z = 1, donde existe un polo.
Tema 6

Transformadas integrales.
Distribuciones

En general, se define la transformada integral de una función g(t) como la expresión


Z b
G(s) := dt K(t, s)g(t),
a

donde K(t, s) se denomina núcleo de la transformación. El núcleo, junto con los lı́mites a y b, definen comple-
tamente la transformación. La notación G(s) enfatiza la dependencia con la nueva variable independiente s. Sin
embargo, la transformada integral se interpreta también como un funcional o “función de función”, ya que se
trata la función g(t) como un todo y depende no solo de sus valores en algunos puntos: para enfatizar el carácter
de funcional, emplearemos la notación F[g] (“función de la función g”):

F[·] : S ! Ŝ
g 7 ! G = F[g]

donde S, Ŝ son espacios funcionales (es decir, conjuntos de funciones). Una transformada normalmente sólo es
útil si de algún modo contiene “la misma información” que la función original g(t), es decir, si la transformada
es invertible: el conocimiento de G(s) permite reconstruir g(t), es decir, existe el funcional inverso: F 1 [G] = g.
Cuando esto es ası́, se puede entender la transformada integral como un “cambio de variables” o también como
otra forma de representar o de definir la función, que se añade a las que ya hemos visto (como solución de una
EDO, como una serie de potencias) o que veremos (como una serie de funciones). En este tema se verán dos tipos
de transformada integral (de Fourier y de Laplace, respectivamente) y cómo se emplean para resolver ecuaciones
diferenciales lineales (ordinarias o parciales) y para manipular las denominadas “distribuciones” o “funciones
generalizadas”.

6.1. Transformada de Fourier


6.1.1. Definición e inversión

Definición: sea g(x) una función definida para 1 < x < +1. Se denomina transformada de Fourier de la
función g a la expresión (VP significa valor principal )
Z +1 Z +R
ikx
F[g] := G(k) := VP dx g(x)e = lı́m dx g(x)e ikx , siendo k 2 R.
1 R!1 R

La transformada de Fourier G(k) es un número complejo incluso si g(x) es real. Se trata de un funcional de
g(x) con un núcleo de funciones trigonométricas y tiene la forma de una integral impropia dependiente de un

1
2 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

parámetro real k: Z Z
+1 +1
G(k) = dx g(x) cos kx i dx g(x) sen kx.
1 1

Definición: sea G(k) la transformada de Fourier de la función g(x). Se define la transformada inversa de Fourier
como Z +1 Z +R
dk dk
F 1 [G] := VP G(k)eikx = lı́m G(k)eikx .
1 2⇡ R!1 R 2⇡
Comentarios:
1
La (casi) simetrı́a de las transformadas directa e inversa implica que las propiedades matemáticas de F [G]
son similares a las de F[g].
El signo del exponente ikx en la transformada directa es convencional: se puede tomar positivo, pero
entonces será negativo en la expresión de la transformada inversa. También la posición del factor 1/(2⇡) es
convencional: lo importante es que el producto de los prefactores deber ser 1/(2⇡). Ası́, otras definiciones
que se emplean con frecuencia son
Z +1 Z +1
dx ikx 1 dk
F[g] = p g(x)e , F [G] = p G(k)eikx ,
1 2⇡ 1 2⇡
y Z +1 Z +1
dx ikx 1
F[g] = g(x)e , F [G] = dk F (k)eikx .
1 2⇡ 1

Algunas definiciones auxiliares que se necesitarán:

Definición: una función g(x) se dice absolutamente integrable en el eje real si existe la integral
Z +1
dx |g(x)|.
1

Básicamente, la integrabilidad absoluta impone que la función no tenga singularidades demasiado fuertes
2
g(x) = xe x es absolutamente integrable,
y que se anule en el infinito con suficiente rapidez. Por ejemplo, p
g(x) = 1/x3 no lo es debido a la divergencia en x = 0, g(x) = 1/ |x| no lo es porque en el infinito se anula
muy despacio.
Recordatorio: la integral de g(x) converge en el infinito si decae más rápido que 1/x, y diverge si decae
más despacio que 1/x. La integral de g(x) en un punto finito converge si tiene una singularidad más débil
que 1/x, y diverge si es más fuerte que 1/x.

Definición: una función g(x) se dice cuasicontinua en un intervalo cerrado [a, b] si posee como mucho un
número finito de discontinuidades evitables o de discontinuidades de primera especie. Se dice cuasicontinua
en todo el eje real si lo es en cualquier intervalo finito.
Ejemplos: las siguientes funciones son cuasicontinuas en [ 1, 1]:

1, x < 0,
g(x) = x, g(x) = g(x) = signo cos 2⇡x.
+1, x > 0,
Las siguientes funciones no son cuasicontinuas en [ 1, 1]:
1
g(x) = (discontinuidad de segunda especie en x = 0),
x
1
g(x) = (discontinuidad de segunda especie en el extremo x = 1),
x 1
1
g(x) = signo cos (infinitas discontinuidades de primera especie).
x
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 3

Comentario: sea g(x) cuasicontinua, y construyamos la función g 0 (x). Evidentemente, g 0 (x) no estará
definida en los puntos donde g(x) sea discontinua, pero sigue teniendo sentido hablar de las derivadas
laterales, según nos aproximemos a la discontinuidad por la derecha o por la izquierda: si ambas derivadas
laterales existen, entonces la función g 0 (x) tendrá discontinuidades evitables o de primera especie donde
las tenga g(x). Si además g 0 (x) existe en todos los puntos donde g(x) es continua, entonces g 0 (x) también
será cuasicontinua.

Teorema: , , , si la función g(x) es cuasicontinua y absolutamente integrable en el eje real, entonces existe su
transformada de Fourier G(k) para cualquier k real. Si además también g 0 (x) es cuasicontinua en el eje real,
entonces su transformada inversa verifica
8
>
< g(x), si g(x) continua en x,
1
F [G] =
: 1 [g(x+ ) + g(x )], si g(x) discontinua en x.
>
2
Comentarios:
La transformada inversa es pues igual a la función original en los puntos donde esta es continua y al punto
medio del salto donde es discontinua. Se utiliza la notación g ' F 1 [G] para indicar que la igualdad se
cumple para casi todos los valores de x, es decir, donde g(x) es continua. Sin embargo, esta notación solo se
empleará cuando sea necesario enfatizar este aspecto. Por lo general, escribiremos simplemente g = F 1 [G]
cuando no sea relevante la diferencia en los puntos de discontinuidad. Por tanto, simbólicamente podemos
escribir
F 1 [F[g]] = g , F 1 [F[·]] = funcional identidad.

El teorema establece básicamente que la transformada G(k) existe y es útil, esto es, posee la “misma
información” que la función original g(x), si esta no es “demasiado discontinua” y en el infinito se anula
lo bastante rápido. Estas condiciones, sin embargo, solo son suficientes. Por ejemplo, la transformada de
Fourier existe aunque g(x) no sea cuasicontinua: basta con la integrabilidad absoluta, y esta ni siquiera es
una condición necesaria. En definitiva, la transformada de Fourier puede existir y ser útil aun cuando g(x)
no cumpla todas las restricciones del teorema: la elección de las mismas se motiva por su simplicidad.
Es relativamente simple establecer la existencia de la transformada con las condiciones del teorema: como
la función g(x)e ikx es cuasicontinua (la exponencial no introduce discontinuidades), la integral
Z +R
ikx
dx g(x)e
R

existe para cualquier valor finito de R. Además, la integrabilidad absoluta conduce a la cota
1 0
Z +R Z +R z }| { Z +R z }| { Z +1
ikx abs.
dx g(x)e  dx |g(x)| e ikx = dx |g(x)|  dx |g(x)| < 1.
R R R 1 integr.

Por tanto, el lı́mite


Z +R
ikx
G(k) = lı́m dx g(x)e , k 2 R,
R!1 R

existe. La demostración del teorema de inversión, sin embargo, no es tan inmediata.


4 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Ejemplos:
|x|
1. Función exponencial del valor absoluto, g(x) = e :
Z +1 Z 0 Z +1
G(k) = dx e |x| e ikx = dx e+x e ikx
+ dx e x
e ikx
1 1 0

1 h i
0 (1+ik)x +1
e(1 ik)x e 1
= = 1 lı́m ex e ikx
+ 1 lı́m e x
e ikx
1 ik 1 1 + ik 0 1 ik x! 1 1 + ik x!1

1 1 2
= + = .
1 ik 1 + ik 1 + k2
Puesto que la función g(x) es absolutamente integrable,
Z +1
dx e |x| = G(k = 0) = 2,
1

y es continua, mientras que su derivada es cuasicontinua,


⇢ ⇢
e x , x 0, 0 e x, x > 0,
g(x) = ) g (x) =
ex , x < 0, ex , x < 0,

sabemos que la transformada inversa va a ser igual a la propia función. Lo comprobamos explı́citamente:
Z +1 Z +R
1 dk 2 ikx eikx
F [G] = VP 2
e = lı́m I R (x), I R (x) := dk h(k), h(k) := .
1 2⇡ 1 + k R!1 R ⇡(1 + k 2 )
La integral no se puede calcular por métodos elementales, pero sı́ usando el teorema de los residuos. Se
procede como sigue:
Se construye la continuación analı́tica de h(k) para valores complejos del argumento. Para ello, no-
tamos que h(k) se puede representar mediante un desarrollo de Taylor alrededor de cualquier punto
k 2 R, por ejemplo, alrededor de k = 0 se tiene:
1
! 1 ! 1
1 X X 1 X ( 1)n (ix)m 2n+m
h(k) = ( 1)n k 2n (ikx)m = k , convergente en |k| < 1.
⇡ n=0 m=0
m! n,m=0
m!

Si reemplazamos k por el número complejo z, esta serie convergerá en un disco |z| < 1, lo cual permite
definir la continuación analı́tica h(z) dentro de este disco. Reiterando el procedimiento, se puede
construir la función h(z). A efectos prácticos, el resultado final consiste simplemente en reemplazar k
por z:
eizx
h(z) := , z 2 C.
⇡(1 + z 2 )
Esta función es analı́tica excepto en z = ±i, donde tiene sendos polos simples.
Supongamos primero x 0. Se define la siguiente integral en el plano complejo a lo largo del camino
+
cerrado C = LR [ KR recorrido en sentido antihorario:
I Z LR = {z = k | R  k  +R} ,
JR := dz h(z) = IR (x) + dz h(z),
+ + +
LR [KR KR KR = z = Rei' | 0  '  ⇡ .

La integral JR se evalúa como sigue: si R > 1, el camino encierra el polo en z = i, que además es el
único punto donde el integrando no es analı́tico. Por tanto, se puede deformar el camino y escribir
I
JR = dz h(z), K" = {z = i + "ei' | 0  ' < 2⇡} en sentido antihorario.
K"
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 5

En consecuencia,
antihorario
z}|{ dz
Z 2⇡ z }| { x i"ei' Z 2⇡ i' Z 2⇡
e e i ei"e "!0 1
JR = d' i"ei' = e x
d' ! e x
d' = e x
,
0 ⇡"ei' (2i + "ei' ) ⇡ 0 2i + "ei' 2⇡ 0
| {z }
h(i+"ei' )

donde en el último paso hemos tomado por conveniencia " ! 0, dado que la analiticidad del integrando
permite elegir " arbitrariamente en cierto rango. Por tanto,
Z
1 x
F [G] = lı́m IR (x) = e lı́m dz h(z), x 0.
R!1 R!1 +
KR

+
A continuación se argumenta que el lı́mite de la integral a lo largo de KR se anula. En efecto, para
cualquier función analı́tica h(z) sobre un camino finito C se tiene la cota
Z Z Z Z
dz h(z)  |dz||h(z)|  MC |dz| = MC LC , LC := |dz|, máx |h(z)|  MC ,
C C C C z2C

donde LC es la longitud del camino C y MC es una cota inferior al máximo valor de la función |h(z)|
sobre el camino (el cual es finito, pues la función no diverge sobre el camino finito). En este caso, la
+
longitud de la semicircunferencia C = KR es LC = ⇡R, mientras que

0 si 0'⇡, x 0 1
z }| { z }| {
ixRei' e xR sen '
eixR cos '
+ |e | 1
h(z 2 KR ) = 2 2i'
= 2 2i'
 .
⇡ |1 + R e | ⇡ 1+R e ⇡|1 R2 |
| {z }
|1 R2 | si 0'⇡

Por tanto,
Z
⇡R R!1
dz h(z)  ! 0.
+
KR ⇡(R2 1)

(Este razonamiento se resume de manera más rigurosa en el denominado lema de Jordan). En defini-
tiva, F 1 [G] = e x si x 0.
Si x < 0, se repite el mismo razonamiento pero para la integral

I Z LR = {z = k | R  k  +R} ,
JR := dz h(z) = IR (x) + dz h(z),
LR [KR KR KR = z = Rei' | ⇡'0 ,

con el camino LR [ KR recorrido en sentido horario, y que encierra ahora el polo z = i de h(z).
Evaluando la integral JR como antes se obtiene

J R = ex ,

y por tanto Z
1
F [G] = ex lı́m dz h(z) = ex , x < 0,
R!1 KR

porque también se cumple que la integral sobre KR se anula en el lı́mite R ! 1 (es para justificar
esta paso que se toma el camino KR cuando x < 0, de manera que sen ' < 0 a lo largo del camino y
se pueda afirmar e xR sen '  1).
6 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

En conclusión, ⇢
1 e x, x 0 |x|
F [G] = =e ,
ex , x<0
y se cumple la igualdad estricta, porque la función g(x) es continua.
|x|
2. Transformada de la función g (x) = e , con > 0 (en el ejemplo previo se calculó F[g1 ]):
Z +1 Z +1
⇠:= x 1 1 2 2
G (k) = dx e |x| ikx = d⇠ e |⇠| i(k/ )⇠ = 2
= 2 .
1 1 1 + (k/ ) + k2
| {z }
G1 (k/ )

Este ejemplo ilustra cómo se pueden emplear manipulaciones habituales de las integrales (como el cambio
de variables) para reducir el cálculo de una transformada a otra más sencilla o ya evaluada.
2
3. Calculemos la transformada de Fourier de la función gausiana g(x) = e x . Se escribe
Z +1 Z +1 Z +1
x2 ikx (ik/2)2 x2 ikx+k2 /4 (ik/2)2 2
G(k) = F[g] = dx e =e dx e| {z } =e dx e (x+ik/2) ,
1 1 1
e (x+ik/2)2 | {z }
=:Ik/2

en términos de la integral compleja


Z +1
(x+is)2
Is := dx h(x), h(x) := e , s 2 R.
1

La función h(x) es analı́tica en todo el eje real. Se introduce la continuación analı́tica simplemente como
h(z), z 2 C, que se trata de una función analı́tica en todo el plano complejo. Se evalúa la siguiente integral
en el plano complejo: I
(z+is)2
JR = dz h(z), h(z) = e ,
CR

donde el camino CR define un rectángulo en el plano complejo, recorrido en sentido antihorario (suponemos
s < 0 por conveniencia y sin pérdida de generalidad):
CR = { R  Re(z)  R, Im(z) = 0} [ {Re(z) = R, 0  Im(z)  s}
[{ R  Re(z)  R, Im(z) = s} [ {Re(z) = R, 0  Im(z)  s}.
Por tanto,
Z +R Z s Z R Z 0
JR = dx h(x) + i dy h(R + iy) + dx h(x is) + i dy h( R + iy)
R 0 +R s

Como la función h(z) es analı́tica en todo el plano complejo, el teorema de Cauchy establece que JR = 0.
Por otro lado, la contribución de los caminos laterales se anula en el lı́mite R ! 1:
1
Z s Z s Z s z }| {
2 2 2 2
(R+iy+is) (R+iy+is) R +(y+s) 2iR(y+s)
i dy e  dy e = dy e e
0 0 0
Z s Z s
R2 2
R2 +s2 R2 +s2 R!1
= e dy e|(y+s)
{z }  e dy = ( s)e ! 0,
0 0
e s2

e igualmente para la otra integral. Por tanto,


Z +1 Z 1 Z +1
x2
0 = lı́m JR (z) = dx h(x) + dx h(x is) ) Is = dx e
R!1 1 +1 | {z } 1
| {z } e x2
Is
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 7

es decir, la cantidad Is en realidad no depende de s. Para calcular su valor se procede como sigue:
Z +1 Z +1 Z Z 2⇡ Z +1 Z +1
2 x2 y2 2 r2 r2 1 u
p
I = dx e dy e = d re = d' dr re = 2⇡ du e =⇡ ) I= ⇡.
1 1 R2 0 0 2 0

En definitiva,
2 p k2 /4
G(k) = e(ik/2) Is = ⇡e ,
es decir, la transformada de Fourier de una gausiana es otra gausiana. Como la gausiana es absolutamente
integrable y continua, y su derivada también es continua, la inversa de esta transformada proporciona la
gausiana original exactamente.

4. Sea la función
1 (t/⌧ )2 ⇥ i!0 t
(t/⌧ )2

g(t) = e e e + e i!0 t ,
cos !0 t = ⌧, !0 > 0.
2
Esta función es absolutamente integrable y tanto ella como su derivada son continuas. Su transformada
se puede evaluar como sigue (si t tiene el significado fı́sico de tiempo, suele ser habitual emplear ! —
frecuencia angular — como variable de la transformada):
Z +1 Z +1 Z +1
i!t 1 i(! !0 )t (t/⌧ )2 1 i(!+!0 )t (t/⌧ )2
G(!) = dt e g(t) = dt e e + dt e e
1 2 1 2 1
F [gausiana] para k=(! !0 )⌧ F [gausiana] para k=(!+!0 )⌧
zZ }| { zZ }| {
+1 +1
⌧ i(! !0 )⌧ x x2 ⌧ i(!+!0 )⌧ x x2
(x:=t/⌧ ) = dx e e + dx e e
2 1 2 1
p
⌧ ⇡h [⌧ (! !0 )/2]2 [⌧ (!+!0 )/2]2
i
= e +e .
2

5. Significado fı́sico: la interpretación fı́sica habitual de la transformada de Fourier es que representa la des-
composición de la función en una superposición de ondas armónicas. Sea g(t) una función cuya transformada
se escribe en forma polar, G(!) = |G(!)|ei✓ . Entonces, la transformada inversa se puede expresar como
Z +1 Z +1
1 d! d!
g(t) = F [G] = G(!)ei!t = |G(!)| ei[!t+✓(!)]
1 2⇡ 1 2⇡
Z +1 Z +1
d! d!
= |G(!)| cos[!t + ✓(!)] + i |G(!)| sen[!t + ✓(!)]
1 2⇡ 1 2⇡
| {z }
0 porque g2R
Z +1
d!
= |G(!)| cos[!t + ✓(!)].
1 2⇡

Este resultado describe la señal g(t) como una superposición de ondas armónicas de distinta frecuencia !
con distintas amplitudes (|G(!)|) y fases (✓(!)). También es habitual que G(!) se denomine el espectro
de la señal, una nomenclatura tomada en préstamo del caso en que la función g(t) represente una onda
luminosa. Evidentemente, la interpretación fı́sica no se limita al caso de una onda luminosa, y la función
g(t) puede representar cualquier observable fı́sico (señal sonora, señal eléctrica,. . . ).
Consideremos el ejemplo anterior interpretando g(t) como una señal luminosa, que por tanto representa una
radiación de frecuencia !0 cuya intensidad está modulada por una gausiana con un tiempo caracterı́stico
⌧ que podemos identificar con la duración de la señal. En particular, si !0 ⌧ 1, es decir, la duración es
mucho mayor que el tiempo caracterı́stico !0 1 de oscilación, entonces el espectro G(!) se caracteriza por
dos picos bien definidos en ! = ±!0 , correspondiente a un haz de luz de un color bien definido. Por el
contrario, si !0 ⌧ ⌧ 1, el haz de luz tiene una duración tan corta que el color no está bien definido y por
ello el espectro G(!) asigna un peso comparable a muchas frecuencias diferentes.
8 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

6.1.2. Propiedades

Lema: la transformada de Fourier es lineal. Es decir, la transformada de Fourier de una combinación lineal es
la combinación lineal de las transformadas:
)
F
g(x) ! G(k) F
F ) ↵g(x) + h(x) ! ↵G(k) + H(k), 8↵, constantes.
h(x) ! H(k)

La demostración es inmediata a partir de la definición.

Lema: si la función g(x) es real, su transformada de Fourier verifica G⇤ (k) = G( k):


Z +1 ⇤ Z +1 Z +1
ikx ⇤ g2R
G⇤ (k) = dx e ikx
g(x) = dx e g ⇤ (x) = dx eikx g(x) = G( k).
1 1 1

Teorema de la transformada de la derivada: supongamos que la función g(x) es continua, su derivada


g 0 (x) es cuasicontinua y que ambas poseen transformada de Fourier. Si además g(x) ! 0 cuando |x| ! 1,
entonces se verifica la relación
F[g 0 ] = ikF[g].
Demostración: supongamos primero que g 0 (x) posee un único punto x0 donde es discontinua (de primera especie,
por la hipótesis de cuasicontinuidad). Entonces se divide el intervalo de integración de la transformada en dos
subintervalos y se integra por partes en cada uno:
ikx 0 ikx 0
(ge ) g(e )
Z Z z }| { Z
+1 x0 +1
0 0 ikx dg ikx dg ikx
F[g ] = dx g (x)e = dx e + dx e
1 1 dx x0 dx
Z x0 Z +1
⇥ ⇤
ikx x0 d ikx
⇥ ⇤
ikx +1 d ikx
= g(x)e 1
dx g(x) e + g(x)e x0
dx g(x) e
1 dx x0 dx
Z x0 Z +1
[ g(±1)!0 ] = g(x+
0 )e
ikx0
+ ik dx g(x)e ikx
g(x0 )e ikx0
+ ik dx g(x)e ikx
1 x0
Z +1
ikx
[ g(x+
0 )=g(x0 ) ] = ik dx g(x)e = ikF[g].
1

Si g 0 (x) tiene más de una discontinuidad, se repite el razonamiento dividiendo el intervalo de integración en
tantos subintervalos como haga falta. Este paso es necesario porque la integración por partes exige un integrando
continuo.
Comentarios:

1. El interés práctico de este resultado es que la derivada se convierte en multiplicación por el factor ik para las
transformadas. Por tanto, la utilidad de la transformada de Fourier para resolver ecuaciones diferenciales
es que permite reformularlas como ecuaciones algebraicas.

2. El teorema se puede extender si la función g(x) tiene discontinuidades, de manera que aparecerán términos
del tipo [g(x+
0) g(x0 )]e ikx0 al integrar por partes.

3. El teorema se puede extender para derivadas de orden superior por aplicación reiterada: si las funciones
g(x), g 0 (x), . . . g (n 1) (x) son continuas, g (n) (x) es cuasicontinua, todas poseen transformada de Fourier y
se anulan en el infinito, entonces

F[g (n) ] = ikF[g (n 1)


] = (ik)2 F[g (n 2)
] = · · · = (ik)n F[g].
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 9

Definición: se denomina convolución de dos funciones g(x) y h(x), denotada h ⇤ g o g ⇤ h, a la función


Z +1 Z +1
m(x) := g ⇤ h = ds g(s) h(x s) = ds g(x s) h(s) = h ⇤ g, x 2 R.
1 1

Teorema de convolución: , si las funciones g(x) y h(x) poseen transformadas de Fourier G(k), H(k), respec-
tivamente, y su convolución m(x) tiene la transformada M (k), entonces M (k) = G(k)H(k).
Demostración: Se tiene
m(x)
Z zZ }| { Z Z x7!z+s
+1 +1 +1 +1 z }| {
ikx ikx
F[m = g ⇤ h] = M (k) = dx e ds g(s) h(x s) = ds g(s) dx e h(x s)
1 1 1 1
Z +1 Z +1 Z +1 Z +1
ik(z+s) iks ikz
= ds g(s) dz e h(z) = ds g(s)e dz e h(z) = G(k) H(k).
1 1 1 1
| {z }| {z }
F [g] F [h]

Debido a este resultado, se puede comprobar inmediatamente que las propiedades estructurales del producto se
transfieren sin modificación a la convolución (denominado por ello a veces también “producto de convolución”):
Ley conmutativa: h ⇤ g = g ⇤ h.
Ley asociativa: h ⇤ (g ⇤ f ) = (h ⇤ g) ⇤ f .
Ley distributiva: (h + g) ⇤ f = h ⇤ f + g ⇤ f .

Ejemplo: sea un oscilador armónico de masa m y frecuencia natural !0 , está sometido a una fricción caracteri-
zada por el coeficiente b y a una fuerza externa f (t), que se supone suficientemente suave en el tiempo y que se
anula con suficiente rapidez en el pasado y el futuro lejanos. El objetivo es encontrar la trayectoria del oscilador
debida al efecto de esta fuerza en cualquier instante de tiempo.
La ecuación de evolución dinámica para la trayectoria x(t) es
b/m f /m
d2 x dx z}|{ z}|{
m 2 +b + m!02 x = f (t) ) ẍ + 2r ẋ + !02 x = a(t) .
dt dt
Como el dominio de la variable independiente es todo el eje real ( 1 < t < 1) y la EDO es lineal, puede ser
ventajoso intentar resolverla mediante el uso de la transformada de Fourier:
Z +1 Z +1
i!t
X(!) := F[x] = dt x(t)e , A(!) := F[a] = dt a(t)e i!t .
1 1

Las condiciones matemáticas impuestas sobre la función f (t) están motivadas por la necesidad de que estas
transformadas estén definidas y de que se verifiquen las condiciones que hagan faltan para aplicar los teoremas
pertinentes. De manera más precisa:
La condición de que la función f (t) sea suficientemente suave quiere decir que existen f (t) y sus derivadas
hasta el orden que sea necesario para que la solución x(t) sea también lo bastante suave. En este caso, como
la EDO es lineal sabemos que basta con que f (t) sea continua para que existan las funciones x(t), ẋ(t), ẍ(t).
El comportamiento de la fuerza f (t) en el infinito significa que su actuación está limitada en el tiempo: no
existe a efectos prácticos ni en el pasado ni en el futuro, ası́ que cualquier oscilación que existı́a o existirá,
respectivamente, desapareció o desaparecerá por amortiguación. Por tanto, se buscarán soluciones que se
anulen en el pasado y futuro lejanos, esto es, que verifiquen la condición de contorno de que x(t) se anula
rápida y suavemente en el infinito: esto quiere decir que, cuando t ! ±1, la función x(t) se anula tan
rápido como haga falta y además lo hace suavemente, es decir, que también lo verifican todas las derivadas
ẋ, ẍ, . . . .
10 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

En conclusión, todo esto significa fı́sicamente que solo nos interesa la evolución inducida por la fuerza externa, sin
contribución del efecto de otras condiciones iniciales (o finales) impuestas. Desde un punto de vista matemático,
esto implica que no vamos a encontrar la solución general de la EDO (que dependerı́a de dos constantes arbitra-
rias), sino solo soluciones particulares que verifican estas condiciones de contorno sobre el comportamiento de la
solución en el infinito.
Ası́ pues, como se supone que se verifican las condiciones para aplicar el teorema de la transformada de la
derivada, se verificará
F[ẋ] = i!F[x], F[ẍ] = i!F[ẋ] = ! 2 F[x].
Por tanto, la EDO se convierte en
!
F[ẍ + 2rẋ + !02 x] = F[ẍ] + 2rF[ẋ] + !02 F[x] = ( ! 2 + 2ir! + !02 )X(!) = F[a] = A(!)

por la linealidad de la transformada, y de aquı́ se deduce


Z +1
A(!) 1 1
X(!) = =: G(!)A(!) ) x(t) = F [X] = ds g(t s)a(s), con g := F [G],
! 2 + 2ir! + !02 1

por el teorema de convolución. Para interpretar fı́sicamente este resultado, calculemos la función g(t) invirtiendo
la transformada por integración en el plano complejo:
Z +1 Z +R Z +R
d! i!t d! i!t d! ei!t
g(t) = G(!)e = lı́m IR (t), IR (t) := G(!)e = .
1 2⇡ R!1 R 2⇡ R 2⇡ ! + 2ir! + !02
2

1. Se construye la extensión analı́tica al plano complejo,


1
G(z) := , z 2 C,
z2 + 2irz + !02
y se analiza la estructura de sus singularidades:
 q
2 2 ! 1
z + 2irz + !0 = 0 ) z = !± := i r ± r2 !02 ) G(z) = .
(z !+ )(z ! )
Luego G(z) es una función analı́tica en todo el plano complejo excepto en los polos z = !± , cuya posición
dependerá de los valores de los parámetros no negativos r y !0 . Se distinguen tres casos:
p
a) !0 < r ) polos !± imaginarios puros en el semiplano superior (porque r ± r2 !02 > 0).
b) !0 = r ) !+ = ! = ir, polo doble imaginario en el semiplano superior.
p
c) !0 > r ) polos !± = ir ⌥ !02 r2 con parte real no nula y en el semiplano superior.
2. Evaluamos la siguiente integral en el plano complejo, recorriendo el camino en sentido antihorario:
2 IR 3
I z}|{
Z Z
dz 6 7
J := lı́m G(z)eizt = lı́m 64 + 7,
5
R!1 L [K 2⇡ R!1 LR KR
R R

con los tramos


LR := {z = ! | R < ! < R} , recta a lo largo del eje real,

KR := z = Rei' | 0 < ' < ⇡ , semicı́rculo en el semiplano superior.

Cuando R es grande, las únicas singularidades encerradas por el camino son los dos polos de G(z), ası́ que
se puede deformar el camino para escribir
I
dz
J= G(z)eizt ,
K" [K" 2⇡
+
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 11

con los caminos (en sentido antihorario)

K"± := z = !± + "ei' | 0 < ' < 2⇡ , cı́rculos que rodean los polos con " pequeño pero arbitrario.

Se tiene
I Z 2⇡ i'
dz 1 eit"e eit!+
G(z)eizt = d' i"ei'
K"+ 2⇡ 2⇡ 0 (!+ + "ei' !+ )(!+ + "ei' ! )
Z 2⇡ it!+ it!+
" ! 0 i e ie
! d' = ,
2⇡ 0 !+ ! !+ !
e igualmente, I
dz ieit!
G(z)eizt = ,
K" 2⇡ !+ !
de manera que
i
J= eit!+ eit! .
!+ !

3. La integral a lo largo del camino KR se anula si t > 0 (lema de Jordan):


|·|=1 e<0
Z Z ⇡ i' Z ⇡ z }| {z }| {
dz iR eitRe R ! 1 iR 1
G(z)eizt = d' ei' ⇠ d' 2 e i'+itR cos '
e tR sen '
! 0.
KR 2⇡ 2⇡ 0 (Rei' !+ )(Rei' ! ) 2⇡ 0 R

4. Por lo tanto, si t > 0 es


Z ⇣ p2 p ⌘
dz i eit!+ eit! e rt !02 r 2 !02
g(t > 0) = lı́m IR = J lı́m G(z)eizt = = p e t r et
R!1 R!1 K 2⇡ !+ ! 2 r2 !02
R
8 q
> 1 rt
>
> p e senh t r2 !02 , !0 < r (sobreamortiguado),
>
> r2 !0 2
>
>
>
<
rt
= te , !0 = r (amortiguamiento crı́tico),
>
>
>
> q
>
> 1
>
> p e rt
sen t !02 r2 , !0 > r (subamortiguado),
:
!02 r2

donde hemos incorporado el caso r = !0 que corresponde a un polo doble y se calcula igualmente (aunque
también se puede encontrar tomando el lı́mite r ! 0 en las expresión para r 6= !0 ).
5. Si t < 0, se calcula la integral tomando el camino semicircular en el plano inferior

KR := z = Rei' | ⇡<'<0 ,

que se recorre en sentido horario. En este caso, no se encierra ninguna singularidad, ası́ que J = 0 y
Z
dz
g(t < 0) = lı́m G(z)eizt = 0.
R!1 K 2⇡
R

Como vemos, la estructura de singularidades de la función G(!) en el plano complejo describe completamente
la dinámica del sistema. La solución expresada en forma de convolución proporciona una interpretación fı́sica
de la función g(t): la posición x(t) representa la “respuesta” del sistema fı́sico a la “perturbación externa” a(t),
y la función g(t), que relaciona linealmente ambas magnitudes, es una “susceptibilidad”, la cual no depende de
la “perturbación externa”, sino solo depende de caracterı́sticas del sistema (los parámetros r, !0 , y la relación
funcional entre x, ẋ y ẍ). En lenguaje matemático, g(t) se denomina función de Green de la ecuación. El hecho
12 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

de que g(t) se anule para t < 0 representa causalidad, es decir, que el valor de la fuerza externa en un instante t
solo afecta al sistema en instantes posteriores, como resulta patente en la convolución:
Z 0 si t<s
+1 z }| { Z t
x(t) = ds a(s) g(t s) = ds a(s)g(t s).
1 1

En la práctica, la expresión que se utilice para el cálculo de x(t) dependerá de la forma de a(t) y A(!), pues a
veces la forma de convolución no es la más sencilla de evaluar. Como ejemplo, tomemos una fuerza de la forma
8 ⇡
>
< ma0 cos ⌦t, |t| < =: T,
2⌦
f (t) = ma(t) =
>
:
0, T < |t|.
El parámetro T > 0 caracteriza la duración de la fuerza externa. Esta función es continua en todo el eje real y
se anula estrictamente en el infinito, ası́ que se cumplen las condiciones para aplicar el resultado anterior. En tal
caso,
0 si |s|>T 0 si ⌧ <0
Z +1 z}|{ Z T Z t+T z}|{
⌧ :=t s
x(t) = ds a(s) g(t s) = a0 ds cos ⌦s g(t s) = a0 d⌧ cos ⌦(t ⌧ ) g(⌧ )
1 T t T
8
> 0, t< T,
>
>
>
>
>
> Z t+T
>
<
a0 d⌧ cos ⌦(t ⌧ ) g(⌧ ), T  t < T,
= 0
>
>
>
> Z t+T
>
>
>
>
: a0 d⌧ cos ⌦(t ⌧ ) g(⌧ ), T  t.
t T

La evaluación de las integrales es posible pero laboriosa. Consideremos el caso simplificado de ausencia de fricción:
como 8
> 0, t < 0,
<
r!0
g(t) !
: sen !0 t , 0  t,
>
!0
resulta
1 1
cos ⌦(t ⌧ ) g(⌧ > 0) ! cos ⌦(t ⌧ ) sen !0 t = {sen [(!0 + ⌦)⌧ ⌦t] + sen [(!0 ⌦)⌧ + ⌦t]} .
!0 2!0
Por tanto:
Si |t| < T :
Z t+⇡/2⌦ h ⇣
1 ⇡ ⌘i
d⌧ sen [(!0 ⌦)⌧ + ⌦t] = cos ⌦t sen !0 t +
0 !0 ⌦ 2⌦
1 h ⇡!0 ⇡!0 i
= cos ⌦t cos sen !0 t sen cos !0 t .
!0 ⌦ 2⌦ 2⌦
La otra integral se obtiene cambiando ⌦ ! ⌦, ası́ que
Z t+T 
a0 ⇡!0 ⌦ ⇡!0
x(t) = a0 d⌧ cos ⌦(t ⌧ ) g(⌧ ) = cos ⌦t cos sen !0 t sen cos !0 t .
0 !02 ⌦2 2⌦ !0 2⌦
En contra de las apariencias, esta expresión no diverge:
✓ ◆
a0 ⇡ cos !0 t
lı́m x(t) = t+ sen !0 t + .
⌦!!0 2!0 2!0 !0
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 13

Si t > T : Z t+⇡/2⌦
2 ⇡!0
d⌧ sen [(!0 ⌦)⌧ + ⌦t] = cos sen !0 t,
t ⇡/2⌦ !0 ⌦ 2⌦
y la otra integral se obtiene cambiando ⌦ ! ⌦, ası́ que
Z t+T
2a0 ⇡!0 ⌦!! ⇡a0
x(t) = a0 d⌧ cos ⌦(t ⌧ ) g(⌧ ) = cos sen !0 t !0 sen !0 t.
t T !02 ⌦2 2⌦ 2!02

En conclusión, para tiempos largos el oscilador ejecuta oscilaciones armónicas con su frecuencia natural y
una amplitud determinada por la intensidad y duración de la fuerza externa.

Para finalizar un breve comentario a propósito del caso lı́mite de ausencia de fricción (r ! 0). Como ha ilustrado
el ejemplo, este lı́mite está bien definido tanto para la fórmula de convolución como para la función de Green
g(t). Sin embargo, el lı́mite no se puede tomar antes de calcular la transformada inversa, puesto que

r!0 1
G(!) !
(! !0 )(! + !0 )

tiene dos singularidades no integrables en el eje real, de manera que la fórmula integral para la transformada
inversa no está definida. Este caso muestra la relevancia del orden en que se realizan las operaciones de trans-
formada inversa y de paso al lı́mite r ! 0. En estas situaciones, se debe recurrir al problema fı́sico que subyace
a las ecuaciones y mantener r 6= 0 para que exista disipación, lo cual permite identificar una flecha del tiempo
y por tanto causalidad: la EDO no es invariante bajo inversión temporal y tiene sentido distinguir entre pasa-
do y futuro. Una vez calculada la transformada inversa, que incorpora esta flecha del tiempo en el resultado
g(t < 0) = 0, se puede considerar el lı́mite r ! 0, el cual se debe interpretar como que estudiamos la evolución
sobre escalas de tiempo mucho menores que el tiempo caracterı́stico r 1 de disipación, esto es, el lı́mite r ! 0
se debe entender como r|t| ⌧ 1.

6.1.3. Transformada de Fourier multidimensional


Se puede extender el concepto de transformada de Fourier a una función g(x) en el espacio real n-dimensional,
x = (x1 , x2 , . . . xn ) 2 Rn . La idea es simplemente calcular n transformadas de Fourier, una por cada variable.

Definición: la transformada de Fourier n–dimensional de una función g(x 2 Rn ) es


Z +1 Z +1
ik1 x1 ikn xn
G(k) = F[g] := dx1 e ··· dxn e g(x)
1 1
Z +1 Z +1 Z +1
i(k1 x1 +k2 x2 +···+kn xn )
= dx1 dx2 . . . dxn e g(x)
1 1 1
Z
= dn x e ik·x
g(x), k = (k1 , k2 , . . . kn ) 2 Rn .
Rn

La ventaja de la última forma de escribir la transformada es que se puede evaluar mediante cambios de variables
en todo el espacio Rn , lo cual permite aprovechar ventajosamente las posibles simetrı́as del campo g(x).

Definición: la transformada de Fourier inversa es


Z +1 Z +1 Z
1 dk1 ik1 x1 dkn ikn xn dn k ik·x
F [G] = e ··· e G(k) = e G(k).
1 2⇡ 1 2⇡ Rn (2⇡)n

Propiedades: Las propiedades son una consecuencia directa de la definición y las propiedades de la transfor-
mada de Fourier unidimensional. En particular,
14 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

1. Factorización:

g(x) = g1 (x1 ) g2 (x2 ) · · · gn (xn ) ) G(x) = G1 (x1 ) G2 (x2 ) · · · Gn (xn ).

Por ejemplo, la función gausiana en R2 :


hp i hp i
|x|2 x21 x22 x21 x22 k12 /4 k22 /4 (k12 +k22 )/4 |k|2 /4
g(x) = e =e =e e ) G(k) = ⇡e ⇡e = ⇡e = ⇡e .

2. Transformada del gradiente: si las funciones g(x), rg(x) poseen transformada de Fourier y son continuas
y además g(x) se anula suficientemente rápido en el infinito, entonces se verifica
teorema de Gauss ik·x
Z zZ }| { Z z }| {
ike
por partes ⇥ ⇤
F[rg] = dn x e ik·x
rg(x) = n
d xr e ik·x
g(x) dn x g(x) r(e ik·x )
Rn Rn Rn
I Z
ik·x
= dS e g(x) +ik dn x g(x)e ik·x
= ikF[g].
frontera |{z} Rn
en infinito !0

(Se ha impuesto continuidad de rg por simplicidad. El resultado se puede demostrar también cuando rg
es cuasicontinua). De la misma manera se puede demostrar el siguiente resultado, que es muy útil:
teorema de Gauss ik·x
Z zZ }| { Z z }| {
ike
por partes ⇥ ⇤
F[r2 g] = dn x e ik·x
r · [rg(x)] = n
d xr· e ik·x
rg(x) dn x [rg(x)] · r(e ik·x )
Rn Rn Rn
2 3
I Z
= dS · 4e ik·x
rg(x)5 + ik · dn x rg(x)e ik·x
= ik · F[rg] = |k|2 F[g].
frontera | {z } Rn | {z }
en infinito !0 | {z } ikF [g]
F [rg]

3. Convolución: si Z Z
m(x) = dn y g(y)h(x y) = dn y g(x y)h(y),
Rn Rn
entonces M (k) = G(k)H(k) cuando existen las transformadas.

Ejemplo: el potencial electrostático V (r) creado en todo el espacio por una distribución de carga eléctrica
especificada por la densidad volumétrica %(r) viene determinado por la ecuación de Poisson,
%(r)
r2 V (r) = .
✏0
1. Nos restringimos al caso en que los campos %(r) y V (r) son suficientemente suaves y se anulan suficien-
temente rápido en el infinito para asegurar que las manipulaciones que siguen son válidas. Entonces, se
introducen las transformadas de Fourier de la densidad y el potencial,
Z Z
v(r) := F[V ] = d3 r e ik·r V (r), R(k) := F[%] = d3 r e ik·r %(r),
R3 R3

de manera que la ecuación de Poisson se transforma en



2 2 ! %(r) R(k) 1
F[r V ] = k v(k) = F = ) v(k) = G(k)R(k), G(k) := .
✏0 ✏0 ✏0 k 2
Podemos expresar la solución explı́citamente en términos del campo %(r) mediante el teorema de convolu-
ción: Z Z
d3 k ik·r 1
V (r) = dr0 g(r r0 )%(r0 ), g(r) := F 1 [G] = 3
e .
R3 R3 (2⇡) ✏0 k 2
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 15

Notemos que no encontramos la solución general del problema, sino solo aquellas que verifican la condición
de contorno de que se anulan suficientemente rápido en el infinito. En este problema, esta condición es
suficiente para que la solución sea única. En particular, aunque fı́sicamente el potencial está definido excepto
por una constante aditiva, la restricción en este caso fija el valor de esta constante.
2. Para calcular la transformada de Fourier inversa evaluamos la integral en coordenadas esféricas para apro-
vechar la simetrı́a de la función G(k), que depende solo del módulo de k: tomando el eje kz en la dirección
y sentido del vector fijo r, se tiene

d3 k = k 2 sen ✓ dk d✓ d', k · r = kr cos ✓,

Z Z +1 Z ⇡ Z 2⇡
d3 k ik·r 1 coord. 1 eikr cos ✓
g(r) = e = dk k 2 d✓ sen ✓ d'
R3 (2⇡)3 ✏0 k 2 esféricas (2⇡)3 ✏0 0 k2
|0 {z } | 0 {z }
s:=cos ✓ 2⇡
Z +1 Z +1 Z +1 ikr ikr Z +1
1 ikrs 1 e e 1 sen kr
= dk ds e = dk = dk
(2⇡)2 ✏0 0 1 (2⇡)2 ✏0 0 ikr 2⇡ 2 ✏0 0 kr
✓ ◆ Z +1 Z +1
r>0 1 sen q 1 sen q ⇡
= 2
dq = , puesto que dq = (ver más abajo).
q:=kr 2⇡ ✏0 r 0 q 4⇡✏0 r 0 q 2
Notemos que g(r) solo depende del módulo de r, reflejando la simetrı́a rotacional de la transformada G(k):
en ausencia de fronteras, no hay dirección privilegiada (isotropı́a espacial ).
3. Por tanto, la solución para la ecuación de Poisson del potencial electrostático se escribe como la convolución
Z
%(r0 )
V (r) = d3 r0 ,
4⇡✏0 |r r0 |
Dado que la función g(r) representa el potencial eléctrico creado por una carga puntual unidad en el origen,
esta convolución incorpora efectivamente la ley de Coulomb (a través de la función g(r)) y el principio de
superposición (a través de la integral). Esta expresión representa una interpretación de la convolución muy
útil en el contexto de la teorı́a de campos. También es posible, por analogı́a con el problema del oscilador,
la interpretación de la solución electrostática como sigue: fı́sicamente la ley de Coulomb g(r) se puede
entender como la “susceptibilidad” del vacı́o a la “perturbación” representada por las cargas eléctricas,
siendo el campo eléctrico la “respuesta” del vacı́o. Es decir, g(r) es la función de Green de la ecuación de
Poisson en el espacio libre (esto es, sin fronteras).
4. Evaluación de la integral
Z +1 Z Z (Z Z )
0 +1 " R
sen q sen q sen q sen q sen q
I := 2 dq = dq + dq = lı́m lı́m dq + dq
0 q 1 q 0 q R!1 "!0 R q " q
| {z }
par
(Z Z )
" R
eiq eiq ˆ
= Im lı́m lı́m dq + dq =: Im I,
R!1 "!0 R q " q

donde se ha definido la integral en el plano complejo


Z
ˆ eiz
I := lı́m lı́m dz , LR," = {z = q | "  |q|  R} .
R!1 "!0 L
R,"
z

Para evaluar Iˆ consideramos pues la siguiente integral a lo largo de un camino cerrado en el plano complejo
y recorrido en sentido antihorario:
I Z Z
eiz ˆ eiz eiz
J := lı́m lı́m dz = I + lı́m dz + lı́m dz ,
R!1 "!0 L + +
R," [KR [K"
z R!1 K +
R
z "!1 K +
"
z
16 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

con los tramos


LR," = {z = q | "  |q|  R} , segmentos en el eje real,
+
KR = z = Rei' | 0  '  ⇡ , semicı́rculo grande en el semiplano superior.

K"+ = z = "ei' | 0  '  ⇡ , semicı́rculo pequeño en el semiplano superior,


centrado en el origen.

a) El contorno no encierra el polo en z = 0, ası́ que J = 0.


+
b) En el lı́mite R ! 1 la integral sobre KR se anula (lema de Jordan):
|·|=1 e<0
Z Z ⇡ Z ⇡ z }| { z }| {
eiz i' R ! +1
dz = d' ieiRe =i d' eiR cos ' e R sen ' ! 0.
+
KR z 0 0

c) La integral sobre K"+ es


Z Z 0 Z ⇡
eiz i"ei' " ! 0
dz = d' ie ! i d' = i⇡.
K"+ z ⇡ 0

Por tanto,
0 = J = Iˆ i⇡ ) Iˆ = i⇡ ) I = Im Iˆ = ⇡.
Notemos que se obtendrı́a el mismo resultado cerrando el contorno de otras maneras, por ejemplo, tomando
el camino K" por debajo del polo en z = 0 (de manera que J 6= 0 porque el camino encerrarı́a la
singularidad).

6.2. Transformada de Laplace


La transformada de Fourier solo se puede emplear con funciones definidas en todo el eje real y que se anulen en
el infinito con suficiente rapidez para que la integral converja. Para tratar problemas de condiciones iniciales (en
los que la función solo interesa en un semiintervalo) o funciones que no se anulen en el infinito, se introduce el
concepto de transformada de Laplace, la cual sin embargo está muy relacionada con la transformada de Fourier.

6.2.1. Definición e inversión

Definición: sea f (t) una función definida para 0 < t < +1. Se denomina transformada de Laplace de la función
f , denotada L[f ], a la expresión
Z +1
L[f ] := F (s) := dt e st f (t), siendo s 2 R.
0

Se trata de un funcional de f (t) con una exponencial real como núcleo y tiene la forma de una integral impropia
dependiente de un parámetro s.

Definición: sea F (s) la transformada de Laplace de la función f (t). Se define la transformada inversa de
Laplace, también llamada fórmula de Mellin–Bromwich a la expresión
Z p+i1 Z p+iR
ds st ds st
L 1 [F ] := VP e F (s) = lı́m e F (s),
p i1 2⇡i R!+1 p iR 2⇡i

donde p es cualquier número real mayor que el máximo de la parte real de las singularidades de F (s), esto es, el
camino p is en el plano complejo se encuentra a la derecha de todas las singularidades de F (s). Notemos que
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 17

F (s) se debe entender como la continuación analı́tica al plano complejo de la transformada de Laplace, que se
definió solo sobre el eje real.

Se necesitará la siguiente definición auxiliar:

Definición: sea f (t) una función definida para t > 0. Se dice que es de orden exponencial si existe un número
real a tal que
lı́m |f (t)|e at = 0.
t!+1

Esto significa que la función crece en el infinito no más rápido que una exponencial. En tal caso, se denomina
ı́ndice de aumento (exponencial) al ı́nfimo de a para el cual se verifica esta condición.
Comentarios:

Si ↵ es el ı́ndice de aumento exponencial, entonces la combinación e at |f (t)| tiende a cero en el infinito al


menos exponencialmente si a > ↵. En efecto, tomando una constante b que cumpla ↵ < b < a, tenemos
!0 expon. !0
z }| { z }| {
t ! +1
e at |f (t)| = e(b a)t e bt
|f (t)| ! 0 al menos exponencialmente.

Ejemplo: cualquier monomio es una función de orden exponencial con ı́ndice de aumento ↵ = 0:

n at 0, a > 0,
n 0: lı́m t e =
t!+1 1, a < 0.

Por tanto, cualquier polinomio también es de orden exponencial con ı́ndice de aumento ↵ = 0.

La gausiana no es una función de orden exponencial en general:



2 0, < 0,
lı́m e t e at =
t!+1 1, > 0.

Teorema: , si la función f (t), definida en el semieje real 0  t, es cuasicontinua y de orden exponencial ↵,


entonces su transformada de Laplace F (s) existe y es analı́tica en el semiplano complejo Re s > ↵. Si además
también f 0 (t) es cuasicontinua en el semieje real 0  t, entonces se la transformada inversa de Laplace verifica
8
>
> 0, t < 0,
>
>
>
<
L 1
[F ] = f (t), si t 0 y f (t) continua en t,
>
>
>
>
: 1 ⇥f (t+ ) f (t )⇤ ,
>
si t 0 y f (t) discontinua en t.
2
Comentarios:

La transformada inversa es igual a la función original en los puntos donde esta es continua, a cero en
el semieje t < 0, y al punto medio del salto donde es discontinua. Se utiliza la notación f ' L 1 [F ]
para indicar que la igualdad se cumple para casi todos los valores de t, es decir, donde f (t) es continua.
Sin embargo, esta notación solo se empleará cuando sea necesario enfatizar este aspecto. Por lo general,
escribiremos simplemente f = L 1 [F ] cuando no sea relevante la diferencia en los puntos de discontinuidad.
Por tanto, simbólicamente podemos escribir

0, t < 0,
L 1 [L[f ]] =
f (t), 0 < t.
18 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

El teorema establece básicamente que la transformada F (s) existe y es útil, esto es, posee la “misma
información” que la función original f (t), si esta no es “demasiado discontinua” y en el infinito no crece
demasiado rápido. Estas condiciones, sin embargo, solo son suficientes y de hecho la transformada de
Laplace puede existir y ser útil aun cuando f (t) no cumpla todas estas restricciones.

Es relativamente simple establecer la existencia de la transformada con las condiciones del teorema: sea el
número complejo s = a + ib, con a = Re s, b = Im s. La función f (t)e st = f (t)e at e ibt es cuasicontinua
(la exponencial no introduce discontinuidades) y se anula en el infinito si Re s = a > ↵ por definición de
orden exponencial (notemos que la exponencial de argumento imaginario está acotada en el infinito). Por
tanto, la integral
Z +R
dt f (t)e st
0

existe para cualquier valor finito de R. Además se tiene la cota


Z +R Z +R Z +1
st at ibt
dt f (t)e  dt |f (t)|e e  dt |f (t)|e at < 1.
0 0 | {z } 0 | {z }
1 !0 expon.
si a>↵

Por lo tanto, el lı́mite


Z +R
st
F (s) = lı́m dt f (t)e
R!1 0

existe en el semiplano Re s > ↵. Más aún, podemos calcular la derivada n-ésima de la transformada
formalmente como Z +1
dn F (s)
F (n) (s) = = dt ( t)n e st f (t).
dsn 0

La función tn f (t) también es cuasicontinua y del mismo orden exponencial ↵, porque el monomio tn es
continuo y de orden exponencial nulo. Por tanto, repitiendo el argumento previo, pero con la función tn f (t),
se concluye que F (n) (s) existe en el semiplano Re s > ↵ para cualquier valor de n, es decir, la función F (s)
es derivable infinitas veces y por tanto es analı́tica en ese semiplano. En el otro semiplano, Re s < ↵, se
puede obtener F (s) como continuación analı́tica pero tendrá singularidades en algunos puntos.

La demostración del teorema de inversión ilustra la conexión de la transformada de Laplace con la de


Fourier. Se define la siguiente función:

0, t < 0,
(t) := siendo p cualquier número real con p > ↵.
f (t)e pt , t > 0,

Las propiedades de esta función relevantes para la demostración son las siguientes:

1. La función (t) está definida en todo el eje real, 1 < t < +1.
2. Tanto (t) como 0 (t) son cuasicontinuas, pues el factor exponencial no introduce nuevas discontinui-
dades y la extensión para t < 0 introduce en el peor caso una discontinuidad de primera especie en
t = 0.
3. La función (t) decae en el infinito rápidamente (estrictamente nula para t ! 1, y exponencialmente
para t ! +1 porque p > ↵), y de hecho es absolutamente integrable.

Estas propiedades permiten aplicar el teorema para la transformada de Fourier y su inversa: existe la
transformada de Fourier = F[ ] y la transformada de Fourier inversa verifica (t) ' F 1 [ ]. Se tiene
pues
Z +1 Z +1
(k) = F[ ] = dt e ikt (t) = dt e (p+ik)t f (t) = F (p + ik),
1 0
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 19

Z +1 Z +R
1 dk ikt dk ikt
(t) ' F [ ] = VP e (k) = lı́m e F (p + ik)
1 2⇡ R!+1 R 2⇡
Z p+iR
ds st
(s:=p+ik) = e pt lı́m e F (s) ) L 1 [F ] = ept F 1 [ ] ' ept (t).
R!+1 p iR 2⇡i
| {z }
L 1 [F ]

La interpretación geométrica del cambio de variable s = p + ik es transformar el camino de integración a lo


largo del eje real de la integral de Fourier en el camino paralelo al eje imaginario y desplazado de la integral
de Mellin–Bromwich mediante una rotación de 90o (el factor i = ei⇡/2 ) seguida de un desplazamiento en
el eje real (el sumando p).

Ejemplos:
1. Un monomio, f (t) = tn con n = 0, 1, 2, . . . : el cálculo de la integral
Z +1
F (s) = dt tn e st
0

se puede realizar integrando reiteradamente por partes. Existe, sin embargo, un procedimiento más inme-
diato:
Z 1 ✓ ◆n Z 1 ✓ ◆n  st +1 ✓ ◆n
n st d st d e s>0 d 1 n!
F (s) = dt t e = dt e = = = n+1 .
0 ds 0 ds s 0 ds s s

El resultado confirma que la continuación analı́tica F (s 2 C) no tiene singularidades en el semiplano


Re s > 0, ya que f (t) es de orden exponencial ↵ = 0. Como además f (t) y f 0 (t) = ntn 1 son continuas, se
verifican las condiciones del teorema de inversión y sabemos que la transformada inversa va a ser igual a
f (t). Para evaluar la fórmula de Mellin–Bromwich
Z p+i1
1 ds st n!
L [F ] = VP e n+1 , con p > 0,
p i1 2⇡i s

en la práctica se puede aplicar el teorema de los residuos cerrando el contorno por el semiplano Re(s) < 0,
que es donde están las posibles singularidades de F (s).
Se define la función compleja
n! ezt
h(z) := , z2C
2⇡iz n+1
que es analı́tica en todo el plano excepto por un polo de orden n + 1 en z = 0.
Si t > 0, se evalúa la siguiente integral compleja (a lo largo de un camino recorrido en sentido
antihorario): I Z
J = lı́m dz h(z) = L 1 [F ] + lı́m dz h(z)
R!1 +
LR [KR R!1 +
KR

con los tramos de camino


LR = {z = p + iy | R  y  R} , segmento recto con Re z = p,

+ ⇡ 3⇡ arco de cı́rculo centrado en z = p y
KR = z = p + Rei' | ' ,
2 2 a la izquierda de la recta Re z = p.

El camino de integración encierra el polo en z = 0 cuando R ! 1. Por tanto, la integral J se podrá


calcular deformando el camino original hasta el camino

K" = z = "ei' | 0  ' < 2⇡ en sentido antihorario, con " pequeño pero arbitrario.
20 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Ası́ pues,
I Z 2⇡ Z 2⇡ i'
n!et"e
J= dz h(z) = d' i"ei' h "ei' = d' i"ei'
K" 0 0 2⇡i"n+1 ei(n+1)'
Z Z 1
n! 2⇡
in' e
t"ei'
n! 2⇡ e in' X 1
= d' e = d' (t"ei' )m
2⇡ 0 "n 2⇡ 0 "n m=0 m!
| {z }
i'
et"e
0 si m6=n
z }| {
1
X Z 2⇡
n! tm "m n
= d' ei(m n)'
= tn .
2⇡ m! 0
m=0 | {z }
2⇡ si m=n

+
Por otra parte, la integral a lo largo KR se anula en el lı́mite R ! 1 si t > 0 (lema de Jordan):
Z Z 3⇡/2 Z i'
i' i' n! 3⇡/2 i' et(p+Re )
dz h(z) = d' iRe h p + Re = d' Re
+
KR ⇡/2 2⇡ ⇡/2 (p + Rei' )n+1
|·|=1 e<0
Z 3⇡/2 Z 3⇡/2 z }| { z }| {
n! pt eitR sen ' etR cos ' R!1 n! pt e in'
= e d' Rei' ⇠ e d' eitR sen ' etR cos ' ! 0.
2⇡ ⇡/2 (p + Rei' )n+1 2⇡ ⇡/2 Rn
1
Por lo tanto, L [F ] = tn si t > 0.
2. Consideremos el caso particular de la función constante f (t) = 1 (monomio de grado cero). Por lo que se
ha visto, su transformada es F (s) = 1/s. Como esta función no se anula en t = 0, el teorema de inversión
establece que la transformada inversa será
8
>
> 0, t < 0,
 >
>
1 <
L 1 = 1/2, t = 0,
s >
>
>
>
:
1, 0  t.
Resulta instructivo comprobar cómo efectivamente la fórmula de Mellin–Bromwich reproduce la disconti-
nuidad en t = 0. Como antes, se estudia la siguiente integral en el plano complejo:
I Z
ezt
h(z) := , J = lı́m dz h(z) = L 1 [F ] + lı́m dz h(z)
2⇡iz R!1 L [K
R R
R!1 K
R

con los tramos de camino


LR = {z = p + iy | R  y  R} , segmento recto con Re z = p,
n ⇡ ⇡o arco de cı́rculo centrado en z = p y
KR = z = p + Rei' | ' ,
2 2 a la derecha de la recta Re z = p.

Las diferencias ahora son que el camino se recorre en sentido horario y que se toma el tramo KR en lugar
+
del tramo KR . Se demuestra de la misma forma que antes que si t < 0, la integral a lo largo de KR se anula
cuando R ! 1. Pero como ahora el camino no encierra ninguna singularidad (porque está completamente
contenido en el semiplano Re z > 0), resulta J = 0 y por tanto L 1 [F ] = 0 si t < 0.
¿Qué sucede si t = 0 exactamente? Podemos evaluar de nuevo la integral a lo largo de KR cuando R ! 1
como sigue:
Z Z ⇡/2 Z ⇡/2 Z ⇡/2
i' i' 1 i' 1 R!1 1 1
dz h(z) = d' iRe h p + Re = d' Re i'
⇠ d' = .
KR ⇡/2 2⇡ ⇡/2 p + Re 2⇡ ⇡/2 2
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 21

Como el camino no encierra la singularidad, se obtiene finalmente


Z
1
0 = J = L 1 [F ] + lı́m dz h(z) ) L 1 [F ] = cuando t = 0.
R!1 K
R
2
| {z }
1/2

+
Se puede comprobar que se llega al mismo resultado tomando el otro camino cerrado (el del tramo KR y
que encierra la singularidad).
3. Supongamos que la función f (t) posee la transformada F (s). Consideremos la transformada F̂ (s) :=
F (s ↵), con ↵ un número complejo arbitrario. Evidentemente, la función compleja F̂ (s) posee el mismo
tipo de singularidades que F (s), pero desplazadas una cantidad ↵ en el plano complejo. Calculemos la
transformada inversa de F̂ (s) como sigue:
=:p
z }| {
Z p̂+i1 Z p̂ Re ↵ +i1
1 ds st :=s ↵ d
L [F̂ ] = VP e F (s ↵) = VP e( +↵)t
F( )
p̂ i1 2⇡i p̂ Re ↵ i1 2⇡i
Z p+i1
d
= e↵t VP e t F ( ) = e↵t f (t),
p i1 2⇡i
| {z }
L 1 [F ]

donde la última igualdad se sigue porque si el camino p̂±i1 está a la derecha de todas las singularidades de
F̂ (s), entonces el camino p ± i1 = p̂ Re ↵ ± i1 lo estará respecto a las singularidades de F (s) = F̂ (s + ↵).
Este resultado permite evaluar rápidamente una transformada en términos de otras conocidas. Por ejemplo,
la contribución de cualquier polo de orden n en una transformada será un comportamiento genérico del
tipo monomio⇥exponencial:
 
1 1 ↵t 1 1 tn ↵t
L = e L = e (para t > 0).
(s ↵)n+1 sn+1 n!
| {z }
tn /n!

Este resultado permite obtener en particular la transformada de Laplace de la función exponencial de


manera inmediata (es el caso n = 0):
⇥ ⇤ 1
L e↵t = .
s ↵
Propiedades similares de la transformada se pueden deducir con facilidad a partir de cambios de variable
en la integral que la definen.

6.2.2. Propiedades

Lema: la transformada de Laplace es lineal. Es decir, la transformada de Laplace de una combinación lineal es
la combinación lineal de las transformadas:
)
L
g(t) ! G(s) L
L ) ↵g(t) + h(t) ! ↵G(s) + H(s), 8↵, constantes.
h(t) ! H(s)

La demostración es inmediata a partir de la definición.

Lema: si la función f (t) es real, su transformada de Laplace verifica F ⇤ (s) = F (s⇤ ):


Z +1 ⇤ Z +1 Z +1
st ⇤ f 2R s⇤ t
F ⇤ (s) = dx e st
f (t) = dx e f ⇤ (t) = dx e f (t) = F (s⇤ ).
0 0 0
22 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Teorema de la transformada de la derivada: , supongamos que la función f (t) es continua y su derivada


f 0 (t) cuasicontinua en el semieje 0  t, y que ambas poseen transformada de Laplace. Entonces se verifica la
relación
L[f 0 ] = sL[f ] f (0+ ), con f (0+ ) := lı́m f (t).
t!0+
0
Demostración: supongamos primero que f (t) continua, de manera que se puede integrar por partes en la defi-
nición de su transformada:
L[f ]
Z zZ }| {
1 ⇥ ⇤+1 1
0 st df st st
L[f ] = dt e = e f (t) 0
+s dt e f (t) = f (0+ ) + sL[f ],
0 dt 0

donde hemos supuesto que Re s es mayor que el ı́ndice de aumento exponencial de f (t), de manera que
st
lı́m e f (t) = 0.
t!+1

Si f 0 (t) tiene discontinuidades de primera especie, se repite el razonamiento dividiendo el intervalo de integración
en tantos subintervalos como haga falta, tal como se hizo en la demostración del correspondiente teorema para
la transformada de Fourier.
Comentarios:
1. El interés práctico de este resultado es que la derivada se reduce a una multiplicación por el factor s para
las tranformadas, que también involucra el valor “inicial” f (0+ ). Por tanto, la utilidad de la transformada
de Laplace para resolver ecuaciones diferenciales con condiciones iniciales es que permite formularlas como
ecuaciones algebraicas.
2. El teorema se puede extender si la función f (t) tiene discontinuidades, de manera que aparecerán términos
del tipo [f (t+
0) f (t0 )]e st0 al integrar por partes.
3. El teorema se puede extender para derivadas de orden superior por aplicación reiterada: si f (t), f 0 (t), . . . f (n 1) (t)
son continuas, f (n) (t) es cuasicontinua, todas poseen transformada de Laplace y son de orden exponencial
en el infinito, entonces
h i
L[f (n) ] = sL[f (n 1) ] f n 1 (0+ ) = s sL[f (n 2) ] f n 2 (0+ ) f n 1 (0+ ) = · · ·
2 0
= sn L[f ] sn 1
f (0+ ) sn f (0+ ) ··· f (n 1)
(0+ ).

Definición: se denomina convolución de dos funciones f (t) y h(t) definidas en el semieje 0 < t, denotada f ⇤ h
o h ⇤ f , a la función
Z t Z t
m(t) := f ⇤ h = d⌧ f (⌧ ) h(t ⌧ ) = d⌧ f (t ⌧ ) h(⌧ ), 0 < t.
0 0

Esta expresión es en realidad un caso particular de la convolución tal como se definió en la sección de transformada
de Fourier: en efecto, utilizando las siguientes extensiones de las funciones f y h a todo el eje real,
⇢ ⇢
0, t < 0, 0, t < 0,
fˆ(t) := ĥ(t) :=
f (t), 0 < t, h(t), 0 < t,

se tiene
0 si t<⌧
Z +1 Z +1 z }| { Z t
m(t) = d⌧ fˆ(⌧ ) ĥ(t ⌧) = d⌧ f (⌧ ) ĥ(t ⌧ ) = d⌧ f (⌧ ) h(t ⌧ ).
1 |{z} 0 0
0 si ⌧ <0

Por tanto, esta convolución también verifica las leyes conmutativa, asociativa y distributiva.
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 23

Teorema de convolución: si las funciones f (t) y h(t) poseen transformadas de Laplace F (s), H(s), respecti-
vamente, y su convolución m(t) tiene la tranformada M (s), entonces M (s) = F (s)H(s).
Demostración: se tiene
m(t)
Z zZ }| { Z Z t7!✓+⌧
+1 t +1 +1 z }| {
L[m = f ⇤ h] = M (s) = dt e st d⌧ f (⌧ ) h(t ⌧ ) = d⌧ f (⌧ ) dt e st
h(t ⌧)
0 0 0 ⌧
Z +1 Z +1 Z +1 Z +1
= d⌧ f (⌧ ) d✓ e s(✓+⌧ ) h(✓) = d⌧ e s⌧ f (⌧ ) d✓ e s✓
h(✓) = F (s) H(s).
0 0 0
| {z } |0 {z }
L[f ] L[h]

Ejemplo: consideremos un circuito eléctrico formado por un condensador (capacidad C), una inductancia L
y una resistencia R conectados en serie. Inicialmente el condensador tiene una carga eléctrica Q0 y no circula
corriente, y el objetivo es estudiar la evolución Q(t > 0) de la carga del condensador. Sea I la intensidad de
corriente eléctrica, que atraviesa por igual los tres componentes al estar conectados en serie, y denotemos la caı́da
de potencial en cada componente como VC para el condensador, VL para la inductancia y VR para la resistencia.
Tenemos pues cinco observables para nuestro sistema (Q, I, VC , VL , VR ), relacionados entre sı́ por los siguientes
cinco ecuaciones: las relaciones constitutivas,
Q
definición de capacidad: C= ,
VC

dI
ley de Henry: VL = L ,
dt

ley de Ohm: VR = RI.

la ley de Kirchho↵ para las diferencias de potencial en un circuito cerrado en serie,

VC + VL + VR = 0,

y la ley de conservación de la carga,


dQ
= I.
dt
Las cuatro primeras relaciones permiten eliminar las diferencias de potencial:
✓ ◆
dI VL VC + V R 1 Q
= = = + RI .
dt L L L C
Se llega ası́ a un sistema de ecuaciones para las dos variables Q(t), I(t). Se busca la solución de este sistema con
las condiciones iniciales Q(0) = Q0 , I(0) = 0, y para ello emplearemos la transformada de Laplace, pues solo
interesan las funciones para t > 0. Dado que el sistema de EDOs es lineal y de coeficientes constantes, sabemos
que las funciones van a ser continuas, derivables y de orden exponencial. Por tanto, las funciones cumplen las
condiciones para aplicar los teoremas de las transformadas de Laplace. Denotando

q(s) := L[Q], i(s) := L[I],

el sistema de EDOs combinado con las condiciones iniciales conduce a un sistema lineal ordinario:
Q0
9
 z }| { >
dQ ! >
> 8
L = sq(s) Q(0) = L[I] = i(s) >
> > sq i = Q0 ,
dt >
= >
<
) ✓ ◆
  ✓ ◆ > > 1 R
dI ! 1 Q 1 R >
> >
: q+ s+ i = 0.
L = si(s) I(0) = L + RI = q(s) >
i(s) > LC L
dt |{z} L C LC L >
;
0
24 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Despejando q(s), se llega a la expresión


" r #
(s + R/L)Q0 (s + R/L)Q0 R 4L
q(s) = 2 = , ± := 1± 1 .
s + (R/L)s + 1/(LC) (s + )(s ) 2L R2 C

El siguiente paso es invertir la transformada, Q(t) = L 1 [q], empleando la fórmula de Mellin–Bromwich. Los
números ± son o bien reales si 4L < R2 C, o bien complejos si 4L > R2 C (dejamos para el final el caso especial
4L = R2 C). En cualquier caso, es evidente que Re ± < 0. Además, el numerador nunca se anula simultáneamente
con el denominador: en efecto, el numerador solo se anula para s = R/L, en cuyo caso el denominador toma el
valor 1/(LC). Por tanto, la función q(s) tiene dos polos simples en s = ± , respectivamente. (Si 4L = R2 C solo
hay un polo doble).
Sin embargo, en lugar de evaluar la integral compleja ilustraremos cómo se puede invertir q(s) empleando
ventajosamente las propiedades algebraicas de las transformadas y el conocimiento de la transformada de los
monomios:
✓ ◆  ✓ ◆
R 1 1 1 Q0 R
q(s) = Q0 s + = s+ L[et + et ]
L + s + s + L
0 1
transformada ✓  ◆
@ de la derivada A = Q0 d t + t R t + t
L e e + L[e e ]
et + et | =0 + dt L
t=0


1 Q0 d t + R t +
) Q(t) = L [q] = e et + e et
+ dt L
✓ ◆ ✓ ◆
Q0 R t + R t
= ++ e + e .
+ L L
Como Re ± < 0, se verifica Q(t ! +1) ! 0, es decir, para tiempos largos el condensador se descarga
totalmente. Sin embargo, el comportamiento cualitativo de cómo se produce la descarga dependerá de si los
números ± son reales o complejos. Si 4L > R2 C, definimos
r
R R p 2
1 R2
± = ± i!, ! := 1 4L/R C = ,
2L 2iL LC 4L2
de manera que
✓ ◆ ✓ ◆ 
Q0 tR/2L R R R
Q(t) = e i! + ei!t i! + e i!t = Q0 e tR/2L cos !t + sen !t ,
2i! 2L 2L 2L!
esto es, oscilaciones armónicas amortiguadas de frecuencia !; en el lı́mite p de baja disipación (R ! 0),pla amor-
tiguación es muy lenta y la frecuencia de las oscilaciones se aproxima a 1/ LC, con Q(t) ⇡ Q0 cos(t/ LC). En
el caso opuesto 4L < R2 C, la carga se anula sin realizar oscilaciones (régimen sobreamortiguado). En particular,
en el lı́mite de disipación muy grande (R ! 1), se tiene
8 1 9
 ✓ ◆ >
> +⇡ !0 > >
R 2L < RC =
± ⇡ 1 ± 1 ) ) Q(t) ⇡ Q0 e t/(RC) .
2L R2 C >
> R >
>
: ⇡ ! 1 ;
L
Quedar por estudiar la situación particular 4L = R2 C, de manera que + = = R/(2L) y la transformada
q(s) tiene un solo polo doble. En este caso,
 ✓ ◆
(s + R/L)Q0 1 R/2L tR/2L R tR/2L
q(s) = = Q0 + = Q0 L[e ]+ L[te ]
(s + R/2L)2 s + R/2L (s + R/2L)2 2L
✓ ◆
tR
) Q(t) = Q0 1 + e tR/2L .
2L
Este ejemplo ilustra cómo la estructura de singularidades de la transformada refleja de manera directa el com-
portamiento de la transformada inversa.
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 25

6.3. Distribuciones y soluciones generalizadas


Podemos resumir lo visto hasta ahora como sigue: dada una función f (t) definida en cierto intervalo a < t < b,
se le asocia una nueva función F (s) mediante una transformada integral, definida como el funcional (=función
de funciones)
Z b
F (s) := dt K(t, s)f (t).
a
Aquı́, K(t, s) está dado y se denomina núcleo de la transformación. Si el núcleo K(t, s) se elige convenientemente,
la función F (s) posee “la misma información” que f (t), en el sentido de que el conocimiento de F (s) permite
reconstruir f (t) completamente. Ignoremos en lo que sigue el parámetro s de momento y consideremos a efectos
conceptuales para los siguientes razonamientos el funcional más simple dado por la expresión
Z b
DK [f ] := dt K(t)f (t),
a

es decir, no se trata de una función, sino de un número, pero sigue siendo un funcional, caracterizado por el
núcleo K(t). Esta expresión permite introducir una clase nueva de objetos matemáticos, pues veremos que el
núcleo K(t) no necesariamente ha de ser una función ordinaria para que la integral esté bien definida. Este
nuevo objeto se denomina función generalizada o distribución y permite extender el concepto de soluciones de
una ecuación diferencial: además de las soluciones clásicas o fuertes, será posible considerar las denominadas
soluciones generalizadas o débiles.

Veamos un par de ejemplos fı́sicos para motivar estos conceptos:


1. Las ecuaciones de la electrostática se pueden formular de varias maneras equivalentes que contienen las
dos leyes fı́sicas fundamentales de la electrostática (ley de Coulomb y principio de superposición):

solución ecuaciones ecuaciones


explı́cita , integrales , diferenciales
I
dq(r0 )
Z z }| { dr · E = 0, 8C cerrado r⇥E=0
1 r r0
E(r) = d3 r0 %(r0 ) C
4⇡✏0 |r r0 |3 I %
QS r·E=
dA · E = , 8S cerrada ✏0
8r 2 R3 S ✏0
La versión diferencial son EDPs, ası́ que por definición de solución solo son admisibles campos E(r) conti-
nuos y derivables. Además, solo tienen sentido cuando la densidad volúmica de carga %(r) está bien definida,
lo cual no sucede con bastantes modelos de relevancia fı́sica, por ejemplo:
carga puntual q q r
) E(r) = ) singularidad en r = 0,
situada en r0 = 0 4⇡✏0 r3
8
>
> ex , x>0
< 2✏0
plano x0 = 0 cargado
) E(r) = ) discontinuidad en x = 0.
con densidad uniforme >
>
: ex , x<0
2✏0
Estos campos tienen en común que están generados por distribuciones de carga que no se pueden carac-
terizar mediante una densidad volúmica de carga. Por ello, estos campos no son soluciones admisibles de
las EDPs, pero sin embargo sı́ verifican las versiones integrales y tienen sentido y utilidad fı́sica. Debido
a que la condición de derivabilidad es más restrictiva que la de integrabilidad, las ecuaciones integrales
admiten más soluciones que las diferenciales, y estas soluciones adicionales son de interés fı́sico. ¿Es posible
incorporarlas en un marco unificado de soluciones para las EDPs? De manera más general, ¿es posible
describir matemáticamente la densidad asociada al concepto fı́sico de carga puntual o de plano cargado?
26 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Recordemos cómo se relacionan las versiones diferencial e integral de las ecuaciones. Por ejemplo, para la
ecuación de Gauss se introduce la función indicadora del volumen V ,

1, r 2 V,
V (r) :=
0, r 62 V,

de manera que la versión integral se obtiene multiplicando la diferencial por V e integrando:


Z Z Z 
3 1 3 3 %(r)
d r V (r) r · E(r) = d r V (r) %(r) , d r V (r) r · E(r) = 0, 8 V .
R3 ✏ 0 R3 R3 ✏0
| {z }
carga encerrada QS

En lenguaje de funcionales, se puede escribir esta ecuación como

DK [ V ] = 0, 8 función indicadora V (r),

para el núcleo
%(r)
K(r) := r · E(r) ,
✏0
dentro del cual aparece la incógnita del problema.
2. Consideremos una partı́cula de masa m bajo la acción de una fuerza externa Fext (t). La evolución está
regida por la segunda ley de Newton,
dv dx
m = Fext (t), posición x(t), velocidad v(t) = .
dt dt
Hay una versión integral de esta ecuación, que expresa de manera equivalente la misma ley fı́sica en el
lenguaje de balance de la cantidad de movimiento p(t) = mv(t): si T > 0 es la duración de un intervalo de
tiempo, entonces se puede integrar la EDO anterior para encontrar
Z T
p(T ) p(0) = pext (T ) := dt Fext (t),
0

donde pext (T ) es el cambio en la cantidad de movimiento inducido por la fuerza externa. Esta segunda
expresión es útil cuando la fuerza externa es de tipo impulsivo, es decir, que provoca un cambio finito en
la cantidad de movimiento de manera instantánea: por ejemplo, en el choque elástico con una superficie
dura, como una pared o u otra partı́cula. Este tipo de fuerzas no se pueden expresar mediante una función
ordinaria Fext (t), pero sı́ se pueden incorporar en la ecuación integral a través de pext (T ).
De manera más precisa: si se introduce la función indicadora

1, T1 < t < T2 ,
T1 ,T2 (t) :=
0, t 62 (T1 , T2 ),

entonces se puede formular la segunda ley de Newton como


DK [ T1 ,T2 ]
zZ }| {
+1
dv
dt T1 ,T2 (t) m Fext (t) = 0, 8 T1 ,T2 .
1 dt
| {z }
=:K(t)

Tiene de nuevo la forma de una ecuación funcional, cuya incógnita se encuentra en el núcleo.
En conclusión, las ecuaciones diferenciales que describen leyes fı́sicas se pueden reformular de manera equiva-
lente como ecuaciones integrales, cuyas soluciones no solo incluyen las clásicas de la ecuación diferencial, sino
también las soluciones generalizadas. Además, el procedimiento para asociar una ecuación integral a una EDO
es generalizable a ecuaciones desde un punto de vista puramente matemático.
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 27

6.3.1. Distribuciones

Definición: , una función (x) definida en todo el eje real se denomina función de prueba si es analı́tica (esto es,
infinitamente derivable) y si ella y todas sus derivadas decaen en el infinito más rápido que cualquier potencia.
El conjunto de todas las funciones de prueba se llama espacio (funcional) de Schwartz S.

Comentarios: La función y todas sus variables con continuas, ya que existen sus derivadas. Y es evidente que
las derivadas de una función de prueba también son funciones de prueba. Un ejemplo de función de prueba es la
2
gausiana, (x) = e x : es analı́tica en todo el eje real, sus derivadas vienen dadas como
2
dn (e x ) x2
= ( 1)n Hn (x) e , Hn (x) = polinomios de Hermite,
dxn
y todas estas funciones se anulan en el infinito exponencialmente. Se pueden definir otros tipos de funciones de
prueba; la definición que empleamos aquı́ es útil en problemas fı́sicos y conduce a las denominadas “distribuciones
temperadas” . La razón de ser de esta definición de funciones de prueba es el siguiente

lema: , todas las funciones de prueba poseen transformada de Fourier, la cual también es una función de prueba:
si (x) 2 S, entonces (k) := F[ ] 2 S.

Demostración:

Es evidente que la transformada de Fourier (k) existe puesto que las funciones de prueba son continuas
y absolutamente integrables (porque decaen en el infinito muy rápido). De manera más general, todas las
funciones de la forma
Z +1 Z +1
(n) dn dn ikx
(n = 0, 1, 2 . . . ) (k) := = dx e (x) = dx e ikx ( ix)n (x) = ( i)n F[xn ]
dk n dk n 1 1

existen puesto que las funciones xn (x) también son evidentemente funciones de prueba. Por tanto, (k)
es analı́tica en todo el eje real.
(n)
Para comprobar que las funciones (k) decaen en el infinito más rápido que cualquier potencia, consi-
deremos las funciones de la forma
 m
m (n) m n n ( i)n d
(m, n = 0, 1, 2 . . . ) k (k) = k ( i) F[x ]= m F (xn ) ,
i dxm

que existen para cualquier valor de k porque las funciones (xn (x))(m) son evidentemente también funciones
(n)
de prueba. En particular, existirá el lı́mite Am := lı́mk!1 |k m (n) (k)| para cualquier par (m, n). Por tanto,
se debe cumplir
(n)
Am+1 = lı́m kk m (n) (k) = lı́m kA(n) m < 1,
k!1 k!1
(n)
lo cual solo es posible si Am = 0.

Por ejemplo, la gausiana es una función de prueba, y su transformada de Fourier, otra gausiana, también.

Definición: , , sea E un espacio funcional, en el que se consideran las aplicaciones

D: E ! C
(x) 7 ! D[ ]

El conjunto de estas aplicaciones que además están acotadas y son lineales se denomina espacio dual E ⇤ .
28 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Comentarios:
Es decir, D 2 E ⇤ si verifica

acotación: |D[ ]| < 1, 8 2 E,

linealidad: D[a + b ] = aD[ ] + bD[ ], 8 , 2 E, 8a, b 2 C.

Consideremos el espacio RN , cuyos elementos se pueden representar como las N -tuplas x = (x1 , x2 , . . . xN ).
La función lineal más general de x se puede escribir como
N
X
D(x) = tk xk = t · x, tk 2 C,
k=1

es decir, como el producto escalar por un vector complejo t 2 CN , el cual por tanto caracteriza el funcional
D. En consecuencia, el espacio dual es equivalente al conjunto de vectores complejos de dimensión N , es

decir, RN = CN . Este ejemplo simple ilustra varios aspectos claves: (i) el concepto de espacio dual
no es exclusivo de espacios funcionales; (ii) el espacio dual es diferente en general del espacio original: en
particular, puede poseer elementos diferentes a los del espacio original, pero los del espacio original también
pueden pertenecer al espacio dual.
Sea ahora la función (x) 2 E, que suponemos que se puede representar con precisión arbitraria mediante
su valor en una serie de N puntos equiespaciados en un intervalo finito, a  x  b:

~ := ( b a
0, 1, . . . N) , k := (xk = a + k x), k = 0, 1, 2 . . . N x := .
N

Es decir, asociamos la función (x) con la N -tupla ~ 2 CN . Los funcionales lineales se podrán entonces
representar como
=:T (xk )
N N z}|{ Z Z
X X tk x!0
b
a,b!1
+1
D[ ] = tk k = x k ! dx T (x) (x) ! dx T (x) (x)
x a 1
k=0 k=0

Por tanto, los elementos del espacio dual E ⇤ se pueden entender como una generalización del producto
escalar ordinario y se representan mediante el tipo de expresiones funcionales que ya nos hemos encontrado
al discutir transformadas. Lo interesante es que el núcleo T (x) que se obtiene al tomar el lı́mite del continuo
( x ! 0) no está restringido a ser una función ordinaria. Por ejemplo, la aplicación que asocia a cada
función su valor y el de su derivada en un punto xµ = a + µ x es claramente un elemento del espacio dual
(suponiendo que la función y su derivada estén definidas en ese punto), pero el núcleo T (x) no se puede
entender como función ordinaria:
N
X µ,k
(xµ ) = lı́m µ,k k ) T (x) = lı́m = ?,
x!0 x!0 x
k=0

N
X
0 (xµ + x) (xµ ) µ+1,k µ,k µ+1,k µ,k
(xµ ) = lı́m = lı́m k ) T (x) = lı́m = ?.
x!0 x x!0 x x!0 ( x)2
k=0

Esta motivación es puramente heurı́stica. Ya veremos más adelante cómo manejar este tipo de objetos
matemáticos de manera rigurosa.
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 29

Definición: , , , , un elemento del espacio dual de Schwartz se denomina distribución temperada o función
generalizada.

Puesto que un funcional lineal está caracterizado por su núcleo T (x), por abuso del lenguaje este se suele
denominar también distribución o función generalizada. El adjetivo “temperado” se refiere, como ya se comentó,
a que se utiliza el espacio de Schwartz para construir las distribuciones. Si se emplea un espacio diferente de
funciones de prueba, se obtiene otro tipo de distribuciones.
Todas las funciones de prueba 2 S son también distribuciones, puesto que las expresiones del tipo
Z +1
D [ ] := dx (x) (x)
1

existen y son finitas para cualquier función de prueba (x): esto es evidente, puesto que el integrando es continuo
y en el infinito se anula más rápido que cualquier potencia. Por tanto, S ⇢ S ⇤ . Sin embargo, también es una
distribución cualquier función ordinaria T (x) para la cual
Z +1
DT [ ] := dx T (x) (x) < 1, 8 2 S.
1

Para que esto ocurra es suficiente si la función no es “demasiado discontinua” (más adelante veremos condiciones
más especı́ficas) y si en el infinito no crece más rápido que una potencia: por ejemplo, cualquier polinomio.
Pero es posible encontrar otras distribuciones “más exóticas”: para los ejemplos que se mencionaron antes
(la distribución que selecciona el valor de la función de prueba o de su derivada en un punto) se introduce la
denominada distribución delta de Dirac (x) y su derivada (que ya estudiaremos en detalle y rigor más adelante):
Z +1
D [ ] := dx (x) (x) := (0) finita,
1

Z +1 ✓ ◆
d (x) 0
D 0 [ ] := dx (x) := (0) finita.
1 dx
El efecto de esta distribución es “seleccionar” en la integral el punto x = 0. Un momento de reflexión indica que
no es posible “dibujar” el objeto (x) como si fuera una función ordinaria.

Surge pues la pregunta de cómo construir aquellas distribuciones que no son simples funciones ordinarias. La
respuesta la proporciona el siguiente

teorema: cualquier distribución se puede representar como el lı́mite de una sucesión de funciones ordinarias.

Comentarios:

Este resultado es una de las razones de su utilidad en fı́sica: permite representar las configuraciones simples
e idealizadas que se suelen emplear en los modelos fı́sicos (masa puntual, plano infinito cargado, acción
instantánea de una fuerza, cambio brusco en la f.e.m. de un circuito eléctrico . . . ) como distribuciones que
se obtienen al tomar el lı́mite de configuraciones más realistas.

Como ejemplo, consideremos la sucesión de funciones


8 n 1
>
> , |x| < ,
>
>
< 2 n
(n = 1, 2, 3 . . . ) tn (x) :=
>
>
>
> 1
: 0, < |x|,
n
30 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

que tienen forma de escalón, cada vez más estrecho y más alto según aumenta n, pero que subtienden todos
el mismo área:
Z +1 Z
n +1/n
dx tn (x) = dx = 1.
1 2 1/n

Se puede construir la correspondiente sucesión de distribuciones,


Z +1 Z +1/n
n
Dtn [ ] := dx tn (x) (x) = dx (x).
1 2 1/n

Cuando n ! 1, el rango de integración se reduce alrededor del punto x = 0 y podemos aproximar la


función analı́tica del integrando por su desarrollo de Taylor. Entonces
Z +1/n
n
lı́m Dtn [ ] = lı́m dx (0) = (0) = D [ ].
n!1 n!1 2 1/n

Como esta igualdad se verifica para cualquier función de prueba, se concluye que la sucesión converge a la
delta de Dirac en el sentido de las distribuciones,

dist.
lı́m tn (x) = (x).
n!1

(En lo sucesivo omitiremos el calificativo “dist.” de la igualdad: el contexto debe dejar claro si la igualdad
se entiende en sentido de funciones ordinarias o de distribuciones). El dibujo de las funciones tn (x) ilustra
claramente por qué (x) no es una función ordinaria. Como veremos, esta distribución se emplea en fı́sica
para representar configuraciones puntuales y acciones instantáneas.

Otra razón de la utilidad de las distribuciones radica en el siguiente

lema: , las distribuciones se pueden sumar y derivar infinitas veces y poseen transformada de Fourier.

Comentarios: no se trata tanto de un lema como de una definición, puesto que no se han definido aún las nociones
de suma, derivada y transformada de distribuciones. La definición de suma es inmediata (notemos, sin embargo,
que en general no se puede definir consistentemente el producto de distribuciones, lo cual constituye el contenido
del teorema de la imposibilidad de Schwartz). Para definir derivada y transformada, consideremos una función
ordinaria T (x) que se puede interpretar como distribución, es decir, que conduce a una distribución DT bien
definida porque las integrales
Z +1
DT [ ] := dx T (x) (x)
1

están bien definidas para cualquier función de prueba 2 S.

Supongamos que además T (x) es derivable. Entonces, para cualquier función de prueba (x) se obtiene el
siguiente resultado integrando por partes:
0
finito pues (x)2S
Z
0 pues (1)=0 rápido
Z zZ }| ✓ ◆{
+1 z }| { +1 +1
dT +1 d d 0
DT 0 [ ] = dx (x) = T (x) (x)| 1 dx T (x) = dx T (x) = DT [ ],
1 dx 1 dx 1 dx
0
ya que (x) está bien definida. De manera simbólica se puede escribir

dT d
= T .
dx dx
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 31

Supongamos que T (x) posee transformada de Fourier. Entonces, para cualquier función de prueba (x) se
obtiene el siguiente resultado intercambiando el orden de integración:
Z +1 Z +1 Z +1
DF [T ] [ ] := dk F[T ] (k) = dk (k) dx e ikx T (x)
1 1 1
Z +1 Z +1 Z +1
ikx
= dx T (x) dk (k)e = dx T (x) F[ ] = DT [F[ ]],
1 1 1 |{z}
| {z } 2S
F[ ]

ya que F[ ] también es función de prueba.


Aunque estos resultados se han obtenido cuando T (x) es una función ordinaria, se emplean como definición para
el caso de distribuciones arbitrarias:
0
derivada de una distribución: DT 0 [ ] := DT [ ],

transformada de Fourier de una distribución: DF [T ] [ ] := DT [F[ ]].

Como vemos, la idea es “transferir” a la función de prueba la manipulación que se pretende realizar sobre la
distribución (derivación, integración). Como la función de prueba posee buenas propiedades, la manipulación
estará bien definida para ella y permitirá extender el correspondiente concepto a la distribución. La utilidad de
estos resultados radica en que tiene sentido buscar soluciones de ecuaciones diferenciales lineales no solo como
funciones ordinarias, sino también como distribuciones: estas son las llamadas soluciones generalizadas de la
ecuación diferencial. La imposibilidad de definir el producto de distribuciones limita su utilidad con ecuaciones
no lineales.
Una consecuencia notable y muy útil para la aplicación a ecuaciones diferenciales se sigue de combinar las
definiciones de derivada y transformada para obtener la expresión de la transformada de la derivada en el
sentido de las distribuciones: recordando el resultado 0 (k) = F[ ix (x)] derivado anteriormente para funciones
de prueba, se puede escribir

0 8 2S
DF [T 0 ] [ ] = DT 0 [F[ ]] = DT [ ] = DT [F[ix ]] = DF [T ] [ix ] = DikF [T ] [ ] ) F[T 0 ] = ikF[T ],
| {z }

es decir, se verifica la misma fórmula que ya se dedujo para el caso de funciones ordinarias. Notemos, sin embargo,
que los requisitos sobre T (x) para la validez son diferentes (de hecho, más laxos): basta con que T (x) represente
una distribución bien definida, lo cual es menos restrictivo que las condiciones especiales sobre continuidad o
integrabilidad de una función ordinaria.

6.3.2. Algunas distribuciones relevantes

Distribución x 1 : la función ordinaria T (x) = x 1 no es una distribución porque la singularidad en x = 0 no


es integrable. Sin embargo, se puede definir la sucesión de funciones
8
< 0, |x| < ",
>
t" (x) := con " ! 0+ ,
: 1 , " < |x|,
>
x
que sı́ define una distribución, pues estas funciones no tienen singularidad en x = 0 y la siguiente integral es
finita:
Z +1 Z Z " Z +1 Z +1
(x) (x) (x) (x) ( x)
Dt" [ ] = dx t" (x) (x) = dx = dx + dx = dx .
–1 |x|>" x x x x
| –1 {z } +" +"
x! x
32 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Más aún, el lı́mite " ! 0 también es finito, ya que el integrando es regular en x = 0:

(x) ( x) 0 L0 Hopital
lı́m = = lı́m [ 0 (x) + 0
( x)] = 2 0 (0).
x!0 x 0 x!0

Por tanto, esta sucesión de funciones define una distribución:

Z +1 Z Z +1
1 (x) (x) (x) ( x)
VP := lı́m t" (x) , D1/x := VP dx = lı́m dx = dx ,
x "!0 1 x "!0 |x|>" x 0 x

donde el prefijo VP (valor principal) se refiere a la forma en que la singularidad en x = 0 es excluı́da y se


añade para distinguir la distribución 1/x de la función ordinaria 1/x (cuando el contexto permite la distinción,
es habitual prescindir del prefijo VP para simplificar la notación). Esencialmente, la idea de la definición es
aprovechar que la función x 1 es impar para expresar la integral como suma de dos integrales idénticas, de
manera que la integral resultante sea convergente debido a la cancelación de la singularidad en x = 0. Las
propiedades más relevantes de esta distribución para nuestros propósitos son su derivada y su transformada de
Fourier:

Se define la distribución (de nuevo vale añadir el prefijo VP cuando es necesario distinguir entre la distri-
bución y la función ordinaria 1/x2 )
✓ ◆
1 d 1
VP 2 := ,
x dx x

que se evalúa empleando la definición de la derivada de una distribución:

0
Dx 2[ ] D( x 1 )0 [ ] D x 1[ ]
z Z }| { z Z ✓ ◆ }| { z Z }| { Z
+1 +1 +1 0 +1 0 0
1 d 1 (x) (x) ( x)
VP dx 2 (x) := VP dx (x) = VP dx = dx .
1 x 1 dx x 1 x 0 x

Esta integral se puede expresar de una manera equivalente como sigue:

Z +1 Z +1 0 (x) 0( Z +1
1 x) 1 d
VP dx (x) = lı́m dx = lı́m dx [ (x) + ( x)]
1 x2 "!0 +" x "!0 +" x dx
( Z )
+1 +1
(x) + ( x) (x) + ( x)
(por partes) = lı́m + dx
"!0 x +" +" x2
⇢ Z +1
(") + ( ") (x) + ( x)
= lı́m + dx
"!0 " +" x2
⇢ Z +1 Z +1
(") + ( ") (x) + ( x)
= lı́m dx + dx
"!0 +" x2 +" x2
Z +1 Z +1
(x) + ( x) (") ( ") (x) + ( x) 2 (0)
= lı́m dx = dx ,
"!0 +" x2 0 x2

donde la última integral ya no tiene singularidad en x = 0:

(x) + ( x) 2 (0) 0 (x) 0( x)


L0 Hopital L0 Hopital 00
lı́m = lı́m = (0).
x!0 x2 x!0 2x
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 33

La transformada de Fourier se calcula como sigue , :


DF [x 1][ ] Dx 1 [ F[ ]]
zZ }| { z Z }| { Z
+1 +1 +1
1 1 (k) ( k)
dk F (k) = VP dk F [ ] = dk
1 x 1 k | {z } 0 k
(k)
2i sen kx
Z +1 Z +1 z⇥ }| {⇤
1 ikx
= dk dx e e+ikx (x)
0 k 1
Z +1 Z +1
sen kx
= dx (x) 2i dk
1 0 k
✓ ◆ Z +1 Z +1
q:=k|x| sen q
= dx (x) 2i d⇠ signo x
x/|x|= signo x 1 q
|0 {z }
⇡/2
Z +1
= dx (x) ( i⇡) signo x.
1

1 1 i
8 (x) función de prueba ) F = i⇡ signo k y por tanto F [ signo k] = .
x ⇡x

Estas manipulaciones son necesarias porque ni la transformada de Fourier de 1/x ni la transformada inversa
de signo k como funciones ordinarias están bien definidas.
Combinando estos resultados, se puede deducir la transformada de Fourier de la derivada:
  ✓ ◆ 
1 d 1 1 1
F 2 =F = ikF = ⇡k signo k = ⇡|k| , F 1 [ |k| ] = .
x dx x x ⇡x2

Se puede reiterar este procedimiento para dar sentido a las distribuciones de la forma
✓ ◆
1 1 d 1
:= , n = 1, 2, 3 . . .
xn+1 n dx xn

Este ejemplo muestra que este tipo de singularidades, que en una función ordinaria no son integrables, conducen
sin embargo a distribuciones bien definidas cuando se reinterpretan apropiadamente (en valor principal, tal como
se ha definido aquı́).

Distribución delta de Dirac: para motivar esta distribución veamos algunos ejemplos de relevancia fı́sica:
Consideremos una varilla homogénea de carga Q y longitud 2L. Se introduce la función
8
> 1
< , |x| < L,
dL (x) := 2L
>
:
0, L < |x|,

que representa la geometrı́a de la varilla. Entonces, el campo densidad lineal de carga %(x) es
Z +1 Z +L
Q
%(x) = QdL (x) ) dx %(x) = dx = Q.
1 L 2L

Si se denota (x) := lı́mL!0 dL (x), se puede escribir lı́mL!0 %(x) = Q (x) y el objeto matemático (x)
(“delta de Dirac”) representa una carga puntual, es decir, una carga finita concentrada en una región de
extensión nula.
34 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Consideremos una fuerza de la forma


8
> f
< , |t| < ⌧,
F (t) = f d⌧ (t) = 2⌧
>
:
0, |t| > ⌧.

Esta expresión representa una fuerza que actúa solo durante un intervalo de tiempo 2⌧ , pero provoca una
aceleración independiente de ⌧ : Z +1 Z +⌧
f
dt F (t) = dt = f.
1 ⌧ 2⌧
Por tanto, el lı́mite lı́m⌧ !0 F (t) = f (t) representa una fuerza impulsiva, que actúa durante un intervalo
de tiempo despreciable pero provoca un cambio finito en la cantidad de movimiento.
Consideremos una variable real y aleatoria x cuya distribución estadı́stica viene dada por la probabilidad
p(x) = dL (x), que representa equiprobabilidad de x en el intervalo L < x < +L, y probabilidad nula de
ocurrencia si |x| > L. Esta probabilidad está normalizada y sus momentos son finitos:
8
Z +1 Z +1 Z +L > Ln
1 < , si n es par,
dx p(x) = 1, hxn i = dx xn p(x) = dx xn = n+1
1 1 2L L >
:
0, si n es impar.

En el lı́mite L ! 0 se obtiene p(x) ! (x), hxn i ! 0 si n 1, ası́ que la delta de Dirac representa una
distribución en que la variable continua x toma con certeza el valor discreto x = 0.
Lo que tiene en común todos estos ejemplos es que las funciones dL (x) se hacen cada vez más estrechas cuando
L ! 1, pero a la vez también más altas de manera que el área subtendida no cambia con L. De manera rigurosa
la delta de Dirac (x) se tiene la siguiente

definición: la distribución delta de Dirac (x) se define como


Z +1
D [ ]= dx (x) (x) := (0), 8 (x) función de prueba.
1

A efectos prácticos, se suele definir la delta de Dirac de manera menos rigurosa como “aquella función que se
anula para cualquier x 6= 0 pero cuya integral es la unidad”:
Z +1
dx (x) = 1.
1

A partir de la definición se deducen las siguientes propiedades:


1. Paridad: ( x) = (x). Es evidente.
2. Traslación: si x0 es un número real, entonces
Z +1 Z +1
⇠:=x x0
dx (x x0 ) (x) = d⇠ (⇠) (⇠ + x0 ) = (x0 ).
1 1

1
3. Escalamiento: (ax) = (x) para cualquier número real a 6= 0:
|a|
Z +1 Z +1 ✓ ◆ Z +1
⇠:=|a|x 1 a 1
dx (ax) (x) = d⇠ ⇠ (⇠/|a|) = d⇠ (⇠) (⇠), 8 (x) función de prueba.
1 1 |a| |a| 1 |a|
| {z }

c Alvaro Domı́nguez, Univ. Sevilla Tema 6 35

4. Cambio de variable: si g(x) es una función real con ceros simples en los puntos x↵ , ↵ = 1, 2, . . . N , es decir,
g(x↵ ) = 0, g 0 (x↵ ) 6= 0, entonces
XN
1
(g(x)) = 0 (x )|
(x x↵ ).
↵=1
|g ↵

En efecto, puesto que la integral con la delta de Dirac solo contribuye en los puntos donde el argumento
de la delta se anula, se puede escribir (con " > 0 pequeño pero arbitrario)
Z +1 N Z
X x↵ +" N Z
X x↵ +"
dx (g(x)) (x) = dx (g(x)) (x) = dx (g 0 (x↵ )(x x↵ )) (x)
1 ↵=1 x↵ " ↵=1 x↵ "
Z +1 N
X Z +1 N
X 1
= dx (g 0 (x↵ )(x x↵ )) (x) = dx (x x↵ ) (x).
1 ↵=1 1 ↵=1
|g 0 (x ↵ )|

5. Derivada:
0
D 0[ ] D [ ]
zZ }| { zZ }| ✓ ◆{
+1 +1
0 d (x) 0
dx (x) (x) = dx (x) = (0).
1 1 dx
Por aplicación reiterada se obtiene la derivada n-ésima:
Z +1 Z +1 ✓ ◆n
(n) d
dx (x) (x) = dx (x) (x) = ( 1)n (n)
(0),
1 1 dx

lo que permite escribir simbólicamente

dn (x) dn
n
= ( 1)n (x) n , n = 0, 1, 2 . . .
dx dx

6. Se verifica xm (x) = 0 para m = 1, 2 . . . En efecto,

Z 2S
+1 z }| {
Dx m (x) [ ]= dx (x) xm (x) = xm (x)|x=0 = 0, 8 (x) función de prueba.
1

De manera más general, se prueba que xm (n)


(x) = 0 si 0  n < m = 1, 2, . . .

2S
Z z }| {
+1 n
nd [xm (x)] n
n d [x
m
(x)]
Dx m (n) (x) [ ] = dx (x) ( 1) n
= ( 1) n
1 dx dx x=0

Xn ✓ ◆
n n d↵ (xm ) dn ↵ n<m
= ( 1) ↵
= 0, 8 (x) función de prueba.
↵=0
n ↵ | dx
{z } dxn ↵
/ xm ↵ si ↵m x=0

De hecho, se puede demostrar el resultado inverso, cuya deducción veremos más adelante :

Lema: la solución de la ecuación xm T (x) = 0 en el sentido de las distribuciones es la combinación lineal


m
X1
(n)
T (x) = Cn (x), C0 , C 1 , . . . Cm 1 constantes arbitrarias.
n=0
36 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

7. Transformada de Fourier:
DF [ ] [ ] D [ F[ ] ]
zZ }| { zZ }| { Z
+1 +1 +1
8 2S 1
dk F[ ] (k) = dk (k) (k) = (0) = dx (x) ) F[ ] = 1 , F [1] = (x).
1 1 1

Combinando las expresiones para la transformada y la derivada se concluye


 n
d (x) dn (x)
F n
= ( ik)n , F 1 [k n ] = in .
dx dxn

8. Representación como lı́mite: existen numerosas formas de representar la delta de Dirac como lı́mite de
una sucesión de funciones ordinarias. Por ejemplo, el resultado anterior para la transformada de Fourier
conduce a la representación
Z +1 Z +R Z R
1 dk ikx dk dk sen Rx
(x) = F [1] = e = lı́m [cos kx + i sen kx] = lı́m cos kx = lı́m .
1 2⇡ R!1 R 2⇡ R!+1 0 ⇡ R!+1 ⇡x
Evidentemente, el lı́mite se debe entender en el sentido de las distribuciones; como función ordinaria la
sucesión no posee lı́mite. Otras posibles representaciones: (x) = lı́m"!0+ d" (x) con
8
> 1
e (x/")2
" e |x|/" < , |x| < ",
d" (x) = p , d" (x) = , d (x) = , d (x) = 2"
" "
⇡"2 ⇡(x2 + "2 ) 2" >
:
0, " < |x|.

Una forma sencilla de demostrar estos resultados es mediante las transformadas de Fourier. Por ejemplo,
|x|/"
e 1
d" (x) = ) F[d" ] = .
2" 1 + ("k)2
Como lı́m"!0 F[d" ] = 1 es una distribución temperada, podemos invertirla y concluir que la sucesión
converge a la delta de Dirac.
9. Acción sobre funciones que no son de prueba: tiene sentido considerar la delta de Dirac en integrales de la
forma
Z b
dx (x)g(x), g(x) no necesariamente función de prueba, a, b no necesariamente infinitos.
a

La idea para definir estas integrales es aproximar la función g(x) por una sucesión de funciones de prueba
(el razonamiento riguroso es considerar un espacio de funciones de pruebas más amplio que el de Schwartz,
y por tanto un espacio dual diferente, en el cual sin embargo sigue existiendo la delta de Dirac como
distribución). Algunos ejemplos de utilidad práctica:
g(x) = e ikx no es una función de prueba porque no se anula en el infinito. Pero se pueden considerar
las funciones de prueba de la forma
"x2
" (x) := e e ikx ,
que en el lı́mite " ! 0 se aproximan a la función deseada. Como
Z +1
dx (x) " (x) = " (0) = 1
1

exactamente, se puede asumir


Z +1 Z +1
ikx
dx (x) e ⌘ lı́m dx (x) " (x) = 1.
1 "!0 1
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 37

Si la función g(x) solo está definida en el rango a < x < b, se puede definir una sucesión de funciones
de prueba n (x) definidas en todo el eje real y que convergen cuando n ! 1:

g(x), a < x < b,
lı́m n (x) =
n!1 0, x 62 (a, b).

Es decir, las funciones n (x) regularizan las discontinuidades en x = a, b, donde son suaves en lugar
de tener un salto. Entonces,
Z b Z +1 ⇢
g(x0 ), a < x0 < b,
dx (x x0 )g(x) ⌘ lı́m dx (x x0 ) n (x) = lı́m n (x0 ) =
a n!1 1 n!1 0, x0 62 (a, b).

Una aplicación particular de este resultado es que también se puede definir la transformada de Laplace
de la delta de Dirac :
Z +1 ⇢
0, t0 < 0,
L[ (t t0 )] := dt e st (t t0 ) =
0 e st0 , 0 < t0 .

Se pueden resumir estos resultados en la observación de que el efecto de la delta de Dirac (x x0 ) en una
integral es seleccionar el valor del resto del integrando (aunque no sea una función de prueba) en el punto
x0 siempre que esté definido ahı́ y que este punto se encuentre en el interior del dominio de integración.

Distribución de Heaviside: la distribución H(x) de Heaviside se define como


Z +1 Z +1
DH [ ] = dx H(x) (x) := dx (x), 8 (x) función de prueba.
1 0

A la vista de la definición, se suele escribir también



0, x < 0,
H(x) :=
1, 0 < x,

de manera que esta distribución se suele emplear en fı́sica para representar un salto finito en alguna magnitud.
Sin embargo, esta expresión no se debe interpretar como una función ordinaria. La diferencia queda patente al
calcular la derivada: como función ordinaria no es derivable en x = 0 debido a la discontinuidad, mientras que
como distribución su derivada está bien definida en todos los puntos:
0
DH 0 [ ] DH [ ]
zZ }| { zZ }| ✓ ◆{ Z +1
+1 +1
d (x) d (x)
dx H 0 (x) (x) = dx H(x) = dx
1 1 dx 0 dx
Z +1
8 2S
= (0) = dx (x) (x) ) H 0 (x) = (x).
1

Este último resultado motiva la siguiente expresión simbólica de la distribución de Heaviside:


Z x
H(x) = ds (s),
1

es decir, H(x) representarı́a el área bajo la “curva” de la delta de Dirac. Y de manera complementaria, se puede
escribir la integral de H(x) como:
Z x ⇢
0, x < 0,
ds H(s) = = xH(x),
0 x, 0 < x,

que sı́ puede interpretarse como integral de funciones ordinarias.


38 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

También se puede calcular la transformada de Fourier:


DF [H] [ ] DH [ F [ ] ]
zZ }| { zZ }| { Z
+1 +1 +1
dk F[H] (k) = dk H(k) (k) = dk (k).
1 1 0

No es sencillo deducir de aquı́ una expresión manejable para F[H]. Es más inmediato deducirla a partir de las
transformadas ya obtenidas para otras distribuciones:
2⇡ (k) 2i/k
1 + signo x 1 z}|{ 1 z }| { 1
H(x) = ) F[H] = F[1] + F[ signo x] = ⇡ (k) + VP ,
2 2 2 ik
1
donde el prefijo VP enfatiza explı́citamente que k se debe entender como distribución.

Finalmente, y al igual que sucede con la delta de Dirac, también se puede definir la transformada de Laplace de
la distribución de Heaviside:
Z +1 ⇢
st 1/s, t0 < 0 t0 >0 1
L[H(t t0 )] = dt e H(t t0 ) = st0 = L[ (t t0 )].
0 e /s, 0 < t0 s

6.3.3. Ejemplos

1. Solución de xm T (x) = 0, m = 1, 2, 3 . . . : como función ordinaria, la solución de esta ecuación serı́a



0, x 6= 0,
T (x) =
arbitrario, x = 0.

Para resolverla en el sentido de las distribuciones aplicamos la transformada de Fourier para convertirla en
una EDO:
im dm (e ikx )/dkm
Z +1 z }| {
dm !
F[xm T (x)] = dx T (x) xm e ikx = im m F[T ] = 0,
1 dk
m
X1
cuya solución general es un polinomio de grado m 1, F[T ] = Cn k n . La transformada inversa es
n=0
sencilla:
( i)n dn (eikx )/dxn !Cn (x)
m
X1 m
X1 Z +1 z }| { X1 z
m }| { dn z }| { m X1
1 n dk
T (x) = Cn F [k ] = Cn k n eikx = Cn ( i)n n F 1 [1] = Cn (n)
(x).
n=0 n=0 1 2⇡ n=0
dx n=0

2. Transformada de Fourier de funciones que no se anulan en el infinito: para estas funciones no


converge la integral de Fourier como función ordinaria, pero existe la posibilidad de interpretarlas como
distribuciones temperadas, y por tanto con transformada de Fourier entendida como distribución. Ya hemos
visto algún ejemplo, como la función
Z Z
eit + e it 1 ⇥ it ⇤ 1 ⇥ it ⇤ 1 +1 i(! 1)t 1 +1
g(t) = cos t = ) G(!) = F e + F e = dt e + dt e i(!+1)t
2 2 2 2 1 2 1
= ⇡ (! 1) + ⇡ (! + 1),

empleando la definición de transformada de una distribución (en este caso indirectamente a través de la
delta de Dirac). Sin embargo, para la mayorı́a de las funciones no es sencillo aplicar esta definición porque
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 39

no conduce a expresiones útiles. En su lugar es mejor aplicar el resultado de que cualquier distribución
se puede representar como una sucesión de funciones ordinarias. A modo de ilustración consideremos la
2
función g(t) = eiat = cos(at2 ) + i sen(at2 ) con a > 0, que no posee lı́mite cuando t ! 1, de manera que
la integral de Fourier Z +1
i!t iat2
F[g] = dt e e
1

no converge como función ordinaria. Sin embargo, g(t) sı́ es una distribución temperada, ya que las integrales
de la forma Z +1
2
dt (t)eiat
1

convergen para cualquier función de prueba (t). Esto significa que la transformada de Fourier existe
como distribución. Para calcularla, escribimos la función original como lı́mite de una sucesión de funciones
ordinarias: 2
g(t) = lı́m+ g" (t), g" (t) := e (" ia)t .
"!0

A diferencia de g(t), existe la transformada de Fourier como funciones ordinarias para todos los elementos
g" (t) con " > 0:
Z +1 Z +1
2 2
G" (!) = F[g" ] = dt e i!t e (" ia)t = 2 dt e (" ia)t cos !t
1 0
Z +1 Z +1
2
i!t (" ia)t2
= dt ei!t (" ia)t
+ dt e .
0 0

Debemos pues evaluar integrales de la forma


Z R
(" ia)t2
lı́m dt h(t) con h(t) := e±i!t , a, " > 0.
R!+1 0

La continuación analı́tica h(z 2 C) es una función sin singularidades en todo el plano complejo y por tanto
se puede deformar el camino de integración de manera arbitraria. Evaluemos pues la siguiente integral a
lo largo de un camino cerrado que recorremos en sentido antihorario:
I
J := lı́m dz h(z)
R!+1 LR [KR [DR

con los tramos


LR := {z = t | 0 < t < R} , semirrecta a lo largo del eje real,

KR := z = Rei' | 0 < ' < ⇡/4 , arco de cı́rculo,

DR := z = tei⇡/4 | 0 < t < R , bisectriz del primer cuadrante.

Como h(z) no tiene singularidades, J = 0 y la integral buscada se podrá calcular como


Z +1 Z
dt h(t) = lı́m dz h(z).
0 R!+1 KR [DR

La integral a lo largo del tramo recto DR es


Z 0 Z +1 Z +1
i⇡/4
(" ia)t2 ei⇡/2 i⇡/4
(a+i")t2
lı́m dt e i⇡/4
h(te i⇡/4
)= e i⇡/4
dt e±i!te e = e i⇡/4
dt e±i!te e .
R!+1 R 0 0

Esta expresión explica la elección del camino DR , porque se obtiene una integral gausiana que converge
incluso si " = 0.
40 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

Por último, la integral a lo largo de KR se anula en el lı́mite R ! 1:


Z ⇡/4 Z ⇡/4
i'
ia)R2 e2i'
i'
d' iRe h(Re ) i'
= d' iRei' e±i!Re e ("
0 0
e<0 incluso si "=0
Z ⇡/4 z }| {
(" cos 2'+a sen 2')R2
= d' Re⌥!R sen ' e e|i(...
{z }
)
0
|·|=1
R!1
! 0.

Por tanto, Z Z
+1 +1
±i!t (" ia)t2 "!0 i⇡/4
at2
dt e ! e i⇡/4
dt e±i!te e .
0 0
En conclusión, deformando el camino de integración en el plano complejo se ha podido expresar la integral
original como una integral convergente incluso en el lı́mite " ! 0. Combinando estas expresiones se puede
escribir
Z +1 h i
2 i⇡/4 i⇡/4
lı́m G" (!) = ei⇡/4 dt e at ei!te + e i!te
"!0 0
✓ ◆ Z h i Z +1
integrando ei⇡/4 +1 at2 i!tei⇡/4 i!tei⇡/4 i⇡/4 2 i⇡/4
= dt e e +e =e dt e at ei!te
par en t 2 1 1
i⇡/4 Z +1 i⇡/4
p r ⇣ ⌘
e 2
i⇡/4
!ep e ⇡ i⇡/4 p 2 ⇡ i ⇡4 !4a2
p ⌧ i⌧ (!e /2 a)
(⌧ :=t a) = p d⌧ e e a = p e = e .
a 1 a a
Como esta expresión se puede interpretar como una distribución temperada, el lı́mite " ! 0 de la trans-
formada está bien definida en el sentido de las distribuciones y se puede concluir la igualdad
h 2 i r ⇡ ⇣ ⇡ !2 ⌘
i
F eiat = e 4 4a
a
en el sentido de las distribuciones. A partir de aquı́ se pueden deducir fácilmente las transformadas de
cos(at2 ) y sen(at2 ) por separado: notemos que tanto
Z +1 Z +1
2 i!t 2
F[cos(at )] = dt e cos at = dt cos !t cos at2
1 1

como Z Z
+1 +1
2 i!t 2
F[sen(at )] = dt e sen at = dt cos !t sen at2
1 1
son funciones reales. Por tanto,
8 h 2i r⇡ ✓
⇡ !2

>
> 2 iat
>
> F[cos(at )] = Re F e = cos ,
h 2
i < a 4 4a
F eiat = F[cos(at2 )] + i F[sen(at2 )] )
>
>
> h 2i r⇡ ✓
⇡ !2

>
: F[sen(at2 )] = Im F eiat = sen .
a 4 4a

3. EDO para la distribución de Heaviside: para poder utilizar el método anterior hay que asegurarse
de que el lı́mite " ! 0 existe como transformada. Un ejemplo de cuando esto no sucede lo proporciona la
distribución de Heaviside, cuya integral de Fourier
Z +1 Z +1
dx H(x)e ikx = dx e ikx
1 0
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 41

no existe como función ordinaria, pero la distribución se puede aproximar mediante una sucesión,
"x
H(x) = lı́m+ H(x)e .
"!0

La transformada está definida para los elementos de esta sucesión:


Z +1 Z +1
"x ikx 1 "!0 1
dx H(x)e e = dx e (ik+")x = ! .
1 0 ik + " ik
Comprobamos, sin embargo, que el lı́mite de esta transformada no es una distribución temperada, puesto
que hace falta la prescripción de valor principal para dar sentido a k 1 y esta no se puede introducir aquı́
sin más justificación. Esto solo significa que la sucesión elegida para representar H(x) no sirve para este
propósito y habrı́a que buscar una sucesión diferente. En lugar de este procedimiento, vamos a obtener la
transformada de Fourier de H(x) resolviendo la EDO que obedece:
! F !
H 0 (x) = (x) ) F[H 0 ] = ikF[H] = F[ ] = 1.
Teniendo en cuenta que la ecuación homogénea kT (k) = 0 en el sentido de las distribuciones tiene la
solución T (k) = C (k), con C una constante arbitraria, entonces se puede escribir
1
F[H] = VP + C (k),
ik
donde se ha introducido el prefijo VP para enfatizar que k 1 se debe entender como distribución. El
término C (k) representa una constante aditiva en H(x) y surge al resolver una EDO de primer orden. Su
valor se determina imponiendo alguna otra condición: en la EDO podrı́a ser un valor inicial, pero esto no
ayuda para la transformada de Fourier. En su lugar, imponemos alguna propiedad global de H(x) que se
pueda transferir a la transformada, por ejemplo alguna propiedad de paridad: se impone que la distribución
g(x) := H(x) 1/2 es impar, lo cual implica que también lo será su transformada:
ikx
Z e Z
+1 z }| { g(x) impar
+1
G(k) := F[g] = dx g(x) [cos kx i sen kx] = i dx g(x) sen kx = G( k)
1 1

1 1
G(k) = F[H] F[1] = VP + (C ⇡) (k) ) C = ⇡,
2 | {zik} | {z
par
}
impar

de donde se concluye
1
F[H] = VP + ⇡ (k).
ik

4. Oscilador armónico sometido a una fuerza impulsiva: en el contexto más amplio de las distribu-
ciones es posible aplicar la transformada de Fourier para resolver EDOs cuando las funciones involucradas
no verifican las condiciones exigidas a las funciones ordinarias. Un buen ejemplo es el oscilador armónico
excitado por un impulso externo. La ecuación de movimiento para la posición x(t) del oscilador es
r:=b/2m
mẍ = m!02 x bẋ + ma0 (t) ) ẍ + 2rẋ + !02 x = a0 (t),
es decir, el oscilador sufre un empuje instantáneo en el tiempo t = 0. Veamos dos métodos de abordar la
solución de este tipo de ecuaciones cuando se interpreta en el sentido de distribuciones:

a) Aplicamos la transformada de Fourier, X(!) := F[x], de manera que solo se pide que x(t) sea una
distribución temperada. En particular, no es necesario exigir que x(t) se anule en el infinito o que sea
continua y derivable. Entonces:
(i!)2 X i!X X 1 1/G(!)
z}|{ z}|{ z}|{ z }| { z }| {
F[ẍ] +2r F[ẋ] +!02 F[x] = a0 F[ (t)] ) ( ! 2 + 2ir! + !02 ) X(!) = a0 ) X(!) = a0 G(!),
42 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

donde reconocemos la función de Green del oscilador armónico, y por tanto x(t) = a0 g(t). Es evidente
que se trata de una solución generalizada, puesto que tanto ġ como g̈ están indefinidas en t = 0. Este
resultado proporciona una interpretación útil de la fórmula de convolución cuando la fuerza externa
tiene una forma general f (t): la expresión
Z +1
f (t) = ds f (s) (t s)
1

se puede leer como que la fuerza f (t) es una superposición de pulsos sucesivos, con intensidad dada
por f (s). Entonces, la EDO
Z +1
1 1
ẍ + 2rẋ + !02 x = f (t) = ds f (s) (t s)
m m 1

se puede resolver formalmente mediante el principio de superposición, y la solución se escribe como


la superposición de soluciones asociadas a fuerzas impulsivas:
Z +1
1
x(t) = ds f (s) g(t s),
m 1

es decir, como la superposición de la respuestas del oscilador a los pulsos sucesivos.


Este resultado no es especı́fico del problema del oscilador, sino que es general para cualquier ecuación
diferencial lineal: la solución cuando la inhomogeneidad es una delta de Dirac se denomina función
de Green de la ecuación. Entonces, la solución para una inhomogeneidad arbitraria se puede escribir
como la convolución de la función de Green con la inhomogeneidad, con la interpretación de que se
trata de la superposición de respuestas a perturbaciones puntuales.
b) La aplicación de la transformada de Fourier proporciona una solución particular, sin constantes arbi-
trarias. Para entender la razón, resolvamos la EDO tratando la distribución (t) como si fuese una
función ordinaria: aplicando el método de variación de parámetros se obtiene la solución de la forma
sol. particular EDO inhomogénea
sol. general EDO homogénea z }| {
z }| { Z t
i ei!+ (t s) ei! (t s)
x(t) = C+ ei!+ t + C ei! t + a0 ds (s)
1 !+ !
8
< 0, t < 0,
= C+ ei!+ t + C ei! t
+ a0 ei!+ t ei! t
: i , 0 < t,
!+ !
| {z }
g(t)

en términos de las constantes arbitrarias C± y de los parámetros


 q
!± := i r ± r2 !02 ,

La elección del lı́mite inferior de integración es arbitraria y solo representa una redefinición de las
constantes de integración C± . Se ha tomado 1 por simplificar los cálculos, aunque el resultado es
el mismo si se elige cualquier valor 6= 0 (para evitar la ambigüedad con la delta de Dirac “evaluada”
en el origen).
Como vemos, la solución depende de dos constantes arbitrarias. Sin embargo, debemos garantizar que
x(t) se pueda interpretar como una distribución temperada, es decir, que existan las integrales de la
forma Z+1
dt x(t) (t), 8 (t) función de prueba.
1
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 43

Pero si r 6= 0 la solución crece exponencialmente en el pasado lejano:


t t! 1
x(t < 0) = C+ ei!+ t + C ei! ! 1,

pues ya se vio que Re (i!± ) < 0. Por tanto, se debe elegir C± = 0, en cuyo caso se recupera la solución
x(t) = a0 g(t) obtenida con la transformada de Fourier. Como ya se discutió, el significado fı́sico de
este resultado matemático es que refleja la flecha del tiempo incorporada a través de la disipación
(r 6= 0). En ausencia de fricción (r = 0), resulta !± = ±!0 ) Re (i!± ) = 0 y la solución x(t)
es válida como distribución temperada para cualquier valor de C± . Esta ambigüedad representa las
oscilaciones excitadas en el pasado remoto y que no han sufrido amortiguamiento: en ausencia de
disipación no es posible “olvidar el pasado”.

5. Oscilador armónico sometido a una fuerza armónica: supongamos que el oscilador está sometido
a una fuerza externa f (t) que se puede representar mediante una transformada de Fourier. Entonces, la
ecuación de movimiento del oscilador se podrá escribir como
Z +1
2 ! d⌦
ẍ + 2rẋ + !0 x = f (t) = F (⌦) ei⌦t , F (⌦) = F[f ].
1 2⇡

Podemos interpretar la transformada de Fourier como la descomposición de la fuerza f (t) en superposición


de contribuciones de la forma ei⌦t , esto es, puramente armónicas, con amplitud y fase caracterizadas
por F (⌦). La aplicación del principio de superposición permite escribir pues la solución también como
superposición:
Z +1
d⌦ !
x(t) = F (⌦) (t; ⌦), con ¨ + 2r ˙ + !02 = ei⌦t .
1 2⇡
Esta expresión justifica el análisis de la ecuación usando fuerzas armónicas puras. Esta última ecuación se
puede resolver mediante transformada de Fourier:
1/G(!)
z }| { Z +1
! ⇥ ⇤
! 2 + 2ir! + !02 F[ ] = F ei⌦t = dt e i(! ⌦)t
= 2⇡ (! ⌦)
1

Z +1
F 1 d!
) F[ ] = 2⇡G(⌦) (! ⌦) ) (t; ⌦) = 2⇡G(⌦) (! ⌦) ei!t = G(⌦) ei⌦t .
1 2⇡
Por tanto, la transformada de Fourier G(!) de la función de Green se puede interpretar como la respuesta
del oscilador a la acción de una fuerza armónica pura. La curva de resonancia, es decir, la amplitud de la
respuesta, se obtiene directamente como el módulo de la transformada:
8
> 1
> |G| = p
> ,
>
< (⌦ 2 2
!0 )2 + 4r2 ⌦2
1
G(⌦) = =: |G|e i✓ )
⌦2 + 2ir⌦ + !02 >
> ! 2 ⌦2 2r⌦
>
>
: cos ✓ = 0 , sen ✓ = .
|G| |G|

Notemos que, de nuevo, la aplicación de la transformada de Fourier no conduce a la solución general (no
existen constantes indeterminadas en la expresión de (t; ⌦)), puesto que implı́citamente nos limitamos
a buscar soluciones que se puedan interpretar como distribuciones temperadas. En este caso, la solución
general incluirı́a transitorios que, hacia el futuro, están amortiguados exponencialmente debido a la disipa-
ción, pero que por tanto crecen exponencialmente hacia el pasado y no son admisibles como distribución
temperada (la cual no puede crecer más rápido que una potencia en el infinito). La interpretación fı́sica de
la solución (t) encontrada es que representa el comportamiento para tiempos largos en el futuro, una vez
que los transitorios han desaparecido por disipación (de nuevo la flecha del tiempo).
44 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

6. EDO lineal de coeficientes no constantes: en estos casos el uso de la transformada de Fourier no


simplifica la ecuación. A modo de ejemplo, consideremos la EDO
xy 00 (x) + y 0 (x) + xy(x) = b (x 1), 0 < x,
junto con las condiciones
y(x) regular, y(1/2) = a,
siendo a, b constantes dadas. Se trata de una ecuación de Bessel de orden cero, la aplicación de la trans-
formada de Fourier no la transforma en una ecuación algebraica y el dominio es solo el semieje positivo.
Aunque la aplicación de la transformada de Fourier es aún posible y de utilidad, en su lugar resolveremos
la EDO como si se buscasen soluciones ordinarias en cada uno de los dos dominios 0 < x < 1 y 1 < x y se
determinarán las condiciones de empalme en x = 1 a partir de la delta de Dirac.
Si x 6= 1: la EDO es homogénea y la solución general es una combinación lineal de las funciones de
Bessel de orden cero: ⇢
C J0 (x) + D Y0 (x), 0 < x < 1,
y(x) =
C+ J0 (x) + D+ Y0 (x), 1 < x,
donde C± , D± son cuatro constantes arbitrarias: notemos que se usan constantes diferentes en cada
dominio, pues la singularidad de la delta de Dirac en x = 1 impide en general la existencia de
una solución clásica (continua, derivable) en todo el semieje 0 < x. Estas constantes se determinan
mediante condiciones de contorno.
La singularidad Y0 (x ! 0) ⇠ ln x es lo que motiva la condición de regularidad de las soluciones: en
este caso, esto implica D = 0.
La otra condición implica
! a
y(1/2) = C J0 (1/2) = a ) C = .
J0 (1/2)
En conclusión,
J0 (x)
y(x) = a , si 0 < x < 1.
J0 (1/2)
Las otras dos constantes C+ , D+ se pueden determinar a partir del comportamiento de la solución cerca
de x = 1, lo cual permite conectar las soluciones a ambos lados del punto. Se divide la ecuación por x
(para eliminar el prefactor de la derivada segunda) y se integra la EDO en el rango 1 " < t < 1 + "
con " ! 0+ suponiendo por hipótesis que y 0 es finito:
Z 1+" Z 1+" Z 1+" Z 1+"
d2 y 1 dy ! 1 "!0
dx 2 + dx + dx y(x) = b dx (x 1) ) y 0 (1+ ) y 0 (1 ) = b,
1 " dx 1 " x dx 1 " 1 " x
| {z } | {z } | {z } | {z }
y 0 (1+") y 0 (1 ") ⇠" si y 0 finito ⇠" si y finito 1

es decir, y 0 (x) tiene una discontinuidad de primera especie en x = 1, y la solución se puede aproximar
cerca de ese punto como y 0 (x) ⇡ bH(x 1) + y 0 (1 ). Integrando esta condición de nuevo se encuentra
Z 1+" Z 1+"
dy ⇥ ⇤ "!0
dx ⇡ dx bH(x 1) + y 0 (1 ) ) y(1+ ) y(1 ) = 0,
1 " dx 1 "
| {z } | {z }
y(1+") y(1 ") ⇠"

es decir, la solución es continua es x = 1. Imponemos por tanto estas dos condiciones de contorno:
9 8
y(1 )
y(1+ ) z }| { > >
> >
> W (1) := J0 (1)Y00 (1) J00 (1)Y0 (1),
z }| { ! >
> >
>
J0 (1) >
> >
>
C+ J0 (1) + D+ Y0 (1) = a > >
J0 (1/2) > = >
<
C+ =
a bY0 (1)
,
) J0 (1/2) W (1)
J (1) >
0 > >
>
! >
> >
>
C+ J00 (1) + D+ Y00 (1) = b + a 0 >
> >
> bJ0 (1)
| {z } J0 (1/2) > > >
>
y 0 (1+ ) | {z } >
; : D+ = .
y 0 (1 )
W (1)
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 45

Por tanto, la solución completa es


8
>
> J0 (x)
>
> a , 0 < x < 1,
< J0 (1/2)
y(x) = 
>
> a bY0 (1) bJ0 (1)
>
>
: J0 (x) + Y0 (x), 1 < x.
J0 (1/2) J0 (1)Y00 (1) J00 (1)Y0 (1) J0 (1)Y00 (1) J00 (1)Y0 (1)

7. Circuito eléctrico LC: consideremos un circuito en serie formado por una resistencia R y una inductancia
L por el que circula una corriente de intensidad I0 inicialmente. En el instante t0 > 0 se le conecta al circuito
un generador de f.e.m. E0 en serie. El objetivo es determinar la intensidad de corriente I(t) en función del
tiempo, que se obtiene resolviendo el siguiente problema de condiciones iniciales:
Henry
z}|{ Ohm f.e.m.
dI z }| { z }| {
L + RI(t) = E0 H(t t0 ), I(t = 0) = I0 .
dt
Resolvamos el problema utilizando dos procedimientos equivalentes:
ˆ = L[I]:
a) Aplicando la transformada de Laplace, I(s)
ˆ
sI(s) I(0+ )
z }| { e st0 /s si t0 >0
dI z }| { st0
L L +R L[I] = E0 L[H(t t0 )] ) ˆ = LI0 + E0 e
(Ls + R)I(s)
dt s

ˆ = LI0 E0 1 L
) I(s) + e st0
Ls + R R s Ls + R
 ⇢  st0 
1 E0 e e st0
) I(t > 0) = LI0 L 1 + L 1 LL 1
.
Ls + R R s Ls + R
Podemos invertir las transformadas mediante manipulaciones simples que las conviertan en otras ya
evaluadas:  
1 1 1 1 1 1
L = L = H(t) e (R/L)t ,
Ls + R L s + R/L L
 st0 Z p+i1 
e ds s(t t0 ) 1 1
L 1 = VP e = H(t t0 )L 1 (t t0 ) = H(t t0 ),
s p i1 2⇡i s s
| {z }
0 si t t0 <0
 
1 e st0 1 1 1 (R/L)(t t0 )
L = H(t t0 )L (t t0 ) = H(t t0 )e ,
Ls + R Ls + R L
y por tanto,

E0 h i
(R/L)t (R/L)(t t0 )
I(t) = I0 H(t) e + H(t t0 ) 1 e
R
8 (R/L)t
>
< I0 e , 0 < t < t0 ,
=
>
: I e (R/L)t E0 h R(t t0 )/L
i
0 + 1 e , t0 < t.
R
Como era de esperar fı́sicamente, la solución describe un transitorio al cabo del cual la corriente
alcanza el valor estacionario I(t ! +1) = E0 /R dado por la ley de Ohm.
46 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

b) Es evidente que la expresión I(t) es una solución generalizada, porque I 0 (t) es discontinua en t =
t0 . Podemos resolver la EDO buscando soluciones ordinarias en los dominios t < t0 y t > t0 y
empalmarlas:
Si 0 < t < t0 :
dI (R/L)t
L + RI(t) = 0, I(t = 0) = I0 ) I(t) = I0 e .
dt
Si t0 < t:
dI E0
+ RI(t) = E0 ) I(t) =
L + Ce (R/L)t .
dt R
La constante arbitraria C se debe determinar a partir del comportamiento de I(t) cerca de t = t0 .
Para ello integramos la EDO en el rango t0 " < t < t0 + ", con " ! 0:
Z t0 +" Z t0 +" Z t0 +"
dI "!0
L dt +R dt I(t) = E0 dt H(t t0 ) ) I(t+ 0) I(t0 ) = 0,
t0 " dt t0 " t0 "
| {z } | {z } | {z }
I(t0 +") I(t0 ") ⇠" si I finito "

es decir, la intensidad debe ser continua:

! E0 E0 (R/L)t0
I(t0 ) = I0 e (R/L)t0
= I(t+
0)= + Ce (R/L)t0
) C = I0 e ,
R R
y se recupera la solución anterior.

8. EDP lineal: sea la función u(x, t) que obedece el siguiente problema:

@u @u 1 < x < +1,


= c + c g(t) (x), u(x, 0) = (x),
@t @x 0 < t.

donde la constante c > 0 y las funciones g(t) y (x) se suponen dadas. Sin entrar en detalles (ya se verán
en los próximos temas), esta ecuación describe la evolución del campo u(x, t) en forma de ondas que se
desplazan con velocidad c bajo la acción de una fuerza / g(t) localizada en el punto x = 0. Notemos que
el problema mecánico deja libre la condición de contorno en el infinito espacial (variable x).
Para resolver la EDP, introducimos la transformada de Fourier en la variable x:
Z +1
U (k, t) := F[u(x, t)] = dx u(x, t) e ikx , (k) := F[ (x)].
1
 Z +1 Z +1
@u @u ikx @ @U
F = dx e = dx u(x, t) e ikx = ,
@t 1 @t @t 1 @t
 Z +1 Z +1 ✓ ◆
@u @u ikx int. d ikx
F = dx e = dx u(x, t) e = ikU,
@x 1 @x partes
1 dx
y por tanto el problema se transforma en una EDO en la variable t:
@U
= ickU + c g(t), U (k, 0) = (k).
@t
Notemos que, al integrar por partes en el cálculo de F[@u/@x], se ha despreciado un término de contorno
+1
u(x, t)e ikx x= 1 . Esto refleja que, al aplicar la transformada de Fourier, se limita implı́citamente el
conjunto de soluciones buscadas a aquellas que se puedan interpretar como distribuciones temperadas en
la variable x: o bien las soluciones se anulan en el infinito (y con ello también el término de contorno), o
bien no crecen más rápido que una potencia y el término de contorno no contribuye porque, interpretadas
como distribuciones, se deben entender multiplicadas por una función de prueba que en el infinito hace
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 47

que se anule. Sin embargo, como veremos al discutir el resultado, esta restricción no es importante pues
incluye todas las soluciones fı́sicamente relevantes.
La solución del problema de condiciones iniciales para la EDO de primer orden es
Z t
ickt ick(t ⌧ )
U (k, t) = (k)e + d⌧ c g(⌧ )e .
0

A continuación se invierte la transformada:


Z t h i
⇥ ⇤
u(x, t) = F 1 [U (k, t)] = F 1 (k)e ickt + d⌧ c g(⌧ ) F 1 e ick(t ⌧ )
0
Z +1 Z t Z +1
dk ik(x ct) dk i[x c(t ⌧ )]k
= (k)e + d⌧ c g(⌧ ) e
1 2⇡ 0 1 2⇡
| {z } | {z }
F 1[ ] para x ct (x c(t ⌧ ))
Z ⇣ ⇣
t
x ⌘⌘
1
( (a⌧ )= |a| (⌧ )) = (x ct) + d⌧ g(⌧ ) ⌧ t
c
|0 {z }
6=0 solo si 0<t x/c<t
⇣ x⌘
= (x ct) + g t H(x)H(ct x).
c
Para ilustrar la solución se pueden considerar dos casos extremos:

En ausencia de forzamiento externo (g(t) ⌘ 0), se tiene u(x, t) = (x ct), que representa la propa-
gación hacia la derecha sin deformación de la perturbación inicial.
En ausencia de perturbación inicial ( (x) ⌘ 0), el campo u(x, t) describe la propagación del efecto
del forzamiento solo hacia la derecha (pues u = 0 si x < 0) y con velocidad finita c (pues u = 0 si
x > ct).

9. Plano infinito cargado con densidad superficial uniforme: tomemos los ejes coordenadas de tal
manera que el plano cargado se identifique como x = 0. En el modelo se han realizado dos idealizaciones:
que el plano se extiende hasta el infinito y que la distribución de carga es un plano de espesor nulo. En
relación con la segunda hipótesis, es una aproximación a la configuración más realista de una plancha en
|x| < ` con un espesor 2` ! 0. En una sección de área A habrá una carga Q = A, que corresponde a una
densidad volumétrica de carga % = Q/(2`A) = /(2`). Por tanto, la ecuación de Poisson para el potencial
electrostático es 8 9
>
< , |x| < `, >=
%(r) 1 2`
r2 V = = = d` (x),
✏0 ✏0 >
: >
; ✏0
0, ` < |x|,

en términos de la función d` (x) ya introducida al motivar la delta de Dirac. Ası́, en el lı́mite ` ! 0 de


espesor nulo se encuentra la EDP
r2 V = (x),
✏0
de manera que el potencial V (r) se debe entender como una distribución, es decir, como una solución
generalizada o débil de la EDP. Buscamos soluciones que reflejan la simetrı́a de la distribución de carga,
esto es que son función solo de x:
d2 V
= (x).
dx2 ✏0
Resolvamos la EDO en el sentido de las distribuciones, utilizando los dos procedimientos como ilustración:
48 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

a) Introducimos la transformada de Fourier, en cuyo caso el único requisito sobre V (x) es que represente
una distribución temperada. En particular, no es necesario exigir que V (x) se anule en el infinito o
que sea continua y derivable. Entonces:

 v(k) 1
d2 V z }| { ! z }| {
F = (ik)2 F [V ] = F[ (x)] ) k 2 v(k) = ) v(k) = VP +2⇡C1 (k)+2⇡iC2 0 (k),
dx2 ✏0 ✏0 ✏0 k 2

donde C1 , C2 son dos constantes arbitrarias que proceden de la solución de la ecuación homogénea
k 2 T (k) = 0. A continuación se calcula la transformada inversa:
|x|/2
z }|
 { 1/(2⇡) ix/(2⇡)
1 z }| { z }| {
V (x) = F 1
[v] = F 1
+2⇡C1 F [ ] +2⇡iC2 F 1 [ 0 ]
1
✏0 k2
8 ✓ ◆
>
>
> 1
> C + C 2 x, 0 < x,
< 2✏0
= |x| + C1 + C2 x = ✓ ◆
2✏0 >
>
>
>
: 1 C + C 2 + x, x < 0.
2✏0

Notemos que, para cualquier elección de las constantes C1 , C2 , la solución siempre va a ser discontinua
y siempre va a crecer sin lı́mite en el infinito, aunque solo como una potencia. En cualquier caso, V (x)
es una distribución temperada.
b) También se puede resolver el problema tratando las distribuciones como si fuesen funciones ordinarias,
pero empleando sus propiedades especı́ficas. Ası́ pues, integrando dos veces la EDO como si (x) y
H(x) fuesen funciones ordinarias con primitivas H(x) y xH(x), respectivamente, proporciona
H(x)
zZ }| { const.
x z}|{
00 0
V (x) = (x) ) V (x) = ds (s) + B
✏0 ✏0 1
xH(x) 8 ✓ ◆
zZ }| { const. >
>
x z}|{ < A+ B x, 0 < x,
✏0
) V (x) = ds H(s) +Bx + A =
✏0 1 >
>
:
A + Bx, x < 0.

Esta expresión coincide con la solución obtenida antes cuando se identifica A = C1 , B = C2 + /2✏0 .
Es evidente que, aunque se haya resuelto la EDO como si se buscasen soluciones clásicas, el resultado
es una solución generalizada, pues ni V 0 ni V 00 están definidas en x = 0.
La solución obtenida depende de dos constantes de integración y es por ello ambigua. ¿Cuál es el significado
fı́sico de las constantes? La constante C1 representa la arbitrariedad en la elección del origen de potencial.
Para entender el significado de C2 , calculemos el campo eléctrico asociado a este potencial:
8
>
> C2 , 0 < x,
dV < 2✏0
E(x) = =
dx >
>
: C2 , x < 0.
2✏0
El campo exhibe un salto /✏0 en el plano cargado, que es lo que realmente se obtiene aplicando el
teorema de Gauss, mientras que la constante C2 representa un campo eléctrico constante: este último se
debe interpretar como creado por cargas eléctricas situadas en el infinito y a las que el modelo de plano
infinito no tiene acceso. Ası́, la indeterminación en C2 refleja la aproximación de plano infinito, que es otra
idealización; en realidad, este modelo solo permite predecir la discontinuidad de (la componente normal
c Alvaro Domı́nguez, Univ. Sevilla Tema 6 49

del) campo en el plano: E(x = 0+ ) E(x = 0 ) = /✏0 . Sin embargo, al exigir que el campo refleje la
simetrı́a del plano cargado estamos suponiendo implı́citamente que no hay otras fuentes de campo. Por
tanto, imponemos la simetrı́a de que el problema es invariante bajo una reflexión en el plano x = 0 (esto
es, donde se encuentra el plano): esto implica

! !
V (x) = V ( x) , E( x) = E(x) ) C2 = 0,

y se concluye que la solución compatible con la simetrı́a de las fuentes es


8
 >
> , 0 < x,
1 < 2✏0
V (x) = C1 |x| ) E(x) = H(x) =
2✏0 ✏0 2 >
>
: , x < 0.
2✏0

10. Delta de Dirac multidimensional: se trata de una generalización para varias variables: en el espacio
tridimensional se define como
(3)
(r) := (x) (y) (z),
que representa una distribución localizada en el origen de coordenadas (r = 0). Puesto que cada dis-
tribución unidimensional se refiere a una variable diferente, no se trata en realidad de un producto
de distribuciones, lo cual no está definido. En el caso general de un espacio D–dimensional, se define
(D)
(r) = (x1 ) (x2 ) · · · (xD ).
Como aplicación, se puede considerar el potencial electrostático V (r) creado por una densidad de carga
%(r): esta ecuación ya se resolvió antes, pero ahora buscamos soluciones generalizadas, es decir, V (r) y %(r)
se pueden interpretar como distribuciones temperadas (esto implica, en particular, que no nos restringimos
a funciones que sean analı́ticas o que se anulen en el infinito suficientemente rápido). La ecuación de Poisson
satisfecha por V (r) se puede escribir como
Z
1 1
r2 V = %(r) = d3 r0 %(r0 ) (3) (r r0 ),
✏0 ✏ 0 R3
es decir, la distribución de carga se expresa como la superposición de fuentes localizadas en el espacio, esto
es, cargas puntuales. Entonces se puede formular la solución, por el principio de superposición, como
Z
V (r) = d3 r0 %(r0 )g(r r0 ),
R3

en términos de la función de Green g(r) de la ecuación de Poisson, es decir, el potencial creado por una
carga puntual:
1 (3)
r2 g = (r).
✏0
Aplicamos la transformada de Fourier:
1
G(k) zZ Z }|
Z +1 {
z}|{ ! 1 1 +1 +1
F[r2 g] = k 2 F[g] = F[ (3)
]= dx dy dz (x) (y) (z) e ik·r
✏0 ✏0 1 1 1

1 1
) k 2 G(k) = ) G(k) = + H(k),
✏0 ✏0 k 2
donde H(k) es cualquier distribución tridimensional que verifica la ecuación homogénea k 2 H(k) = 0, y que
corresponde fı́sicamente a un campo eléctrico creado por fuentes localizadas en el infinito. Las soluciones
de esta segunda ecuación se pueden encontrar invirtiendo la transformada (como se hizo con la ecuación
xn T (x) = 0 para distribuciones unidimensionales): si h(r) = F 1 [H], entonces h(r) es solución de la
50 Tema 6 c Alvaro Domı́nguez, Univ. Sevilla

ecuación de Laplace, r2 h = 0. Sin embargo, si se impone la condición de que no hay más fuentes de
campo que la carga puntual, la única solución admisible es h(r) = C constante ) H(k) = CF[1] =
C(2⇡)3 (3) (k). (A tı́tulo puramente informativo: todas las otras soluciones posibles divergen en el infinito
como alguna potencia y son por tanto distribuciones temperadas admisibles matemáticamente, pero no
fı́sicamente, como solución.) En conclusión, el potencial creado por una carga puntual es
1 F 1 1
G(k) = + C(2⇡)3 (3)
(k) ) g(r) = + C,
✏0 k 2 4⇡✏0 r

dado que ya habı́amos evaluado F 1 [1/k 2 ]. Como vemos, la constante C representa el origen arbitrario de
potencial; esta constante no se puede capturar con la transformada de Fourier en el sentido ordinario, pero
sı́ en el de distribuciones. Como resultado interesante se encuentra la siguiente igualdad entre distribuciones
tridimensionales: ✓ ◆
2 1
r = 4⇡ (3) (r).
r

11. Campo eléctrico creado por un dipolo puntual: un dipolo p se define como dos cargas puntuales
de signos opuestos, ±q, con una posición relativa d en el lı́mite de separación pequeña: p := lı́md!0 qd. Si
el vector d apunta hacia la carga positiva y se toma el origen de coordenadas en el punto medio entre las
dos cargas, entonces la representación matemática de esta configuración de carga como una distribución es
mediante la densidad de carga
✓ ◆ ✓ ◆
d d d!0
%(r) = q (3) r q (3) r + ! qd ·r (3) (r).
2 2 |{z}
p

Por tanto, el potencial V (r) creado por el dipolo satisface la ecuación

%(r) 1
r2 V = = p·r (3)
(r).
✏0 ✏0
Aplicando la transformada de Fourier con v(k) = F[V ] resulta

ik · p
k 2 v(k) = ,
✏0
cuya solución combinada con la restricción de que no hay fuentes de campo en el infinito es
ik · p
v(k) = + (2⇡)3 C (3)
(k)
✏0 k 2
1 2
rF [k ] 1
z }|
 { (4⇡r)
✓ ◆
p ik p z }| { p 1 p·r
1 1
) V (r) = F [v] = ·F +C = · r F 1 [k 2 ] +C = ·r +C = + C.
✏0 k2 ✏0 4⇡✏0 r 4⇡✏0 r3
Métodos Matemáticos II Curso 2020–2021

60. Calcule la transformada de Fourier de las siguientes funciones:


⇢ ⇢
1 1, |x| < 1, 0, |x| < 1,
a) g(x) = , b) g(x) = c) g(x) =
1 + (x 1)2 0, |x| > 1, x, |x| > 1,

sen x 0, x < 0, x
d) g(x) = 2
, e) g(x) = x , 0 < x, f ) g(x) = .
1+x e 1 + x2

61. Suponiendo que la función g(x) es real, demuestre que su transformada G(k) será real y
par si g(x) es una función par, mientras que G(k) será real e impar si g(x) es impar.

62. Sea una función g(x) definida solo en el semieje real 0 < x < +1. Para poder emplear
la transformada de Fourier hay que extender la definición al otro semieje. Dos extensiones
de uso habitual son las denominadas extensiones par e impar definidas, respectivamente,
como ⇢ ⇢
g(x), x > 0, g(x), x > 0,
gpar (x) := gimpar (x) :=
g( x), x < 0, g( x), x < 0.
Se definen respectivamente la transformada coseno de g(x) como Fcos [g] := F[gpar ], y la
transformada seno como Fsen [g] := iF[gimpar ].

a) Exprese estas transformadas como integrales que involucren solo la función g(x) de-
finida en el semieje real.
b) Suponiendo que g(x) se anula en el infinito, es continua y la derivada g 0 (x) también
posee transformada y es cuasicontinua, demuestre las relaciones

Fcos [g 0 ] = kFsen [g] 2g(0+ ), Fsen [g 0 ] = kFcos [g].

c) Calcule las transformadas coseno y seno de las siguientes funciones ( es un parámetro


positivo): ⇢
x x, 0 < x < ,
1) g(x) = e , 2) g(x) =
0, < x.
63. Calcule explı́citamente la transformada de Fourier tridimensional de un potencial dipolar:
p·r
V (r) = , r 2 R3 , p vector constante dado.
4⇡r3

64. Si F (s) denota la transformada de Laplace de la función f (t), demuestre las siguientes
igualdades (↵ > 0, 2 C son constantes):
⇥ ⇤
a) L [f (t/↵)] = ↵F (↵s), b) L e t f (t) = F (s + ), c) L [f (t ↵)] = e ↵s F (s).

65. Calcule la transformada de Laplace de las siguientes funciones definidas para t 0, supo-
niendo que b es una constante positiva:

a) f (t) = cosh(bt), b) f (t) = eat sen(bt), c) f (t) = t2 sen(bt),


8
⇢ >
> 1, 0  t < 1,
<
1, 0  t < 1, 0, 1  t < 2,
d) f (t) = e) f (t) =
0, t 1, > 1, 2  t < 3,
>
:
0, t 3.
66. Calcule la transformada de Laplace inversa de las siguientes funciones:

e 4s 2s + 1
a) F (s) = , b) F (s) = .
2s 1 4s2+ 4s + 5

67. Calcule las transformadas de Laplace o su inversa, según proceda, de las siguientes funcio-
nes empleando el teorema de convolución:
Z t Z t
0 0 2 0 0
a) f (t) = dt (t t ) cos 2t , b) f (t) = dt0 e (t t ) sen t0 ,
0 0
1 s
c) F (s) = , d) F (s) = .
s4 (s2 + 1) (s + 1)(s2 + 4)

68. Calcule la transformada de Laplace de las siguientes funciones y discuta brevemente su


estructura analı́tica:
1 et
a) f (t) = tµ , µ > 1, b) f (t) = .
t

69. Utilice la transformada de Laplace para resolver los siguientes problemas de condiciones
iniciales en el dominio 0  t < +1:

a) ÿ 2ẏ + 2y = cos t, y(0) = 1, ẏ(0) = 0,

b) ẍ + 4x = (t ⇡) (t 2⇡), x(0) = 0, ẋ(0) = 0,



ẋ = y,
c) x(0) = 1, y(0) = 1.
ẏ = x + 2y,

...
70. Obtenga soluciones de la ecuación x x = (t) en el eje real ( 1 < t < 1) utilizando
la transformada de Fourier. Discuta si se trata de la solución general de la ecuación o de
soluciones particulares.

71. Utilice la transformada de Fourier para buscar soluciones de la denominada ecuación de


Airy, y 00 xy = 0. ¿Es una solución general?

72. Se considera la ecuación de Bessel de orden cero, xy 00 + y 0 + xy = 0 en el semieje positivo


(x 0). Calcule la transformada de Laplace Y (s) de aquellas soluciones de esta ecuación
que además son regulares en x = 0.

73. Se considera un oscilador armónico (masa m, frecuencia natural !0 ) sin fricción sometido
a una fuerza de la forma

F0 , |t| < T,
F (t) = F0 , T constantes, T > 0.
0, T < |t|,

Calcule la trayectoria x(t) del oscilador a partir de la convolución con la función de Green
del oscilador. Considere el lı́mite en que la duración T ! 0 pero la intensidad F0 ! 1
de manera que el producto p := 2T F0 se mantiene finito. ¿Qué significado fı́sico tiene el
resultado?
74. Un cuerpo de masa m cae en el seno de un fluido viscoso que ejerce una fuerza kv, con
k > 0. Utilice la transformada de Laplace para resolver la ecuación para la posición vertical
z(t) del cuerpo con la condición inicial de que parte del reposo desde el origen.

75. Un oscilador armónico (masa m, frecuencia natural !0 , coeficiente de fricción b < 2m!0 )
se ve sometido a una fuerza de la forma F (t) = F0 H(t t0 ), con t0 > 0. Inicialmente
el oscilador se encuentra en reposo en equilibrio. Utilice la transformada de Laplace para
calcular la trayectoria x(t) del oscilador y discuta fı́sicamente el resultado.

76. El potencial eléctrico V (x, y) verifica el siguiente problema de condiciones de contorno en


el semiplano superior:
8 9
< V (x, 0) = W (x), =
1 < x < 1,
r2 V = 0, ,
: ; 0 < y,
V ! 0 suavemente cuando |r| ! 1,

donde la función W (x) se supone conocida. Busque soluciones aplicando la transformada de


Fourier en la variable x, dejando el resultado expresado como una integral de convolución.

77. La elongación u(x, t) del punto x de una cuerda en el instante t obedece el siguiente
problema de condiciones iniciales, que representa la propagación de una onda a lo largo
de la cuerda tensa:
8 2 9
>
< u(x, 0) = e (x/ ) > =
2
@ u 2
2@ u 1 < x < +1,
2
= c 2
, ,
@t @x >
: @u >
; 0 < t,
(x, 0) = 0
@t
donde la constante c > 0 representa la velocidad de propagación de la onda. Utilice trans-
formada de Fourier en la variable x para encontrar la solución u(x, t).

78. Busque soluciones mediante la transformada de Fourier tridimensional de la ecuación de


Helmholtz con una fuente puntual:

r2 u(r) a2 u(r) = (3)


(r), r 2 R3 , a > 0.

79. A partir de la electrostática bidimensional deduzca la igualdad r2 ln |r| = 2⇡ (2) (r).

80. La temperatura T (x, t) en una varilla de extensión infinita evoluciona según el siguiente
problema de condiciones de contorno:
8 9
> T (x, 0) = T0 >
@T @2T < =
1 < x < +1,
= D 2 +Q (t t0 ) (x x0 ), ,
@t @x >
: @T ! 0 cuando x ! ±1 > ; 0 < t.
@x
En estas expresiones, D, Q, t0 , x0 son constantes dadas, con D, t0 > 0. Introduzca la trans-
formada de Laplace en la variable t y de Fourier en la variable x para resolver el problema.
Determine el campo T (x, t) invirtiendo primero la transformada de Laplace y después la
de Fourier.
MMII 2020–2021, soluciones del boletı́n para el tema 6 1

ik |k|
60. a) G(k) = ⇡e .
2 sen k
b) Por evaluación directa de la integral de Fourier se llega a G(k) = . El resultado
k
es consistente con la evaluación utilizando el cálculo de distribuciones:
signo (1 x) + signo (1 + x)
g(x) = H(1 |x|) = = H(1 x) + H(1 + x) 1,
2

ik
eeik
G(k) = F[H(1 x)] + F[H(1 + x)] F[1] = F[H]( k) +
F[H](k) 2⇡ (k)
2 2
⇥ ⇤ 1 ⇥ ⇤ 2 sen k
= ⇡ e ik + eik (k) + e ik + eik 2⇡ (k) = .
ik k
c) La integral de Fourier no converge, pero g(x) se puede interpretar como una distribución
temperada. Por tanto, llamando ĝ(x) a la función del apartado anterior, se puede escribir
✓ ◆
d d 2 sen k
F[g] = F[x] F[xĝ] = i (F[1] F [ĝ]) = i 2⇡ (k)
dk dk k
2i (sen k k cos k)
= 2⇡i 0 (k) + .
k2
d ) Utilizando el resultado del apartado (a):
Z
1 +1 e i(k 1)x e i(k+1)x
⇡ ⇣ |k 1| |k+1|

G(k) = dx = e e .
2i 1 1 + x2 2i
1
e) G(k) = .
1 + ik
f ) La integral de Fourier
Z +1 Z +R
x e ikx 2ix sen kx
G(k) = F[g] = dx = lı́m dx
1 1 + x2 R!+1 R 1 + x2
es convergente porque el integrando se comporta en el infinito como sen kx/x, que ya
se ha evaluado (apartado (b)). Se puede escribir (usando el resultado del apartado (a))
Z +1
d e ikx d ⇣ ⌘ d|k|
G(k) = i dx 2
=i ⇡e |k| = i⇡e |k| = i⇡e |k| signo k.
dk 1 1+x dk dk

61. Si g(x) es real y par, se verifica:


par en x impar en x
Z +1 z }| { Z +1 z }| { Z +1
G(k) = dx g(x) cos kx i dx g(x) sen kx = 2 dx g(x) cos kx, que es real y par en k.
1 1 0
| {z }
0 por paridad

Del mismo modo se comprueba la otra afirmación.


62. a) Empleando las propiedades de paridad de las extensiones se encuentra
Z +1 Z +1
Fcos [g] = 2 dx g(x) cos kx, Fsen [g] = 2 dx g(x) sen kx.
0 0

0
b) Supongamos que g (x) es continua por simplicidad (la generalización al caso de cuasi-
continuidad es sencilla):
Z +1 Z +1
0 dg 1 d(cos kx)
Fcos [g ] = 2 dx cos kx = 2g(x) cos kx|0 2 dx g(x) = 2g(0+ )+kFsen [g],
0 dx 0 dx
Z +1 Z +1
dg 1 d(sen kx)
Fsen [g 0 ] = 2 dx sen kx = 2g(x) sen kx|0 2 dx g(x) = kFcos [g].
0 dx 0 dx
MMII 2020–2021, soluciones del boletı́n para el tema 6 2

c) 1) Utilizamos resultados de problemas anteriores:

|x| Prob. 60a 2


gpar (x) = e ) Fcos [g] = 2
,
+ k2

|x| Prob. 60f 2⇡k


gimpar (x) = e signo x ) Fsen [g] = 2
.
+ k2
2) Por evaluación directa de las integrales se encuentra

2(1 cos k ) 2(k sen k )


Fcos [g] = , Fsen [g] = .
k2 k2

63. La transformada tridimensional del campo es


Z
p r
F[V ] = · d3 r e ik·r
, k 2 R3 .
4⇡ r3

Sin pérdida de generalidad, se expresa la variable de integración r en coordenadas esféricas


(r, ✓, ') con el eje Z elegido en la dirección del vector fijo k, de manera que se tiene

k = kez , r = rer = r(ex sen ✓ cos ' + ey sen ✓ sen ' + ez cos ✓), k · r = kr cos ✓.

Entonces,
Z Z 1 Z ⇡ Z 2⇡
r ikr cos ✓ ex
sen ✓ cos ' + ey sen ✓ sen ' + ez cos ✓
d3 r e ik·r 3 = dr r 2
d✓ sen ✓ d' e
r 0 0 0 r2
Z 1 Z ⇡ Z 1 Z 1
ikr cos ✓ s:=cos ✓
= 2⇡ez dr d✓ e sen ✓ cos ✓ = 2⇡ez dr ds s e ikrs
0 0 0 1
✓ ◆ Z 1 Z 1 iqs Z 1 Z 1
k>0 2⇡ 1 d(e ) 2⇡i d iqs
= ez ds dq = ez dq ds e
q:=kr k 0 i dq 1k 0 dq 1
Z 1 ✓ ◆  1
4⇡i d sen q 4⇡i sen q 4⇡i
= ez dq = ez = ez .
k 0 dq q k q 0 k

Por lo tanto, 
p 4⇡i iez · p ez =k/k ik · p
F[V ] = · ez = = .
4⇡ k k k2

64. Las demostraciones se siguen trivialmente a partir de la integral que define la transformada.
ebt + e bt
s
65. a) f (t) = ) F (s) = .
2 s2 b2
e(a+ib)t e(a ib)t
b
b) f (t) = ) F (s) = .
2i (s a)2 + b2
c) El cálculo se puede simplificar observando que f (t) = t2 sen bt = d2 (sen bt)/db2 :
✓ ◆
d2 d2 b 2b(3s2 b2 )
F (s) = L[sen bt] = = .
db2 db2 s2 + b2 (s2 + b2 )3
s
1 e
d ) F (s) = .
s
1⇥ s 2s 3s

e) F (s) = 1 e +e e .
s
1 1
66. a) L H(t 4)e(t 4)/2 .
[F ] =
2
1
b) L 1 [F ] = H(t)e t/2 cos t.
2
MMII 2020–2021, soluciones del boletı́n para el tema 6 3

2
67. a) L[f ] = L[t2 ]L[cos 2t] = .
s2 (4 + s2 )
1
b) L[f ] = L[e t ]L[sen t] = 3 2
.
s +s +s+1
c)
1 1
F (s) = F1 (s)F2 (s), F1 (s) = , F2 (s) = .
s4 1 + s2
t3
1 1
f1 (t) = L [F1 ] = , f2 (t) = L [F2 ] = sen t.
6
Z t Z
1 t
f (t) = L 1 [F ](t) = d⌧ f1 (t ⌧ ) f2 (⌧ ) = d⌧ (t ⌧ )3 sen ⌧.
0 6 0
d)
1 s
F (s) = F1 (s)F2 (s), F1 (s) = , F2 (s) = .
1+s 4 + s2
1
f1 (t) = L [F1 ] = e t , f2 (t) = L 1
[F2 ] = cos 2t.
Z t Z t
f (t) = L 1 [F ](t) = d⌧ f1 (t ⌧ ) f2 (⌧ ) = d⌧ e (t ⌧ )
cos 2⌧.
0 0

68. a) La función tµ es continua excepto quizás en t = 0 (si µ < 0), pero la singularidad
es integrable si µ > 1. También es una función de orden exponencial con ı́ndice de
aumento ↵ = 0. La transformada de Laplace se puede expresar en términos de la función
gamma:
Z +1 Z +1
µ st s>0 µ 1 (µ + 1)
F (s) = dt t e = s d⌧ ⌧ µ e ⌧ = .
0 0 sµ+1
Si µ es un entero no negativo (µ = 0, 1, 2 . . . ), la transformada se reduce a la que se
encontró para monomios y la continuación analı́tica solo tiene un polo de orden µ + 1
en s = 0. Si µ no es entero, la continuación analı́tica tiene un punto de ramificación
algebraico en s = 0.
b) La función f (t) es continua y es orden exponencial con ı́ndice de aumento exponencial
↵ = 1. Las dificultades técnicas para evaluar su transformada de Laplace proceden
del comportamiento cerca de t = 0: aunque la función ahı́ es continua, no se puede
separa el integrando en dos sumandos que conduzcan a integrales convergentes. Un
procedimiento consiste en regularizar las integrales y tomar el paso al lı́mite al final.
Comparando con el apartado anterior, se puede escribir t 1 = tµ con µ ! 1:
Z +1 ⇢Z +1 Z +1
st t µ
F (s) = lı́m dt e (1 e )t = lı́m dt tµ e st dt tµ e (s 1)t
µ! 1 0 µ! 1 0 0
 h i
(µ + 1) (µ + 1) (µ+1) ln s (µ+1) ln(s 1)
(s > 1) = lı́m = lı́m (µ + 1) e e
µ! 1 sµ+1 (s 1)µ+1 µ! 1
s 1
= lı́m (µ + 1) (µ + 1) ln .
µ! 1 s
Por otra parte,
L[tµ+1 ]
Z d(tµ+1 )/dt
z
0 si µ> 1,s>0
}| { zZ }| {
+1 z }| { ⇥ ⇤+1 +1
(µ + 1) (µ + 1) = dt (µ + 1)tµ e st
= tµ+1 e st 0 +s dt tµ+1 e st
0 0
(µ + 2) µ! 1
= ! (1) = 1.
sµ+1
En conclusión, ✓ ◆
s 1 1
F (s) = ln = ln 1 .
s s
MMII 2020–2021, soluciones del boletı́n para el tema 6 4

Aunque esta expresión se ha obtenido para s > 1, se puede continuar analı́ticamente a


todo el plano complejo excepto por dos singularidades en s = 1 y s = 0, que son puntos
de ramificación logarı́tmicos.
Esta no la única forma de regularizar la integral. Una manera alternativa, que no recurre
a la definición de la función gamma, es excluir el punto t = 0 del rango de integración
y pasar al lı́mite al final:
Z +1 Z +1 Z +1
1 et e st e (s 1)t
F (s) = dt e st = lı́m dt dt
0 t "!0 " t " t
"Z Z +1 # Z (s 1)"
+1 u u
e e e u
(s > 1) = lı́m du du = lı́m du .
"!0 s" u (s 1)" u "!0 s" u

Esta última integral está bien definida para cualquier " > 0. Aunque no se puede
expresar mediante funciones elementales, en el lı́mite " ! 0 el rango de integración se
limita al entorno de u = 0, por lo que se puede aproximar eu ⇡ 1 en el integrando.
Entonces
Z (s 1)" ✓ ◆
1 s 1 1
F (s) = lı́m du = ln = ln 1 .
"!0 s" u s s

1 2
69. a) y(t > 0) = (cos t 2 sen t) + et (2 cos t sen t).
5 5
(
1
1 sen 2t, ⇡ < t < 2⇡,
b) x(t > 0) = [H(t ⇡) H(t 2⇡)] sen 2t = 2
2 0, 0 < t < ⇡ o 2⇡ < t.
8 t
< x(t > 0) = (1 2t)e ,
c)
:
y(t > 0) = (1 + 2t)et .
70. Se trata de determinar la función de Green de la EDO. Buscamos la solución generalizada,
es decir, en sentido de las distribuciones, de la EDO

d3 x
x = (t)
dt3
empleando transformada de Fourier:
Z +1
1
X(!) := F[x] = dt e i!t x(t) ) (i!)3 X X = 1 ) X(!) = .
1 1 + i! 3

Obtenemos x(t) como transformada inversa:


Z +1
1 d! i!t
x(t) = F [X] = e X(!).
1 2⇡

La integral se puede evaluar pasando al plano complejo (! ! z 2 C) y teniendo en cuenta


que la continuación analı́tica eizt X(z) tiene tres polos simples:

1 + iz 3 = 0 ) z=e i⇡/2
, ei⇡/6 , ei5⇡/6 .

De esta manera se encuentra la solución


8
> 1 t
>
> e, t < 0,
>
< 3
x(t) = " p p #
>
> 1 1 3t 3t
>
> t/2
: p e p cos
2
+ sen
2
, 0 < t.
3 3
MMII 2020–2021, soluciones del boletı́n para el tema 6 5

Se trata de una solución débil o en el sentido de las distribuciones porque la derivada segunda
no está definida en t = 0. Tampoco se trata de la solución general porque no depende de tres
constantes de integración. En este caso, se trata de la única solución que verifica la condición
de contorno adicional de que se puede interpretar como una distribución temperada, lo cual
implica en este ejemplo que en el infinito no crece más rápido que una potencia.
En efecto, para comprobar esta afirmación es instructivo analizar la solución general de
la EDO cuando t 6= 0: en tal caso, se reduce a una ecuación homogénea de coeficientes
...
constantes, x hom xhom = 0, cuya ecuación caracterı́stica es
p p
3 2⇡i/3 1 3 2⇡i/3 1 3
1=0 ) 1 = 1, 2 =e = i , 3 =e = +i ,
2 2 2 2
de manera que la solución general se escribe como
2⇡i/3 2⇡i/3
xhom (t) = Cet + C ete + C+ ete
2 3
z
=:D
}| { p z
=:E
}| { p
6 3t 3 t7
= Cet + e t/2 4(C+ + C ) cos + i(C+ C ) sen 5
2 2
" p p #
t t/2 3t 3t
= Ce + e D cos + E sen .
2 2

Estas funciones no se pueden interpretar como distribuciones temperadas, es decir, las ex-
presiones del tipo
Z +1
dt xhom (t) (t), (t) función de prueba
1

no existen porque xhom (t) diverge más rápido que cualquier potencia en t ! +1 o en
t ! 1. Sı́ es posible, sin embargo, considerar como distribuciones temperadas las funciones
definidas a trozos de la forma
8
>
> Cet t < 0,
>
<
" p p #
⇠(t) =
>
> t/2 3 t 3t
: e
> D cos
2
+ E sen
2
, t > 0,

pues se anulan cuando t ! ±1 y poseen, en el peor caso, una discontinuidad de primera


especie en t = 0. Es importante notar que ⇠(t) nunca puede ser una solución clásica o fuerte
de la EDO homogénea, pues se puede comprobar fácilmente que las tres condiciones de
que tanto ⇠(t) como sus derivadas primera y segunda sean continuas en t = 0 imponen la
condición C = D = E = 0: es decir, la única solución fuerte que además no crece en el infinito
más rápido que una potencia es la solución trivial. Sin embargo, sı́ se puede considerar ⇠(t)
como solución generalizada o débil que posee discontinuidades en t = 0. Comparando la
forma de ⇠(t) con la solución x(t) obtenida mediante
p la transformada de Fourier vemos que
corresponde a C = 1/3, D = 1/3, E = 1/ 3. ¿Cómo se determinan estos valores de
las constantes?
Dado que las distribuciones temperadas siempre poseen transformadas de Fourier, al resolver
la EDO con transformada de Fourier lo que se hace implı́citamente es buscar soluciones en el
conjunto de distribuciones de la forma ⇠(t). Este procedimiento genera de forma automática
la solución generalizada pertinente. Un procedimiento práctico alternativo y algo más intui-
tivo consiste en estudiar el comportamiento de la solución cerca del punto t = 0 y utilizar
las conclusiones para empalmar los tramos a izquierda y derecha del punto. Integrando la
EDO en el rango " < t < +" cuando " ! 0 se encuentra
ẍ(") ẍ( ") ⇠" si x finito
zZ }| { zZ }| {
+" +"
... "!0
dt x dt x = 1 ) ẍ(0+ ) ẍ(0 ) = 1.
" "
MMII 2020–2021, soluciones del boletı́n para el tema 6 6

Luego cerca de t = 0 la solución se comporta como ẍ(t) ⇡ ẍ(0 )+H(t). Integrando de nuevo
esta relación se obtiene
Z +" Z +"
⇥ ⇤
ẋ(0+ ) ẋ(0 ) = lı́m [ẋ(") ẋ( ")] = lı́m dt ẍ(t) = lı́m dt ẍ(0 ) + H(t) = 0
"!0 "!0 " "!0 "

Igualmente se encuentra
Z +"
ẋ continuo
x(0+ ) x(0 ) = lı́m [x(") x( ")] = lı́m dt ẋ ⇡ lı́m 2"ẋ(0) = 0.
"!0 "!0 " "!0

Por tanto, la solución generalizada es aquella distribución ⇠(t) que además verifica las si-
guientes condiciones de empalme en t = 0:

⇠(0+ ) ⇠(0 ) = 0, ˙ +)
⇠(0 ˙
⇠(0 ) = 0, ¨ +)
⇠(0 ¨ ) = 1.
⇠(0

Estas tres condiciones determinan las tres constantes de integración C, D, E que aparecen
en la expresión de ⇠(t) y conducen a la misma solución x(t) que se encontró por el método
de la transformada de Fourier.

71. Introduciendo la transformada de Fourier Y (k) := F[y(x)], la ecuación de Airy, de segundo


orden, se transforma en una EDO de primer orden que se resuelve fácilmente:
dY 3
F[y 00 ] F[xy] = k 2 Y (k) i =0 ) Y (k) = Ceik /3
, C constante.
dk
La transformada inversa está bien definida en el sentido de las distribuciones:
Z +1 Z ✓ ◆
1 dk ikx ik3 /3 C +1 k3
y(x) = F [Y ] = e Ce = dk cos kx + .
–1 2⇡ ⇡ 0 3

No se trata de la solución general, pues depende solo de una constante arbitraria. Esta expre-
sión solo describe aquellas soluciones de la ecuación de Airy que son también distribuciones
temperadas porque en el infinito no crecen más rápido que una potencia (de hecho, tienden
a cero).
72. Al aplicar la transformada de Laplace nos restringimos a buscar aquellas soluciones que no
son “demasiado discontinuas” ni que crecen más rápido que una exponencial en el infinito. La
condición de regularidad en x = 0 implica que y(0), y 0 (0) son finitas. Entonces, en términos
de Y (s) := L[y] se puede escribir
Z +1 Z +1
sx d sx dY
L [xy] = dx e xy(x) = dx e y(x) = ,
0 ds 0 ds

Z finito Z
+1 z}|{ +1
0 sx dy d sx
L [y ] = dx e = y(0) dx y(x) e = sY (s) y(0),
0 dx 0 dx
2 3
finito
d d 6 z }| { d d(s2 Y )
7
L [xy 00 ] = L[y 00 ] = 0
4sL[y ] y 0 (0)5 = [s(sY (s) y(0))] = + y(0).
ds ds ds ds

Por tanto,

d(s2 Y ) dY ! dY
L [xy 00 + y 0 + xy] = + y(0) + sY (s) y(0) =0 ) (1 + s2 ) + sY = 0.
ds ds ds
La solución de esta EDO de primer orden es
C
Y (s) = p , C constante.
1 + s2
MMII 2020–2021, soluciones del boletı́n para el tema 6 7

Esta función es analı́tica en el plano complejo excepto por sendos puntos de ramificación
algebraicos en s = ±i. Sabemos que la solución general de la ecuación de Bessel es la
combinación lineal y(x) = ↵J0 (x) + Y0 (x), pero solo J0 (x) es regular en x = 0. Por tanto,
podemos concluir que Y (s) debe ser proporcional a la transformada de Laplace de J0 :

C
L[J0 ] = p ,
1 + s2
y la constante C estarı́a determinada por la condición J0 (0) = 1.
73. Como ya se calculó, la función del Green del oscilador en ausencia de fricción es
sen !0 t
g(t) = H(t) .
!0
La fórmula de convolución proporciona la trayectoria como
Z +1 Z +T
F0 F0
x(t) = d⌧ H(T |⌧ |)H(t ⌧ ) sen !0 (t ⌧) = d⌧ H(t ⌧ ) sen !0 (t ⌧)
m!0 1 m!0 T
8
> 0, t< T,
>
>
>
>
>
> Z t+T
Z t+T >
< F0
F0 ds sen !0 s, T < t < T,
= ds H(s) sen !0 s = m!0 0
m!0 t T >
>
>
> Z
>
> t+T
>
> F0
: ds sen !0 s, T < t,
m!0 t T
8
>
> 0, t< T,
>
>
>
>
>
> F0
>
< [1 cos !0 (t + T )], T < t < T,
= m!02
>
>
>
> F0
>
>
>
> [cos !0 (t T) cos !0 (t + T )], T < t.
>
: m!02 | {z }
2(sen !0 T )(sen !0 t)

En el lı́mite
T ! 0, F0 ! 1, p := 2T F0 ! finito,
la fuerza es impulsiva y transmite una cantidad de movimiento p finita y no nula al oscilador
en un tiempo despreciable. En este lı́mite se puede aproximar F (t) ! ( p) (t) y la fórmula
de convolución proprociona
Z
p +1 p p
x(t) = d⌧ (⌧ )g(t ⌧ ) = g(t) = H(t) sen !0 t,
m 1 m m! 0

que coincide con el lı́mite de la expresión para x(t) calculada antes.


74. Tomando el eje Z en la dirección vertical y sentido hacia abajo, la ecuación de movimiento
(ley de Newton) es de la forma

d2 z 1 dz
mz̈ = k ż + mg ) + = g,
dt2 ⌧ dt
siendo g > 0 la aceleración de la gravedad, y ⌧ := m/k > 0 una escala de tiempo caracterı́stica
de disipación. La ecuación se resuelve introduciendo la transformada de Laplace e imponiendo
las condiciones iniciales z(0) = 0, ż(0) = 0:
Z 1
Z(s) := L[z] = dt e st z(t)
0
MMII 2020–2021, soluciones del boletı́n para el tema 6 8

1 g g
s2 Z sz(0) ż(0) + [sZ z(0)] = ) Z(s) = .
⌧ s s2 (s + 1/⌧ )
Se obtiene z(t) evaluando la integral de Mellin–Bromwich,
Z p+i1 Z p+i1
ds st g est
z(t) = e Z(s) = ds 2 , p > 0,
p i1 2⇡i 2⇡i p i1 s (s + 1/⌧ )

donde se toma p > 0 para que el camino en el plano complejo se encuentra a la derecha de
todas las singularidades (polo simple en s = 1/⌧ y polo doble en s = 0). Calculando la
integral para t > 0 (el único caso que interesa), se llega finalmente a la solución
h i mg
z(t > 0) = v1 t + v1 ⌧ e t/⌧ 1 , v1 := g⌧ = .
k
Esta solución describe un transitorio de duración del orden de ⌧ hasta que la masa adquiere
(formalmente para tiempos largos, t ! +1) una velocidad lı́mite v1 , para la cual la fuerza
de fricción compensa exactamente el peso y, por tanto, se anula la aceleración.
75. La formulación matemática del modelo es

F0 x(0) = 0 b
ẍ + 2rẋ + !02 x = H(t t0 ), , 2r := .
m ẋ(0) = 0 m

Introduciendo la transformada de Laplace, X(s) := F[x(t)], se obtiene


Z
F0 +1 (F0 /m)e st0
s2 X sx(0) ẋ(0)+2r[sX x(0)]+!02 X = dt e st ) X(s) = ,
m t0 s(s2 + 2rs + !02 )

teniendo en cuenta las condiciones


p iniciales. La transformada tiene tres polos simples, en
s = 0, r ± i⌦, con ⌦ := !02 r2 (que es real debido a la restricción b < 2m!0 ) Aplicando
la fórmula de Mellin–Bromwich para t > 0 se obtiene
⇢ 
F0 rt r⌦
x(t > 0) = 1 e cos ⌦t + 2 sen ⌦t H(t t0 ).
m!02 ⌦ r2
Esta solución describe el oscilador en equilibrio hasta que en el instante t0 , cuando se
“conecta” la fuerza, comienza a efectuar oscilaciones amortiguadas alrededor del punto
xeq = F0 /(m!02 ). Este punto representa la nueva posición de equilibrio debido a que la
fuerza no se “desconecta” nunca, y corresponde al nuevo balance de fuerzas:
F0
m!02 xeq = F0 ) xeq = .
m!02

76. La función V (x, y) representa el potencial electrostático en el semiplano y > 0, que está libre
de cargas, cuando se conoce el potencial en las fronteras, es decir, en la recta y = 0 y en
el infinito (y ! +1, x ! ±1). En particular, la condición de que “V ! 0 con suavidad”
cuando |r| ! 1 significa que tanto la función V (r) como sus derivadas se anulan en el
infinito.
Se introduce la transformada de Fourier respecto a la variable x:

v(k, y) := F[V (x, y)], w(k) := F[W (x)],

de manera que el problema se reformula como


 2  2 ⇢
@ V @ V @2v ! v(k, y = 0) = v(k)
F[r2 V ] = F +F = k 2 v+ 2 = 0, , y > 0.
@x 2 @y 2 @y v(k, y ! 1) ! 0

La condición de contorno en x ! 1 ha sido absorbida implı́citamente al tomar la transfor-


mada de Fourier. La solución general de la EDO en la variable y es

v(k, y) = A(k)eky + B(k)e ky


,
MMII 2020–2021, soluciones del boletı́n para el tema 6 9

donde A(k), B(k) son constantes en y, pero funciones del parámetro k determinadas por las
condiciones de contorno:
!
v(k, 0) = A(k) + B(k) = w(k),
⇢ ⇢
A(k), 0 < k, ! A(k > 0) = 0,
v(k, y ! +1) ⇠ =0 )
B(k), k < 0, B(k < 0) = 0.
Por lo tanto, ⇢
w(k)e ky , 0 < k, |k|y
v(k, y) = = w(k)e .
w(k)eky , k < 0,
Para invertir la transformada aplicamos la fórmula de convolución observando que
1 |k|y y
F [e ]= .
⇡(y 2 + x2 )

Por tanto, Z +1
y W (x0 )
V (x, y) = dx0 .
⇡ 1 y2 + (x x0 )2

77. La propagación de una onda en una cuerda tensa es un problema puramente mecánico:
la ecuación de ondas representa la segunda ley de Newton bajo la fuerza de tensión y las
condiciones iniciales describen la posición y velocidad inicial de la cuerda.
Aplicamos la transformada de Fourier en la variable x: U (k, t) = F[u(x, t)]. Como el pro-
blema mecánico deja libre la condición de contorno en el infinito espacial (variable x), este
procedimiento limita el conjunto de soluciones buscadas a aquellas que se puedan interpretar
como distribuciones en la variable x. Esto, sin embargo, no es una restricción relevante pues
incluye todas las soluciones fı́sicamente relevantes. En términos de U (k, t), el problema se
formula como
8 2 9
 2  2 >
< U (k, 0) = F[ e (x/ ) ] =: W (k) > =
2
@ u @ U ! 2 @ u
F 2
= 2
=c F 2
= (ck)2 U, , 0 < t.
@t @t @x >
: @U >
;
(k, 0) = 0
@t
La solución general de la EDO en la variable t es

U (k, t) = A(k)eickt + B(k)e ickt

donde A(k), B(k) son constantes en t, pero funciones del parámetro k determinadas por las
condiciones iniciales:
9
!
U (k, 0) = A(k) + B(k) = W (k) >>
= 1
) A(k) = B(k) = W (k).
@U ! >
> 2
(k, 0) = ickA(k) ickB(k) = 0 ;
@t
Por lo tanto,
1 ⇥ ⇤
U (k, t) = W (k) eickt + e ickt
= W (k) cos ckt,
2
y la transformada inversa es
Z +1 Z +1
1 1 dk 1 dk
u(x, t) = F [U (k, t)] = W (k)eik(x+ct) + W (k)eik(x ct)
2 1 2⇡ 2 1 2⇡
h i
(x+ct)2 / 2
(x ct)2 / 2
= e +e .
2
Es decir, la deformación inicial se propaga sin deformación (excepto por el prefactor 1/2) a
izquierda y derecha con velocidad c.
MMII 2020–2021, soluciones del boletı́n para el tema 6 10

78. Introduciendo la transformada de Fourier tridimensional U (k) := F[u(r)], se encuentra

! 1
F[r2 u] a2 F[u] = (k 2 + a2 )U (k) = F[ (3)
(k)] = 1 ) U (k) = .
k 2 + a2
Puesto que k 2 + a2 6= 0 para cualquier vector k real, no existe ambigüedad al resolver la
ecuación: no se encuentra la solución general, sino solo aquellas soluciones particulares que
se pueden interpretar como distribuciones (en este caso la solución es única, pues se puede
demostrar que las otras divergen en el infinito exponencialmente).
A continuación invertimos la transformada (aprovechando resultados de problemas previos):
Z Z 1
d3 k eik·r 1 k
u(r) = F 1 [U ] = 3 2 2
= 2
dk 2 sen kr
R3 (2⇡) k + a 2⇡ r 0 k + a2
Z 1
1 q ⇥ iqar ⇤
iqar r 0 1 ar e ar
= dq e e = ( 2i⇡e ) = .
8i⇡ 2 r 1 q2 + 1 8i⇡ 2 r 4⇡r

Se trata del potencial culombiano corregido por un decaimiento exponencial sobre una escala
espacial del orden de 1/a.
79. En dos dimensiones, el potencial electrostático V (r) creado por una carga puntual q verifica
✓ ◆
2 1 d dV 1 d2 V q (2)
r V = r + 2 = (r)
r dr dr r d'2 ✏0

en coordenadas polares (r, '). La solución con simetrı́a radial (V independiente de ') es de
la forma V (r) = A + B ln r para r 6= 0, con A, B constantes. Se calcula la contribución de la
delta de Dirac mediante la aplicación del teorema de Gauss bidimensional a una superficie
esférica de radio arbitrario R centrada en la carga:
Z Z I
q q (2) ! Gauss
= d2 r (r) = d2 r r · (rV ) = d` er · rV
✏0 r<R ✏0 r<R r=R
Z 2⇡ ✓ ◆
Ber q
= d' R er · = 2⇡B ) B = .
0 | {z } r 2⇡✏ 0
d` | {z r=R}
rV

Por tanto, el potencial electrostático es


q
V =A ln r,
2⇡✏0
que corresponde, en electrostática tridimensional, al campo creado por un hilo infinito car-
gado uniformemente. Volviendo a las ecuaciones de la electrostática se concluye
✓ 2 ◆ p
@ @2
r2 ln |r| = + ln x2 + y 2 = 2⇡ (2) (r).
@x2 @y 2

80. Fı́sicamente, la EDP se denomina ecuación del calor (D > 0 es la conductividad térmica), que
en este caso incorpora un pulso instantáneo de calor en el punto x0 en el instante t0 > 0. La
condición inicial establece que la varilla empieza a una temperatura homogénea T0 , mientras
que la condición de contorno impone ausencia de flujo de calor por los extremos de la varilla.
Se introduce la transformada de Laplace en la variable t y de Fourier en la variable x,
✓(k, s) := F[L[T ]], y se tiene:
 
@T
F L = F [sL[T ] T (x, 0)] = sF[L[T ]] F[T0 ] = s✓ 2⇡T0 (k),
@t
  2  2
@ T @ L[T ]
F L 2
=F = k 2 F[L[T ]] = k 2 ✓,
@x @x2
MMII 2020–2021, soluciones del boletı́n para el tema 6 11

st0 ikx0 st0


F[L[ (t t0 ) (x x0 )]] = F[ (x x0 )e ]=e e .
En consecuencia, el problema de condiciones de contorno conduce a la siguiente ecuación:

s✓ 2⇡T0 (k) = Dk 2 ✓ + Qe ikx0


e st0
.

Tanto las condiciones de contorno como la inicial han sido incorporadas al tomar las trans-
formadas. Despejando ✓(k, s), se encuentra

2⇡T0 Qe ikx0 e st0


✓(k, s) = (k) + .
s s + Dk 2
El resultado final para el campo T (x, t) no dependerá del orden en que se inviertan las trans-
formadas, aunque la dificultad del cálculo sı́ puede hacerlo. Invertimos primero la transfor-
mada de Laplace:
 
1 1 1 ikx0 1 e st0
L [✓] = 2⇡T0 (k)L + Qe L
s s + Dk 2
ikx0 Dk2 (t t0 )
= 2⇡T0 (k) + Qe H(t t0 )e .

A continuación se invierte la transformada de Fourier:


1 1 1 1 ikx0 Dk2 (t t0 )
T (x, t) = F [L [✓]] = 2⇡T0 F [ (k)] + QH(t t0 )F [e ]
(x x0 )2
e4D(t t0 )
= T0 + QH(t t0 ) p .
4⇡D(t t0 )

Por tanto, la temperatura permanece homogénea hasta el tiempo t0 , momento en el cual el


pulso localizado de calor provoca una perturbación con un perfil gausiano que se ensancha
y se aplana según pasa el tiempo.
Tema 7

Introducción al análisis funcional I.


Espacios y bases

La definición elemental de una función f (x) es como una regla que asocia pares de números, (x, y = f (x)). Este
tema y el siguiente son una introducción al análisis funcional, que es la disciplina que estudia las funciones f
como un todo, como un objeto matemático en sı́ mismo. Se trata básicamente del mismo tipo de distinción que
existe entre considerar un vector en el espacio ordinario como una tripleta de números (a1 , a2 , a3 ) o como un
objeto algebraico (~a). El objetivo en los próximos dos temas consiste en reproducir para espacios funcionales
las definiciones introducidas en los espacios vectoriales elementales, de manera que podamos dotarlos de una
estructura similar: como veremos, el principal escollo para extender la estructura a espacios funcionales es que
estos últimos tendrán dimensión infinita en general, lo cual plantea cuestiones no triviales relacionadas con el
paso al lı́mite y la convergencia. El siguiente mapa conceptual marca los hitos más relevantes para este propósito:
Espacio vectorial: gracias a la noción de independencia lineal se pueden introducir unos subconjuntos,
denominados bases, a partir de los cuales se expresa cualquier vector. Esto permite definir la dimensión
del espacio como el número mı́nimo de elementos de una base.

Producto escalar: permite cuantificar la relación geométrica mutua de los vectores, en particular la condición
de ortogonalidad.
Norma o distancia: se puede obtener a partir del producto escalar y permite cuantificar la longitud de un
vector (módulo) y con ello la “distancia” entre dos cualesquiera.
Convergencia: a partir de la norma, se pueden introducir los conceptos de lı́mite de sucesiones y de con-
vergencia, es decir, una topologı́a.
Espacios de Hilbert: base + producto escalar ) bases ortonormales,
base + convergencia ) dimensión infinita.
Transformaciones lineales: en espacios euclı́deos están representadas por matrices. La generalización a
espacios de dimensión infinita conduce al concepto de operadores lineales.
Clasificación de los operadores lineales: en diversos tipos (hermı́ticos, unitarios, normales,. . . ), cada una
con propiedades especı́ficas, que generalizan el correspodiente concepto matricial.
Autovalores y autovectores de los operadores lineales: proporcionan un método sistemático para generar
bases del espacio.
Problema de Sturm–Liouville: es la aplicación de estos conceptos al caso especı́fico de EDOs lineales y
homogéneas.

1
2 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

7.1. Espacios de Hilbert

Definición: Un espacio funcional se define como un conjunto de funciones.

Ejemplos:

1. El espacio funcional de las funciones n-veces derivable con continuidad en el intervalo [a, b], con a, b finitos:

n dn g
C [a, b] := g : [a, b] ! C | existe y es continua en [a, b] .
dxn

Comentarios:

Puesto que g (n) (x) existe, no solo existe también g (n 1) (x), sino que además es continua. Por tanto,
todas las g (k) (x), k = 0, 1, . . . n existen y son continuas.
En particular, C 0 es el espacio de las funciones continuas y C 1 es el espacio de las funciones derivables
infinitas veces. Se verifican las relaciones de inclusión C 0 C 1 C 2 · · · C 1 , es decir, cuanto mayor
es el ı́ndice n, más “pequeño” es el espacio C n [a, b] (“las funciones derivables deben ser continuas, pero
no al revés”).
Se define el espacio C n ( 1, +1) o C n (R) como el conjunto de las funciones que pertenecen a todos
los espacios de la forma C n [a, b], es decir, que son n-veces derivable en cualquier intervalo finito [a, b].
2. El conjunto de soluciones clásicas de una EDO lineal y homogénea de grado n en un intervalo donde el
problema está bien planteado:
( n
)
X dµ y
n n
K [a, b] := y : [a, b] ! C | y 2 C [a, b], Pµ (x) µ = 0 y bien planteado en cada punto de [a, b] .
µ=0
dx

3. El espacio de Schwartz de funciones de prueba:




S := : R ! C | 2 C 1 (R) y lı́m xk µ = 0, 8k, µ = 0, 1, . . . , .
x!1 dx

4. El espacio de las distribuciones temperadas, esto es, el espacio dual de Schwartz:


⇢ Z +1

S = D T : S ! C | DT [ ] = dx T (x) (x) < 1, 8 2 S .
1

5. El espacio de las funciones complejas absolutamente integrables en el intervalo (a, b).


( Z b )
L1 (a, b) := f : (a, b) ! C | dx |f (x)| < 1 .
a

Algunos de los valores a o b puede ser infinito. En particular, se define el espacio


⇢ Z +1
L1 (R) := f : (a, b) ! C | dx |f (x)| < 1 .
1
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 3

6. El espacio de las funciones complejas cuadrado integrables con peso w(x) en el intervalo (a, b):
( Z b )
2 2
Lw (a, b) := f : (a, b) ! C | dx w(x)|f (x)| < 1 , w(x) > 0.
a

Aquı́, w(x) es una función real positiva dada denominada función peso. En el caso particular w(x) = 1,
se escribe simplemente L2 (a, b), que se denomina espacio de las “funciones de cuadrado integrable o de
cuadrado sumable”. Algunos de los valores a o b puede ser infinito. En particular, se define el espacio
⇢ Z +1
L2w (R) := f : (a, b) ! C | dx w(x) |f (x)|2 < 1 .
1

Los espacios L2w juegan un papel muy relevante en fı́sica, pues aparecen de manera natural en teorı́as
fundamentales relacionados con magnitudes fı́sicas cuadráticas (por ejemplo, la energı́a en mecánica, óptica,
electromagnetismo, o la función de onda en cuántica).
7. Estos espacios se solapan en el sentido de que comparten algunos elementos. Por ejemplo, las soluciones
(clásicas) de la EDO de orden n son funciones continuas y derivables hasta al menos orden n, las funciones
de prueba de Schwartz son infinitamente derivables en todo el eje real, las funciones continuas en [a, b]
finito también son absolutamente integrables y cuadrado integrables, las funciones de prueba de Schwartz
son absolutamente integrables y cuadrado integrables en todo el eje real:

Kn [a, b] ⇢ C n [a, b], S ⇢ C 1 (R), C n [a, b] ⇢ L1 (a, b), C n [a, b] ⇢ L2w (a, b), S ⇢ L1 (R), S ⇢ L2 (R).

Los espacios C n , Kn , S involucran condiciones de continuidad y derivabilidad, que son más restrictivas que
las condiciones de integrabilidad que definen los espacios S ⇤ , L1 y L2w : estos últimos contienen funciones
que incluyen discontinuidades. Por ejemplo:

8 Z +1 Z +1
> 1 8
>
> dx |f (x)| = 2 dx = ) f 2 L1 ( 1, 1)
⇢ 1/4 ,
>
< x 1/4 3
discontinuidad x 0 < x < 1, 1 0
f (x) = )
de 2a especie: |x| 1/4 , 1<x<0 >
> Z +1 Z +1
>
> 1
: dx |f (x)|2 = 2 dx p = 4 ) f 2 L2 ( 1, 1)
1 0 x
8 Z +1 Z +1
>
> dx |f (x)| = dx |x| = 1 ) f 2 L1 ( 1, 1)
>
>
infinitas < 1 1
1
discontinuidades f (x) = x sig sen )
x >
> Z Z
de 1a especie: >
>
+1 +1 2
: dx |f (x)|2 = dx x2 = ) f 2 L2 ( 1, 1)
1 1 3
8 Z +1 Z +1
> 1
>
> dx |f (x)| = 2 dx p = 4 ) f 2 L1 ( 1, 1)
>
< x
1 1 0
f (x) = p )
|x| >
> Z +1 Z +1
>
> 1
: dx |f (x)|2 = 2 dx =1 ) f 62 L2 ( 1, 1)
1 0 x

De hecho, la mayorı́a (en un sentido bien definido ) de las funciones de los espacios S ⇤ , L1 , L2w son bastante
más “exóticas”: ya hemos encontrado la distribución delta de Dirac y sus derivadas en S ⇤ , pero en L1 ,
L2w también existen funciones discontinuas en todos los puntos, funciones continuas pero no derivables en
ningún punto, funciones no monótonas en casi todos los puntos, etc.
4 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

Definición: Un espacio E tiene estructura de espacio vectorial si cualquier combinación lineal de elementos del
espacio pertenece al mismo:

8f (x), g(x) 2 E
) ↵f (x) + g(x) 2 E.
8↵, 2 C

Comentarios:

Los elementos del espacio E también se pueden denominar vectores.

Con más precisión, se dice que E es un espacio vectorial sobre el cuerpo de los números complejos. Si solo
se exige ↵, 2 R, entonces es un espacio vectorial sobre el cuerpo de los números reales.

Ejemplo: RN es un espacio vectorial.

Lema: Los espacios C n , Kn , S, S ⇤ , L1 y L2w tienen estructura de espacio vectorial sobre el cuerpo C de los
números complejos.
Comentarios:

Para los espacios C n , L1 y L2w este resultado recoge la imagen intuitiva de que la construcción de combinacio-
nes lineales no introduce singularidades nuevas que estropeen las condiciones de continuidad, derivabilidad
o integrabilidad, según corresponda.

La demostración del lema es inmediata para C n , Kn , S, S ⇤ , L1 . Para L2w , se demuestra por separado que
tanto la multiplicación por un escalar como la suma de funciones conduce a otro elemento del espacio:

1. Sea f (x) 2 L2w (a, b) y ↵ 2 C arbitrario. Entonces la función ↵f (x) 2 L2w (a, b). En efecto,
Z b Z b
dx w(x)|↵f (x)|2 = |↵|2 dx w(x)|f (x)|2 < 1,
a a

esto es, si f (x) es de cuadrado sumable, también lo es ↵f (x).


2. Sean f (x), g(x) 2 L2w (a, b). Entonces la función h(x) := f (x) + g(x) 2 L2w (a, b). En efecto, para
cualquier par f, g de números complejos se verifica
0
z }| {
2|f ||g| = |f |2 + |g|2 (|f | |g|)2  |f |2 + |g|2 ,

|f + g|2 = (f + g)⇤ (f + g) = |f |2 + |g|2 + f ⇤ g + f g ⇤ = |f |2 + |g|2 + 2Re(f ⇤ g)


 |f |2 + |g|2 + 2|f ⇤ g| = |f |2 + |g|2 + 2|f ||g|  2(|f |2 + |g|2 ).

Por tanto, puesto que w(x) > 0,


Z b Z b Z b Z b
2 2 2
dx w(x)|h| = dx w(x)|f + g|  2 dx w(x)|f | + 2 dx w(x)|g|2 < 1,
a a a a

esto es, si f (x) y g(x) son de cuadrado sumable, también lo es h(x).

Definición: El producto escalar o interior se define como una aplicación

(·, ·) : E ⇥E ! C
f (x), g(x) 7 ! (f, g)

que satisface las siguientes propiedades :


c Alvaro Domı́nguez, Univ. Sevilla Tema 7 5

a) Positividad: (f, f ) 0, y es cero si, y solo si f = 0.


b) Homogeneidad: (f, ↵g) = ↵ (f, g), 8↵ 2 C.
c) Distributividad: (f, g + h) = (f, g) + (f, h).

d ) Simetrı́a hermı́tica: (g, f ) = (f, g) .
Comentarios:
1. Se trata de la definición axiomática. Aunque parezca haber una asimetrı́a entre los dos elementos del
producto escalar en lo que respecta a los axiomas de homogeneidad y distributividad, esto no es ası́:
(d) ⇤ (b) ⇤ (d)
b’) (↵f, g) = (g, ↵f ) = ↵⇤ (g, f ) = ↵⇤ (f, g).
(d) ⇤ (c) ⇤ ⇤ (d)
d ’) (g + h, f ) = (f, g + h) = (f, g) + (f, h) = (g, f ) + (h, f ) .
2. Es inmediato comprobar que el producto escalar ordinario (euclı́deo) en RN verifica los axiomas: si x, y, z 2
RN son vectores reales N –dimensionales, entonces
x · x 0, y es nulo si, y solo si x = 0.
x · (↵y) = ↵(x · y).
x · (y + z) = x · y + x · z.
(x · y)⇤ = x · y = y · x.
3. A partir del producto escalar se pueden introducir otros conceptos relevantes:
p
a) La norma (“módulo”) de un vector se define como kf k := (f, f ). Un elemento f se dirá normalizado
si kf k = 1. En virtud del axioma de positividad, un vector será nulo si y solo si su norma es nula.
b) Dos elementos se consideran iguales si la norma de la diferencia es nula:
kf gk = 0 , f = g.
c) Se define la proyección de un vector f en la dirección del vector unitario u (esto es, kuk = 1) como
(u, f ) u. En particular, los vectores f y g se dicen ortogonales si (f, g) = 0 (la proyección es nula), y
se dicen paralelos si existe una constante ↵ 6= 0 tal que f = ↵g (el vector f tiene la misma dirección
que g).
d ) De manera más precisa, se verifica la desigualdad de Cauchy–Schwarz,
| (f, g) |2  (f, f ) (g, g) , | (f, g) |  kf k kgk ,
y se tiene la igualdad si y solo si f y g son paralelos. Geométricamente se interpreta como que la
proyección de un vector en cualquier dirección nunca es mayor que su norma y no se trata más que
de una consecuencia del teorema de Pitágoras.
La demostración es sencilla: en efecto, definamos los siguientes vectores:
g
ĝ := = vector unitario en la dirección de g, fg := (ĝ, f ) ĝ = proyección de f en la dirección de g, h := f fg .
kgk
Resulta que h es la componente de f ortogonal a g, es decir, que (ĝ, h) = 0. En efecto:
kĝk=1
z }| {
(ĝ, h) = (ĝ, f fg ) = (ĝ, f ) (ĝ, fg ) = (ĝ, f ) (ĝ, f ) (ĝ, ĝ) = 0.
Entonces se debe cumplir la siguiente igualdad:
kf k2 = (f, fg + h) = (f, fg ) + (f, h) = (f, ĝ) (f, ĝ) + (fg + h, h) = | (f, ĝ) |2 + (ĝ, f ) (ĝ, h) + (h, h) = | (f, ĝ) |2 + khk2 .
Es decir, se trata del teorema de Pitágoras:
hipotenusa cateto (proyección) cateto (comp. ortogonal)
z }| { z }| { z }| {
kf k2 = | (f, ĝ) |2 + khk2 .
Obviamente, de aquı́ se deduce
kf k2 | (f, ĝ) |2 = khk2 0,
que se convierte en la desigualdad de Cauchy–Schwarz, y la igualdad solo se dará cuando khk = 0, es decir, f = ↵ĝ (f
y g son paralelos).
6 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

Esta desigualdad tiene dos implicaciones importantes:


La norma verifica la desigualdad triangular o de Minkowski:

kf + gk  kf k + kgk .

En los espacios reales RN esta desigualdad se suele enunciar como que “el camino más corto entre
dos puntos es la lı́nea recta”.
La demostración también es sencilla:
kf + gk2 = (f + g, f + g) = (f, f ) + (g, g) + (f, g) + (g, f )
= (f, f ) + (g, g) + 2Re (f, g)  (f, f ) + (g, g) + 2| (f, g) |
(Cauchy–Schwarz)  (f, f ) + (g, g) + 2 kf k kgk = (kf k + kgk)2

En el caso de espacios sobre el cuerpo de los números reales (como RN ), tiene sentido hablar del
ángulo que forman los vectores: en efecto, en estos casos el producto escalar (f, g) siempre es real
y la desigualdad de Cauchy–Schwarz se expresa como

(f, g)
1  1,
kf k kgk

de manera que tiene sentido definir un ángulo ✓ como (f, g) =: kf k kgk cos ✓, y la desigualdad se
convierte en igualdad cuando ambos vectores son paralelos (✓ = 0 ó ⇡).

Definición: Sea una sucesión de vectores {f1 , f2 , . . . }. Se dice que la sucesión converge al vector f , y se escribe
lı́mn!1 fn = f , si se verifica
lı́m kfn f k = 0.
n!1

Comentarios:
El concepto de norma permite definir el concepto “paso al lı́mite en vectores” en términos del concepto ya
conocido de “paso al lı́mite en números reales”. Se dice que la norma pemite introducir una topologı́a en
el espacio vectorial.
Un fenómeno que puede suceder es que la topologı́a del espacio tenga “agujeros”, lo cual quiere decir lo
siguiente: supongamos que en la secuencia de elementos {f1 , f2 , . . . } la distancia entre elementos vecinos
se anula en el paso al lı́mite, es decir,

lı́m kfn+m fn k = 0, 8m.


n!1

Intuitivamente esta expresión sugiere que la sucesión posee un punto de acumulación h al cual se aproximan
los fn . Sin embargo, puede suceder que el punto de acumulación h no pertenezca al espacio, de manera
que no se pueda escribir fn ! h, es decir, que h representarı́a una especie de frontera interna o “agujero”
en el espacio. Esta posibilidad no es algo extraño, como ilustra el ejemplo de las siguientes sucesiones de
números racionales,
✓ ◆n n
X n ✓
Y ◆
1 1 1
an := 1+ 2 Q, bn := 2 Q, cn := 1 2 Q, n = 1, 2, 3 . . .
n 2k k (2k + 1)2
k=1 k=1

que, sin embargo, convergen a números irracionales,



lı́m an = e 62 Q, lı́m bn = ln 2 62 Q, lı́m cn = 62 Q.
n!1 n!1 n!1 4
Por tanto, el espacio Q de los números racionales tiene “agujeros”, mientras que el espacio R de los números
reales no los tiene. Este fenómeno motiva las dos siguientes definiciones:
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 7

• Un espacio se dice completo si cualquier sucesión con un punto de acumulación converge dentro del
mismo espacio. Es decir, el espacio “no tiene agujeros”. Como hemos visto, el espacio Q no es completo,
mientras que R (o, de manera más general, RN ) sı́ lo es.
• El espacio Q no solo “tiene agujeros”, sino que además “están por todas partes”: entre cualesquiera
dos números racionales hay una infinidad de números irracionales y cualquier número real se puede
aproximar con precisión arbitraria por un número racional. Este hecho motiva la introducción del
siguiente concepto : sea un espacio E dotado con una norma y S ⇢ E un subespacio del mismo. Se
dice que S es denso en E si se verifica

8f 2 E, 9{f1 , f2 , . . . } ⇢ S | lı́m fn = f.
n!1

Esto es, cualquier elemento de E se puede aproximar con precisión arbitraria por una sucesión de
elementos de S o bien, de manera equivalente, cualquier elemento de E está arbitrariamente próximo
a un elemento de S. Si además cualquier sucesión convergente en S lo hace a un elemento de E, se dice
que E completa a S, esto es, cualquier posible “agujero” del espacio S es “rellenado” por el espacio E.
Por tanto, el espacio Q es denso en R, mientras que este último completa al primero.

Definición: se denomina espacio de Hilbert a un espacio vectorial que posee un producto escalar y es completo
respecto a la norma asociada al mismo.
Comentario: por lo tanto, un espacio de Hilbert permite
introducir una base, por tratarse de un espacio vectorial,
que sea ortonormal (esto es, formada por vectores unitarios y mutuamente ortogonales) gracias al producto
escalar,
y que tenga infinitos elementos (dimensión infinita), pues al ser el espacio completo las series infinitas
convergentes lo hacen a elementos del propio espacio.
El espacio real RN es un espacio de Hilbert con el producto escalar euclı́deo. El siguiente resultado sirve de
colofón para esta sección:

Teorema de Riesz–Fischer: , el espacio funcional L2w (a, b) es un espacio de Hilbert con el producto escalar
Z b
(f, g) := dx w(x) f ⇤ (x) g(x), 8f, g 2 L2w (a, b).
a

Comentarios:
La demostración del teorema no es inmediata. Lo que sı́ se puede comprobar fácilmente es que esta expresión
para (f, g) verifican trivialmente los cuatro axiomas del producto escalar. Entonces, la norma viene dada
como Z b
2 2
kf k := dx w(x) |f (x)| ,
a

es decir, una función f (x) pertenece al espacio L2w (a, b) si, y solo si, su norma es finita. Una consecuencia
inmediata de estos resultados es que la desigualdad de Cauchy–Schwarz asegura que el producto escalar
entre cualesquiera dos elementos del espacio está bien definido:

| (f, g) |  kf k kgk < 1, 8f, g 2 L22 (a, b).

Esta definición de norma introduce una sutileza al interpretar lo que significa que dos vectores del espacio
L2w (a, b) sean iguales: se escribe f = g si kf gk = 0, lo cual significa
Z b
2 2
kf gk := dx w(x) |f (x) g(x)| = 0,
a
8 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

pero de aquı́ no se puede concluir f (x) = g(x), 8x 2 (a, b). Por ejemplo,
8
< 1, x > 0, ⇢ ⇢
1, x 0, 0, x 6= 0
f (x) = signo x = 0, x = 0, g(x) = ) f (x) g(x) =
: 1, x < 0, 1, x=0
1, x < 0,

ası́ que claramente f (x) 6= g(x), pero kf gk = 0 porque el integrando es no nulo en un único punto. Por
ello se distingue entre

• igualdad en media o en norma cuando los vectores f y g son iguales, esto es, kf gk = 0,
• e igualdad punto a punto o puntual cuando las funciones f (x) y g(x) son iguales, esto es, f (x) =
g(x), 8x 2 (a, b).

Para marcar estas distinción cuando sea necesario, expresaremos que dos funciones son iguales en media
como f (x) ' g(x). En realidad ya hemos encontrado esta sutileza al discutir las transformadas inversas
de Fourier y de Laplace y como entonces casi siempre se podrá obviar la diferencia a efectos prácticos. La
diferencia refleja el salto conceptual entre la definición ordinaria de funciones como duplas (x, f (x)) y la
definición “holı́stica” como un vector de un espacio funcional.

Se puede demostrar que cualquier espacio de Hilbert L2w es isomorfo al espacio L2 ( 1, +1) pues se puede
establecer una transformación lineal biunı́voca entre los elementos de ambos espacios. En el caso de los
espacios L2w (a, b) con a, b finitos es sencillo comprobarlo: en efecto, sea f 2 L2w (a, b) e introduzcamos las
nuevas variables
2x (b + a) p
s := ) 1  s  +1, fˆ(s) := w(x)f (x).
b a
Entonces el vector fˆ pertenece al espacio L2 ( 1, +1):
Z +1 Z b
2
ds |fˆ(s)|2 = dx w(x)|f (x)|2 < 1 ) fˆ 2 L2 ( 1, +1).
1 b a a

Como el cambio de variables es claramente invertible (recordemos que w(x) > 0 estrictamente), resulta
que se puede establecer una relación uno a uno entre elementos de los espacios L2 ( 1, +1) y L2w (a, b). Más
aún, los productos escalares en los respectivos espacios están relacionados como
D E 2
fˆ |ĝ = hf |g iw .
w(x)=1 b a

Por lo tanto, todas las propiedades del espacio L2 ( 1, +1) basadas en la estructura de espacio de Hilbert
con este producto escalar se pueden transferir sin más a cualquier espacio L2w (a, b). Para el caso de que a
o b sean infinitos (esto es, los espacios L2w (R), L2w (a, +1), L2w ( 1, b)) el argumento es más complicado
pero la conclusión es la misma.

El teorema explica la importancia de los espacios L2w en la fı́sica matemática frente a otros que podrı́an
parecer “más naturales”, como los espacios C n : estos últimos no son completos, pero sı́ son densos en L2w ,
es decir, este último completa los espacios C n (teorema de Stone–Weierstrass ). Como consecuencia, se
usan los espacios L2w para justificar la estructura algebraica (producto escalar, norma, etc.), pero cualquier
elemento de este espacio se puede aproximar con precisión arbitraria por una función continua y derivable.
Como ejemplo de aplicación de este marco consideremos el espacio vectorial Kn [a, b] de soluciones (clásicas)
de una EDO lineal y homogénea bien planteada en el intervalo finito a  x  b. Por definición de solución
clásica, sabemos que todas serán continuas en el intervalo y por tanto también de cuadrado integrable:
en consecuencia, Kn [a, b] es un subespacio de L2 (a, b) ası́ que el espacio Kn [a, b] se puede dotar de la
estructura de espacio de Hilbert “heredada” de su pertenencia a L2 (a, b). En el siguiente tema se estudiará
cómo explotar esta posibilidad.
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 9

Notación de Dirac: la definición de producto escalar (f, g) introducida para el espacio L2 se puede interpretar
como un funcional lineal para el segundo elemento, g(x), con un núcleo determinado por el primero, f ⇤ (x): en
notación de distribuciones se puede escribir igualmente
Z +1
(f, g) = dx f ⇤ (x) g(x) = Df ⇤ [g].
1

(Por lo ya mencionado, nos limitamos a ilustrar las ideas con el espacio L2 ( 1, 1), sabiendo que son aplicables
al caso genérico L2w (a, b)).
Esta expresión se interpretarı́a como que f ⇤ (x) es una distribución asociada al espacio de funciones de prueba
g(x) 2 L2 ( 1, 1). Recordemos que el conjunto de todos las distribuciones de este tipo, es decir, los funcionales
lineales y acotados, es el espacio dual L2⇤ ( 1, 1). Ya se ha comprobado que L2 ( 1, 1) ⇢ L2⇤ ( 1, 1), puesto que
el producto escalar (f, g) está definido para cualquier par de elementos de L2 ( 1, 1). Surge pues naturalmente
la pregunta de si existen otros objetos matemáticos T (x) tales que T 62 L2 ( 1, 1), es decir, no son funciones de
cuadrado integrables, pero T 2 L2⇤ ( 1, 1), es decir, tales que (T, g) = DT ⇤ [g] existe para cualquier g 2 L2 ( 1, 1).
La respuesta la proporciona el

teorema de Riesz–Fréchet: , el espacio L2 ( 1, 1) es su propio dual: L2⇤ ( 1, 1) = L2 ( 1, 1).

Esto es, las distribuciones construidas usando L2 ( 1, 1) como funciones de prueba es el propio espacio L2 ( 1, 1).
Lo que ocurre es que este espacio es tan “amplio” e incluye funciones tan “exóticas” que no ofrece flexibilidad
para construir distribuciones nuevas. Desde un punto de vista práctico este hecho es una desventaja, puesto que
existen distribuciones T (x) de utilidad en las aplicaciones fı́sicas que no se pueden interpretar usando L2 ( 1, 1)
como espacio de funciones de prueba, pero que sin embargo se pueden aplicar a funciones g(x) que pertenecen
a subconjuntos del espacio L2 ( 1, 1) con gran interés en las aplicaciones, como las funciones continuas. Por
ejemplo,
9
1
f (x) = p 62 L ( 1, 1) >
2 >
= Z +1 Z +1
|x| g(x)
) (f, g) = dx f ⇤ (x)g(x) = dx p < 1,
>
> 1 1 |x|
;
g(x) 2 C 0 [ 1, 1] ⇢ L2 (0, 1)

9
f (x) = (x) 62 L2 ( 1, 1) = Z +1 Z +1

) (f, g) = dx f (x)g(x) = dx (x)g(x) = g(0) < 1.
;
g(x) 2 C 0 ( 1, 1) ⇢ L2 ( 1, 1) 1 1

La situación se puede resumir en la cadena de inclusiones

S ⇢ L2 (R) = L2⇤ (R) ⇢ S ⇤ .

El fı́sico P. Dirac introdujo una notación para agrupar toda esta casuı́stica de interés práctico: se define la
expresión denominada “braket” como
Z +1
hf |g i := dx f ⇤ (x) g(x),
1

mientras que |gi, hf | se denominan, respectivamente, “ket” y “bra”, los cuales denotan cualquier objeto ma-
temático tal que el braket hf |g i está bien definido. Entonces, a la vista de la discusión previa se puede afirmar

(i) que cualquier elemento del espacio L2 ( 1, 1) se puede asociar con un ket, al cual le corresponde un único
bra, y viceversa, esto es, la relación |f i $ hf | es biunı́voca para todo f 2 L2 ( 1, 1);
10 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

(ii) que las distribuciones temperadas se pueden asociar con un bra, y entonces el correspondiente ket se
construye de manera unı́voca a partir de la propiedad del braket hf |g i = (hg |f i)⇤ , heredada del producto
escalar. En particular, la distribución delta de Dirac (x x0 ) se denota con el ket |x0 i.
En lo sucesivo usaremos por comodidad la notación de Dirac incluso para manipulaciones que solo involucren
“vectores verdaderos” de L2 ( 1, 1):
(solo si f, g 2 L2 ) (para objetos f, g más generales)

producto escalar (f, g) ! braket hf |g i


primer elemento f ⇤ (x) ! bra hf | ($ ket |f i)
segundo elemento g(x) ! ket |gi ($ bra hg|)
Por ejemplo, la delta de Dirac (x x0 ) tiene asociado un bra hx0 |, de manera que para funciones continuas se
puede escribir
(x x0 )2R ⇢
Z +1 z }| {
0 2 ⇤ g(x0 ), |x0 | < 1,
g(x) 2 C [ 1, 1] ⇢ L ( 1, 1) : hx0 |g i = dx (x x0 ) g(x) =
1 0, 1 < |x0 |.
El correspondiente ket |x0 i se construye a partir de la identidad
⇢ ⇤
⇤ g (x0 ), |x0 | < 1,
hg |x0 i := hx0 |g i = 8g(x) 2 C 0 [ 1, 1].
0, 1 < |x0 |,
Este resultado permite introducir la notación g(x0 ) = hx0 |f i, incluso para funciones g(x) que no estén definidas
en todos los puntos, la cual se lee como que el valor g(x0 ) es la “proyección” de la función g(x) sobre la delta de
Dirac localizada en x0 . Esto se debe entender en sentido formal y es una notación muy útil en fı́sica para muchas
manipulaciones, que nosotros utilizaremos ocasionalmente.

El siguiente cuadro resume el paralelismo inducido por la estructura común de espacio de Hilbert entre el espacio
euclı́deo RN y el espacio funcional L2w (a, b):

p QN es denso en RN
RN c c·d |c| = c·c c = d , |c d| = 0
pero no completo

p C 0 [a, b] es denso en L2w (a, b)


L2w (a, b) f hf |g i kf k = hf |f i f = g , kf gk = 0 , f (x) ' g(x)
pero no completo

7.2. Bases ortonormales


La estructura de espacio de Hilbert permite introducir el concepto de base ortonormal, como el que existe en
los espacios euclı́deos RN . Veremos sin embargo que los espacios funcionales tienen dimensión infinita, lo cual
significa que un elemento del espacio se escribirá como una combinación lineal de infinitos elementos, esto es, una
serie. Este hecho plantea la dificultad de analizar la convergencia de la serie, para lo cual será útil la propiedad
del espacio de ser completo. En lo sucesivo H denotará un espacio L2w (a, b).

Definición: un conjunto finito {|'1 i , |'2 i , . . . |'n i} de elementos de un espacio de Hilbert H se dice linealmente
independiente si la condición
n
X
↵k |'k i = 0
k=1
solo se satisface para ↵1 = · · · = ↵k = 0. La condición se escribe de manera compacta en notación de Dirac para
enfatizar el carácter vectorial de las funciones 'n (x) como un todo; en la notación ordinaria que se utilizó al
discutir EDOs lineales se escribirı́a
Xn
↵k 'k (x) = 0, 8x 2 rango de definición.
k=1
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 11

Definición: la dimensión del espacio es el número máximo de elementos linealmente independientes.

Definición: un conjunto (finito o infinito) {|'1 i , |'2 i , . . . } de elementos de un espacio de Hilbert se denomina
sistema ortonormal si cada elemento está normalizado a la unidad y es ortogonal a todos los demás,

1, n = m,
8n, m : h'n |'m i = n,m =
0, n 6= m.

Por ejemplo, el conjunto ⇢


1
Bexp := 'n (x) = p ein⇡x/L
2L n=0,±1,±2...
2
forma un sistema ortonormal en el espacio L ( L, +L):
8 Z +L
>
> 1
Z +L >
> dx = 1, si n = m,
1 < 2L L
h'n |'m i = dx ei(m n)⇡x/L =
2L L >
>
>
> ei(m n)⇡ e i(m n)⇡ sen(m n)⇡
: = = 0, si n 6= m.
2i(m n)⇡ (m n)⇡

Lema: sea B := {|'1 i , |'2 i , . . . } un sistema ortonormal (finito o infinito). Entonces cualquier subconjunto
finito de B es linealmente independiente.
Demostración: Este lema generaliza la noción del espacio euclı́deo RN de que ortogonalidad implica independencia
lineal debido a que se puede proyectar a lo largo de la dirección de cada vector: en efecto, tomemos un subconjunto
finito del sistema ortonormal, {|f1 i , . . . |fN i} ⇢ B, y resolvamos la condición de independencia lineal mediante
la proyección ortogonal inducida por el producto escalar:
N N
! Z N
!
X X b X

↵k |fk i = 0 ) 0 = hfn | ↵k |fk i = dx w(x) fn (x) ↵k fk (x)
k=1 k=1 a k=1
N
X Z b N
X N
X
(suma finita) = ↵k dx w(x) fn⇤ (x)fk (x) = ↵k hfn |fk i = ↵k n,k = ↵n .
| {z }
k=1 |a {z } k=1 ortonorm. k=1
hfn |fk i

Por tanto, la comprobación de independencia lineal se expresa con facilidad a través de la noción de proyección
ortogonal: esta es una de los principales motivos para dotar un espacio vectorial de un producto escalar (pero
enfatizando que independencia lineal y ortogonalidad son conceptos diferentes).

Corolario: los espacios L2w (a, b), con a y b finitos o infinitos, tienen dimensión infinita.
Demostración: Ya se ha comprobado que el conjunto Bexp , que posee infinitos elementos, es un sistema orto-
normal: por tanto, el espacio L2 ( 1, +1) tiene dimensión infinita. Como todos los espacios L2 son isomorfos, el
resultado es extensible a ellos.

7.2.1. Serie de Fourier generalizada


Cuando el espacio de Hilbert H tiene dimensión infinita sus elementos se expresarán como series infinitas de
elementos de una base:
1
X
|f i 2 H ) |f i = ck |'k i , {|'1 i , |'2 i , . . . } base ortonormal de H.
k=1

El objetivo es determinar los coeficientes ck en función del vector |f i. En el espacio euclı́deo RN , con una base
{e1 , e2 , . . . eN }, esto se consigue proyectando el vector a lo largo de cada dirección de la base :
12 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

NX
finito N
! N
X X
N
x= x k ek 2 R ) ej · x = ej · x k ek = x k ej · ek = c j ,
k=1 k=1 k=1
| {z }
j,k

de manera que cada vector x se puede representar por la N -tupla (x1 , x2 , . . . xN ) de componentes en la base
dada. La dificultad clave en el caso de dimensión infinita es que no está probado que se pueda intercambiar el
orden de dos lı́mites: el de la serie infinita y el de la integral que define el producto escalar,
* 1
+ 1 Z b 1 1 Z b
X ? X X ? X
'j c k 'k = ck h'j |'k i , dx w(x) '⇤j (x) ck 'k (x) = ck dx w(x) '⇤j (x) 'k (x).
k=1 k=1 a k=1 k=1 a

A continuación demostraremos paso a paso que la analogı́a con los espacios euclı́deos RN a este respecto es, sin
embargo, completa.

1. Lema: supongamos que la sucesión de vectores {|h1 i , |h2 i , . . . } converge al vector |hi. Entonces se verifica
D E
hg |h i = g lı́m hn = lı́m hg |hn i , 8 |gi 2 H,
n!1 n!1

es decir, se puede intercambiar el paso el lı́mite con el producto escalar.


Demostración: el objetivo es demostrar que la sucesión de números complejos hg |hn i converge al número
hg |h i a partir de la condición de que la sucesión de números reales khn hk converge a cero (esta es la
definición de convergencia de la sucesión de vectores |hn i). Para ello, se calcula la siguiente diferencia:
Cauchy Schwarz
0  |hg |h i hg |hn i| = |hg |h hn i|  kgk kh hn k ,

de donde se deduce inmediatamente la igualdad pedida. En lenguaje geométrico, este resultado establece
que si un vector se aproxima a otro, también lo hacen sus respectivas proyecciones a lo largo de cualquier
dirección.
P1
Como consecuencia de este lema, podemos establecer el siguiente resultado: si la serie k=1 ck |'k i converge
al vector |f i, entonces se debe cumplir
* 1
+ * n
+ 1
X X X
h'j |f i = 'j ck 'k = 'j lı́m c k 'k = ck h'j |'k i = cj .
k=1
n!1
k=1 k=1
| {z }
j,k

Es decir, los coeficientes de la expresión de |f i en la base infinita vienen dados por la proyección ortogonal,
como en los espacios euclı́deos. Falta por tanto demostrar que la serie construı́da con estos coeficientes es
efectivamente convergente.
2. Introducimos el subespacio vectorial de dimensión finita n generada por los n primeros elementos de la
base,
Sn := gen{|'1 i , . . . |'n i}.
Se definen las sumas parciales
n
X
|fn i := ck |'k i ,
k=1

que representan la proyección del vector |f i en el subespacio Sn . La norma de estas proyecciones es (como
n es finito, todas las manipulaciones que siguen están justificadas)
n
! n n
2
X X X
kfn k = hfn |fn i = hfn | ck |'k i = ck hfn |'k i = |ck |2 ,
| {z }
k=1 k=1 k=1
h'k |fn i⇤ =c⇤
k
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 13

como cabe esperar del teorema de Pitágoras en el subespacio Sn . Más aún, se tiene el siguiente

2 2
lema: se verifica la denominada desigualdad de Bessel, kfn k  kf k .
Demostración: no se trata más que de una aplicación de la desigualdad de Cauchy–Schwarz, que representa
geométricamente que la proyección de un vector nunca es mayor que su norma:

n
! n n
X X X 2
kf k kfn k |hf |fn i| = hf | ck |'k i = ck hf |'k i = |ck |2 = kfn k ) kfn k  kf k .
| {z }
k=1 k=1 k=1
h'k |f i⇤ =c⇤
k

De aquı́ se deducen dos corolarios relevantes:


Pn 2
P1reales 2 k=1 |ck | forman una sucesión monótonamente creciente
a) Como las sumas parciales de números
y acotada superiormente, la serie k=1 |ck | debe ser convergente .
b) Como esta serie converge, su término general debe tender a cero:
Z b
lı́m |ck | = 0 , lı́m dx w(x) '⇤k (x) f (x) ! 0.
k!1 k!1 a

Este resultado se denomina lema de Riemmann–Lebesgue generalizado .

P1
Lema: la serie k=1 ck |'k i es convergente en media.
Demostración: esta serie es la sucesión de sumas parciales |fn i. Para demostrar que la sucesión converge,
se prueba que la distancia entre dos elementos de la misma se puede hacer arbitrariamente pequeña al
avanzar en la sucesión. Tomando dos enteros arbitrarios m, n, se tiene
m n 2 m 2 * m m
+
2
X X m>n
X X X
kfm fn k = c k 'k c k 'k = c k 'k = c j 'j c k 'k
k=1 k=1 k=n+1 j=n+1 k=n+1
m
X m
X 1
X 1
X Xn
= c⇤j ck h'j |'k i = |ck |2  |ck |2 = |ck |2 |ck |2 ,
k,j=n+1
| {z } k=n+1 k=n+1 k=1 k=1
jk | {z }
convergente

empleando los resultados obtenidos de la desigualdad de Bessel. Por tanto, es evidente que se puede tomar
n (y por ende m) suficientemente grande para que kfn fm k sea arbitrariamente pequeño. Como el espacio
de Hilbert H es completo (“no tiene agujeros”), la sucesión debe converger en media a algún elemento del
espacio:
X1
9 |hi 2 H | |hi = h'k |f i |'k i .
k=1

3. Notemos que este resultado no garantiza que el lı́mite |hi de las sumas parciales sea el vector original
|f i: dado que la dimensión del espacio es infinita, es posible construir sistemas ortonormales que, aunque
tengan infinitos elementos, sin embargo no permiten expresar todos los vectores del espacio. Por ejemplo,
en el espacio L2 ( 1, +1) se considera la función f (x) = e i⇡x y el sistema ortonormal

+ 1
Bexp := 'n (x) = p ein⇡x .
2⇡ n=1,2,3...

Se trata solo de un subconjunto propio del conjunto Bexp introducido antes, ya que el rango de valores del
ı́ndice n es más reducido. Se tiene
Z +1 Z +1 X1
1 n 6= 1
cn = h'n |f i = dx '⇤n (x)e i⇡x = p dx e in⇡x e i⇡x = 0 ) |hi = cn |'n i = 0 6= |f i .
1 2 1 n=1
14 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

p
Es evidente que la serie de sumas parciales converge, pero no al vector original f (x) = 2⇡ ' 1 (x) sino
+
a cero porque es ortogonal a todos los vectores de Bexp , a pesar de que este último conjunto genera un
espacio de dimensión infinita pero obviamente no lo bastante grande aún. Por tanto, es necesario introducir
la siguiente

definición: , un sistema ortonormal B = {|'1 i , |'2 i , . . . } del espacio de Hilbert H se dice completo, y se
denomina base si se verifica que
1
X
|f i = ck |'k i con ck = h'k |f i , 8 |f i 2 H.
k=1

Por lo tanto, se puede escribir H = gen B (“el sistema ortonormal B genera el espacio H”), ası́ que
cualquier elemento del espacio se puede escribir como una combinación lineal de elementos de la base. En
la próxima sección veremos varios ejemplos relevantes de bases.
La expresión de |f i en términos de los elementos de la base se denomina serie generalizada de Fourier de
f relativa a la base B y se dice que el vector f (o la función f (x)) se ha desarrollado en la base B. Esta
serie expresa |f i en términos de las proyecciones ortogonales ck = h'k |f i a lo largo de cada dirección dada
por los vectores unitarios |'k i: los números complejos ck se llaman coeficientes generalizados de Fourier y
juegan el papel de las componentes de un vector en la base B, de manera que el vector |f i se representa
en la base con una lista infinita {c1 , c2 , . . . }. Es importante enfatizar que la igualdad (o convergencia) es
en media, esto es,
n
X Z b n
X
2

lı́m f c k 'k = 0 , lı́m dx w(x) f (x) ck 'k (x) =0


n!1 n!1 a
k=1 k=1

con Z b
ck = h'k |f i = dx w(x)'⇤k (x)f (x).
a
Esto implica que puede existir un conjunto de puntos x donde f (x) no sea exactamente igual a la suma
de la serie, pero el tamaño de este conjunto debe ser despreciable en lo que concierne la evaluación de la
integral, es decir, la gráfica de este conjunto de puntos subtiende un área nula (conjunto de medida nula).
4. Para concluir, algunos resultados útiles:

Lema: sea {|'1 i , |'2 i , . . . } una base ortonormal del espacio de Hilbert H. Entonces se puede escribir
1
X
hg |f i = b⇤k ck con ck = h'k |f i , bk = h'k |g i , 8 |f i , |gi 2 H.
k=1

Demostración: como la serie de Fourier generalizada que representa la función f (x) es convergente, es
posible intercambiar el paso al lı́mite con el producto escalar:
* + h'k |g i⇤
n
X n
X z }| { n
X 1
X
hg |f i = lı́m hg |fn i = lı́m g c k 'k = lı́m ck hg |'k i = lı́m ck b⇤k = b⇤k ck .
n!1 n!1 n!1 n!1
k=1 k=1 k=1 k=1

Este resultado generaliza la fórmula del espacio euclı́deo RN para el producto escalar en términos de las
componentes en una base ortonormal.

Corolario: se verifica la identidad de Parseval (tomando g = f en la expresión anterior):


1
X 1
X
2
kf k = hf |f i = |ck |2 = | h'k |f i |2 8 |f i 2 H.
k=1 k=1
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 15

Se trata de la generalización a espacios funcionales del teorema de Pitágoras y corresponde al caso en que
la desigualdad de Bessel se convierte en igualdad.

Lema: sea {|'1 i , |'2 i , . . . , |'n i} un sistema ortonormal finito. Entonces, la combinación lineal de estos
elementos que mejor aproxima un vector |f i 2 H es la proyección ortogonal del mismo en el subespacio
generado por el sistema.
Demostración: este resultado extiende la sencilla imagen geométrica del espacio R3 de que, dados un vector
y un plano, el vector del plano más cercano al vector original es su proyección ortogonal sobre el plano . La
demostración es casi inmediata: el sistema ortonormal genera un subespacio vectorial Sn ⇢ H de dimensión
n formado por todas las posibles combinaciones lineales de la forma
n
X
|hi = ak |'k i .
k=1

El objetivo es determinar los coeficientes ak para que el error E({ak }) = kf hk sea mı́nimo. Se definen
los componentes ck := h'k |f i de la proyección de |f i sobre el subespacio y se desarrolla la expresión para
el error:
2
En2 = kf fn k = hf h |f h i = hf |f i hf |h i hh |f i + hh |h i
n
!
2
X ⇤ 2
= kf k hf | ak |'k i hf |h i + khk
k=1
n
X n
X
2 ⇤
= kf k ak hf |'k i hf |h i + |ak |2
| {z }
k=1 k=1
h'k |f i⇤ =c⇤
k
n
X n
X
2
= kf k (a⇤k ck + ak c⇤k ) + |ak |2
k=1 k=1
Xn n
X
2
= kf k |ck |2 + |ak ck |2 .
k=1 k=1
| {z }
0

Es evidente que, como función de los coeficientes a1 , a2 , . . . an , el error E será mı́nimo si se escoge ak = ck .
En tal caso,
X n
|f i ⇡ |hi = h'k |f i |'k i
k=1

es la mejor aproximación (en el sentido de la norma) que se puede construir del vector |f i con los elementos
del sistema ortonormal dado. A efectos prácticos esta propiedad es muy útil en aplicaciones de algoritmos
numéricos para representar las funciones como combinaciones lineales de elementos de un sistema ortonor-
mal, que por fuerza será finito para permitir la implementación práctica.

En conclusión, a pesar de la dimensión infinita, siguen siendo válidos el tipo de manipulaciones y los resultados
que se encuentran en espacios euclı́deos concernientes a la descomposición de un vector en sus componentes en
una base ortonormal dada.

7.2.2. Algunas bases ortonormales


Demostrar que un sistema ortonormal es una base de un espacio de Hilbert de dimensión infinita no es trivial. Sin
embargo, se pueden emplear los métodos de los espacios euclı́deos RN para construir bases ortonormales, cuya
generalización se apoya en los correspondientes teoremas no triviales. Destacan en particular el procedimiento
de ortogonalización de Gram–Schmidt (basado en el teorema de Stone–Weierstrass) y el cálculo de autovectores
16 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

(basado en el teorema de Sturm–Liouville); ambos procedimientos se pueden solapar. En esta sección veremos
ejemplos del primer procedimiento; en el siguiente tema se discutirá el otro.

Teorema de Stone–Weierstrass: , , : el conjunto de monomios {'n (x) = xn }n=0,1,2... forma una base del
espacio L2w (a, b).
Comentarios:

Por tanto, cualquier elemento del espacio de Hilbert se podrá expresar como
1
X
f (x) ' c k xk .
k=0

Sin embargo, ck 6= h'k |f i porque esta base no está ortonormalizada: por ejemplo, en L2 ( 1, 1) es
Z +1
1 ( 1)n+m+1
h'n |'m i = dx xn xm = 6= n,m .
1 n+m+1

Sin embargo, utilizando el método de ortogonalización de Gram–Schmidt es posible construir una base
ortonormal mediante la consideración de combinaciones lineales de los monomios, es decir, polinomios.
Veremos algunos ejemplos.

Dado que los monomios son funciones continuas, este resultado demuestra que cualquier función del espacio
de Hilbert L2w (a, b) se puede aproximar arbitrariamente por una función continua, es decir, que, efectiva-
mente, el espacio de las funciones continuas C 0 [a, b] es denso en el espacio de las funciones de cuadrado
integrable.
P1
Es importante enfatizar que la igualdad (en media) f (x) ' k=0 ck xk no es equivalente a un desarrollo
de Taylor. Este último solo existe para funciones que verifican una serie de condiciones de regularidad
alrededor de un punto (analiticidad) y en este sentido es un desarrollo “local”: la truncación del desarrollo
proporciona una aproximación a la función que es tanto mejor cuanto más cerca del punto. El desarrollo
en una base del espacio de Hilbert, por el contrario, es de ı́ndole “global” y, como muestra el teorema,
permite expresar como serie de monomios funciones muy singulares del espacio de Hilbert que pueden no
tener desarrollo de Taylor en ningún punto: ya veremos algún ejemplo.

Base trigonométrica o de Fourier: el conjunto de funciones



1
Bexp := 'n (x) = p ein⇡x/L
2L n=0,±1,±2...

forma una base ortonormal del espacio L2 ( L, +L).


Comentarios:

Ya se comprobó la ortonormalidad del conjunto Bexp . Pero además resulta que cualquier función f (x) de
cuadrado sumable en ( L, L) se puede representar como
1
X X1
1
f (x) ' cn 'n (x) = p cn ein⇡x/L ,
n= 1 2L n= 1

con los coeficientes


Z +L Z +L
1
cn = h'n |f i = dx '⇤n (x)f (x) = p dx e in⇡x/L
f (x).
L 2L L
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 17

Ejemplo: para la función f (x) = signo x en el intervalo 1 < x < 1, es decir, considerada como elemento
del espacio L2 ( 1, 1), se tiene
Z +1 Z +1
1 1
cn = p dx e in⇡x signo x = p dx (cos n⇡x i sen n⇡x) signo x
2 1 2 1 | {z }
impar
8
p >
> 0, n par,
p Z +1 i 2 n
<
= i 2 dx sen n⇡x = [( 1) 1] = p
0 ⇡n >
> 2i 2
: , n impar,
⇡n
de manera que se puede escribir
1 p 1 p 1
X 2i 2 X 1 2i 2 X 1
signo x ' cn 'n (x) = 'n (x) = ['n (x) ' n (x)]
n= 1
⇡ n= 1 n ⇡ n=1
n
n impar n impar n impar
1 1
2i X 1 ⇥ in⇡x in⇡x
⇤ n = 2k + 1 4 X sen(2k + 1)⇡x
= e e =
⇡ n=1 n | {z } ⇡ 2k + 1
k=0
n impar 2i sen n⇡x
✓ ◆
4 1 1
= sen ⇡x + sen 3⇡x + sen 5⇡x + · · · , |x| < 1.
⇡ 3 5
Notemos que la serie converge a cero en los puntos x = 0, ±1. La identidad de Parseval para este ejemplo
conduce al siguiente resultado interesante:
Z 1 9
2
kf k = hf |f i = dx | signo x|2 = 2 >
>
>
>
1 >
>
= X1
1 ⇡2
* 1
+ 1 1 1 ) = .
X X X 8 n=2k+1 16 X 1 >
> (2k + 1)2 8
hf |f i = f c n 'n = cn hf |'n i = 2 = >
> k=0
n= 1 n= 1
| {z } n=1
⇡ 2 n2 ⇡2 (2k + 1)2 >
>
;
⇤ k=0
cn n impar

Ejemplo: la función f (x) = (1 x2 ) 1/4


diverge en x = ±1, pero pertenece al espacio L2 ( 1, 1):
Z +1
2 1 +1
kf k = dx p = arcsin x| 1 = ⇡.
1 1 x2
Por tanto, están bien definidos los coeficientes
8 p
> (3/4)
z
par
}| { >
> 2 2⇡ , n = 0,
Z >
1 +1
in⇡x 1 p Z 1 cos n⇡x < (1/4)
cn = h'n |f i = p dx e = 2 dx =
2 1 (1 2
x ) 1/4
0 (1 x2 )1/4 >
> ✓ ◆✓ ◆1/4
>
> 3 ⇡
: J1/4 (|n|⇡), n 6= 0,
4 2|n|
(no interesan los detalles sobre la evaluación de la integral , el propósito del ejemplo es ilustrar el caso de
una función con singularidades integrables), y se puede escribir
2 cos n⇡x
1 X ⇥z in⇡x }| {⇤
+1
X +1
X 1
c n =cn
2 1/4 in⇡x
(1 x ) ' cn 'n (x) = c0 + cn ['n (x) + ' n (x)] = c0 + p cn e +e
n= 1 n=1
2 n=1
" ✓ ◆1/4 ✓ ◆ X 1
#
p (3/4) 2 5 J1/4 (n⇡)
= 2 ⇡ 1+ cos n⇡x
(1/4) ⇡ 4 n=1 n1/4
⇡ 10 198 00 155 cos ⇡x + 00 096 cos 2⇡x 00 072 cos 3⇡x + · · · |x| < 1.
18 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

Ejemplo: la versatilidad de la representación de funciones mediante bases del espacio de Hilbert queda
patente con el ejemplo de la función de Weierstrass: se trata de una función continua en todos los puntos
pero no derivable en ninguno. Como ya se comentó, hay muchas funciones de esta ı́ndole (de hecho, son la
mayorı́a de las funciones). A modo de ejemplo, la serie
1
X sen(⇡k 2 x) 1 1
S(x) = = sen ⇡x + sen 4⇡x + sen 9⇡x + · · ·
k2 4 9
k=1

representa una función continua en todos los puntos, pero derivable sólo en un conjunto de puntos de
medida nula (es decir, la gráfica del conjunto de estos puntos subtiende un área nula). Esta serie tiene
una estructura parecida a la serie para la función signo x, excepto que en vez de sumar sobre los impares
positivos, se suma sobre los cuadrados perfectos.
Ejemplo: consideremos la distribución delta de Dirac (x x0 ), con L < x0 < L. Como ya se discutió a
propósito de la notación de Dirac, aunque la distribución no es un elemento del espacio L2 ( L, L), sı́ tiene
asociada un ket |x0 i y un bra hx0 |, y está bien definido el braket
Z +L
⇤ |x0 |<L 1
hx0 |'n i = dx (x x0 ) 'n (x) = 'n (x0 ) = p ein⇡x0 /L .
L 2L
Entonces se puede escribir formalmente el desarrollo del ket asociado a la delta de Dirac en la base
trigonométrica:
'⇤
n (x0 )
1 z }| {
X 1
X 1
1 X in⇡(x x0 )/L
|x0 i = h'n |x0 i |'n i , (x x0 ) ' '⇤n (x0 )'n (x) = e
n= 1 n= 1
2L n= 1
" 1
#
1 X n⇡(x x0 )
= 1+2 cos , |x0 | < L.
2L n= 1
L

Esta última expresión se debe entender como igualdad en el sentido de distribuciones: aunque cada elemento
de la serie es una función del espacio de Hilbert, es evidente que la serie no converge a ninguna función en
ese espacio porque el término general de la serie no tiende a cero, esto es, no se verifica el lema generalizado
de Riemann–Lebesgue. Notemos que esta conclusión no es contradictoria con que el espacio de Hilbert sea
completo ya que la distancia entre elementos de la sucesión no se anula: por ejemplo, la diferencia entre
dos términos vecinos es cos n⇡(x x0 )/L, cuya norma no se anula por muy grande que se tome n:
2 Z L 2
n⇡(x x0 ) n⇡(x x0 )
cos = dx cos = L.
L L L

Es decir, la norma de la serie también diverge.


Se puede comprobar que el conjunto de funciones
n n⇡x n⇡x o
Btrig := cos , sen
L L n=0,1,2...

es una base ortogonal (no está normalizada) del espacio L2 ( L, +L). En efecto:
• Por un lado los elementos son mutuamente ortogonales. Por ejemplo,
D Z +L Z +L 
n⇡x m⇡x E n⇡x m⇡x 1 (n + m)⇡x (n m)⇡x m6=n
cos cos = dx cos cos = dx cos + cos = 0,
L L L L L L 2 L L

y de manera análoga para las otras combinaciones de senos y cosenos. Estas integrales también se
pueden evaluar con facilidad expresando las funciones trigonométricas en términos de las exponenciales
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 19

1/2 in⇡x/L
complejas 'n (x) = (2L) e 2 Bexp y aplicando la ortogonalidad de las mismas: por ejemplo,
D ⌧
n⇡x m⇡x E 1 1 1
cos cos = ('n + ' n ) ('m + ' m )
L L 2L 2 2
1 1
= [h'n |'m i + h'n |' m i + h' n |'m i + h' n |' m i]
2L 4
1
= [2 n,m + 2 n, m ] = 0 porque m 6= n y m, n 0.
8L
• Por otra parte, cualquier elemento de este espacio se puede expresar como
2 3
X1 h i X1
6 n⇡x n⇡x 7
f (x) ' c0 + cn ein⇡x/L + c n e in⇡x/L = c0 + 4(cn + c n ) cos + i (cn c n ) sen 5
|{z} | {z } L | {z } L
n=1 n=1
=:a0 /2 =:an =:bn
1 h
a0 X n⇡x n⇡x i
= + an cos + bn sen ,
2 n=1
L L

con los coeficientes Z +L


1
a0 = 2c0 = dx f (x),
L L
2 cos n⇡x/L
Z +L zh }| i{ Z +L
1 in⇡x/L 1 n⇡x
an = c n + c n = dx e + ein⇡x/L f (x) = dx f (x) cos ,
2L L L L L
2i sen n⇡x/L

i
Z +L hz }| i{ 1
Z +L
n⇡x
in⇡x/L
bn = i(cn c n) = dx e ein⇡x/L f (x) = dx f (x) sen .
2L L L L L
Es decir, si f 2 L2 ( L, L) entonces se puede escribir como una serie de elementos del conjunto Btrig .
Esta forma alternativa de escribir la serie permite tener una expresión manifiestamente real cuando la
función f (x) lo es, pues entonces también serán reales los coeficientes an , bn . La serie escrita de esta
manera se denomina serie de Fourier propiamente, aunque es habitual extender la denominación también
a la serie escrita con las exponenciales de argumento imaginario.
Relación con la transformada de Fourier: la representación de funciones mediante una serie de Fourier es
de particular relevancia por su sencillez y por su omnipresencia en problemas de la Fı́sica Matemática.
Ası́, en términos fı́sicos se puede entender la serie de Fourier como la representación de la función f (x) en
forma de superposición lineal de ondas estacionarias:
+1
X +1
eikn x a0 X n⇡
f (x) ' cn p = + (an cos kn x + bn sen kn x) , kn := ,
n= 1 2L 2 n=1
L

en términos del “número de onda” kn ; el conjunto de coeficientes {c0 , c±1 , c±2 . . . } o bien {a0 , a1 , b1 , a2 , b2 , . . . }
de la serie de Fourier serı́a entonces el “espectro” de la función f (x).
Esta forma de escribir la serie permite establecer un paralelismo con la transformada de Fourier cuando se
considera el lı́mite L ! 1: si el intervalo de definición se extiende a todo el eje real, los números de onda
dejan de tomar valores discretos pues la diferencia entre dos sucesivos, k := kn+1 kn = ⇡/L, se anula.
Entonces se puede considerar el número de ondas k como una variable continua y la suma sobre el ı́ndice
n se transforma en una integral (“suma de Riemann”):
=:F (kn )
+1 +1 +1
z
}| { Z
X X eikn x X k 2⇡cn k!0
+1
dk
f (x) ' cn 'n (x) = cn p = p eikn x ! F (k)eikx = F 1
[F ],
n= 1 n= 1 2L n= 1
2⇡ 2L k 1 2⇡
20 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

con la función
p Z +L Z +1
2⇡cn k=⇡/L ikn x L!1 ikx
F (kn ) := p = 2L cn = dx e f (x) ! e f (x) = F[f ].
2L k L 1

La identidad de Parseval (“teorema de Pitágoras”) para los coeficientes de la serie de Fourier se convierte
en este lı́mite en la identidad generalizada de Parseval , , :
kf k2
z }| {
Z +L +1
X +1
X Z +1 Z +1
k dk
dx |f (x)|2 = |cn |2 = |F (kn )|2 dx |f (x)|2 = |F (k)|2 .
L!1
!
L n= 1 n= 1
2⇡ k!0
1 1 2⇡

Ejemplo: consideremos la función ⇢


1, |x| < 1,
f (x) =
0, 1 < |x|,
en el intervalo L  x  L con L > 1. Los coeficientes de su serie de Fourier son
8 r 9
>
> 2 >
>
Z +L Z +1 >
> , n = 0, >
> r
e in⇡x/L < L = 2 L n⇡
⇤ L>1
cn = h'n |f i = dx 'n (x)f (x) = dx p = = sen .
L 1 2L > r
> >
> L n⇡ L
>
> 2 L n⇡ >
>
: sen , n=6 0, ;
L n⇡ L
Por tanto, la función se puede representar como sigue:
+1
X +1
1 X L n⇡ in⇡x/L
1x1: f (x) ' cn 'n (x) = sen e
n= 1
L n= 1 n⇡ L
✓ ◆ +1 Z
kn :=n⇡/L 1 X 2 sen kn ikn x L!1 1 +1
2 sen k ikx
= k e ! dk e ,
k=⇡/L 2⇡ n= 1 kn 2⇡ 1 k

que en el lı́mite L ! 1 coincide con la expresión para la transformada de Fourier inversa, puesto que
F[f ] = 2 sen k/k.

Las expresiones obtenidas sugieren que se puede interpretar la transformada de Fourier como el desarrollo
de funciones del espacio L2 (R) en una base de ı́ndice continuo. De manera más precisa, se definen las
funciones
✓k (x) := eikx , k 2 R,
y los kets asociados |✓k i, que verifican
Z +1 Z +1
0
h✓k |✓k0 i = dx ✓k⇤ (x)✓k0 (x) = dx ei(k k)x
= 2⇡ (k k 0 ).
1 1

(Este resultado se puede leer como una relación de ortonormalidad, donde la delta de Dirac serı́a la versión
para ı́ndices continuos de la delta de Kronecker). Entonces, los resultados anteriores se pueden escribir en
notación de Dirac como
Z +1 Z +1 Z +1
dk
F (k) = h✓k |f i = dx ✓k⇤ (x) f (x) = dx e ikx f (x), |f i = F (k) |✓k i .
1 1 1 2⇡

Notemos, sin embargo, que las funciones ✓k (x) no son de cuadrado sumable en el eje real (puesto que
|✓k |2 = 1, cuya integral no converge), ası́ que no está claro que el número h✓k |f i esté definido para
cualquier elemento f (x) 2 L2 (R), pues quizás la función f (x) no tienda a cero en el infinito lo bastante
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 21

rápido (en otras palabras, no está claro que exista el lı́mite L ! 1, o bien k ! 0, en el razonamiento
previo). La respuesta la proporciona el

teorema de Plancherel: , , la transformada de Fourier está definida en todo el espacio L2 (R) y es


también una función de cuadrado sumable:

8f (x) 2 L2 (R) ) F (k) = h✓k |f i 2 L2 (R).

La relación entre una función y su transformada, ası́ como la inversión, se debe entender como convergencia
en media en el espacio L2 (R), es decir,
Z +L Z +L
ikx ikx
lı́m F (k) dx e f (x) = 0 , F (k) ' lı́m dx e f (x),
L!+1 L L!+1 L

Z +L Z +L
dk ikx dk ikx
lı́m f (x) e F (k) = 0 , f (x) ' lı́m e F (k).
L!+1 L 2⇡ L!+1 L 2⇡
La demostración no es inmediata y la obviamos. Este teorema permite interpretar el conjunto de funciones
✓k (x), k 2 R, como una base del espacio L2 (R) en el sentido de que cualquier función del mismo se puede
escribir como “combinación lineal” de elementos de ese conjunto.
El siguiente cuadro resume el paralelismo entre la transformada de Fourier y el desarrollo en serie de
Fourier:

Serie de Fourier Transformada de Fourier

eikn x n⇡
'n (x) = p , kn = , n = 0, ±1, ±2 . . . ✓k (x) = eikx , k2R
2L L

ortonormalidad: h'n |'m i = n,m ortonormalidad: h✓k |✓k0 i = 2⇡ (k k0 )

{'n (x)}n=0,±1,±2... base {|✓k i}k2R base

f (x) 2 L2 ( L, +L) f (x) 2 L2 (R)

+1
X Z +1
dk
|f i = cn |'n i |f i = F (k) |✓k i
n= 1 1 2⇡

Z +L Z +1
cn = h'n |f i = dx '⇤n (x)f (x) F (k) = h✓k |f i = dx ✓k⇤ (x)f (x)
L 1

+1
X Z +1
2 2 dk
Plancherel: kf k = |cn |2 Plancherel: kf k = |F (k)|2 .
n= 1 1 2⇡

+1
X Z +1
dk
'n $ ✓ k cn $ F (k) $
n= 1 1 2⇡
22 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

Polinomios de Legendre: los polinomios de Legendre Pn (x), n = 0, 1, 2 . . . , forman una base ortogonal
del espacio L2 ( 1, 1).
Comentarios:
• Los polinomios de Legendre vienen dados por la fórmula de Rodrigues,
1 dn 2
Pn (x) = (x 1)n ,
n! 2n dxn
y verifican la EDO 
d dPn
(1 x2 ) = n(n + 1)Pn (x).
dx dx
Como veremos en el próximo tema, a partir de estas expresiones se puede demostrar la relación
Pn (x) ✓ ◆
Z 1 z }| { 1
⇤ 1
hPn |Pm i = dx Pn (x) Pm (x) = n + n,m .
1 2

Es decir, los polinomios son mutuamente ortogonales pero no están normalizados a la unidad.
• Cualquier función f (x) de cuadrado sumable en ( 1, 1) se puede representar como
+1
X +1
X
f (x) ' cm Pm (x) , |f i = cm |Pm i ,
m=0 m=0

con los coeficientes determinados como sigue:


! hPn |Pn i n,m
+1
X +1
X z }| {
hPn |f i = hPn | cm |Pm i = cm hPn |Pm i = hPn |Pn i cn
m=0 m=0
✓ ◆Z +1
hPn |f i 1
) cn = = n+ dx Pn (x)f (x).
hPn |Pn i 2 1

• Ejemplo: para la función f (x) = signo x en el intervalo 1 < x < 1,


2 3
✓ ◆Z ( 1)n Pn (x)
z }| { ✓ ◆ Z +1
impar
1 +1
1 6 z }| { 7
cn = n+ dx Pn (x) signo x = n + dx 4Pn (x) Pn ( x) 5
2 1 2 0

8
>
> 0, n par,
✓ ◆Z +1 <
1
= [1 ( 1)n ] n + dx Pn (x) = p n+ 1
| {z } 2 0 >
> 2
0 si n par
: ⇡ n 3+n , n impar,
1 2 2

(Basta indicar, sin entrar en detalles, que la integral se puede evaluar mediante la fórmula de Rodrigues
para los polinomios de Legendre). Por tanto,
1 
p X 2k + 32 p 3 7 11
signo x ' ⇡ 1 P2k+1 (x) = ⇡ P1 (x) P3 (x) + P5 (x) + · · ·
2 k (k + 2) 2 8 16
k=0

p 3 7 11
= ⇡ x (5x3 3x) + (63x5 70x3 + 15x) + · · · , |x| < 1.
2 16 128

En particular, en x = 0 la serie converge a cero, mientras que es divergente en x = ±1. Aunque esta
expresión representa la función f (x) como una serie de potencias de x, no es un desarrollo de Taylor.
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 23

Por ejemplo, el desarrollo de Taylor alrededor de un punto x0 > 0 es simplemente fTaylor (x) = 1, que
no representa la función en el rango x < 0.
La identidad de Parseval conduce a un resultado interesante:
Z 1 9
2 >
>
kf k = hf |f i = dx | signo x|2 = 2 >
>
1 >
>
= 1
X 2k + 3
2
2
) ⇥ ⇤2 = .
! c⇤
n hPn |Pn i >
(n+1/2) 1
1 ⇡
1
X 1
X z }| { 1
X z }| { > >
> k=0 2 k (2 + k)
hf |f i = hf | cn |Pn i = cn hf |Pn i = |cn | hPn |Pn i >
2 >
;
n=0 n=0 n=0

También podemos comprobar el lema de Riemann–Lebesgue generalizado (que se refiere al desarrollo


en funciones normalizadas):

p q
normalizada 1/2
z }| { (n+1/2)
1
X p zp }| { ⇡ n+ 1
|Pn i 2
|f i = cn hPn |Pn i p , lı́m |cn | hPn |Pn i = lı́m n 3+n = 0.
n=0 hPn |Pn i n!1 n!1 1 2 2

1/4
• Ejemplo: la función f (x) = |x| signo x tiene una singularidad en x = 0 pero es un elemento de
L2 ( 1, +1):
Z +1 Z +1 Z +1
2 2 1 1
kf k = hf |f i = dx |f (x)| = dx p =2 dx p = 4.
1 1 |x| 0 x

Por tanto, la función se puede desarrollar en polinomios de Legendre. Los primeros términos de la
serie de Fourier generalizada son

1/4 12 4 572
|x| signo x ' P1 (x) P3 (x) + P5 (x) + · · ·
7 3 483
12 2 143
= x (5x3 3x) + (63x5 70x3 + 15x) + · · · , |x| < 1.
7 3 966

• Ejemplo: consideremos la distribución delta de Dirac (x x0 ) con 1 < x0 < 1. Como sı́ está bien
definido el braket Z +1
|x0 |<1
hx0 |Pn i = dx ⇤ (x x0 ) Pn (x) = Pn (x0 ),
1

entonces se puede escribir formalmente el desarrollo del ket asociado a la delta de Dirac en polinomios
de Legendre:
Pn⇤ (x0 )=Pn (x0 )
1
X z }| { 1 ✓
X ◆ 1 ✓
X ◆
|Pn i 1 1
|x0 i = hPn |x0 i = n+ Pn (x0 ) |Pn i , (x x0 ) ' n+ Pn (x0 )Pn (x),
n=0
hPn |Pn i n=0 2 n=0
2

donde esta última expresión se debe entender como igualdad en el sentido de distribuciones: es evidente
que la serie no representa una función del espacio de Hilbert porque los coeficientes no verifican el
lema generalizado de Riemann–Lebesgue:
✓ ◆1/2
1
lı́m n+ Pn (x0 ) = 1
n!1 2

pues Pn (x0 ) es finito para cualquier valor de n cuando x0 está dado.


24 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

Polinomios de Hermite: los polinomios de Hermite Hn (x), n = 0, 1, 2, . . . , forman una base ortogonal
2
del espacio L2w (R) con el peso w(x) = e x .
Comentarios:

• Los polinomios de Hermite vienen dados por la fórmula de Rodrigues,

2 dn ⇣ x2

Hn (x) = ( 1)n ex e ,
dxn
verifican la EDO
d 2 Hn dHn
2x = 2nHn
dx2 dx
y satisfacen las relaciones

Hn (x)
Z +1 z }| {
x2 2
hHn |Hm iw = dx e Hn⇤ (x) Hm (x) = n! 2n ⇡ 1/2 n,m ) kHn kw = n! 2n ⇡ 1/2 ,
1

es decir, son ortogonales pero no están normalizados.


• Cualquier función f (x) de cuadrado sumable en todo el eje real se puede pues escribir como
+1
X Z +1
hHn |f iw 1 x2
f (x) ' cn Hn (x), cn = = dx e Hn (x)f (x).
n=0
hHn |Hn iw n! 2n ⇡ 1/2 1

• Ejemplo: para la función f (x) = signo x considerada como elemento del espacio L2 (R):
2 3
Z +1 impar Z +1
1 2
z }| { 1 2 6 7
cn = dx e x Hn (x) signo x = dx e x 4Hn (x) Hn ( x) 5
n! 2n ⇡ 1/2 1 n! 2n ⇡ 1/2
0 | {z }
( 1)n Hn (x)
8
Z >
> 0, n par,
1 ( 1)n +1
2
<
x
= dx e Hn (x) = 1
n! 2n ⇡ 1/2 0 >
> , n impar,
: n
n! 1 2

de manera que (la integral se puede evaluar con la fórmula de Rodrigues para los polinomios de
Hermite)
1
X 1
X
1 n = 2k + 1 1
signo x ' n Hn (x) = 1 H2k+1 (x)
n=1
n! 1 2 k=0
(2k + 1)! 2 k
n impar

1 1 1
= p H1 (x) H3 (x) + H5 (x) + · · ·
⇡ 12 160

2 1 1
= p x (2x3 3x) + (4x5 20x3 + 15x) + · · · , 1 < x < +1.
⇡ 6 40

El dibujo de las gráficas de f (x) y de las sumas parciales fn (x) muestra que difieren mucho para x
suficientemente grande. Lo importante es destacar que la medida de la discrepancia entre estas gráficas
no está dada por nuestra percepción visual inmediata, sino que está pesada en la norma k·kw por la
2
función w(x) = e x , que asigna “muy poco peso” a la contribución de los puntos con x grande: con
esta definición de distancia lo relevante es que las sumas parciales estén próximas a la función original
para x . 1.
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 25

• Se definen las funciones de Hermite como

( 1)n ex /2 dn ⇣ ⌘
2 2
p Hn (x) Hn (x)e x /2 Rodrigues x2
n (x) := w(x) = p = p e , n = 0, 1, 2 . . .
kHn kw n! 2n ⇡ 1/2 n! 2n ⇡ 1/2 dxn

Estas funciones tienen la propiedad de que forman una base ortonormal del espacio L2 (R). En efecto,
por un lado se verifica ortonormalidad:
Z +1 Z +1
⇤ Hn⇤ (x) Hm (x) hHn |Hm iw
h n | mi = dx n (x) m (x) = dx w(x) = = n,m .
1 1 kHn kw kHm kw kHn kw kHm kw

2 ˆ
p parte, supongamos que f (x) 2 L (R). Entonces podemos construir la función f (x) :=
Por otra
f (x)/ w(x) (recordemos que la función peso w(x) no se puede anular) que verifica
Z +1 Z +1
dx w(x)|fˆ(x)|2 = dx |f (x)|2 < 1 ) fˆ(x) 2 L2w (R).
1 1

P1
Por lo tanto, fˆ se puede representar como un desarrollo en polinomios de Hermite, fˆ(x) ' n=0 ĉn Hn (x),
lo cual implica
=:cn
p p X1 z }| { 1
X
n (x)
f (x) = w(x)fˆ(x) ' w(x) ĉn kHn kw p = cn n (x),
n=0 w(x) n=0

con los coeficientes


D E
Hn fˆ Z +1
1 f (x)
cn = kHn kw ĉn = kHn kw w
= dx w(x)Hn⇤ (x) p
hHn |Hn iw kHn kw 1 w(x)
Z +1

= dx n (x)f (x) =h n |f i ,
1

es decir, cualquier función f (x) 2 L2 (R) se puede representar como una serie de Fourier generali-
zada de elementos n (x), con los coeficientes dados por la fórmula general: por tanto, el conjunto
{ 0 (x), 1 (x), . . . } es una base del espacio L2 (R). La diferencia entre trabajar en un espacio y otro
se refleja en el tipo de funciones que se pueden representar como serie de Fourier generalizada. Por
ejemplo, ex 2 L2w (R) pero ex 62 L2 (R).

Funciones de Bessel: Sea z⌫,n , n = 1, 2, 3 . . . , el n-ésimo cero positivo de la función de Bessel J⌫ (x), esto es, J⌫ (z⌫,n ) = 0.
Entonces, el conjunto de funciones
( p )
⌫ (⌫) 2
Bbessel := 'n (x) = 0 J⌫ (z⌫,n x) ,
J⌫ (z⌫,n )
n=1,2...

es una base ortonormal del espacio L2w (0, 1) con el peso w(x) = x para cada valor de ⌫ = 0, 1, 2, . . .
Comentarios:

• Las relaciones de ortonormalidad se escriben pues de la forma


Z 1
1 1
h'n |'m i = n,m , dx xJ⌫ (z⌫,n x)J⌫ (z⌫,m x) = [J⌫0 (z⌫,n )]2 n,m = [J⌫+1 (z⌫,n )]2 n,m ,
0 2 2
y cualquier función f (x) 2 L2w(x)=x (0, 1) se puede escribir como
p Z
p +1
X cn 2 1
f (x) ' 2 J⌫ (z⌫,n x), cn = dx xJ⌫ (z⌫,n x)f (x).
n=1
J⌫0 (z⌫,n ) J⌫0 (z⌫,n ) 0
26 Tema 7 c Alvaro Domı́nguez, Univ. Sevilla

• Se puede establecer un paralelismo con las series trigonométricas: sean zn = n⇡, n = 1, 2, . . . los sucesivos ceros de la
función sen x. Entonces, el conjunto de funciones
n p p o
Bsen := 'n (x) = 2 sen zn x = 2 sen n⇡x
n=1,2...

es una base ortonormal del espacio L2 (0, 1).


• Ejemplo:
Z 1
p Z 1
p
2 2
f (x) = 1, 0<x<1 ) cn = dx xf (x)'n (x) = dx xJ0 (z0,n x) =
0 J00 (z0,n ) 0 z0,n

+1
X 1
f (x) ' 2 J0 (z0,n x).
n=1
z0,n J00 (z0,n )
Por comparación, el desarrollo de la misma función en la base de senos es
+1
X ( 1)n 1
f (x) ' 2 sen n⇡x.
n=1
n⇡

En conclusión, los ejemplos ponen de manifiesto la flexibilidad y versatilidad de las representaciones de funciones
mediante bases {'1 (x), '2 (x), . . . } de los espacios de Hilbert L2w (a, b), incluyendo funciones con singularidades,
funciones de tipo Weierstrass o distribuciones como la delta de Dirac. La representación como serie en un espacio
de Hilbert converge a la función original en media, es decir, la integral

Z b n
X
2

dx w(x) f (x) ck 'k (x)


a k=1

se anula cuando n ! 1. Esto implica que puede existir un conjunto de medida nula de puntos en el intervalo
(a, b) (es decir, la gráfica de esos puntos subtiende un área nula) donde la serie converge a un valor diferente
del de la función: ya hemos visto ejemplos de este fenómeno, como donde f (x) es discontinua. A veces interesa
conocer la convergencia puntual de la series. Existen teoremas para la convergencia puntual de las series en las
bases más usadas, como las que hemos visto. A modo de ilustración, enunciamos un teorema para la convergencia
puntual de la serie de Fourier trigonométrica:

Teorema de Fourier: si f (x) y f 0 (x) son funciones cuasicontinuas en el intervalo L  x  +L, entonces la
serie de Fourier de f (x) converge puntualmente a

la extensión periódica de f (x) en los puntos donde esta extensión es continua,

al punto medio de las discontinuidades donde la extensión periódica es discontinua.

Comentarios:

1. Sea f (x) una función (real o compleja) definida en el intervalo real L  x  +L. Se define la ex-
tensión periódica de esta función como el resultado de trasladar en x la gráfica de la función desde el
intervalo x 2 [ L, L] en múltiplos enteros de 2L. Es evidente que este procedimiento no introduce más
discontinuidades que las que ya tuviera f (x), excepto por posibles discontinuidades finitas en los extremos
x = ±L, ±3L, ±5L, . . . de los intervalos trasladados, si resulta que f ( L) 6= f (+L). Por tanto, si f (x) es
cuasicontinua, su extensión periódica también lo será.

2. El teorema proporciona condiciones suficientes, pero no necesarias, para poder decir algo sobre la conver-
gencia puntual de la serie incluso más allá del intervalo original ( L, L). El resultado del teorema es el
mismo que el de los teoremas que se vieron para las transformadas de Fourier y de Laplace. Se denomina
fenómeno de Gibbs al hecho de que la serie de Fourier converge más lentamente cerca de una discontinuidad
de f (x).
c Alvaro Domı́nguez, Univ. Sevilla Tema 7 27

3. Ejemplo: serie de Fourier de f (x) = x, |x| < L:


+1
X Z +L
ein⇡x/L 1 in⇡x/L
f (x) ' cn 'n (x), 'n (x) = p , cn = h'n |f i = p dx x e .
n= 1 2L 2L L

Al evaluar la integral se deben distinguir dos casos:


Z +L
1
n=0 ) c0 = p dx x = 0,
2L L

Z +L Z +L ✓ ◆
1 1 d L
n 6= 0 ) cn = p dx xe in⇡x/L = p dx x e in⇡x/L
2L L 2L L dx in⇡
r " Z +L #
L x +L 1
in⇡x/L in⇡x/L
= e + dx e
2 in⇡ L in⇡ L
r 
L L L
= e in⇡ + ein⇡ e in⇡ ein⇡
2 in⇡ (in⇡)2
p 2 3 p
L 2L 4 1 5 ( 1)n+1 L 2L
= cos
| {zn⇡} n⇡ sen
| {zn⇡} = .
in⇡ in⇡
( 1)n 0

Notemos que c n = cn = c⇤n : esta propiedad se podı́a haber deducido directamente de la expresión
integral del coeficiente cn y refleja que la función f (x) = x es real e impar. Por tanto,
+1
X +1
X +1
X
f (x) ' cn 'n (x) = [cn 'n (x) + c n ' n (x)] = [cn 'n (x) + c⇤n '⇤n (x)]
n= 1 n=1 n=1
+1 +1 p +1
X X ( 1)n+1 L 2L ein⇡x/L 2L X ( 1)n+1 n⇡x
= 2Re cn 'n (x) = 2Re p = sen .
n=1 n=1
in⇡ 2L ⇡ n=1 n L

En este caso es claro que la serie se anula idénticamente en los extremos x = ±L, aunque f (±L) = ±L; de
manera general, el teorema de Fourier establece que en el rango |x|  L esta serie convergerá puntualmente
a la función 8
< x, |x| < L,
:
0, x = ±L,
y a la extensión periódica de la misma en el resto del eje real.
Métodos Matemáticos II Curso 2020–2021

81. Demuestre que el espacio L1 (a, b) de funciones absolutamente integrables es vectorial.

82. En el espacio L2 ( 1, 1) de funciones de cuadrado sumable en 1  x  1 se considera la


sucesión de funciones de la forma
8
< 1, 1  x < 1/n,
fn (x) = nx, 1/n  x  1/n, n = 1, 2, . . .
:
1, 1/n < x  1,

a) Compruebe que cada fn (x) es continua, pero la sucesión converge puntualmente a


una función discontinua cuando n ! 1.
b) Compruebe que, sin embargo, la sucesión converge en media a una función también
de cuadrado sumable.

83. Se considera un conjunto discreto de N valores reales, x1 < x2 < . . . < xN , y se define
el espacio E de las funciones discretas definidas en estos puntos, identificadas como la
N -tupla f := {f (x1 ), f (x2 ), . . . , f (xN )} .

a) Demuestre que E es un espacio vectorial y encuentre una base del mismo. ¿Cuál es la
dimensión del espacio?
b) Para cualesquiera f, g 2 E se define la cantidad
N
X
(f, g) := f ⇤ (x↵ )g(x↵ ).
↵=1

Demuestre que esta expresión es un p


producto escalar, esto es, que verifica los axiomas
correspondientes. Por tanto, kf k = (f, f ) es una norma.
c) Argumente que el procedimiento de aproximar una función dada f (x) mediante una
función de ajuste g(x) por el método de los mı́nimos cuadrados se puede reformular
como la minimización de la “distancia” entre estas dos funciones medida según la
norma definida en el apartado previo.

84. Sea el subespacio S ⇢ L2 ( 1, 1) generado por las funciones f1 (x) = 1 y f2 (x) = x2 .

a) Construya una base ortonormal {'1 (x), '2 (x)} en dicho subespacio.
b) Determine las aproximaciones óptimas en S a las funciones g(x) = x y h(x) = x4 .

85. Se quiere aproximar una función f (x) mediante una combinación lineal de los tres primeros
polinomios de Legendre. Calcule los coeficientes de la combinación lineal para obtener la
mejor aproximación respecto a la norma del espacio L2 ( 1, 1) cuando

a) f (x) = e↵x , ↵ 2 C, b) f (x) = cosh x, c) f (x) = sen ⇡x.


1
Los tres primeros polinomios de Legendre son P0 (x) = 1, P1 (x) = x, P2 (x) = (3x2 1).
2
86. Los polinomios de Hermite Hn (x) verifican la fórmula de Rodrigues,

2 dn ⇣ x2

Hn (x) = ( 1)n ex e ,
dxn
2
y forman una base ortogonal del espacio L2w (R), con la función peso w(x) = e x . Demues-
tre que la función f (x) = e2tx pertenece a este espacio para cualquier valor del parámetro
real t y utilice la fórmula de Rodrigues para calcular su serie de Fourier generalizada en
esta base.

87. Calcule la serie de Fourier de las siguientes funciones:



0, L  x < 0,
a) f (x) = ex , |x|  ⇡, b) f (x) = | sen x|, |x|  ⇡, c) f (x) =
x/L, 0 < x  L.

88. Calcule la serie de Fourier de la función f (x) = x2 en el intervalo ( ⇡, ⇡). A partir de la


convergencia puntual de la misma, demuestre las igualdades siguientes:
1
X 1
X
1 ⇡2 ( 1)n+1 ⇡2
= , = .
n2 6 n2 12
n=1 n=1

p
89. Sabiendo que el conjunto Bexp = {'n (x) = ein⇡x/L / 2L}n=0,±1,±2... forma una base orto-
normal del espacio L2 ( L, L), demuestre que cada uno de los conjuntos
( r )
2 n⇡x
Bsen := n (x) = sen ,
L L
n=1,2,...
( r )
1 2 n⇡x
Bcos := ✓0 (x) = p , ✓n (x) = cos ,
L L L
n=1,2,...

forma una base ortonormal del espacio L2 (0, L). Como aplicación, obtenga las series de
Fourier en senos y en cosenos de la función f (x) = ⇡ 2x definida en el intervalo (0, ⇡).
Ayuda: la extensión par o impar de cualquier elemento de L2 (0, L) pertenece a L2 ( L, L).

90. Sea una función real f (x) 2 L2 ( L, L), que por tanto puede representarse mediante un
desarrollo en serie de Fourier con coeficientes reales de la forma

a0 X ⇣ n⇡x ⌘
1
n⇡x
f (x) ' + an cos + bn sen .
2 L L
n=1

Demuestre que la identidad de Parseval puede escribirse como


Z L X 1
1 1
dx |f (x)|2 = a20 + (a2n + b2n ).
L L 2
n=1

Como aplicación, use el desarrollo en serie de Fourier de la función f (x) = ex en el intervalo


( ⇡, ⇡) para calcular la suma
+1
X 1
.
n= 1
1 + n2
MMII 2020–2021, soluciones del boletı́n para el tema 7 1

81. Sean f (x), g(x) 2 L1 (a, b), es decir,


Z b Z b
dx |f (x)| < 1, dx |g(x)| < 1.
a a

Construyamos la combinación lineal arbitraria h(x) = ↵f (x) + g(x), con ↵, constantes


complejas. Entonces:

|h(x)| = |↵f (x) + g(x)|  |↵f (x)| + | g(x)| = |↵||f (x)| + | ||g(x)|,

ası́ que la integral


Z b Z b Z b
dx |h(x)|  |↵| dx |f (x)| + | | dx |g(x)| < 1 ) h(x) 2 L1 (a, b).
a a a

82. Comprobamos que cada elemento de la sucesión es de cuadrado sumable pues la norma es
finita:
par
Z 1 z }| { Z 1 Z 1/n Z 1
2 4
kfn k = dx |fn (x)|2 = 2 dx |fn (x)|2 = 2 dx (nx)2 + 2 dx = 2 .
1 0 0 1/n 3n

Además, en el lı́mite n ! 1 la norma permanece finita, ası́ que la sucesión converge a un


elemento del espacio de Hilbert L2 ( 1, 1), pues el espacio es completo.
a) Claramente fn (x) 2 C 0 [ 1, 1]. Al pasar al lı́mite se encuentra
8 9
< 1, 1x<0 =
F (x) := lı́m fn (x) = 0, x=0 = signo x 62 C 0 [ 1, 1].
n!1 : ;
1, 0<x1

b) Claramente F (x) 2 L2 ( 1, 1). Para demostrar que este es el lı́mite en media de la


sucesión, evaluamos kF fn k con la norma del espacio L2 ( 1, 1):
Z +1 Z 1/n
2
lı́m kF fn k = lı́m dx | signo x fn |2 = lı́m dx ( signo x nx)2
n!1 n!1 1 n!1 1/n
Z 1/n Z 1
2
(integrando par respecto a x) = lı́m 2 dx (1 nx)2 = lı́m dz (1 z)2 = 0.
n!1 0 n!1 n 0
| {z }
finito

83. El ejercicio es bastante inmediato cuando se nota que el espacio E es isomorfo al espacio
euclı́deo RN .
84. a) El subespacio S está formado, por definición, por todas las combinaciones lineales de los
dos elementos f1 (x), f2 (x), que son linealmente independientes. Por tanto, la dimensión
del subespacio es dos y cualquier base estará forma por dos elementos. Se proponen las
siguientes combinaciones lineales dependientes de tres constantes A, B, C desconocidas:

'1 (x) = Af1 (x), '2 (x) = Bf1 (x) + Cf2 (x).

Se determinan estas constantes imponiendo las condiciones de ortonormalidad respecto


al producto escalar del espacio L2 ( 1, 1):

h'1 |'1 i = 1, h'2 |'2 i = 1, h'1 |'2 i = 0.

El resultado de este proceso de ortonormalización es


r
1 1 5
'1 (x) = p , '2 (x) = 3x2 1 ) S = gen {'1 (x), '2 (x)}.
2 2 2
Podemos identificar los polinomios de Legendre P0 (x) (en '1 (x)) y P2 (x) (en '2 (x)).
MMII 2020–2021, soluciones del boletı́n para el tema 7 2

b) La mejor aproximación en S a una función (x) 2 L2 ( 1, 1) está dada por la proyección


de (x) sobre el subespacio, es decir, por la combinación lineal
Z +1
c1 '1 (x) + c2 '2 (x), con cn = h'n | i = dx '⇤n (x) (x).
1

Por tanto,
si (x) = g(x) = x, resulta c1 = c2 = 0 ) g(x) es ortogonal al subespacio S;
si (x) = h(x) = x4 , resulta
p r
2 4 2
c1 = , c2 = .
5 7 5

85. La aproximación óptima se encuentra proyectando f (x) sobre el subespacio generado por el
conjunto {P0 (x), P1 (x), P2 (x)} usando el producto escalar del espacio L2 ( 1, 1), es decir,
3
X ✓ ◆Z +1
hPn |f i 1
aproximación óptima = cn Pn (x), con cn = = n+ dx Pn (x)f (x).
n=1
hPn |Pn i 2 1

Se encuentran ası́ los siguientes coeficientes:


a) f (x) = e↵x . Es evidente que f (x) = P0 (x) si ↵ = 0. En los cálculos que siguen supon-
dremos ↵ 6= 0: Z
1 +1 1
c0 = dx e↵x = senh ↵,
2 1 ↵
Z +1
3 dc0 3
c1 = dx xe↵x = 3 = 2 (↵ cosh ↵ senh ↵) ,
2 1 d↵ ↵
Z +1
5 5 dc1 5 5 ⇥ ⇤
c2 = dx (3x2 1)e↵x = c0 = 3 (3 + ↵2 ) senh ↵ 3↵ cosh ↵ .
4 1 2 d↵ 2 ↵

b) No es necesario repetir los cálculos, pues se puede escribir f (x) = cosh x = (ex +e x )/2,
de manera que los coeficientes se pueden encontrar como combinaciones lineales de los
coeficientes para la función e↵x con ↵ = ±1:
1
c0 = [senh 1 + senh 1] = senh 1,
2
1
c1 = [3(cosh 1 senh 1) + 3( cosh 1 + senh 1)] = 0,
2
1
c2 = [5(4 senh 1 3 cosh 1) 5( 4 senh 1 + 3 cosh 1)] = 20 senh 1 15 cosh 1.
2
De hecho, dado que el polinomio Pn (x) tiene la misma paridad que n y que f (x) = cosh x
es una función par, se puede concluir que cn = 0 para cualquier n impar.
c) Igualmente se puede escribir f (x) = sen ⇡x = (ei⇡x e i⇡x )/(2i). Como esta función
es impar, se tendrá c0 = c2 = 0, y solo es necesario calcular c1 :

1 3 3 3 3
c1 = (i⇡ cosh i⇡ senh i⇡) + (i⇡ cosh i⇡ senh i⇡) = (i⇡ cos ⇡ i sen ⇡) = ,
2i (i⇡)2 ( i⇡)2 i⇡ 2 ⇡

teniendo en cuenta que senh iz = i sen z, cosh iz = cos z.


MMII 2020–2021, soluciones del boletı́n para el tema 7 3

86. En este ejercicio utilizaremos el subı́ndice w para denotar norma y producto escalar con la
función peso w(x). Comprobamos que la norma de f (x) en el espacio L2w (R) es finita:
Z +1 Z +1 Z +1
2 ⇤ (t real) x2 +4tx 4t2 2
kf kw = dx w(x)f (x)f (x) = dx e =e dx e (x 2t)
1 1 1
✓ ◆ Z +1
t es real 2 2 p 2
= cambio de variable real = e4t dz e z
= ⇡e4t .
z := x 2t
1

Por tanto, se podrá escribir


=:In
zZ }| {
1
X +1
hHn |f iw 1 x 2
f (x) ' cn Hn (x), con cn = = p dx e Hn (x)f (x).
n=0
hHn |Hn iw n! 2n ⇡ 1

La integral In se puede evaluar empleando la expresión dada para los polinomios de Hermite.
Integrando una vez por partes se obtiene una relación de recurrencia:
x2 +2tx
e Hn 1 (x)!0 cuando x!±1
z }| {
Z +1  ⇣ ⌘ +1
dn 2 dn 1 2
In = ( 1)n dx e2tx e x
= ( 1)n e2tx n e x
1 dxn dx 1
x= 1
Z +1   n 1 Z +1 
d 2tx d x2 dn 1
x2
( 1)n dx e e = ( 1)n 1
2t 2tx
dx e e
1 dx dxn 1
1 dxn 1
| {z }
2te2tx
= 2tIn 1.

La solución de esta relación de recurrencia se encuentra fácilmente por reiteración:


Z +1
2 n 2 p 2
In = 2tIn 1 = (2t) In 2 = . . . = (2t) I0 ,
(n veces)
I0 = dx e x +2tx = ⇡et .
1

Por lo tanto,
X1 n
tn t 2 2 t
cn = e ) e2tx ' et Hn (x).
n! n=0
n!
Compare este resultado con la función generatriz introducida en el problema 47.
87. a) " #
X1
x senh ⇡ ( 1)n
|x| < ⇡ : e ' 1+2 (cos nx n sen nx) .
⇡ n=1
1 + n2
b)
1
2 4 X 1
|x| < ⇡ : | sen x| ' + cos 2mx.
⇡ ⇡ m=1 1 4m2
c)
1 1
1 2 X 1 (2m + 1)⇡x 1 X ( 1)n n⇡x
|x| < L : f (x) ' 2 2
cos sen .
4 ⇡ m=0 (2m + 1) L ⇡ n=1 n L

88.
X1
⇡2 ( 1)n
|x| < ⇡ : x2 ' +4 cos nx.
3 n=1
n2
Como f (x) = x2 y f 0 (x) = x son cuasicontinuas (continuas, de hecho), la serie converge
puntualmente a la extensión periódica de f (x) = x2 , que también es continua pues f ( ⇡) =
f (⇡). Por tanto, se puede reemplazar el signo de igualdad en media (') por el signo de
igualdad puntual (=) en todo el eje real. En particular, evaluando la serie en x = 0, donde
debe valer f (0) = 0, y en x = ⇡, donde debe valer f (⇡) = ⇡ 2 , se llega a los resultados
pedidos.
MMII 2020–2021, soluciones del boletı́n para el tema 7 4

89. Se comprueba inmediatamente que tanto Bsen como Bcos son sistemas ortonormales. Para
comprobar que Bsen además es base, construimos la extensión impar de la función f (x) 2
L2 (0, L): ⇢
f (x), 0 < x < L,
fˆimpar (x) :=
f ( x), L < x < 0.
Evidentemente fˆimpar 2 L2 ( L, L) y por tanto se puede desarrollar en la base Bexp , con
coeficientes
D E Z +L r Z L
ˆ e in⇡x/L ˆ 2 n⇡x
cn = 'n fimpar = dx p fimpar (x) = i dx f (x) sen
L 2L L 0 L
Z L
= i dx f (x) n (x).
0

Estos coeficientes verifican c n = cn (y en particular c0 = 0). Por tanto, el desarrollo en


la base Bexp se puede escribir como
+1
X +1
X +1
X
f (x) ' cn 'n (x) = [cn 'n (x) + c n ' n (x)] = cn ['n (x) '⇤n (x)]
n= 1 n=1 n=1
| {z }
p
2i sen(n⇡x/L)/ 2L
+1
X
= icn n (x).
n=1

Es decir, cualquier elemento de L2 (0, L) se puede expresar como serie de elementos del
conjunto Bsen , que es pues una base. De la misma forma, a partir de la extensión par de
f (x) se demuestra que Bcos es una base de L2 (0, L).
Teniendo en cuenta que la serie de Fourier seno de f (x) en (0, ⇡) es igual a la serie de Fourier
de la extensión impar al intervalo ( ⇡, ⇡), se deduce
X1
1
⇡ 2x ' 2 sen 2mx (0 < x < ⇡).
m=1
m

Y teniendo en cuenta que la serie de Fourier coseno de f (x) en (0, ⇡) es igual a la serie de
Fourier de la extensión par al intervalo ( ⇡, ⇡), se encuentra
1
8 X 1
⇡ 2x ' cos(2m + 1)x (0 < x < ⇡).
⇡ m=0 (2m + 1)2

90. En términos de la base ortonormal


n n⇡x s n⇡x o
Btrig = '0 (x) = 1, 'cn (x) = cos , 'n (x) = sen
L L n=1,2,...
del espacio de L2 ( L, L), la función f (x) se puede representar como
X1 X1
a0 a0
f (x) ' '0 (x)+ [an 'cn (x) + bn 'sn (x)] , |f i = |'0 i+ [an |'cn i + bn |'sn i] ,
2 n=1
2 n=1

con los coeficientes dados como


a0 h'0 |f i h'cn |f i h'sn |f i
= , an = , bn = ,
2 h'0 |'0 i h'cn |'cn i h'sn |'sn i
en virtud de la ortogonalidad de Btrig . La evaluación de la norma de los elementos de la base
es sencilla y proporciona
Z +L
h'0 |'0 i = dx |'0 (x)|2 = 2L,
L
MMII 2020–2021, soluciones del boletı́n para el tema 7 5

Z +L
h'cn |'cn i = dx |'cn (x)|2 = L,
L
Z +L
h'sn |'sn i = dx |'sn (x)|2 = L.
L

Entonces la identidad de Parseval (“teorema de Pitágoras”) para esta base particular se


expresa como
Z +L * 1
+
2 a0 X
2 c s
dx |f (x)| = kf k = hf |f i = '0 + [an 'n + bn 'n ] |f
L 2 n=1
( 1
)
a⇤0 X
⇤ c ⇤ s
= h'0 | + [an h'n | + bn h'n |] |f i
2 n=1
X1
a0
= h'0 |f i + [an h'cn |f i + bn h'sn |f i]
2 n=1
X1
L ⇥ ⇤
= |a0 |2 + L|an |2 + L|bn |2
2 n=1
( 1
)
1 2 X⇥ 2 2

= L a + a + bn ,
2 0 n=1 n

donde el último paso es posible porque la tanto la función f (x) como los elementos de la
base Btrig son reales y por tanto los coeficientes an , bn también: |an |2 = a2n , |bn |2 = b2n . Ası́
resulta la relación dada en el enunciado.
A partir de la serie de Fourier obtenida en el problema 87a para f (x) = ex se deduce por
comparación

2 senh ⇡ 2 senh ⇡ ( 1)n 2 senh ⇡ ( 1)n n


a0 = , an = , bn = ,
⇡ ⇡ 1 + n2 ⇡ 1 + n2
y por tanto
1 ✓ ◆2 ( 1 
)
1 2 X 2 1 2 senh ⇡ X ( 1)2n ( 1)2n n2
a0 + an + b2n = 1+2 +
2 n=1
2 ⇡ n=1
(1 + n2 )2 (1 + n2 )2
✓ ◆2 X 1
senh ⇡ 1
= 2 .
⇡ n= 1
1 + n2

Por otro lado, con L = ⇡ es


Z +⇡
1 2 1 senh 2⇡
kf k = dx e2x = .
L ⇡ ⇡ ⇡

Por tanto, la identidad de Parseval permite concluir


1
X 1 ⇡ senh 2⇡ ⇡ cosh ⇡
2
= 2 = .
n= 1
1+n 2 senh ⇡ senh ⇡
Tema 8

Introducción al análisis funcional II.


Operadores lineales

Los operadores representan la formulación abstracta de funcional. De particular relevancia son los operadores
lineales que actúan en espacios de Hilbert: estos representan la generalización funcional del concepto de aplicación
o transformación lineal en espacios vectoriales de dimensión finita, la cual se representa mediante una matriz.

8.1. Operadores lineales

Definición: sean E1 y E2 dos espacios funcionales. Se denomina operador A a cualquier aplicación de un espacio
en otro:
A : E1 ! E2
|f i 7! A |f i = |Af i = |A[f ]i
El concepto de operador es la formulación abstracta de la noción de funcional (función de funciones): a partir
de f (x) 2 E1 se obtiene la nueva función A[f ] 2 E2 . Aunque la definición es general para cualquier tipo de
espacios funcionales, en lo sucesivo supondremos que E1 y E2 son el mismo espacio de Hilbert, E1 = E2 =: H.
En tal caso, podemos ver el operador como una generalización de la noción de función en el espacio euclı́deo
multidimensional, E : RN ! RN , es decir, un campo vectorial E(r).

Definición: sea A un operador definido en un espacio de Hilbert H. Se denomina operador lineal si verifica
8 |f i , |gi 2 H
) A (↵ |f i + |gi) = ↵ (A |f i) + (A |gi) .
8↵, 2 C
Ejemplos: (se puede usar indistintamente la notación funcional, A[f ], o la de Dirac, A |f i).
Operador identidad I, definido como I |f i = |f i.
En un espacio euclı́deo RN de dimensión finita, cualquier operador lineal se puede asociar con la multipli-
cación por una matriz N ⇥ N (operador matricial):
0 1
x1 0 1
B x2 C A11 A12 · · · A1N N
B C
x = B . C 2 RN ,
B
A = @ ... .. .. C , con A 2 R ) (Ax) = X A x .
. . A ij i ij j
@ .. A j=1
AN 1 AN 2 · · · AN N
xN

Multiplicación de una función por 1 + x2 :



f (x) 2 H, A = (1 + x2 )· ) A[f ] = (1 + x2 )f (x) , A |f i = (1 + x2 )f .

1
2 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Transformación de paridad ⇧:
f (x) 2 H ) ⇧[f ] = f ( x).

Derivada de una función:


d df (x)
f (x) 2 H, · ) A[f ] =
A= .
dx dx
Se trata de un ejemplo de operador diferencial. De manera más general, una EDO lineal se puede formular
como la acción de un operador lineal:
n
X dk dn dn 1
d
L := Pk (x) k
= n + Pn 1 (x) + · · · + P1 (x) + P0 (x),
dx dx dxn 1 dx
k=0

f (x) 2 H ) L[f ] = R(x) , L |f i = |Ri .


Los operadores diferenciales permiten ilustrar que la acción del operador no está necesariamente definida
en todo el espacio; por ejemplo, f (x) = 2|x|1/2 es cuadrado sumable en 1 < x < 1, pero su derivada,
f 0 (x) = |x| 1/2 signo x, no lo es.
Integral de una función con un núcleo:
Z b Z b
f (x) 2 H, A= dx g(x, s) · ) A[f ] = dx g(x, s) f (x).
a a

En particular, si a y b son finitos y el núcleo g(x, s) es continuo en el dominio a  x, s  b, se denomina


operador de Hilbert–Schmidt y suele aparecer en aplicaciones al resolver ecuaciones diferenciales. Otros
ejemplos de operador integral son las transformadas de Fourier y de Laplace.
Operador “mariposa”: dados | i , | i 2 H, se define el siguiente operador lineal:

8 |hi 2 H, A = | ih | ) A |hi = (| i h |) |hi = | i h |h i .

En RN este operador se escribe como

A = u v, A · x = u (v · x)

(notemos que la yuxtaposición de los vectores no es un producto escalar; esta notación se denomina
producto diádico o tensorial). En particular, si |ui $ u es un vector unitario, el operador Pu := |ui hu| se
denomina proyector, porque su acción consiste en generar la proyección a lo largo de la dirección definida
por |ui:
Pu |hi = |ui hu |h i , Pu · x = (uu) · x = u (u · x).
Los proyectores proporcionan una forma compacta de expresar que un sistema ortonormal es una base:
8
>
> ortonormalidad : h'n |'m i = n,m
>
>
>
> 8
>
> =:Pn
>
> >
> P z }| { P
< >
>
{|'n i} es base >
> 8 |f i 2 H ) |f i = n |'n i h'n | f i = ( n Pn ) |f i
) <
ortonormal de H >
>
>
> base :
>
> >
> m
>
> >
>
>
> >
> P P
: :
relación de cierre: n Pn = n |'n i h'n | = I

La relación de cierre expresa la idea geométrica de que las proyecciones de un vector a lo largo de todas y
cada una de las direcciones de la base permiten reconstruirlo de manera única y completa.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 3

8.1.1. Caracterización
El objetivo es caracterizar los operadores lineales o, de manera equivalente, encontrar una representación unı́voca
de los mismos. El principal problema para extender las nociones y propiedades de operadores lineales en un
espacio euclı́deo (esto es, de las matrices) al caso de espacios de Hilbert funcionales es, de nuevo, la dimensión
infinita: para un operador lineal A en el espacio RN dotado de una base {e1 , . . . eN } se verifica
N N
! N
X X linealidad
X
N
x= x k ek 2 R : Ax = A x k ek = xk Aek ,
k=1 k=1 k=1

de manera que la acción del operador está caracterizada unı́vocamente por los elementos de matriz que involucren
solo los vectores de la base. No se puede afirmar sin más el resultado análogo en un espacio de Hilbert H generado
por una base infinita {|'1 i , |'2 i , . . . }:
1 1
! 1
X X ? X
|f i = ck |'k i 2 H : A |f i = A ck |'k i = ck A |'k i .
k=1 k=1 k=1

Pensemos, por ejemplo, en el operador derivada actuando sobre una serie infinita: en general no será posible
derivar la serie término a término. Para establecer el puente entre los casos de dimensión finita e infinita es
necesario una serie de definiciones y resultados.

Definición: se definen los elementos de matriz del operador lineal A en el espacio H como los números complejos

hg |A| f i := hg| (A |f i) = hg |Af i 2 C, |f i , |gi 2 H.

En particular, se denominan elementos de matriz diagonales a los de la forma hf |A| f i. Geométricamente,


hg |A| f i representa la proyección sobre |gi de la acción de A sobre |f i. Por ejemplo, el producto escalar se puede
entender como el elemento de matriz del operador identidad, hg |f i = hg |I| f i.
Un operador está caracterizado por su acción sobre todos y cada uno de los elementos del espacio y, como
consecuencia, por el conjunto de todos los posibles elementos de matriz, es decir, por la proyección sobre todas
las direcciones posibles de su acción sobre todos los vectores posibles. Sin embargo, este conjunto contiene mucha
información redundante y es posible afinar la caracterización:

Lema: un operador está caracterizado completamente por todos sus elementos de matriz diagonales entre
vectores unitarios, hu |A| ui con kuk = 1, es decir, por la “autoproyección” de su acción en todas las direcciones
posibles.
Demostración: cualquier elemento de matriz se puede expresar de forma única en términos de elementos diago-
nales como
1
hg |A| f i = [hf + g |A| f + gi hf g |A| f gi + i hf + ig |A| f + igi i hf ig |A| f igi] ,
4
como se comprueba desarrollando y simplificando el segundo miembro de la igualdad. La restricción a vectores
unitarios evidentemente no supone pérdida de información (el único problema serı́a con el vector nulo |0i, pero
cualquier operador lineal verifica A |0i = 0). Este resultado motiva la siguiente

definición: se construye el cociente de Rayleigh de un operador lineal A como

hf |A| f i hf |A| f i
|f i 2 H ) R[f ] := 2 = 2 C.
kf k hf |f i

Se trata de una generalización del concepto de forma cuadrática para matrices; en este caso, es un funcional
que asigna a cada función f (x) un número complejo R[f ] para el cual, como queda claro de la definición, la
única información relevante es la “dirección” de f (x), no su “longitud”. A la vista del lema previo, el cociente
de Rayleigh también permite caracterizar completamente el operador lineal.
4 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Como mostró el ejemplo del operador derivada, la acción de un operador no siempre está definida en el espacio
H. Esto motiva en muchas aplicaciones la consideración del operador restringido a subconjuntos donde su acción
sı́ está definida:

Definición: sea S un subespacio lineal. Se define la restricción del operador A al subespacio S, denotado AS ,
como el operador lineal caracterizado por los elementos de matriz con vectores solo del subespacio S, esto es,
8
< hg |A| f i , si |f i , |gi 2 S,
hg |AS | f i :=
:
0, si |f i 62 S o |gi 62 S.
Por construcción, AS involucra solo la acción y el efecto del operador A dentro del subespacio S. Esto significa
que, aunque la acción de A sobre un vector |f i 2 S genere un nuevo vector A |f i 62 S, solo interesa la proyección
de este resultado sobre el subespacio S. Obviamente, el conocimiento del operador AS (esto es, de sus elementos
de matriz no nulos) no permite concluir nada sobre la acción y el efecto del operador A fuera del subespacio.
Ejemplo: consideremos el operador A = d/dx en el espacio de Hilbert L2 ( 1, 1); como se ha visto, su acción
no está definida sobre todos los elementos del espacio. Sin embargo, sı́ está definido en el subespacio vectorial
S = C 1 [ 1, 1] ⇢ L2 ( 1, 1) y por ello tiene sentido hablar del operador restringido AS = d/dx|S , definido por los
elementos de matriz en este subespacio:
Z +1
df (x)
hg |AS | f i = dx g ⇤ (x) , 8f (x), g(x) 2 C 1 [ 1, 1].
1 dx

Definición: un operador A se denomina finito–dimensional o de rango finito si sus elementos de matriz son
no nulos solo en un subespacio de dimensión finita:

SN ⇢ H
: hg |A| f i = 0 si |f i 62 SN o |gi 2
6 SN .
dim SN = N finito
Claramente, este tipo de operador es equivalente a su restricción al subespacio SN donde su efecto no es nulo,
y por tanto se puede denotar igualmente ASN . Estos operadores se pueden caracterizar de manera muy simple
gracias al siguiente

lema: un operador lineal finito-dimensional está caracterizado completamente por su acción sobre los elementos
de una base del subespacio donde su efecto no es nulo.
Demostración: sea SN un subespacio de dimensión N generado por la base {|'1 i , . . . |'N i}, esto es, SN =
gen{|'1 i , . . . |'N i}. Entonces se podrá escribir
N
X N
X
|f i = ck |'k i , |gi = bk |'k i , 8 |f i , |gi 2 SN .
k=1 k=1

Sea A un operador lineal finito–dimensional sobre SN , caracterizado por tanto por todos los elementos de matriz
hg |A| f i con |f i , |gi 2 SN . Como N es finito, se puede intercambiar la acción de A con el sumatorio por linealidad,
ası́ que
N
! N
! N N
X X X X
hg |A| f i = hg| A ck |'k i = hg| ck A |'k i = ck hg |A| 'k i = ck hg |A'k i
k=1 k=1 k=1 k=1
0 2 3 1⇤
N
X N
X N
X N
X
⇤ ⇤
= ck (hA'k |g i) = ck @hA'k | 4 bj |'j i5A = ck b⇤j (hA'k |'j i)
k=1 k=1 j=1 j,k=1
N
X N
X XN
= ck b⇤j h'j |A'k i = ck b⇤j h'j |A| 'k i = b⇤j Ajk ck .
j,k=1 j,k=1
| {z } j,k=1
=:Ajk
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 5

Es decir, cualquier elemento de matriz (y por tanto, la caracterización completa del operador A) se puede
obtener a partir del conocimiento de los elementos de matriz Ajk referidos únicamente a la base. Notemos
que la demostración no utiliza el hecho de que la base sea ortonormal, aunque la ortonormalidad simplifica
notablemente los cálculos; en particular, la ortonormalidad permite representar el operador A en términos de
operadores “mariposa”:
0 1
XN N
X
ck = h'k |f i
) hg |A| f i = hg |'j i Ajk h'k |f i = hg| @ |'j i Ajk h'k |A |f i
b⇤j = hg |'j i
j,k=1 j,k=1
N
X N
X
8 |f i , |gi 2 SN ) A= |'j i Ajk h'k | = Ajk |'j i h'k | .
j,k=1 j,k=1

Representación matricial: este resultado permite establecer una analogı́a directa con las matrices en espacios
euclı́deos: dada una base {|'1 i , . . . |'N i} del subespacio SN de dimensión finita N , se puede asociar a cada ket
una matriz fila, a cada bra una matriz columna, y a cada operador lineal finito–dimensional en S una matriz
cuadrada N ⇥ N como
0 1 0 1
c1 A11 A12 · · · A1N
B c2 C B A21 A22 · · · A2N C
B C B C
|f i ! B . C , hg| ! b⇤1 b⇤2 · · · b⇤N , AS ! B . .. .. C ,
@ .. A @ .. . . A
cN AN 1 AN 2 · · · AN N
de manera que
0 10 1
A11 A12 ··· A1N c1
N
X B A21 A22 ··· A2N CB c2 C
B CB C
hg |A| f i = b⇤j Ajk ck = b⇤1 b⇤2 ··· b⇤N B .. .. .. CB .. C.
@ . . . A@ . A
j,k=1
AN 1 AN 2 ··· AN N cN
Obviamente la representación matricial depende de la base: el mismo operador y los mismos kets y bras pueden
exhibir representaciones matriciales diferentes, según la base elegida. La representación matricial proporciona
una herramienta útil y práctica cuando se trabaja en subespacios de dimensión finita, puesto que las se pueden
aplicar las mismas reglas que en los espacios euclı́deos RN . Por ejemplo, en implementaciones numéricas es
inevitable trabajar con una base truncada y la notación matricial ofrece una forma sencilla de representar la
función y los operadores en el código numérico.

Ejemplo: Calculemos la representación matricial del operador A = d/dx restringido al subespacio tridimensional

1 1 1
S = gen '1 (x) = p cos x, '2 (x) = p sen x, '3 (x) = p sen 2x ⇢ L2 ( ⇡, +⇡).
⇡ ⇡ ⇡
Los elementos |'k i forman una base ortonormal, y por tanto se puede escribir
3
X
|f i 2 S ) |f i = ck |'k i , ck = h'k |f i .
k=1

Todas las funciones 'k (x) son derivables:


2
A |'1 i = |'2 i , A |'2 i = |'1 i , A |'3 i = p cos 2x 62 S.

Por tanto, está bien definida la acción de A sobre cualquier elemento de S, pero el resultado no pertenece a este
subespacio:
X3
2
A |f i = ck A |'k i = c1 |'2 i + c2 |'1 i + c3 p cos 2x 62 S.

k=1
6 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Como la acción de A “saca” al vector fuera del espacio de partida S, la representación matricial de AS solo
proporciona información sobre la parte que “permanece” en S:
0 1 0 1 0 1
A11 A12 A13 h'1 |A| '1 i h'1 |A| '2 i h'1 |A| '3 i 0 1 0
AS ! @ A21 A22 A23 A = @ h'2 |A| '1 i h'2 |A| '2 i h'2 |A| '3 i A = @ 1 0 0 A .
A31 A32 A33 h'3 |A| '1 i h'3 |A| '2 i h'3 |A| '3 i 0 0 0

La matriz representa el operador A restringido al subespacio S. En general no es posible extraer de aquı́ conclu-
siones relativas a la acción de A sobre elementos fuera de S ni sobre el resultado de la acción que “queda” fuera
de S. Como ilustración, consideremos la acción de AS sobre la función u(x) = sen x(cos x 1) 2 S:
 
1 p 1 p 1
u(x) = sen x(cos x 1) = sen 2x sen x = ⇡ '3 (x) '2 (x) ) |ui = ⇡ |'3 i |'2 i 2 S,
2 2 2
0 10 1 0 p 1
0 1 0 0
p ⇡ p d
AS |ui ! @ 1 0 0 A @ p ⇡ A = @ 0 A ! ⇡ |'0 i , u(x) = cos x.
dx S
0 0 0 ⇡/2 0
Notemos la diferencia con la acción del operador sin restringirlo:
62S
d z }| {
u(x) = cos 2x cos x,
dx
cuyo resultado tiene una componente fuera del espacio S, es decir, la matriz que representa el operador finito–
dimensional AS no es suficiente para conocer la acción del operador A que actúa en un espacio de dimensión
infinita.

Como ilustra el ejemplo, lo ideal es intentar tomar un subespacio S lo bastante grande para que la acción del
operador de interés no “saque” vectores de este subespacio. Por ejemplo, se buscarı́a extender el subespacio
hasta el espacio completo H de dimensión infinita, estableciendo ası́ la relación de los operadores en H con la
representación matricial de la contrapartida finito–dimensional. El problema es que esto no siempre es posible
para cualquier operador debido al siguiente fenómeno: una matriz describe una función lineal,
N
X
y(x) = Ax ! yj = Ajk xk ,
k=1

y en dimensión finita la linealidad es suficiente para garantizar que la función es continua y por ello regular (esto
es, y(x) existe si |x| es finito). Un espacio de dimensión infinita, sin embargo, es “demasiado grande” y pueden
existir operadores lineales que posean singularidades a una distancia finita del origen: por ejemplo,
8
p 9 > df signo (x)
2
f (x) = |x| 2 L ( 1, 1) > >
> = p 62 L2 ( 1, 1),
>
= >
< dx 2 |x|
Z +1 )
> > Z +1
dx |x| = 1 > >
2
kf k = ; >
> 2 1
1
: kf k = dx = 1.
1 4|x|

Es decir, la condición de linealidad no basta para asegurar ausencia de singularidades. Es necesario introducir un
concepto nuevo para extender a dimensión infinita la noción de operador que preserva tanto la linealidad como
todas las propiedades asociadas a la continuidad: ası́ aparece la noción de operador completamente continuo
o compacto. Sin entrar en detalles, baste decir para nuestros propósitos que cuando un operador lineal A es
compacto, está definido en todo el espacio de Hilbert , posee una representación matricial respecto a una base
ortonormal {'1 , |'2 i , . . . } y se puede expresar en notación de Dirac en términos de operadores mariposa como
1
X
A= Ajk |'j i h'k | , Ajk := h'j |A| 'k i ,
j,k=1
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 7

mientras que la acción del operador A sobre un vector |f i del espacio se representa de manera sencilla como
0 1 ck
1
X 1
X z }| { 1
X
|gi = A |f i = @ |'j i Ajk h'k |A |f i = |'j i Ajk h'k |f i ) bj := h'j |g i = Ajk ck .
j,k=1 j,k=1 k=1

La compacidad del operador asegura que todos los números Ajk son finitos y que las series infinitas que apa-
recen arriba convergen, de manera que el operador compacto sigue las mismas reglas que las matrices finito–
dimensionales (la compacidad es una condición suficiente, no necesaria: existen algunos operadores no compactos
que también verifican las reglas matriciales; y en otros casos, estas expresiones son solo útiles en algunas manipu-
laciones formales). El ejemplo más habitual de operador compacto que aparece en aplicaciones fı́sicas al resolver
ecuaciones diferenciales es el denominado operador de Hilbert–Schmidt ,

Z b
J= ds g(x, s)· , a, b finitos, g(x, s) continuo,
a

es decir, un operador integral en un intervalo finito con un núcleo continuo.

Definición: un operador lineal A se dice completamente continuo o compacto si existe una sucesión {A1 , A2 , . . . } de operadores
lineales finito–dimensionales que converge al mismo:

lı́m k(An A)f k = 0, 8 |f i 2 H,


n!1

es decir, para cualquier vector |f i se puede construir la sucesión de vectores {A1 |f i , A2 |f i , . . . } que converge al vector A |f i.
Esta definición no es la más simple de usar en la práctica; en su lugar, existen algunas condiciones útiles y más inmediatas: si
{|'1 i , |'2 i , . . . } es una base ortonormal del espacio, entonces una condición necesaria es

lı́m kA'n k2 = M < 1,


n!1

mientras que una condición suficiente es


1
X
kA'n k2 < 1.
n=1

Intuitivamente, la definición representa que el operador A se puede aproximar con precisión arbitraria por una sucesión de opera-
dores finito–dimensionales, es decir, de matrices. Y efectivamente los operadores compactos representan la extensión natural a un
espacio funcional de los operadores en espacios finito–dimensionales: se puede demostrar que un operador compacto es lineal y sin
singularidades, que está caracterizado completamente por los elementos de matriz del operador solo entre elementos de una base (y
se puede pues representar mediante una matriz de dimensión infinita ), y que el paso al lı́mite se puede intercambiar con la aplicación
del operador:
⇣ ⌘
lı́m |fn i = |f1 i 2 H ) lı́m A |fn i = A lı́m |fn i = A |f1 i 2 H si A compacto.
n!1 n!1 n!1

La condición de compacidad es solo condición suficiente. Pueden existir operadores que no sea compactos pero verifiquen algunas
de estas propiedades. Algunos ejemplos ilustrarán de manera heurı́stica el tipo de dificultades que surgen al tratar de describir
operadores infinito–dimensionales mediante matrices:

Consideremos el operador diferencial A = d/dx y los subespacios vectoriales S2N de L2 ( ⇡, +⇡) de la forma

eikx
S2N = gen 'k (x) = p ) dim S2N = 2N.
2⇡ k=±1,±2,···±N

Los elementos 'k (n) forman una base del subespacio, que es ortonormal respecto al producto escalar del espacio L2 ( ⇡, +⇡)
(son de hecho un subconjunto de la base trigonométrica; notemos que el elemento con k = 0 está excluı́do). Al restringir A a
estos subespacios se construye una sucesión de operadores finito–dimensionales, representables mediante una matriz 2N ⇥ 2N
(diagonal en este ejemplo):
ikeikx
A |'k i = p = ik |'k i ) h'j |A| 'k i = ik jk ,
2⇡
8 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

0 1
h' N|A| ' Ni h' |A| '
N N +1 i ··· h' |A| 'N i
N
B .. .. .. C
B C
B . . . C
B C
B h' 1 |A| ' Ni h' 1 |A| ' N +1 i ··· h' 1 |A| 'N i C
AS2N ! B C
B h'+1 |A| ' Ni h'+1 |A| ' N +1 i ··· h'+1 |A| 'N i C
B C
B .. .. .. C
@ . . . A
h'N |A| ' Ni h'N |A| ' N +1 i ··· h'N |A| 'N i
0 1
iN
B
B ... 0 C
C
B i C
= B C = i diag ( N, N + 1, · · · 1, +1, . . . N ) .
B +i C
B C
@ 0 ... A
+iN

La sucesión de operadores compactos {A1 , A2 , . . . } no parece converger, pues los elementos que aparecen en las matrices
crecen en módulo sin cota según se incrementa la dimensión del subespacio S2N . De hecho, como no se cumple la condición
necesaria,
lı́m kA'k k2 = lı́m hA'k |A'k i = lı́m k2 6< 1,
k!1 k!1 k!1

se concluye que el operador diferencial A = d/dx no es compacto.


Consideremos ahora el operador integral
Z x Z x
B= dz · , B[f ] = dz f (z).
0 0

Consideremos los mismos subespacios vectoriales S2N del ejemplo previo. Se verifica
Z x
1 k6=0 eikx 1 |'k i |'0 i jk j0 j6=0 i
B['k ] = p dz eikz = p ! ) h'j |B| 'k i = = jk .
2⇡ 0 ik 2⇡ ik ik k

0 1
h' N |B| ' Ni h' |B| '
N N +1 i ··· h' |B| 'N i
N
B .. .. .. C
B C
B . . . C
B C
B h' 1 |B| ' Ni h' 1 |B| ' N +1 i ··· h' 1 |B| 'N i C
BS2N ! B C
B h'+1 |B| ' Ni h'+1 |B| ' N +1 i ··· h'+1 |B| 'N i C
B C
B .. .. .. C
@ . . . A
h'N |B| ' Ni h'N |B| ' N +1 i ··· h'N |B| 'N i
0 1
i/N
B
B ... 0 C
C ✓ ◆
B i C 1 1 1
= B C = i diag , ,··· 1, +1, . . . .
B +i C N N 1 N
B C
@ 0 ... A
+i/N

La sucesión de operadores compactos {B1 , B2 , . . . } parece converger, pues los elementos que van apareciendo sucesivamente
en las matrices disminuyen en módulo según se incrementa la dimensión del subespacio S2N : en efecto, se cumple la condición
suficiente
X1 X1 X1
2
kB'k k2 = hB'k |B'k i = 2
< 1,
k=1 k=1 k=1
k
R
y se concluye que el operador integral B = 0x dz · es compacto.
Consideremos por último el operador identidad I: su representación matricial en cualquier base ortonormal es la matriz
identidad. Cumple la condición necesaria,

lı́m kI'k k = lı́m k'k k = 1 < 1,


k!1 k!1

pero no la condición suficiente,


1
X 1
X
kI'k k2 = 1 6< 1,
k=1 k=1
por lo que estas condiciones no permiten concluir nada sobre la compacidad del operador. Se puede demostrar por otro camino
que no es un operador compacto, aunque sı́ verifica muchas de sus propiedades.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 9

8.1.2. Operaciones
Los operadores lineales se pueden combinar y someter a transformaciones para generar nuevos operadores lineales.
Veamos las operaciones más relevantes para las aplicaciones en Fı́sica Matemática :

1. Combinación lineal: si A y B son operadores lineales y , son dos constantes complejas, entonces se
define la combinación lineal A + B como el operador que verifica

( A + B) |f i := (A |f i) + (B |f i).

Cuando la notación matricial es aplicable, se verifica

( A + B)jk = Ajk + Bjk .

2. Producto: si A y B son operadores lineales, se define el producto AB como la aplicación sucesiva de los
operadores,
(AB) |f i := A(B |f i).
Se utiliza la notación de potencia natural cuando es apropiada, por ejemplo, A2 = AA y en general
An = AAn 1 . Es importante resaltar que el producto verifica la propiedad asociativa, A(BC) = (AB)C,
pero no la conmutativa, AB 6= BA. Esto último se caracteriza definiendo el conmutador de dos operadores
como [A, B] := AB BA. Por ejemplo,
9
f (x) 2 C 1 (R) >
= d df
) [A, B] |f i = AB |f i BA |f i ! (xf ) x = f (x) ) [A, B] = I.
d >
; dx dx
A= , B=x
dx
Incluso si la notación matricial es aplicable, hay que prestar atención porque esto no significa que la
representación matricial del producto se pueda encontrar como el producto de las matrices. En efecto,
como contraejemplo consideremos los operadores A = d/dx y B = A2 = d2 /dx2 restringidos al subespacio
vectorial

1 1 1
S = gen '1 (x) = p cos x, '2 (x) = p sen x, '3 (x) = p sen 2x ⇢ L2 ( ⇡, +⇡).
⇡ ⇡ ⇡
Estos operadores tienen la representación matricial
0 1 0 1
1 0 0 0 1 0
BS ! @ 0 1 0 A, AS !@ 1 0 0 A,
0 0 4 0 0 0
pero se encuentra
0 10 1 0 1
0 1 0 0 1 0 1 0 0
(AS )2 !@ 1 0 0 A@ 1 0 0 A=@ 0 1 0 A.
0 0 0 0 0 0 0 0 0

Por tanto, BS = (A2 )S 6= (AS )2 , es decir, no se puede intercambiar la restricción con elevar al cuadrado.
La razón es que el operador A = d/dx “extrae” la función '3 fuera del espacio S, pero al aplicarlo otra
vez, lo “reintroduce”. Por ejemplo, para la función '3 (x) se verifica
✓ ◆
d 1 2
A |'3 i = p sen 2x = p cos 2x 62 S,
dx ⇡ ⇡
✓ ◆
2 d 2
B |'3 i = A p cos 2x = p cos 2x = 4 |'3 i 2 S.
⇡ dx ⇡
10 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

1
3. Operador inverso: si A es un operador lineal, se define el operador lineal inverso A como aquel que
verifica
A 1 A = AA 1 = I.
No siempre existe el operador inverso. En el caso de una matriz, la condición necesaria y suficiente de
invertibilidad es que su determinante sea diferente de cero, esto es, que el sistema lineal homogéneo asociado
posea solución única (la nula). Este resultado se generaliza a operadores en el siguiente
1
lema: el operador inverso A existe si, y solo si, la ecuación A |f i = 0 posee solución única |f i = 0.
Demostración:

a) Supongamos que existe A 1. Entonces se puede resolver la ecuación para obtener solución única nula:
1
A |f i = 0 ) |f i = A |0i = 0.
b) Supongamos que la ecuación A |f i = 0 posee la solución única |f i = 0. El operador inverso existe si la solución |gi de la
ecuación A |gi = |hi es única para cualquier. |hi Supongamos que hubiera al menos dos soluciones, |g1 i, |g2 i. Entonces
se puede demostrar que ambas deben ser iguales:
A |g1 i = |hi sol. única
) A(|g1 i |g2 i) = 0 ) |g1 i = |g2 i .
A |g2 i = |hi
Por tanto, A 1 |hi = |gi está bien definido.
1 1 1
Lema: si los operadores A y B poseen inverso, entonces el inverso del producto es (A B) =B A .
Demostración: se verifica
I I
z }| { z }| {
1 1
(A B) (A B) = B A 1A B = B 1
B = I, (A B)(A B) 1
= A B 1B A 1
= AA 1
= I.

Ejemplo: consideremos el operador A = d/dx. En general no es invertible, puesto que la condición A |f i = 0


posee infinitas soluciones:
df
A |f i = 0 ,
= 0 ) f (x) = C constante arbitraria.
dx
Para que la solución de este problema sea únicamente la función nula, se debe imponer alguna condición
inicial que restrinja la multiplicidad de soluciones. Por tanto, buscamos el inverso del operador A en el
subespacio
D = {f (x) | f (x) 2 C 1 (R), f (0) = 0},
es decir, en el conjunto de funciones derivables que se anulan en el origen. En este caso, D es el dominio
del operador A, mientras que su rango se define como
R := {A |f i | |f i 2 D} , R = A[D] simbólicamente,
es decir, el conjunto de todos los resultados de aplicar A en su dominio. En este caso se puede demostrar1
R = C 0 (R). Es inmediato comprobar que tanto el dominio D como el rango R tienen estructura de espacio
vectorial. Podemos pues buscar el operador inverso A 1 , cuyo dominio y rango estarán intercambiados con
los de A,
A |f i = |gi 2 R
, D = A 1 [R] simbólicamente.
A 1 |gi = |f i 2 D
Z x
1
Es sencillo comprobar que el operador inverso tiene la forma de un operador integral, A = dz ·; en
0
efecto, se verifica
Z continua
d x z}|{
1 1
8 |gi 2 R : AA |gi ! dz g(z) = g(x) ) AA = I,
dx 0
| {z }
derivable
1 Comof 2 D es derivable con continuidad, g = f0
2 R es continua, aunque no necesariamente derivable. Y la inversa, cualquier
función g continua es integrable y permitir construir una primitiva f (por tanto, derivable) que se anule en x = 0, es decir, un
elemento de D.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 11

continua
Z z }| { 0
x
d z}|{
1 1
8 |f i 2 D : A A |f i ! dz f (z) = f (x) f (0) = f (x) ) A A = I.
0 dz
Notemos que, de la misma manera que la acción de A está definida sobre elementos que no pertenecen
a D (por ejemplo, cualquier función derivable), la acción del operador inverso A 1 puede estar definida
también sobre elementos que no pertenezcan al rango R del operador A; por ejemplo, cualquier función
cuasicontinua, como
Z x
g(x) = signo x 62 R porque f (x) = A 1 [g] = dz signo z = |x| 62 D.
0

1
Entonces es importante destacar que A y A no se pueden considerar inversos uno de otro cuando A actúa
sobre elementos que no están en D o A 1 sobre elementos que no están en R. Por ejemplo, f (x) = 1 62 D
pero A[f ] = 0 existe y A 1 [0] = 0 6= f (x). En definitiva, cuando decimos que un operador es el inverso de
otro, no basta con especificar la forma de los mismos, también hay que especificar en qué dominios lo son.
Mencionemos por último que en estos razonamientos no se ha requerido la estructura de espacio de Hilbert:
solo se ha empleado la estructura de espacio vectorial, pero no ha hecho falta la noción de producto escalar
ni de completitud.
Existe una relación estrecha entre el operador inverso y la función de Green de la EDO asociada al operador diferencial
original. En efecto, la existencia del inverso implica que el problema
9 8
> df
A |f i = |bi = < = b(x),
, dx
; >
:
|f i 2 D f (0) = 0, f (x) sol. clásica,
está bien planteado y tiene solución única, la cual se puede escribir como
Z x
1
|f i = A |bi , f (x) = dz b(z).
0
Hay, sin embargo, una forma alternativa de expresar esta solución mediante la función de Green. Esta última es una distribución
que satisface el problema
dgx0
= (x x0 ), gx0 (0) = 0, x0 , x 2 R,
dx
cuya solución es
Z x Z x
d ⇤x
gx0 (x) = dz (z x0 ) = dz H(z x0 ) = H(z x0 ) 0 = H(x x0 ) H( x0 ).
0 0 dz

Por otra parte, la EDO original se puede escribir formalmente también como
Z +1 Z +1
df
A |f i = |bi = dz b(z) |zi , = b(x) = dz b(z) (x z).
1 dx 1

Por tanto, el principio de superposición permite formular la solución como una transformada integral con el núcleo dado por
la función de Green: Z +1
f (x) = dz g(x, z) b(z) = G[b] , |f i = G |bi .
1
| {z }
=:G
Podemos comprobar que efectivamente G = A 1:
2 0 si x<z
3
0 si 0<z
Z +1 Z +1 z }| { z }| { Z x Z 0 Z x
6 7
f (x) = dz g(x, z) b(z) = dz b(z) 4H(x z) H( z) 5 = dz b(z) dz b(z) = dz b(z) .
1 1 1 1 0
| {z } | {z }
G[b] A 1 [b]

Estos resultados sirven para ilustrar una serie de caracterı́sticas genéricas sobre los operadores asociados a ecuaciones dife-
renciales que no son exclusivas del ejemplo:

El operador inverso de un operador diferencial es un operador integral, el cual se puede construir a partir de la función
de Green.
El operador inverso está definido en un espacio más grande que el diferencial, puesto que las condiciones de integrabilidad
son menos restrictivas que las de derivabilidad.
12 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

4. Operador adjunto o traspuesto conjugado: sea A un operador lineal definido en un espacio de Hilbert
H. Se denomina operador adjunto A† al operador lineal que verifica
⌦ ↵ ⇤
f A† g = hg |A| f i , 8 |gi , |f i 2 H.

Comentarios:

Si el operador A es compacto, se puede demostrar que existe A† , en cuyo caso la definición simplemente
significa que la matriz que representa a A† es la traspuesta conjugada de la matriz para A:
⌦ ↵ ⇤
(A† )jk = 'j A† 'k = h'k |A| 'j i = A⇤kj .

En la mayorı́a de las aplicaciones (con operadores diferenciales provenientes de EDOs), el operador A


no estará definido en todo el espacio de Hilbert H: entonces consideraremos el operador AS restringido
a un subespacio S ⇢ H, y su adjunto se define a través de los elementos de matriz restringidos al
subespacio:
D E

f A†S g = hg |AS | f i , 8 |gi , |f i 2 S.

Una interpretación alternativa y muy útil es que el operador A† es la versión del operador A que actúa
sobre bras:
⌦ ↵ ⇤ ⇤ 8 |gi
f A† g = hg |A| f i = hg |Af i = hAf |g i ) hf | A† = hAf | .

Es decir, se verifica la siguiente relación:

A
espacio de kets H : |f i ! A |f i = |Af i
# #
A†
espacio de bras H⇤ : hf | ! hf | A† ⌘ hAf |

donde H⇤ es el espacio dual de H (aunque, como establece el teorema de Riesz–Fréchet, en realidad


H⇤ = H). En la representación matricial, es la diferencia entre multiplicar el vector por la derecha o
por la izquierda de la matriz:
0 1⇤
X X X
x ⇤ · A† ! x⇤j (A† )jk = A⇤kj x⇤j = @ Akj xj A ! (A · x)⇤
j j j

Algunas propiedades útiles :

(A† )† = A, (A + B)† = A† + B † , (↵A)† = ↵⇤ A† , (AB)† = B † A† , (A† ) 1


= (A 1 †
) .

La demostración es inmediata a partir de la definición.


Las dos demostraciones más laboriosas corresponden al producto y al inverso:
D E |hi = B |f i
D E |ki = A† |gi
f (AB)† g = hg |AB| f i⇤ = hg |A| hi⇤ = h A† g = hh |k i
D E D E
⇤ ⇤
= hk |h i = hk |B| f i = f B † k = f B † A† g ) (AB)† = B † A† .

Para el inverso basta con demostrar A† (A 1 )† = (A 1 )† A† = I por definición de inverso:


D E D E⇤ ⌦ ↵⇤
f (A 1 )† A† g = g ((A 1 )† A† )† f = g AA 1 f = hg |I| f i⇤ = hf |I| gi ) (A 1 †
) A† = I,
D E D E⇤ ⌦ ↵⇤
f A† (A 1 †
) g = g (A† (A 1 † †
) ) f = g A 1
A f = hg |I| f i⇤ = hf |I| gi ) A† (A 1 †
) = I.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 13

Ejemplo: calculemos el operador adjunto de A = d/dx restringido al subespacio vectorial

S = f (x) 2 C 1 [0, 1], f (0) = f (1) = 0

respecto al producto escalar de L2 (0, 1). Evidentemente S ⇢ L2 (0, 1) y A está definido en todo el espacio
S, ya que la acción de A sobre elementos de S produce funciones continuas, que son cuadrado integrables
en (0, 1). Por tanto, los elementos de matriz de A†S son, por definición,

continua
✓Z ◆⇤ Z }| z {
D E 1
df (x) 1
df ⇤ (x)

f A†S g = hg |AS | f i = dx g (x) ⇤
= dx g(x)
0 dx 0 dx
0 pues f,g2S
✓ ◆ z }| { Z 1 Z 1 ✓ ◆
integrando ⇥ ⇤1 ⇤ dg(x) ⇤ d
= g(x)f (x) 0 dx f (x) = dx f (x) g(x)
por partes
0 dx 0 dx

d
= f g ,
dx
d
8 |f i , |gi 2 S ) A†S = .
dx
Este ejemplo sirve también para enfatizar dos aspectos muy importantes:

a) El adjunto de A cuando actúa sobre elementos que no pertenecen a S no tiene por qué ser d/dx
ya que, como se indicó, el conocimiento de AS no proporciona información sobre la acción y el efecto
de A fuera del subespacio S. Por ejemplo, sean f (x) = x, g(x) = x2 . Obviamente |f i , |gi 62 S, pero
|f i , |gi 2 C 1 [0, 1], ası́ que A |f i , A |gi están definidos. Sin embargo,
✓Z 1 ◆⇤ Z 1
⌦ †
↵ ⇤ d
g A f = hf |A| gi = dx x x2 =2 dx x2 = 1,
0 dx 0

D E ⌧ d
Z 1 ✓
d
◆ Z 1
1
g A†S f = g f = dx x2 x= dx x2 = .
dx 0 dx 0 2

Como estos elementos de matriz difieren, se concluye que A† 6= d/dx fuera del subespacio S.
b) El adjunto de AS es diferente si el subespacio S se embebe en un espacio de Hilbert diferente, porque
supone en general un producto escalar distinto. Por ejemplo, sea el espacio de Hilbert L2w (0, 1) con la
función peso w(x) = e x . Evidentemente se sigue cumpliendo S ⇢ L2w (0, 1), pero ahora es

D E ✓Z 1 ◆⇤ Z 1
⇤ df (x) df ⇤ (x)
f A†S g = hg |AS | f iw = dx e x ⇤
g (x) = dx e x
g(x)
w 0 dx 0 dx
0 x
(g g)e
0 pues f,g2S
✓ ◆ z }| { Z z }| {
⇥ ⇤1 1
integrando x ⇤ d ⇥ x ⇤
= e g(x)f (x) 0 dx f (x) e g(x)
por partes
0 dx
Z 1 ✓ ◆
x ⇤ d
= dx e f (x) 1 g(x)
0 dx

d
= f 1 g ,
dx w
d
8 |f i , |gi 2 S ) A†S = 1 en L2w (0, 1).
dx
14 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

8.1.3. Operador normal, hermı́tico, unitario, proyector


Existe una serie de operadores que poseen propiedades particulares de espacial relevancia para las aplicaciones.
Como se verá, estas propiedades son una generalización de las correspondientes a matrices.

Definición: Un operador lineal A se denomina normal si verifica AA† = A† A, es decir, el operador conmuta
con su adjunto, [A, A† ] = 0. De manera equivalente, un operador es normal si verifica kAf k = A† f para
cualquier vector |f i. La equivalencia de estas dos definiciones se comprueba fácilmente a través de los elementos
de matriz diagonales del operador [A, A† ], los cuales lo caracterizan completamente en un espacio de Hilbert H:
⌦ ↵ ⌦ ↵ ⌦ ↵ ⌦ ↵ 2 2
8 |f i 2 H : f [A, A† ] f = f AA† f f A† A f = A† f A† f hAf |Af i = A† f kAf k .
2 2
Entonces, el conmutador se anula si la diferencia A† f kAf k es cero y viceversa.

Hay tres tipos de operadores normales particularmente relevantes en las aplicaciones fı́sicas:
Operador hermı́tico o autoadjunto si A† = A (que es normal porque AA† = A2 = A† A).
Operador unitario si U † = U 1
(que es normal porque U U † = I = U † U ).
Operador proyector si es hermı́tico y además P 2 = P .

1. Operador hermı́tico o autoadjunto, A† = A: los operadores hermı́ticos generalizan la noción de ma-


triz simétrica:
⌦ ↵ def.A† ⇤
hf |A| gi = f A† g = hg |A| f i .
(En efecto, para una matriz de elementos reales, esta condición implica que la matriz es simétrica). Na-
turalmente, como se comentó en la definición de operador adjunto, el que un operador sea hermı́tico o no
dependerá del subespacio al que se restrinja y del espacio de Hilbert en el que se trabaje.
Ejemplos: en los ejemplos que sigue se trabaja en el subespacio de funciones dos veces derivables con
continuidad en 0  x  1 que se anulan en los extremos del intervalo:
S = f (x) 2 C 2 [0, 1], f (0) = f (1) = 0 .
Calculemos el operador adjunto del operador derivada segunda, A = d2 /dx2 , restringido al subespacio
vectorial S, respecto al producto escalar de L2 (0, 1): obviamente se puede embeber el subespacio en
este espacio de Hilbert (S ⇢ L2 (0, 1)), y la acción de A está definida sobre todos los elementos de S.
Entonces:
D E ✓Z 1 ◆⇤ Z 1
† ⇤ ⇤ d2 f (x) d2 f ⇤ (x)
f AS g = hg |AS | f i = dx g (x) = dx g(x)
0 dx2 0 dx2
0 pues g2S, f 0 finito
z }| {
✓ ◆  1 Z 1
integrando df ⇤ (x) dg(x) df ⇤ (x)
= g(x) dx
por partes dx 0 0 dx dx
0 pues f 2S, g 0 finito
z }| {
✓ ◆  1 Z 1
integrando dg(x) ⇤ d2 g(x) ⇤
= f (x) + dx f (x)
por partes dx 0 0 dx2

d2
= f g = hf |AS | gi
dx2
8 |f i , |gi 2 S ) A†S = AS .
Por tanto, A es un operador hermı́tico restringido al subespacio vectorial S y respecto al producto
escalar de L2 (0, 1). Es importante enfatizar estas dos condiciones porque indican que la propiedad de
hermiticidad no es intrı́nseca a la forma del operador A. Notemos en particular lo relevante que es la
condición f (0) = f (1) = 0 para eliminar el término de contorno que aparece al integrar por partes.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 15

Consideremos el operador B = id/dx restringido al subespacio S ⇢ L2 (0, 1). Ya se demostró en un


ejemplo previo que para el operador A = d/dx se verifica A†S = AS respecto al producto escalar de
L2 (0, 1) (aunque el subespacio Ŝ del ejemplo entonces se restringı́a a funciones derivables una vez, es
evidente que el subespacio S considerado ahora de funciones dos veces derivables verifica S ⇢ Ŝ). Por
tanto,

BS = iAS ) BS† = (iAS ) = i⇤ A†S = ( i)( AS ) = BS ,
es decir, B = id/dx es autoadjunto cuando se restringe a S considerado subespacio de L2 (0, 1).
Consideremos el operador
d2 d
A= 2.
dx2 dx
La restricción AS no es hermı́tica respecto al producto escalar de L2 (0, 1). En efecto, escribamos
d2 d
AS = A2 + A1 + A0 , A2 := , A1 := , A0 := 2I.
dx2 S dx S

Ya hemos comprobado que A†2 = A2 y se comprueba inmediatamente que A†0 = A0 pero, como se
demostró, A†1 = A1 . Por tanto, A†S 6= AS respecto al producto escalar de L2 (0, 1). Supongamos, sin
embargo, que el espacio S está embebido en L2w (0, 1) con la función peso w(x) = e x . Entonces AS sı́
es hermı́tico respecto al producto escalar del espacio L2w (0, 1): por un lado se verifica
D E ✓Z 1 ◆⇤ Z 1
⇤ d2 f (x) d2 f ⇤ (x)
f A†2 g = hg |A2 | f iw = dx e x g ⇤ (x) 2
= dx e x g(x)
w 0 dx 0 dx2
0 pues g2S
z }| {
✓ ◆  1 Z 1
integrando x df ⇤ (x) d[e x
g(x)] df ⇤ (x)
= e g(x) dx
por partes dx 0 0 dx dx
0 pues f 2S (g 00 2g 0 +g)e x
z }| { z }| {
✓ ◆  1 Z 1
integrando d[e x g(x)] ⇤ d2 [e x g(x)] ⇤
= f (x) + dx f (x)
por partes dx 0 0 dx2
Z 1 Z 1 
d2 g(x) d
= dx e x f ⇤ (x) 2
+ dx e x ⇤
f (x) 1 2 g(x)
0 dx 0 dx
⌧ ⌧ ⌧
d2 d d
= f g + f g + f 1 g
dx2 w dx w dx w
D E

= hf |A2 | giw + hf |A1 | giw f A1 g
w
8 |f i , |gi 2 S ) A†2 + A†1 = A2 + A1 ,

pues ya se calculó A†1 en un ejemplo previo. Como A†0 = A0 trivialmente, se concluye finalmente
A†S = A†2 + A†1 + A†0 = AS respecto a este producto escalar.

2. Operador unitario, U † = U 1 : la caracterı́stica fundamental de un operador unitario es que el producto


escalar es invariante bajo su acción: llamando |F i := U |f i, |Gi := U |gi, se tiene
⌦ ↵⇤ ⌦ ↵⇤ U† = U 1 ⌦ ↵⇤ 1U = I

hF |G i = hF |U | gi = g U † F = g U † U f 1 U
= g U U f = hg |f i = hf |g i ,

y en particular la norma se conserva,


p p
kF k = hF |F i = hf |f i = kf k .

Por tanto, los operadores unitarios representan el análogo en espacios de Hilbert a las rotaciones en los
espacios euclı́deos RN y a los cambios de base ortonormal. Un ejemplo muy relevante de operador unitario
16 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

es la transformada de Fourier, que como ya se discutió está definida en todo el espacio L2 (R) (teorema de
Plancherel): en efecto, la transformada se puede escribir como2
Z +1 Z +1
dx dx
(k) = p e ikx f (x) , | i = U |f i , U := p e ikx ·, k 2 R,
1 2⇡ 1 2⇡
en términos de la acción de un operador integral U . La transformada inversa se escribe por tanto como
Z +1 Z +1
dk ikx 1 1 dk ikx
f (x) = p e (k) , |f i = U | i , U = p e ·, x 2 R.
1 2⇡ 1 2⇡
Entonces, para cualquier par |f i , |Gi 2 L2 (R) se verifica
✓Z +1 Z +1 ◆⇤
⌦ †
↵ ⇤ ⇤ ⇤ dx ikx
f U G = hG |U | f i = hG | i = dk G (k) p e f (x)
1 1 2⇡
Z +1 ✓Z +1 ◆ Z +1
dk ikx
= dx f ⇤ (x) p e G(k) = dx f ⇤ (x)U 1
[G]
1 1 2⇡ 1
⌦ ↵
= f U 1 G ,
2
8 |f i , |Gi 2 L (R) ) U† = U 1
, U unitario.

La conservación de la norma corresponde simplemente a la identidad generalizada de Plancherel:


Z +1 Z +1 ✓ Z +1 ◆
2 2 2 2 dk 2
kf k = k k , dx |f (x)| = dk | (k)| = |F (k)| .
1 1 1 2⇡

3. Operador proyector, P † = P y P 2 = P : sea |ui un vector unitario, esto es, kuk = 1 (“vector unitario”).
Entonces el operador Pu = |ui hu| es un proyector:
⌦ ↵ ⇤ ⇤ 8f,g
f Pu† g = hg |Pu | f i = (hg |u i hu |f i) = hu |g i hf |u i = hf |u i hu |g i = hf |Pu | gi ) Pu† = Pu ,
|uihu|f i |ui
z }| { z }| { 8f
Pu2 |f i = Pu Pu |f i = Pu |ui hu |f i = |ui hu |f i = Pu |f i ) Pu2 = Pu .
Geométricamente, el efecto de Pu sobre cualquier vector es obtener su proyección a lo largo de la dirección
de |ui: 8
< Pu |f i = |f i , si |f i k |ui
Pu |f i = |ui hu |f i , en particular
:
Pu |f i = 0, si |f i ? |ui
Los operadores permiten expresar de manera compacta la noción de que un conjunto de vectores forman
una base ortonormal. En efecto, sea {|'1 i , |'2 i , . . . } una base ortonormal, de manera que Pk = |'k i h'k |
es el proyector a lo largo de cada “dirección” de la base. Entonces:
Ortonormalidad: a partir de la relación h'j |'k i = j,k se deduce
jk Pk
z }| { z }| {
Pj Pk = (|'j i h'j |) (|'k i h'k |) = |'j i h'j |'k i h'k | = jk |'k i h'k | = jk Pk .

Geométricamente esta expresión indica que si ya se ha proyectado en una dirección de la base, una
segunda proyección solo puede dar cero (si es en una dirección distinta) o la identidad (si es en la
misma dirección).
2 Notemos
p
que la transformada p (k) se define con un prefactor 1/ 2⇡ de manera que nuestra definición original F (k) de trans-
formada viene dada como F (k) = 2⇡ (k). El objetivo de esta redefinición es conseguir una simetrı́a máxima con la transformada
inversa.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 17

Base: para cualquier |f i se cumple


X
|f i = ck |'k i , ck = h'k |f i .
k

Entonces,
!
X X X X 8f X
|f i = |'k i h'k |f i = (|'k i h'k |) |f i = Pk |f i = Pk |f i ) Pk = I,
k k k k k

que es la denominada relación de cierre. Geométricamente esta ecuación expresa que la suma de las
proyecciones a lo largo de todas las direcciones de la base proporciona el vector completo original.
De manera más general, sea S = gen B el subespacio vectorial generado por la base ortonormal B =
{|'1 i , . . . |'n i}. Entonces, el proyector sobre este subespacio se escribe
n
X
PS = |'k i h'k | .
k=1

8.2. Autovalores y autovectores


El problema de autovalores de una matriz se puede extender a operadores lineales, con propiedades similares.

Definición: se denomina problema de autovalores del operador lineal A a la ecuación


A |vi = |vi , 2 C.
Se denomina autovalor a aquellos números complejos para los cuales esta ecuación posee soluciones no nulas,
|vi =
6 0, denominadas autovectores o autofunciones.
Comentarios:
De manera alternativa, esta ecuación se escribe como (A I) |vi = 0, es decir, los autovalores son aquellos
números para los cuales el operador A I no es invertible.
Los autovalores son numéricamente iguales al cociente de Rayleigh del operador A evaluado en los auto-
vectores:
hv |A| vi
R[v] = = .
hv |v i
El conjunto de autovalores se denomina espectro del operador A.
El conjunto de autovectores asociados a un mismo autovalor se denomina autoespacio,
E = {|vi | A |vi = |vi},
y tiene estructura de espacio vectorial:
|vi , |wi 2 E : A(↵ |vi + |wi) = (↵ |vi + |wi) ) ↵ |vi + |wi 2 E , 8↵, 2 C.
Por tanto, es suficiente con obtener una base del autoespacio para caracterizarlo completamente. Su di-
mensión se denomina degeneración o multiplicidad del autovalor . Si dim E = 1, el autovalor se dice
simple.
Si se trabaja en un subespacio de dimensión finita, el problema de autovalores coincide con el problema de
autovalores para la matriz que representa el operador:
0 10 1 0 1
A11 A12 · · · A1n v1 v1
B A21 A22 · · · A2n C B v2 C B v2 C
dim. finita B CB C B C
A |vi = |vi ) B .. .. .. C B .. C = B .. C.
@ . . . A @ . A @ . A
An1 An2 ··· Ann vn vn
18 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Ejemplo: consideremos el operador derivada segunda, A = d2 /dx2 , restringido al subespacio vectorial

S = {f (x) | f (x) 2 C 2 [0, 1] y f (0) = 0, f 0 (1) = 0}.

El problema de autovalores se formula como un problema de condiciones de contorno para una EDO:
8
8 9 > d2 v
>
> = v,
< A |vi = |vi = < dx2
AS |vi = |vi , ,
: ; >
> v(0) = 0, v 0 (1) = 0,
|vi 2 S >
:
v(x) sol. clásica en 0  x  1.

Resolvemos el problema de condiciones de contorno, donde es también una incógnita:


Si = 0: la solución clásica de la EDO es v(x) = ↵ + x. A continuación se imponen las condiciones de
contorno:
)
!
v(0) = 0 ) ↵ = 0
!
) v(x) = 0 solución trivial y única ) = 0 no es autovalor.
v 0 (1) = 0 ) =0
p p
x x
Si 6= 0: la solución clásica de la EDO es v(x) = ↵e + e , y las condiciones de contorno implican

! !
v(0) = 0 ) ↵+ =0 ) = ↵,

! p h p p i
! ,↵6=0 p
!
v 0 (1) = 0 ) ↵ e +e =0 ) e2 = 1 = ei(⇡+2⇡n) , n = 0, ±1, ±2, . . .
p
(No se puede tomar ↵ 6= 0 porque entonces se obtiene la solución trivial, v(x) = 0). Definiendo µ := ,
µr := Re(µ), µi := Im(µ), la segunda condición se formula como
8 9
>
> e2µr = 1 ) µr = 0 >
> ✓ ◆2
< = 1
2µr 2iµi ! ⇡i(2n+1) ✓ ◆ 2 2
e e =e ) ) = (iµi ) = ⇡ n + .
>
> 1 > > 2
: 2µi = ⇡(2n + 1) ) µi = ⇡ n + ;
2
La correspondiente autofunción será
h i ✓ ◆
i⇡(n+1/2)x i⇡(n+1/2)x 1
'n (x) = ↵ e e = 2i↵ sen n + ⇡x,
2
con ↵ arbitrario.
Notemos que no todos los valores de n conducen a autovalores y autofunciones diferentes: es suficiente con tomar
n = 0, 1, 2, . . . . En definitiva, la solución del problema de autovalores es
✓ ◆2 ✓ ◆
2 1 1
n = ⇡ n+ , 'n (x) = sen n + ⇡x, En = gen {'n (x)}, n = 0, 1, 2 . . .
2 2
y cada autovalor es simple, dim E = 1.
Este ejemplo también permite ilustrar un hecho genérico en la resolución del problema de autovalores para
operadores diferenciales: el problema siempre tiene la solución nula, mientras que los autovalores corresponden
a los casos en que el problema no está bien planteado porque existe otra solución. Esto significa que no se
pueden imponer condiciones iniciales, pues entonces probablemente el problema esté bien planteado en virtud
del teorema de Picard. Por ello, en su lugar aparecen condiciones de contorno.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 19

A partir de la ecuación del problema de autovalores para un operador y de sus propiedades se puede deducir una
serie de resultados generales útiles.

Lema:
1. Cualquier autovector de A también lo es de sus potencias enteras An , n = 2, 3, . . . .
2. Si existe el operador inverso A–1 , entonces A y A 1
poseen los mismos autovectores en el dominio donde
ambos están definidos.
3. Si el operador A es normal, entonces él y su adjunto A† poseen los mismos autovectores.
4. Si S es un subespacio lineal, entonces los autovectores de A que pertenecen a S son los mismos que los del
operador restringido AS .
Demostración:
1. Sea |vi un autovector de A. Entonces se verifica
|vi
z }| {
An |vi = An 1
(A |vi) = An 1
|vi = (n .veces)
.. = n
|vi .

2. Si A posee inverso, la única solución de A |f i = 0 es el vector nulo, es decir, ningún autovalor de A será
cero. Puesto que A A 1 = A 1 A = I, las dos siguientes formulaciones del problema de autovalores son
equivalentes en el dominio donde A está definido:
I
z }| { 1
6=0
A |vi = |vi , A 1 A |vi = A 1
|vi , A 1
|vi = |vi .

3. La ecuación de autovectores se escribe B |vi = 0 en términos del operador B := A I. Si A es normal,


esto es, AA† = A† A, entonces también B es normal:
BB † = (A I)(A† ⇤
I) = AA† ⇤
A A† + ⇤
I
† ⇤ † ⇤ † ⇤
(A normal) = A A A A + I = (A I)(A I) = B † B.
Por tanto, para cualquier vector |f i se verifica kBf k = B † f , por definición de operador normal. En
particular, si |vi es un autovector de A se verifica kBvk = 0 y por tanto es B † v = 0, esto es, también es
un autovector de A† (asociado al autovalor ⇤ ).
4. Por definición del autovector |vi 2 S, la acción de A sobre el mismo no lo extrae del subespacio: A |vi =
|vi 2 S. Como la acción del operador restringido AS solo considera por definición el efecto dentro del
subespacio, se puede afirmar AS |vi = A |vi, y por tanto, |vi también es autovector de AS . En consecuencia,
si el operador no restringido A posee otros autovectores, estos no pertenecerán al subespacio S. El efecto
práctico de este resultado es que resulta equivalente resolver el problema de autovalores para A o para AS
en lo que concierne a los autovectores que están en S.

Teorema: los autovalores de un operador hermı́tico son reales. Los autovalores de un operador unitario tienen
módulo unidad. Los autovalores de un proyector son cero o uno.
Demostración: en lo que sigue se toma el autovector |vi normalizado, kvk = 1, para simplificar.
Sea A hermı́tico (A† = A). Aplicando el cociente de Rayleigh,
def.A† ⌦ ↵⇤ herm. ⇤
= R[v] = hv |A| vi = v A† v = hv |A| vi = ⇤
) 2 R.
Este resultado expresa que los elementos de matriz diagonales del operador hermı́tico deben ser reales.
Sea U unitario (U † = U 1
). Aplicando el cociente de Rayleigh, y puesto que 6= 0 porque existe U 1 ,
def.U † ⌦ ↵⇤ unit. 1
= R[v] = hv |U | vi = v U† v = (hv| U 1 |vi)⇤ = ⇤ ) | |2 = 1 , = ei✓ , 0  ✓ < 2⇡.
| {z }
1 |vi
20 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Este resultado es consecuencia directa de la conservación de la norma bajo una transformación unitaria: la
norma del autovector no puede cambiar bajo la acción de U , ası́ que solo puede adquirir una fase compleja
✓; por tanto, en el caso de espacios euclı́deos reales, en los que esta fase debe ser 0 o ⇡, los autovalores solo
pueden ser +1 (movimientos propios) o 1 (movimientos impropios).
Sea P proyector (P † = P y P 2 = P ). Aplicando el cociente de Rayleigh,
proy.
= R[v] = hv |P | vi = hv| P 2 |vi = 2
) ( 1) = 0 ) = 0, 1.
| {z }
2 |vi

Geométricamente este resultado significa que los únicos vectores que no cambian de dirección bajo la
proyección son o bien los vectores que ya están en el subespacio sobre el que se proyecta ( = 1) o bien
aquellos vectores que son ortogonales al subespacio ( = 0).
A continuación enunciaremos una serie de resultados especı́ficos para los operadores normales.

Teorema: los autovectores de un operador normal forman un sistema ortonormal.


Demostración: dentro de cada autoespacio, cualquier combinación lineal es autovector por definición. Por tanto,
si la dimensión del autoespacio E es mayor que uno (existe degeneración del autovalor ), siempre se puede
aplicar el procedimiento de ortonormalización de Gram–Schmidt para obtener un sistema ortonormal dentro
de E . Solo resta pues probar que los autovectores en autoespacios distintos (esto es, asociados a autovalores
diferentes) son mutuamente ortogonales. Sean pues dos autovectores asociados a autovalores , µ diferentes:
A |vi = |vi , A |wi = µ |wi ) A† |wi = µ⇤ |wi ,
donde la última implicación se sigue de un lema previo. Entonces,
|vi autovec. def.A† ⌦ ↵⇤ |wi autovec. ⇤
hw |v i = hw |A| vi = v A† w = (µ⇤ hv |w i) = µ hw |v i
6=µ
) ( µ) hw |v i = 0 ) hw |v i = 0 ) |vi ? |wi ,
puesto que |vi , |wi son no nulos por definición de autovector. Por tanto, los autoespacios asociados a los auto-
valores diferentes son ortogonales: E ? Eµ si = 6 µ.

Ejemplo: resolvamos el problema de autovalores para el operador A = id/dx restringido al subespacio vectorial
S = f (x) 2 C 1 [ 1, +1] y f ( 1) = f (+1) ⇢ L2 ( 1, +1).
El problema de autovalores se transforma en un problema de condiciones de contorno:
8
8 9 > dv
>
> i = v(x),
< A |vi = |vi = < dx
AS |vi = |vi , ,
: ; >
> v( 1) = v(1),
|vi 2 S >
:
v(x) sol. clásica en 1  x  1.
La condición de contorno que se impone se denomina periódica. Antes de resolver el problema, es útil anticipar
propiedades del resultado a partir de las caracterı́sticas del operador AS . Se trata de un operador hermı́tico:
continua
✓ Z ◆⇤ Z z }| {
D E +1
df (x) +1
df ⇤ (x)

f A†S g = hg |AS | f i = i dx g ⇤ (x) =i dx g(x)
1 dx 1 dx
0 pues f,g2S
✓ ◆ z }| { Z +1 Z +1 ✓ ◆
integrando +1 dg(x) d
= [ig(x)f (x)] 1 i dx f ⇤ (x) = dx f ⇤ (x) i g(x)
por partes
1 dx 1 dx

d
= f i g = hf |AS | gi ,
dx
8 |f i , |gi 2 S ) A†S = AS .
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 21

Por tanto, podemos concluir que los autovalores serán reales y los autovectores formarán un sistema ortonormal.
Podemos intentar obtener más información a partir de la forma especı́fica del cociente de Rayleigh para este
ejemplo: si |vi 2 S es un autovector normalizado (esto es, kvk = 1), se tiene
Z +1
v2S dv(x)
= R[v] = hv |AS | vi = hv |A| vi = i dx v ⇤ (x) .
1 dx

Si la función v(x) fuese real (v ⇤ = v) o imaginaria pura (v ⇤ = v), se tendrı́a


Z +1 Z +1 ✓ ◆
dv(x) d v2 1 2 v2S
| |= dx v(x) = dx = v (1) v 2 ( 1) = 0.
1 dx 1 dx 2 2

Por tanto, las autofunciones serán complejas (con parte real e imaginaria simultáneamente no nulas), excepto
la asociada al posible autovalor = 0. Para obtener las autofunciones se procede a resolver el problema de
condiciones de contorno:
Solución (clásica) general de la ecuación: v(x) = ↵ei x .
⇥ ⇤ !
Condición de contorno de periodicidad: v(1) v( 1) = ↵ ei e i
= 0.
Autovalores: para tener solución no trivial debe ser ↵ 6= 0. Como debe ser real, se puede escribir la
condición como
sen = 0 ) = n⇡, n = 0, ±1, ±2 . . .

La correspondiente autofunción será pues


Z 1 Z 1
2
vn (x) = ↵ein⇡x ) kvn k = dx |vn (x)|2 = |↵|2 dx = 2|↵|2
1 1
p
y se obtiene una autofunción normalizada eligiendo ↵ = 1/ 2.
En resumen, la solución del problema es
ein⇡x
n = n⇡, 'n (x) = p , En = gen {'n (x)}, n = 0, ±1, ±2, . . .
2
Todos los autovalores son simples, pues los autoespacios En tienen dimensión uno. Y resulta que los autovectores
además forman una base (la trigonométrica) del espacio L2 ( 1, 1).

Teorema espectral: si el operador lineal A es normal y compacto, entonces sus autovectores forman una base
ortonormal del espacio de Hilbert H.
Comentarios:
Este teorema generaliza el concepto de diagonalización de matrices: en un espacio de dimensión finita, los
autovectores de una matriz normal forman una base, de manera que la matriz se puede diagonalizar al
expresarla en esta base. Como en el caso de las matrices, el teorema solo proporciona condiciones suficientes,
es decir, pueden existir operadores no compactos cuyos autovectores forman una base autonormal, como
en el caso del ejemplo previo.
La demostración del teorema no es sencilla y la obviamos. Sea {|'1 i , |'2 i , . . . } el conjunto de autovectores
del operador:
A |'n i = n |'n i , n = 1, 2, . . .
(para simplificar la notación no se introduce un ı́ndice de degeneración, de forma que los autovalores n
pueden ser iguales para distintos valores del ı́ndice n si existe degeneración). El conjunto se puede suponer
ortonormalizado, h'j |'k i = jk , en virtud del teorema anterior para operadores normales. Entonces, la
condición de que es una base se puede expresar de varias maneras equivalentes:
22 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

1
X
1. Cualquier vector |f i 2 H se expresa como una serie de Fourier en autovectores, |f i = |'k i h'k |f i.
k=1
1
X
2. Relación de cierre: Pk = I, Pk = |'k i h'k |.
k=1
3. Descomposición espectral: el operador A está representado por una matriz diagonal en esta base,
1
X 1
X
A= k |'k i h'k | = k Pk .
k=1 k=1

El desarrollo de Fourier generalizado en esta base se denomina desarrollo en autofunciones. En la siguiente


sección veremos un ejemplo de aplicación del teorema que explica la gran relevancia para la Fı́sica Ma-
temática: aunque los operadores diferenciales que aparecen en las ecuaciones diferenciales no son compactos,
sus inversos sı́ suelen ser operadores normales y compactos, de manera que sus autovectores formarán una
base.

Teorema: sea un operador lineal A definido en un subespacio lineal S de un espacio de Hilbert H y supongamos
que existe una base ortonormal de H formada por autovectores del operador restringido AS . Si la restricción
AS es un operador normal, entonces se puede aplicar A término a término al desarrollo en autofunciones de
cualquier elemento de S, esto es, a la serie de Fourier generalizada respecto a la base de autovectores.
Demostración: sea {|'1 i , |'2 i , . . . } ⇢ S ⇢ H una base ortonormal de autovectores de AS (y, por ende, de A):

A†S |'k i =
AS normal ⇤
AS |'k i = k |'k i ) k |'k i

(para simplificar la notación no se introduce un ı́ndice de degeneración, de forma que los autovalores k pueden
ser iguales para distintos valores del ı́ndice k). Se tiene
1
X
base de H
|f i 2 S ⇢ H ) |f i = ck |'k i , ck = h'k |f i .
k=1

Como A está definido en S, se tiene


1
X
base de H
|gi := A |f i 2 H ) |gi = bk |'k i , bk = h'k |g i .
k=1

Notemos que en general |gi 62 S porque A |f i 6= AS |f i, es decir, la acción de A sobre elementos de S puede
producir componentes fuera del subespacio S. Sin embargo, se pueden evaluar los coeficientes bk como sigue:
' ,f 2S
D E⇤
bk = h'k |g i = h'k |A| f i k= h'k |AS | f i = f A†S 'k
AS normal ⇤ ⇤ ⇤
= (hf | k |'k i) = k hf |'k i = k h'k |f i = k ck .

Por tanto, se escribe


1
! 1 1 1
X X X X
A ck |'k i = A |f i = |gi = bk |'k i = ck k |'k i = ck A |'k i ,
k=1 k=1 k=1 k=1

es decir, se puede aplicar el operador A término a término al desarrollo de Fourier de |f i en autofunciones de A.


Se debe destacar que esta afirmación no se refiere al operador restringido AS ; la restricción solo se ha necesitado
al emplear que AS es normal.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 23

Ejemplo: sea el operador A = id/dx y el subespacio

S = f (x) 2 C 1 [ 1, +1] y f ( 1) = f (+1) ⇢ L2 ( 1, +1).


p
Ya se ha encontrado que la restricción es hermı́tica, AS = A†S , y que sus autofunciones, 'n (x) = ein⇡x / 2,
n = 0, ±1, ±2 . . . forman una base ortonormal de L2 ( 1, +1). Por tanto, la serie de Fourier generalizada de
cualquier función f (x) 2 S se puede derivar término a término y el resultado es igual en media a la serie de
Fourier generalizada de la derivada de f (x):
9 8 " +1 #
f (x) 2 C 1 [ 1, +1] > > > df (x) X +1
X
>
> >
> = iA[f (x)] ' iA c ' (x) ' cn (iA['n (x)])
>
> >
> n n
f ( 1) = f (+1) >
= < dx
> n= 1 n= 1
!
>
> >
> +1 +1
+1
X >
> >
> X d'n (x) X
>
> >
> ' c ' in⇡cn 'n (x)
f (x) ' cn 'n (x) >
; : n
dx
n= 1 n= 1 n= 1

Es importante destacar las restricciones sobre la función que se expresan en la definición del subespacio S, como
la condición de contorno periódica en este ejemplo. Como aplicación ilustrativa, consideremos f (x) = x2 /2 2 S,
cuya derivada primera, f 0 (x) = x, no pertenece al subespacio S:
8 p
> 2
Z +1 >
> , n = 0,
x 2 +1
X e in⇡x 2
x < 6
f (x) = ' bn 'n (x), bn = h'n |f i = dx p =
2 2 2 >
> p n
: 2 ( 1) , n 6= 0,
n= 1 1 >
(n⇡)2
8
Z > 0, n = 0,
+1
X +1
e in⇡x <
0
f (x) = x ' cn 'n (x), cn = h'n |f i = dx p x= p n
1 2 >
: i 2 ( 1) ,
n= 1 n 6= 0,
n⇡
p
f 00 (x) = 1 = 2 '0 (x).
0
La serie para f (x) se puede encontrar derivando término a término la de f (x) porque se verifican los requisitos
del teorema:
cn
+1
X +1 z }|
X {
d
bn 'n (x) = in⇡bn 'n (x) ' f 0 (x),
n= 1
dx n= 1
n6=0

pero no se puede hacer lo mismo para obtener la serie para f 00 (x):


p
( 1)n+1 2
+1
X +1
X z }| { +1
X
d
cn 'n (x) = in⇡cn 'n (x) = ( 1)n+1 ein⇡x ,
n= 1
dx n= 1 n= 1
n6=0 n6=0

y la serie no converge en media porque no se verifica el lema de Riemann–Lebesgue (en este caso, lı́mn!1 ( 1)n 6=
0). Este ejemplo muestra que, efectivamente, en general no es posible aplicar un operador término a término a
una serie de Fourier: en este caso, el operador diferencial A = id/dx no es compacto, ası́ que su aplicación
término a término se limita a un tipo particular de series, incluso si sus autofunciones forman una base.
24 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

8.3. Problema de Sturm–Liouville


En esta sección introducimos un tipo especial de problema de autovalores que, como se estudiará en el próximo
capı́tulo, aparece en muchos campos de la Fı́sica Matemática al resolver problemas de contorno de EDPs lineales
de segundo orden: ecuaciones de la hidrodinámica, de la difusión del calor, de la elasticidad, del electromagnetis-
mo, de la mecánica cuántica. El problema de Sturm–Liouville es un problema de autovalores para un operador
normal compacto, de manera que se obtiene una base ortonormal de autofunciones especialmente bien adaptada
para representar las soluciones de la ecuación de partida.

8.3.1. Condiciones de contorno


En la Fı́sica Matemática, las ecuaciones diferenciales suelen aparecer acompañadas de condiciones de contorno.
Para el caso de EDOs de segundo orden, la idea es que una solución y(x) definida en un intervalo finito, a  x  b,
debe satisfacer ciertas restricciones que involucran el valor de la función y de su derivada en los extremos del
intervalo de definición, esto es, en x = a o x = b.

Definición: las condiciones de contorno se denominan lineales si el conjunto de funciones que las verifica tiene
estructura de espacio vectorial, esto es,
9
f (x) verifica condiciones de contorno =
) ↵f (x) + g(x) verifica condiciones de contorno, 8↵, 2 C.
;
g(x) verifica condiciones de contorno

Una consecuencia particularmente relevante de esta definición es que la función nula verifica este tipo de condi-
ciones de contorno. La forma general de estas condiciones para una función y(x) es

↵0 y(a) + ↵1 y 0 (a) + 0 y(b) + 1y


0
(b) = 0, 0 y(b) + 1y
0
(b) + 0 y(a) + 1y
0
(a) = 0,

para constantes dadas ↵1 , ↵2 , 1, 2, 1, 2, 1, 2. Estas condiciones se pueden clasificar a su vez en tres grandes
grupos:

Definición: las condiciones de contorno se denominan separables si se escriben de la forma

↵0 y(a) + ↵1 y 0 (a) = 0, 0 y(b) + 1y


0
(b) = 0,

es decir, no se “mezclan” los valores en cada extremo del intervalo. En caso contrario, se denominan no separables.
La condición en cada punto a su vez se clasifica como sigue:

Condición de contorno de Dirichlet o de primera clase si no aparece la derivada: por ejemplo, y(a) = 0.

Condición de contorno de Neumann o de segunda clase si no aparece el valor de la función: por ejemplo,
y 0 (a) = 0.

Condición de contorno de Robin o de tercera clase si no es de Dirichlet o de Neumann.

Definición: un caso particularmente relevante de condiciones no separables es el de las condiciones de contorno


periódicas: y(a) = y(b), y 0 (a) = y 0 (b).

Definición: la condición de contorno se dice singular o de acotación si involucra desigualdades porque alguno
de los puntos extremos es un punto singular de la EDO, por ejemplo,

y(x) regular en el punto singular x = a , y(x) finita y derivable en x = a.


c Alvaro Domı́nguez, Univ. Sevilla Tema 8 25

8.3.2. Problema regular


Consideremos la expresión general de una EDO de segundo orden lineal y homogénea:
d2 v dv
P2 (x) + P1 (x) + P0 (x)v = v.
dx2 dx
(Notemos que se podrı́a haber absorbido el término v(x) mediante una redefinición del factor P0 (x)). Sabemos
que una condición suficiente para que las soluciones v(x) de esta ecuación existan y sean continuas y derivables
hasta dos veces (solución clásica) es que los cocientes P1 (x)/P2 (x) y [P0 (x) ]/P2 (x) sean continuos. Esta EDO
se suele resolver acompañada de condiciones de contorno lineales y homogéneas, como las que hemos considerado
más arriba. Entonces, el problema completo se puede escribir en notación de análisis funcional como
8
9 > d2 d
>
> J := P 2 (x) + P1 (x) + P0 (x),
J |vi = |vi = < dx2 dx
con ⇢
; >
>
|vi 2 S : S := v(x) 2 C 2 [a, b] + cond. contorno
> ,
lineales
es decir, un problema de autovalores en el subespacio vectorial S. Esta reformulación motiva las siguientes
definiciones:

Definición: el operador diferencial de segundo orden


d2 d
J = P2 (x) + P1 (x) + P0 (x),
dx2 dx
se denomina operador de Sturm-Liouville regular en el intervalo [a, b] cuando se cumplen las siguientes condicio-
nes:
El intervalo [a, b] es finito.
Las funciones P2 (x), P1 (x) y P0 (x) son reales y continuas en ese intervalo.
La función P2 (x) no se anula en el intervalo; sin pérdida de generalidad se puede escoger P2 (x) > 0.
Comentarios:
La principal razón de estas condiciones es que todos los puntos de la EDO J |f i = |f i) son regulares.
Entonces, sabemos que la EDO verificará dos condiciones: (i) posee soluciones clásicas (dos veces derivables
en este caso) que existen en todo el intervalo [a, b] (y que además se pueden escoger reales si también es
real), y (ii) cualquier problema de condiciones iniciales estarı́a bien planteado: por cada punto del plano
pasa una, y solo una curva solución con una pendiente dada.
Es importante destacar que la condición de regularidad depende crı́ticamente del intervalo [a, b]: la misma
forma del operador pero en un intervalo diferente puede dejar de ser regular.
Hay una forma muy útil y equivalente de expresar el operador J . Para ello se definen las siguientes
funciones:
Z
P1 (x) p(x) P0 (x)
p(x) := exp dx , w(x) := , q(x) := w(x)P0 (x) = p(x),
P2 (x) P2 (x) P2 (x)
que están definidas y son reales y continuas. Además, p(x) y w(x) son estrictamente positivas debido a la
elección P2 (x) > 0. Entonces se puede reescribir el operador J en la denominada forma autoadjunta:
p(x) dp/dx q(x)
z }| { d2 z }| { d z }| {
w(x)J = w(x)P2 (x) 2 + w(x)P1 (x) + w(x)P0 (x)
 dx dx ⇢ 
d d 1 d d
= p(x) + q(x) ) J = p(x) + q(x) .
dx dx w(x) dx dx
26 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Definición: si J es un operador de Sturm–Liouville regular en [a, b], se denomina problema de Sturm–Liouville


regular al problema de autovalores

condiciones de contorno
J |vi = |vi , |vi 2 S = v(x) 2 C 2 [a, b] + , [a, b] finito.
lineales, reales, separables

Comentarios:

Es importante destacar que un problema de Sturm–Liouville regular no solo implica condiciones sobre la
forma del operador, sino también sobre el tipo de condiciones de contorno, las cuales definen el subespacio
S al que se restringe el operador. En particular, las condiciones deben ser lineales y homogéneas para
garantizar que S tiene estructura de espacio vectorial.

En forma analı́tica, el problema de Sturm–Liouville regular es el siguiente problema de contorno:


8 0
9
> ↵0 v(a) + ↵1 v0 (a) = 0 >
>
> >
>
⇢ ✓ ◆ >
< 0 v(b) + 1 v (b) = 0 > =
1 d dv
p(x) + q(x)v(x) = v(x), ↵ 0 , ↵1 , 0 , 1 2 R , 1 < a  x  b < 1.
w(x) dx dx >
> >
>
>
> >
>
: ;
v(x) solución clásica

Ejemplo: problema de autovalores del operador J = d2 /dx2 restringido al subespacio

S = {f (x) | f (x) 2 C 2 [ 1, 1] y f ( 1) = 0, f (1) = 0}.

Es decir,

J |vi = |vi d2 v v(±1) = 0
, = v, , 1  x  1.
|vi 2 S dx2 v(x) solución clásica

El operador J es de Sturm–Liouville regular porque (i) las funciones P0 (x) = P1 (x) = 0, P2 = 1 son reales
y continuas y P2 (x) no se anula, y (ii) el intervalo donde se busca la solución, x 2 [ 1, 1], es finito. Además,
las condiciones de contorno en x = ±1 son de Dirichlet (y por tanto, lineales, homogéneas y separables) y
además reales. En conclusión, se trata de un problema de Sturm–Liouville regular.

Lema: el operador de Sturm–Liouville regular restringido al subespacio vectorial S es hermı́tico respecto al


producto escalar del espacio L2w (a, b), donde el peso w(x) es la correspondiente función que aparece en la forma
autoadjunta del operador.

Demostración: tomando un par de elementos |f i , |gi del espacio S y expresando J en la forma autoadjunta,
Z b !⇤ Z  ✓ ◆
D E b
d df ⇤
† ⇤ ⇤
f JS g = hg |JS | f i = dx w(x)g (x)J[f ] = dx g(x) p(x) + q(x)f ⇤ (x) =
a a dx dx
✓ ◆  b Z b 
integrando df ⇤ dg df ⇤
= p(x)g(x) + dx p(x) + q(x)g(x)f ⇤ (x)
por partes dx a a dx dx
✓ ◆  b Z b  ✓ ◆
integrando df ⇤ ⇤ dg ⇤ d dg
= p(x)g(x) p(x)f (x) + dx f (x) p(x) + q(x)g(x)
por partes dx dx a a dx dx
= (x = b) (x = a) + hf |JS | gi ,

donde se ha definido el término debido a las condiciones de contorno



df ⇤ dg
(x) := p(x) g(x) f ⇤ (x) .
dx dx
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 27

Se puede comprobar que (a) = (b) = 0 si f (x), g(x) 2 S. En efecto, en x = a se verifica

dv ↵0 ,↵1 2R dv ⇤
v2S ) ↵0 v(a) + ↵1 (a) = 0 ) ↵0 v ⇤ (a) + ↵1 (a) = 0.
dx dx
Si ↵1 = 0, se tiene una condición de contorno de Dirichlet, f ⇤ (a) = g(a) = 0 y resulta inmediatamente
(a) = 0 pues f 0 (a), g 0 (a) son finitos. Si ↵1 6= 0 se tiene
 
df ⇤ ⇤ dg ↵0 ↵0 ⇤
(a) = p(a) g(a) (a) f (a) (a) = p(a) g(a)f ⇤ (a) + f (a)g(a) = 0.
dx dx ↵1 ↵1

El mismo razonamiento se aplica para (b). Por tanto JS† = JS . (Notemos que estas no son las condiciones
de contorno más generales que aseguran que JS es hermı́tico, veremos más ejemplos después ).

Retomemos el ejemplo anterior: para el operador J = d2 /dx2 ,


Z
1 P1 (x)
P2 (x) = 1, P1 (x) = 0 ) w(x) = exp dx = 1,
P2 (x) P2 (x)

ası́ que el operador restringido JS será hermı́tico en el espacio de Hilbert L2 ( 1, 1), con la función peso
w(x) = 1. En efecto, para cualquier par de elementos |f i , |gi 2 S, se tiene
D E ✓Z +1 ◆⇤ Z +1
⇤ d2 f (x) d2 f ⇤ (x)
f JS† g = hg |JS | f i = ⇤
dx g (x) = dx g(x)
1 dx2 1 dx2
0 porque g(±1)=0, f 0 finito
z }| {
✓ ◆  +1 Z +1
integrando df ⇤ (x) dg(x) df ⇤ (x)
= g(x) dx
por partes dx 1 1 dx dx
0 porque f (±1)=0, g 0 finito
z }| {
✓ ◆  +1 Z +1
integrando dg(x) ⇤ d2 g(x) ⇤
= f (x) + dx f (x)
por partes dx 1 1 dx2
= hf |JS | gi ,
8 |f i , |gi 2 S ) JS† = JS .

El resultado fundamental y más relevante para las aplicaciones fı́sicas se recoge en el siguiente

teorema: sea el problema de Sturm–Liouville regular



condiciones de contorno
J |vi = |vi , |vi 2 S = v(x) 2 C 2 [a, b] + , [a, b] finito,
lineales, reales, separables

o de manera equivalente,
8 9
>
> ↵0 v(a) + ↵1 v 0 (a) = 0 >
>
 >
> >
>
d dv < 0 v(b) + 1 v 0 (b) = 0 =
p(x) + q(x)v(x) = w(x)v(x), ↵ 0 , ↵1 , 0 , 1 2 R , 1 < a  x  b < 1.
dx dx >
> >
>
>
> >
>
: ;
v(x) solución clásica
28 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Entonces se verifican los siguientes resultados:

1. Todos los autovalores son reales y simples.

2. El conjunto de autovalores es numerable (espectro discreto) y forma una sucesión infinita monótonamente
decreciente acotada superior pero no inferiormente.

3. Las autofunciones forman una base ortonormal del espacio L2w (a, b), es decir, el subespacio S es denso en
el espacio de Hilbert L2w (a, b). Además, las autofunciones se pueden escoger reales.

4. El desarrollo de Fourier de cualquier elemento del subespacio S en esta base converge puntualmente.

5. La autofunción 'n+1 (x) posee exactamente un cero más que la autofunción 'n (x) en el interior del intervalo.

Comentarios:

Sea { 0 , 1 , 2 . . . } el conjunto numerable (esto es, formado por elementos discretos) de autovalores, y
{'0 (x), '1 (x), '2 (x) . . . } el correspondiente conjunto de autofunciones: J |'n i = n |'n i. Entonces el teo-
rema establece lo siguiente:

En = autoespacio asociado a n 2R: dim En = 1 ) autovalor no degenerado.

1> 0 > 1 > 2 > ... lı́m n = 1.


n!1
Z b
'⇤n (x) = 'n (x), h'j |'k iw = dx w(x)'j (x)'k (x) = j,k .
a

1
X 1
X Z b
8 |f i 2 L2w (a, b) : |f i = ck |'k i , f (x) ' ck 'k (x), ck = h'k |f iw = dx w(x)'k (x)f (x).
k=1 k=0 a

1
X
8f (x) 2 S : f (x) = ck 'k (x).
k=0

El último punto establece que 'n (x) es una función oscilante en el intervalo a  x  b con una frecuencia
que crece monótonamente con n. Como vimos en los ejemplos del tema anterior, cuanto menos “suave”
es una función f (x) (menos derivable, más discontinua,. . . más “irregular”), tanto más relevantes son los
términos de la serie con oscilaciones rápidas para describir estos rasgos: por tanto, cabe esperar que en el
desarrollo en serie en las autofunciones de un problema de Sturm–Liouville regular, el coeficiente cn (esto
es, el “peso” de la contribución de la autofunción 'n (x) a la serie) se anula en módulo tanto más rápido
con n cuanto más suave es la función que representan.

Veremos en el próximo tema cuán útil es la propiedad de que S sea denso para encontrar soluciones
generalizadas. En efecto, esta propiedad permite aproximar con precisión arbitraria cualquier elemento del
espacio de Hilbert (aunque sea discontinuo o no derivable, o tenga singularidades) mediante un elemento
del subespacio, que es más regular y tiene propiedades matemáticas mucho mejores:
n
X
8 |f i 2 L2w (a, b) : |f i ⇡ suma parcial |fn i = ck |'k i 2 S.
k=1

Se dice que la función f (x) se regulariza mediante la función fn (x).

Algunos de los puntos del teorema se pueden demostrar con facilidad: como el operador de un problema
de Sturm–Liouville regular es hermı́tico en el subespacio S, los autovalores serán reales y el conjunto de
autofunciones formará un sistema ortonormal en L2w (a, b).
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 29

Para demostrar que los autovalores son simples , supongamos dos autofunciones u(x) y v(x) asociadas al mismo autovalor, es
decir, que verifican la EDO para el mismo valor de . Entonces se deduce inmediatamente la relación
✓ ◆ ✓ ◆  ✓ ◆
d du d dv d dv du
v p(x) =u p(x) , p(x) u v = 0.
dx dx dx dx dx dx dx

Identificando el wronskiando de las dos soluciones, W (x) = u(x)v 0 (x) u0 (x)v(x), e integrando la relación entre x = a y un
x < b arbitrario, se deduce la denominada fórmula de Abel,

p(x)W (x) p(a)W (a) = 0.

Sin embargo, el hecho de que las dos soluciones verifiquen las condiciones de contorno implica que el wronskiano se anula en
x = a:
↵0 u(a) + ↵1 u0 (a) = 0
) W (a) = 0.
↵0 v(a) + ↵1 v 0 (a) = 0
Por lo tanto, puesto que la función peso p(x) nunca se anula, la fórmula de Abel implica W (x) = 0 en todo el intervalo
a  x  b. En conclusión, las dos funciones u(x) y v(x) deben ser linealmente dependientes, ası́ que el autoespacio asociado
al autovalor debe tener dimensión unidad.

La demostración de los otros puntos es más compleja y obviamos los detalles; tan solo algunas indicaciones:
las propiedades sobre los ceros de las autofunciones se deducen de una serie de resultados (teoremas de
oscilación) válidos para EDOs genéricas de segundo orden. La idea para demostrar que las autofunciones
forman una base se basa en reformular la ecuación diferencial como una ecuación integral empleando el
operador inverso (construı́do a partir de la función de Green), el cual resulta ser hermı́tico y compacto
y que por ello verifica el teorema espectral . Veremos un ejemplo para ilustrar esta propiedad, pero de
manera general y algo más precisa se puede razonar como sigue: en la base de autovectores, el operador
restringido J y su inverso J 1 vendrı́an descritos formalmente por las matrices
1
X 1
X
1 1
J= k |'k i h'k | , J = |'k i h'k | .
k
k=0 k=0

(El inverso de una matriz diagonal es formalmente la matriz diagonal formada con los inversos de la
diagonal.) Sin embargo, esta representación no es válida para J pero sı́ para J 1 porque el operador es
compacto: mientras que la sucesión de los autovalores k crece monótonamente en módulo, la sucesión de
los inversos k 1 tiende a cero. Ası́, para un par de elementos del espacio, el correspondiente elemento de
matriz se escribirı́a formalmente como

b⇤
k ck
1
X z }| { z }| { X 1
⌦ ↵ 1 ⇤
X b ck

|f i , |gi 2 L2w (a, b) : hg |J| f i = k hg |'k i h'k |f i = k bk c k , g J 1
f = k
.
k
k=0 k=0 k=0

Entonces, aunque los coeficientes del desarrollo en serie de Fourier verifiquen |bk |, |ck | ! 0 cuando k ! 1
(lema de Riemann–Lebesgue), la serie para el elemento de J puede no converger (ya vimos un teorema
que estipula condiciones suficientes para aplicar J término a término),
P pero la serie para el elemento de
J 1 sı́ lo hará siempre (notemos que el producto escalar hg |f i = k b⇤k ck siempre está definido para los
elementos del espacio).

Debido a la monotonicidad de la sucesión de autovalores, el cociente de Rayleigh aplicado a elementos del


subespacio S está acotado por el mayor autovalor. En efecto, cualquier elemento del subespacio S se puede
escribir como una combinación lineal de autofunciones:
1
X
8 |f i 2 S : |f i = ck |'k i , ck = h'k |f i .
k=0

Como se puede aplicar el operador J término a término a esta serie (en virtud de uno de los teoremas
30 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

enunciados en la sección anterior), resulta


convergente porque
J|f i2L2w (a,b)
! ! z }| !{
1
X 1
X 1
X
f 2S
hf |J| f i = hf | J ck |'k i = hf | ck J |'k i = hf | ck k |'k i
k=0 k=0 k=0
1
X 1
X 1
X
2 2
= ck k hf |'k i = k |ck |  0 |ck |2 = 0 kf k
| {z }
k=0 k=0 k=0
c⇤
k

hf |J| f i
) 2  0 si |f i 2 S.
R[f ] =
kf k
Este resultado es muy práctico a la hora de buscar aproximaciones al autovalor fundamental 0 en aque-
llas situaciones en que no es posible encontrar las autofunciones de manera analı́tica: se evalúa R[f ] con
propuestas f (x) 2 S, y se elige aquella propuesta que conduce al máximo valor de R[f ] y, por tanto, lo
más cercano posible al verdadero autovalor 0 . Es importante enfatizar que la cota se refiere al valor del
cociente evaluado en el subespacio S: si la función no pertenece al mismo, R[f ] puede ser mayor que 0 ;
la razón de que el resultado no sea válido en este caso es que los pasos dados en la demostración no están
justificados.
Ejemplo: ya se comprobó que el siguiente problema de autovalores
9
J |vi = |vi = ⇢
d2 v v(±1) = 0
|vi 2 S , = v, , 1  x  1,
; dx2 v(x) sol. clásica
S = {f (x) 2 C 2 [ 1, 1] y f (±1) = 0}

es de Sturm–Liouville regular en el espacio de Hilbert L2 ( 1, 1), y por tanto se le aplica el teorema anterior.
Busquemos la base de autofunciones. Primero podemos emplear el criterio de Rayleigh especı́fico para este
problema con el objetivo de intentar restringir aún más los posibles autovalores: si v̂(x) es una autofunción
normalizada (kv̂k = 1) asociado al autovalor , entonces
0 finito 0 finito
Z Z
hv̂ |J| v̂i +1
⇤d2 v̂(x) z ⇤}| { z 0}| { z ⇤ }| { z 0 }| { +1
dv̂ ⇤ (x) dv̂(x)
= R[v̂] = 2 = dx v̂ (x) = v̂ (1) v̂ (1) v̂ ( 1) v̂ ( 1) dx
kv̂k 1 dx2 | {z } 1 dx dx
0
Z +1 2
dv̂(x)
= dx  0.
1 dx
Es decir, los autovalores no solo son reales, sino también no positivos. Más aún, podemos excluir el autovalor
nulo: ya que dv̂/dx es continua por hipótesis (pues v̂ 2 C 2 [ 1, 1]), la única posibilidad para que la integral se
anule es que dv̂/dx = 0 ) v̂ = C constante, y las condiciones de contorno imponen C = 0. Por tanto, en lo
sucesivo bastará con considerar < 0, de manera que la solución general de la EDO se puede escribir como (el
teorema garantiza que se pueden escoger reales)
p
v(x) = ↵ cos µx + sen µx, µ= > 0, ↵, constantes de integración.
Las condiciones de contorno conducen a un sistema lineal y homogéneo para las constantes de integración:
) ✓ ◆✓ ◆
!
v(1) = ↵ cos µ + sen µ = 0 cos µ sen µ ↵
!
, = 0.
v( 1) = ↵ cos µ sen µ = 0 cos µ sen µ

Los autovalores se determinan con la condición de que existan soluciones no nulas, es decir, ↵ y no simultánea-
mente nulas, lo cual impone la restricción de que la matriz del sistema sea singular (determinante nulo):
cos µ sen µ ! n⇡
= 2 cos µ sen µ = sen 2µ = 0 ) µ= , n = 0, ±1, ±2, . . .
cos µ sen µ 2
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 31

g
0.1
x0
x
-1.0 -0.5 0.5 1.0
1
-0.1

0.5 -0.2
n=1
n=2
-0.3
-1 -0.5 0.5 1
x n=3
n=4 -0.4
-0.5
-0.5

-1
-0.6

Figura 8.1: Problema de Sturm–Liouville v 00 = v, v(±1) = 0. (Izquierda) Las primeras autofunciones normali-
zadas. (Derecha) Función de Green para el problema de Sturm–Liouville.

Podemos excluir el caso n = 0 de autovalor nulo, ası́ como los valores negativos del ı́ndice, pues conducen al
mismo autovalor = µ2 . Ası́ pues, basta considerar n = 1, 2, . . . . Las soluciones del sistema de ecuaciones son
por tanto de dos tipos:
Si n es par, el parámetro µ es un múltiplo entero de ⇡ y por tanto sen µ = 0, cos µ 6= 0, resultando ↵ = 0.
Ası́ que las autofunciones son de la forma
n⇡x
v(x) = sen ,
2
y la constante se elige para que esté normalizada:
Z +1 Z
2 2 2 n⇡x | |2 +1 n6=0 !
kvk = | | dx sen = dx (1 cos n⇡x) = | |2 = 1 ) = 1 por ejemplo.
1 2 2 1

Si n es impar, el parámetro µ es un múltiplo semientero de ⇡ y por tanto cos µ = 0, sen µ 6= 0, resultando


= 0. Por tanto, las autofunciones asociadas son de la forma
n⇡x
v(x) = ↵ cos ,
2
y la constante ↵ se elige para que esté normalizada:
Z +1 Z
2 n⇡x |↵|2 +1 n6=0 !
kvk = |↵|2 dx cos2 = dx [1 + cos n⇡x] = |↵|2 = 1 ) ↵ = 1 por ejemplo.
1 2 2 1

En conclusión, la solución de este problema de Sturm–Liouville es


8 n⇡x
>
⇣ n⇡ ⌘2 < cos 2 ,
> n impar,
n = 1, 2, . . . : n = , 'n (x) =
2 >
: sen n⇡x ,
>
n par.
2
Cada autovalor es efectivamente simple. Y según el teorema para Sturm–Liouville regular, el conjunto de au-
tofunciones {'1 (x), '2 (x), . . . } forma una base ortonormal del espacio L2 ( 1, 1). Notemos que, a pesar de la
similitud, esta base es diferente de la trigonométrica (por ejemplo, no aparece la función '(x) = constante, y no
todas las autofunciones 'n (x) son periódicas). Podemos emplear este ejemplo para ilustrar otros aspectos:
Operador inverso: como = 0 no es un autovalor, existirá el inverso del operador J cuando actúa sobre
funciones del subespacio S, esto es, cuando el dominio del operador es S. Para calcularlo se busca la función
de Green del problema:
d2 g x0
= (x x0 ), gx0 (±1) = 0, 1 < x, x0 < +1.
dx2
32 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

La solución general de la EDO se puede calcular con el método de variación de constantes,


Z x ⇢
0, x < x0
gx0 (x) = ↵x + + dz (z x0 )(x z) = ↵x + + = ↵x + + (x x0 )H(x x0 ),
1 x x 0 , x 0 <x

mientras que las constantes de integración ↵, se determinan mediante las condiciones de contorno:
! ! x0 1
gx0 ( 1) = 0 ) = ↵, gx0 (+1) = 0 ) ↵ = .
2
Por lo tanto3 ,
'(1/2) signo (x x0 )
z {}|
(x0 1)(x + 1) x0 x 1 1
gx0 (x) = g(x, x0 ) = + (x x0 )H(x x0 ) = + (x x0 ) H(x x0 )
2 2 2
8
>
> (x0 1)(x + 1)
>
< , x < x0 ,
x0 x 1 x x0 x0 x 1 + |x x0 | 2
= + signo (x x0 ) = =
2 2 2 >
>
: (x0 + 1)(x 1) , x0 < x.
>
2
Es decir, la función de Green del problema es simétrica (o invariante) bajo la transformación x $ x0 :
g(x, x0 ) = g(x0 , x), y por ello se ha introducido la notación g(x, x0 ) (como veremos, esta simetrı́a refleja
que el operador inverso es hermı́tico). La gráfica de la función g(x, x0 ) en el intervalo 1  x  +1 es
continua y consiste en dos segmentos de recta que se cortan en el punto (x = x0 , g = (x20 1)/2 < 0) y que
pasan, respectivamente, por los puntos (x = 1, g = 0) y (x = +1, g = 0). La ecuación
Z +1 9 8 2 Z +1
>
> >
> d f
J |f i = |bi = dz b(z) |zi = < = b(x) = dz b(z) (x z)
1 , dx2 1
>
> >
>
; :
|f i 2 S f (±1) = 0, f (x) 2 C 2 [ 1, 1]
se puede resolver mediante el principio de superposición como
Z +1 Z +1
|f i = J 1 |bi , f (x) = dz g(x, z) b(z) = dz g(z, x) b(z),
1 1
| {z }
J 1

1
lo cual permite identificar como un operador integral con núcleo g(x, z). El operador J tiene mejores
propiedades matemáticas que J :
1. El inverso tiene la estructura de un operador de Hilbert–Schmidt (intervalo de integración finito,
núcleo continuo), y por tanto J 1 es compacto. Esto implica entre otras cosas que, al contrario que
J, la acción de J 1 está definida sobre cualquier elemento del espacio de Hilbert L2 ( 1, 1).
2. En efecto, cuando g(x, z) se ve como una función de x o de z, es un elemento del espacio de Hilbert
por ser continua en un intervalo finito:
Z +1 Z +1
dx |g(x, z)|2 = dz |g(x, z)|2 < 1.
1 1
1
Por tanto, la acción del operador J sobre cualquier elemento del espacio de Hilbert tiene la estruc-
tura de un producto escalar, que siempre está definido:
2L2 ( 1,+1)
Z +1 Z +1 z }| {
g2R
8 |bi 2 L2 ( 1, 1) : J 1
[b] = dz g(z, x) b(z) = dz g ⇤ (z, x) b(z) = hgx |b i < 1.
1 1

3 Notemosel uso del signo ' debido a la discontinuidad de la distribución de Heaviside en x = x0 . Esto, sin embargo, no es
relevante puesto que el factor x x0 elimina la indeterminación.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 33

3. El operador J 1 es hermı́tico y, por tanto, normal en todo el espacio de Hilbert (al contrario que J,
que solo es hermı́tico cuando se restringe al subespacio S):
✓Z +1 ◆⇤ ✓Z +1 Z +1 ◆⇤
⌦ 1 †
↵ ⌦ 1
↵⇤ ⇤ 1 ⇤
b (J ) f = f J b = dx f (x)J [b] = dx f (x) dz g(z, x) b(z)
1 1 1
g(x,z)
Z +1 Z +1 Z +1 Z +1 z }| {
g2R ⇤ ⇤
= dx f (x) dz g(z, x) b (z) = dz b (z) dx g(z, x) f (x)
1 1 1 1
| {z }
J 1 [f ]

Z +1 ⌦ ↵
= dz b⇤ (z)J 1
[f ] = b J 1
f
1
2 1 † 1
8 |f i , |bi 2 L ( 1, 1) ) (J ) =J .

(Notemos la relevancia en la demostración de la propiedad de simetrı́a g(x, z) = g(z, x), la cual ha


permitido escribir la acción de J 1 de dos formas equivalentes).
4. Los autovectores de J 1 son los mismos que los del operador restringido JS . En efecto, tenemos el
problema de autovalores
8 Z +1
>
> ⌫u(x) = J 1
[u] = dz g(z, x) u(z)
>
>
>
> 1
9 >
>
>
>
J 1 |ui = ⌫ |ui = < Z Z
x 1 x x + 1 +1
, = dz (z + 1)u(z) + dz (z 1)u(z),
; >
> 2 2
|ui 2 L2 ( 1, +1) >
>
1 x
>
>
>
> Z +1
>
>
: dx |u(x)|2 < 1.
–1

(Notemos que, como buscamos todos los autovectores de J 1 , debemos permitir que u(x) sea cualquier
elemento del dominio del operador, que en este caso es el espacio de Hilbert completo). Se trata de
una ecuación integral para la función u(x). Como se ha demostrado, J 1 [u] siempre es finito para
cualquier elemento u 2 L2 ( 1, +1): por lo tanto, la ecuación de autovalores implica que la función
u(x) es finita en todo el intervalo 1  x  +1. Entonces es evidente que se verifican los siguientes
resultados:
Z Z x 9
1 +1 >
0
⌫u (x) = dz (z 1)u(z) + dz u(z) ) u finita, continua >
0 >
>
>
2 1 1 >
>
>
>
=
00 00
⌫u (x) = u(x) ) u finita, continua ) u(x) 2 S.
) ⌫ 6= 0 (si no, u(x) ⌘ 0) >
>
>
>
>
>
>
>
⌫6=0 >
;
⌫u(±1) = 0 ) u(±1) = 0

Es decir, para buscar las autofunciones de J 1 basta con restringirse al subespacio S. Pero entonces,
resulta que son las mismas que las del operador restringido JS :
9 8
J 1 |ui = ⌫ |ui = < |ui = |'n i ,
1
) |ui = JS (J 1 |ui) = ⌫JS |ui ) JS |ui = |ui ,
; ⌫ :
|ui 2 S ⌫ = n 1.

En conclusión, como J 1 es un operador normal y compacto, verifica el teorema espectral y se puede


construir una base ortonormal del espacio de Hilbert L2 ( 1, 1) con sus autovectores, los cuales a su vez
son los mismos que los del operador restringido JS .
34 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Estimación de 1 mediante Rayleigh: supongamos que no se hubiese podido resolver el problema de au-
tovalores analı́ticamente. Podrı́amos sin embargo intentar obtener una cota al menor autovalor usando el
cociente de Rayleigh: puesto que

hf |J| f i
R[f ] = 2  1 si |f i 2 S,
kf k

proponemos funciones de prueba f (x) 2 S dependientes de algunos parámetros y determinamos estos


últimos con la condición de que R[f ] sea máximo. Como el número de ceros crece con el valor absoluto del
autovalor, elegimos funciones que no tienen ceros dentro del intervalo y que son pares4 :

f (x; ↵) = (1 x2 )(1 + ↵x2 ) 2 S, ↵ 2 R.

Para estas funciones,


Z +1 Z +1
2 16(21 + 6↵ + ↵2 ) d2 f 8(35 + 14↵ + 11↵2 )
kf k = dx |f (x)|2 = , hf |J| f i = dx f (x) = ,
1 315 1 dx2 105

hf |J| f i 3(35 + 14↵ + 11↵2 )


R[f ] = 2 = .
kf k 2(21 + 6↵ + ↵2 )
El máximo de esta función del parámetro real ↵ se encuentra en
p
4 133 49
↵m = ⇡ 00 2208,
13
y se obtiene una estimación para el autovalor como
p
1 ⇡ R[f ](↵ = ↵m ) = 133 14.

El error respecto al valor exacto, 1 = (⇡/2)2 , es de solo 00 0015 %. Se puede evaluar también el error en
media de la aproximación5 f (x; ↵ = ↵m ) a la autofunción exacta '1 (x):
v " p #2
uZ
f (x, ↵m ) u +1 3 35(1 x2 )(1 + ↵m x2 ) ⇡x
'1 (x) = t dx p cos = 80 3 ⇥ 10 4 ,
kf (x, ↵m )k 1 4 21 + 6↵m + ↵m 2 2

el cual se debe contrastar con el “tamaño caracterı́stico” k'1 k = 1 de las autofunciones.


Otra estimación de 1 : La cota sobre los autovalores basada en el cociente de Rayleigh requiere funciones
de prueba que pertenezcan al subespacio S; por ejemplo, el cociente de Rayleigh evaluado para la función
f (x) = 1 62 S conduce a R[f ] = 0, es decir, mayor que el autovalor máximo 1 . Sin embargo, es posible
en la práctica relajar esta restricción para ampliar el campo de funciones de prueba. Como ilustración,
consideremos la siguiente familia paramétrica de funciones definidas en el intervalo 1  x  1:
8
> 1+x
>
< 1 + ↵ , x  ↵,
>
f (x; ↵) = 1 < ↵ < 1, 2 R.
>
> 1 x
>
: , ↵ < x,
1 ↵
Evidentemente f 2 L2 ( 1, +1) y, aunque la función se anula en los extremos, f (±1) = 0, y es continua,
no es derivable en el punto x = ↵ y por tanto f 62 S. Esto, sin embargo, no invalida el método porque la
derivabilidad se viola en un conjunto de medida nula (un único punto, en este caso) y por ello no afecta a
4 No es necesario considerar el caso más general f (x; ↵, ) = (1 x2 )( + ↵x2 ) pues la normalización es irrelevante, solo representa

una dilatación del vector f (x) sin “cambio de dirección”, y se puede suponer = 1.
5 Notemos que la comparación pertinente debe hacerse con la función normalizada f / kf k.
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 35

R( ) R( )

-5 -5

-10

-10

-15

-20 -15

-20 -10 10 20 -1.0 -0.5 -20 0.5 1.0

Figura 8.2: Problema de Sturm–Liouville v 00 = v, v(±1) = 0. (Izquierda) Cociente de Rayleigh para las funciones
de prueba f (x) = (1 x2 )(1 + ↵x2 ). (Derecha) Cociente de Rayleigh para las funciones de prueba f (x) =
[1 + xs(x)]/[1 + ↵s(x)], s(x) = signo (↵ x).

la evaluación de las integrales en el cociente de Rayleigh. De manera más precisa, se calcula el cociente de
Rayleigh directamente para la función f (x) considerada como una distribución, para dar sentido dentro de
la integral a las derivadas primera y segunda también en el punto x = ↵. En efecto, como distribución se
escribe
Z +1
1+x 1 x 2 2
f (x) = H(↵ x) + H(x ↵), f (↵) = 1 ) kf k = dx |f (x)|2 = ,
1+↵ 1 ↵ 1 3
de donde se encuentran las derivadas como
1 1 1+x 0 1 x 0
f 0 (x) = H(↵ x) H(x ↵) + H (↵ x) + H (x ↵)
1+↵ 1 ↵ 1+↵ 1 ↵
| {z } | {z }
(↵ x) (x ↵)

H(↵ x) H(x ↵)
= ,
1+↵ 1 ↵
(↵ x) (x ↵) 2
f 00 (x) = = 2 (x ↵).
1+↵ 1 ↵ ↵ 1
Por tanto, Z +1
hf |J| f i 1 3
dx f (x)f 00 (x)
1<↵<1
R[f ] = 2 = = 2
.
kf k 1 2/3 ↵ 1
Se podrı́a haber empleado igualmente la otra expresión para el cociente de Rayleigh que ya se obtuvo al
integrar por partes:
Z +1 Z ↵ Z +1
1 0 2 1<↵<1 1 1 1 3
R[f ] = 2 dx |f (x)| = dx 2
+ dx 2
= 2 .
kf k 1 2/3 1 (1 + ↵) ↵ (1 ↵) ↵ 1

De manera más precisa, la idea es regularizar la discontinuidad de la derivada, lo cual siempre es posible porque el subespacio
S es denso en L2 ( 1, +1), es decir, se puede aproximar la función f (x) con precisión arbitraria por otra función de S, esto
es, derivable dos veces con continuidad y que verifica las condiciones de contorno. En nuestro caso especı́fico, la aproximación
será una función 2 S tal que su valor y el de sus derivadas difieren de aquellos de f solo en un intervalo muy estrecho
alrededor del punto x = ↵,
9
|f (x) (x)| 6= 0 >
>
>
=
|f 0 (x) 0 (x)| 6= 0 solo si |x ↵| < ⌧ 1,
>
>
>
;
|f 00 (x) 00 (x)| 6= 0

Pensemos, por ejemplo, en que (x) se escriba como un polinomio de grado seis en el intervalo ↵ < x < ↵ + , de manera
que se puedan elegir sus coeficientes para que se satisfagan las seis condiciones de empalme:
f (↵ ± ) = (↵ ± ), f 0 (↵ ± ) = 0
(↵ ± ), f 00 (↵ ± ) = 00
(↵ ± ).
36 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Se evalúa entonces el cociente de Rayleigh R[ ] y se toma el lı́mite ! 0 en las expresiones finales, teniendo en cuenta que
en el lı́mite ! 0 tanto , como 0 son finitos, pero 00 diverge en x = ↵:
!0 si !0
z }| {
Z +1 Z ↵ Z ↵+ Z +1
2 2 2 2
k k = dx | (x)| = dx |f (x)| + dx | (x)| + dx |f (x)|2
1 1 | {z } ↵ | {z } ↵+ | {z }
finito en x=↵ finito 8 finito en x=↵
kf k2
z }| {
Z ↵ Z +1 Z ↵ Z +1
!0 2 2 1 1 2
! dx |f (x)| + dx |f (x)| = dx (1 + x)2 + dx (1 x)2 = ,
1 ↵ (1 + ↵)2 1 (1 ↵)2 ↵ 3
continuo, pero
0 diverge si !0 0
Z +1 Z ↵ z }| { Z ↵+ z }| { Z +1 z }| {
00
h |J| i = dx (x) (x) = dx f (x) f 00 (x) + dx (x) 00 (x) + dx f (x) f 00 (x)
1 1 ↵ ↵+
!0 si !0
z }| {
✓ ◆ Z ↵+
integrando ⇥ 0
⇤↵+
= (x) (x) ↵
dx | 0 (x)|2 = (↵ + ) 0
(↵ + ) (↵ ) 0
(↵ )
por partes ↵ | {z }
finito 8
✓ ◆
condiciones de 0
= f (↵ + )f (↵ + ) f (↵ )f 0 (↵ )
empalme

!0 ⇥ ⇤ 1 1 2
! f (↵) f 0 (↵+ ) f 0 (↵ ) = = 2 ,
1 ↵ 1+↵ ↵ 1
h |J| i !0 3
R[ ]= ! 2 .
k k2 ↵ 1

Cuando se considera esta expresión para el cociente de Rayleigh en el rango 1  ↵  +1, se alcanza el
p a una estimación 1 ⇡ 3, es decir, un error ⇡ 18 %, mientras que
valor máximo para ↵ = 0: esto conduce
la aproximación f (x; ↵ = 0)/ kf k = 3/2(1 |x|) a la autofunción '1 (x) tiene un error en media ⇡ 00 12.
En conclusión, se puede emplear el cociente de Rayleigh para estimar los autovalores con funciones con
discontinuidades (en ella o en sus derivadas), y que por ello no pertenecen al subespacio S, siempre que
estas discontinuidades se puedan interpretar en el sentido de las distribuciones y conduzcan a integrales
definidas. El razonamiento más preciso subyacente a este procedimiento es, como se ha visto, la posibilidad
de regularizar las discontinuidades mediante elementos del subespacio S.

Ejemplo: consideremos de nuevo el operador derivada segunda, J = d2 /dx2 , pero restringido al subespacio
vectorial
S = {f (x) | f (x) 2 C 2 [0, L] y f (0) = 0, f 0 (L) f (L) = 0}, con L > 1.
Ya se demostró que el operador J es de Sturm–Liouville regular, con una función peso w(x) = 1. Como las
condiciones de contorno son de Dirichlet (primera especie) en x = 0 y de Robin (tercera especie) en x = L, el
problema de autovalores para JS es un problema de Sturm–Liouville regular en el espacio de Hilbert L2 (0, L).
Resolvemos el problema de autovalores
8 9
9 > v(0) = 0 >
J |vi = |vi = >
< 0 >
=
d2 v v (L) v(L) = 0
, = v, , 0  x  L.
; dx2 >
> >
>
|vi 2 S : ;
v(x) sol. clásica
Como es un problema de Sturm–Liouville regular, los autovalores serán reales. Si v̂(x) es una autofunción
normalizada (kv̂k = 1) asociado al autovalor , entonces el criterio de Rayleigh especı́fico para este problema es
v̂(L) 0
Z L z }| { z }| { Z L Z L 2
hv̂ |J| v̂i ⇤ d2 v̂(x) ⇤ dv̂ ⇤ (x) dv̂(x) dv̂(x)
= 2 = dx v̂ (x) = v̂ (L) v̂ 0 (L) v̂ (0) v̂ 0 (0)

dx = |v̂(L)|2 dx .
kv̂k 0 dx2 0 dx dx 0 dx
En este caso no parece que se puede concluir con facilidad nada sobre el signo del autovalor, y por tanto hay
que estudiar separadamente cada caso:
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 37

5
1.4

1.2 4 1.5

1.0 1
3
0.8 0.5 n=0
n=1
0.6 2 x/L
1/2 1 n=2
0.4 n=3
-0.5
1
0.2
-1

L L -
0 1 2 3 4 5 0 2 4 6 8 10 12 14 -1.5

Figura 8.3: Problema de Sturm–Liouville v 00 = v, v(0) = 0, v 0 (L) = v(L). (Izquierda) Resolución gráfica de
la ecuación para autovalores positivos. (Centro) Resolución gráfica de la ecuación para autovalores negativos.
(Derecha) Las primeras autofunciones normalizadas.

= 0: la solución general de la EDO y las condiciones de contorno conducen a



v(0) = 0 ) ↵=0 L>1
v(x) = ↵ + x ) ) v(x) = 0 ) = 0 no es autovalor.
v 0 (L) v(L) = 0 ) (1 L) = 0

> 0: la solución general de la EDO y las condiciones de contorno conducen a


8 p
p p < !
v(0) = 0 ) ↵ + = 0 ) v(x) = 2↵ senh x ,
v(x) = ↵e x
+ e x
) hp p p i
: v 0 (L) v(L) = !
0 ) 2↵ cosh L senh L = 0,
↵6=0
p p p cosh6=0 z p p z:=L
p
) cosh L senh L =0 ) = tanh z. = tanh L )
L
La representación gráfica de esta ecuación trascendental muestra que existe un único autovalor positivo
0 < 1 porque L > 1 (no habrı́a solución de la ecuación si L < 1), que además verifica 0 ! 1 cuando
L ! +1. La correspondiente autofunción real y normalizada es
⇢  p 1/2
p ! L senh 2L 0
'0 (x) = A0 senh x 0, k'0 k = 1 ) A0 = p 1 .
2 2L 0
p
< 0: se define el parámetro real µ := y entonces la solución general de la EDO y las condiciones de
contorno llevan a la siguiente relación:

= 0 ) v(x) = ↵ sen µx,
v(0) = 0 )
v(x) = ↵ sen µx + cos µx )
v 0 (L) v(L) = 0
↵ [µ cos µL sen µL] = 0, )
↵6=0 cos6=0 z:=µL z
) µ cos µL sen µL = 0 ) µ tan µL = 0 ) = tan z.
L
(Se puede suponer cos µL 6= 0, porque si cos µL = 0, entonces debe ser sen µL 6= 0 y no se verifica la
condición). La representación gráfica de esta ecuación trascendental muestra que, aparte de la solución
= 0 excluı́da por hipótesis, existe una infinidad de soluciones 0 > n = µ2n , n = 1, 2, . . . , que forman
una sucesión monótonamente creciente y que se comporta asintóticamente como
✓ ◆2
n 1 1 ⇣ ⇡ ⌘2
n ⇠ n + .
2 L
Las correspondientes autofunciones reales y normalizadas son de la forma
⇢  p 1/2 ✓ ◆ 1/2
p ! L sen 2L n n L
1
'n (x) = An sen x n, k'n k = 1 ) An = 1 p ! .
2 2L n 2
En resumen, la solución del problema de autovalores es
p p
0 > 0 > 1 > 2 > ... '0 (x) = A0 senh x 0, 'n (x) = An sen x n, n = 1, 2, 3 . . .
2
Cada autovalor es simple y las autofunciones forman una base ortonormal del espacio L (0, L).
38 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

8.3.3. Extensiones
Se pueden relajar algunas de las condiciones que definen el problema de Sturm–Liouville regular para permitir
situaciones de interés práctico.

Teorema: se define el problema de Sturm–Liouville periódico como un problema de autovalores con condiciones
de contorno periódicas,
J |vi = |vi , |vi 2 S = {v(x) 2 C 2 [a, b] y v(a) = v(b), v 0 (a) = v 0 (b)}, [a, b] finito,
donde J es un operador de Sturm–Liouville regular cuya función p(x) en la forma autoadjunta debe además
verificar p(a) = p(b). Entonces:
1. Todos los autovalores son reales y simples o dobles.
2. El conjunto de autovalores es numerable (espectro discreto) y forma una sucesión infinita monótonamente
decreciente acotada superior pero no inferiormente.
3. Las autofunciones se pueden escoger reales y forman una base ortonormal del subespacio S.
Comentarios:
La condición p(a) = p(b) es necesaria para asegurar, como vimos en la demostración de hermiticidad, que
se anula la contribución de los contornos: en este caso para que (b) (a) = 0, aunque (a), (b) 6= 0.
Este teorema difiere del correspondiente para el problema regular en dos aspectos:
1. Los autovalores pueden tener degeneración doble. Esto no es problemático porque siempre es posible
elegir dos autovectores asociados al mismo autovalor pero que sean ortogonales.
2. Las autofunciones solo forman una base del subespacio S, no de todo el espacio de Hilbert L2w (a, b),
es decir, el subespacio S no es necesariamente denso. Hay que considerar cada caso especı́fico separa-
damente, pero en la práctica esto no es un problema porque, en los casos que suelen encontrarse en
las aplicaciones fı́sicas, resulta que las autofunciones sı́ constituyen una base del espacio de Hilbert.
Ejemplo: consideremos el operador derivada segunda, J = d2 /dx2 , restringido al subespacio vectorial
S = {f (x) | f (x) 2 C 2 [ ⇡, ⇡] y f ( ⇡) = f (⇡), f 0 ( ⇡) = f 0 (⇡)}.
Como sabemos, J es un operador de Sturm–Liouville regular, con la función peso w(x) = 1, que claramente
verifica la condición de periodicidad w(⇡) = w( ⇡). Por tanto, el problema de autovalores
8 9
d2 v < v( ⇡) = v(⇡) =
J |vi = |vi
, = v, v 0 ( ⇡) = v 0 (⇡) , ⇡  x  ⇡,
|vi 2 S dx2 : ;
v(x) sol. clásica
es un problema de Sturm–Liouville periódico. Los autovalores serán reales. Más aún, el cociente de Rayleigh
para una autofunción v̂(x) normalizada (kv̂k = 1) es
0
Z Z Z
d2 v̂(x) z ⇤ }| {
+⇡ +⇡ +⇡ 2
hv̂ |J| v̂i ⇤ 0 ⇤ 0 dv̂ ⇤ (x) dv̂(x) dv̂(x)
= 2 = dx v̂ (x) = v̂ (⇡)v̂ (⇡) v̂ ( ⇡)v̂ ( ⇡) dx = dx  0.
kv̂k ⇡ dx2 ⇡ dx dx ⇡ dx
Es decir, los autovalores no solo son reales, sino también no positivos.
= 0: la solución de la EDO es v(x) = ↵ + x. Luego,
v(⇡) v( ⇡) = 2 ⇡ = 0 ) = 0,
y la condición v 0 (⇡) v 0 ( ⇡) = 0 se p
cumple automáticamente. Por tanto, existe el autovalor = 0 con
autofunción normalizada '0 (x) = 1/ 2⇡. Se podrı́a haber obtenido este mismo resultado a partir del
cociente de Rayleigh: si = 0, debe cumplirse v 0 (x) = 0 porque v 0 (x) es continua pues v(x) 2 C 2 [ ⇡, +⇡].
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 39

p
< 0: se define el parámetro real µ := y la solución general de la EDO se escribe

v(x) = ↵ cos µx + sen µx.

Las condiciones de contorno conducen a un sistema lineal y homogéneo para las constantes de integración:

! !
v(⇡) v( ⇡) = 2 sen µ⇡ = 0, v 0 (⇡) v 0 ( ⇡) = 2↵ sen µ⇡ = 0.

Por tanto, para que no sean simultáneamente ↵ = = 0 y la autofunción no sea nula, se debe cumplir

! µ6=0
sen µ⇡ = 0 ) µ = n = ±1, ±2, . . . ) = µ2 = n2 ,

de manera que basta considerar valores positivos del ı́ndice n. Por tanto, todas las combinaciones lineales
de la forma
v(x) = ↵ cos nx + sen nx
son autofunciones. Se pueden escoger las autofunciones normalizadas y mutuamente ortogonales como
1 1
'n,1 (x) = p cos nx, 'n,2 (x) = p sen nx.
⇡ ⇡

(Debido a la degeneración, hay que introducir un segundo ı́ndice, además de n, para identificar cada
autofunción). De manera equivalente, se podrı́a haber escogido otras combinaciones lineales:

'n,1 (x) + i'n,2 (x) 1 'n,1 (x) i'n,2 (x) 1


'n,+ (x) = p = p einx , 'n, (x) = p =p e inx
.
2 2⇡ 2 2⇡

Comprobación de la ortonormalidad:
|'n,1 i + i |'n,2 i |'n,1 i i |'n,2 i
|'n,+ i = p , |'n, i = p .
2 2

1
k'n,+ k2 = h'n,+ |'n,+ i = (h'n,1 | i h'n,2 |) (|'n,1 i + i |'n,2 i)
2
2 3
16 7
= 4h'n,1 |'n,1 i i h'n,2 |'n,1 i +i h'n,1 |'n,2 i i2 h'n,2 |'n,2 i5 = 1,
2 | {z } | {z } | {z } | {z }
1 0 0 1
2 3
1 16 2 7
h'n,+ |'n, i = (h'n,1 | i h'n,2 |) (|'n,1 i i |'n,2 i) = 4h'n,1 |'n,1 i i h'n,2 |'n,1 i i h'n,1 |'n,2 i + i h'n,2 |'n,2 i5 = 0.
2 2 | {z } | {z } | {z } | {z }
1 0 0 1

Resumiendo, los autovalores y los correspondientes autoespacios son


8 9
8 1 9 > 1 >
> > >
> '0 (x) = p >
>
>
> ' (x) = p > > >
2⇡ > > >
0 2⇡
>
> >
> >
> >
> E0 = gen{'0 },
>
> >
> >
> >
>
n = 0, 1, 2 . . . >
< > > >
cos nx = < einx =
'n,1 (x) = p , 'n,+ (x) = p En = gen{'n,1 , 'n,2 }
>
> ⇡ >> >
> 2⇡ >
>
n = n2 , >
> >
> >
> >
>
>
> >
> >
> >
>
>
> sen nx >
> >
> >
> = gen{'n,+ , 'n, }.
: 'n,2 (x) = p ; >
> e inx >
>
⇡ : ' n, (x) = p ;
2⇡

Cada autovalor no nulo es doblemente degenerado (dim En = 2 si n 6= 0). Como se puede observar, el conjunto
de autofunciones normalizadas es la base trigonométrica o de Fourier del espacio L2 ( ⇡, +⇡) y no solo del
subespacio S.
40 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Definición: un problema de Sturm–Liouville se denomina singular cuando se verifica una o varias de las
siguientes condiciones :
1. El intervalo (a, b) es infinito o semiinfinito.
2. La función p(x) o la función peso w(x) se anulan en uno o en los dos puntos extremos.
3. La función q(x) no es continua en el intervalo [a, b].
4. Alguna de las funciones w(x), q(x), es singular en uno de los puntos extremos.
Cuando se cumpla alguna de estas condiciones, la EDO tendrá puntos singulares o el dominio de definición
no estará acotado, de manera que puede ocurrir que no todas las soluciones pertenezcan al espacio de Hilbert:
pueden tener singularidades no integrables o no decaer lo bastante rápido en el infinito. Por ello se suelen imponer
condiciones de contorno singulares o de acotación, que seleccionan un subconjunto de las soluciones. Aunque
existen teoremas generales para estos casos, su nivel supera los del curso. Habrá que analizar cada caso particular
por separado, pero baste indicar que en las aplicaciones fı́sicas es habitual que las singularidades estén asociadas
con la especificidad del sistema de coordenadas elegido y no tengan que ver con las propiedades fı́sicas del sistema
considerado.

Ejemplo: consideremos el operador


8
 < q(x) = 0,
d2 d d d
J = (1 x2 ) 2 2x = (1 x2 ) ) p(x) = 1 x2 ,
dx dx dx dx :
w(x) = 1,

restringido al subespacio vectorial S = C 2 [ 1, 1]. El correspondiente problema de autovalores,


9
J |vi = |vi = d2 v dv v(x) sol. clásica,
, (1 x2 ) 2 2x = v, 1  x  1.
; dx dx también en x = ±1,
|vi 2 S ⇢ L2 ( 1, 1)

es un problema de Sturm–Liouville singular porque la función p(x) se anula en los extremos del intervalo de
definición de las autofunciones, p(±1) = 0. Por tanto, la solución general de la EDO podrı́a tener algún tipo de
singularidad en x = ±1. Está implı́cito en la definición del subespacio S que solo se consideran aquellas soluciones
que son regulares en los puntos extremos, es decir, en realidad tenemos condiciones de contorno singulares. A
pesar de la singularidad, se comprueba que el operador restringido JS es hermı́tico en el espacio de Hilbert
L2 ( 1, 1):
D E ✓Z +1  ◆⇤ Z +1 
⇤ d df (x) d df ⇤ (x)
f JS† g = hg |J| f i = ⇤
dx g (x) (1 2
x ) = dx g(x) (1 x2 )
1 dx dx 1 dx dx
0 porque g(±1),f 0 (±1) finitos
z }| {
✓ ◆  ⇤ +1 Z +1
integrando df (x) dg(x) df ⇤ (x)
= (1 x2 )g(x) dx (1 x2 )
por partes dx 1 1 dx dx
0 porque f (±1),g 0 (±1) finitos
z }| {
✓ ◆  +1 Z +1 
integrando dg(x) d dg(x)
= (1 x2 )f ⇤ (x) + dx f ⇤ (x) (1 x2 )
por partes dx 1 1 dx dx
= hf |JS | gi ,
8 |f i , |gi 2 S ) JS† = JS .

Por tanto, los autovalores de JS serán reales y se podrá construir un sistema ortonormal en L2 ( 1, 1) con las
autofunciones. Estas últimas se encuentran resolviendo el correspondiente problema de condiciones de contorno.
Ya se abordó este problema usando el método de Frobenius: todas las soluciones de la EDO tienen una divergencia
c Alvaro Domı́nguez, Univ. Sevilla Tema 8 41

logarı́tmica en los puntos x = ±1, y por tanto no son soluciones admisibles porque no verifican la condición de
regularidad, excepto si = n(n + 1), n = 0, 1, 2 . . . , en cuyo caso la solución es un polinomio de Legendre,
v(x) = Pn (x). A pesar de ser un problema singular, encontramos que cumple las mismas propiedades que uno
regular:

Los autovalores son numerables y simples.

Los autovalores forman una sucesión infinita monótonamente decreciente acotada superior, pero no infe-
riormente.

Las autofunciones se pueden escoger reales y forman una base ortogonal de L2 ( 1, 1) (los polinomios de
Legendre no están normalizados; incidentalmente, la propiedad de hermiticidad de JS es la demostración
de que los polinomios de Legendre son mutuamente ortogonales).

La autofunción Pn (x) posee n ceros en el interior del intervalo x 2 [ 1, 1].

d2
Ejemplo: consideremos el operador J = x2 ) p(x) = w(x) = 1, q(x) = x2 , restringido al subespacio
dx2
vectorial
S = {f (x) | f (x) 2 C 2 (R) y f (x) 2 L2 (R) y f 0 (x) 2 L2 (R)} ⇢ L2 (R).
Notemos que la definición del subespacio incluye explı́citamente la pertenencia al espacio de Hilbert puesto que,
al ser el intervalo infinito, la condición de continuidad no es suficiente: aunque no existan singularidades, aún
puede ocurrir que la norma
Z +1
2 2
kf k = dx |f (x)|
1

diverja si la función no se anula suficientemente rápido en el infinito. Por tanto, la condición de contorno f 2 L2 (R)
en este caso es equivalente a exigir que f (x) se anula suficientemente rápido cuando |x| ! 1. También se ha
incluido en la definición del subespacio S la misma condición para la derivada f 0 (x): como veremos, la razón es
garantizar que el operador restringido JS es hermı́tico. Ası́ pues, el correspondiente problema de autovalores,
8 9
9 > v(x), v 0 (x) ! 0 >
J |vi = |vi = >
< >
=
d2 v 2 rápidamente si |x| ! 1
, x v = v, , 1 < x < +1.
; dx2 >
> >
>
|vi 2 S : ;
v(x) sol. clásica

es un problema de Sturm–Liouville singular porque el intervalo es infinito. Podemos comprobar que el operador
restringido JS es hermı́tico en el espacio de Hilbert L2 (R):
D E ✓Z +1  ◆⇤ Z +1 Z +1
⇤ d2 d2 f ⇤ (x)
f JS† g = hg |J| f i = dx g ⇤ (x) x2 f (x) = dx g(x) + dx f ⇤ (x) x2 g(x)
1 dx2 1 dx2 1
| {z }
hf | x2 |gi
0
0 porque g,f !0 si |x|!1
z }| {
✓ ◆  +1 Z +1
integrando df ⇤ (x) dg df ⇤ ⌦ ↵
= g(x) dx + f x2 g
por partes dx 1 1 dx dx
0
0 porque f,g !0 si |x|!1
z }| {
✓ ◆  +1 Z +1
integrando dg(x) d2 g(x) ⌦ ↵
= f ⇤ (x) + dx f ⇤ (x) + f x2 g
por partes dx 1 1 dx2
⌧ 2
d
= f x2 g = hf |JS | gi ,
dx2
8 |f i , |gi 2 S ) JS† = JS .
42 Tema 8 c Alvaro Domı́nguez, Univ. Sevilla

Por tanto, los autovalores de JS serán reales y se podrá construir un sistema ortonormal en L2 (R) con las
autofunciones. Estas últimas se encuentran resolviendo el correspondiente problema de condiciones de contorno.
Introduciendo el cambio de variable dependiente
2
u(x) := v(x)ex /2
,

se encuentra la siguiente EDO para la nueva variable u:


d2 u du
2x (1 + )u = 0.
dx2 dx
Podemos identificar aquı́ la ecuación que conduce a los polinomios de Hermite para ciertos valores de . Como
ya se encontró, las soluciones se pueden escribir como un desarrollo en serie de Taylor alrededor de x = 0, con
coeficientes que verifican una relación de recurrencia (con + 1 = 2p en la notación que se usó entonces):
1
X 2k + 1 +
u(x) = ak xk , ak+2 = ak .
(k + 2)(k + 1)
k=0
2
Los autovalores se determinan imponiendo la condición de contorno de que v(x) = u(x)e x /2 sea cuadrado
sumable, esto es, kvk < 1. Se distinguen dos casos según que la serie que define u(x) esté truncada o no:
Si + 1 = 2n, n = 0, 1, 2 . . . , entonces alguna de las series se trunca y se tienen soluciones polinómicas,
que son de hecho los polinomios de Hermite Hn (x). Es evidente que la correspondiente solución de la
2
EDO original, v(x) = Hn (x)e x /2 (y también su derivada), es de cuadrado sumable puesto que se anula
exponencialmente en el infinito, ası́ que es un autovector. Podemos reconocer en v(x) las denominadas
funciones de Hermite n (x).
Si + 1 6= 2n, n = 0, 1, 2 . . . , la serie que define u(x) no está truncada. Se puede demostrar que en tal
2 2
caso, para |x| ! 1 la función se comporta como u(x) ⇠ ex , de manera que la función v(x) ⇠ ex /2 no
será cuadrado sumable ni, por tanto, un autovector.
La demostración es relativamente simple: para x ! 1, la principal contribución a la serie proviene de las potencias xk de
orden más alto. Por tanto, se puede aproximar el comportamiento asintótico de la función considerando la contribución de
los términos con ı́ndice k grande (formalmente k ! 1). Para estos términos, la relación de recurrencia se puede aproximar
como
k 1 2 k=2m am 1
ak+2 ⇡ ak ) am ⇡ ) am ⇡ .
k m m!
Notemos que, como k es grande, es irrelevante aproximar k = 2m (par) o k = 2m + 1 (impar). Notemos también que la
solución de la relación de recurrencia no será en general una buena aproximación para los coeficientes con ı́ndice m pequeño,
pero como hemos indicado la contribución de estos términos a la suma de la serie será despreciable en el lı́mite x ! 1. En
definitiva se puede aproximar
X1
1 2m 2
u(x ! 1) ⇡ x = ex .
m=0
m!

En resumen, la solución del problema de autovalores es de la forma


x2 /2
n = 0, 1, 2 . . . : n = 2n 1, n (x) = Cn Hn (x)e (Cn es constante de normalización).

A pesar de ser un problema singular, encontramos que cumple las mismas propiedades que uno regular:
Los autovalores son numerables y simples.
Los autovalores forman una sucesión infinita monótonamente decreciente acotada superior, pero no infe-
riormente.
Las autofunciones se pueden escoger reales y forman una base ortogonal de L2 (R) (incidentalmente, la
propiedad de hermiticidad de JS es la demostración de que las funciones de Hermite son mutuamente
ortogonales).
La autofunción n (x) posee n ceros en el eje real.
Métodos Matemáticos II Curso 2020–2021

91. En cierta base ortonormal de un espacio vectorial de dimensión tres, dos vectores |f i y |gi
se representan como 0 1 0 1
i i
|f i ! @ 2A , |gi ! @0A .
i 2
Compruebe explı́citamente que hf |g i = hg |f i⇤ y calcule la matriz que representa al ope-
rador |f i hg|.

92. Se considera el subespacio lineal S = gen{P0 (x), P1 (x), P2 (x)} ⇢ L2 ( 1, 1) generado por
los tres primeros polinomios de Legendre: P0 (x) = 1, P1 (x) = x, P2 (x) = (3x2 1)/2.
Calcule la representación matricial de los siguientes operadores lineales restringidos a S:
Z x
d d2
a) i , b) , c) dz · .
dx dx2 1

93. Un operador Q se dice antihermı́tico si Q† = Q. Demuestre que:

a) Los autovalores de un operador antihermı́tico Q son imaginarios.


b) El conmutador de dos operadores que son hermı́ticos o antihermı́ticos es antihermı́tico.

94. En el espacio L2 (0, 1) se considera el operador integral A que actúa como


Z x
A[f ] = ds f (s), 0  x  1, f (x) 2 L2 (0, 1).
0

Demuestre que la acción del operador está definida en todo el espacio de Hilbert y que el
adjunto A† es de la forma Z 1

A [f ] = ds f (s).
x

95. Verifique que el operador P caracterizado en cierta base ortonormal por la representación
matricial 0 1
1/2 0 i/2
@ 0 1 0 A
i/2 0 1/2
es un proyector. Halle una base del subespacio SP sobre el cual proyecta P .

96. Se introduce el operador Tc que implementa una traslación en la variable de abscisa:

Tc [f (x)] = f (x + c), c 2 R.

Demuestre que la acción de Tc está definida sobre cualquier elemento del espacio L2 (R) y
produce otro elemento del espacio. Pruebe también que es un operador unitario.
97. En el espacio L2 (R) se definen el operador de paridad ⇧ y el operador transformada de
Fourier U como sigue:
Z +1
1
8f (x) 2 L2 (R) : ⇧[f (x)] = f ( x), U [f (x)] = p dx e ikx f (x), k 2 R.
2⇡ 1
a) Demuestre que ⇧2 = I y use este resultado para probar que los autovalores de ⇧ son
⇧ = ±1. ¿Cuáles son las autofunciones? ¿Cuál es la degeneración de cada autovalor?
b) Demuestre que U 2 = ⇧ y pruebe por tanto que los autovalores de U son U = ±1, ±i.
98. Se considera el operador restringido AS con

d 1 x
A=i + cos , S = {f (x) 2 C 1 [ ⇡, ⇡] y f ( ⇡) = f (⇡)} ⇢ L2 ( ⇡, ⇡).
dx 2 2
¿Es el operador restringido hermı́tico? Resuelva explı́citamente el problema de autovalores
para AS .
99. Se considera el problema de autovalores
d4 '
ex ' = 0, '(0) = '(1) = '0 (0) = '00 (1) = 0, 0  x  1.
dx4
Sin necesidad de resolver el problema, demuestre que los autovalores son positivos y que
las autofunciones correspondientes a dos autovalores diferentes son ortogonales respecto al
producto escalar del espacio L2w (0, 1) con la función peso w(x) = ex .
100. Resuelva el siguiente problema de autovalores:
d2 v
= v, v 0 (0) = v 0 (L) = 0, 0  x  L.
dx2
101. Resuelva el problema de autovalores para el operador restringido JS con
✓ ◆
x d x d 1
J =e e + , S = {f (x) 2 C 2 [0, 1] y f (0) = 0, 2f 0 (1) + f (1) = 0}.
dx dx 4

102. Considere el problema de autovalores (con 0 < " < 1)


x2 y 00 (x) + 3xy 0 (x) + y(x) = y(x), y(") = y(1) = 0, "  x  1.
a) Compruebe que se trata de un problema de Sturm–Liouville regular y calcule los
autovalores y las autofunciones. ¿Qué se puede afirmar sobre estas últimas?
b) Supongamos que se hiciera " = 0. ¿Sigue siendo un problema de Sturm–Liouville?
Demuestre que, en este caso, no existe solución del problema de autovalores si se exige
que y(0) sea regular y se mantiene la condición y(1) = 0.
103. Se considera la siguiente familia uniparamétrica de funciones definidas para 0 < "  x  1:
8 r
>
> x " ↵
>
> , x < ↵,
< ↵ " x
f (x; ↵) = r " < ↵ < 1.
>
>
>
> 1 x ↵
: , ↵ < x,
1 ↵ x
Estime el primer autovalor del problema de Sturm–Liouville del ejercicio 102 utilizando
esta familia como funciones de prueba.
MMII 2020–2021, soluciones del boletı́n para el tema 8 1

0 1 0 1
i i

91. hf |g i = i 2 i @0A = i 2 i @0A = 1 + 2i,
2 2
0 1 0 1
i i
⇤ ⇤
hg |f i = i 0 2 @ 2A = i 0 2 @ 2A = 1 2i = hf |g i ,
i i
0 1 0 1 0 1
i i 1 0 2i

|f i hg| ! @ 2A i 0 2 = @ 2A i 0 2 = @ 2i 0 4 A.
i i 1 0 2i

92. En el espacio de Hilbert L2 ( 1, 1), los polinomios de Legendre son ortogonales pero no están
normalizados. Por tanto, se puede construir una base ortonormal del subespacio S como
r r
P0 (x) 1 P1 (x) 3 P2 (x) 1 5
'0 (x) = =p , '1 (x) = = x, '2 (x) = = (3x2 1).
kP0 k 2 kP1 k 2 kP2 k 2 2

La matriz que representa el operador restringido AS tiene elementos Ajk = h'j |A| 'k i. Ası́:
0 p 1
0 i 3 p0
d
a) ! Ma := @ 0 0 i 15 A .
dx S 0 0 0
0 p 1
d2 0 0 3 5
b) ! Mb := @ 0 0 0 A.
dx2 S 0 0 0
0 p 1
Z x 1p 1/ 3 0p
c) dz · ! Mc := @ 1/ 3 0
p 1/ 15 A .
1 S 0 1/ 15 0
Como la acción del operador restringido id/dx|S sobre elementos del espacio S no los extrae
del mismo, se puede escribir
d2 d d
2
=i i ,
dx S dx S dx S
y la matriz Mb se puede calcular como Ma2 . (Esto no serı́a posible si se hubiesen expresado
las matrices en la base sin normalizar {P0 , P1 , P2 }.)
93. a) Los autovalores son iguales al cociente de Rayleigh evaluado sobre un autovector:

Q |vi = |vi ⌦ ↵⇤ ⇤
) = R[v] = hv |Q| vi = v Q† v = hv |Q| vi = ⇤
) Re = 0.
kvk = 1

b) Sean A y B dos operadores lineales hermı́ticos, esto es, A† = A y B † = B. Entonces,

[A, B]† = (AB BA)† = (AB)† (BA)† = B † A† A† B † = BA AB = [A, B].

Igualmente se demuestra para el caso en que A y B son antihermı́ticos.

94. La acción del operador se puede escribir en términos de la distribución de Heaviside como
Z 1
A[f ] = ds H ⇤ (x s)f (s).
0

Como la función hx (s) = H(x s) es un elemento del espacio L2 (0, 1),


Z 1 Z x
2
khx k = ds |H(x s)|2 = ds = x finito,
0 0
MMII 2020–2021, soluciones del boletı́n para el tema 8 2

resulta que la acción de A sobre f tiene la forma de un producto escalar, A[f ] = hhx |f i, y
por tanto está definida para cualquier elemento f 2 L2 (0, 1).
El operador adjunto se construye a partir de su definición: para cualquier par f, g 2 L2 (0, 1),
se verifica
✓Z 1 Z z ◆⇤
⌦ ↵ ⇤
f A† g = hg |A| f i = dz g ⇤ (z) ds f (s)
0 0
Z 1 Z z
= dz ds g(z) f ⇤ (s)
0 0
✓ ◆ Z 1 Z 1 Z 1 Z 1
intercambiando el ⇤ ⇤
= ds dz g(z) f (s) = ds f (s) dz g(z)
orden de integración 0 s 0
| s {z }
=:B[g]

= hf |B| gi
Z 1
8 |f i , |gi 2 L2 (0, 1) ) A† = B = dz ·
x

95. La matriz que representa P es autoadjunta o hermı́tica (P † = P ) y además P 2 = P ; luego P


es proyector. Por tanto, sus autovalores son cero y uno. El subespacio S sobre el que proyecta
es el autoespacio asociado al autovalor = 1. Por tanto, hay que buscar los autovectores
asociados a = 1. El resultado es
0 1 0 1
0 i
SP = E =1 = gen {|'1 i , |'2 i}, |'1 i ! @ 1 A , |'2 i ! @ 0 A .
0 1

96. Sea f (x) 2 L2 (R), es decir,


Z +1
dx |f (x)|2 < 1.
1

Entonces, el vector g(x) = f (x + c) = Tc [f (x)] también verifica


Z +1 Z +1 Z +1
z:=x+c
dx |g(x)|2 = dx |f (x + c)|2 = dz |f (z)|2 < 1 ) g(x) 2 L2 (R).
1 1 1

Evidentemente, el operador inverso viene dado como Tc 1 = T c . El operador Tc† se encuentra


a partir de la definición de adjunto: para cualquier par de vectores |f i , |gi 2 L2 (R) se tiene
✓Z +1 ◆⇤ Z +1
⌦ ↵ ⇤
g Tc† f = hf |Tc | gi = dx f ⇤ (x)Tc [g] = dx f (x)g ⇤ (x + c)
1 1
Z +1 Z +1
z:=x+c ⌦ ↵
= dz g ⇤ (z)f (z c) dz g ⇤ (z)T c [f ] = hg |T c| f i = g Tc 1
f
1 1
8 |f i , |gi ) Tc† = Tc . 1

97. a) Es evidente que la acción de ⇧ está definida en todo el espacio L2 (R) y produce otro
elemento del espacio. Además se verifica

⇧2 [f (x)] = ⇧(⇧[f (x)]) = ⇧[f ( x)] = f (x) ) ⇧2 = I.

El problema de autovalores para ⇧ es

⇧ |'i = ⇧ |'i , con ⇧ 2 C, |'i =


6 0.

Combinando esta definición de las autofunciones con el resultado previo, resulta


)
⇧2 |'i = ⇧( ⇧ |'i) = ⇧ ⇧ |'i = 2⇧ |'i '6=0
⇧2 = I ) ( 2⇧ 1) |'i = 0 ) ⇧ = ±1.
= |'i
MMII 2020–2021, soluciones del boletı́n para el tema 8 3

Por tanto, las autofunciones de ⇧ son:

!
⇧ = +1 : '( x) = ⇧['(x)] = '(x) ) '(x) función par,

!
⇧ = 1: '( x) = ⇧['(x)] = '(x) ) '(x) función impar.
La degeneración de cada autovalor es infinita, pues hay infinitas funciones pares lineal-
mente independientes y lo mismo vale para las impares.
b) El teorema de Plancherel asegura que la acción de U está definida en todo el espacio
L2 (R) y produce otro elemento del espacio. Para cualquier f (x) 2 L2 (R) se verifica
Z +1 Z +1 Z +1
2 1 ikx 1 ikz
U [f ] = p U dx e f (x) = dk e dx e ikx f (x)
2⇡ 1 2⇡ 1 1
Z +1 Z +1 Z +1
1
= dx f (x) dk e ik(z+x) = dx f (x) (z + x)
1 2⇡ 1 1
| {z }
(z+x)

= f ( z) = ⇧[f ]
8f 2 L2 (R) ) U 2 = ⇧.

Combinando este resultado con la ecuación de autovalores para U ,

U |'i = U |'i , con U 2 C, |'i =


6 0,

se llega a

U 2 |'i = 2
U |'i '6=0 2
) U = ⇧ = ±1 ) U = ±1, ±i.
= ⇧ |'i = ⇧ |'i

98. A partir de la definición de operador adjunto,


D E

f A†S g := hg |AS | f i , 8 |f i , |gi 2 S,

se encuentra 
d 1 x
A†S = i cos .
dx S 2 2
(Notemos que la multiplicación por cos(x/2) no extrae un elemento del subespacio S del
mismo, pero la acción de la derivada sı́, y por ello es necesaria la notación d/dx|S ). Como
A†S 6= AS , el operador no es hermı́tico.
El problema de autovalores se transforma en un problema de condiciones de contorno:
✓ ◆
A |'i = |'i d' i x
, i = cos '(x), '( ⇡) = '(⇡), ⇡  x  +⇡.
|'i 2 S dx 2 2

Solución (clásica) general de la ecuación (EDO de primer orden separable):


i x sen(x/2)
'(x) = ↵e .

Condición de contorno:
⇥ i ⇡ 1

0 = '(⇡) '( ⇡) = ↵ e ei ⇡+1

Autovalores: para tener solución no trivial debe ser ↵ 6= 0. Por tanto

i ⇡ 1 ! ! i
e ei ⇡+1
=0 ) e2(i ⇡+1)
= 1 = e2⇡in ) = n+ , n = 0, ±1, ±2, . . .

MMII 2020–2021, soluciones del boletı́n para el tema 8 4

La correspondiente autofunción será


inx+(x/⇡) sen(x/2)
'n (x) = ↵e

Se puede elegir ↵ para que la autofunción esté normalizada:


Z ⇡ Z ⇡
2 2 2 !
k'n k = dx |'n (x)| = |↵| dx e(2x/⇡) 2 sen(x/2) = 1.
⇡ ⇡

Notemos que la constante ↵ no depende del ı́ndice n. La integral no se puede expresar en


términos de funciones elementales y se debe dejar indicada (numéricamente se encuentra
|↵| ⇡ 00 39.)
En resumen, la solución del problema es
i inx+(x/⇡) sen(x/2)
=n+ , n = 0, ±1, ±2, . . . 'n (x) = ↵e , En = gen{'n (x)}.

Todos los autovalores son simples, pues cada autoespacio En tiene dimensión uno.
99. El problema se puede formular en el lenguaje de espacios de Hilbert como

d4
AS |'i = |'i , A := e x
, S := f (x) 2 C 4 [0, 1], f (0) = f (1) = f 0 (0) = f 00 (1) = 0 ⇢ L2w (0, 1).
dx4
Demostremos que el operador AS es hermı́tico respecto al producto escalar del espacio de
Hilbert L2w (0, 1) con la función peso w(x) = ex : para cualesquiera |f i , |gi 2 S se cumple
D E Z 1 ◆ ✓
⇤ Z 1
⇤ d4 d4 g ⇤
g A†S f = hf |AS | giw
= dx e f (x) e x ⇤
g(x) = x
dx f (x)
w 0 dx4 0 dx4
0 1
integrando por partes Z 1 Z 1 ✓ ◆
@ A d4 f d4
cuatro veces + = dx g ⇤ (x) 4 = dx ex g ⇤ (x) e x 4 f (x)
0 dx 0 dx
condiciones de contorno

= hg |AS | f iw
8 |f i , |gi 2 S ) A†S = AS .

Por tanto, AS es hermı́tico y sus autovalores son reales y las autofunciones asociadas a
autovalores distintos serán ortogonales. Falta demostrar que además > 0, y para ello se
evalúa el cociente de Rayleigh sobre una autofunción normalizada ': ˆ
0 1
integrando por partes Z 1 2
k'k
ˆ w =1
@ A d2 'ˆ
= R[']
ˆ = h'ˆ |AS | 'i
ˆw= dos veces + = dx 0.
0 dx2
condiciones de contorno

El caso = 0 se puede excluir porque el integrando es continuo por hipótesis, y por tanto
la integral se anula solo si d2 '/dx
ˆ 2
= 0 ) '(x)
ˆ = ↵x + , y las condiciones de contorno
implican ↵ = = 0.
100. Se trata de un problema de Sturm–Liouville regular en el espacio de Hilbert L2 (0, L): opera-
dor J = d2 /dx2 regular (p(x) = w(x) = 1, q(x) = 0), condiciones de contorno de Neumann
en los extremos del intervalo finito [0, L]. Por tanto, los autovalores serán reales. Evaluando
el cociente de Rayleigh para una autofunción normalizada (kvk = 1), se encuentra
Z L Z L 2
⇤ d2 v(x) dv(x)
= R[v] = hv |J| vi = dx v (x) = dx  0.
0 dx2 0 dx

No se puede excluir el autovalor nulo porque las condiciones de contorno permiten autofun-
ciones no nulas con dv/dx = 0.
MMII 2020–2021, soluciones del boletı́n para el tema 8 5

Si = 0: la solución general de la EDO y las condiciones de contorno conducen a


( )
!
v 0 (0) = = 0
v(x) = ↵ + x, !
) v(x) = ↵.
v 0 (L) = = 0
p
La autofunción normalizada es '0 (x) = 1/ L.
p
Si < 0: introduciendo µ := , la solución general de la EDO y las condiciones de
contorno conducen a
( )
!
v 0 (0) = = 0
v(x) = ↵ cos µx + sen µx, !
v 0 (L) = ↵ sen µL = 0
⇣ n⇡ ⌘2
↵6=0
) sen µL = 0 ) = µ2 =
, n = 1, 2, . . .
L
(El ı́ndice n = 0 está excluı́do porque < 0; los ı́ndices
pn < 0 no conducen a autovalores
diferentes). La autofunción normalizada es 'n (x) = 2/L cos(n⇡x/L).
En conclusión, la solución del problema es
8 1
>
> '0 (x) = p ,
⇣ n⇡ ⌘2 >
< L
n = 0, 1, 2, . . . n = , r
L >
>
>
: ' (x) = 2 cos n⇡x ,
n n 6= 0,
L L
y las autofunciones forman una base ortonormal del espacio L2 (0, 1).
101. Se trata de un problema de Sturm–Liouville regular en el espacio de Hilbert L2w (0, 1) con la
función peso w(x) = ex . La solución del problema de autovalores para JS es
✓ ◆2 ✓ ◆
1 p 1
n = n+ ⇡2 , 'n (x) = 2e x/2
sen n + ⇡x, n = 0, 1, 2, . . .
2 2

y las autofunciones forman una base ortonormal del espacio L2w (0, 1).
102. a) Problema de Sturm–Liouville regular en 0 < "  x  1 con el operador
⇢ 
d2 d 1 d d
J := x2 2 +3x +1 = x3 +x , w(x) = x, p(x) = x3 , q(x) = x.
dx dx x dx dx

Por tanto, los autovalores serán reales y las autofunciones (también reales) formarán
una base ortonormal del espacio L2w (", 1). El cociente de Rayleigh para un autovector
normalizado es
Z 1
kvkw =1
= R[v] = hv |J| viw = dx w(x)v ⇤ (x)J[v(x)]
"
Z 1 ⇢ 
⇤ d dv(x)
= dx v (x) x3 + xv(x)
" dx dx
✓ ◆ Z 1 Z 1 2
integrando por partes dv(x)
= dx x|v(x)|2 dx x3
v(")=v(1)=0 dx
|" {z } "

kvkw
Z 1
2
= 1 dx x3 |v 0 (x)| .
"

La expresión no permite concluir nada sobre el signo de los autovalores. Para determi-
narlos resolvemos la EDO (ecuación de Euler) con las condiciones de contorno:
MMII 2020–2021, soluciones del boletı́n para el tema 8 6

Si = 0, la solución general de la EDO es


1
y(x) = [↵ + ln x] , ↵, constantes de integración.
x
! !
La condición y(1) = 1 implica ↵ = 0. Entonces, la condición y(") = 0 implica
= 0. Por tanto, solo existe la solución trivial y = 0 no es autovalor.
Si 6= 0, la solución general de la EDO se escribe como
1h p p i
y(x) = ↵x + x , ↵, constantes de integración.
x
!
La condición y(1) = 0 implica
8 2↵ p
>
< x senh(
> ln x), >0
↵+ =0 ) y(x) =
>
: 2i↵ sen(p
>
ln x), <0
x
!
La segunda condición, y(") = 0 implica, si > 0, que
2↵ p !
senh( ln ") = 0 ) ↵ = 0.
"
Por tanto, no existe autovalor > 0. En cambio, si < 0 se obtiene
2i↵ p ! ↵ 6= 0
p !
sen( ln ") = 0 ) sen( ln ") = 0.
"
En resumen, la solución del problema de autovalores es
⇣ n⇡ ⌘2 An n⇡ ln x
n = , 'n (x) = sen , n = 1, 2, 3, . . .
ln " x ln "
donde las constantes reales An están determinadas por la condición de normalización:
Z 1 Z 1
2 2 2 1 n⇡ ln x
k'n kw = dx w(x)|'n (x)| = An dx sen2
" " x ln "
Z 0 2
r
2 2 An ! 2
(z:=ln x/ ln ") = An ln " dz sen n⇡z = ln " = 1 ) An = .
1 2 ln "

b) Se trata de un problema de Sturm–Liouville singular porque las funciones p(x) = x3


y w(x) = x se anulan en el punto extremo x = 0 del intervalo de definición. Se puede
comprobar que, a pesar de esto, el operador de Sturm–Liouville J sigue siendo hermı́tico
cuando se restringe al subespacio

S = f (x) | f (x) 2 C 2 [0, 1] y f (1) = 0, f (0) regular .

En efecto, para todo |f i , |gi 2 S se encuentra


D E 
df ⇤ dg
f JS† g = (x = 1) (x = 0)+hf |JS | giw , (x) := x3 g(x) f ⇤ (x) ,
w dx dx

y las contribuciones de los extremos se anulan: (x = 1) = 0 porque f (1) = g(1) = 0


y f 0 (1), g 0 (1) son finitas, mientras que (x = 0) = 0 debido al prefactor x3 puesto que
f (x), g(x) son regulares en x = 0 (y, por tanto, finitas al igual que sus derivadas). Por
tanto, los autovalores, si existen, serán reales y podrán formar un sistema ortonormal.
A partir de la forma de la solución general de la EDO, se concluye que la condición de
MMII 2020–2021, soluciones del boletı́n para el tema 8 7

que y(x) sea regular en x = 0 excluye el caso = 0 de inmediato. Cuando 6= 0, la


condición y(1) = 0 implica, como ya se vio,
8 2↵ p
>
< x senh(
> ln x), > 0,
↵ + = 0 ) y(x) =
>
: 2i↵ sen(p
>
ln x), < 0.
x
La condición de regularidad en x = 0 conduce a ↵ = 0, puesto que cuando x ! 0,
la función y(x) diverge monótonamente si > 0 o exhibe oscilaciones de amplitud y
periodo divergentes si < 0. Por tanto, no existe solución no trivial del problema de
autovalores.
103. El problema de Sturm–Liouville anterior estaba planteado en el subespacio
S = {f (x) | f (x) 2 C 2 (", 1), y f (") = f (1) = 0} ⇢ L2w (", 1), w(x) = x.

αm
R[f]
1.0
-10

-20 0.8

-30
0.6
-40

-50 0.4

-60
0.2
-70

-80 α ϵ
0.2 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0

Figura 1: (Izquierda) Cociente de Rayleigh como función del parámetro ↵ para un valor fijo de
". (Derecha) Valor ↵m como función de " donde R[f ] alcanza su máximo local. Como se observa,
este valor verifica efectivamente las cotas " < ↵ < 1.

Es evidente que f 2 L2w (", 1) para cualquier elección del parámetro real ↵ y que f (") =
f (1) = 0, pero la discontinuidad de f 0 (x) en x = ↵ hace que f 62 S. La función sin embargo
se puede emplear en el cociente de Rayleigh si se interpreta como distribución siempre que
las integrales que aparezcan estén definidas. En este caso es ası́:
Z 1 Z ↵ ✓ ◆2 Z 1 ✓ ◆2
2 2 " x 1 x 1 "
kf kw = dx x|f (x)| = ↵ dx +↵ dx = ↵
" " " ↵ ↵ 1 ↵ 3

Z ↵ Z 1
prob. 102 2
hf |J| f iw = kf kw dx x3 |f 0 (x)|2 dx x3 |f 0 (x)|2
" ↵
Z ✓ ◆2 Z ✓ ◆2
2 ↵ ↵ "+x ↵ 1 1+x
= kf kw dx dx
4 " " ↵ 4 ↵ 1 ↵
2
(1 ")↵ 3↵ + (1 + ")↵ "
=
4 (1 ↵)(↵ ")
hf |J| f iw 3 3↵2 + (1 + ")↵ "
R[f ] = 2 =
kf kw 4 (1 ↵)(↵ ")

La figura 1 muestra que, como función de ↵, R[f ] ! 1 cuando ↵ ! 1, " y alcanza un


máximo local dentro del intervalo " < ↵ < 1 para
2"
↵m = ) " < ↵m < 1.
1+"
Por tanto, el primer autovalor se puede estimar como
3 "2 + 14" + 1
1 ⇡ R[f ](↵m ) = .
4 (1 ")2
MMII 2020–2021, soluciones del boletı́n para el tema 8 8

error (%)
100

3.0

80
2.5 ϵ = 0'3

60 2.0

1.5
40

1.0

20
0.5

ϵ x
0.0 0.2 0.4 0.6 0.8 1.0 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Figura 2: (Izquierda) Error relativo porcentual en la estimación del primer autovalor. (Derecha)
La estimación para la primera autofunción (lı́nea roja continua) comparada con la autofunción
exacta (lı́nea azul de guiones), para el valor " = 00 3.

Las gráficas en la figura 2 muestran el error relativo de esta estimación ası́ como la aproxi-
mación a la primera autofunción cuando se compara con los resultados exactos obtenidos en
el problema 102.
Tema 9

EDPs lineales de segundo orden

Las ecuaciones en derivadas parciales (EDP) son la generalización de las ecuaciones diferenciales para funciones
de más de una variable y aparecen con profusión en las aplicaciones fı́sicas. Los métodos analı́ticos de resolución
más frecuentes buscan reducir la EDP a ecuaciones diferenciales ordinarias. En este tema veremos cómo emplear
la representación en serie de Fourier generalizada para resolver las EDPs lineales de segundo orden.

9.1. EDPs de relevancia fı́sica


9.1.1. Ecuación de ondas
Consideremos una cuerda tensa cuyos extremos están fijados y que se encuentra bajo la acción de la aceleración
de la gravedad g. La cuerda está caracterizada por una densidad lineal de masa %. El objetivo es escribir la
ecuación de movimiento para las oscilaciones verticales (suponemos que no hay desplazamientos horizontales o
fuera del plano vertical) .
1. Sea u(x, t) el desplazamiento vertical del punto x de la cuerda en el instante t. Los extremos están en x = 0
y x = L. La segunda ley de Newton para el movimiento vertical de un tramo infinitesimal de cuerda de
longitud d` (y, por ende, de masa dm = % d`) es
aceleración
masa z }| { fuerza
z}|{ @ 2 u(x, t) z }| {
% d` ey = dF(x, t) .
@t2
2. La fuerza dF(x, t) tiene una contribución debido a la gravedad y otra debida a la tensión de la cuerda,
dF = ey g%d` + dFT .
Denotemos por T(x) la tensión que la mitad derecha de la cuerda ejerce en el punto x sobre la mitad
izquierda. Esta tensión es paralela a la cuerda en ese punto y por tanto se escribe como
@u
T = T [ex cos ✓ + ey sen ✓], tan ✓ = = pendiente de la cuerda.
@x
La fuerza sobre el tramo infinitesimal debida a la tensión es por tanto la diferencia entre las tensiones en
cada extremo del tramo:
@T
dFT = T(x + dx) T(x dx) = 2 dx,
@x
puesto que T(x dx) es la tensión que la mitad a la izquierda del punto x dx ejerce sobre la mitad a
la derecha, por el principio de acción y reacción. Ası́ pues,
s ✓ ◆2
@T @u
dF = ey g%d` + 2 dx, d` = 2dx 1 + .
@x @x

1
2 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

3. Para simplificar el cálculo, invocamos la aproximación de oscilaciones pequeñas, que consiste en suponer
que el desplazamiento de la cuerda respecto a la horizontal es pequeño, |@u/@x| ⌧ 1. Esto implica en
particular que el ángulo ✓ que forma la cuerda con la horizontal es pequeño y por tanto se pueden hacer
las siguientes aproximaciones, en las que se desprecian términos de orden ✓2 o superiores:
8
> @u 
< = tan ✓ ⇡ ✓, @u
d` ⇡ 2dx, @x ) T ⇡ T ex + ey .
>
: @x
T ⇡ T [ex + ey ✓].

Por tanto, la fuerza sobre el tramo infinitesimal de cuerda es


 ✓ ◆
@T @u @T @2u
dF ⇡ 2dx ex + ey %g + +T 2 .
@x @x @x @x

Como los puntos de la cuerda no se mueven en dirección horizontal (no hay estiramiento), se debe cumplir

@T
ex · dF = 0 ) = 0,
@x
es decir, el módulo de la tensión de la cuerda es la misma en toda su longitud, ası́ que

@2u
dF ⇡ 2dxey %g + T 2 .
@x

4. Por tanto, la segunda ley de Newton para la cuerda tensa en esta aproximación se simplifica a la ecuación

@2u @2u
2%dx 2 ⇡ 2dx %g + T 2 .
@t @x

Se define la cantidad
T
c2 := 0,
%
(notemos que T = |T| y % son cantidades positivas), de forma que finalmente resulta

@2u @2u
⇡ g + c2 .
@t2 @x2
Cuando g = 0, la ecuación resultante se denomina ecuación de ondas. Nótese que la cantidad c tiene
dimensiones de velocidad y, como se verá, representa fı́sicamente la velocidad de propagación de las ondas.
De manera más general, en sistemas bi o tridimensionales la ecuación de ondas es
✓ 2 ◆
@2u 2 2 2 @ u @2u @2u
= c r u = c + + ,
@t2 @x2 @y 2 @z 2

en términos del operador Laplaciano, r2 := r · r.


5. Dado el origen fı́sico del problema, la ecuación de ondas se suele complementar con las siguientes condiciones
para tener un problema bien planteado:
a) Condiciones iniciales en un instante dado t0 que especifican el valor u(x, t0 ) (“posición inicial”) y el
valor @t u(x, t0 ) (“velocidad inicial”).
b) Condiciones de contorno en los extremos que especifican las ligaduras o las fuerzas que actúan sobre
el sistema. Por ejemplo:
Extremo fijo: u(x = 0, t) = u0 . Esta condición de contorno siempre se puede escribir como una
condición de Dirichlet para el campo u(x, t) := u(x, t) u0 , es decir, u(x = 0, t) = 0.
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 3

Extremo libre de fuerza vertical1 :


@u
ey · T = 0 en x = 0 ) (x = 0, t) = 0.
@x
Se trata de una condición de Neumann.
Extremo sujeto por un muelle vertical (condición de Robin):

@u
ey · T = ku en x = 0 ) (x = 0, t) + ku(x = 0, t) = 0.
@x
6. La ecuación de ondas no es exclusiva de este problema mecánico especı́fico, sino que representa de manera
muy general la evolución dinámica de los sistemas mecánicos cuando se apartan ligeramente de un estado
de equilibrio estable. La ecuación de ondas también aparece con generalidad en teorı́a de campos. Por
ejemplo, las ecuaciones de Maxwell en el vacı́o describen la propagación de ondas electromagnéticas:

@B @E
r · E = 0, r · B = 0, r⇥E= , r ⇥ B = µ0 ✏ 0 ,
@t @t

✓ ◆
@2E @ 1 1 @B 1
= r⇥B = r⇥ = r ⇥ (r ⇥ E)
@t2 @t µ0 ✏ 0 µ0 ✏ 0 @t µ0 ✏ 0
1 ⇥ ⇤ 1
= r(r · E) r2 E = c2 r2 E, c := p ,
µ0 ✏ 0 µ0 ✏ 0

y una ecuación análoga para B.

9.1.2. Leyes de conservación. Ecuación de difusión y ecuación de transporte


Consideremos una magnitud fı́sica escalar, aditiva y conservada: por ejemplo, el número de partı́culas, la masa,
la carga eléctrica o la energı́a. Deduciremos la formulación matemática general del principio de conservación
correspondiente para un medio continuo o un campo, y veremos algunas particularizaciones.

1. Para fijar ideas hablaremos de la magnitud conservada masa M , aunque los resultados son extrapolables
a cualquiera de los otros casos con un cambio trivial de nomenclatura. Se define pues el campo densidad
volumétrica de masa %(r, t) de la siguiente manera:

dV := elemento de volumen infinitesimal,


dm(r, t) := masa contenida en el elemento de volumen dV
localizado en el punto r y en el instante t,

dm(r, t)
%(r, t) := campo densidad volumétrica de masa = .
dV
Es evidente que la masa total contenida en un volumen V viene dada por la expresión
Z
MV (t) = dV %(r, t).
V

La conservación de masa significa que la masa MV (t) solo cambia debido al flujo de masa a través de la
frontera @V del volumen, lo cual se expresa matemáticamente como
Z
dMV !
= dA · j(r, t), 8volumen V,
dt @V
1 Naturalmente sigue actuando una fuerza horizontal, que es la responsable de la ligadura de que el extremo de la cuerda

permanezca siempre anclado en x = 0.


4 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

donde el campo vectorial j(r, t) es la densidad de corriente de masa. La interpretación fı́sica de este campo
es que dA · j representa la cantidad de masa que atraviesa el elemento de área dA por unidad de tiempo;
el signo negativo de la integral indica que la masa disminuye cuando la corriente j apunta hacia el exterior
del volumen, pues se sigue el convenio habitual de orientar una superficie cerrada hacia su exterior. En
particular, si la magnitud conservada es la carga eléctrica Q, entonces se escribe
Z
dQV
= I@V := dA · j(r, t),
dt @V

donde el flujo de corriente a través de la superficie @V se denomina intensidad de corriente, I@V , la cual
representa pues la carga neta que atraviesa la superficie.
Como se ve, en términos matemáticos una ley de conservación se formula diciendo que la cantidad @MV /@t,
que a la vista de su definición deberı́a depender en principio del volumen V, en realidad solo depende de
la frontera del mismo. Esta expresión es la formulación global o integral de la ley de conservación; pero
también se puede expresar en forma local o diferencial utilizando el teorema de Ostrogradsky–Gauss:
Z Z Z Z
dMV d V̇=0 @% ! Gauss 8V @%
= dV %(r, t) = dV = dA · j = dV r · j ) = r · j.
dt dt V V @t @V V @t

Según cómo venga dada la densidad de corriente j(r, t) se obtienen casos particulares de relevancia fı́sica.
2. Procesos de difusión: cuando en sistemas disipativos se produce una relajación al estado de equilibrio sin
apartarse demasiado del mismo, suele ser posible aproximar los flujos como linealmente proporcionales a
las desviaciones del equilibrio. Por ejemplo, en el caso de la difusión de masa se propone la denominada
ley de Fick,
j = Dr%, D := coeficiente de difusión de masa > 0.
Esta ley expresa que la corriente de masa tiene sentido opuesto al gradiente de densidad, de forma que
la masa se difunde en el sentido de intentar reducir los gradientes. Suponiendo que D es espacialmente
uniforme, la correspondiente ecuación de conservación se convierte en la ecuación de difusión de masa,
✓ 2 ◆
@% @ % @2% @2% 1D @% @2%
= r · ( Dr%) = Dr2 % = D + + ) = D .
@t @x2 @y 2 @z 2 @t @x2

Una ecuación similar se puede escribir para la conservación de la energı́a. Si consideramos un sistema
termodinámico sencillo, la energı́a interna E en equilibrio se puede expresar como función de la temperatura
y de la densidad de masa (ecuación de estado energética). Por tanto, si los procesos son suficientemente
lentos para suponerlos cuasiestáticos, los cambios en la densidad volumétrica de energı́a e se podrán escribir
como
cV
z }|◆{ ◆
@e @e
de = dT + d%, cV := capacidad calorı́fica a volumen constante.
@T % @% T
Para simplificar aún más el sistema, supongamos que es incompresible (por ejemplo, un lı́quido o un sólido),
de manera que la densidad no varı́a, d% = 0, y los cambios de energı́a serán debidos a únicamente a cambios
en la temperatura: de = cV dT . Fı́sicamente esto representa cambios de energı́a debido solo al flujo de calor
pues no se realiza trabajo de compresión o expansión. Por tanto, se puede expresar la conservación de
energı́a en el material en términos del campo local de temperatura como sigue:
=:jT
z✓ }| ◆{
@e @T cV const. @T je
= cV = r · je ) = r· .
@t @t @t cV
Entonces, la denominada ley de Fourier para la conducción del calor establece que

jT = rT,  := coeficiente de difusión del calor o conductividad térmica > 0.


c Alvaro Domı́nguez, Univ. Sevilla Tema 9 5

Esta ley expresa que el flujo de calor tiene sentido opuesto al gradiente de temperatura, esto es, el calor fluye
de caliente a frı́o y la energı́a se difunde en el sentido de intentar reducir las diferencias de temperatura.
Por tanto, la conservación de la energı́a se expresa bajo estas circunstancias como la denominada ecuación
del calor (suponiendo que  es espacialmente uniforme),

@T 1D @T @2T
= r2 T ) =D 2.
@t @t @x

3. Ecuación de transporte: en otras configuraciones la cantidad conservada es transportada por un fluido,


cuyo flujo se caracteriza mediante un campo de velocidad dado,

v(r, t) := velocidad del elemento de volumen localizado en el punto r y en el instante t.

Entonces, la densidad de corriente de la magnitud conservada será simplemente

j(r, t) = %(r, t)v(r, t),

y la correspondiente ley de conservación toma la forma de una ecuación de transporte,

@% 1D @% @
= r · (%v) ) = (%v).
@t @t @x
Cuando % se refiere a la densidad de masa, esta expresión se denomina ecuación de continuidad.

4. Para que el problema esté bien planteado se suele complementar la ecuación de difusión con las siguientes
condiciones:

a) Condiciones iniciales, que especifican el campo en un instante dado, por ejemplo, la distribución inicial
de temperatura T (x, t0 ).
b) Condiciones de contorno en los extremos que especifican el flujo de la magnitud correspondiente a
través de la frontera del sistema; suele haber dos clases de ligaduras:
El sistema está en contacto con un reservorio (un foco de partı́culas, un baño térmico,. . . ) que
fija el valor del campo en la frontera, por ejemplo

T (r 2 frontera) = T0 .

Es una condición de Dirichlet para el campo T := T (r) T0 , es decir, T (r 2 frontera) = 0.


El sistema está expuesto a un flujo predeterminado a través de la frontera, por ejemplo

n := vector unitario normal a la frontera ) n · j(r 2 frontera) = j0 .

Se tiene un sistema aislado si j0 = 0; en este caso, cuando se verifica una ley como la de Fick o
la de Fourier, la condición de contorno se convierte en una condición de Neumann, por ejemplo

n=ex @T
n · j|frontera = 0 ) n · rT |frontera = = 0.
@x frontera

5. Violación de la conservación: es muy sencillo extender la descripción matemática al caso en que se viola
la conservación porque existen fuentes o sumideros locales: se escribe

@%
= r · j + q(r, t),
@t
donde el denominado término de fuente q(r, t) representa la creación (o destrucción) de la correspondiente
magnitud por unidad de tiempo y volumen en el punto r y en el instante t.
6 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

9.1.3. Ecuaciones de Laplace, de Poisson y de Helmholtz


1. La ecuación de Laplace y su versión inhomogénea, la ecuación de Poisson, tienen un papel muy relevante en
las aplicaciones matemáticas y aparecen en numerosas aplicaciones fı́sicas que involucran campos (gravita-
ción, electromagnetismo, hidrodinámica, elasticidad, cuántica,. . . ). Por ejemplo, el potencial electrostático
V (r) está relacionado con la distribución de carga, caracterizada por la densidad volumétrica de carga %(r),
a través de la ecuación de Poisson:
%(r)
r2 V = .
✏0
En el caso particular de ausencia de carga (% = 0), esta expresión se reduce a la ecuación de Laplace.
La ecuación de Poisson suele aparecer como consecuencia del teorema de Helmholtz, que establece que un
campo vectorial se puede caracterizar completamente mediante su divergencia y su rotacional: esto implica
a su vez que el campo se puede obtener a partir de un potencial escalar y un potencial vector, los cuales
suelen satisfacer una ecuación de Poisson que los relaciona con las fuentes del campo.
2. Para que el problema esté bien planteado hay que especificar condiciones de contorno sobre el potencial
en todas las fronteras del sistema. Por ejemplo, particularizadas para fijar ideas en el caso del problema
electrostático, se puede fijar que las paredes son equipotenciales,

V(r 2 frontera) = V0 (Dirichlet para el campo V := V V0 ).

También se puede especificar la densidad superficial de carga de las paredes, que se traduce en una
condición sobre la componente normal del campo eléctrico:
E
z }| {
n := vector unitario normal a la frontera ) n · rV (r 2 frontera) = (Neumann si = 0).
✏0
orientado hacia afuera

3. Una ecuación relacionada es la denominada ecuación de Helmholtz,

r2 V = V, constante.

Esta ecuación aparece, por ejemplo, en fluidos iónicos, donde el propio potencial eléctrico induce cargas
eléctricas en el seno del fluido, de manera que % / V .

9.1.4. Ecuación de Schrödinger


Se trata de la ecuación fundamental de la Mecánica Cuántica y describe la evolución de la función de onda
(r, t), que es un campo escalar complejo ( 2 C) que determina completamente el estado cuántico de una
partı́cula. Fı́sicamente, | (r, t)|2 se interpreta como la probabilidad de encontrar la partı́cula en el punto r en el
instante t, de manera que debe verificar la condición de normalización,
Z
d3 r | (r, t)|2 = 1,
R3

es decir, es un elemento del espacio de Hilbert L2 (R3 ). Si la partı́cula tiene masa m y posee una energı́a
potencial V (r) debido a un campo de fuerza externa, entonces la ecuación de Schrödinger para su función de
onda es
@ ~2 2 1D @ ~2 @ 2
i~ = r + V (r) ) i~ = + V (x) .
@t 2m @t 2m @x2
donde ~ denota la constante de Planck. Se puede obtener fácilmente la ecuación de evolución de la densidad de
probabilidad %(x, t) = | (x, t)|2 a partir de la ecuación de Schrödinger:
=:jprob
 z ✓ }| ◆{
⇤ ⇤
@% ⇤@ @ i~ ⇤@
2
@2
@ i~ @ ⇤ ⇤@ @jprob
= + = = = ,
@t @t @t 2m @x2 @x2 @x 2m @x @x @x
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 7

es decir, una ecuación de continuidad que expresa la conservación de la probabilidad en términos de la corriente
de probabilidad jprob . Como la condición de normalización se debe conservar,
Z +1 Z +1
dx %(x, t) = dx | (x, t)|2 = 1,
1 1

la ecuación de continuidad implica que la corriente se debe anular en el infinito, jprob (x ! 1) = 0. En conse-
cuencia, las soluciones fı́sicamente admisibles de la ecuación de Schrödinger deben verificar que tanto (x) como
0
(x) se anulen en el infinito suficientemente rápido para garantizar que la función de onda es normalizable y
que su norma se conserva en el tiempo.

9.2. Nociones generales

Definición: sea una función u(r) de las n variables r = (x1 , x2 . . . , xn ). Se denomina ecuación en derivadas
parciales a una relación entre la función u y sus derivadas parciales (de cualquier orden),
✓ ◆
@u @u @u @ 2 u @ 2 u @2u @2u
F x1 , x2 . . . , xn , u, , ..., , 2, ..., 2, ,... = 0.
@x1 @x2 @xn @x1 @x1 @x2 @x2 @x2 @x3

La función u(x1 , x2 . . . , xn ) se denomina variable dependiente, las r = (x1 , x2 , . . . , xn ) son las variables indepen-
dientes. Se denomina orden de una EDP al orden de la derivada más alta. Esta definición se puede generalizar
para más de una variable dependiente, u1 (r), u2 (r), . . . y para más de una relación funcional, F1 , F2 , . . . , obte-
niendo ası́ un sistema de EDPs.

Definición:

Una EDP se denomina lineal si la variable dependiente y todas sus derivadas aparecen linealmente.

Una EDP lineal se denomina además homogénea si la función nula es solución.

Ejemplo: todas las ecuaciones presentadas en la sección anterior son lineales. Y de ellas, todas son homogéneas,
excepto la ecuación de Poisson, la ecuación de transporte con un término que viola la ley de conservación y la
ecuación de ondas con gravedad.

Definición: La solución de una EDP de orden n dependerá en general de n funciones independientes. El


conjunto de todas las posibles soluciones de una EDP se denomina su solución general.

Ejemplo: para ilustrar que la solución general de una EDP depende de funciones arbitrarias (y no simplemente
de constantes como en las EDOs), vamos a resolver la ecuación de ondas unidimensional:

@2u 1 @2u
= 0.
@x2 c2 @t2
Se introduce un cambio a nuevas variables independientes que está bien definido en todo el plano, como muestra
el jacobiano de la transformación:

9 @⇠ @⇠
⇠ := x + ct = @x @t
jacobiano 1 c
) = = 2c 6= 0.
; @⌘ @⌘ 1 c
⌘ := x ct
@x @t
8 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

Geométricamente se trata de una rotación de 45 grados desde los ejes (x, ct) a los nuevos ejes (⇠, ⌘). Se introduce
entonces la nueva variable dependiente v(⇠, ⌘) := u(x, t) y se expresa la ecuación de ondas en las nuevas variables:
9 8 @/@x @u/@x
1
z}|{
1
z}|{ > >
> z }| { z }| {
>
> >
> @2u  @
@u @⇠ @v @⌘ @v @v @v >
> >
> @ @v @v @2v @2v @2v
= + = + >
> >
> = + + = 2 + 2 +2
@x @x @⇠ @x @⌘ @⇠ @⌘ >
= >
< @x 2 @⇠ @⌘ @⇠ @⌘ @⇠ @⌘ @⌘@⇠
 )
> >
@u @⇠ @v @⌘ @v @v @v > >
>
>
>
>
@/@t @u/@t
= + =c >
> >
> z  }| { z  }| {  2
@t @t @⇠ @t @⌘ @⇠ @⌘ >
> > 2
> @ u @ @ @v @v @2v @2v
|{z} |{z} ; >
: 2 @ v
c c 2
= c c = c 2
+ 2 2
@t @⇠ @⌘ @⇠ @⌘ @⇠ @⌘ @⌘@⇠
8
> @w
>
> = 0 ) w(⇠, ⌘) = g(⌘)
>
< @⇠
@2u 1 @2u @ 2 v w:=@v/@⌘ =:G(⌘)
) 0= =4 ) z }| {
@x2 c2 @t2 @⌘@⇠ >
> Z
>
> @v
: = w ) v(⇠, ⌘) = F (⇠) + d⌘ g(⌘)
@⌘
) v(⇠, ⌘) = F (⇠) + G(⌘), F (⇠), G(⌘) funciones arbitrarias ) u(x, t) = F (x + ct) + G(x ct).
Esta expresión se conoce como solución de d’Alembert, y representa fı́sicamente la superposición de dos perfiles
espaciales, dados por las funciones F (x) y G(x), que se desplazan sin deformación con velocidad c pero sentidos
opuestos.

Por tanto, para obtener una solución única de una EDP hay que complementarla en general con condiciones de
contorno (también llamadas iniciales si alguna de las variables independientes se puede interpretar como tiempo).

Definición: se denomina problema de contorno al conjunto (a) una EDP o un sistema de EDPs,
(b) condiciones de contorno,
(c) dominio de definición del problema.

Definición: se denomina solución clásica del problema de contorno a una función tal que
(i) verifica la EDP y las condiciones de contorno,
(ii) y ella y todas las derivadas necesarias existen en el dominio de definición del problema de contorno (con-
dición de regularidad ).
En ocasiones las soluciones clásicas son demasiado restrictivas debido a la estructura de la EDP o al significado
fı́sico del problema. En tal caso, se pueden intentar buscar soluciones que no cumplan la condición de regularidad
en algunos puntos del dominio p.ej., función con discontinuidades o, de manera más general, distribuciones, es
decir, soluciones débiles o generalizadas.

Definición: , un problema de contorno se dice bien planteado si existe solución, es única y depende con
continuidad de las condiciones de contorno (o iniciales, según el caso). Esta última condición significa que
cambios pequeños en las condiciones de contorno solo producen cambios pequeños en toda la solución, y se
motiva fı́sicamente por la propiedad de que posibles errores (experimentales, numéricos) en las condiciones de
contorno no son amplificados.

Ejemplos: la propiedad de que un problema esté bien planteado limita el tipo de condiciones de contorno y de
dominios admisibles para un problema de contorno según el tipo de EDP. En particular están bien planteados
los problemas para la ecuación de ondas o la de difusión con condiciones iniciales en la variable temporal y
condiciones de contorno lineales, homogéneas, reales y separables (es decir, las mismas que para un problema de
Sturm–Liouville regular) en los extremos del intervalo para la variable espacial:
8 9
@2u @ 2
u < cond. contorno SL regular en x = a, b >
> = a  x  b,
2
ec. ondas: = c , ,
@t2 @x2 >
: @u >
;
u(x, 0) = f (x), (x, 0) = g(x) 0  t.
@t
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 9

8 9
< cond. contorno SL regular en x = a, b = a  x  b,
@T @2T
ec. difusión: = 2, ,
@t @x : ;
T (x, 0) = f (x), 0  t.
Respecto a la ecuación de Poisson, que solo involucra variables espaciales, para que el problema esté bien
planteado hay que imponer condiciones en todos los contornos del dominio espacial, las cuales además deben
verificar ciertas condiciones que no especificamos en este curso:

@2V @2V ciertas cond. contorno en a  x  b,
ec. Poisson: + = Q(x, y), ,
@x2 @y 2 x = a, b y en y = c, d c  y  d.
En todos estos casos los intervalos espaciales se pueden extender al infinito. Estos problemas son los que se
encuentran con más frecuencia en aplicaciones fı́sicas, pero no son los únicos que conducen a problemas bien
planteados para estas ecuaciones. En este curso no entramos en los detalles de la demostración sobre el buen
planteamiento de los problemas: baste decir que el método de resolución que veremos a continuación permite
saber en cada caso especı́fico cuando un problema no está bien planteado.

Una EDP lineal siempre se puede escribir en notación de Dirac como L |ui = |F i, donde L es un operador lineal
diferencial (en varias variables) y |F i es el término inhomogéneo. Las EDPs lineales verifican tres resultados de
gran importancia, que generalizan las correspondientes propiedades de las EDOs lineales (la demostración de
estos teoremas es inmediata):
1. El conjunto de soluciones S de una EDP lineal y homogénea tiene estructura de espacio vectorial:
|ui , |vi 2 S
S := {|wi | L |wi = 0}, ) ↵ |ui + |vi 2 S.
↵, 2 C

2. La solución general de una EDP lineal e inhomogénea, L |ui = |F i, se puede escribir como suma de la
solución general de la EDP homogénea y una solución particular de la inhomogénea.
3. Principio de superposición: si |u1 i es solución de la EDP lineal e inhomogénea L |ui = |F1 i, y |u2 i lo es de
L |ui = |F2 i, entonces la combinación lineal ↵ |u1 i + |u2 i lo es de la EDP L |ui = ↵ |F1 i + |F2 i.

9.3. Separación de variables y desarrollo en autofunciones


En este tema veremos cómo resolver problemas de contorno para EDPs lineales de segundo orden mediante
la representación de la solución como una serie de Fourier generalizada en cierta base ortonormal. La idea es
el equivalente funcional al procedimiento de diagonalizar una matriz A para resolver ecuaciones de la forma
Ax = y: si se conoce una base de autovectores {e1 , . . . eN },
8 N
>
> X
>
> x = x k ek ,
>
>
< k=1
autovectores ) Aek = k ek , base )
>
> N
>
> X
>
> y = y k ek ,
:
k=1

2
entonces se puede resolver la ecuación matricial para el vector x como sigue :
k ek
N
X N
z}|{ ! X N
X
! {ek } base yk yk 1
Ax = y , xk Aek = y k ek ) xk = ) x= ek (= A y).
k k
k=1 k=1 k=1

Como veremos, para algunos tipos de EDPs es posible encontrar soluciones separables, en las que la dependencia
con las variables independientes factoriza, por ejemplo u(x, t) = ⌅(x)⌦(t), lo cual conduce a un problema de
2 Si algún autovalor se anula, entonces el problema no está bien planteado porque la solución o bien no existe, o bien no es única.
10 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

Sturm–Liouville regular: esto permite elegir una base ortonormal para representar la solución de manera que la
EDP adopta una forma muy sencilla (se reduce a un sistema lineal de EDOs, en realidad). Aunque el método
es válido para un número arbitrario de variables independientes, en este curso nos limitaremos por simplicidad
EDPs con dos variables independientes.

1) Cuerda tensa con un extremo fijo y otro libre: calculamos las oscilaciones pequeñas en función de
unas condiciones iniciales genéricas para la posición y la velocidad de cada punto de la cuerda:
8 9
>
> @u >
>
>
< u(0, t) = 0, (L, t) = 0 >
= 0  x  L,
@2u 2
2@ u
@x
= c , ,
@t2 @x2 >
> @u >
>
> 0  t.
: u(x, 0) = f (x), (x, 0) = g(x) >
;
@t
En estas expresiones, L representa la longitud de la cuerda, c la velocidad de propagación de las ondas elásticas,
f (x) es la deformación inicial de la cuerda y g(x) la velocidad vertical inicial de cada punto.

1. Separación de variables y problema de Sturm–Liouville: el primer paso es identificar el problema de Sturm–


Liouville regular asociado y el espacio de Hilbert correspondiente. Para ello se considera la EDP homogénea
y se propone una solución separable u(x, t) = ⌅(x)⌦(t). En este caso, la EDP ya es homogénea y al sustituir
la solución separable se encuentra que efectivamente pueden existir soluciones de esta forma:
función solo de x función solo de t
z }| { z }| {
2 2 2 2
@ u @ u d ⌦(t) d ⌅(x) 1 d2 ⌅(x) 1 d2 ⌦(t)
0= c2 = ⌅(x) c2 ⌦(t) ) = 2 = constante.
@t2 @x2 dt2 dx2 ⌅(x) dx2 c ⌦(t) dt2
Esta expresión sugiere dos posibles problemas de Sturm–Liouville, uno para la variable x y otro para la
variable t. El dominio de esta última, sin embargo, es infinito y además las condiciones iniciales solo se
refieren a un extremo (t = 0): por tanto, esto no conduce a un problema de Sturm–Liouville. Consideramos
pues la variable x e identificamos el operador de Sturm–Liouville J = d2 /dx2 , que es regular en el intervalo
finito 0  x  L pues p(x) = w(x) = 1, q(x) = 0. Las condiciones de contorno en cada extremo del intervalo
también son consistentes con la solución separable:
! 8t 0
u(0, t) = ⌅(0)⌦(t) = 0 ) ⌅(0) = 0 cond. contorno de 1a especie (Dirichlet).
@u ! 8t 0
(L, t) = ⌅0 (L)⌦(t) = 0 ) ⌅0 (L) = 0 cond. contorno de 2a especie (Neumann).
@x
Ası́ pues, el problema de Sturm–Liouville regular asociado en el espacio de Hilbert L2 (0, L) es

9 8
> d2 v(x)
JS |vi = |vi >
> >
> = v(x)
>
> >
> dx2
= <
|vi 2 S ⇢ L2 (0, L) , v(0) = 0, v 0 (L) = 0
>
> >
>
>
> >
>
; >
:
S = {v(x) 2 C 2 [0, L] y v(0) = 0, v 0 (L) = 0} v(x) sol. clásica en 0  x  L
Introduciendo la nueva variable independiente z := x/L, se encuentra un problema de autovalores que ya
se ha resuelto como ejemplo, y cuya solución en las variables de nuestro problema es:
✓ ◆2 2 ✓ ◆
1 ⇡ 1 ⇡x
n = n+ , 'n (x) = Cn sen n + , n = 0, 1, 2 . . .
2 L2 2 L
donde la constante Cn se escoge para que la autofunción sea real y esté normalizada en el espacio L2 (0, L):
Z L ✓ ◆ r
2 1 ⇡x L ! p.ej. 2
k'n k = |Cn |2 dx sen2 n + = |Cn |2 = 1 ! Cn = .
0 2 L 2 L
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 11

φn
2

1
n=0
n=1
x/L
0.2 0.4 0.6 0.8 1.0 n=2
n=3
-1

-2

Figura 9.1: Autofunciones asociadas al operador d2 /dx2 con una condición de contorno de Dirichlet (x = 0) y
otra de Neumann (x = L).

Como era de esperar, los autovalores son simples y forman una sucesión monótonamente decreciente sin
cota inferior. Además, el conjunto {|'0 i , |'1 i , . . . } forma una base ortonormal del espacio L2 (0, L).
2. Desarrollo en autofunciones: se puede ahora expresar la EDP como el problema de un vector que evoluciona
en el espacio de Hilbert L2 (0, L): si |u(t)i denota el ket asociado a la función u(x, t), entonces el problema
de condiciones de contorno se reformula en notación de Dirac como
8 9
>
< |u(t)i 2 S >
=
2
d 2
|u(t)i = c J |u(t)i , , 0  t.
: |u(0)i = |f i , d |u(0)i = |gi >
dt 2 > ;
dt
Como |u(t)i 2 S ⇢ L2 (0, L), se podrá escribir este vector como el siguiente desarrollo en autofunciones,
esto es, como serie de Fourier generalizada:

Z 2R
1
X 1
X L z }| {
u(x, t) = un (t)'n (x) , |u(t)i = un (t) |'n i , un (t) = h'n |u(t) i = dx '⇤n (x) u(x, t).
n=0 n=0 0

Es importante enfatizar que las soluciones buscadas no son separables: la solución u(x, t) se expresa como
una superposición lineal de soluciones separables, pero en general u(x, t) 6= u1 (x)u2 (t). Como vimos en el
paso previo, la búsqueda de soluciones separables solo sirve para identificar el problema de Sturm–Liouville
apropiado; una vez encontrada la base de autofunciones, es innecesario restringirse a soluciones separables,
las cuales, por otra parte, no podrán satisfacer en general todas las condiciones de contorno e iniciales.
Notemos también dos aspectos en estas expresiones que son consecuencia directa del teorema para el
problema de Sturm–Liouville regular: primero, como las autofunciones son reales se puede prescindir de
la conjugación compleja en la evaluación del producto escalar; segundo, como la solución buscada u(x, t)
pertenece al mismo subespacio S en que se resuelve el problema de autovalores, la convergencia de la serie
no es solo en media, sino también puntual, y por ello se ha podido usar el signo = en lugar de ' en el
desarrollo en autofunciones.
El siguiente objetivo es expresar el problema vectorial en términos de las componentes de los vectores en
la base de autofunciones. Para ello, se proyecta la EDP sobre esta base:
✓ 2 ◆
d
h'n | |u(t)i = c2 h'n |J| u(t)i .
dt2
Por una parte se tiene
✓ 2 ◆ Z L Z L
d ⇤ @2 d2 d2 d2 un
h'n | 2
|u(t)i = dx 'n (x) 2
u(x, t) = 2
dx '⇤n (x)u(x, t) = 2 h'n |u(t) i = ,
dt 0 @t dt 0 dt dt2
12 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

donde se puede intercambiar la derivada temporal con la integral porque suponemos que @ 2 u/@t2 es continua
en x y t, lo cual es consistente con la búsqueda de soluciones clásicas, es decir, existen tanto @ 2 u/@t2 como
@ 2 u/@x2 en todos los puntos del dominio de definición del problema (0  x  L, 0  t). Por otra parte, el
elemento de matriz se evalúa como sigue:
h'n |u i
J

= JS
D E z }| {
⇤ ⇤
'n JS†
u,'n 2S S ⇤ n 2R
h'n |J| ui = h'n |JS | ui = u = hu |JS | 'n i = n hu |'n i = n un .

Notemos que este resultado es el mismo que se habrı́a encontrado aplicando el operador J término a término
al desarrollo en autofunciones de |ui, lo cual es efectivamente posible según uno de los teoremas que ya
vimos previamente: de hecho, los pasos que hemos dado son los mismos que los de la demostración de aquel
teorema. En consecuencia, la EDP se convierte en un conjunto de EDOs para los coeficientes un (t):

d2 un
= c2 n un , n = 0, 1, 2 . . .
dt2
Las condiciones iniciales para estas EDOs se deducen igualmente proyectando las condiciones iniciales de
la EDP sobre la base de autofunciones:
Z L
un (0) = h'n |u(0) i = h'n |f i = dx '⇤n (x)f (x) =: fn ,
0

✓ ◆ Z L
dun d
(0) = h'n | |u(t)i = h'n |g i = dx '⇤n (x)g(x) =: gn .
dt dt t=0 0

Es importante entender el paso que se ha dado para llegar hasta aquı́, porque representa la esencia del
método: el objeto matemático relevante es el vector |u(t)i dependiente del tiempo que verifica la segunda
ley de Newton:
aceleración /fuerza armónica
z }| { (lineal en u)
d2 |ui z }| {
= c2 J |ui .
dt2
En la presentación original del problema esta ecuación vectorial se expresaba en la “base de deltas de
Dirac”, por decirlo ası́,
Z L
|u(t)i = dx0 u(x0 , t) |x0 i ,
0

de manera que la EDP y las condiciones de contorno hacı́an referencia a las componentes u(x, t) en esta
base. Hemos sido capaces, sin embargo, de encontrar una base diferente y que refleja mejor las simetrı́as del
problema, de manera que, cuando el mismo problema se expresa en las componentes un (t) del vector |u(t)i
en esta nueva base, se reduce a un conjunto de EDOs desacopladas entre sı́. De manera alternativa, si se
piensa en el operador J representado como una matriz en un espacio vectorial, la EDP original se podrı́a
entender como un sistema de ecuaciones: entonces, el problema de Sturm–Liouville sirve para diagonalizar
la matriz del sistema y convertirlo en un conjunto de EDOs independientes entre sı́.

3. Solución: teniendo en cuenta que ningún se anula, la solución general de cada EDO es de la forma
n

p ✓ ◆
1 ⇡c
un (t) = ↵n cos !n t + n sen !n t, !n = c n = n+ ,
2 L

donde ↵n y n son constantes de integración. En consecuencia, la solución general de la EDP se puede


expresar como
1 1 r 1
X X 2 X !n x
|u(t)i = un (t) |'n i , u(x, t) = un (t)'n (x) = [↵n cos !n t + n sen !n t] sen .
n=0 n=0
L n=0
c
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 13

Notemos que, en la medida en que los coeficientes ↵n y n no están especificados, esta expresión es en
realidad la solución general de la ecuación de ondas: en esta forma de expresar la solución, las funciones
arbitrarias de la EDP aparecen como las listas infinitas {↵0 , ↵1 , ↵2 . . . } y { 0 , 1 , 2 . . . }, las cuales repre-
sentan sendas funciones a través de sus coeficientes de Fourier. Las constantes de integración ↵n , n se
determinan con las condiciones iniciales:
! ! ! 6=0 gn
un (0) = ↵n = fn , u0n (0) = !n n
n
= gn ) n = ,
!n
y la solución particular del problema de condiciones de contorno es
r 1 
2 X gn !n x
u(x, t) = fn cos !n t + sen !n t sen .
L n=0 !n c

4. Discusión fı́sica: la expresión de la solución general representa la evolución de la cuerda tensa como una
superposición de ondas estacionarias, descritas por las autofunciones 'n (x), donde cada una oscila con
una frecuencia caracterı́stica !n tal como describe la función un (t). Se trata de un caso particular de un
resultado genérico: la evolución de un sistema mecánico alrededor de un estado de equilibrio (en este caso,
la cuerda sin deformación) se puede describir como un conjunto de osciladores armónicos desacoplados,
denominados modos normales, con sus correspondientes frecuencias propias !n : en este caso son las ondas
estacionarias, cada una de las cuales obedece, como se ha encontrado, una EDO formalmente análoga a la
de un oscilador armónico.
Es interesante comprobar que, a pesar de las apariencias, esta solución general tiene efectivamente la
forma de la solución de d’Alembert como superposición de dos ondas viajeras: utilizando las identidades
trigonométricas
1 1
cos A sen B = [sen(B A) + sen(B + A)] , sen A sen B = [cos(B A) cos(A + B)] ,
2 2
se puede escribir 
!n x 1 !n (x ct) !n (x + ct)
cos !n t sen = sen + sen ,
c 2 c c

!n x 1 !n (x ct) !n (x + ct)
sen !n t sen = cos cos ,
c 2 c c
y la solución de la EDP se puede efectivamente escribir en la forma de d’Alembert:

Uder (x ct) Uizq (x + ct)


z }| { z }| {
1  1 
1 X !n (x ct) gn !n (x ct) 1 X !n (x + ct) gn !n (x + ct)
u(x, t) = p fn sen + cos +p fn sen cos
2L n=0 c !n c 2L n=0 c !n c
1 1
1X 1 X cgn 0
= fn ['n (x ct) + 'n (x + ct)] + [' (x ct) '0n (x + ct)]
2 n=0 2 n=0 !n2 n

donde Uder representa un perfil que se desplaza sin deformación hacia la derecha y Uizq otro perfil des-
plazándose hacia la izquierda.
5. La expresión obtenida describe soluciones clásicas, esto es, cuando u(x, t) es dos veces derivables en x
en cualquier instante de tiempo (|u(t)i 2 S). Esto impone restricciones sobre las condiciones iniciales
f (x), g(x). Se pueden obtener, sin embargo, soluciones generalizadas o débiles si se relajan las restricciones
y se supone que la expresión final obtenida como desarrollo en autofunciones también describe soluciones
que no están en el subespacio S pero aún pertenecen al espacio completo L2 (0, L). Son dos los argumentos
que subyacen esta expectativa son dos: (i) que el problema está bien planteado y (ii) que el subespacio S
es denso en L2 (0, L). Por tanto, debido a (ii) cualquier vector de este espacio de Hilbert que describa las
14 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

condiciones iniciales se puede aproximar con precisión arbitraria en media, es decir, se puede regularizar
mediante un elemento del subespacio S, mientras que debido a (i) el error cometido no es amplificado en
la solución al resolver el problema de contorno.
Consideremos, a modo de ilustración, la solución correspondiente a la siguiente condición inicial (A 6= 0):
8
✓ ◆ < A, 0 < x < L/2,
L
f (x) = A H x = g(x) = 0.
2 :
0, L/2 < x < L,
Esta condición representa una cuerda inicialmente en reposo y plana en casi todos los puntos excepto
por una deformación muy grande en su punto medio que se modela como una discontinuidad de primera
especie. Es evidente que f 62 S porque no es continua y porque f (0) 6= 0. Sin embargo, se puede intuir que
f se puede aproximar con precisión arbitraria por un elemento del subespacio S: de manera más precisa,
como f 2 L2 (0, L), esta función se puede representar como una serie de Fourier en la base de autofunciones,
1
X N
X
|f i = fk |'k i ) aproximación por suma parcial |fN i = fk |'k i 2 S,
k=1 k=1

donde la aproximación se puede hacer arbitrariamente buena tomando N tan grande como haga falta:
geométricamente, se puede esperar que la gráfica de la suma parcial fN (x) se parezca a la de f (x), pero
regularizando los saltos en un intervalo pequeño alrededor del punto x = L/2 y en otro cerca de x = 0.
Los coeficientes del desarrollo son
r Z L/2 ✓ ◆ p 
2 1 ⇡x A 2L (2n + 1)⇡
fn = h'n |f i = dx A sen n + = 1 cos .
L 0 2 L ⇡(n + 1/2) 4
Como gn = 0, la solución de la ecuación de ondas será simplemente (notemos que ahora solo está justificado
el signo de igualdad en media ')

1 hˆ i
1 1
1X 1X
u(x, t) ' fn 'n (x + ct) + fn 'n (x ct) = f (x + ct) + fˆ(x ct) ,
2 n=0 2 n=0 2

donde se ha definido la suma


1
X
fˆ(x) := fn 'n (x), 1 < x < 1,
n=0

que, al contrario que la función original f (x), está definida en todo el eje real3 . La evolución no elimina
las discontinuidades iniciales, sino que las propaga sin deformación. Otra forma de ver esto es que los
coeficientes de la solución en el desarrollo en autofunciones decaen igual de lentamente con el ı́ndice n que
los de condición inicial, |fn | ⇠ 1/n: esto indica que las autofunciones con muchos ceros (n grande) tienen
una contribución apreciable para conseguir representar la discontinuidad.

2) Varilla con extremos aislados térmicamente sometida a calentamiento: calculamos el perfil de tem-
peratura en la varilla a partir de una condición inicial genérica:
8 9
> @T @T >
2 < (0, t) = (L, t) = 0, = 0  x  L,
@T @ T @x @x
=  2 + Q(x, t), ,
@t @x >
: >
;
T (x, 0) = f (x) 0  t.

La varilla tienen una longitud L y una conductividad térmica , mientras que f (x) especifica la temperatura
inicial y Q(x, t) representa un término espacialmente no uniforme de inyección o absorción de calor.
3 Esta suma se podrı́a evaluar si conociéramos el análogo al teorema de Fourier sobre convergencia puntual para esta base de

autofunciones .
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 15

φn
2

1
n=0
n=1
x/L
0.2 0.4 0.6 0.8 1.0 n=2
n=3
-1

-2

Figura 9.2: Autofunciones asociadas al operador d2 /dx2 con condiciones de contorno de Neumann.

1. Separación de variables y problema de Sturm–Liouville: buscamos soluciones separables T (x, t) = ⌅(x)⌦(t)


de la EDP homogénea:
función solo de x función solo de t
z }| { z }| {
2 2
@T @ T d⌦(t) d ⌅(x) 1 d2 ⌅(x) 1 d2 ⌦(t)
0=  = ⌅(x) ⌦(t) ) = = constante.
@t @x2 dt dx2 ⌅(x) dx2 ⌦(t) dt2

Como en el ejemplo previo, nos centramos en la variable x, que tiene un dominio finito y condiciones de
contorno en las fronteras del mismo, las cuales también son consistentes con la solución separable:

@T ! 8t 0
(0, t) = ⌅0 (0)⌦(t) = 0 ) ⌅0 (0) = 0 cond. contorno de 2a especie (Neumann),
@x
@T ! 8t 0
(L, t) = ⌅0 (L)⌦(t) = 0 ) ⌅0 (L) = 0 cond. contorno de 2a especie (Neumann).
@x
Ası́ pues, el problema de Sturm–Liouville regular asociado en el espacio de Hilbert L2 (0, L) es
9 8
> d2 v(x)
JS |vi = |vi >
> >
> = v(x)
>
> >
> dx2
= <
|vi 2 S ⇢ L2 (0, L) , v 0 (0) = v 0 (L) = 0
>
> >
>
>
> >
>
; >
:
S = {v(x) 2 C 2 [0, L] y v 0 (0) = v 0 (L) = 0} v(x) sol. clásica en 0  x  L

Se trata de un problema de autovalores que ya se ha resuelto en el boletı́n:


⇣ n⇡ ⌘2 r
1 2 n⇡x
0 = 0, '0 (x) = p , n = , 'n (x) = cos , n = 1, 2, . . .
L L L L

Los autovalores son simples, forman una sucesión monótonamente decreciente sin cota inferior y el conjunto
{|'0 i , |'1 i , . . . } forma una base ortonormal del espacio L2 (0, L).

2. Desarrollo en autofunciones: se puede ahora formular la EDP como el problema de un vector que evoluciona
en el espacio de Hilbert L2 (0, L): si |T (t)i denota el ket asociado a la función T (x, t), y |Q(t)i el ket asociado
a Q(x, t) (suponemos que esta última, como función de x, también pertenece al espacio L2 (0, L)), entonces
el problema de condiciones de contorno se reformula en notación de Dirac como
8 9
d < |T (t)i 2 S =
|T (t)i = J |T (t)i + |Q(t)i , , 0  t.
dt : ;
|T (0)i = |f i
16 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

Como |T (t)i 2 S ⇢ L2 (0, L), se podrá escribir este vector como el siguiente desarrollo en autofunciones:
1
X 1
X Z L
T (x, t) = ✓n (t)'n (x) , |T (t)i = ✓n (t) |'n i , ✓n (t) = h'n |T (t) i = dx '⇤n (x)T (x, t).
n=0 n=0 0

A continuación se expresa el problema en las componentes de los vectores respecto a la nueva base de
autofunciones. La EDP se proyecta sobre esta base:
✓ ◆
d
h'n | |T (t)i =  h'n |J| T (t)i + h'n |Q(t) i .
dt

Se tiene
✓ ◆ Z L Z L
d @ d d d✓n
h'n | |T (t)i = dx '⇤n (x) T (x, t) = dx '⇤n (x)T (x, t) = h'n |T (t) i = ,
dt 0 @t dt 0 dt dt

donde se puede intercambiar la derivada temporal con la integral porque suponemos que @T /@t es continua
en x y t. Por otra parte, el elemento de matriz se evalúa como sigue:
h'n |T i
J

= JS
D E z }| {
⇤ ⇤
'n JS†
T ,'n 2S S ⇤ n 2R
h'n |J| T i = h'n |JS | T i = T = hT |JS | 'n i = n hT |'n i = n ✓n .

Finalmente, se tienen los coeficientes


Z L
qn (t) := h'n |Q(t) i = dx '⇤n (x)Q(x, t).
0

En consecuencia, la EDP se convierte en un conjunto de EDOs para los coeficientes ✓n (t):

d✓n
= n ✓n + qn (t), n = 0, 1, 2 . . .
dt
Las condiciones iniciales para estas EDOs se deducen igualmente proyectando la condición inicial de la
EDP sobre la base de autofunciones:
Z L
✓n (0) = h'n |T (0) i = h'n |f i = dx '⇤n (x)f (x) =: fn .
0

3. Solución: la solución del problema de condiciones iniciales para las EDOs es


Z t Z t
 nt
✓0 (t) = f0 + d⌧ qn (⌧ ), ✓n6=0 (t) = fn e + d⌧ qn (⌧ )e n (t ⌧)
,
0 0

y, por tanto, la solución del problema de condiciones de contorno se escribe como


=:Tf (x,t)
z r 1 }| {
1
X f0 2 X (n⇡/L)2 t n⇡x
T (x, t) = ✓n (t)'n (x) = p + fn e cos
n=0
L L n=1 L
Z t r 1 Z t
1 2 X n⇡x (n⇡/L)2 (t ⌧ )
+p d⌧ qn (⌧ ) + cos d⌧ qn (⌧ )e .
L 0 L n=1 L 0
| {z }
=:Tq (x,t)

4. Discusión fı́sica: la solución general aparece como la suma de una solución del problema homógeneo
(Tf (x, t)) y una solución del problema inhomógeneo (Tq (x, t)). En particular, la solución del problema
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 17

homogéneo (Q ⌘ 0 ) Tq ⌘ 0) tiene la estructura de una superposición de perfiles, dados por las funciones
'n (x), cuya amplitud decae exponencialmente si n 6= 0 en una escala de tiempo ⇠ ( n ) 1 / n 2 , esto es,
tanto más rápido cuanto mayor es n. Por tanto, para tiempos largos se verifica asintóticamente
Z L
t!+1 f 1 1
Tf (x, t) ⇠ p0 = p h'0 |T (0) i = dx T (x, 0).
L L L 0

Este resultado representa conservación de energı́a, manifestada por la existencia de un autovalor nulo ( 0
en este caso): como los extremos de la varilla están aislados, la energı́a inicial se redistribuye hasta que
la temperatura se vuelve homogénea e igual al promedio del perfil inicial de temperatura. Y en efecto, la
temperatura promedio no depende del tiempo:
Z L
1 1 ✓0 (t) f0
dx Tf (x, t) = p h'0 |Tf (t) i = p = p .
L 0 L L L

5. La condición |T (t)i 2 S para todo instante de tiempo impone en general restricciones sobre la forma de la
condición inicial f (x) y del término de fuente Q(x, t). Estas restricciones, sin embargo, se pueden relajar y,
como en el ejemplo previo, la expresión de la solución como desarrollo en autofunciones se puede emplear
para encontrar soluciones generalizadas sobre la base de que el problema está bien planteado y que la
solución no pertenecen al subespacio S.
A modo de ejemplo, consideremos una varilla con una temperatura inicial homogénea, T (x, 0) = f (x) = T0 ,
y una fuente de calor que es discontinua:
8
✓ ◆ < B, 0 < x < L/2,
L
Q(x, t) = B H x =
2 :
0, L/2 < x < L,

donde la constante B > 0 representa inyección de calor en la mitad izquierda de la varilla. Por tanto,
8 p
>
> B L
Z L Z L/2 >
< , n = 0,
⇤ ⇤
2
qn := h'n |Q i = dx 'n (x)Q(x) = B dx 'n (x) = p
0 0 >
>
>
: B 2L sen n⇡ , n 6= 0,
n⇡ 2
8
> 1, n = 0
>
>
p >>
B L < 23/2 ( 1)(n 1)/2
= , n = 1, 3, . . .
2 >> n⇡
>
>
>
:
0, n = 2, 4, . . .

La solución del problema es pues (ahora solo podemos asegurar la igualdad en media ')
⇣p ⌘ 1
X e nt
1
T (x, t) ' L T0 + q0 t '0 (x) + qn 'n (x).
n=1
 n

Como qn = 0 si n es par no nulo, la solución se podrá escribir finalmente como

2BL2 X ( 1)m h i
1
1 ((2m 1)/⇡L)2 t (2m 1)⇡x
T (x, t) ' T0 + Bt + e 1 cos .
2 ⇡ m=1 (2m 1)3
3 L

Notemos que los coeficientes de la serie decaen con el número de ceros de la autofunción más rápidamente
(como ⇠ 1/m3 ) que los del término de fuente (|qn | ⇠ 1/n). Esto denota que la ecuación del calor, al
18 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

0.10

Q(x)/10B
κW/B
0.05

x/L
0.2 0.4 0.6 0.8 1.0

-0.05

Figura 9.3: Perfil estacionario de temperatura en una varilla calentada de manera no uniforme.

contrario que la de ondas, tiende a regularizar las discontinuidades, de manera que las autofunciones con
muchos ceros (n grandes) no contribuyen tanto a la representación de la solución.
Para tiempos largos el perfil de temperatura toma la forma
1
t!+1 1 2BL2 X ( 1)m+1 (2m 1)⇡x
T (x, t) ⇠ T0 + Bt + W (x), W (x) ' cos .
2 ⇡ m=1 (2m 1)3
3 L

El primer término representa el crecimiento monótono de la temperatura debido a que se inyecta calor que
no puede escapar por las extremos aislados térmicamente, mientras que el perfil W (x) representa un perfil
inhomogéneo de la temperatura debido a que el término Q(x) de inyección de calor no es espacialmente
homogéneo. De hecho, se puede encontrar la expresión analı́tica de W (x) como sigue: introduciendo esta
forma asintótica en la EDP original, se encuentra una EDO para W (x) con condiciones de contorno,
d2 W B
+ Q(x)  = 0, W 0 (0) = W 0 (L) = 0.
dx2 2
La integral primera de la EDO que verifica la condición W 0 (0) = 0 es
(1/2) signo (L/2 ⇠)
Z z
 ✓ }| ◆ { Z ✓ ◆ ⇢
x x
dW B L 1 B L B x, x < L/2,
= d⇠ H ⇠ = d⇠ signo ⇠ =
dx  0 2 2 2 0 2 2 L x, L/2 < x.
Esta expresión satisface automáticamente la otra condición, W 0 (L) = 0. Por tanto, al integrar una vez más
aparece una constante de integración nueva que se debe determinar a partir de otra condición proporcio-
nada por la solución completa T (x, t): en este caso, el desarrollo en autofunciones para W (x) encontrado
previamente permite obtener inmediatamente W (L/2) = 0 y entonces se puede escribir el resultado final
como
8 ✓ ◆2
>
> 2 L
Z x >
> x , x < L/2,
dW B < 2
W (x) = d⇠ =
L/2 d⇠ 4 >
> ✓ ◆2
>
> L
: (L x)2 , L/2 < x,
2
2 8 93
✓ ◆✓ ◆ > 0, x < L/2 >
B 6 L L < =
7
= 4 x +x + 2 5.
4 2 2 >
: (L 2x) >
, L/2 < x ;
2
Este perfil indica que la temperatura en la mitad que está siendo calentada (x < L/2) es mayor que en la
otra mitad y que el flujo de calor jT = @T /@x = W 0 (x) es máximo en x = L/2.
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 19

6. Otro ejemplo que involucra distribuciones: consideremos la difusión de partı́culas cuando todas están ini-
cialmente concentradas en el punto medio del intervalo. El campo densidad de masa %(x, t) verifica el
problema de condiciones de contorno
8 9
> @% @% >
>
> (0, t) = (L, t) = 0, >
>
< @x @x = 0  x  L,
@% @2%
= D 2, ✓ ◆ > ,
@t @x >
> L >
>
: %(x, 0) = M x >
; 0  t.
2
En estas ecuaciones, D es el coeficiente de difusión y M es la masa total de las partı́culas,
Z L
dx %(x, 0) = M.
0

Evidentemente, el campo inicial no pertenece al subespacio S, pero se puede aproximar (regularizar)


mediante un elemento del subespacio con precisión arbitraria. La solución de este problema se puede
escribir inmediatamente a partir de las expresiones previas con las sustituciones qn ! 0,  ! D, y
Z L ✓ ◆
L
fn ! h'n |%(t = 0) i = dx '⇤n (x)M x = M 'n (L/2).
0 2
Entonces,
0 si n impar 2 3
1 z }| { 1
M 2M X 2
(n⇡/L) t n⇡ n⇡x M6 X 2 2⇡mx 7
%(x, t) ' + e cos cos = 41 + 2 ( 1)m e (2⇡m/L) t cos 5.
L L n=1 2 L L m=1
| {z } L
=:cm (t)

Podemos comprobar explı́citamente la conservación de masa:


Z
1 L 1 M
dx %(x, t) = p h'0 |%(t) i = .
L 0 L L
En el instante inicial los coeficientes de la serie toman la forma cm (0) = ( 1)m , los cuales no verifican
el lema de Riemann–Lebesgue porque la serie representa una delta de Dirac. Pero en cualquier instante
posterior (t > 0) los coeficientes se anulan muy rápidamente (exponencialmente) con el ı́ndice m y la serie
representa una función muy suave. De nuevo comprobamos que el efecto de la ecuación de difusión, al
contrario que la ecuación de ondas, es regularizar la singularidad y propagar su efecto de manera rápida
(formalmente con velocidad infinita, si se compara con el caso de la ecuación de ondas).

3) Potencial electrostático entre paredes conductoras y cargadas: calculemos el potencial electrostáti-


co en un dominio cuadrado cuando todas menos una de las paredes están conectadas a tierra:
8 9
2 2
>
< V (0, y) = V (L, y) = V (x, 0) = 0 >
=
@ V @ V
r2 V = + = 0, x , 0  x, y  L.
@x2 @y 2 >
: V (x, L) = V0
>
;
L
La ecuación de Laplace indica ausencia de cargas en el interior del dominio, mientras que las condiciones de
contorno en x = 0, L y en y = 0 corresponden a las paredes conductoras conectadas a tierra. La condición
de contorno en y = L especifica un perfil de potencial con V0 6= 0 una constante dada. Se debe notar que las
condiciones de contorno implican que el potencial es discontinuo al menos en el contorno, pues el valor V (L, L)
no está bien definido:
V0 = lı́m V (x, L) 6= lı́m V (L, y) = 0.
x!L y!L

Por tanto, estamos en realidad buscando una solución generalizada del problema. Se puede demostrar, sin
embargo, que dentro del dominio la solución V (x, y) es dos veces derivable, esto es, como una solución clásica:
nosotros supodremos esta propiedad, que será corroborada a posteriori por nuestro resultado.
20 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

1. Separación de variables y problema de Sturm–Liouville: proponiendo una solución separable V (x, y) =


⌅(x)⌥(y) para la EDP homogénea, se encuentra
función solo de x función solo de y
z }| { z }| {
2 2 2 2
@ V @ V d ⌅(x) d ⌥(y) 1 d2 ⌅(x) 1 d2 ⌥(y)
0= + = ⌥(y) + ⌅(x) ) = = constante.
@x2 @y 2 dx2 dy 2 ⌅(x) dx2 ⌥(y) dy 2
En este caso las dos variables independientes tienen un intervalo finito y condiciones de contorno en cada
extremo del intervalo, ası́ que se puede elegir entre dos posibles problemas de Sturm–Liouville regulares.
La única diferencia radica en las condiciones de contorno: el hecho de que las dos condiciones en la variable
x ya son homogéneas es un argumento para preferir este problema, y se deja como ejercicio.
En su lugar y a modo de ilustración de cómo proceder cuando no existe la posibilidad de elegir, vamos a
considerar el problema de autovalores en la variable y. La versión homogénea de las condiciones de contorno
en y también son consistentes con la solución separable:
! 8x2[0,L]
V (x, 0) = ⌅(x)⌥(0) = 0 ) ⌥(0) = 0 cond. contorno de 1a especie (Dirichlet),
! 8x2[0,L]
V (x, L) = ⌅(x)⌥(L) = 0 ) ⌥(L) = 0 cond. contorno de 1a especie (Dirichlet).
Ası́ pues, el problema de Sturm–Liouville regular asociado es
8
9 > d2 v(y)
JS |vi = |vi > >
> = v(y)
>
> >
> dy 2
>
= >
<
|vi 2 S ⇢ L2 (0, L) ,
>
> >
> v(0) = v(L) = 0
>
> >
>
2 ; >
>
S = {v(y) 2 C [0, L] y v(0) = v(L) = 0} :
v(y) sol. clásica en 0  y  L
Introduciendo el cambio de variable independiente z = (2y L)/L se encuentra un problema en el espacio
L2 ( 1, 1) que ya se ha resuelto como ejemplo, y cuya solución en las variables de nuestro problema es:
⇣ n⇡ ⌘2 r
2 n⇡y
n = , 'n (y) = sen , n = 1, 2, . . .
L L L
Los autovalores son simples, forman una sucesión monótonamente decreciente sin cota inferior y el conjunto
{|'1 i , |'2 i , . . . } forma una base ortonormal del espacio L2 (0, L).
2. Desarrollo en autofunciones: el problema se formula en términos del vector |V (x)i 2 L2 (0, L) como
8 9
d2 < |V (x)i 2 {f (y) 2 C 2 [0, L] y f (0) = 0, f (L) = V0 x/L} =
6 S =
|V (x)i = J |V (x)i , , 0  x  L.
dx2 : ;
|V (0)i = |V (L)i = 0

φn
2

1
n=1
n=2
x/L
0.2 0.4 0.6 0.8 1.0 n=3
n=4
-1

-2

Figura 9.4: Autofunciones asociadas al operador d2 /dx2 con condiciones de contorno de Dirichlet.
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 21

Notemos que, debido a la condición de contorno inhomogénea, el vector |V (x)i no pertenece al subespacio
S en el cual se ha formulado el problema de Sturm–Liouville asociado. A pesar de ello, |V (x)i 2 L2 (0, L)
y el vector se podrá expresar como un desarrollo en autofunciones (que será igual en media, pero quizás
no puntualmente, a la solución):
1
X 1
X Z L
V (x, y) ' vn (x)'n (y) , |V (x)i = vn (x) |'n i , vn (x) = h'n |V (x) i = dy '⇤n (y)V (x, y).
n=0 n=0 0

Entonces se proyecta la EDP sobre esta base de autofunciones:


✓ 2 ◆
d
h'n | |V (x)i = h'n |J| V (x)i .
dx2

Para el primer término se tiene


✓ 2 ◆ Z L Z L
d ⇤ @2 d2 d2 d2 v n
h'n | 2
|V (x)i = dy 'n (y) 2
V (x, y) = 2
dy '⇤n (y)V (x, y) = 2 h'n |V (x) i = ,
dx 0 @x dx 0 dx dx2

donde se puede intercambiar la derivada segunda con la integral porque suponemos que @ 2 V /@ 2 x es continua
en x e y. Para evaluar el elemento de matriz, sin embargo, nos encontramos con que

h'n |J| V (x)i =


6 h'n |JS | V (x)i ,

puesto que |V (x)i 62 S. Por tanto, no podemos razonar como en los ejemplos previos ya que el operador
J no restringido no es necesariamente hermı́tico. Debemos evaluar el elemento de matriz incorporando
explı́citamente la condición de contorno inhomogénea en y = L:
0 pues 'n (0)='n (L)=0
z}| {
Z L  L Z L
@ V2
@V d'⇤n @V
h'n |J| V (x)i = dy '⇤n (y) 2 = '⇤n (y) dy
0 @y @y y=0 0 dy @y
 L Z L
d'⇤ (y) d2 '⇤n
= V (x, y) n + dy V (x, y)
dy y=0 0 dy 2
| {z } | {z }

6=0 n 'n (y)

= V (x, L)'0n (L) + n h'n |V (x) i

V0 0
= x ' (L) + n vn (x).
L n
Por lo tanto, la EDP proyectada se convierte en un sistema de EDOs inhomogéneas,

d2 v n V0 0
= n vn (x) +x ' (L), n = 1, 2, . . .
dx2 L n
que se complementan con la proyección de las condiciones de contorno en la variable x:

vn (0) = h'n |V (0) i = 0, vn (L) = h'n |V (L) i = 0.


p
3. Solución: introduciendo µn := n,
la solución general de la EDO es de la forma
Z x
V0 0
vn (x) = ↵ cosh µn x + senh µn x + 'n (L) d⇠ ⇠ senh µn (x ⇠)
Lµn 0

V0 0 V0
= ↵ cosh µn x + ' (L) senh µn x x 2 '0n (L).
Lµ3n n Lµn
22 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

Figura 9.5: Potencial electrostático V (x, y): las lı́neas azules señalan el valor impuesto por las condiciones de
contorno, las lı́neas verdes son equipotenciales.

Las condiciones de contorno permiten determinar las constantes de integración ↵ y :



! V0 0 V0 0 ! V0 0 V0 '0 (L)
vn (0) = ↵ = 0, vn (L) = 3
'n (L) senh µn L 2
'n (L) = 0 ) 3
'n (L) = 2 n .
Lµn µn Lµn µn senh µn L

Por tanto, 
V0 '0n (L) senh µn x x
vn (x) = ,
µ2n senh µn L L
y la solución del problema de contorno original es pues
1
X X1 
( 1)n senh n⇡x/L x n⇡y
V (x, y) ' vn (x)'n (y) = 2V0 sen ,
n=1 n=1
n⇡ senh n⇡ L L
p
teniendo en cuenta que µn = n⇡/L y '0n (L) = 2/L µn cos n⇡. Podemos identificar la suma de una de las
series porque ya se calculó como ejemplo,

X1
( 1)n n⇡y y
sen = ,
n=1
n⇡ L 2L

de manera que " #


X1
xy ( 1)n n⇡x n⇡y
V (x, y) ' V0 +2 senh sen .
L2 n=1
n⇡ senh n⇡ L L

4. Discusión fı́sica: esta solución describe un campo muy suave (de hecho, infinitamente derivable) en casi
todos los puntos del dominio, puesto que los coeficientes de la serie de Fourier se anulan rápidamente
(exponencialmente) con el ı́ndice n,

1 n⇡x n!1 1 n⇡(x L)/L x<L


senh ⇠ e ! 0.
n⇡ senh n⇡ L n⇡
Solo en el tramo x = L la serie converge mucho más lentamente, reflejando la discontinuidad en las
condiciones de contorno; y en efecto, la representación encontrada para la solución es discontinua en el
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 23

punto x = y = L:
" 1
#
x x!L y X ( 1)n n⇡y
V (x, L) = V0 ! V0 , V (L, y) = V0 +2 sen = 0.
L L n=1
n⇡ L

En conclusión, la singularidad debida a la condición de contorno es regularizada y no se propaga dentro


del dominio.

4) Ecuación hiperbólica, parabólica o elı́ptica: los tres ejemplos anteriores ilustran comportamientos cua-
litativos diferentes que permiten clasificar de manera general las EDPs de segundo orden en tres categorı́as, según
cómo se formulen las condiciones de contorno/iniciales para tener un problema bien planteado y cómo los efectos
de estas condiciones se manifiestan en la solución:
1. Ecuaciones hiperbólicas, como la ecuación de ondas: alguna de las variables independientes se puede inter-
pretar como el tiempo de manera que se pueden imponer condiciones iniciales. Además, la solución describe
la propagación de estas condiciones al resto del dominio con velocidad finita. Ası́, en el ejemplo trabajado
con la discontinuidad inicial en x = L/2, el extremo derecho de la cuerda no se ve afectado por la presencia
de una discontinuidad hasta transcurrido un intervalo de tiempo t = L/2c.
2. Ecuaciones parabólicas, como la ecuación de difusión: alguna de las variables independientes se puede
interpretar como el tiempo de manera que se pueden imponer condiciones iniciales. Además, la solución
describe la propagación de estas condiciones al resto del dominio pero instantáneamente (esto es, formal-
mente con velocidad infinita). Ası́, en el ejemplo trabajado con una delta de Dirac inicial en x = L/2, el
campo densidad se ve modificado en todos los puntos del intervalo 0 < x < L en cuanto t > 0.
3. Ecuaciones elı́pticas, como la ecuación de Poisson o la de Laplace: ninguna de las variables independientes
se puede interpretar como temporal, puesto que hay que imponer condiciones de contorno en todas las
fronteras, incluyendo el caso de que la frontera esté en el infinito si el dominio no está acotado. Este tipo
de ecuaciones suele describir situaciones fı́sicas estacionarias, en las cuales los datos en las fronteras del
contorno determinan el estado dentro del dominio.
Para ilustrar la importancia de las condiciones de contorno a la hora de garantizar un problema bien planteado,
veamos el siguiente ejemplo:
8 9
>
< V (x, 0) = V (x, L) = 0 >
= 0  y  L,
2 2
@ V @ V
r2 V = + = 0, ,
@x2 @y 2 : V (0, y) = f (y), @V (0, y) = 0 >
> ; 0  x.
@x
Se trata de un problema para la ecuación de Poisson pero con condiciones iniciales en la variable x, pues solo se
imponen restricciones en la frontera x = 0 del dominio para esta variable. Podemos emplear el mismo desarrollo
en autofunciones en la variable y del ejemplo anterior y escribir la solución general como
1 r 1 r Z L
X 2 X n⇡x n⇡y 2 n⇡y
V (x, y) ' vn (x)'n (y) = fn cosh sen , fn = h'n |f i = dy f (y) sen .
n=1
L n=1
L L L 0 L

Los coeficientes de la serie que representa la solución crecen sin cota cuando x ! +1, sugiriendo una divergencia
fı́sicamente inadmisible. En efecto, consideremos por ejemplo el caso de una condición inicial que representa la
pared de x = 0 conectada a tierra (esto es, potencial nulo) excepto por pequeñas fluctuaciones microscópicas
debidas a la granularidad a escala molecular:
M ⇡y
f (x) = " sen , " ! 0, M 1.
L
Entonces, r r r
Z L
2 M ⇡y n⇡y L L
fn = " dy sen sen =" h'n |'M i = " n,M ,
L 0 L L 2 2
24 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

y por tanto,
M ⇡x M ⇡y
V (x, y) ' " cosh sen .
L L
Según esta expresión, la desviación respecto a la solución en ausencia de granularidad (V (x, y) ⌘ 0) crece cuanto
mayor es x y por tanto el problema no está bien planteado, puesto que pequeñas desviaciones en x = 0 inducen
cambios enormes en la solución para x arbitrariamente grande. En términos fı́sicos, este resultado indicarı́a
que, incluso si nuestros aparatos de medida careciesen de la precisión necesaria (del orden de ") para apreciar
la granularidad molecular cerca de la pared en x = 0, podrı́amos alejarnos lo suficiente para ser capaces de
detectarla, puesto que a una distancia x = R las variaciones espaciales del potencial tendrı́an una amplitud
mayor por un factor cosh(M ⇡R/L) 1.

5) Cilindro infinito cargado: calculemos el campo eléctrico E(r) creado por un cilindro de radio a con una
densidad superficial de carga (r) especificada. Este campo satisface las ecuaciones
8 9 8 9
< r⇥E=0 = < er · E(r) ⇢=a = ( , z)/✏0 = a  ⇢ < 1,
, , 0  < 2⇡,
: ; : ⇢!1 ;
r·E=0 E(r) ! 0 1 < z < 1,

expresada en coordenadas cilı́ndricas con el eje Z a lo largo del eje del cilindro. La condición de contorno en
la superficie del cilindro (⇢ = a) expresa la componente normal del campo eléctrico en términos de la densidad
superficial de carga. La condición de contorno en el infinito garantiza que no existen campos debidos a fuentes
lejanas, es decir, que el campo eléctrico que se obtenga se debe solo a la esfera cargada. Introduciendo el potencial
electrostático como E = rV , el problema se transforma en
8 9
✓ ◆ >
> @V ( , z) >
>
< (a, , z) = = a  ⇢ < 1,
1 @ @V 1 @2V @2V @⇢ ✏0
r2 V = ⇢ + 2 2
+ 2
= 0, , 0  < 2⇡,
⇢ @⇢ @⇢ ⇢ @ @z >
> >
>
: ⇢!1 ; 1 < z < 1.
rV (r) ! 0

Para simplificar el problema, supondremos que la densidad de carga no depende de la altura en el cilindro, ( ),
de manera que por simetrı́a es suficiente buscar soluciones de la forma V (⇢, ). Es decir, el problema se reduce
a trabajar en un plano z = constante y es, de manera efectiva, bidimensional.

1. Separación de variables y problema de Sturm–Liouville: se propone una solución separable V (⇢, ) =


R(⇢)F ( ) para la EDP, que ya es homogénea, y se encuentra
✓ ◆
F( ) d dR(⇢) R(⇢) d2 F ( )
0 = r2 V = ⇢ + 2
⇢ d⇢ d⇢ ⇢ d 2
✓ ◆
⇢ d dR(⇢) 1 d2 F ( )
) ⇢ = = constante.
R(⇢) d⇢ d⇢ F( ) d 2
| {z } | {z }
función solo de ⇢ función solo de

Por tanto, la EDP admite soluciones separables. También la versión homogénea de las condiciones de
contorno:
@V ! 8 2[0,2⇡)
(a, ) = F ( )R0 (a) = 0 ) R0 (a) = 0 cond. contorno de 2a especie (Neumann).
@⇢
R(⇢) 0 8 2[0,2⇡) R(⇢)
rV = e⇢ F ( )R0 (⇢) + e lı́m R0 (⇢),
⇢!1
F ( ) ! 0 ) =0 cond. de acotación.
⇢ ⇢!1 ⇢
Tenemos dos posibles problemas de Sturm–Liouville: el de la variable ⇢ es singular porque el dominio es
infinito, mientras que en la variable es periódico porque los extremos = 0 y = 2⇡ del intervalo en la
variable representan el mismo punto fı́sicamente, ası́ que todos los campos deben tomar el mismo valor
en para = 0 y = 2⇡. Elegimos este segundo problema (notemos que la función peso w(x) = 1 cumple
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 25

φn

1
2

n=0
n=1,q=1
n=1,q=2
ϕ
π 3π
π 2π n=2,q=1
2 2

n=2,q=2

1
-
2

Figura 9.6: Autofunciones en la variable del problema del cilindro cargado.

efectivamente la condición de periodicidad exigida para un problema de Sturm–Liouville periódico, esto es,
w(0) = w(2⇡)):
8 2
>
> d v( )
9 >
> = v( ),
>
> d 2
JS |vi = |vi >
> >
>
>
> >
>
= <
v(0) = v(2⇡),
|vi 2 S ⇢ L2 (0, 2⇡) , 0
>
> >
> v (0) = v 0 (2⇡),
>
> >
>
; >
> v( ) sol. clásica,
S := {f (x) 2 C 2 [0, 2⇡], f (0) = f (2⇡), f 0 (0) = f 0 (2⇡)} >
>
>
>
:
0  < 2⇡.
Este problema de autovalores, ya resuelto como ejemplo, conduce a la base trigonométrica:
8 9 8 9
1 > 1 >
>
> ' ( ) = p >
> >
> '0 ( ) = p >
>
>
> 0
2⇡ >
> >
> 2⇡ >
>
>
> >
> >
> >
>
>
> >
> >
> >
>
>
< >
= >
< >
=
cos n ein
n = 0, 1, 2 . . . : n =
2
n , 'n,1 ( ) = p , '(+)
n ( )= p .
>
> ⇡ >
> >
> 2⇡ >
>
>
> >
> >
> >
>
>
> >
> >
> >
>
>
> >
sen n > >
> e in >
>
>
: 'n,2 ( ) = p >
; >
> >
>
⇡ : '(n ) ( ) = p ;
2⇡
Debido a que el problema es periódico, existen autovalores con degeneración doble (en este caso todos
menos el primero).
2. Desarrollo en autofunciones: se expresa el problema de condiciones de contorno para el vector |V (⇢)i 2
L2 (0, 2⇡):
8 9
> |V (⇢)i 2 S >
>
> >
>
>
> >
>
✓ ◆ >
> >
>
< d |V (⇢)i 1 =
d d |V (⇢)i = | i ,
⇢ ⇢ + J |V (⇢)i = 0, d⇢ ⇢=a ✏ 0 , a  ⇢ < 1,
d⇢ d⇢ >
> >
>
>
> >
>
>
> >
>
: lı́m d |V (⇢)i , |V (⇢)i = 0. >
> ;
⇢!1 d⇢ ⇢
donde | i denota el ket asociado a la función ( ). Se proyecta el problema en la base de autovectores,
teniendo en cuenta que el operador J es hermı́tico en el subespacio S (debido a la degeneración de los
autovalores, debemos introducir un segundo ı́ndice q = 1, 2 en las expresiones que siguen):
1 X
X 2 Z 2⇡
|V (⇢)i = v0 (⇢) |'0 i + vn,q (⇢) |'n,q i , vn,q (⇢) = h'n,q |V (⇢) i = d '⇤n,q ( ) V (⇢, ),
n=1 q=1 0
26 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

8 9
> dvn,q 1
h'n,q | i >
n,q
✓ ◆ z}|{
n >
> (⇢ = a) = := >
>
d dvn,q < d⇢ ✏0 ✏0 =
⇢ ⇢ n2 vn,q = 0, , a  ⇢ < 1.
d⇢ d⇢ >
> dvn,q vn,q (⇢) >
>
>
: lı́m , = 0. >
;
⇢!1 d⇢ ⇢
3. Solución: la EDO para vn,q (r) es una ecuación de Euler, cuya solución general es

0
v0 (⇢) = ↵0 + 0 ln ⇢ ) v00 (⇢) = ,

dvn,q
vn,q (⇢) = ↵n,q ⇢n + n,q ⇢
n
) = n↵n,q ⇢n 1
n n,q ⇢
n 1
, n = 1, 2 . . .
d⇢
Las condiciones de contorno en el infinito implican ↵ = 0 si n = 1, 2 . . . , pero no hay restricción si n = 0.
Ası́ pues, queda
⇢ ⇢
↵0 + 0 ln ⇢ n = 0 dvn,q 0 /⇢ n=0
vn,q (r) = n ) = n 1
n,q ⇢ , n = 1, 2, . . . d⇢ n n,q ⇢ . n = 1, 2, . . .

La segunda condición de contorno implica:


dv0 0 ! 0 a 0 a 0 1
(⇢ = a) = = ) 0 = ) v0 (⇢) = ↵0 + ln ,
d⇢ a ✏0 ✏0 ✏0 ⇢

dvn,q n 1 ! n,q n,q a


n+1
a n,q ⇣ a ⌘n
n = 1, 2 . . . : (⇢ = a) = n n,q a = ) n,q = ) vn,q (⇢) = .
d⇢ ✏0 ✏0 n ✏0 n r
Por tanto, la solución para el potencial eléctrico es
=:V0 constante " ✓ ◆n X #
z }| { a
1
1 X1 a
2
V (⇢, ) = ↵'0 ( ) +
0 '0 ( ) ln + n,q 'n,q ( )
✏0 ⇢ n=1 n ⇢ q=1
" 1 ✓ ◆n #
a 0 1 1 X1 a
= V0 + p ln + p ( n,1 cos n + n,2 sen n ) .
✏0 2⇡ ⇢ ⇡ n=1 n ⇢

4. Discusión fı́sica: el problema para el potencial V (⇢, ) no está bien planteado en sentido matemático
porque la solución obtenida depende de la constante indeterminada V0 . Fı́sicamente, sin embargo, se puede
entender como la indeterminación intrı́nseca al valor del potencial, de manera que V0 sirve para fijar
el origen arbitrario de potencial. El campo eléctrico E = rV , que es el observable relevante en este
problema, sı́ está determinado de manera única por la solución pues la constante V0 desaparece al tomar
el gradiente.
La solución tiene la estructura de una superposición de campos que, según crece el ı́ndice n, decaen cada
vez con más rapidez con la distancia (⇠ ⇢ n ) y tienen una estructura angular más fina (periodo angular
2⇡/n). Se trata de un desarrollo en multipolos (en este caso, bidimensionales; en el próximo ejemplo se
trata el caso tridimensional). Es de destacar el término n = 0 (monopolo): suponiendo n,q = 0 si n 6= 0 e
identificando la carga por unidad de longitud
Z 2⇡ p
= d a ( ) = 2⇡ a 0 ,
0

se encuentra el potencial eléctrico


1
Vmono = V0 + ln ,
2⇡✏0 ⇢
que decae tan lentamente con la distancia que no se puede elegir el origen de potencial en el infinito. En
su lugar, una elección natural es V = 0 en la superficie del cilindro (⇢ = a).
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 27

El desarrollo en autofunciones también se puede emplear para representar soluciones generalizadas. Por
ejemplo, consideremos una distribución superficial de carga
8
8 > 0 = n,1 = 0,
< +s, 0 < < ⇡, >
<
( )= ) Z ⇡ Z 2⇡
: >
> sen n sen n 2s
s, ⇡ < < 2⇡, : n,2 = d s p d s p = p .
0 ⇡ ⇡ ⇡ n ⇡

Entonces, el potencial es
1 ✓ ◆n
2as X 1 a
V (⇢, ) ' V0 + sen n .
⇡✏0 n=1 n2 ⇢

Aunque la distribución de carga es discontinua, el potencial es un campo muy suave porque los coeficientes
del desarrollo tienden a cero exponencialmente con n si ⇢ > a:

e<
✓ ◆n z }| {
1 a 1 n ln(⇢/a)
= 2e .
n2 ⇢ n

Incluso en la superficie del cilindro (⇢ = a), el potencial es continuo (aunque no tan suave porque los
coeficientes de la serie se anula mucho más lentamente como 1/n2 ).

6) Esfera cargada: calculemos el campo eléctrico E(r) creado por una esfera de radio a con una densidad
superficial de carga (r) especificada. Este campo satisface las ecuaciones
8 9 8 9
< r⇥E=0 = < er · E(r) r=a = (✓, )/✏0 = a  r < 1,
, , 0  ✓  ⇡,
: ; : r!1 ;
r·E=0 E(r) ! 0 0  < 2⇡,

expresada en coordenadas esféricas con origen en el centro de la esfera. La condición de contorno en la superficie
de la esfera (r = a) expresa la componente normal del campo eléctrico en términos de la densidad superficial de
carga. La condición de contorno en el infinito garantiza que no existen campos debidos a fuentes lejanas, es decir,
que el campo eléctrico que se obtenga se debe solo a la esfera cargada. Introduciendo el potencial electrostático
como E = rV , el problema se transforma en
8 9
 ✓ ◆ ✓ ◆ 2
> @V (a, ✓, ) =
>
<
(✓, ) >>
= a  r < 1,
1 @ @V 1 @ @V 1 @ V @r ✏0
r2 V = 2 r2 + sen ✓ + = 0, , 0  ✓  ⇡,
r @r @r sen ✓ @✓ @✓ sen2 ✓ @ 2 >
> >
>
: r!1 ; 0  < 2⇡.
rV (r) ! 0

Para simplificar el problema, supondremos que la densidad de carga no depende del ángulo azimutal, esto es,
(✓) de manera que por simetrı́a es suficiente buscar soluciones de la forma V (r, ✓), esto es, podemos poner
@ 2 V /@ 2 = 0 en la EDP.

1. Separación de variables y problema de Sturm–Liouville: se propone una solución separable V (r, ✓) =


R(r)T (✓) para la EDP, que ya es homogénea, y se encuentra
 ✓ ◆ ✓ ◆
1 d dR(r) R(r) @ dT (✓)
0 = r2 V = 2 T (✓) r2 + sen ✓
r dr dr sen ✓ @✓ d✓
✓ ◆ ✓ ◆
1 d dR(r) 1 d dT (✓)
) r2 = sen ✓ = constante.
R(r) dr dr T (✓) sen ✓ d✓ d✓
| {z } | {z }
función solo de r función solo de ✓
28 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

Por tanto, la EDP admite soluciones separables. También la versión homogénea de las condiciones de
contorno:
@V ! 8✓2[0,⇡]
(a, ✓) = T (✓)R0 (a) = 0 ) R0 (a) = 0 cond. contorno de 2a especie (Neumann).
@r
R(r) 8✓2[0,⇡] R(r)
rV = er T (✓)R0 (r) + e✓ lı́m R0 (r),
r!1
T (✓) ! 0 ) =0 cond. de acotación.
r r!1 r
Tenemos dos posibles problemas de Sturm–Liouville, pero ambos son singulares: en la variable r el dominio
es infinito, mientras que en la variable ✓, tanto la función peso w(✓) = sen ✓ como la función p(✓) = sen ✓
se anulan en los extremos del intervalo ✓ = 0, ⇡. Se puede comprobar que el problema en la variable r no
tiene solución y por tanto es inútil para nuestros propósitos.
Si elegimos la variable r, llegamos a un problema de Sturm–Liouville en el espacio de Hilbert L2 (a, 1), que es singular porque
el intervalo es infinito:
8 9
✓ ◆ > v 0 (a) = 0 >
d < =
2 dv(r)
r = v(r), , a  r < 1.
dr dr >
: lı́m v 0 (r), v(r) >
=0 ;
r!1 r
Evaluemos el cociente de Rayleigh: si v(r) es un autovector con norma unidad, entonces
Z 1 ✓ ◆ Z 1
d dv(r) ⇥ ⇤1 dv(r) 2
= dr v ⇤ (r) r2 = r2 v ⇤ (r)v 0 (r) a dr r2 .
a dr dr a dr
Para que el término de contorno se anule en el infinito hay que imponer condiciones de contorno más restrictivas que las
especificadas: v(r) debe anularse lo bastante rápido para que
lı́m r2 v ⇤ (r)v 0 (r) = 0.
r!+1
Solo ası́ se podrá argumentar que el operador de Sturm–Liouville es hermı́tico. Y en tal caso, el cociente de Rayleigh permite
concluir que los autovalores serán negativos. La EDO es una ecuación de Euler, cuya solución general es
p
1 ⇥ ⇤ 1 ⇥ ⇤ 1 4
v(r) = p ↵r iµ + r iµ ) v 0 (r) = 3/2 ↵(2iµ 1)r iµ (2iµ + 1)r iµ , µ := 6= 0,
r 2r 2
1 1 1
v(r) = p [↵ + ln r] ) v 0 (r) = 3/2 [ (2 ln r) ↵] , = .
r 2r 4
Se identifican tres posibles casos:

Si < 1/4: el parámetro µ es real y la autofunción se puede expresar mejor como


1 1
v(r) = p [ cos(µ ln r) + sen(µ ln r)] ) v 0 (r) = 3/2 [(2µ ) cos(µ ln r) (2µ + ) sen(µ ln r)] ,
r 2r
con las constantes de integración reales , . No hay forma de elegir , , µ para que este tipo de funciones verifiquen la
condición de contorno más restrictiva en el infinito:
1
lı́m r 2 v ⇤ (r)v 0 (r) = lı́m [ cos(µ ln r) + sen(µ ln r)] [(2µ ) cos(µ ln r) (2µ + ) sen(µ ln r)]
r!1 r!1 4
1⇥
= lı́m (2µ ) cos2 (µ ln r) (2µ + ) sen2 (µ ln r)
r!1 4

+ (2µ 2 2µ 2 2 ) sen(µ ln r) cos(µ ln r)
8
< (2µ )=0
!
= 0 ) (2µ + ) = 0 ) = = 0 ) v(r) ⌘ 0,
: 2 2
2µ 2µ 2 =0
que no es autofunción válida.
Si = 1/4, la condición de contorno en el infinito implica
1 !
lı́m r 2 v ⇤ (r)v 0 (r) = lı́m [↵ + ln r] [ (2 ln r) ↵] = 0 ) ↵= =0 ) v(r) ⌘ 0,
r!1 r!1 2
que no es autofunción válida.
p
Si 1/4 < < 0: definimos el parámetro positivo := iµ = 1 + 4 /2 y se escribe
1 ⇥ ⇤ 1 ⇥ ⇤
v(r) = p ↵r + r ) v 0 (r) = 3/2 ↵(2 1)r (2 + 1)r ,
r 2r
que claramente verificará la condición de contorno en el infinito solo si ↵ = 0. En tal caso, la otra condición de contorno
implica
(2 + 1) !
v 0 (a) = = 0.
2a +3/2
Como > 0, la única solución es = 0, que conduce a la función nula.
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 29

φn
2

1
n=0
n=1
θ
π π 3π
π
n=2
4 2 4
n=3

-1

-2

Figura 9.7: Autofunciones en la variable ✓ del problema de la esfera cargada.

En conclusión, este problema de Sturm–Liouville singular no tiene soluciones.


Por tanto, estudiamos el problema para la variable ✓, que se debe complementar con condiciones de contorno
de regularidad en los extremos del intervalo:
8 
9 >
> 1 d dv(✓)
>
> sen ✓ = v(✓),
J |vi = |vi >
> >
> sen ✓ d✓ d✓
>
> >
>
= <
|vi 2 C 2 [0, ⇡] ⇢ L2w (0, ⇡) , v(✓) sol. clásica,
>
> >
>
>
> >
> también en ✓ = 0, ⇡,
; >
>
w(✓) = sen ✓ >
>
:
0  ✓  ⇡.
Se introduce la nueva variable independiente s := cos ✓, que es un cambio de variable bien definido en el
rango 0  ✓  ⇡. Por tanto, el problema de autovalores se formula para las nuevas variables en el espacio
de Hilbert L2 ( 1, 1) como

d dv(s)
(1 s2 ) = v(s), v(✓) sol. clásica, también en s = ±1, 1  s  +1.
ds ds
Ya se resolvió este problema como ejemplo y cuya solución involucra los polinomios de Legendre: en las
variables de nuestra problema es
r
1
n = n(n + 1), 'n (✓) = n + Pn (cos ✓), n = 0, 1, 2 . . .
2
El conjunto de autofunciones forma una base ortonormal del espacio L2w (0, ⇡) con el peso w(✓) = sen ✓.
2. Desarrollo en autofunciones: se expresa el problema de condiciones de contorno para el vector |V (r)i en
este espacio:
8 9
> |V (r)i 2 C 2 [0, ⇡] >
>
> >
>
>
> >
>
✓ ◆ >
> >
>
< d |V (r)i 1 =
d 2 d |V (r)i = | i ,
r + J |V (r)i = 0, dr ✏ 0 , a  r < 1,
dr dr >
> r=a >
>
>
> >
>
>
> >
>
>
: lı́m d |V (r)i , |V (r)i = 0. > ;
r!1 dr r
donde | i denota el ket asociado a la función (✓). Se proyecta el problema en la base de autovectores,
teniendo en cuenta que el operador J es hermı́tico en el subespacio C 2 [0, ⇡]:
Z w(✓)
1
X ⇡ z }| {
|V (r)i = vn (r) |'n i , vn (r) = h'n |V (r) iw = d✓ sen ✓ '⇤n (✓) V (r, ✓),
n=0 0
30 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

8 9
> 1 n >
✓ ◆z n >
> v 0 (a) = h'n | iw =: >
>
d dvn }| { < n ✏0 ✏0 =
r2 n(n + 1) vn = 0, , a  r < 1.
dr dr >
> vn (r) >
>
>
: >
;
lı́m vn0 (r), =0
r!1 r
3. Solución: la EDO para vn (r) es una ecuación de Euler, cuya solución general es
vn (r) = ↵rn + r n 1
) vn0 (r) = ↵nrn 1
(n + 1)r n 2
.
La condición de contorno en el infinito implica ↵ = 0 si n = 1, 2 . . . , pero no hay restricción si n = 0. Ası́
pues, queda ⇢
↵ + r 1, n = 0
vn (r) = ) vn0 (r) = (n + 1)r n 2 .
r n 1 , n = 1, 2, . . .
La segunda condición de contorno implica:
! n na
n+2
a n ⇣ a ⌘n+1
vn0 (a) = (n + 1)a n 2
= ) = ) vn (r) = ↵ n,0 + .
✏0 ✏0 (n + 1) ✏0 (n + 1) r
Por tanto, la solución para el potencial eléctrico es
=:V0 constante p
z }| { a X n ⇣ a ⌘n+1 ⇣ a ⌘n+1
1 1
a X n + 1/2
V (r, ✓) ' ↵'0 (✓) + 'n (✓) = V0 + n Pn (cos ✓).
✏0 n=0 n + 1 r ✏0 n=0 n+1 r

4. Discusión fı́sica: como en el ejemplo anterior, la constante V0 representa la indeterminación en el origen


de potencial y no juega ningún papel para el campo eléctrico E = rV .
La solución tiene la estructura de una superposición de multipolos: el de orden n produce un potencial que
decae con la distancia como r n 1 y cuya dependencia angular viene descrita por el polinomio de Legendre
Pn . Por ejemplo, consideremos una esfera con una densidad de carga superficial de la forma
8 p
> Q
>
> 2 , n = 0,
>
> 4⇡a2
r >
>
Q p Q p p 2 < r
(✓) = + cos ✓ = 2 ' 0 (✓)+ ' 1 (✓) ) n = h' n | i = 2 p
4⇡a2 2⇡a3 | {z } 4⇡a2 2⇡a3 3 w
>
> , n = 1,
P1 (cos ✓) >
> 3 2⇡a3
>
>
>
:
0, n = 2, 3 . . .
teniendo en cuenta la definición de las autofunciones '0 (✓) y '1 (✓). Esta distribución posee una carga total
(monopolo)
Z Z ⇡ Z 2⇡ p Z ⇡
dS (r) = a2 d✓ sen ✓ d (✓) = 2⇡a2 2 d✓ sen ✓ '⇤0 (✓) (✓) = Q,
r=a 0 0 0
| {z }
h'0 | iw

y un dipolo en la dirección del eje Z proporcional a la integral


Z Z Z ⇡ Z 2⇡
dS r (r) = dS aer (✓, ) (r) = a3 d✓ sen ✓ d (✓) [ex sen ✓ cos + ey sen ✓ sen + ez cos ✓]
r=a r=a 0 0
Z ⇡ r
2 2p
= 2⇡a3 ez d✓ sen ✓ cos ✓ (✓) = 2⇡a3 ez h'1 | iw = ez .
0 3 3
Sustituyendo estos valores de n en la solución obtenida para el potencial se llega a la expresión
Q p cos ✓ Q pez · r
V (r, ✓) = V0 + + = V0 + + ,
4⇡✏0 r 4⇡✏0 r2 4⇡✏0 r 4⇡✏0 r3
es decir, efectivamente la superposición de un monopolo Q y un dipolo pez .
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 31

7) Oscilador armónico cuántico: consideremos la evolución cuántica de una partı́cula de masa m bajo la
acción de un potencial unidimensional V (x) = m! 2 x2 /2. El estado cuántico está caracterizado por la función de
onda (x, t), que obedece el problema de condiciones de contorno
8 9
> @ (x, t)
>
> (x, t), !0 > >
> 1 < x < +1,
@ ~2 @ 2 1 < @x =
2 2 rápidamente si |x| ! 1
i~ = + m! x , ,
@t 2m @x2 2 >
> >
>
>
: >
; 0  t.
(x, 0) = f (x)
Como ya se mencionó en la discusión general, la ecuación de Schrödinger con estas condiciones de contorno
garantizan que la función de onda es normalizable y que la norma se conserva en el tiempo, es decir,
Z +1
dx | (x, t)|2 = 1, 8t.
1

1. Separación de variables y problema de Sturm–Liouville: se propone una solución separable (x, t) =


⌅(x)⌦(t) para la EDP, que ya es homogénea, y se encuentra
d⌦(t) ~2 d2 ⌅(x) 1
0= i~⌅(x) ⌦(t) + m! 2 x2 ⌅(x)⌦(t)
dt 2m dx2 2
función solo de t función solo de x
z }| { z  2 }| {
i~ d⌦(t) ~2 d ⌅(x) ⇣ m! ⌘2 2
) = x ⌅(x) = constante.
⌦(t) dt 2m⌅(x) dx2 ~
Por tanto, la EDP admite soluciones separables. También sucede lo mismo con las condiciones de contorno
(en la variable espacial x):
|x|!1 8t 0
(x, t) = ⌅(x)⌦(t) ! 0 ) ⌅(x ! 1) ! 0,
@ (x, t) |x|!1 8t 0
= ⌅0 (x)⌦(t) ! 0 ) ⌅0 (x ! 1) ! 0,
@x
Podemos pues identificar un problema de Sturm–Liouville en la variable x con el operador
 ⇣ m!x ⌘2
~2 d 2 ~2 ~2 ⇣ m!x ⌘2
J := ) p(x) = , w(x) = 1, q(x) = .
2m dx2 ~ 2m 2m ~
Se trata, sin embargo, de un problema singular porque el intervalo de x es todo el eje real; las condiciones
de contorno en el infinito permiten asegurar que las soluciones continuas ⌅(x) es de cuadrado sumable en
el eje real. Ası́ pues, el problema asociado de Sturm–Liouville singular en el espacio de Hilbert L2 (R) es
8
9
> d2 v ⇣ m!x ⌘2 2m
J |vi = |vi >
> >
> v= v,
>
> >
> dx 2 ~ ~2
>
> >
>
= <
|vi 2 S ⇢ L2 (R) v(x), v 0 (x) ! 0 rápidamente si |x| ! 1,
,
>
> >
> v(x) sol. clásica,
> >
S := {v(x) 2 C 2 (R), v(x), v 0 (x) ! 0 >>
>
>
>
>
; >
:
rápidamente si |x| ! 1} 1 < x < +1.
p
Introduciendo la nueva variable independiente z := x m!/~ se encuentra un problema de autovalores
ya resuelto como ejemplo, cuya solución involucra los polinomios de Hermite; en las variables de nuestro
problema es
✓ ◆ s r ✓r ◆
1 1 m! m! 2
n = n+ ~!, 'n (x) = Hn x e m!x /2~ , n = 0, 1, 2 . . .
2 n! 2n ⇡~ ~
A pesar de ser un problema de Sturm–Liouville singular, las autofunciones forman una base ortonormal
del espacio L2 (R).
32 Tema 9 c Alvaro Domı́nguez, Univ. Sevilla

φn

0.5

n=0
n=1

-4 -2 2 4
x mω / ℏ n=2
n=3

-0.5

Figura 9.8: Autofunciones asociadas al oscilador armónico cuántico.

2. Desarrollo en autofunciones: el problema se formula en el espacio de Hilbert como


8 9
@ | (t)i < | (t)i 2 S =
i~ = J | i, , 0  t.
@t : ;
| (0)i = |f i

Expresamos los vectores ası́ como el problema de condiciones de contorno en la base de autofunciones recién
encontrada: Z +1
X 1
| (t)i = pn (t) |'n i , pn (t) = h'n | (t) i = dx '⇤n (x) (x, t),
n=0 1
✓ ◆
@ dpn
i~ h'n | | i = h'n |J| i ) i~ = n pn ,
@t dt
pn (0) = h'n | (0) i = h'n |f i =: fn .

3. Solución: la solución del conjunto de EDOs que satisfacen la condición inicial es


i n t/~ i(n+1/2)!t
pn (t) = fn e = fn e ,

y la función de onda es
1
X 1
X
i(n+1/2)!t
(x, t) ' pn (t)'n (x) = fn e 'n (x).
n=0 n=0

4. Discusión fı́sica: si la condición inicial coincide exactamente con alguna autofunción, entonces la probabi-
lidad asociada a la función de onda es independiente del tiempo,
i(⌫+1/2)!t
fn = f⌫ n,⌫ ) (x, t) = f⌫ e '⌫ (x) ) | (x, t)|2 = |f⌫ '⌫ (x)|2 ,

de manera que los observables fı́sicos resultan ser constantes en el tiempo: por esta razón, las autofunciones
se denominan estados estacionarios. En el caso más general, la función de onda es una superposición
de estados estacionarios pero cada uno con una fase compleja diferente y dependiente del tiempo. En
consecuencia, la distribución de probabilidad depende del tiempo, pero podemos comprobar explı́citamente
que no es ası́ con la normalización:
Z +1 1
X 1
X
2 2
dx | (x, t)|2 = k (t)k = |pn (t)|2 = |fn |2 = k (0)k = 1.
1 n=0 n=0
c Alvaro Domı́nguez, Univ. Sevilla Tema 9 33

De manera más especı́fica, expresando los coeficientes de la condición inicial en forma polar,

fn = cn ei✓n , 0  cn , 0  ✓n < 2⇡,

se puede poner de manera más explı́cita la estructura ondulatoria de la evolución de la función de onda:
X1 ✓ ◆ X1 ✓ ◆
1 1
Re (x, t) = cn cos n + !t ✓n 'n (x), Im (x, t) = cn sen n + !t ✓n 'n (x).
n=0
2 n=0
2

Como vemos, las partes real e imaginaria de la función de onda poseen una estructura muy similar a la
solución de la ecuación de ondas, de forma que los estados estacionarios 'n (x) se pueden interpretar como
ondas estacionarias.
Finalmente, los autovalores se interpretan fı́sicamente como los valores observables de la energı́a. Entonces,
el hecho de que formen un conjunto discreto se manifiesta como cuantización de la energı́a. El cuanto de
energı́a en este ejemplo es ~!, de manera que los efectos cuánticos serán relevantes en situaciones cuando los
cambios de energı́a seanp comparables con este valor. De manera equivalente, las autofunciones exhiben una
distancia caracterı́stica ~/m!, de manera que el carácter cuántico solo será notable en escalas espaciales
de este orden.

8) Problema no separable: para ilustrar las limitaciones del método, consideremos el siguiente problema:
8 9 8 9
>
> @% @j >
> > j(0, t) = j0 (t) + K(t)%(0, t) >
>
< = >
= >
< >
= 0  x  L,
@t @x %(L, t) = 0
, ,
>
> > > >
> j = D(x, t) @% >
: >
;
>
: >
; 0  t.
%(x, 0) = 0
@x
Estas ecuaciones describen la inyección de partı́culas dentro de una tuberı́a de longitud L. La densidad de
partı́culas %(x, t) evoluciona debido a la difusión, caracterizada por un coeficiente D(x, t) > 0 que depende de la
posición y el tiempo. Inicialmente no hay partı́culas dentro de la tuberı́a, que son inyectadas en el extremo x = 0
a un ritmo especificado j0 (t) pero corregido por un término proporcional a la concentración local de partı́culas
y caracterizado por el parámetro K(t) dependiente del tiempo. El otro extremo de la tuberı́a absorbe todas las
partı́culas que llegan y por ello la concentración de partı́culas en x = L es nula. Eliminando el campo corriente
de partı́culas j(x, t) se obtiene un problema para la variable % únicamente:
8 9
> @%
> D(x, t) (0, t) K(t)%(0, t) = j0 (t) >
> >
>
 >
> @x >
>
< = 0  x  L,
@% @ @%
= D(x, t) , %(L, t) = 0 ,
@t @x @x >
> >
>
>
> >
> 0  t.
>
: >
;
%(x, 0) = 0

Si proponemos una solución separable, %(x, t) = ⌅(x)⌦(t), comprobamos que, en general, ni la EDP ni las
condiciones de contorno la admiten:
función solo de t función de x y t
 z }| { z  }| {
d⌦ d d⌅ 1 d⌦ 1 d d⌅
0 = ⌅(x) ⌦(t) D(x, t) ) = D(x, t) .
dt dx dx ⌦ dt ⌅ dx dx
Solo si el coeficiente de difusión también factoriza, D(x, t) = D1 (x)D2 (t), puede existir una solución separable
de la EDP. Y la versión homogénea de la condición de contorno en el extremo x = 0 conduce a

0 = ⌦(t) [D(0, t)⌅0 (0) + K(t)⌅(0)] ,

y esta condición no se puede verificar para valores arbitrarios de t a menos que D(x, t) = D1 (x)D2 (t) y además
D2 (t) / K(t).
Métodos Matemáticos II Curso 2020–2021

104. Una cuerda de longitud L tiene una densidad de masa inhomogénea, de forma que las
velocidad de propagación de las ondas depende de la posición como
⇣ x⌘
c(x) = c0 1 + , c0 = constante positiva.
L
Suponiendo que los extremos de la cuerda están fijos en la posición de equilibrio, encuentre
la evolución de las deformaciones pequeñas u(x, t) respecto al equilibrio si inicialmente la
cuerda parte de una deformación
p f (x) desde el reposo. Particularice la solución para el
caso especial f (x) = A 1 + (x/L), donde A es una constante.

105. Una cuerda tensa de longitud L cuelga bajo la acción de su peso desde sus dos extremos,
cuyas alturas difieren en una cantidad H. Determine el perfil de la cuerda en equilibrio
suponiendo que la desviación de la horizontal es pequeña.

106. El potencial electrostático V (x, y) en un dominio cuadrado viene dado como solución del
siguiente problema de condiciones de contorno para la ecuación de Laplace:
8 9
2 2
>
< V (0, y) = V (L, y) = V (x, 0) = 0 >
=
@ V @ V
+ = 0, , 0  x, y  L.
@x2 @y 2 >
: x >
;
V (x, L) = V0
L
Obtenga la solución V (x, y) mediante desarrollo en autofunciones en la variable x.

107. La temperatura en una varilla de longitud L viene dada por la solución del siguiente
problema de condiciones de contorno:
8 9
> @T >
>
> (0, t) = 0 >
>
>
> @x >
>
>
> >
>
@T @2T < @T (L, t) = b [T (L, t) T ] = 0xL
f
= 2, @x ,
@t @x >
> >
>
>
> ⇢ >
> 0  t.
>
> T0 , 0  x  a >
>
>
: T (x, 0) = >
;
0, a  x  L

La constante  > 0 es la conductividad térmica de la varilla y T0 es una temperatura inicial.


Las condiciones de contorno representan el extremo x = 0 aislado y el extremo x = L en
contacto con un foco térmico a temperatura Tf con el que intercambia calor según la ley de
enfriamiento de Newton, siendo b > 0 constante (¿por qué no puede ser b < 0?). Reformule
el problema para la variable T (x, t) = T (x, t) Tf y resuélvalo mediante un desarrollo en
autofunciones.
108. Un conjunto de partı́culas se difunde sobre un anillo homogéneo de radio a. Obtenga el
campo densidad lineal de partı́culas %( , t) como función del tiempo y del ángulo polar
a lo largo del anillo si inicialmente todas las partı́culas están confinadas a una mitad del
mismo, donde se distribuyen uniformemente.

109. Una varilla de longitud L posee una conductividad térmica no uniforme


⇣ x⌘
(x) = 0 1 + , 0 , constantes positivas.
L
Si los extremos de la varilla se mantienen a temperaturas fijas T0 y T0 + , respectiva-
mente, calcule el perfil estacionario de temperatura.

110. Sea una cuerda tensa de longitud L fija en sus extremos, inicialmente en reposo y sin
deformación. Determine la evolución en el tiempo de las oscilaciones transversales de am-
plitud pequeña si la cuerda se somete a una aceleración externa de la forma a(x) cos ⌦t y si
se tiene en cuenta además la fuerza de rozamiento con el medio fluido que rodea a la cuerda.

111. Las oscilaciones de amplitud pequeña de una cuerda tensa se pueden describir como solu-
ción del siguiente problema de condiciones de contorno:
8 9
>
> u(0, t) = 0 >
>
>
> @u >
>
>
< >
= 0  x  L,
2
@ u @ 2 u (L, t) = A cos ⌦t
=c 2
, @x ,
@t2 @x2 >
> >
>
>
> >
> 0  t.
: u(x, 0) = 0, @u (x, 0) = 0 >
> ;
@t
La condición de contorno en x = L representa la acción de una fuerza externa que varı́a
sinusoidalmente en el tiempo con frecuencia ⌦ y cuya intensidad está caracterizada por la
constante A. Encuentre la solución del problema y discútala fı́sicamente.

112. Se considera un dominio rectangular 0  x  Lx , 0  y  Ly . Calcule el potencial eléctrico


V (x, y) dentro del mismo sabiendo que obedece la ecuación de Helmholtz,

V
r2 V = 0, ` constante positiva,
`2
cuando tres de las paredes del dominio están descargadas y la cuarta pared (en y = Ly )
posee una densidad superficial de carga (x) = 0 ex/Lx , con 0 una constante. ¿Está la
solución definida de manera única? Discuta fı́sicamente qué sucederı́a en el lı́mite ` ! 1.

113. Se considera una distribución inicial de N partı́culas concentradas en el centro de una


tuberı́a de longitud L llena de lı́quido. Las partı́culas se difunden en el lı́quido con la
condición de que los dos extremos de la tuberı́a absorben todas las partı́culas. Calcule la
evolución de la densidad de partı́culas y estudie el comportamiento para tiempos largos.
MMII 2020–2021, soluciones del boletı́n para el tema 9 1

104. La formulación matemática del problema es


8 9
>
< u(0, t) = u(L, t) = 0 >
= 0  x  L,
2
@ u ⇣ ⌘
x 2@ u2
2
= c0 1 + , ,
@t2 L @x2 : u(x, 0) = f (x), @u (x, 0) = 0
> >
; 0  t,
@t
La EDP y las condiciones de contorno admiten una solución separable, lo cual conduce al
siguiente problema de autovalores en la variable x:
⇣ ⇢
x ⌘2 d2 v(x) v(0) = v(L) = 0
, c20 1 + = v(x), , 0  x  L.
L dx2 v(x) sol. clásica
Con el cambio de variable independiente ⇠ := 1+(x/L), la EDO se convierte en una ecuación
de Euler: ✓ ◆2 ⇢
d2 v L v(1) = v(2) = 0
⇠2 2 = v, , 1  ⇠  2.
d⇠ c0 v(x) sol. clásica
Se trata de un problema de Sturm–Liouville regular en el espacio L2w (1, 2) con la función
peso w(⇠) = 1/⇠ 2 . La solución es
 r
1 ⇣ n⇡ ⌘2 ⇣ c0 ⌘2 2⇠ n⇡ ln ⇠
n = + , 'n (⇠) = sen , n = 1, 2, . . .
4 ln 2 L ln 2 ln 2
Las autofunciones, reales y ya normalizadas, forman una base ortonormal del espacio L2w (1, 2).
La solución del problema original se escribe como un desarrollo en autofunciones del vector
|u(t)i 2 L2w (1, 2):
+1
X Z 2
1 ⇤
u(⇠, t) ' un (t) 'n (⇠), un (t) := h'n |u(t) iw = d⇠ ' (⇠)u(⇠, t).
n=1 1 ⇠2 n

La proyección del problema de condiciones de contorno en esta base conduce a un conjunto


de EDOs para los coeficientes un (t):
d2 un dun
= n un , un (t = 0) = fn , (t = 0) = 0, 0  t.
dt2 dt
en términos de los coeficientes fn de la serie de Fourier generalizada para la función f (x =
L(⇠ 1)):
Z 2
1
fn := h'n |f iw = d⇠ 2 '⇤n (⇠) f (L(⇠ 1)) .
1 ⇠
Resolviendo estas ecuaciones, se encuentra
r
p c0 1 ⇣ n⇡ ⌘2
un (t) = fn cos !n t, !n := n = + .
L 4 ln 2
y la expresión final para la solución, volviendo a la variable x, es pues
r
2 ⇣ x⌘ X h n⇡ ⇣ x ⌘i
1
u(x, t) ' 1+ fn cos !n t sen ln 1 + .
ln 2 L n=1 ln 2 L
p p
Para el caso particular f (x) = A 1 + (x/L) = A ⇠ se encuentra
8
>
> 0, n par,
Z 1 >
<
s = ln ⇠/ ln 2
p p 1 ( 1)n p
fn = A 2 ln 2 ds sen n⇡s = A 2 ln 2 = 2 2 ln 2
0 n⇡ >
> A , n = 2m + 1 impar,
>
: (2m + 1)⇡
m = 0, 1, 2 . . .

4A ⇣ x ⌘ X cos !2m+1 t (2m + 1)⇡ ⇣ x⌘
1
) u(x, t) ' 1+ sen ln 1 + .
⇡ L m=0 2m + 1 ln 2 L
MMII 2020–2021, soluciones del boletı́n para el tema 9 2

105. En equilibrio, el peso de la cuerda es compensado por la tensión, de manera que la deforma-
ción (pequeña) u(x) respecto a la horizontal obedece la ecuación

d2 u
c2 g = 0, 0  x  L,
dx2
donde c es la velocidad de las ondas. Las condiciones de contorno para esta ecuación corres-
ponden a los extremos fijos a distinta altura,

u(0) = 0, u(L) = H.

La solución general de la EDO es

gx2
u(x) = ↵ + x + .
2c2
Las constantes de integración se fijan mediante las condiciones de contorno y conducen
finalmente a la solución
gx(x L) Hx
u(x) = + .
2c2 L
La condición de que la desviación respecto a la horizontal sea pequeña se expresa matemáti-
camente como
du H g(L 2x)
⌧1 ) ⌧ 1.
dx L 2c2
Una condición suficiente es que H ⌧ L y gL ⌧ c2 .
106. LA EDP y las condiciones de contorno en la variable x admiten soluciones separables y
conducen al siguiente problema de Sturm–Liouville regular:

d2 v(x) v(0) = v(L) = 0
= v(x), , 0  x  L.
dx2 v(x) sol. clásica

La solución es
⇣ n⇡ ⌘2 r
2 n⇡x
n = , 'n (x) = sen , n = 1, 2, . . .
L L L
Estas autofunciones, reales y normalizadas, forman una base ortonormal del espacio L2 (0, L).
Se expresa la solución del problema original como un desarrollo en autofunciones para el
vector |V (y)i 2 L2 (0, L):
1
X Z L
V (x, y) ' vn (y)'n (x), vn (t) := h'n |V (y) i = dy '⇤n (y)V (x, y).
n=1 0

La proyección del problema de condiciones de contorno en esta base conduce a las EDOs

d2 v n vn (y = 0) = 0
= v
n n , , 0  y  L,
dy 2 vn (y = L) = sn

en términos de los coeficientes


r Z L
2 x n⇡x p Z 1 p ( 1)n+1
sn := h'n |V (y = L) i = V0 dx sen = V0 2L ds s sen n⇡s = V0 2L .
L 0 L L 0 n⇡
La solución de estas ecuaciones conduce finalmente a
sn n⇡y
vn (y) = senh ,
senh n⇡ L
r 1 1
2 X sn n⇡y n⇡x 2V0 X ( 1)n+1 n⇡y n⇡x
V (x, y) ' senh sen = senh sen .
L n=1 senh n⇡ L L ⇡ n=1 n senh n⇡ L L
MMII 2020–2021, soluciones del boletı́n para el tema 9 3

107. Se introduce el campo T (x, t), que convierte en homogéneas las condiciones de contorno en
la variable espacial x (de Dirichlet en x = 0 y de Robin en x = L):
8 9
>
> @ T >
>
>
> (0, t) = 0 >
>
>
> @x >
>
2
>
< @ T >
= 0xL
@ T @ T (L, t) + b T (L, t) = 0
= , @x ,
@t @x2 >
> >
>
>
> ⇢ >
> 0  t.
>
> T 0 T f , 0  x  a >
>
>
: T (x, 0) = >
;
Tf , axL

Aplicando el método de separación de variables conduce al siguiente problema de Sturm–


Liouville regular en la variable x:
8 9
< v 0 (0) = 0 =
d2 v(x) 0
2
= v(x), v (L) + bv(L) = 0 , 0  x  L.
dx : ;
v(x) sol. clásica

Se puede construir una base ortonormal del espacio de Hilbert L2 (0, L) con las autofunciones
reales:
r  1/2
2 sen 2µn L
'n (x) = An cos µn x, An = 1+ , n = 0, 1, 2, . . .
L 2µn L
p
donde los parámetros µn , relacionados con los autovalores como µn = n , son las solu-
ciones positivas de la ecuación trascendental

µn = b cotg µn L.

Se puede comprobar gráficamente que esta ecuación tiene infinitas soluciones, que ninguna es
nula, que forman una sucesión monótonamente creciente y que se comportan asintóticamente
como µn ⇠ n⇡/L cuando n ! 1.
El problema de condiciones de contorno original se expresa en esta base de autofunciones
para el vector | T (t)i 2 L2 (0, L):
1
X Z L
T (x, t) ' ✓n (t)'n (x), ✓n (t) := h'n | T (t) i = dx '⇤n (x) T (x, t),
n=0 0

d✓n
= n ✓n , ✓n (0) = ⌧n , 0  t,
dt
Z L Z a Z L
⌧n := h'n | T (x, 0) i = dx '⇤n (x) T (x, 0) = T0 dx '⇤n (x) Tf dx '⇤n (x)
0 0 0
µn 6=0 An
= [T0 sen µn a Tf sen µn L] .
µn
La solución de estas ecuaciones es
n t
✓n (t) = ⌧n e ,

1
X
n t
T (x, t) = Tf + T (x, t) ' Tf + ⌧n e 'n (x)
n=0
X1
T0 sen µn a Tf sen µn L n t
= Tf + 4 e cos µn x.
n=0
2µn L + sen 2µn L

Como n < 0, para tiempos largos se encuentra T (x, t) ! Tf , esto es, la varilla alcanza la
temperatura del foco térmico.
MMII 2020–2021, soluciones del boletı́n para el tema 9 4

@T
Según la ley de Fourier, el flujo de calor que atraviesa el punto x = L es (L, t) en el
@x
sentido positivo de la coordenada espacial x, es decir, desde el sistema hacia el foco (porque
el sistema está en x = L , esto es, espacialmente a la izquierda del foco en x = L+ ). Como
el calor debe fluir de caliente a frı́o, el coeficiente b en la ley de enfriamiento de Newton
debe ser positivo: ası́, cuando T (L) > Tf , el foco absorbe energı́a, esto es, el flujo de calor va
efectivamente en el sentido desde el sistema hacia el foco.
108. Introducimos coordenadas cilı́ndricas con origen en el centro del anillo y con eje Z per-
pendicular al plano del mismo. Entonces, la formulación matemática del problema en estas
coordenadas es
8 9
>
> %(0, t) = %(2⇡, t) >
>
>
> >
>
>
> >
>
2
>
< @% @% >
= 0  < 2⇡,
@% 2 D@ % (0, t) = (2⇡, t)
= Dr % = 2 2 , @ @ ,
@t a @ >
> >
>
>
> >
> 0  t.
>
> N >
>
>
: >
;
%(x, 0) = H(⇡ )
⇡a
El laplaciano se ha expresado en coordenadas cilı́ndricas y se ha particularizado para el
caso z = 0, ⇢ = a (el anillo). También se han añadido condiciones de contorno periódicas
puesto que = 0 y = 2⇡ representan el mismo punto fı́sico del anillo: por ello, tanto el
campo densidad como la corriente de partı́culas, Dr% = (D/a)@ %, deben ser continuos.
Finalmente, D > 0 representa la difusividad de las partı́culas y N el número total de ellas, que
inicialmente se distribuyen con densidad uniforme N/(⇡a) en la mitad del anillo caracterizada
por 0 < < ⇡.
El método de separación de variables conduce al siguiente problema de problema de Sturm–
Liouville periódico en el espacio de Hilbert L2 ( L, L):
8 9
2 < v(0) = v(2⇡) =
d v(x)
= v(x), v 0 (0) = v 0 (2⇡) , 0  < 2⇡.
d 2 : ;
v(x) sol. clásica

La solución es
1
0 = 0, '0 (x) = p ,
2⇡
8 1
>
> 'n,1 ( ) = p cos n
>
< ⇡
n = 1, 2, . . . : n = n2 ,
>
> 1
>
: 'n,2 ( ) = p sen n

Los autovalores con n 6= 0 tienen degeneración doble. Las autofunciones, reales y normaliza-
das, se reconocen como la base de Fourier o trigonométrica del espacio L2 (0, 2⇡). Por tanto,
se puede representar la solución del problema original como un desarrollo en autofunciones
del vector |%(t)i 2 L2 (0, 2⇡):
1 X
X 2
%( , t) = ⇢0 (t)'0 ( ) + ⇢n,q (t)'n,q ( ).
n=1 q=1

La proyección del problema original en esta base conduce a las ecuaciones


d⇢0
= 0, ⇢0 (0) = f0 ,
dt
d⇢n,q D n
= 2 ⇢n,q , ⇢n,q (0) = fn,q ,
dt a
MMII 2020–2021, soluciones del boletı́n para el tema 9 5

en términos de los coeficientes del desarrollo en autofunciones para la condición inicial:


Z 2⇡ Z ⇡
N 1 N N
f0 := d '0 ( ) H(⇡ )= d p = p ,
0 ⇡a 0 2⇡ ⇡a a 2⇡
Z 2⇡ Z ⇡
N N n6=0
fn,1 := d 'n,1 ( ) H(⇡ )= p d cos n = 0,
0 ⇡a ⇡a ⇡ 0

Z 2⇡ Z ⇡
N N
fn,2 := d 'n,2 ( ) H(⇡ )= p d sen n
0 ⇡a ⇡a ⇡ 0
8
>
> 0, n par
>
<
n6=0 N 1 ( 1)n
= = 2N
⇡ 3/2 a n >
> , n = 2m + 1 impar,
>
: ⇡ 3/2 an m = 0, 1, 2 . . .

Por tanto, la solución del problema se escribe entonces como


2
⇢0 (t) = f0 , ⇢n,q (t) = fn,q eD n t/a ,
1
" 1
#
X N 4 X e (2m+1)2 Dt/a2
D nt
%(x, t) ' f0 '0 ( )+ e fn,2 'n,2 ( ) = 1+ sen(2m + 1) .
2⇡a ⇡ m=0 2m + 1
n=1, impar

Hemos introducido el signo de igualdad en media (') porque, en rigor, se trata de una
solución generalizada pues la condición inicial ⇢(x, 0) tiene una discontinuidad en = ⇡. Sin
embargo, los coeficientes de la serie decaen muy rápidamente con n (exponencialmente) en
cuanto t > 0, representando pues una función muy suave (de hecho, infinitamente derivable).
El autovalor 0 = 0 representa la conservación del número de partı́culas,
Z 2⇡ p Z 2⇡ p
número total de partı́culas = d a %( , t) = 2⇡ a d %0 ( ) %( , t) = 2⇡ a⇢0 (t) = N.
0 0

Y para tiempos largos, la solución se aproxima a una distribución uniforme sobre todo el
anillo, %( , t) ! N/(2⇡a) si t ! +1.
109. La temperatura de la varilla obedece el siguiente problema de condiciones de contorno:
8 9 8 9
>
> @T @jcalor > > > T (0) = T0 >
>
< @t = >
= >
< >
= 0  x  L,
@x T (L) = T0 +
, ,
>
> @T >> >
> >
>
> j
: >
; : ; 0  t,
calor = (x) T (x, 0) dado
@x
Es importante notar la forma en que aparece la conductividad térmica, debido a que, por
definición, es el coeficiente de proporcionalidad en la ley de Fourier para la corriente de calor
jcalor . Serı́a erróneo tomar la ecuación de difusión del calor para una conductividad uniforme
(@t = @x2 T ) y reemplazar  7! (x).
El perfil estacionario de temperatura se obtiene resolviendo este problema cuando @T /@t = 0,
en cuyo caso la condición inicial es irrelevante. La EDP conduce entonces a
 Z x
djcalor d dT dT 1
= (x) = 0 ) jcalor (x) = (x) = ↵ ) T (x) = +↵ ds .
dx dx dx dx 0 (s)

Las condiciones de contorno determinan las constantes de integración ↵ y :


Z L
! 1 !
T (0) = = T0 , T (L) = T0 + ↵ ds = T0 + ) ↵= Z L
.
0 (s) 1
ds  (s)
0
MMII 2020–2021, soluciones del boletı́n para el tema 9 6

Por tanto, el perfil estacionario es


Z x
1
ds  (s)
0
T (x) = T0 + Z L .
1
ds  (s)
0

Para el caso particular  = 0 (1 + x/L), se encuentra


Z x Z x/L
ds (1 + s/L) 1 d (1 + ) 1
⇣ x⌘
T (x) = T0 + Z 0L = T0 + 0Z
= T0 + ln 1 + .
ln(1 + ) L
ds (1 + s/L) 1 d (1 + ) 1
0 0

110. La formulación matemática del problema fı́sico es


8 9
>
< u(0, t) = u(L, t) = 0 >
= 0  x  L,
2 2
@ u 2@ u @u
=c 2r + a(x) cos ⌦t ,
@t2 @x2 @t : u(x, 0) = 0, @u (x, 0) = 0
> >
; 0  t.
@t
La ecuación de ondas se ha complementado con dos fuerzas: la acción externa y el rozamiento
con el fluido, el cual es proporcional a la velocidad vertical @u/@t de los puntos de la cuerda
y está caracterizado por el parámetro 2r > 0.
La EDP es inhomogénea debido a la acción de la fuerza externa. Sin embargo, la versión
homogénea y las condiciones de contorno en x admiten soluciones separables, lo cual conduce
al siguiente problema de Sturm–Liouville regular:

d2 v(x) v(0) = v(L) = 0
= v(x), 0  x  L.
dx2 v(x) sol. clásica
La solución es
⇣ n⇡ ⌘2 r
2 n⇡x
n = , 'n (x) = sen , n = 1, 2, . . .
L L L
Estas autofunciones, reales y normalizadas, forman una base ortonormal del espacio L2 (0, L).
Se busca la solución del problema de contorno original como un desarrollo en autofunciones
del vector |u(t)i 2 L2 (0, L):
X1 Z L
u(x, t) ' un (t)'n (x), un (t) = h'n |u(t) i = dx '⇤n (x) u(x, t).
n=1 0

La proyección del problema original en esta base conduce a las ecuaciones


d2 un dun dun
+ 2r + !n2 un = an cos ⌦t, un (0) = 0, (0) = 0, 0  t,
dt2 dt dt
en términos de las frecuencias propias,
p n⇡c
!n := c n =
L
y de los coeficientes de la serie de Fourier generalizada para la función a(x):
Z L
an := h'n |a i = dx '⇤n (x)a(x).
0

La solución de las EDOs se puede escribir como


an h p p i
un (t) = cos(⌦t ✓n ) + e rt ↵n cos t !n2 r2 + n sen t !n2 r2 ,
R
| n {z } | {z }
=:Vn (t) =:Wn (t)
MMII 2020–2021, soluciones del boletı́n para el tema 9 7

donde
p 2r⌦
Rn := (!n2 ⌦2 )2 + 4r2 ⌦2 , tan ✓n = ,
!n2 ⌦2
an a
↵n = cos ✓n , n = p n (r cos ✓n + ⌦ sen ✓n ) .
Rn Rn !n2 r2
La solución del problema original es pues
r 1 r 1
2 X n⇡x 2 X n⇡x
u(x, t) ' un (t) sen = [Vn (t) + Wn (t)] sen ,
L n=1 L L n=1 L

que se interpreta fı́sicamente como una superposición de ondas estacionarias cuya amplitud
varı́a en el tiempo según un (t), la cual consta de dos términos:
El término Vn (t) representa oscilaciones con la misma frecuencia ⌦ que la fuerza ex-
terna, pero con un desfase ✓n y una amplitud an /Rn . Esta amplitud depende tanto de
la función a(x) (a través de an ) que expresa la distribución espacial sobre la cuerda
de la fuerza externa, como de la diferencia entre la frecuencia propia !n de la onda
estacionaria y la frecuencia externa (a través de Rn ).
El término Wn (t) decae en el tiempo: como oscilaciones amortiguadas si !n > b o
monótonamente si !n < b.

Por tanto, para tiempos largos la solución se reduce a


r 1
t!+1 2 X an n⇡x
u(x, t) ⇠ cos(⌦t ✓n ) sen ,
L n=1 Rn L

es decir, todas las ondas estacionarias oscilan con la misma frecuencia pero con distintas
amplitudes y desfases. En particular, si existe algún modo n0 cuya frecuencia propia coincide
con la de la fuerza externa, ⌦ = !n0 , entonces Rn0 = 2r⌦ y la amplitud de las oscilaciones
de esta onda estacionaria será muy grande si el coeficiente de rozamiento r es muy pequeño,
lo cual representa una resonancia.
111. Tanto la EDP (homogénea), como la versión homogénea de las condiciones de contorno
admiten soluciones separables, lo cual conduce al siguiente problema de Sturm–Liouville
regular en el espacio L2 (0, L):

d2 v v(0) = 0, v 0 (L) = 0
= v, , 0  x  L.
dx2 v(x) sol. clásica

La solución de este problema es


✓ ◆2 ⇣ ⌘ r ✓ ◆
1 ⇡ 2 2 1 ⇡x
n = n+ , 'n (x) = sen n + , n = 0, 1, 2 . . .
2 L L 2 L

y estas autofunciones, reales y normalizadas, forman una base ortonormal del espacio L2 (0, L).
Por tanto, se propone buscar la solución del problema de contorno original como un desarrollo
en autofunciones del vector |u(t)i 2 L2 (0, L):
1
X Z L
u(x, t) ' un (t)'n (x), un (t) = h'n |u(t) i = dx '⇤n (x) u(x, t).
n=1 0

A la hora de proyectar el problema original en esta base hay que tener en cuenta que la
función u(x, t) no pertenece al subespacio S porque no cumple la condición de contorno
inhomogénea en x = L: por tanto, no se puede suponer que el operador d2 /dx2 es hermı́tico
MMII 2020–2021, soluciones del boletı́n para el tema 9 8

cuando actúa sobre esta función y hay que calcular el elemento de matriz teniendo en cuenta
especı́ficamente esta condición de contorno:
⌧ ⌧ Z L
1 d2 un 1 @2u @2 @2
2 2
= ' n 2 2
= ' n 2
u = dx '⇤n (x) 2 u(x, t)
c dt c @t @x 0 @x
x=L Z L ⇤ Z L
@u d' @u d'⇤n @u
(int. por partes) = '⇤n (x) (x, t) dx n
= A '⇤n (L) cos ⌦t dx
@x x=0 0 dx @x 0 dx @x
0 '⇤ (x)
n n
z }| { z }| {
⇤ x=L Z L
d'n d2 '⇤n
(int. por partes) = A '⇤n (L) cos ⌦t (x)u(x, t) + dx u(x, t)
dx x=0 0 dx2
Z L
= A '⇤n (L) cos ⌦t + n dx '⇤n (x)u(x, t) .
| {z } 0
p n
| {z }
(2/L) ( 1)
h'n |u i=un

Por tanto, se acaba llegando al sistema de EDOs


r
d2 un 2 2 dun
= !n un + ( 1)n c2 A cos ⌦t un (0) = 0, (0) = 0, 0t (n = 0, 1, 2 . . . ),
dt2 L dt
expresado en términos de las frecuencias propias
p ✓ ◆
1 ⇡c
!n := c n = n+ .
2 L

Como vemos, la inhomogeneidad en la condición de contorno en x = L se ha convertido en


una inhomogeneidad en las EDOs para los coeficientes un (t). La solución de estas EDOs es
r
2 cos !n t cos ⌦t
un (t) = ( 1)n c2 A ,
L ⌦2 !n2

suponiendo que ⌦ 6= !n para cualquier n (más adelante se considera el caso en que esto no
es ası́). Ası́ pues, la solución del problema se escribe como
1
X 1 ✓ ◆
2c2 A X cos !n t cos ⌦t 1 ⇡x
u(x, t) ' un (t)'n (x) = ( 1)n sen n +
n=0
L n=0
⌦2 !n2 2 L
(⌦ !n )t (⌦ + !n )t ✓ ◆
1
4c2 A X sen sen 1 ⇡x
= ( 1) n 2 2 sen n + .
L n=0 ⌦ !n ⌦ + !n 2 L

La solución es una superposición de ondas estacionarias, cada una de las cuales oscila en el
tiempo. La amplitud de oscilación es tanto mayor cuanto más próxima es alguna frecuencia
propia !n a la externa ⌦. De hecho, la solución proporcionada no es válida si existe un n0
para el cual ⌦ = !n0 , en cuyo caso la solución del problema de condiciones iniciales para el
correspondiente modo es
r
2 t sen ⌦t
un0 (t) = ( 1)n0 c2 A ,
L 2⌦
de manera que la amplitud de la onda estacionaria con n = n0 crece en el tiempo, lo cual
corresponde a una resonancia.
MMII 2020–2021, soluciones del boletı́n para el tema 9 9

112. La formulación matemática del problema es


8 9
> @V @V >
>
> (0, y) = (Lx , y) = 0, >
>
>
> @x @x >
>
>
> >
>
>
> >
>
< = 0  x  Lx ,
@2V @2V V @V
+ = 0, (x, 0) = 0, ,
@x 2 @y 2 ` 2 >
> @y >
>
>
> >
> 0  y  Ly .
>
> >
>
>
> @V (x) >
>
>
: (x, Ly ) = =
0 x/Lx
e >
;
@y ✏0 ✏0
Las condiciones de contorno especifican la componente normal del campo eléctrico en cada
pared como función de la correspondiente densidad superficial de carga. (Preste atención,
en particular, al signo para la condición en la pared y = Ly : (x) crea un flujo de campo
eléctrico hacia el interior del dominio, esto es, en el sentido del vector unitario ey .)
La EDP, que es homogénea, admite soluciones separables, V (x, y) = ⌅(x)⌥(y):
función solo de x función solo de y
z }| { z }| {
⌅(x)⌥(y) 1 1 1
0 = ⌥(y)⌅00 (x)+⌅(x)⌥00 (y) ) ⌅00 (x) = 00
⌥ (y) + 2 = constante.
`2 ⌅(x) ⌥(y) `

También la admiten la versión homogénea de las condiciones de contorno. Existen dos posi-
bles problemas de Sturm–Liouville regular: elegimos el de la variable x porque las condiciones
de contorno ya son homogéneas:
⇢ 0
d2 v v (0) = v 0 (Lx ) = 0
= v, , 0  x  Lx .
dx2 v(x) sol. clásica

La solución es (véase el problema 100)


8 1
>
> '0 (x) = p ,
✓ ◆2 >
< Lx
n⇡
n = 0, 1, 2, . . . n = , r
Lx >
>
>
: 'n (x) = 2 n⇡x
cos , n 6= 0,
Lx Lx

y las autofunciones, reales y normalizadas, forman una base ortonormal del espacio L2 (0, Lx ).
A continuación se expresa la solución del problema original como un desarrollo en autofun-
ciones del vector |V (y)i 2 L2 (0, Lx ):
1
X Z Lx
V (x, y) ' vn (y)'n (x), vn (y) := h'n |V (y) i = dx '⇤n (x) V (x, y).
n=0 0

Proyectando el problema en la base de autofunciones se encuentra el siguiente conjunto de


EDOs y condiciones de contorno:

(n⇡/Lx )2 1/`2
z✓ }| ◆{
d2 v n 1 n
+ n vn = 0, vn0 (0) = 0, vn0 (Ly ) = ,
dy 2 `2 ✏0

en términos de los coeficientes


Z Lx p
1 x/Lx
0 := h'0 | i = dx p 0e = 0 Lx (e 1),
0 Lx
Z r Z
Lx
2 n⇡x p 1 p ( 1)n e 1
x/Lx
n := h'n | i = dx cos 0e = 0 2Lx dz ez cos n⇡z = 0 2Lx .
0 Lx Lx 0 1 + (n⇡)2
MMII 2020–2021, soluciones del boletı́n para el tema 9 10

Introduciendo los parámetros estrictamente positivos (esto es, ninguno es nulo)


s✓ ◆
2
n⇡ 1
µn := + 2,
Lx `

la solución para los coeficientes se puede escribir como

n cosh µn y
vn (y) = .
✏0 µn senh µn Ly

Por tanto, el potencial es


1
0 ` cosh y/` 2 0 X ( 1)n e 1 cosh µn y n⇡x
V (x, y) ' (e 1) + cos .
✏0 senh Ly /` ✏0 n=1 1 + (n⇡)2 µn senh µn Ly Lx

Es evidente que la solución está bien definida. En el lı́mite ` ! 1, la ecuación de Helmholtz


se transforma en la ecuación de Laplace y µn ! n⇡/Lx , de manera que el término n = 0 en
el desarrollo en serie está mal definido: en efecto, en este lı́mite se encuentra el potencial
1
0 `2 2 0 X ( 1)n e 1 Lx cosh n⇡y/Lx n⇡x
V (x, y) ⇠ (e 1) + cos .
✏0 Ly ✏0 n=1 1 + (n⇡)2 n⇡ senh n⇡Ly /Lx Lx

El término n = 0 se vuelve independiente de las coordenadas espaciales x, y y representa


una constante aditiva pero que diverge: esta divergencia está asociada con el hecho de que el
mismo problema pero para la ecuación de Laplace está mal planteado, en el sentido de que
las condiciones de contorno solo permiten determinar el potencial excepto, precisamente, por
una constante aditiva.
113. La formulación matemática del problema fı́sico es el siguiente problema de condiciones de
contorno para el campo densidad de partı́culas %(x, t):
8 9
>
> %(0, t) = %(L, t) = 0 > >
< = 0  x  L,
@% @2% ✓ ◆
= D 2, ,
@t @x >
> L > >
: %(x, 0) = N x ; 0  t,
2

donde D > 0 es el coeficiente de difusión de las partı́culas en el lı́quido. La condición de


contorno de extremos absorbentes se formula como ausencia de partı́culas en los mismos.
La EDP y las condiciones de contorno (todas homogéneas) admiten soluciones separables y
conducen al siguiente problema de Sturm–Liouville regular en la variable x (compare con el
problema 110):
d2 v
= v, v(0) = v(L) = 0, 0  x  L,
dx2
cuya solución es
⇣ n⇡ ⌘2 r
2 n⇡x
n = , 'n (x) = sen , n = 1, 2, . . .
L L L
Estas autofunciones, reales y normalizadas, forman una base ortonormal del espacio L2 (0, L).
Se busca la solución como el desarrollo en autofunciones del vector |%(t)i 2 L2 (0, L):
1
X Z L
%(x, t) ' rn (t)'n (x), rn (t) = h'n |%(t) i = dx '⇤n (x)%(x, t).
n=1 0

Entonces, el problema de condiciones de contorno se formula de manera equivalente como el


siguiente sistema de EDOs:
drn
= D n rn ,
dt
MMII 2020–2021, soluciones del boletı́n para el tema 9 11

8
>
> 0, n par
Z L
r >
<
2 n⇡ r
rn (0) = dx '⇤n (x)%(x, 0) = N 'n (L/2) = N sen = 2
0 L 2 >
> m
( 1) N , n = 2m + 1 impar
>
: L
m = 0, 1, 2 . . .
La solución es
rn (t) = N 'n (L/2)eD nt
,
y por tanto
1
X 1
2N X [(2m+1)⇡/L]2 Dt (2m + 1)⇡x
%(x, t) ' N eD nt
'n (L/2)'n (x) = ( 1)m e sen .
n=1
L m=0 L

Para tiempos largos (de manera más precisa, (⇡/L)2 Dt 1), el campo densidad se puede
aproximar como
2N (⇡/L)2 Dt ⇡x
%(x, t) ⇡ e sen ,
L L
y por tanto se anula asintóticamente: en este caso, los extremos absorbentes previenen la
conservación del número de partı́culas y la tuberı́a acaba vacı́a de partı́culas.

También podría gustarte