Está en la página 1de 4

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/320323533

El Método del Descenso más Rápido

Article · June 2008

CITATIONS READS

0 2,421

1 author:

Iván de Jesús May-Cen


Instituto Tecnológico Superior Progreso
61 PUBLICATIONS   18 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

TICs para el proceso enseñanza-aprendizaje de las ciencias básicas View project

Modelación de las reacciones eléctricas en el corazón View project

All content following this page was uploaded by Iván de Jesús May-Cen on 11 October 2017.

The user has requested enhancement of the downloaded file.


El Método del Descenso más Rápido
Iván de Jesús May Cen
imaycen@hotmail.com
Facultad de Matemáticas, Universidad Autónoma de Yucatán
Junio de 2008
Resumen
Presentaremos el método del descenso más rápido (Steepest Descent) el cual es
válido para sistemas Ax = b, cuya matriz A es simétrica y definida positiva, i. e.,
para matrices tales que AT = A y xT Ax > 0 cualquiera que sea el vector x 6= 0.
Iniciaremos con el siguiente resultado.
Lema 1 Si A es simétrica y definida positiva, el problema de resolver el sistema Ax = b
es equivalente al de minimizar la forma cuadrática
q(x) = hx, Axi − 2hx, bi
donde hx, yi = xT y representa el producto escalar de los vectores x e y.
Demostración:

Fijemos una dirección v y vamos a ver cómo se comporta la forma cuadrática q para
vectores de la forma x + tv donde t es un escalar.
q(x + tv) = hx + tv, A(x + tv)i − 2hx + tv, bi
= hx + tv, Ax + tAvi − 2hx, bi − 2thv, bi
= hx + tv, Axi + thx + tv, Avi − 2hx, bi − 2thv, bi
2
= hx,  Avi + t hv, Avi − 2hx, bi − 2thv, bi
 Axi + thv, Axi+ thx, 
2
= hx, Axi − 2hx, bi + thv, Axi + thx, Avi − 2thv, bi + t hv, Avi
 
= q(x) + 2thv, Axi − 2thv, bi + t2 hv, Avi
= q(x) + 2thv, Ax − bi + t2 hv, Avi
La ecuación de segundo grado en t ası́ obtenida tiene un mı́nimo que se calcula igua-
lando a cero la derivada
d
q(x + tv) = 2hv, Ax − bi + 2thv, Avi
dt
es decir, en el punto
hv, b − Axi
t=
b
hv, Avi
El valor mı́nimo que alcanza la forma cuadrática sobre dicho rayo viene dado por
 
q(x + b
tv) = q(x) + b t 2hv, Ax − bi + b
thv, Avi
 
= q(x) + t 2hv, Ax − bi + hv, b − Axi
b
 
= q(x) + bt − 2hv, b − Axi + hv, b − Axi
= q(x) − bthv, b − Axi
hv, b − Axi2
= q(x) −
hv, Avi

1
Esto nos indica que al pasar de x a x + b
tv siempre hay una reducción en el valor de q
excepto si v⊥(b − Ax), es decir, si hv, b − Axi = 0. Ası́ pues si x no es una solución del
sistema Ax = b existen muchos vectores v tales que hv, b − Axi = 6 0 y, por tanto, x no
minimiza a la forma cuadrática q. Por el contrario, si Ax = b, no existe ningún rayo que
emane de x sobre el que q tome un valor menor que q(x), es decir, x minimiza el valor de
q. N
El lema anterior nos sugiere un método iterado para resolver el sistema Ax = b pro-
cediendo a minimizar la forma cuadrática q a través de una sucesión de rayos.
En el paso k del algoritmo se dispondrá de los vectores

x(0) , x(1) , x(2) , . . . , x(k)

Estos vectores nos permitirán buscar una dirección apropiada v (k) y el siguiente punto
de la sucesión vendrá dado por

x(k+1) = x(k) + tk v (k)

donde
hv (k) , b − Ax(k) i
tk =
hv (k) , Av (k) i
Gráficamente, si kv (k) k = 1, tk mide la distancia que nos movemos de x(k) para obtener
x(k+1) .

1. Método del Descenso más Rápido


Si tomamos v (k) como el gradiente negativo de q en x(k) , es decir, como la dirección
del residuo r(k) = b − Ax(k) obtenemos el denominado método del descenso más rápido.
Teniendo en cuenta que los diferentes vectores x(i) no es necesario conservarlos, los
podemos sobreescribir obteniéndose el siguiente algoritmo que teniendo como entrada los
valores de x, A, b y n tiene como salida la solución x:

Punto inicial x:
for k = 1:n
v = −∇q(x) = b − Ax
hv, b − Axi kvk2
t= =
hv, Avi hv, Avi
x = x + tv
end
x

Obsérvese que a medida que crece el valor de k, el residuo v = b−Ax va disminuyendo,


por lo que al encontrarnos en las proximidades de la solución, el cálculo de t se convierte
prácticamente en una división de 00 lo que puede alterar considerablemente el valor exacto
que deberı́a tomar t y que generalmente nos lleva a que el método diverge.
Este método resulta, en general, muy lento si las curvas de nivel de la forma cuadrática
están muy próximas, por lo que no suele utilizarse en la forma descrita. Sin embargo,
utilizando condiciones de ortogonalidad en las denominadas direcciones conjugadas, puede
ser modificado de forma que se convierta en un método de convergencia rápida que es
conocido como método del gradiente conjugado.

2
Punto inicial x1 . Si k = 1, r1 = y − Ax1 , s1 = r1 ;
Repetir hasta convergencia:
krk k2
αk = T
sk Ask
xk+1 = xk + αk sk
rk+1 = rk − αk Ask
krk+1 k2
βk =
krk k2
sk+1 = rk+1 + βk sk
k ←k+1

Cuadro 1: Método del gradiente conjugado.

Figura 1: Descenso más rápido vs Gradiente conjugado

Referencias
[1] G. Strang, Introduction to Linear Algebra, Wellesley Cambidge Press, Third Edition
2003.

[2] M. Heath, Scientific Computing: An Introductory Survey, McGraw-Hill Companies


Inc., 2002.

View publication stats

También podría gustarte