Steepest Descent

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/320323533
El Método del Descenso más Rápido
Article · June 2008
CITATIONS READS
0 2,421
1 author:
Iván de Jesús May-Cen

Instituto Tecnológico Superior Progreso
61 PUBLICATIONS 18 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
TICs para el proceso enseñanza-aprendizaje de las ciencias básicas View project
Modelación de las reacciones eléctricas en el corazón View project
All content following this page was uploaded by Iván de Jesús May-Cen on 11 October 2017.
The user has requested enhancement of the downloaded file.

El Método del Descenso más Rápido
Iván de Jesús May Cen
imaycen@hotmail.com
Facultad de Matemáticas, Universidad Autónoma de Yucatán
Junio de 2008
Resumen
Presentaremos el método del descenso más rápido (Steepest Descent) el cual es
válido para sistemas Ax = b, cuya matriz A es simétrica y definida positiva, i. e.,
para matrices tales que AT = A y xT Ax > 0 cualquiera que sea el vector x 6= 0.
Iniciaremos con el siguiente resultado.
Lema 1 Si A es simétrica y definida positiva, el problema de resolver el sistema Ax = b
es equivalente al de minimizar la forma cuadrática
q(x) = hx, Axi − 2hx, bi
donde hx, yi = xT y representa el producto escalar de los vectores x e y.
Demostración:
Fijemos una dirección v y vamos a ver cómo se comporta la forma cuadrática q para
vectores de la forma x + tv donde t es un escalar.
q(x + tv) = hx + tv, A(x + tv)i − 2hx + tv, bi
= hx + tv, Ax + tAvi − 2hx, bi − 2thv, bi
= hx + tv, Axi + thx + tv, Avi − 2hx, bi − 2thv, bi
2
= hx, Avi + t hv, Avi − 2hx, bi − 2thv, bi
Axi + thv, Axi+ thx,
2
= hx, Axi − 2hx, bi + thv, Axi + thx, Avi − 2thv, bi + t hv, Avi

= q(x) + 2thv, Axi − 2thv, bi + t2 hv, Avi
= q(x) + 2thv, Ax − bi + t2 hv, Avi
La ecuación de segundo grado en t ası́ obtenida tiene un mı́nimo que se calcula igua-
lando a cero la derivada
d
q(x + tv) = 2hv, Ax − bi + 2thv, Avi
dt
es decir, en el punto
hv, b − Axi
t=
b
hv, Avi
El valor mı́nimo que alcanza la forma cuadrática sobre dicho rayo viene dado por

q(x + b
tv) = q(x) + b t 2hv, Ax − bi + b
thv, Avi

= q(x) + t 2hv, Ax − bi + hv, b − Axi
b

= q(x) + bt − 2hv, b − Axi + hv, b − Axi
= q(x) − bthv, b − Axi
hv, b − Axi2
= q(x) −
hv, Avi
1
Esto nos indica que al pasar de x a x + b
tv siempre hay una reducción en el valor de q
excepto si v⊥(b − Ax), es decir, si hv, b − Axi = 0. Ası́ pues si x no es una solución del
sistema Ax = b existen muchos vectores v tales que hv, b − Axi = 6 0 y, por tanto, x no
minimiza a la forma cuadrática q. Por el contrario, si Ax = b, no existe ningún rayo que
emane de x sobre el que q tome un valor menor que q(x), es decir, x minimiza el valor de
q. N
El lema anterior nos sugiere un método iterado para resolver el sistema Ax = b pro-
cediendo a minimizar la forma cuadrática q a través de una sucesión de rayos.
En el paso k del algoritmo se dispondrá de los vectores
x(0) , x(1) , x(2) , . . . , x(k)
Estos vectores nos permitirán buscar una dirección apropiada v (k) y el siguiente punto
de la sucesión vendrá dado por
x(k+1) = x(k) + tk v (k)
donde
hv (k) , b − Ax(k) i
tk =
hv (k) , Av (k) i
Gráficamente, si kv (k) k = 1, tk mide la distancia que nos movemos de x(k) para obtener
x(k+1) .
1. Método del Descenso más Rápido

Si tomamos v (k) como el gradiente negativo de q en x(k) , es decir, como la dirección
del residuo r(k) = b − Ax(k) obtenemos el denominado método del descenso más rápido.
Teniendo en cuenta que los diferentes vectores x(i) no es necesario conservarlos, los
podemos sobreescribir obteniéndose el siguiente algoritmo que teniendo como entrada los
valores de x, A, b y n tiene como salida la solución x:
Punto inicial x:
for k = 1:n
v = −∇q(x) = b − Ax
hv, b − Axi kvk2
t= =
hv, Avi hv, Avi
x = x + tv
end
x
Obsérvese que a medida que crece el valor de k, el residuo v = b−Ax va disminuyendo,

por lo que al encontrarnos en las proximidades de la solución, el cálculo de t se convierte
prácticamente en una división de 00 lo que puede alterar considerablemente el valor exacto
que deberı́a tomar t y que generalmente nos lleva a que el método diverge.
Este método resulta, en general, muy lento si las curvas de nivel de la forma cuadrática
están muy próximas, por lo que no suele utilizarse en la forma descrita. Sin embargo,
utilizando condiciones de ortogonalidad en las denominadas direcciones conjugadas, puede
ser modificado de forma que se convierta en un método de convergencia rápida que es
conocido como método del gradiente conjugado.
2
Punto inicial x1 . Si k = 1, r1 = y − Ax1 , s1 = r1 ;
Repetir hasta convergencia:
krk k2
αk = T
sk Ask
xk+1 = xk + αk sk
rk+1 = rk − αk Ask
krk+1 k2
βk =
krk k2
sk+1 = rk+1 + βk sk
k ←k+1
Cuadro 1: Método del gradiente conjugado.
Figura 1: Descenso más rápido vs Gradiente conjugado
Referencias
[1] G. Strang, Introduction to Linear Algebra, Wellesley Cambidge Press, Third Edition
2003.
[2] M. Heath, Scientific Computing: An Introductory Survey, McGraw-Hill Companies

Inc., 2002.
View publication stats

Steepest Descent

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Steepest Descent

Cargado por

Copyright:

Formatos disponibles

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

El Método del Descenso más Rápido

Article · June 2008

Iván de Jesús May-Cen

TICs para el proceso enseñanza-aprendizaje de las ciencias básicas View project

Modelación de las reacciones eléctricas en el corazón View project

The user has requested enhancement of the downloaded file.

x(0) , x(1) , x(2) , . . . , x(k)

x(k+1) = x(k) + tk v (k)

1. Método del Descenso más Rápido

Obsérvese que a medida que crece el valor de k, el residuo v = b−Ax va disminuyendo,

Cuadro 1: Método del gradiente conjugado.

Figura 1: Descenso más rápido vs Gradiente conjugado

[2] M. Heath, Scientific Computing: An Introductory Survey, McGraw-Hill Companies

View publication stats

También podría gustarte