Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sist Ecuac No Lineales PDF
Sist Ecuac No Lineales PDF
SISTEMAS DE ECUACIONES
NO LINEALES
Ing. Jorge J. L. Ferrante
Colaboradores
Lic. Mario Di Blasi Regner
Ing. Carlos Krujovsky
2011
PROLOGO
I GENERALIDADES
f 1 ( x1 , x 2 ,..., x n ) = 0
f ( x , x ,..., x ) = 0
2 1 2 n
.......... ..................
f n (x1 , x 2 ,..., x n ) = 0
f1
f
f = 2
....
fn
x1
x
x= 2
....
xn
f (x ) = 0
3 También se supone que ha sido encontrada una aproximación inicial a
la raíz buscada, que se denominará aproximación de orden 0
(0)
x1
( 0)
x
x ( 0) = 2
......
( 0)
xn
y que se tomará como punto de partida para los métodos que a continuación
se presentan.
λx = λ x , ∀λ ∈ R, ∀x ∈ R n
x + y ≤ x + y , ∀x , y ∈ R n
i =n
x
2
x 2
= i
i =1
x ∞
= Máx{x i }
1≤ i ≤ n
d (x k , x m ) = x k − x m
*
A =0⇔ A=0
λA = λ A , ∀λ ∈ R, ∀A ∈ R n
A + B ≤ A + B , ∀A, B ∈ R n
A. B ≤ A . B , ∀A, B ∈ R n
n n
a
2
A F
= i, j
j =1 i =1
n
A 1 = Máx a i , j
i =1
1≤ j ≤ n
n
A 2 = Máx a i , j
j =1
1≤ i ≤ n
11 También puede utilizarse como norma para matrices reales la
A = ρ ( A t . A)
siguiente
o su equivalente
f 1 ( x1 , x 2 , x 3 ,..., x n ) = 0
f ( x , x , x ,..., x ) = 0
2 1 2 3 n
f 3 ( x1 , x 2 , x 3 ,..., x n ) = 0
.................................
f n ( x1 , x 2 , x 3 ,..., x n ) = 0
(0)
x1
( 0)
x
x ( 0) = 2
......
( 0)
xn
o su equivalente
x1 = ϕ 1 ( x1 , x 2 , x 3 ,..., x n )
x = ϕ ( x , x , x ,..., x )
2 2 1 2 3 n
x 3 = ϕ 3 ( x1 , x 2 , x 3 ,..., x n )
.................................
x n = ϕ n (x1 , x 2 , x 3 ,..., x n )
15 La elección de las funciones ϕ no es para nada trivial pues de ellas
depende nada menos que la convergencia o no convergencia del método en
estudio.
Algunas posibles son elementales, por ejemplo
x = x + f (x ) ϕ (x ) = x + f (x )
x = x − f (x ) ϕ (x ) = x − f (x )
otras sencillamente dependen de un despeje total o parcial de x1 en la
primera ecuación, de x2 en la segunda y, por fin de xn en la última ecuación
dada.
x k +1 = ϕ (x k )
o su equivalente
(
x1 k +1 = ϕ 1 x1 k , x 2 k , x 3 k ,..., x n k
k +1
)
(
x 2 = ϕ 2 x1 , x 2 , x 3 ,..., x n
k k k k
)
k +1
(
x 3 = ϕ 3 x1 , x 2 , x 3 ,..., x n
k k k k
)
.........................................
(
x n k +1 = ϕ n x1 k , x 2 k , x 3 k ,..., x n k
)
limx k +1 = limϕ (x k )
k →∞ k →∞
si estos límites existen, deberá ser
limx k +1 = Ξ
k →∞
limϕ (x k ) = Ξ
k →∞
Ξ =ϕ Ξ ()
siendo entonces Ξ un punto fijo. Naturalmente, para resolver sistemas no
lineales es necesario que existan puntos fijos y para ello, a su vez es
necesario que la aplicación sea una contracción.
d [ϕ ( x ), ϕ ( y )] ≤ Ld ( x , y ), ∀x , y ∈ D
x k +1 = ϕ (x k )
será
[
]
d (x 1 , x 2 ) = d ϕ (x 0 ), ϕ (x 1 ) ≤ Ld (x 0 , x 1 )
[
]
d (x 2 , x 3 ) = d ϕ (x 1 ), ϕ (x 2 ) ≤ Ld (x 1 , x 2 ) ≤ L2 d (x 0 , x 1 )
..........................................................
[
]
d (x n , x n +1 ) = d ϕ (x n −1 ), ϕ (x n ) ≤ Ld (x n −1 , x n ) ≤ ... ≤ Ln d (x 0 , x 1 )
Ln d (x 0 , x 1 ) + Ln +1 d (x 0 , x 1 ) + Ln + 2 d (x 0 , x 1 ) + ... + Ln + p −1 d (x 0 , x 1 ) =
Ln d (x 0 , x 1 )
L d (x , x )(1 + L + L + ... + L ) ≤
n 0 1 2 p −1
1− L
d (x n , x n + p ) ≤ d (x 0 , x 1 )
Ln
1− L
como ϕ es una contracción L es menor que uno, entonces para cualquier ε > 0
basta con tomar
ε (1 − L )
log 0 1
N≥ d (x , x )
log(L )
para que se verifique que la distancia d(xn,xm=n+p) < ε para todo par de índices
n y m mayores que N. En consecuencia la sucesión
x k +1 = ϕ (x k )
x k +1 → Ξ ∧ ϕ (x k ) → ϕ (Ξ ) Ξ = ϕ (Ξ )
k →∞ k →∞
21 Además ese punto fijo es único. Supóngase que existen dos puntos
fijos Ξ0 y Ξ1 entonces
d (Ξ 0 , Ξ 1 ) = d [ϕ (Ξ 0 ), ϕ (Ξ 1 )] ≤ Ld (Ξ 0 , Ξ 1 ) < d (Ξ 0 , Ξ 1 )
lo que evidentemente es un absurdo dado que ningún número real es
estrictamente menor a si mismo. Salvo que Ξ0 y Ξ1 sean coincidentes, en
cuyo caso la distancia es nula y entonces
0 = d (Ξ 0 , Ξ 1 ) = d [ϕ (Ξ 0 ), ϕ (Ξ 1 )] ≤ Ld (Ξ 0 , Ξ 1 ) = 0
limd (x , x ) = d (x , Ξ ) = d (x 1 , x 0 )
n n+ p n Ln
p →∞ 1− L
[
]
d (x k , x k +1 ) = d ϕ (x k −1 ), ϕ (x k ) < Ld (x k −1 , x k )
x1 = ϕ 1 ( x1 , x 2 , x 3 ,..., x n )
x = ϕ ( x , x , x ,..., x )
2 2 1 2 3 n
x 3 = ϕ 3 ( x1 , x 2 , x 3 ,..., x n )
.................................
x n = ϕ n (x1 , x 2 , x 3 ,..., x n )
ϕ (x p ) − ϕ (x q ) = J [ϕ (x r )](x p − x q ), x r ∈ D
ϕ (x p ) − ϕ (x q ) = J [ϕ (x r )](x p − x q ) ≤ J [ϕ (x r )] (x p − x q ) ≤ L (x p − x q ) < (x p − x q )
5 x 2 − y 2 = 0
y − 0.25( Sen( x) + Cos ( y )) = 0
10
4 2 2 4
10
1.0
0.8
0.6
0.4
0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0
x1 = ϕ1 ( x1 , x 2 )
x 2 = ϕ 2 ( x1 , x 2 )
escribiendo
x = ( y 2 ) / 5
y = 0.25( Sen( x) + Cos ( y ))
Donde se ha hecho x2 = y
( ) (
lim d x n , x n + p = d x n , Ξ =
p →∞
Ln
1− L
)
(
d x1, x 0 )
∂ϕ1 ∂ϕ1
∂x
∂y
y
0 0 0.089442
J ( x, y ) = = =
0.2487510 0.049967
5
∂ϕ 2 ∂ϕ 2
0.25Cos ( x) − 0.25Sen( y ) ( x , y ) =( 0.1,0, 2)
∂x
∂y ( x , y ) =( 0.1, 0.2 )
Se calcula ahora
a11 a12
(a )
2 2
= = 0 2 + 0.089442 2 + 0.2487510 2 + 0.049967 2 = 0.269023 = L < 1
2
a a 22
ij
21 F i =1 j =1
Este valor indica que el Método del Punto Fijo, para este sistema, es
convergente
39 Se calcula, iterativamente
f (xk )
x k +1 = x k −
f ′( x k )
lim x k = ξ
k →∞
f (ξ ) = 0
x k +1 − ξ < Q x k − ξ
2
y escalarmente de la forma
f1 ( x1 , x 2 , x3 ,..., x n ) = 0
f ( x , x , x ,..., x ) = 0
2 1 2 3 n
f 3 ( x1 , x 2 , x3 ,..., x n ) = 0
....................................
f n ( x1 , x 2 , x3 ,..., x n ) = 0
Segundo, un vector en el espacio de n dimensiones como primera
aproximación a la raíz Ξ del sistema
x1 ( 0 )
(0)
x2
( 0)
x ( 0) = x3
.......
xn (0)
43 Se supone un incremento
h1
h2
h = h3
....
hn
x = x (0) + h
1
( ) ( ) ( )( )
f x ( 0) + h = f x ( 0 ) + h .∇ f x ( 0) + h .∇
2!
( ) f (x ) + 31! (h.∇) f (x ) + ...
( 2) ( 0) ( 3) ( 0)
1
( )
(n − 1)!
h .∇
( n −
( )
1)
( ) ( )
1
n!
( n )
f x ( 0 ) + h .∇ f x (θ )
(Cálculo Avanzado, Watson Fulks, Limusa Wiley, Cap 10, pto 5)
donde
∂ ∂ ∂ ∂
∇= e1 + e2 + e3 + ... + en
∂x1 ∂x 2 ∂x3 ∂x n
∂ 2 f ( x1 , x 2 ) ∂ 2 f ( x1 , x 2 ) ∂ 2 f ( x1 , x 2 ) 2
( 2)
∂ ∂
h1 + h2 f ( x1 , x 2 ) = h1 +2 h1 h2 +
2
h2
∂x1 ∂x 2 ∂x1 ∂x1∂x 2 ∂x 2
2 2
∂f 1 ( x1 , x 2 ,..., x n )
( ) ( )
n
+ + + = +
(0) (0) (0) (0) (0) (0)
1 1
f x h , x h ,..., x h f x , x ,..., x hi
∂
1 2 2 n n 1 1 2 n
i = 1 x i 0
f x ( 0 ) + h , x ( 0 ) + h ,..., x ( 0 ) + h = f x ( 0 ) , x ( 0 ) ,..., x ( 0 ) + ∂f 2 ( x1 , x 2 ,..., x n ) h
( ) ( )
n
2 1 1 2 2 n n 2 1 2 n
i =1 ∂x i
i
0
∂f 3 ( x1 , x 2 ,..., x n )
( ) ( )
n
+ + + = +
(0) (0) (0) (0) (0) (0)
3 1
f x h , x h ,..., x h f x , x ,..., x hi
∂x i
1 2 2 n n 3 1 2 n
i =1 0
.......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... ..
∂f n ( x1 , x 2 ,..., x n )
( ) ( )
n
+ + + = +
(0) (0) (0) (0) (0) (0)
n 1
f x h , x h ,..., x h f x , x ,..., x hi
∂
1 2 2 n n n 1 2 n
i = 1 x i 0
45 Suponiendo ahora que los valores de hi calculados a partir de este
sistema son aquellos que anulan las funciones fi, es decir los valores xi(0) + hi
son exactamente las raíces del sistema no lineal que se está resolviendo, se
tendrá
∂f1 ∂f1 ∂f 1
...
∂x1 ∂x 2 ∂x n h1 ( ( 0) (0) (0)
f 1 x1 , x 2 , x3 ,..., x n
(0)
)
∂f 2 ∂f 2
...
∂f 2 h2
=−
( ( 0) (0) (0)
f 2 x1 , x 2 , x3 ,..., x n
(0)
)
∂x1 ∂x 2 ∂x n
... ...
( )
... .. ... ...
∂f n ∂f n ∂f n
( 0) (0) (0) (0)
hn f n x1 , x 2 , x3 ,..., x n
...
∂x1 ∂x 2 ∂x n 0
∂f 1 ∂f 1 ∂f 1
...
∂ x1 ∂x 2 ∂x n
∂f 2 ∂f 2 ∂f 2
f 1 , f 2 , f 3 ,..., f n ...
J = ∂x ∂x 2 ∂x n
x1 , x 2 , x 3 ,..., x n 1
... .. ... ...
∂f n ∂f n ∂f n
...
∂ x1 ∂x 2 ∂x n
x1
(1)
x1
(0)
( (0) (0)
f1 x1 , x 2 , x3 ,..., x n
(0) (0)
)
f , f , f ,..., f n f (x )
(1) (0) (0) (0) (0) (0)
x2 x , x 2 , x3 ,..., x n
= 1 − J −1 1 2 3 2 1
(0)
−1 f (x )
x = x − J ( 0 ) f (x ( 0 ) )
(1) ( 0 )
x
x1
( k +1)
x1
(k )
( (k ) (k )
f 1 x1 , x 2 , x3 ,..., x n
(k ) (k )
)
x2
( k +1
=
x1
(k )
f , f , f ,..., f n
− J −1 1 2 3
(
f 2 x1 ( k ) , x 2 ( k ) , x3 ( k ) ,..., x n ( k ) )
... ... x1 , x 2 , x3 ,..., x n k ...
xn
( k +1)
x1
(k )
(
(k ) (k )
f n x1 , x 2 , x3 ,..., x n
(k ) (k )
)
(k )
−1 f (x )
= x − J ( k ) f (x ( k ) )
( k +1) ( k )
x
x
vale la pena observar la similitud formal de esta ultima con aquella con la
que se comenzó este tema
f (x k )
x k +1 = x k −
f ′(x k )
f1 = 5 x 2 − y 2
f 2 = y − 0.25*( Sen( x) + Cos ( y ))
x1
( k +1)
x1
(k )
( (k ) (k ) (k )
f1 x1 , x2 , x3 ,..., xn
(k )
)
x2
( k +1
=
x1
(k )
−J
(
−1 f1 , f 2 , f 3 ,..., f n f 2 x1
(k ) (k ) (k )
, x2 , x3 ,..., xn
(k )
)
... ... x1 , x2 , x3 ,..., xn k ...
xn
( k +1)
x1
(k )
( (k ) (k ) (k )
f n x1 , x2 , x3 ,..., xn
(k )
)
x ( k +1) x (k ) f ,f f1 ( x ( k ) , y ( k ) )
= − J −1 1 2 .
y ( k +1) y (k ) x, y
(k )
k f2 (x , y )
(k )
53 Se calcula
−1
f ,f 10 x − 2y
J 1 2
−1
=
x, y k − 0.25Cos ( x) 1 + 0.25Sen( y )
resultando
1 + 0.25Sen( y ) 2y
f , f 10 x − 0.5 yCos( x) + 2.5 xSen( y ) 10 x − 0,5 yCos ( x) + 2.5 xSen( y )
J −1 1 2 =
x, y 0.25Cos ( x) 10 x
10 x − 0.5 yCos( x) + 2.5 xSen( y ) 10 x − 0.5 yCos( x) + 2.5 xSen( y )
Y se hace
( k +1) (k )
x x
= −
y y
(k )
1 + 0.25Sen( y ) 2y
5x 2 − y 2
(k )
3.4
3.2
x(2)
3
x(1)
2.8
2.6
57 Cabe una pregunta ¿hasta dónde habrá que deslizarse por la línea del
gradiente, con punto de partida en x(0) ? La respuesta es fácil, muy fácil
para expresarla con palabras pero algo más compleja matemáticamente.
x ( 0 ) , x (1) , x ( 2 ) , x ( 3) ,..., x ( k ) ,...
esperándose una buena tasa de convergencia. Esto es así cuando los "valles"
están netamente definidos como lo es el del gráfico anterior. En cambio si
el "fondo" del "valle" es estrecho y alargado la poligonal puede entrar en un
casi interminable zig zag hasta llegar, si llega, al mínimo buscado.
3.2
x(2)
3 x(1)
2.8 λ∇S(x(0))
2.6
x(0)
1.6 1.8 2 2.2 2.4
x ( k ) = x ( k −1) − λk −1∇S ( x ( k −1) )
donde λk-1 es un parámetro a determinar para hacer mínima la función S(X)
( )
n
S (x ) = S ( x1 , x 2 , x 3 ,..., x n ) = ( f i ( x1 , x 2 , x 3 ,..., x n )) = f ( x ) • f ( x )
2
i =1
dado que el vector raíz del sistema anula a esta función, haciendo cero a
todos y cada uno de sus componentes fi
{ [
( )]}
n
Φ (λ ) = f i x ( k −1) − λ∇S x ( k −1)
2
i =1
( k −1)
n
Φ (λ ) = f i x (−λ
∂f i x ( k −1)
) ∇S x
(
( k −1)
2
) ( )
i =1 ∂x
i =1
) ( ) (
( k −1) ∂f i x ( k −1)
(
)
n
fi x
∂x
∇S x ( k −1)
λk −1 = i =1
n
∂f i x
( k −1
(
)
) (
( k −1)
2
)
i =1
∂x
∇S x
∂ ∂ ∂ ∂
∇= e1 + e2 + e3 + ... + en
∂x1 ∂x 2 ∂x3 ∂x n
resulta
∂ ∂ ∂ ∂ n ∂f i ( x )
( ) = ∂x e1 + ∂x e2 + ∂x e3 + ... + ∂x en [ f i (x )] = 2 f i (x ) ∂x
2 n
∇S x
1 2 3 n i =1 i =1 j
f1 , f 2 , f 3 ,..., f n
∇S (x ) = 2J
t
f ( x )
x1 , x 2 , x3 ,..., x n
de donde
) ( ) (
( k −1) ∂f i x ( k −1)
(
)
n
fi x
∂x
∇S x ( k −1)
λk −1 = i =1 =
n
(
∂f i x ( k −1) ) ( ( k −1)
)
2
i =1
∂x
∇S x
( k −1) f1 , f 2 , f 3 ,..., f n t f1 , f 2 , f 3 ,..., f n ( k −1)
f x
( )
, J J ( f x)
x 1 , x 2 , x 3 ,..., x n x 1 , x 2 , x 3 ,..., x n
2
f1 , f 2 , f 3 ,..., f n t f 1 , f 2 , f 3 ,..., f n ( k −1) f1 , f 2 , f 3 ,..., f n t f1 , f 2 , f 3 ,..., f n ( k −1)
)
J
x , x , x ,..., x J x , x , x ,..., x f x
( ), J J (
f x
1 2 3 n 1 2 3 n x1 , x 2 , x3 ,..., x n x1 , x 2 , x3 ,..., x n
f , f , f ,..., f n ( k −1)
x ( k ) = x ( k −1) − 2λ k −1 J t 1 2 3 f x ( )
x1 , x 2 , x3 ,..., x n k −1
f 1 ( x, y ) = xsen( y ) − 1 = 0
f 2 ( x, y ) = x + cos(2 y ) = 0
2
2 2 2
[
S (x, y ) = [ f 1 (x, y )] + [ f 2 (x, y )] = [xsen( y ) − 1] + x 2 + cos(2 y ) ]
2
70 Para tener una idea del “valle” donde se encuentra la raíz, el gráfico
siguiente es explícito al respecto
Es fácil ver que la raíz buscada es el punto más profundo de la
“lúnula” central (mejor sería decir la banana central), forma que puede ser
causa de múltiples rebotes en la ruta de descenso siguiendo la línea de
gradientes.
{ [ ]} { [
∇S (x, y ) = 2[xsen ( y ) − 1]sen ( y ) + 4 x x 2 + cos (2 y ) I + 2 cos( y )[xsen ( y ) − 1] − 4 sen ( 2 y ) x 2 + cos( 2 y ) J ]}
haciendo
[
x1 = x0 − λ 2[x0 sen ( y 0 ) − 1]sen ( y 0 ) + 4 x0 x0 + cos (2 y 0 )
2
]
[
y1 = y 0 − λ 2 cos( y 0 )[x0 sen ( y 0 ) − 1] − 4 sen ( 2 y 0 ) x0 + cos( 2 y 0 )
2
]
se calcula la función
Φ (λ ) = S [x1 (λ ), y1 (λ )]
[
S [x1 (λ ), y1 (λ )] = [x1 (λ )sen( y1 (λ )) − 1] + x1 (λ ) + cos(2 y1 (λ )) =
2 2
]
[ [
x0 − λ 2[x0 sen( y 0 ) − 1]sen( y 0 ) + 4 x0 x 0 2 + cos(2 y 0 )
=
]]
2
+
[ [
sen y 0 − λ 2 cos( y 0 )[x0 sen( y 0 ) − 1] − 4sen(2 y 0 ) x0 2 + cos(2 y 0 ) ]]
{ [ ]}
2
x − λ 2[x sen( y ) − 1]sen( y ) + 4 x x 2 + cos(2 y ) 2 +
0 0 0 0 0 0 0
[( [
cos 2 y 0 − λ 2 cos( y 0 )[x 0 sen( y 0 ) − 1] − 4sen(2 y 0 ) x0 2 + cos(2 y 0 ) ])]
cuyo mínimo hay que hallar. Como es usual, el procedimiento requiere derivar
con respecto a λ, igualar esta derivada a cero y obtener el valor de λ que
corresponde al mínimo.
76 Inmediatamente se hacen
∂S ( x, y )
x1 = x0 − λ
∂x 0
{ [
= 0.9 − λ 2[x0 sen( y 0 ) − 1]sen( y 0 ) + 4 x0 x0 + cos(2 y 0 )
2
]}
y1 = y 0 − λ
∂S ( x, y )
∂y 0
{ [
= 1.4 − λ 2 cos( y 0 )[x0 sen( y 0 ) − 1] − 4 sen(2 y 0 ) x0 + cos(2 y 0 )
2
]}
n Xn Yn S(xn , yn )
Φ (λ ) = S ( X ( 0 ) − λ∇S ( X ( 0 ) ))
x ( k ) = x ( k −1) − λk −1∇S ( x ( k −1) )
5 x 2 − y 2 = 0
y − 0.25( Sen( x) + Cos ( y )) = 0
λ1 =0
λ3 =0.5 (arbitrario)
λ2 =λ3/2 =0.25