Está en la página 1de 32

Capı́tulo 5

Ecuaciones no Lineales

5.1. Introducción
 

  lineal
 algebraica


Dada una función f : IR → IR definida por f (x) = expresión no lineal





trascendente → no lineal

¿Cuándo aparece una ecuación?


Una ecuación aparece cuando la expresión que define a f se fija a un valor determinado.

 homogénea si y0 = 0
f (x) = y0 es una Ecuación
no homogénea si y0 6= 0

El valor y0 se llama el término independiente.


Gráficamente, la ecuación f (x) = y0 representa una intersección.

Figura 5.1: Intersección con el eje


Figura 5.2: Intersección con la recta y = y0
x

101
La ecuación homogénea representa la intersección de la curva definida por y = f (x) y la
recta definida por y = 0, que es el eje x, como lo muestra la Figura 5.1.
La ecuación no homogénea representa la intersección de la curva definida por y = f (x) y
la recta definida por y = y0 , que es una recta paralela al eje x como lo muestra la Figura 5.2.

Resolver o hallar la solución de una ecuación f (x) = y0 es encontrar el o los valores de x


que verifican dicha ecuación.

Según la forma de la expresión f (x) distinguen dos tipos de ecuaciones:



Lineales
1. Ecuaciones Algebraicas:
No Lineales

2. Ecuaciones Trascendentes → No lineales

Las Ecuaciones Algebraicas: son aquellas que se forman con suma, resta, producto y división
de polinomios por ejemplo:
x2
x3 − 2x = 0, −3x2 + 1 = −2, = 1, etc.
x+1
Las Ecuaciones Transcendentes se forman usando funciones trascendentes, por ejemplo:
5
ex − x = 0, ln(x2 ) = , sen(x2 ) + cos(x) = −1, etc.
2
Las soluciones de estas ecuaciones pueden ser reales o complejas. En particular en esta asig-
natura se estudiarán sólo las ecuaciones de soluciones reales.

Dado que existen escasos métodos para hallar la solución exacta de una ecuación no lineal, es
necesario para el futuro ingeniero conocer métodos numéricos que se aproximen a la solución de
una ecuación no lineal.

Ası́ como se vieron varios métodos para hallar la solución de sistemas de ecuaciones lineales,
también en este capı́tulo se verán métodos para resolver sistemas de ecuaciones no lineales.

5.2. Ecuaciones No Lineales


5.2.1. Clasificación de los métodos de solución
Los métodos que se van a estudiar para resolver ecuaciones no lineales se clasifican en :

1. Método Gráfico

Método de la Bisección
2. Métodos Cerrados (usan intervalos)
Método de la Regla Falsa

102

 Método de la Secante
3. Métodos Abiertos (no usan intervalos) Método de Iteración de Punto Fijo
Método de Newton - Raphson

Existen otros métodos que no se verán en este curso.

5.2.2. Método Gráfico

Dada la función f : IR → IR tal que f (x) está definida por una expresión tanto lineal como
no lineal, cuando se desea resolver la ecuación f (x) = 0 o la ecuación f (x) = y0 , significa que
se desea saber para qué valores de x la gráfica de f interseca al eje x o bien para qué valores
de x la gráfica de f interseca a la recta de ecuación y = y0 , respectivamente.
La forma más intuitiva de resolver las situaciones antes descriptas serı́a aplicar el Método
Gráfico, que consiste graficar la función f y observando la gráfica detectar aproximadamente
dónde se producen dichas intersecciones.

Ejemplo 5.2.1 Dadas las gráficas que siguen:

Figura 5.3: Intersección con el eje Figura 5.4: Intersección con la


x recta de ecuación y = y0

Observando la Figura 5.3 se puede decir que una aproximación a la solución es x = 0.75,
mientras que en la Figura 5.4 una aproximación a la solución es x = 1.8.

El método gráfico es impreciso y sólo sirve para tomar un valor inicial aproximado a la solu-
ción, que luego será empleado por otros métodos numéricos para hallar una mejor aproximación.
Ası́ el método gráfico sirve de apoyo de los métodos que se estudiarán más adelante.

En lo que sigue se considera que una f : IR → IR tal que f (x) está definida por una expresión
no lineal, se desea resolver la ecuación f (x) = 0, esto es se desea hallar la raı́z xr o una muy
buena aproximación de ella.

103
5.2.3. Método de la Bisección

El Método de la Bisección es un método cerrado, dado que se considera el intervalo cerrado


[a, b] que contiene a la raı́z xr de la ecuación f (x) = 0. Esta información generalmente se
conoce de antemano gracias al Método Gráfico.
Este método emplea el hecho que una función cambia de signo a ambos lados de la raı́z.
Gráficamente:

f (xr ) = 0 con xr ∈ [a, b] o a ≤ xr ≤ b

f (x) < 0 para todo a ≤ x < xr

f (x) > 0 para todo xr < x ≤ b

Figura 5.5: Gráfica de y = f (x)

Con base en la situación graficada se desarrolla el algoritmo del método.

Algoritmo:

Sea f una función continua sobre todo el intervalo [a, b].

Paso 1: Se toman como puntos iniciales x1 = a, x2 = b, donde [a, b] es el intervalo que contiene
a xr , la raı́z de f (x) = 0.
x1 + x2
Paso 2: Se calcula x3 = ; donde x3 es el punto medio del intervalo [a, b].
2

Figura 5.6: Cálculo de x3

104
Paso 3: Se evalúa f (x3 ) y se calculan los productos f (x1 ) · f (x3 ) y f (x3 ) · f (x2 ). Uno de estos
productos es negativo y verifica que:

Si f (x1 ) · f (x3 ) < 0 significa que la raı́z está en el subintervalo [x1 , x3 ].

Si f (x3 ) · f (x2 ) < 0 significa que la raı́z está en el subintervalo [x3 , x2 ].

x1 + x3
Paso 4: Si la raı́z se encuentra en el intervalo [x1 , x3 ], se calcula x4 = .
2
x3 + x2
En caso contrario, si la raı́z está en el intervalo [x3 , x2 ], se calcula x4 = .
2
Paso 5: Se hace lo mismo que en el paso 3.

Figura 5.7: Cálculo de x4 Figura 5.8: Cálculo de x5

Ası́ sucesivamente se encuentra una sucesión de valores (xn )n∈IN que se aproxima a la raı́z
xr .

Es de observar que después del n-ésimo paso, la raı́z xr se encuentra en el intervalo [xn−1 , xn ]
o en el intervalo [xn , xn−1 ].

En general

xn + xn−1
xn+1 = Fórmula del Método de la Bisección
2

Observaciones 5.2.1

1. Es conveniente aclarar que en cada paso se debe calcular ei = |xi − xi−1 |, el error entre
iteraciones, para saber cuándo se alcanza la precisión > 0 deseada, esto es cuándo ei <.

2. En la aplicación todos los métodos que se estudiarán en el este capı́tulo se analizará la


precisión en la forma antes mencionada.

105
Acotación del error de aproximación

A continuación se muestra qué tan cerca de la raı́z xr se encuentra una aproximación xn .


Se sabe que la raı́z xr se encuentra en un intervalo cerrado [a, b], donde se llamará a0 = a
y b0 = b.

a0 + b 0
Paso 1: Se calcula x1 = .
2
Suponiendo que la raı́z se encuentra en el intervalo [a0 , x1 ], entonces se denota ahora con
a1 = a0 y b1 = x1 , ası́ xr ∈ [a1 , b1 ].
a1 + b 1
Paso 2: Se calcula x2 = .
2
1
Se cumple que: |a1 − b1 | = |a0 − b0 |
2
 2
1 1
luego |xr − x2 | ≤ |a1 − b1 | = |a0 − b0 |
2 2
Llamando a2 = x2 y b2 = b1 = x1 , se tiene xr ∈ [a2 , b2 ]
a2 + b 2 x2 + x1
Paso 3: Se calcula x3 = = .
2 2
 2
1 1
Es claro que |a2 − b2 | = |a1 − b1 | = |a0 − b0 |
2 2
 2  3
1 1 1
Ası́ |xr − x3 | ≤ |a2 − b2 | = |a1 − b1 | = |a0 − b0 |
2 2 2
 3  3
1 1
Esto es: |xr − x3 | ≤ |a0 − b0 | = |a − b|
2 2

Paso n: Trabajando en forma análoga a lo anterior resulta que en el n-ésimo paso de la iteración se
cumple:
 n
1
|xr − xn | ≤ |a − b|
2

Número de iteraciones para alcanzar la precisión deseada

A continuación se muestra cómo descubrir cuál será el número n de iteraciones necesarias


para hallar la solución aproximada al resolver la ecuación no lineal f (x) = 0, por medio del
Método de la Bisección, alcanzando una precisión > 0 y sabiendo que la solución xr ∈ [a, b].

106
xn−2 + xn−1
En la iteración n del algoritmo del Método de la Bisección se verifican: xn = y
 n 2
1
(1) |xr − xn | ≤ |a − b|, con xr ∈ [xn , xn−1 ] o xr ∈ [xn−2 , xn ].
2
Para hallar n tal que |xr − xn | ≤ , considerando (1), será suficiente que se cumpla:

 n
1
|a − b| ≤ 
2
 n
1 

2 |a − b|
 n  
1 
log ≤ log
2 |a − b|
n (log(1) − log(2)) ≤ log() − log(|a − b|)
−n log(2) ≤ log() − log(|a − b|)

log(|a − b|) − log()


n≥
log(2)

Esta es la fórmula que determina la cantidad de pasos necesarios para encontrar la raı́z xr
con una precisión deseada, por medio del Método de la Bisección.

Ventajas y Desventajas del Método de la Bisección

Ventaja: Es un método seguro que siempre encuentra la raı́z con la precisión establecida.

Desventajas:

1. Es un método generalmente lento.

2. No distingue raı́z de punto crı́tico.

3. Presenta problemas en caso de discontinuidad de la función considerada.

4. El método no se puede aplicar cuando la función considerada tiene el mismo signo en ambos
extremos del intervalo que contiene a la raı́z. Esto indica que hay una raı́z repetida.

107
1
Ejemplo 5.2.2 Sea la función definida f (x) = que presenta singularidad en x = 2
x−2

En caso de existir un punto crı́tico lo


conveniente es evaluar f (x) y ver si
esta tiende a +∞ o a −∞, para no
usar el método.

Figura 5.9: Función discontinua

Ejemplo 5.2.3 Sea la función definida por f (x) = (x − 4)2

En este caso hay una raı́z doble y


al evaluar f (x) en los extremos de
cualquier intervalo que contenga a la
raı́z, no se presenta cambio de signo.

Figura 5.10: Función cuadrática

5.2.4. Método de la Regla Falsa

El Método de la Regla Falsa es parecido al Método de la Bisección, dado que para resolver
una ecuación no lineal f (x) = 0, también se necesita que la solución xr pertenezca a un intervalo
inicial cerrado [a, b]. La diferencia radica en el cálculo de las aproximaciones xn para n = 1, 2, · · · ,
aquı́ no se divide al intervalo en la mitad, sino que emplea el punto donde la recta secante a f (x)
corta al eje “x”.

Para obtener una fórmula que permita calcular xn , se considera lo siguiente:

108
Figura 5.11: Recta secante y triángulos semejantes

4 4
Por semejanza de triángulos EDA∼
=ABC se tiene

f (x1 ) f (x0 )
=−
x1 − x2 x2 − x0

Empleando propiedades de la proporción, propiedad distributiva y pasajes de términos:

(x2 − x0 )f (x1 ) = −f (x0 )(x1 − x2 )

x2 f (x1 ) − x0 f (x1 ) = f (x0 )x2 − f (x0 )x1

x2 f (x1 ) − x2 f (x0 ) = x0 f (x1 ) − f (x0 )x1

x2 (f (x1 ) − f (x0 )) = x0 f (x1 ) − f (x0 )x1

x0 f (x1 ) − f (x0 )x1


x2 =
f (x1 ) − f (x0 )

En general

xn−1 f (xn ) − f (xn−1 )xn


xn+1 = Fórmula del Método la Regla Falsa
f (xn ) − f (xn−1 )

109
La expresión de x2 también puede escribirse como:

x0 f (x1 ) x1 f (x0 )
x2 = −
f (x1 ) − f (x0 ) f (x1 ) − f (x0 )

Sumando y restando x1
x0 f (x1 ) x1 f (x0 )
x2 = x1 + − x1 −
f (x1 ) − f (x0 ) f (x1 ) − f (x0 )
x0 f (x1 ) − x1 [f (x1 ) − f (x0 )] − x1 f (x0 )
x2 = x1 +
f (x1 ) − f (x0 )
x0 f (x1 ) − x1 f (x1 ) + x1 f (x0 ) − x1 f (x0 )
x2 = x1 +
f (x1 ) − f (x0 )
(x0 − x1 )f (x1 )
x2 = x1 +
f (x1 ) − f (x0 )
(x1 − x0 )f (x1 )
x2 = x1 −
f (x1 ) − f (x0 )
f (x1 )
x2 = x1 −
f (x1 ) − f (x0 )
x1 − x0

En general

(xn − xn−1 )f (xn )


xn+1 = xn −
f (xn ) − f (xn−1 )
Otras Fórmulas del
f (xn ) Método la Regla Falsa
xn+1 = xn −
f (xn ) − f (xn−1 )
xn − xn−1

Algoritmo del Método de la Regla Falsa

Paso 1: Se considera un intervalo inicial [x0 , x1 ] que contiene a xr , la raı́z de f (x) = 0.

Paso 2: Se calcula x2 mediante la fórmula

x0 f (x1 ) − f (x0 )x1


x2 =
f (x1 ) − f (x0 )
o también
f (x1 )(x1 − x0 )
x2 = x1 −
f (x1 ) − f (x0 )

110
Paso 3: Se evalúan los productos f (x1 )·f (x2 ) y f (x0 )·f (x2 ) para analizar en cuál nuevo subintervalo
está el cambio de signo y por ende la raı́z:
• Si f (x1 ) · f (x2 ) < 0 significa que la raı́z xr se encuentra en el intervalo [x2 , x1 ].
• Si f (x0 ) · f (x2 ) < 0 significa que la raı́z xr se encuentra en el intervalo [x0 , x2 ].

Paso 4: Se vuelve al Paso 1 y se calcula la aproximación que sigue empleando una de las fórmulas
generales del método.

En cada iteración se analiza el error entre iteraciones y se detiene el proceso de cálculo cuando
ei = |xi − xi−1 | < , siendo  > 0 la precisión deseada.

Comparación con el Método de la Bisección

1. Al comparar el comportamiento del Método de la Regla Falsa con respecto al del Método
de la Bisección, se observa en general que la convergencia del primero es más rápida que la
del segundo. Esto es, una precisión deseada se logra en menos pasos con el primero de los
métodos. Sin embargo este hecho es relativo, existen algunas situaciones en que el Método
de la Bisección emplea menos pasos.

2. Tanto en el Método de la Regla Falsa


como en el Método de la Bisección es
importante tener el apoyo del método
gráfico, especialmente cuando se trata
de resolver problemas de raı́ces múlti-
ples, en que se debe determinar el in-
tervalo inicial que contiene a cada raı́z.
Figura 5.12: Raı́ces múltiples

5.3. Métodos Abiertos

Los métodos abiertos, a diferencia de los métodos cerrados, en lugar de partir de un intervalo
cerrado que contiene a la raı́z de una ecuación f (x) = 0, parten de uno o dos valores iniciales
próximos a la raı́z. Desde aquı́ empleando la fórmula del método que corresponda se construye
una sucesión de valores que converge a la raı́z xr .
Los métodos abiertos al no iniciar desde un intervalo que contiene la raı́z, es posible que
construyan una sucesión divergente de valores. Cuando esto sucede partiendo de un valor inicial
x0 , es porque este valor no es adecuado por no estar cerca de la raı́z o bien por la función dada.

111
Si bien el hecho de considerar sólo un punto inicial puede ser una desventaja, cuando los
métodos abiertos convergen, generalmente lo hacen en menos iteraciones que los métodos cerrados,
esto es la convergencia es más rápida.

5.3.1. Método de la Secante

El Método de la Secante es un método abierto empleado para hallar la raı́z de una ecuación
f (x) = 0. El procedimiento de cálculo comienza con dos valores iniciales que están próximos a
la raı́z xr , pero asumiendo que el intervalo que ellos forman no la contiene. El siguiente valor se
halla a partir de la recta secante a la gráfica de f (x) determinada por los dos valores iniciales.

Se consideran los puntos del plano

Gráficamente se tiene lo siguiente: (x0 , yo ), (x1 , y1 ), (x2 , y2 )

con y0 = f (x0 ), y1 = f (x1 ) e y2 = 0


y0 − y1 y1 − y2
=
x0 − x1 x1 − x2
f (x0 ) − f (x1 ) f (x1 ) − 0
=
x0 − x1 x1 − x2
x1 − x 2 f (x1 )
=
x0 − x1 f (x0 ) − f (x1 )
f (x1 )(x0 − x1 )
x1 − x2 =
f (x0 ) − f (x1 )
Figura 5.13: Algoritmo del método
f (x1 )(x0 − x1 )
x2 = x1 −
f (x0 ) − f (x1 )
f (x1 )
x2 = x1 −
f (x0 ) − f (x1 )
En general se tiene: x0 − x1

f (xn )(xn−1 − xn ) f (xn )


xn+1 = xn − o bien xn+1 = xn −
f (xn−1 ) − f (xn ) f (xn−1 ) − f (xn )
xn−1 − xn

Fórmulas del Método de la Secante

112
Observaciones 5.3.1

1. Se observa que el Método de la Secante tiene una formulación igual a la del Método de la
Regla Falsa. La diferencia entre los métodos radica en cómo funcionan al aplicar la misma
fórmula. En el método de la Regla Falsa el nuevo valor que se calcula a partir de uno de
los valores anteriores de un intervalo que contiene a la raı́z. En cambio en el Método de la
Secante el nuevo valor que se calcula forma un intervalo con los puntos anteriores que no
contiene a la raı́z, este intervalo queda a un lado de la misma. Ver la Figura 5.13.

2. Cabe también mencionar, que generalmente el Método de la Secante converge en menos


iteraciones que el Método de la Regla Falsa.

3. Al igual que otros métodos se debe calcular el error entre iteraciones para conocer cuándo se
alcanza la precisión deseada.

5.3.2. Método de la Secante Modificado

Acá la variante del Método de la Secante es que en lugar de partir de dos valores próximos a
la raı́z de una ecuación f (x) = 0, se parte de un sólo valor y se emplea un factor δ ( δ es un
número real pequeño por ejemplo δ = 0.0001) que modifica o perturba al valor dado, y con esta
modificación se tienen nuevamente dos valores iniciales; esto es, se tiene x0 y x1 = x0 + δ · x0
Note que el factor δ no debe ser muy grande, pues puede conducir a problemas de divergencia.
Tampoco debe ser muy pequeño pues puede producir errores de redondeo.
La deducción de la fórmula general de este método es igual que la del método anterior consi-
derando que para un xi cualquiera se cumple:

f (xi + δxi ) − f (xi ) f (xi + δxi ) − f (xi )


=
xi + δxi − xi δxi
Luego la fórmula general del método es:

f (xn ) · δxn f (xn )


xn+1 = xn − o bien xn+1 = xn −
f (xn + δxn ) − f (xn ) f (xn + δxn ) − f (xn )
δxn

Fórmulas del Método de la Secante Modificado

113
5.3.3. Método de Iteración de Punto Fijo

El problema del punto fijo.

Sea g : IR1 −→ IR1 una función real definida por g(x) = y.


Sea I : IR1 −→ IR1 la función real definida por I(x) = x.

I es la función identidad y divide al plano en dos semiplanos iguales.

Figura 5.14: Gráfica de g Figura 5.15: Gráfica de I

La derivada de I, representa la pendiente de la recta tangente I 0 (x) = 1 para todo x ∈ IR.

Si la función g tiene una gráfica que corta


a la gráfica de la función identidad, entonces
existe solución a la ecuación x = g(x), es
decir, existe x = α que cumple α = g(α).

Figura 5.16: Gráficas de g e I

Encontrar una solución de la ecuación x = g(x), corresponde a la Teorı́a de Punto Fijo


donde α se llama el punto fijo.

114
La solución de la ecuación x = g(x) se lleva a cabo siguiendo un proceso iterativo para hallar
una sucesión de aproximaciones a la solución, de forma tal que xn+1 = g(xn ), como se muestra
en la figura que sigue:

La sucesión (xn )n∈IN está dada


por
xn+1 = g(xn )

Fórmula de la Iteración de
Punto Fijo

Figura 5.17: Sucesión (xn )n∈IN

A continuación se verán distintos casos que pueden darse al aplicar el proceso iterativo de
punto fijo.
Caso I y Caso II

Figura 5.18: Caso I Figura 5.19: Caso II

Para ambos casos se consideran la pendiente de las rectas tangentes en x = α.

Observe que la pendiente de la función identidad es 1, y que I 0 (x) = 1, esto indica que la
tangente a I(x) es ella misma.
Llamando t(x) a la recta tangente a g(x), luego g 0 (x) es la pendiente de t(x).

115
En las Figuras 5.20 y 5.21 se observa que tanto en el Caso I como en el Caso II la pendiente
de la recta tangente t(x) es, en valor absoluto, menor que 1, esto es:

|g 0 (x)| < I 0 (x) = 1


Lo anterior puede verse en las gráficas que siguen:

Figura 5.20: Gráficas: g(x), I(x) y t(x) Figura 5.21: Gráficas: g(x), I(x) y t(x)

En ambos casos en x = α y en un intervalo [a, b] que contiene a α, se cumple

|g 0 (x)| < 1

Caso III y Caso IV

Figura 5.22: Caso III Figura 5.23: Caso IV

Para ambos casos ahora se consideran las pendientes de la rectas tangentes en x = α.

116
Figura 5.24: Caso III Figura 5.25: Caso IV

De las figuras se observa que:

• En el Caso III se tiene g 0 (x) > 1 en un intervalo [a, b] que contiene a α.

• En el Caso IV se tiene g 0 (x) < −1 en un intervalo [a, b] que contiene a α.

Luego se puede decir en ambos casos que en x = α y que en un intervalo [a, b] que contiene
a α, se cumple:

|g 0 (x)| > 1

Lo visto anteriormente en forma geométrica corresponde al siguiente resultado teórico:

Teorema de Punto Fijo

Sea g : IR → IR una función continua y derivable en [a, b], con |g 0 (x)| ≤ λ < 1 para todo
x ∈ [a, b] y dados α, x0 ∈ [a, b], tal que α = g(α), entonces la sucesión (xn )n∈IN construida
bajo la forma xn+1 = g(xn ), es convergente y se cumple lı́m xn = α.
n→∞

Demostración

(1) Sea g una función continua en el intervalo [a, b] [hip.]

(2) Sea 0 < λ < 1 tal que |g 0 (x)| ≤ λ < 1 para todo x ∈ [a, b] [hip.]

(3) Sea α ∈ [a, b] tal que α = g(α). [hip.]

(4) Sea la sucesión (xn )n∈IN construida bajo la forma xn+1 = g(xn ). [hip.]

117
(5) Aplicando el teorema del valor medio se tiene que si xn ∈ [a, b], existe ξ un valor entre
α y xn tal que:

g(α) − g(xn )
= g 0 (ξ) con ξ ∈ [a, b]
α − xn

g(α) − g(xn ) = g 0 (ξ)(α − xn )


|g(α) − g(xn )| = |g 0 (ξ)| |(α − xn )|

[(1), (2)]

(6) Existe λ tal que λ = máx |g 0 (x)| [(1)]


x∈[a, b]

(7) |g 0 (x)| ≤ λ para todo x ∈ [a, b], en particular |g 0 (ξ)| ≤ λ. [(1), (5)]

(8) Luego
|α − xn+1 | = |g(α) − g(xn )|
= |g 0 (ξ)||(α − xn )|
≤ λ|α − xn | ≤ |g(α) − g(xn−1 )|
≤ λ(λ|α − xn−2 |) = λ2 |α − xn−2 | ≤ ...
≤ λn |α − x0 |
ası́
|α − xn+1 | ≤ λn |α − x0 |

[(3), (5), (7)]

(9) Como 0 < λ < 1 entonces λn −−−→ 0 luego |α − xn+1 | → 0 por lo tanto y xn −−−→ α por
n→∞ n→∞
lo tanto queda demostrado el teorema.

Relación entre los Métodos Abiertos y el Método de Iteración de Punto Fijo

Sea f1 : IR −→ IR tal que se desea resolver la ecuación de la forma (1) f1 (x) = b.

Sin pérdida de generalidad, resolver una ecuación de la forma (1) es lo mismo que resolver una
ecuación de la forma (2) f (x) = 0, con f (x) = f1 (x) − b.

Para resolver f (x) = 0 se emplea la Iteración de Punto Fijo. Para esto, se hallará una función
g, tal que resolver x = g(x), sea lo mismo que resolver f (x) = 0.

Esto es, se tratará de hallar α tal que:

118
α es solución de x = g(x) si y sólo si α es solución de f (x) = 0.

Esto es, α = g(α) si y sólo si f (α) = 0

Puede existir una gran cantidad de funciones g en las condiciones antes mencionadas. A
continuación se verán algunas de las más comunes de hallar. La principal y más confiable función
g es la que se obtiene por medio del Método de Newton-Raphson.

Método de Newton-Raphson

Este es el método más usado entre los métodos abiertos.

Sea la función f : IR → IR tal que se desea hallar la raı́z xr , de la ecuación f (x) = 0.


Para deducir la fórmula de este método se toma un valor inicial x0 cerca de la raı́z de la función,
luego trazando la recta tangente a la gráfica de f en el punto (x0 , f (x0 )) se determina el punto
(x1 , 0), que es la intersección de la recta tangente y el eje x.

Gráficamente:

La recta tangente a f (x) en el punto


(x0 , f (x0 )) corta al eje x en el punto
(x1 , 0) y su pendiente está dada por

f (x0 ) − 0
f 0 (x0 ) = , luego
x0 − x1
f (x0 )
x0 − x1 = , ası́
f 0 (x0 )
f (x0 )
x1 = x0 −
f 0 (x0 )
Figura 5.26: Algoritmo del método

Tomando x1 en lugar de x0 y haciendo lo mismo, se obtiene:

f (x1 )
x2 = x1 −
f 0 (x1 )

119
En general,

f (xn )
xn+1 = xn − Fórmula del Método de Newton-Raphson
f 0 (xn )

La fórmula anterior puede escribirse como:

f (xn )
xn+1 = g1 (xn ), con g1 (xn ) = xn −
f 0 (xn )

Ası́ se puede afirmar que la iteración de Newton-Raphson es una Iteración de Punto Fijo.

Otro camino para hallar la fórmula del método

Considerando el desarrollo de Taylor de f (x) alrededor de xi se tiene:

f 00 (xi )
f (x) = f (xi ) + f 0 (xi )(x − xi ) + (x − xi )2 + · · ·
2!
Truncando este desarrollo en el segundo término, se obtiene un polinomio lineal
f (x) u f (xi ) + f 0 (xi )(x − xi )
Si xi está próximo a una raı́z xr de la ecuación f (x) = 0, se tiene
0 = f (xr ) u f (xi ) + f 0 (xi )(xr − xi )
luego
0 u f (xi ) + f 0 (xi )(xr − xi )
efectuando pasaje de términos
f (xi )
(xr − xi ) u −
f 0 (xi )
ası́
f (xi )
xr u xi −
f 0 (xi )
definiendo por proximidad
f (xi )
xi+1 = xi −
f 0 (xi )

La fórmula de Newton-Raphson anterior permite construir una sucesión (xi )i∈IN . Se desea
que dicha sucesión converja a xr , la raı́z de f (x) = 0, esto es, lı́m xi = xr .
i→∞

Existen situaciones en que la sucesión no converge. A continuación se muestran, gráficamente,


algunos casos.

120
Figura 5.27: Caso 1 Figura 5.28: Caso 2 Figura 5.29: Caso 3

Para evitar situaciones como las vistas anteriormente se debe elegir correctamente el valor
inicial x0 , para esto se considera el siguiente Teorema.

Teorema de convergencia local del Método de Newton-Raphson

Sea la función f : IR → IR tal que:

H1) f, f 0 y f 00 son continuas en un intervalo [a, b],

H2) Existe un único valor xr ∈ [a, b] tal que f (xr ) = 0,

H3) f 0 (x) 6= 0 para todo x ∈ [a, b],

H4) El signo de f 00 (x) es constante para todo x ∈ [a, b],

H5) Se cumple que f (a) · f 00 (a) > 0 ó f (b) · f 00 (b) > 0,

Si se elige x0 como el extremo que verifica el producto positivo en H5) entonces la sucesión
(xi )i∈IN definida por la fórmula de Newton-Raphson converge a xr .

Ejemplo Sea la función f : IR → IR definida por f (x) = x2 − 3. Se sabe que la ecuación


f (x) = 0 tiene una raı́z en [1.5, 2].

1. Comprobar las condiciones del


Teorema de convergencia.

2. Aplicar el Método de Newton


Raphson para calcular la raı́z con
una precisión de  = 0.001.

Figura 5.30: Gráfica de f

121
Solución

1. H1) f (x) = x2 − 3, f 0 (x) = 2x y f 00 (x) = 2 son continuas en el intervalo [1.5, 2], por ser
f (x) un polinomio.
H2) Existe un único valor xr ∈ [1.5, 2] tal que f (xr ) = 0 vale por la aplicación del Método
Gráfico.
H3) f 0 (x) = 2x 6= 0 para todo x ∈ [1.5, 2],
H4) f 00 (x) = 2, luego el signo de f 00 (x) es constante para todo x ∈ [1.5, 2],
extremo f (x) f 00 (x)

H5) 1.5 -0.75 2


2 1 2

Se cumple que f (2) · f 00 (2) = 2 > 0,


Se elige x0 = 2

2. Se define la fórmula iterativa y el error entre iteraciones:

x2i − 3
xi+1 = xi − , ei+1 = |xi+1 − xi |
2xi
3. Se calcula la sucesión de aproximaciones:
x1 = 1.7500000000, e1 = 0.2500000000
x2 = 1.7321428571, e2 = 0.0178571429
x3 = 1.7320508100, e3 = 0.0000920471

Se observa que la sucesión es convergente, con convergencia monótona.

La solución aproximada con la precisión deseada es: x3 = 1.7320508100.

Observación 5.3.1 Cabe hacer notar que si bien el Método de Newton-Raphson es un método
abierto, “se lo acerca” a los métodos cerrados para poder elegir el valor x0 adecuado para asegurar
la convergencia.

5.3.4. Análisis del error del Método de Newton-Raphson

Sea la función f : IR → IR, si xr es raı́z de la ecuación f (x) = 0, entonces se cumple


f (xr ) = 0.
Desarrollando f (x) por Taylor alrededor de xi muy próximo a xr y evaluando en xr , se
tiene:

122
f 00 (ξi )
0 = f (xr ) = f (xi ) + f 0 (xi )(xr − xi ) + (xr − xi )2
2!
con ξi que se encuentra entre xr y xi .
Como xi está muy próximo a xr se cumple :
f 00 (ξi )
0 = f (xi ) + f 0 (xi )(xr − xi ) + (xr − xi )2
2!
f 00 (ξi )
f 0 (xi )(xr − xi ) = −f (xi ) − (xr − xi )2
2!
f (xi ) f 00 (ξi )
xr − xi = − − (xr − xi )2
f 0 (xi ) 2!f 0 (xi )
f (xi ) f 00 (ξi )
xr = xi − 0 − (xr − xi )2
f (xi ) 2!f 0 (xi )
| {z }
xi+1

f 00 (ξi )
xr − xi+1 = − 0
(xr − xi )2
2!f (xi )

Si Ev,i+1 = xr − xi+1 , es error verdadero que se comete en la iteración i + 1 y Ev,i = xr − xi ,


es el error verdadero que se comete en la i-ésima iteración, entonces:

f 00 (ξi )
Ev,i+1 = − Ev,i 2
2!f 0 (xi )

Como ξi → xi cuando xi → xr , pues ξi ∈ (xi , xr ), se puede decir que:

f 00 (xi )
Ev,i+1 =− 0 Ev,i 2
2!f (xi )

Se observa que existe una relación entre el error verdadero cometido en la iteración i y el
error verdadero cometido en la iteración i + 1.
Además, esta expresión indica que el error disminuye de iteración en iteración cuando el método
converge.
f 00 (xi )
00
f (xi )
Si M es una cota superior próxima de , esto es 0 ≤ M entonces
2!f 0 (xi ) 2!f (xi )
2
|Ev,i+1 | ≤ M Ev,i

De lo anterior se observa que cuando el Método de Newton-Raphson converge, es decir,


lı́m Ev,i = 0, el error en cada iteración es proporcional al cuadrado del error de la iteración
i→∞
anterior. Esto explica por qué el Método de Newton-Raphson converge muy rápido, cuando con-
verge. Este tipo de convergencia se le llama “convergencia cuadrática”. A diferencia del Método de

123
 n
1
la Bisección que tiene convergencia |x0 − x1 |, a la que se le llama “convergencia lineal”de
2
1
razón .
2

Otras funciones g para aplicar la Iteración de Punto Fijo

Se recuerda que para resolver f (x) = 0, empleando la Iteración de Punto Fijo, se hallará
una función g, tal que resolver la ecuación x = g(x), sea lo mismo que resolver la ecuación
f (x)
f (x) = 0. Además de la función g1 (x) = x − 0 , definida a partir de la fórmula de Método de
f (x)
Newton-Raphson, existen algunas otras formas generales para definir funciones g que permitan
construir una sucesión (xi )i∈IN convergente a α, la raı́z de la ecuación f (x) = 0.

A continuación se muestran algunas de dichas formas generales de definir distintas g:

Se considera la ecuación f (x) = 0 y α la raı́z de dicha ecuación.

1. Dada la ecuación f (x) = 0, sumando x a cada miembro en la ecuación, se tiene


x + f (x) = x,

luego se define g2 (x) = x + f (x)

Para saber si la función g2 definida es adecuada para aplicar la iteración de punto fijo,
primero se debe analizar si |g20 (x)| < 1 en un intervalo [a, b] que contiene a la raı́z α.

2. Dada la ecuación f (x) = 0, otra fórmula útil para definir g3 (x) se obtiene con los siguiente
pasos:
f (x) = 0
c · f (x) = c · 0 = 0 con c 6= 0
x + c · f (x) = x

luego se define g3 (x) = x + c · f (x), con c 6= 0

Si c = 1, entonces se obtiene nuevamente g2 (x).

Para c 6= 0, c 6= 1, la expresión de g30 (x) determinará el valor de c para el cual |g30 (x)| < 1,
en un intervalo [a, b] que contiene a α y ası́ asegurar que g3 es adecuada para aplicar
la iteración de punto fijo en [a, b].

124
3. Dada la ecuación f (x) = 0, despejando la variable x de la ecuación anterior, se obtiene
una expresión con la que se define g4 (x) y posteriormente se analiza si |g40 (x)| < 1 en
un intervalo [a, b] que contiene a α y ası́ asegurar que g3 es adecuada para aplicar la
iteración de punto fijo en [a, b].

Ejemplo 5.3.1 Dada f (x) = x2 − 3, hallar raı́z positiva de f (x) = 0, empleando Iteración de
Punto Fijo.

Solución
Ya se vio que f (x) = 0 tiene una raı́z en el intervalo [1.5, 2].

Caso 1 g2 (x) = x + f (x)

f (x) = 0
2
x −3 = 0
2
x −3+x = x
Luego
g2 : IR → IR está definida por g2 (x) = x2 + x − 3

A continuación se analiza si la función g2 definida es conveniente para aplicar la iteración


de punto fijo, esto es, se analiza si se cumple |g20 (x)| < 1 en [1.5, 2].
g2 (x) = x2 + x − 3
g20 (x) = 2x + 1
Luego a partir de g2 se construirá
una sucesión valores que será diver-
gente, esto indica que la función g2
Ahora se analiza g20 (x)
1.5 < x < 2 que se definió no sirve para hallar
3 < 2x < 4 aproximaciones a la raı́z α.
4 < 2x + 1 < 5
∴ g20 (x) > 1

Caso 2 g3 (x) = x + c · f (x), con c 6= 0

Para f (x) = x2 − 3, partiendo de f (x) = 0

x2 − 3 = 0
c · (x2 − 3) = c · 0 = 0
x + c(x2 − 3) = x
Luego g3 : IR → IR está definida por
g3 (x) = x + c(x2 − 3) con c 6= 0

125
Para lograr convergencia se debe elegir c 6= 0 adecuado, tomando un valor próximo a α
como se muestra en lo que sigue:
g3 (x) = x + c · (x2 − 3)
0
g3 (x) = 1+2·c·x
de la gráfica se observa que x = 1.7 es próximo a α
g30 (1.7) = 1 + 2 · c · 1.7
0
g3 (1.7) = g30 (1.7) = 1 + c · 3.4

Se requiere |g30 (1.7)| < 1 luego se trabaja partir de la expresión de la derivada como sigue:

−1 < 1 + c · 3.4 < 1


−1 − 1 < c · 3.4 < 1−1
−2 < c · 3.4 < 0

17
−2 < c· < 0
5
10
− < c < 0
17

−0.588235294 < c < 0

De lo anterior, cualquier función g3 : IR → IR definida por g3 (x) = x + c · (x2 − 3), con


c ∈ (−0.588235294, 0), ”podrı́a” construir una sucesión convergente de aproximaciones de
la raı́z.

La expresión ”podrı́a”, se emplea porque no se efectúa el análisis de g30 (x) en todo el


intervalo [1.5, 2].

Considerando por ejemplo c1 = −0.5, se define


1
g3 (x) = x − 0.5(x2 − 3) = x − (x2 − 3).
2
Luego g30 (x) = 1 − x

Ahora se comprueba la condición de convergencia

1.5 < x < 2


−2 < −x < −1.5
1−2 < 1−x < 1 − 1.5
−1 < 1−x < −0.5
∴ |g30 (x)| < 1

Luego, efectivamente, a partir de g3 (x) se puede hallar una sucesión de aproximaciones que
converge a α.

126
Por ejemplo para x0 = 1.7 y una precisión  = 0.01, la sucesión que se obtiene es:

x1 = g3 (x0 ) = 1.7550000000, e1 = 0.0550000000


x2 = g3 (x1 ) = 1.7149875000, e2 = 0.0400125000
x3 = g3 (x2 ) = 1.7443964374, e3 = 0.0294089374
x4 = g3 (x3 ) = 1.7229369720, e4 = 0.0214594654
x5 = g3 (x4 ) = 1.7386810673, e5 = 0.0157440953
x6 = g3 (x5 ) = 1.7271751404, e6 = 0.0115059268
x7 = g3 (x6 ) = 1.7356081576, e7 = 0.0084330171 < 

Se observa que la sucesión convergente, en este caso la convergencia es alternada.

Caso 3.1 Partiendo de la ecuación f (x) = 0, despejando x.

3
2 g4 (x) =
x −3 = 0 x
x2 = 3 3
g40 (x) = −
3 x2
x = 3
x g40 (1.7) = − √
Ası́ ahora ( 3)2
3 = −1.038062284 < −1
g4 : IR → IR está definida por g4 (x) =
x ∴ |g40 (x)| > 1

Luego con la función g4 la sucesión construida por la Iteración de Punto Fijo tampoco
converge a α.

Caso 3.2 Partiendo de la ecuación f (x) = 0, despejando x de otra forma.

x2 − 3 = 0
x2 = 3  
x2 + x2 = 3 + x2 1 3
g5 (x) = +x
2 x
2x2 = 3 + x2  
3 + x2 1 3
x = g50 (x) = − 2 +1
2x 2 x
 
1 3
 
1 3
x = +x g50 (1.7) = − 2 +1
2 x 2 1.7
= −0.019031142
Luego g5 : IR → IR está definida por ∴ |g50 (x)| < 1
 
1 3
g5 (x) = +x
2 x

127
En este caso la función g5 sı́ es conveniente para aplicar el proceso de iteración de punto
fijo, pues cumple la condición de convergencia.

Por ejemplo para x0 = 1.7 y una precisión  = 0.00001, la sucesión que se obtiene es:

x1 = g5 (x0 ) = 1.7323529412, e1 = 0.0323529412


x2 = g5 (x1 ) = 1.7320508339, e2 = 0.0003021073
x3 = g5 (x2 ) = 1.7320508076, e3 = 0.0000000263

Se observa que la sucesión es convergente y la convergencia es monótona.

Resumen:

1. De lo expuesto se asegura que al aplicar la Teorı́a de Punto Fijo para resolver una ecuación
de la forma f (x) = 0, se pueden definir distintas funciones g para un mismo problema.

2. De las distintas funciones g definidas, unas permiten resolver el problema original, mientras
otras no.

3. De las que lo resuelven al problema, unas lo hacen mejor que otras.

5.4. Sistemas de Ecuaciones No Lineales


5.4.1. Método de Newton-Raphson
Entre distintas formas de resolver un sistema de ecuaciones no lineales se puede contar con
generalizaciones de la Iteración de Punto Fijo para n variables, entre las que se encuentra el
Método de Newton-Raphson.

Sea el siguiente sistema de ecuaciones no lineales:




 f1 (x1 , x2 , · · · , xn ) = 0
 f2 (x1 , x2 , · · · , xn ) = 0

(I) ..


 .
 f (x , x , · · · , x ) = 0
n 1 2 n

En forma compacta el sistema (I) se puede escribir en la forma:


(I´) F (X) = θ donde:
 
f1
 f2 
• F =  .. , es la matriz de las funciones fi
 
 . 
fn

128
 
x1
 x2 
• X=  es la matriz de coordenadas de x̄
 
..
 . 
xn

x̄ = (x1 , x2 , · · · , xn ) ∈ IRn .

• Cada función fi : IRn → IR es decir fi (x̄) ∈ IR i = 1, 2, · · · n.

• F : IRn → IRn definida por F (x̄) = (f1 (x̄), f2 (x̄), · · · , fn (x̄))

Hallar la solución del sistema homogéneo (I) significa que se desea hallar la solución de la
ecuación homogénea
F (x̄) = 0̄

luego se desea hallar ᾱ raı́z de F (x̄) = 0̄,

por lo tanto se desea hallar ᾱ tal que F (ᾱ) = 0̄

Sea F con derivadas parciales continuas hasta orden n ≥ 2 en B[ᾱ, δ ], una bola
cerrada o entorno cerrado con centro en ᾱ y de radio δ , donde ᾱ es la raı́z de F (x̄) = 0̄,
esto es, F (ᾱ) = 0̄.

Sea x̄i ∈ B[ᾱ, δ ], entonces x̄i es muy próximo a ᾱ. Se considera el desarrollo de Taylor
de grado 1 de F (x̄) alrededor de x̄i , trabajando matricialmente se tiene:

F (X) = F (Xi ) + JF Xi · (X − Xi ) + R2 (X)


con JF Xi la matriz asociada a F , evaluada en Xi .

Por las condiciones de F y considerando R2 (X) ∼


= 0̄, se trunca obteniendo un polinomio
de Taylor matricial de grado 1; ası́:

F (X) ∼

= F (Xi ) + JF Xi · (X − Xi )

Luego para X =α se tiene

θ = F (α ) ∼

= F (Xi ) + JF Xi · (α − Xi )
siendo α la matriz de coordenadas ᾱ

JF · (α − Xi ) ∼

luego Xi
= −F (Xi )

como la matriz jacobiana JF Xi tiene inversa, luego

129
−1 −1
JF X∗i · JF Xi · (α − Xi ) ∼

= −JF Xi · F (Xi )
−1
α − Xi ∼= −JF Xi · F (Xi )
−1
α ∼ = Xi − JF Xi · F (Xi )

De lo anterior se define un procedimiento iterativo al reemplazar α por Xi+1 como sigue:

−1
Xi+1 = Xi − JF Xi · F (Xi )

Fórmula No 1 del Método de Newton Raphson para n ≥ 2

Mediante la fórmula anterior se construye una sucesión (Xi )i∈IN de aproximaciones a la


solución, tal que Xi converge a α cuando i → ∞

−1
En la práctica, a veces suele ser poco conveniente el cálculo de JF Xi , por lo que se procede
como sigue a partir de la ecuación:


JF Xi · (α − Xi ) = −F (Xi ) ,

considerando Xi+1 , se tiene JF Xi · (Xi+1 − Xi ) = −F (Xi ),

Llamando ∆Xi+1 = Xi+1 − Xi , se obtiene:


JF Xi · ∆Xi+1 = −F (Xi )

Fórmula No 2 del Método de Newton Raphson para n ≥ 2

La fórmula anterior representa un sistema de ecuaciones lineales que puede resolverse por
cualquiera de los métodos vistos en el Capı́tulo 4.

Ejemplo 5.4.1 Aplique el método de Newton-Raphson para resolver el siguiente sistema:


   
 2 x01 1.1
−20x1 + x2 = −19 Considere X0 = = y una
2 x02 1.1
x1 − 20x2 = −19
precisión de  = 10−3 .

130
Solución:


 f1 (x1 , x2 ) = −20x1 + x2 2 + 19 = 0
1. El sistema se reformula como:
f2 (x1 , x2 ) = x1 2 − 20x2 + 19 = 0

2. Se efectúa el proceso iterativo

Iteración 1:

JF |X0 · ∆X1 = −F (X0 ), ∆X1 = X1 − X0


       
f1 (x01 , x02 ) −22 + 1.21 + 19 −1.79 δ1
F (X0 ) = = = , ∆X1 =
f2 (x01 , x02 ) 1.21 − 22 + 19 −1.79 δ2

∂f1 (x̄) ∂f1 (x̄)


 
 ∂x1 ∂x2   
−20 2x2
JF |X =  = ,
 
 ∂f (x̄) 2x1 −20
2 ∂f2 (x̄) 
∂x1 ∂x2
∂f1 (x̄0 ) ∂f1 (x̄0 )
 
 ∂x1 ∂x2   
−20 2.2
JF |X0 =  =
 
 ∂f (x̄ ) 2.2 −20
2 0 ∂f2 (x̄0 ) 
∂x1 ∂x2
Se formula ası́ el sistema de ecuaciones lineales que se resuelve por cualquiera de los métodos
vistos en el Capı́tulo 4.

JF |X0 · ∆X1 = −F (X0 )

     
−20 2.2 δ1 1.79
· =
2.2 −20 δ2 1.79

   
δ1 −0.1005617978
∆X1 = =
δ2 −0.1005617978
   
x01 + δ1 0.9994382022
Ası́ ∆X1 = X1 − X0 luego X1 = X0 + ∆X1 = =
x02 + δ2 0.9994382022
y e1 = kX1 − X0 k∞ = 0.1005617978 > 

131
Iteración 2:
 
−20 1.998876404
Se formula ahora JF |X1 ∆X2 = −F (X1 ) con JF |X1 =
1.998876404 −20
     
−20 1.9988764 δ1 −0.01011268
· =
1.9988764 −20 δ2 −0.01011268
   
δ1 0.00056178004881
∆X2 = =
δ2 0.00056178004881
   
x11 + δ1 0.9999999827
∆X2 = X2 − X1 luego X2 = X1 + ∆X2 = =
x12 + δ2 0.9999999827
y e2 = kX2 − X1 k∞ = 0.0005617805 < 

Al alcanzar la precisión deseada se detiene el proceso iterativo en la aproximación a la


solución que se calculó en la última iteración.

132

También podría gustarte