Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cal Num Itis Apuntes PDF
Cal Num Itis Apuntes PDF
DE INGENIERIA INFORMATICA
Apuntes de
CALCULO
NUMERICO
para la titulaci
on de
INGENIERIA TECNICA
EN INFORMATICA
DE SISTEMAS
Contenido
Portada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Contenido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 Ecuaciones no lineales
1.1
1.2
12
1.3
19
1.4
25
1.4.1
31
34
1.5.1
Sucesiones de Sturm . . . . . . . . . . . . . . . . . . .
38
1.5.2
Algoritmo de Horner . . . . . . . . . . . . . . . . . . .
41
1.6
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . .
43
1.7
Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . .
54
1.5
61
61
2.1.1
Normas vectoriales . . . . . . . . . . . . . . . . . . . .
62
2.1.2
62
2.1.3
63
2.1.4
Normas matriciales . . . . . . . . . . . . . . . . . . . .
64
2.1.5
Transformaciones unitarias . . . . . . . . . . . . . . . .
66
2.1.6
Radio espectral . . . . . . . . . . . . . . . . . . . . . .
67
Contenido
2.2
2.3
2.4
2.5
2.6
71
2.2.1
N
umero de condicion . . . . . . . . . . . . . . . . . . .
74
80
2.3.1
Factorizacion LU . . . . . . . . . . . . . . . . . . . . .
80
2.3.2
Factorizacion de Cholesky . . . . . . . . . . . . . . . .
84
87
2.4.1
Metodo de Jacobi . . . . . . . . . . . . . . . . . . . . .
92
2.4.2
Metodo de Gauss-Seidel . . . . . . . . . . . . . . . . .
93
2.4.3
93
Factorizaciones ortogonales . . . . . . . . . . . . . . . . . . . .
95
2.5.1
Factorizacion QR de Gram-Schmidt . . . . . . . . . . .
95
2.5.2
96
2.5.3
Factorizacion QR de Householder . . . . . . . . . . . .
98
110
2.7
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . .
112
2.8
Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . .
122
3 Interpolaci
on
3.1
141
Interpolacion polinomial . . . . . . . . . . . . . . . . . . . . .
142
3.1.1
Interpolacion de Lagrange . . . . . . . . . . . . . . . .
145
3.1.2
Interpolacion de Newton . . . . . . . . . . . . . . . . .
148
3.1.3
Interpolacion de Hermite . . . . . . . . . . . . . . . . .
157
160
3.2.1
Splines c
ubicos . . . . . . . . . . . . . . . . . . . . . .
161
3.3
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . .
164
3.4
Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . .
168
3.2
4 Integraci
on num
erica
171
4.1
Formulas de cuadratura . . . . . . . . . . . . . . . . . . . . .
172
4.2
Formulas de Newton-Cotes . . . . . . . . . . . . . . . . . . . .
174
Contenido
4.2.1
177
4.2.2
Formula de Simpson . . . . . . . . . . . . . . . . . . .
178
Formulas compuestas . . . . . . . . . . . . . . . . . . . . . . .
179
4.3.1
179
4.3.2
180
4.4
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . .
181
4.5
Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . .
186
4.3
Bibliografa
189
1. Ecuaciones no lineales
Dada una funcion no nula f : C C, resolver la ecuacion f (x) = 0 es hallar
los valores x que anulan a dicha funcion. A estos valores x se les denomina
races o soluciones de la ecuacion, o tambien, ceros de la funcion f (x).
Los metodos de resolucion de ecuaciones y sistemas de ecuaciones se clasifican
en
todos directos
Me
Proporcionan la solucion mediante un n
umero finito de operaciones elementales.
b b2 4ac
2
ax + bx + c = 0 = x =
2a
todos iterados
Me
Construyen una sucesion (xn ) convergente a la solucion x de la ecuacion
o del sistema.
Sin embargo, el siglo XIX, Abel probo que no existe ninguna formula equivalente (en termino de races) para resolver ecuaciones de grado superior a
cuatro.
Ademas, si la ecuacion no es polinomica no podemos resolverla mas que mediante metodos iterados que, incluso en el caso de las polinomicas de grado no
superior a cuatro, son mas eficientes.
Definici
on 1.1 [Multiplicidad de una raz]
Una solucion x de la ecuaci
on f (x) = 0 se dice que tiene multiplicidad n si
f (x) = f 0 (x) = f 00 (x) = = f (n1 (x) = 0
f (n (x) 6= 0
Ecuaciones no lineales
Todos los metodos numericos de resolucion de ecuaciones presentan dificultades cuando la ecuacion tiene races m
ultiples, ya que todos ellos se basan en
los cambios de signo de la funcion y estos son difcilmente detectables en un
entorno de una raz m
ultiple.
Ese hecho nos lleva a un mal condicionamiento del problema.
1.1
En la mayora de los procesos numericos utilizaremos como error el error absoluto ya que lo que nos interesa conocer es el n
umero de cifras decimales exactas
que posee la solucion de un determinado problema.
1
|f 0 (x)|
|f (x) f (x)|
10
Ecuaciones no lineales
Definici
on 1.4 Estabilidad de un algoritmo
Respecto al algoritmo que se utiliza para resolver un determinado problema,
diremos que es inestable cuando los errores que se cometen en los diferentes
pasos del algoritmo hacen que el error total que se genera sea muy grande.
Si, por el contrario los errores que se producen en los distintos pasos no alteran
de forma significativa el resultado del problema, diremos que el algoritmo es
estable.
Ejemplo 1.2 Supongamos que se quiere calcular la integral
Z
I10 =
0
Z
Llamando In =
0
1
x10
dx
a+x
xn
dx observamos que
a+x
xn
dx =
a+x
xn1 (x + a a)
dx =
a+x
0
0
Z 1 n1
Z 1 n1
Z 1
Z 1 n1
x (x + a)
x
x
n1
=
dx a
dx =
x dx a
dx =
a+x
0 a+x
0
0 a+x
0
n 1
x
1
=
aIn1 = aIn1
n 0
n
Z
In =
11
Algoritmo
a+1
I0 = ln
a
In = aIn1
n
11
Sin embargo, dado que para a = 10 es I0 = ln
= 0.09531017980432 . . .
10
y el n
umero 0.09531017980432 . . . no podemos introducirlo en el ordenador
de manera exacta, debemos cometer alg
un error introduciendo un n
umero
aproximado I 0 de tal forma que cometemos un error inicial 0 = |I 0 I0 |.
El error n que se cometera al calcular In vendra dado por
1
1
n = |I n In | = aI n1 ( aIn1 ) = | a(I n1 In1 )| = |a|n1
n
n
es decir,
n = |a|n1 = |a|2 n2 = = |a|n 0
por lo que si tomamos las 10 primeras cifras decimales de I0 , es decir, si
tomamos
I 0 = 0.0953101798 con 0 < 1010
obtendremos un error en la decima iteracion
10 < 1010 1010 = 1
en otras palabras,
I 10
12
Ecuaciones no lineales
1.2
M
etodo y algoritmo de la bisecci
on: an
alisis de errores
todo de la biseccio
n o dicotoma
Me
Supongamos que tenemos separada una raz x de la ecuacion f (x) = 0 en el
intervalo [a1 , b1 ] = [a, b] es decir
sig f (a) 6= sig f (b)
Tomando el punto medio x1 =
f 0 (x) 6= 0 x [a, b]
a1 + b 1
2
13
Reiterando el procedimiento podemos construir una sucesion de intervalos [an , bn ] con amplitudes
|bn an | =
|b a|
0 cuyos puntos medios xn x
2n
ba
2n
1
por lo que si b a = 1 y n = 10 se tiene que 10 10 < 103 , es decir,
2
en 10 iteraciones obtenemos tres cifras decimales exactas, por lo que podemos
estimar el error de una determinada iteracion sin necesidad de realizarlas previamente.
Lo verdaderamente importante de esta formula del error a priori es que nos
permite conocer el n
umero de iteraciones que van a ser necesarias para obtener
la raz con una determinada precision.
As, por ejemplo, si queremos obtener la solucion de la ecuacion f (x) = 0 en
el intervalo [a, b] de amplitud 1 con 14 cifras decimales exactas, debera ser
n
1
< 1014 2n > 1014 = n 47
n
2
n
Algoritmo de la biseccio
Para i = 1, . . . , n, . . ., Ii = [ai , bi ] y mi =
I1 = [a, b]
Ii+1 =
ai + b i
(punto medio de Ii ) con
2
o bien
14
Ecuaciones no lineales
n
Algoritmo de la Biseccio
while (b-a)/2>
m = a+(b-a)/2;
if f(m) == 0
a = m;
b = m;
end
if sign f(a) == sign f(m)
a = m;
else
b = m;
end
end
m
f (b)
(c,
0)
t
O
f (a)
t
(a, f (a))
Figura 1.1: Metodo de la r
egula f alsi.
15
f (b) f (a)
0 f (b)
=
ba
cb
Seg
un se utilicen los puntos (a, f (a)) y (b, f (b)) o (c, 0) y (b, f (b)) respectivamente.
Despejando el valor de c obtenemos que
c = b f (b)
af (b) bf (a)
ba
=
f (b) f (a)
f (b) f (a)
16
Ecuaciones no lineales
Error a posteriori
Supongamos conocido que la funcion f (x) tiene un cero en el intervalo [a, b] y
que por cualquier metodo hemos aproximado la solucion como xn .
Lo primero que se nos ocurre para comprobar si es valido el resultado es
calcular f (xn ) y, en general, obtendremos que f (xn ) 6= 0 ya que no tendremos
exactamente la raz x sino una aproximacion.
Supongamos que obtenemos f (xn ) = 2.2345.
estamos cerca o lejos de la raz buscada?
Si la pendiente de la funcion en dicho punto f 0 (xn ) es grande estaremos cerca
de ella, pero si es peque
na estaremos lejos.
f (x)
f (x)
xn
Figura 1.2: El error es inversamente proporcional a la pendiente.
17
f (x)
f (x)
x
xn
Figura 1.3: Se debe tomar el mnimo valor de la pendiente.
18
Ecuaciones no lineales
f (xn )
, obteniendose:
f 0 (c)
|f (xn )|
|f (xn )|
0
mn |f 0 (x)|
n |f (x)|
m
|f (xn )|
n = 0
|f (c)|
x
(x, xn )
(xn , x)
con
x(a,b)
(x, xn )
(xn , x)
)
(a, b)
Lo u
nico que debemos exigir es que la derivada de la funcion no se anule en
ning
un punto del intervalo (a, b).
Tengase en cuenta que si la funcion esta mal condicionada es decir, si |f 0 (x)| es
muy grande, el calculo de f (xn ) estara muy mal condicionado ya que cualquier
error en el valor de xn hace que lo que estemos calculando sea f (xn ) en un
punto x0n muy cercano a xn verificandose que
|f (x0n ) f (xn )| ' |x0n xn | |f 0 (xn )|
es decir, puede que obtengamos por ejemplo que f (xn ) = k y sin embargo su
verdadero valor difiera mucho de k debido a la fuerte pendiente existente en
dicho punto, con lo que obtendremos una cota erronea del error.
Debemos, por tanto, asegurarnos de que nuestro problema esta bien condicionado, es decir, no existen en el intervalo pendientes muy grandes (condicionamiento directo) ni muy peque
nas (condicionamiento inverso) para garantizar
la fiabilidad del error a posteriori.
1.3
19
n contractiva]
Definici
on 1.5 [Funcio
Una funcion f : R R se dice contractiva si verifica que
|f (x1 ) f (x2 )| q |x1 x2 |
x 1 , x2 R
con
q<1
x [a, b]
con
xn+1 = (xn )
converge al u
nico punto fijo de la funci
on (x) en [a, b].
20
Ecuaciones no lineales
Demostraci
on.
Convergencia
(
xn+1 xn = (xn ) (xn1 ) = (xn xn1 )0 (c) con c
[xn , xn+1 ]
[xn+1 , xn ]
con
q < 1 =
1
1q
21
n geome
trica del teorema del punto fijo
Interpretacio
Dependiendo de los valores que toma 0 (x) en el intervalo [a, b], podemos
distinguir cuatro casos:
a) 0 (x) < 1
d) 0 (x) > 1
pudiendose observar (vease la Fig. 1.4) que en los casos (a) y (d) la sucesion
resulta ser divergente ya que |0 (x) > 1|.
En los casos (b) y (c), en los que |0 (x)| q < 1 el metodo converge
monotonamente en (b) y de forma oscilatoria en (c).
n a la resolucio
n de ecuaciones
Aplicacio
Si se desea resolver la ecuacion f (x) = 0, se escribe esta de la forma x = (x),
donde (x) es una funcion contractiva, y partiendo de un determinado valor
inicial x0 , se construye la sucesion xn+1 = (xn ).
22
Ecuaciones no lineales
|0 (x)| =
23
2
2
2
2 =
2
(1 + x)
3
9
para cualquier
x [1, 2]
=
=
=
=
=
=
=
=
=
=
=
=
=
2
1.66666666666667
1.75000000000000
1.72727272727273
1.73333333333333
1.73170731707317
1.73214285714286
1.73202614379085
1.73205741626794
1.73204903677758
1.73205128205128
1.73205068043172
1.73205084163518
x14
x15
x16
x17
x18
x19
x20
x21
x22
x23
x24
x25
x26
=
=
=
=
=
=
=
=
=
=
=
=
=
1.73205079844084
1.73205081001473
1.73205080691351
1.73205080774448
1.73205080752182
1.73205080758148
1.73205080756550
1.73205080756978
1.73205080756863
1.73205080756894
1.73205080756886
1.73205080756888
1.73205080756888
|f (xn )|
donde f (x) = x2 3, por lo que
mn |f 0 (x)|
x[1,2]
26
es decir,
|x226 3|
<
= 4.884981308350688 1015 < 1014
2
24
Ecuaciones no lineales
Orden de convergencia
(x) =
x
1
en [1, 1] es contractiva ya que |0 (x)| = < 1 x [1, 1]
2
2
x
0 (0) = 0
(x) =
2
convergencia de segundo orden.
1
00
(x) = 00 (0) 6= 0
2
2
x 1
x3
(x) =
en [1, 1] es contractiva: |0 (x)| = < 1 x [1, 1]
6
2
2
x0 = 1 x1 = 0.16666 x2 = 0.00077 x3 = 7.6565 1011
La convergencia a cero es ahora muy r
apida debido a que
x2
0
0
(x) =
(0) = 0
2
00
00
(x) = x (0) = 0 = convergencia de tercer orden.
3+x
La funcion (x) =
que obtuvimos para calcular 3 en el Ejemplo 1.3
1+x
verifica que
0 (x) =
1
1
0
(
3) =
6= 0
2
(1 + x)
(1 + 3)2
25
1.4
An
alisis del m
etodo de Newton-Raphson
f (xn )
f 0 (xn )
= x ' xn
f (xn )
f 0 (xn )
f (xn )
f 0 (xn )
(1.2)
f (x)
f 0 (x)
f (xn )
f 0 (xn )
f (lim xn )
f (lim xn )
=
= 0 = f (lim xn ) = 0
0
lim f (xn )
lim f 0 (xn )
es decir, lim xn = x.
n geome
trica: Me
todo de la tangente
Interpretacio
Si trazamos la tangente a la curva y = f (x) en el punto (xn , f (xn )) obtenemos
la recta
y = f (xn ) + f 0 (xn )(x xn )
26
Ecuaciones no lineales
f (xn )
f 0 (xn )
y = f (x)
x
x2
x1
x0
Orden de convergencia
Si el metodo converge, (x) = x
0 (x) = 1
f (x)
es contractiva y ademas
f 0 (x)
f (x)f 00 (x)
f 02 (x) f (x)f 00 (x)
=
con f 0 (x) 6= 0 = 0 (x) = 0
f 02 (x)
f 02 (x)
f (xn )
f (xn )
= en + 0
0
f (xn )
f (xn )
Dado que
f 00 (t) 2
0 = f (x) = f (xn + en ) = f (xn ) + f 0 (xn )en +
en con t
2
(x, xn )
(xn , x)
27
f 00 (t) 2
f 00 (t) 2
f (xn )
+
e
+
e
=
e
+
en
n
n+1
n
f 0 (xn )
2
2
|f 00 (t)| 2
max |f 00 (x)|
2
con
k
n
n
2|f 0 (xn )|
2 mn |f 0 (x)|
n+1
max |f 00 (x)|
1
n
(k0 )2 con k
k
2 mn |f 0 (x)|
lo que nos proporciona una cota del error a priori, pudiendose garantizar la
1
convergencia siempre que k0 < 1 es decir, si 0 .
k
Algoritmo
Una vez realizado un estudio previo para ver que se cumplen las condiciones
que requiere el metodo, establecer el valor inicial x0 y calcular el valor de
m = mn |f 0 (x)|, el algoritmo, que tiene por entradas los valores de a, b, x, ,
x[a,b]
28
Ecuaciones no lineales
x2 + 3
1
f (xn )
x2 3
= xn 0
= xn n
= n
=
f (xn )
2xn
2xn
2
3
xn +
xn
=2
= 1.75000000000000
= 1.73214285714286
= 1.73205081001473
= 1.73205080756888
|f (xn )|
,
mn |f 0 (x)|
x[1,2]
por lo que
4 <
es decir,
|x24 3|
= 4.884981308350688 1015 < 1014
2
1
A
La formula xn+1 =
xn +
es conocida como formula de Heron ya que
2
xn
este matematico la utilizaba para aproximar la raz cuadrada de un n
umero
real positivo A hacia el a
no 100 a.C. pues saba que si dispona de un valor
aproximado xn y este fuese mayor que la raz buscada, necesariamente A/xn
sera menor que su raz y viceversa, por lo que la media entre ambos deba ser
una mejor aproximacion que xn . En otras palabras, en cada iteracion tomaba
como aproximacion de la raz la media aritmetica entre el valor xn anterior y
el cociente A/xn .
29
x10
n 1
.
10x9n
x20
x30
x40
x41
x42
x43
= 6.97714912329906
= 2.43280139954230
= 1.00231602417741
= 1.00002393429084
= 1.00000000257760
=1
9
x1
x0
x2
30
Ecuaciones no lineales
El metodo de Newton-Raphson oscila en los alrededores de un maximo
o un mnimo local, persistiendo o llegando a encontrarse con pendientes
cercanas a cero, en cuyo caso la solucion se aleja del area de interes.
y = f (x)
x0
x1
Por otra parte, como no nos interesa que x0 este situado cerca de un extremo
local, vamos a estudiar los diferentes casos con que podemos encontrarnos
y elegir, en cada uno de ellos, un valor adecuado para x0 (aquel que no se
encuentre cercano a un extremo local).
a
b
f 0 (x) > 0
f 00 (x) < 0
x0 = a
31
f 0 (x) > 0
f 00 (x) > 0
x0 = b
f 0 (x) < 0
f 00 (x) > 0
x0 = a
f 0 (x) < 0
f 00 (x) < 0
x0 = b
Observese que en cualquiera de los cuatro casos (vease la Figura 1.8) hemos
optado por elegir, como valor inicial x0 , el extremo en el que la funcion tiene
el mismo signo que su segunda derivada.
Este resultado, que formalizamos a continuacion en forma de teorema es conocido como regla de Fourier.
Teorema 1.6 [Regla de Fourier]
Sea f (x) una funcion continua y dos veces derivable [a, b]. Si sig f (a) 6= sig f (b)
y sus dos primeras derivadas f 0 (x) y f 00 (x) no se anulan en [a, b] existe una
u
nica raz de la ecuacion f (x) = 0 en dicho intervalo y se puede garantizar la
convergencia del metodo de Newton tomando como valor inicial x0 el extremo
del intervalo en el que la funci
on y su segunda derivada tienen el mismo signo.
1.4.1
M
etodo de Newton generalizado
0
0
32
Ecuaciones no lineales
f (x)
pero con la particularidad
f 0 (x)
de que
(x) = x
g(x)
g 0 (x)
f (xn )
hacemos
f 0 (xn )
xn+1 = xn k
f (xn )
f 0 (xn )
(1.3)
xn sen xn
sen xn xn cos xn
=
1 cos xn
1 cos xn
33
y=x
y = sen x
-1
0
f 0 (x10 ) = 0.0001 . . .
x10 = 0.016822799 . . .
f 00 (x10 ) = 0.016 . . .
f 000 (x ) = 0.9998 . . .
10
.....................
f 0 (x20 ) = 0.00000001 . . .
x20 = 0.0000194 . . .
f 00 (x20 ) = 0.0019 . . .
f 000 (x ) = 0.9999 . . .
20
Como la convergencia es muy lenta, hace pensar que se trata de una raz
m
ultiple. Ademas, como la primera y la segunda derivadas tienden a cero y
la tercera lo hace a 1, parece que nos encontramos ante una raz triple, por lo
que aplicamos el metodo generalizado de Newton.
xn+1 = xn 3
xn sen xn
1 cos xn
=1
= 0.034 . . .
= 0.000001376 . . .
= 0.00000000000009 . . .
34
1.5
Ecuaciones no lineales
n de las races mu
ltiples
Eliminacio
i = 1, 2, . . . , k
35
P (x)
= a0 (x x1 )(x x2 ) (x xk )
D(x)
Es decir, hemos encontrado un polinomio cuyas races son las mismas que las
de P (x) pero todas ellas simples.
Ejemplo 1.7 El polinomio P (x) = x3 5x2 + 8x 4 = (x 1)(x 2)2 tiene
la raz 1 simple y la 2 doble.
D(x) = mcd (P (x), P 0 (x)) = mcd (x3 5x2 + 8x 4, 3x2 10x + 8) = x 2
por lo que
Q(x) =
P (x)
= x3 3x + 2 = (x 1)(x 2)
D(x)
que tiene las mismas races que P (x) pero todas simples.
n de las races
Acotacio
Si ya conocemos que una ecuacion solo tiene races simples y queremos calcularlas, parece apropiado que un primer paso consista en detectar d
onde pueden
encontrarse. As por ejemplo, si son reales, determinar intervalos de una amplitud reducida en los que se encuentren las races de la ecuacion.
Dada una ecuacion f (x) = 0 (en general compleja) se denomina acotar las races a buscar dos n
umeros reales positivos r y R tales
que r |x| R para cualquier raz x de la
ecuacion.
Geometricamente consiste en determinar una
corona circular de radios r y R dentro de la
cual se encuentran todas las races.
En el caso real se reduce a los intervalos
(R, r) y (r, R).
36
Ecuaciones no lineales
Proposici
on 1.7 Si x es una raz de la ecuaci
on
P (x) = a0 xn + a1 xn1 + + an1 x + an = 0
se verifica que:
|x| < 1 +
A
|a0 |
siendo
A = m
ax |ai |
i1
Demostraci
on. Sea P (x) = a0 xn + a1 xn1 + + an1 x + an . Tomando
modulos tenemos
|P (x)| = |a0 xn + a1 xn1 + + an1 x + an |
|a0 xn | |a1 xn1 + + an1 x + an |
i
+ + |an1 x| + |an | =
h
i
= |a0 xn | |a1 | |xn1 | + + |an1 | |x| + |an |
|a0 xn | A [|x|n1 + + |x| + 1]
(Para considerar el u
ltimo parentesis como una progresion geometrica habra
que a
nadir los terminos que, probablemente, falten en P (x) y suponer que,
ademas, es |x| =
6 1).
|P (x)| |a0 | |x|n A
|x|n 1
|x| 1
Dado que el teorema es trivial para |x| < 1, supondremos que |x| > 1 y
entonces:
|x|n
A
n
n
|P (x)| > |a0 | |x| A
= |x| |a0 |
|x| 1
|x| 1
Como la expresion anterior es cierta para cualquier |x| > 1, sea |x| > 1 con
P (x) = 0. Entonces
A
A
n
0 > |x| |a0 |
= |a0 |
< 0 =
|x| 1
|x| 1
A
A
|a0 | <
= |x| 1 <
=
|x| 1
|a0 |
|x| < 1 +
A
|a0 |
con
|x| > 1
Es evidente que esta cota tambien la verifican las races x con |x| < 1.
37
Proposici
on 1.8 [Regla de Laguerre]
Consideremos la ecuacion
P (x) = a0 xn + a1 xn1 + + an1 x + an = 0
Sean C(x) = b0 xn1 + + bn2 x + bn1 el cociente y r el resto de la divisi
on
de P (x) entre x c.
Si r 0 y bi 0 para 0 i n 1, el n
umero real c es una cota superior
para las races positivas de la ecuaci
on. (Trivialmente lo es tambien para las
races negativas).
El procedimiento consiste en comenzar con la cota obtenida anteriormente
(que no suelen ser muy buena) e ir disminuyendola hasta afinarla todo lo que
podamos.
Ejemplo 1.8 Consideremos la ecuacion 2x4 9x3 x2 + 24x + 12 = 0.
Sabemos que
|x| < 1 +
A
24
siendo A = max |ai | = |x| < 1 +
= 13
i1
|a0 |
2
por lo que cualquier raz real del polinomio debe estar en el intervalo (13, 13).
Aplicando la regla de Laguerre obtenemos:
2 9 1
24 12
4
8 4 20 16
2 1 5
4 28
2 9 1 24 12
10
5 20 240
5
2
1
4 48 252
Dado que para x = 4 se obtienen valores negativos no podemos garantizar que
4 sea una cota superior para las races positivas de la ecuacion, pero para x = 5
todos los valores obtenidos han sido positivos, por lo que podemos garantizar
que las races reales de la ecuacion se encuentran en el intervalo (13, 5).
No debemos confundir el hecho de que la regla de Laguerre no nos garantice
que 4 sea una cota superior de las races positivas y 5 s lo sea, con que la
38
Ecuaciones no lineales
ecuacion deba tener alguna raz en el intervalo (4, 5). En otras palabras, 4
puede ser una cota superior para las races positivas de la ecuacion aunque la
regla de Laguerre no lo garantice. De hecho, la mayor de las races positivas
de nuestra ecuacion es x = 3.56155281280883 . . . < 4.
n de las races
Separacio
Las cotas obtenidas anteriormente nos delimitan la zona en la que debemos
estudiar la existencia de soluciones de la ecuacion pero, en realidad, lo que mas
nos acerca a nuestro problema (resolver la ecuacion) es separar cada raz en un
intervalo. A este proceso se le conoce como separaci
on de races y estudiaremos
un metodo que se conoce como metodo de Sturm que nos permite separar las
races de una ecuacion.
1.5.1
Sucesiones de Sturm
n de Sturm]
Definici
on 1.7 [Sucesio
Una sucesion de Sturm en [a, b] es un conjunto de funciones continuas en dicho
intervalo f0 (x), f1 (x), . . . , fn (x) que cumplen las siguientes condiciones:
fn (x) 6= 0 cualquiera que sea x [a, b]. Es decir, el signo de fn (x)
permanece constante en el intervalo [a, b].
Las funciones fi (x) y fi+1 (x) no se anulan simult
aneamente. En otras
palabras, si fi (c) = 0 entonces fi1 (c) 6= 0 y fi+1 (c) 6= 0.
Si fi (c) = 0 entonces fi1 (c) y fi+1 (c) tienen signos opuestos, es decir,
fi1 (c) fi+1 (c) < 0. (Engloba al apartado anterior).
f0 (x)
pasa de negativa a positiva
f1 (x)
en c. (Esta bien definida en c por ser f1 (c) 6= 0 y es creciente en dicho
punto).
n de una sucesio
n de Sturm para un polinomio
Construccio
La construccion de una sucesion de Sturm es, en general, complicada. Sin
embargo, cuando se trabaja con funciones polinomicas, el problema es mucho
mas simple ademas de que siempre es posible construir una sucesion de Sturm
valida para cualquier intervalo.
39
Para determinar las demas funciones de la sucesion vamos dividiendo fi1 (x)
entre fi (x) para obtener
fi1 (x) = ci (x) fi (c) + ri (x)
donde ri (x) tiene grado inferior al de fi (x) y hacemos
fi+1 (x) = ri (x)
Como el grado de fi (x) va decreciendo, el proceso es finito. Si se llega a un
resto nulo (el proceso que estamos realizando es precisamente el del algoritmo
de Euclides) la ecuacion posee races m
ultiples y se obtiene el maximo com
un
0
divisor D(x) de Pn (x) y Pn (x). Dividiendo Pn (x) entre D(x) obtenemos una
nueva ecuacion que solo posee races simples.
P (x)
fi (x)
es una sucesion de Sturm para la ecuacion
= Q(x) = 0
D(x)
D(x)
que posee las mismas races que P (x) = 0 pero todas simples.
La sucesion
40
Ecuaciones no lineales
Ejemplo 1.9 Vamos a construir una sucesion de Sturm que nos permita separar las races de la ecuacion x4 + 2x3 3x2 4x 1 = 0.
f0 (x) = x4 + 2x3 3x2 4x 1.
|2x3 + 3x2 3x 2
xk1
multiplicando por 2
f2 (x) = 9x2 + 9x + 2.
18x3 + 27x2 27x 18
18x3 18x2 4x
9x2 31x 18
9x2 9x 2
40x 20
|9x2 + 9x + 2
2x + 1
f3 (x) = 2x + 1.
18x2 + 18x + 4
18x2 9x
9x + 4
18x + 8
18x 9
1
|2x + 1
9x k 9
multiplicando por 2
f4 (x) = 1.
3 2 1 0 1 2 +
f0 (x) = x + 2x 3x 4x 1 +
+ + +
f1 (x) = 2x3 + 3x2 3x 2
0 + 0 + +
2
f2 (x) = 9x + 9x + 2
+
+ + + + + + +
f3 (x) = 2x + 1
+ + + +
f4 (x) = 1
+
+ + + + + + +
cambios de signo
4
4
3
3 1 1 0
0
4
41
Sabemos, por ello, que existe una raz en el intervalo (3, 2), dos races en
el intervalo (1, 0) y una cuarta raz en el intervalo (1, 2).
Como f0 (1) = 1 < 0, f0 (0.5) = 0.0625 > 0 y f0 (0) = 1 < 0 podemos
separar las races existentes en el intervalo (1, 0) y decir que las cuatro races
de la ecuacion dada se encuentran en los intervalos
(3 2)
(1, 0.5)
(0.5, 0)
(1, 2)
1.5.2
Algoritmo de Horner
P (x) = (x x0 )Q(x) + r
con
rR
y
42
Ecuaciones no lineales
Algoritmo de Horner
Consideremos el polinomio P (x) = a0 xn + a1 xn1 + + an1 x + an .
Si llamamos bi (0 i n 1) a los coeficientes del polinomio cociente
P (x) P (x0 )
= Q(x) = b0 xn1 + b1 xn2 + + bn2 x + bn1
x x0
se tiene que
b 0 = a0
b 1 = a1 + x 0 b 0
b 2 = a2 + x 0 b 1
..
.
bn1 = an1 + x0 bn2
r = P (x0 ) = an + x0 bn1
Este procedimiento para calcular el polinomio cociente Q(x) y el valor numerico de P (x0 ) es conocido como algoritmo de Horner.
Ademas, dado que
P (x) = Q(x)(x x0 ) + P (x0 ) = P 0 (x) = Q0 (x)(x x0 ) + Q(x)
se tiene que
P 0 (x0 ) = Q(x0 )
y el calculo de Q(x0 ) es analogo al que hemos realizado para P (x0 ), es decir,
aplicando el algoritmo de Horner a Q(x) obtenemos
Q(x) = C(x)(x x0 ) + Q(x0 )
donde
Q(x0 ) = P 0 (x0 ).
Regla de Ruffini
Una regla u
til para hacer los calculos a mano es la conocida regla de Ruffini
que consiste en disponer las operaciones como se indica a continuacion.
a0
a1
a2
an1
an
x0 b0 x0 b1 x0 bn2 x0 bn1
x0
b0
b1
b2
bn1
P (x0 )
Ejercicios resueltos
43
Si utilizamos la regla de Ruffini solo tenemos que volver a dividir por x0 , como
se muestra a continuacion, para obtener el valor de P 0 (x0 ).
a0
a1
a2
an2
an1
an
x0
b0
b1
b2
bn2
bn1
P (x0 )
x0 c0 x0 c1 x0 cn3 x0 cn2
x0
c0
c1
c2
cn2
P 0 (x0 )
1 3
10
14
36
18
31
18
50
25
68
por lo que
P (2) = 31
P 0 (2) = 68
1.6
Ejercicios resueltos
44
Ecuaciones no lineales
c) Aplicar el metodo de Newton, hasta obtener tres cifras decimales exactas.
n:
Solucio
a) La ecuacion puede escribirse de la
forma:
1
ex =
x
Graficamente, se observa que existe
una u
nica solucion real (interseccion de las dos curvas) y que esta es
positiva. La demostracion analtica
de este hecho es la siguiente:
Para x < 0:
1
<0
x
ex > 0 = ex 6=
1
x
f (0) = 1 < 0
f (+) = + > 0
f (0) = 1 < 0
f (1) = e 1 > 0
Ejercicios resueltos
45
f (0.5) < 0
f (0.75) > 0
f (0.625) > 0
f (0.5625) < 0
f (0.59375) > 0
f (0.578125) > 0
f (0.5703125) > 0
=
=
=
=
=
=
=
[a2 , b2 ] = [0.5, 1]
[a3 , b3 ] = [0.5, 0.75]
[a4 , b4 ] = [0.5, 0.625]
[a5 , b5 ] = [0.5625, 0.625]
[a6 , b6 ] = [0.5625, 0.59375]
[a7 , b7 ] = [0.5625, 0.578125]
[a8 , b8 ] = [0.5625, 0.5703125]
1
= 0.00390625 = 8 < 102
28
f (0.5625) < 0
f (x) = xex 1 =
f (0.5703125) > 0
mn
x[0.5625,0.5703125]
es decir
n
|f (xn )|
|f (xn )|
<
0
mn
|f (x)|
2.74
x[0.5625,0.5703125]
46
Ecuaciones no lineales
obteniendose que
|f (x0 )|
= 0.00320437856505 . . .
2.74
|f (x1 )|
x1 = 0.56715149835900 . . . con 1 <
= 0.00000827757122 . . .
2.74
x0 = 0.5703125
con 0 <
Puede observarse que solo existe un punto de corte entre ellas, por lo que la
ecuacion x2 + ln x = 0 solo posee una raz real.
Analticamente hay que probar que las graficas no vuelven a cortarse en ning
un
otro punto, sin embargo, dado que en su dominio de definicion, que es (0, +),
ln x es creciente y x2 decreciente, no pueden volver a cortarse.
Partiendo de x0 = 0.1 y aplicando el metodo de Newton, en el intervalo (0.1, 1)
(no tomamos (0, 1) por no estar definido el logaritmo en 0), dado por la formula
xn+1 = xn
x3n + xn xn ln xn
f (xn )
x2n + ln xn
=
x
=
n
f 0 (xn )
2x2n + 1
2xn + x1n
Ejercicios resueltos
47
|f (xn )|
|f (xn )|
=
, obtenemos:
0
mn |f (x)|
2
x(0,1)
x1
x2
x3
x4
= 0.32476324441118 . . .
= 0.59809970985991 . . .
= 0.65258567248750 . . .
= 0.65291863363348 . . .
con
con
con
con
1
2
3
4
0.509593 . . .
0.078137 . . .
4.7239 . . . 104
9.6269 . . . 109
48
Ecuaciones no lineales
P (x)
x6 2x5 + 3x4 4x3 + 3x2 2x + 1
= x3 x2 + x 1
=
D(x)
x3 x2 + x 1
P 0 (i) = 2 (3i 5 + 6i + 6 3i 1) = 0
0
P (i)
= 2 (3i 5 6i + 6 + 3i 1) = 0
Luego las tres races son dobles (no pueden tener mayor multiplicidad ya que
el grado de P (x) es 6, es decir, 2+2+2).
Ejercicio 1.4 Dado el polinomio P (x) = x3 + 3x2 + 2 se pide:
a) Acotar sus races reales.
b) Probar, mediante una sucesion de Sturm, que P (x) solo posee una raz
real y determinar un intervalo de amplitud 1 que la contenga.
c) Se verifican, en dicho intervalo, las hipotesis del teorema de Fourier?
En caso afirmativo, determinar el extremo que debe tomarse como valor
inicial x0 para garantizar la convergencia del metodo de Newton.
d) Sabiendo que en un determinado momento del proceso de Newton se ha
obtenido xn = 3.1958, calcular el valor de xn+1 as como una cota del
error en dicha iteracion.
Ejercicios resueltos
49
n:
Solucio
a)
|x| < 1 +
3
= 4 = 4 < x < 4
1
4
+
+
+
por lo que solo posee una raz real, la cual se encuentra en el intervalo
(4, 3).
f (4) = 14 < 0
3
2
c) f (x) = x + 3x + 2 =
es decir, la funcion
f (3) = 2 > 0
cambia de signo en los extremos del intervalo (4, 3).
f 0 (x) = 3(x2 + 2x) > 0
f 00 (x) = 6(x + 1) < 0
x (4, 3)
x (4, 3)
por lo que se verifican las hipotesis del teorema de Fourier y, por tanto,
tomando como valor inicial x0 = 4 (extremo en el que la funcion tiene
el mismo signo que la segunda derivada) se tiene garantizada la convergencia del metodo de Newton.
d) Dado que xn+1 = xn
f (xn )
x3n + 3x2n + 2
=
x
se obtiene que
n
f 0 (xn )
3x2n + 6xn
xn+1 = 3.19582334575880.
El error a posteriori viene dado
n+1
|f (xn+1 )|
|f (xn+1 )|
|f (xn+1 )|
= 0
=
< 3.9891010 < 109 .
0
mn |f (x)|
f (3)
9
x(4,3)
50
Ecuaciones no lineales
Ejercicio 1.5 Aplicar el metodo de Sturm para separar las races de la ecuacion
2x6 6x5 + x4 + 8x3 x2 4x 1 = 0
y obtener la mayor de ellas con seis cifras decimales exactas por el metodo de
Newton.
n: Comencemos por construir la sucesion de Sturm.
Solucio
f0 (x) = P (x) = 2x6 6x5 + x4 + 8x3 x2 4x 1
P 0 (x) = 12x5 30x4 + 4x3 + 24x2 2x 4, por lo que
f1 (x) = 6x5 15x4 + 2x3 + 12x2 x 2
Multiplicando f0 (x) por tres y dividiendo el resultado entre f1 (x) obtenemos:
6x6 18x5 + 3x4 + 24x3 3x2 2x 3 |6x5 15x4 + 2x3 + 12x2 x 2
6x6 + 15x5 2x4 2x3 + x2 + 2x
xk 1
5
4
3
2
3x + x + 12x 2x 10x 3 multiplicando por 2
6x5 + 2x4 + 24x3 4x2 20x 6
6x5 15x4 + 2x3 + 12x2 x 2
13x4 + 26x3 + 8x2 21x 8
Ejercicios resueltos
51
f4 (x) = x2 x 1
2x 4x x + 3x + 1
6x3 9x2 x + 2
g2 (x) = 13x2 13x 8
2x 1
1
Cambios de signo
3 1 0.5
+ +
+ +
+
+ +
+
4
4
3
0
+
+
+
2
1
+
+
+
2
1.5
+
+
+
+
1
2
+
+
+
+
+
0
[0.5, 0]
[1, 1.5]
[1.5, 2]
3
+
+
+
+
+
0
52
Ecuaciones no lineales
La mayor de las races se encuentra en el intervalo [1.5, 2], pero dado que
Q0 (1.5) = 0 podemos tomar el intervalo [1.6, 2] en el cual:
(
Q(1.6) < 0
Q(x) = 2x4 4x3 x2 + 3x + 1
Q(2) > 0
Q0 (x) = 8x3 12x2 2x + 3 > 0 x [1.6, 2]
Q00 (x) = 24x2 24x 2 > 0 x [1.6, 2]
La regla de Fourier no dice que debemos comenzar a iterar en x0 = 2.
Q(x)
Teniendo en cuenta que xn+1 = xn 0
se obtiene la sucesion:
Q (x)
x0
x1
x2
x3
x4
x5
x6
x7
=2
= 1.8
= 1.684726867
= 1.632243690
= 1.618923782
= 1.618037855
= 1.618033989
= 1.618033989
=
=
=
=
4
5
6
7
0.01841
0.0011
0.0000047
0.885 1010
Fig. 1
Fig. 2
Ejercicios resueltos
53
54
Ecuaciones no lineales
con
g 00 (0.5) < 0
g 00 (1.5) > 0
por lo que no puede aplicarse la regla de Fourier en dicho intervalo. (Si
reducimos el intervalo a [0.5, 1.01] si podemos aplicarla, obteniendo que
debemos tomar x0 = 0.5).
1.7
Ejercicios propuestos
Ejercicio 1.7 Dada la ecuacion 8x3 4x2 18x + 9 = 0, acotar y separar sus
races reales.
Sol : |x| 3.25, x1 (2, 1), x2 (0, 1) y x3 (1, 2).
Ejercicio 1.8 Se considera el polinomio P (x) = x3 6x2 3x + 7.
a) Probar, mediante una sucesion de Sturm, que posee una u
nica raz en el
intervalo (6, 7).
b) Si expresamos la ecuacion P (x) = 0 de la forma
1
x = F (x) = (x3 6x2 + 7),
3
podemos asegurar su convergencia?
Sol : No. F 0 (x) > 1 en todo el intervalo, por lo que no es contractiva.
c) Probar, aplicando el criterio de Fourier, que tomando como valor inicial
x0 = 7, el metodo de Newton es convergente.
d) Aplicando Newton con x0 = 7 se ha obtenido, en la segunda iteracion,
x2 = 6.3039. Que error se comete al aproximar la raz buscada por el
valor x3 que se obtiene en la siguiente iteracion?
Sol : 3 6.62 . . . 106 < 105 .
Ejercicio 1.9 Dada la ecuacion x7 14x + 7 = 0 se pide:
a) Probar que solo tiene una raz real negativa.
Ejercicios propuestos
55
56
Ecuaciones no lineales
b) Utilizar el metodo de Sturm para probar que tiene una u
nica raz real
si, y solo si, k < 0 o k > 4, y que solo tiene races m
ultiples si k = 0 o
k = 4 no existiendo, en ning
un caso, una raz triple.
c) Para k = 4 admite una u
nica raz real en el intervalo [0, 1]. Si tomamos
como valor aproximado de la raz x = 0.3553 de cuantas cifras decimales
exactas disponemos?
Sol : x = 0.35530 con las 5 cifras decimales exactas.
d) Si, en el caso anterior en que k = 4, aplicamos el metodo de Newton
para hallar la raz del polinomio, cual de los extremos del intervalo [0, 1]
deberamos tomar como valor inicial x0 para garantizar la convergencia?
y que valor obtendramos para x2 ?
Sol : x0 = 1, x2 = 0.365079 . . ..
Ejercicios propuestos
57
Ejercicio 1.13
Cuando dos races positivas de una ecuaci
on polin
omica est
an muy pr
oximas,
suele ser difcil separarlas mediante intervalos cerrados. Para alejarlas se
puede proceder como sigue:
Paso 1: Sea la ecuacion polin
omica
P (x) = an xn + an1 xn1 + + a1 x + a0 = an (x 1 ) (x n ) = 0
Paso 2: Cambiar x por x2 en P (x) = 0
P (x2 ) = an (x2 1 ) (x2 n ) = 0
Paso 3: Cambiar x por x2 en P (x) = 0
P (x2 ) = an (x2 1 ) (x2 n ) = (1)n an (x2 + 1 ) (x2 + n ) = 0
58
Ecuaciones no lineales
d) Para resolver la ecuacion x4 = 0 por el metodo de Newton y as
calcular la raz de P (x) = 0, hacer lo siguiente:
d.1) Encontrar un intervalo [a, b] que solo contenga a la mayor raz real
de esta ecuacion y en donde se verifiquen las hipotesis de la regla
de Fourier.
Sol : [2, 3].
d.2) Cuantas iteraciones son necesarias para obtener 25 cifras decimales
exactas? Indicacion: En+1
n
max |f 00 (x)|
1
(kE1 )2 , con k =
en un
k
2 mn |f 0 (x)|
intervalo adecuado.
Ejercicios propuestos
59
2.1
Definici
on 2.1 [Concepto de norma]
Sea E un espacio vectorial definido sobre un cuerpo K. Se define una norma
como una aplicacion, que denotaremos por k k, de E en R que verifica las
siguientes propiedades:
kxk 0 x E siendo kxk = 0 x = 0. Definida positiva.
k xk = ||kxk K, x E. Propiedad de homogeneidad.
kx + yk kxk + kyk x, y E. Desigualdad triangular.
Es frecuente que en el espacio E se haya definido tambien el producto de dos
elementos. En este caso, si se verifica que
kx yk kxk kyk
se dice que la norma es multiplicativa.
Esta propiedad de las normas es fundamental cuando trabajamos en el conjunto de las matrices cuadradas de orden n.
Un espacio E en el que hemos definido una norma recibe el nombre de espacio
normado.
61
62
2.1.1
Normas vectoriales
n
X
xi ui
i=1
kxk1 =
n
X
|xi |
i=1
v
u n
uX
kxk2 = t
|xi |2
i=1
Norma infinito
kxk1 = 2 + 3 + 0 + 12 = 17
kxk2 = 22 + 32 + 02 + 122 = 13
kxk = | 12| = 12
y = (1 + i, i)T
kyk1 = |1 + i| + |i| = 2 + 1
p
kyk = |1 + i| = 2
2.1.2
Definici
on 2.2 [Distancia]
Dado un espacio vectorial E, se define una distancia como una aplicaci
on
d : E E R cumpliendo que:
d(x, y) 0
63
x, y E siendo d(x, y) = 0 x = y.
d(x, y) = d(y, x)
x, y E.
x, y, z E.
2.1.3
Esta definicion coincide con la idea intuitiva de que la distancia de los vectores
de la sucesion al vector lmite v tiende a cero a medida que se avanza en la
sucesion.
Teorema 2.2 Para un espacio vectorial normado de dimensi
on finita, el concepto de convergencia es independiente de la norma utilizada.
64
2.1.4
Normas matriciales
Norma-1
Dado que Ax = y = yi =
n
X
k=1
kAk1 = max{
n X
n
X
i=1 k=1
Por u
ltimo, si descargamos todo el peso sobre una coordenada, es decir,
si tomamos un vector de la base canonica, obtenemos que
kAk1 = max
j
Norma eucldea
n
X
|aij |.
i=1
kAk2 = max{ x A Ax : x x = 1}
Norma infinito
65
P
kAk = max{ nj=1 |aij xj | : kxk = 1}.
Como ahora se dara el maximo en un vector que tenga todas sus coordenadas iguales a 1, se tiene que
kAk = max
i
n
X
|aij |.
j=1
Tenemos pues, que las normas asociadas (algunas veces llamadas subordinadas)
a las normas de vector estudiadas anteriormente son:
kAk1 = max
Norma-1
n
X
|aij |.
i=1
kAk = max
Norma infinito
n
X
|aij |.
j=1
kAkF =
sX
|aij |2 =
tr A A
i,j
1
1
n
X
1 se tiene:
1
i=1
6 1
T
El polinomio caracterstico de la matriz A A = 1
2
5
1
1 es
6
kAk2 = max i = 11
i
66
kAk = max
i
kAkF =
2.1.5
n
X
j=1
tr AT A =
6+2+6=
14.
Transformaciones unitarias
Definici
on 2.4 [Matriz unitaria]
La matriz U Cnn de una transformaci
on se dice unitaria si
U U = U U = I U = U 1
Proposici
on 2.3 La norma de Frobenius y la norma eucldea de vector son
invariantes mediante transformaciones unitarias.
Demostraci
on.
Para la norma matricial de Frobenius:
p
p
p
kU AkF = tr [(U A) (U A)] = tr (A U U A) = tr (A A) = kAkF
p
p
kAU kF = tr [(A U ) (A U )] = tr [(A U )(A U ) ] =
p
p
p
= tr (A U U A ) = tr (A A ) = tr (A A) = kAkF
Para la norma eucldea de vector.
p
kU xk2 = (U x) (U x) = x U U x = x x = kxk2
Proposici
on 2.4 Las matrices A, A , AU y U A, donde U es una matriz
unitaria, poseen los mismos valores singulares y, por tanto, lo misma norma
eucldea.
Demostraci
on. Veamos, en primer lugar que las matrices A A y AA poseen
los mismos autovalores. En efecto:
Sea un autovalor de A A y x un autovector asociado a .
A Ax = x = AA Ax = Ax
y llamando y = Ax tenemos que AA y = y, por lo que es un autovalor de
la matriz AA asociado al autovector y = Ax. As pues, cualquier autovalor
de A A lo es tambien de AA .
Razonando de igual forma se obtiene que cualquier autovalor de AA lo es
tambien de A A, por lo que ambas matrices poseen los mismos autovalores.
67
Como los valores singulares de la matriz A son las races cuadradas positivas de los autovalores de A A y los de A las races cuadradas positivas
de los autovalores de AA (los mismos que los de A A), las matrices A
y A poseen los mismos valores singulares.
Los valores singulares de U A son las races cuadradas positivas de los
autovalores de (U A) (U A) = A U U A = A A que eran precisamente los
valores singulares de la matriz A.
Los valores singulares de AU son (por el primer apartado) los mismos
que los de (AU ) = U A es decir, las races cuadradas positivas de los
autovalores de (U A ) (U A ) = AU U A = AA cuyos autovalores son
los mismos que los de A A, por lo que AU tiene tambien los mismos
valores singulares que la matriz A.
Proposici
on 2.5 La norma eucldea de una matriz unitaria vale siempre 1.
Demostraci
on.
kU xk2
kxk2
= max
=1
xV {0} kxk2
xV {0} kxk2
kU k2 = max
Proposici
on 2.6 La norma eucldea es invariante mediante transformaciones
de semejanza unitarias.
Demostraci
on. Sea A y B dos matrices unitariamente semejantes, es decir,
tales que
B = U AU con U unitaria
2.1.6
Radio espectral
Definici
on 2.5 [Radio espectral]
Se define el radio espectral de una matriz A, y se denota por (A) como el
maximo de los modulos de los autovalores de la referida matriz.
(A) = m
ax |i |
i
68
Teorema 2.7 El radio espectral de una matriz es una cota inferior de todas
las normas multiplicativas de dicha matriz.
Demostraci
on. Sean {1 , 2 , . . . , r } los autovalores de la matriz A y sean
{x1 , x2 , . . . , xr } autovectores asociados a dichos autovalores.
kAxi k = ki xi k = |i | kxi k.
Por otra parte sabemos que kAxi k kAk kxi k. Por tanto:
|i | kxi k kAk kxi k siendo kxi k =
6 0 por tratarse de autovectores.
Se obtiene entonces que |i | kAk para cualquiera que sea i = 1, 2, . . . , r, de
donde max |i | kAk, es decir: (A) kAk.
i
Definici
on 2.6 [Matriz de diagonal dominante]
Una matriz cuadrada de orden n A = (aij )i = 1, 2, . . . , n se dice que es una matriz
j = 1, 2, . . . , n
n
X
|aik |
i = 1, 2, . . . , n
k=1
k 6= i
3
1
2>0+1
5 > 2 + | 1| = 3
|akk |
n
X
i=1
i 6= k
69
n
X
i
|aki |
|aki |
k
i=1
i 6= k
!
a11 a12 a13
a11 a12
A1 = (a11 )
A2 =
A3 = a21 a22 a23
a21 a22
a31 a32 a33
Teorema 2.9 Las matrices fundamentales Ak de una matriz A de diagonal
dominante, son tambien de diagonal dominante.
Demostraci
on. La demostracion es trivial, ya que si A es de diagonal dominante se verifica que
|aii | >
n
X
|aij |
j =1
j 6= i
k
X
|aij |
j =1
j 6= i
C1 = {z : |z a11 | r1 }
C2 = {z : |z a22 | r2 }
X
con ri =
|aij | para 1 i n
..
.
j =1
j 6= i
Cn = {z : |z ann | rn }
Teorema 2.10 [Teorema de Gerschgorin]
Sean C1 , C2 , . . . , Cn los crculos de Gerschgorin de una matriz A. Si es un
n
[
autovalor de A, se verifica que
Ci .
i=1
70
Demostraci
on. Si 6
n
[
i=1
por lo que
| a11 | > r1
| a22 | > r2
..
.
| ann | > rn
y, por tanto, la matriz
I A =
a11 a12
a21 a22
..
..
.
.
an1
an2
..
.
a1n
a2n
..
.
ann
0 2 3
71
Estos u
ltimos nos dicen que la matriz tiene, al menos, un autovalor real (hay
un crculo que solo contiene a un autovalor y este debe ser real ya que de
ser complejo el conjugado tambien sera autovalor de A y al tener el mismo
modulo se encontrara en el mismo crculo contra la hipotesis de que en dicho
crculo solo se encuentra un autovalor), es decir los crculos obtenidos por filas
no nos dan informacion sobre el autovalor real, mientras que los obtenidos por
columnas nos dicen que existe un autovalor real en el intervalo (-4,4).
2.2
72
mn
M C
M z = k con
x Cn1
k Cm1
con
A, B Rmn
y analogamente
z = x + iy
con
k = k1 + ik2
con
x, y Rn1
k1 , k2 Rm1
Ax By = k1
A B
x
k1
=
=
Bx + Ay = k
B
A
y
k2
2
sistema real de 2m ecuaciones con 2n incognitas.
Es por ello, que centraremos nuestro estudio en los sistemas reales.
n de los SS.EE.LL
Clasificacio
Podemos clasificar los sistemas de ecuaciones lineales atendiendo a
73
Su tama
no
Peque
nos: n 300 donde n representa el n
umero de ecuaciones.
Grandes: n > 300
(Esta clasificacion corresponde al error de redondeo)
Su estructura
Si la matriz posee pocos elementos nulos diremos que se trata de
un sistema lleno.
Si, por el contrario, la matriz contiene muchos elementos nulos,
diremos que la matriz y, por tanto, que el sistema es disperso o
sparce. Matrices de este tipo son las denominadas
a11 a12 0
0
a
21 a22 a23 0
Tridiagonales:
22 a23 a24
Triangulares superiores:
0
0 a33 a34
0
a44
0
0
a11 0
0
a
12 a22 0
Triangulares inferiores:
a31 a32 a33
a41 a42 a43 a44
74
2.2.1
N
umero de condici
on
Definici
on 2.8 [Condicionamiento de un sistema]
Un sistema de ecuaciones lineales Ax = b se dice bien condicionado cuando
los errores cometidos en los elementos de la matriz A y del vector b producen
en la solucion un error del mismo orden, mientras que diremos que el sistema
est
a mal condicionado si el error que producen en la soluci
on del sistema es
de orden superior al de los datos. Es decir:
kA Ak <
=
kb bk <
kx xk '
3x + 4y
= 7
3x + 4.00001y = 7.00001
de solucion
x
y
!
=
1
1
75
r10
r1
r10
%
s
%
%
%
%
%
%
%
%
s
%
%
r2 %
%
@
@
@
@s s
@
@
@ r2
@
@
y cometemos un peque
no error en los datos, podemos obtener el sistema
!
!
3x + 4y
= 7
x
7.6
de solucion
=
y
4
3x + 3.99999y = 7.00004
o bien este otro
3x +
4y = 7
de solucion
3x + 3.99999y = 7.000055
x
y
!
=
9.6
5.5
!
!
3x + 4y = 7
x
1
de solucion
=
y
1
4x 3y = 1
siendo este un sistema bien condicionado.
Se puede observar entonces que si, en un sistema mal condicionado, sustituimos
una de las ecuaciones por una combinacion lineal de las restantes, podemos
hacer que el sistema resultante este bien condicionado o viceversa.
El estudio del condicionamiento de un sistema se realiza a traves del denominado n
umero de condicion que estudiamos a continuacion.
76
Definici
on 2.9 Sea A una matriz cuadrada y regular. Se define el n
umero de
condicion de la matriz A y se denota por (A) como
(A) = kAk kA1 k
donde la norma utilizada ha de ser una norma multiplicativa.
Este n
umero nos permite conocer el condicionamiento del sistema Ax = b.
Dado que en la practica el calculo de la matriz inversa A1 presenta grandes
dificultades lo que se hace es buscar una cota del n
umero de condicion.
(A) = kAk kA1 k < kAk k
siendo k una cota de la norma de la matriz inversa.
Si kI Ak < 1 entonces kA1 k
kIk
. En efecto:
1 kI Ak
A A1 = I = [I (I A)]A1 = I =
A1 (I A)A1 = I = A1 = I + (I A)A1 =
kA1 k = kI + (I A)A1 k kIk + k(I A)A1 k kIk + kI Ak kA1 k
kA1 k kI Ak kA1 k kIk = (1 kI Ak)kA1 k kIk =
kA1 k
kIk
1 kI Ak
Es decir:
(A) kAk k
con
k=
kIk
1 kI Ak
Debemos tener cuidado con esta acotacion ya que si tenemos una matriz casi
regular, es decir, con det(A) ' 0, quiere decir que tiene un autovalor proximo
a cero, por lo que la matriz I A tiene un autovalor proximo a 1 y sera el
mayor de todos. En este caso kI Ak ' 1, por lo que k y dara lugar a
un falso condicionamiento, ya que A no tiene que estar, necesariamente, mal
condicionada.
Ejemplo 2.6 Para estudiar el condicionamiento del sistema
3x + 4y
= 7
3x + 4.00001y = 7.00001
77
Se tiene que
3
4
3 4.00001
A=
A1
!
= det(A) = 0.00003
4.00001 4
3
3
1
=
0.00003
kAk = 7.00001
kA1 k =
8.00001
0.00003
n
X
j=1
= (A) '
56
105 > 1.8 106
3
kAk1 = 8.00001
kA1 k1 =
7.00001
0.00003
i=1
= 1 (A) '
56
105 > 1.8 106
3
78
Demostraci
on. Sabemos que los valores singulares i de la matriz A
son las races cuadradas positivas de los autovalores de la matriz A A.
p
i = i (A A)
Si suponemos 1 2 n se tiene que
kAk2 =
max i (A A) = n
i
q
q
kA1 k2 = max i (A1 ) A1 = max i (A )1 A1 =
i
i
s
r
q
1
1
=
=
= max i (AA )1 = max
i
i
i (AA )
mn i (AA )
i
s
s
1
1
1
1
=
=
2 = kA k2 =
mn i (A A)
1
mn i
i
kAk2 = n
kA1 k2 =
1
= 2 (A) =
n
1
79
n nkAk2 kA1 k2 = n2 (A) =
p
kAk2 kAk1 kAk
p
Ademas:
(A)
1 (A) (A)
2
p
1
1
1
kA k2 kA k1 kA k
La condicion necesaria y suficiente para que 2 (A) = 1 es que A = zU
siendo z C (no nulo) y U una matriz unitaria (U U = U U = I).
Demostraci
on.
) A = zU = 2 (A) = 1.
A = zU = A A = zU zU = |z|2 U U = |z|2 I =
i (A A) = |z|2 cualquiera que sea i = 1, 2, . . . , n y, por tanto,
1 = 2 = = n = |z|
por lo que
2 (A) =
n
=1
1
) 2 (A) = 1 = A = zU .
Sabemos que si A es diagonalizable existe una matriz regular R
tal que R1 AR = D con D = diag(i ) (R es la matriz de paso
cuyas columnas son los autovectores asociados los autovalores i ).
Por otra parte sabemos que toda matriz hermtica (A = A ) es
diagonalizable mediante una matriz de paso unitaria.
Como A A es hermtica existe una matriz unitaria R tal que
12
22
R A AR =
...
n2
2 (A) =
n
= 1 = 1 = 2 = = n = , por lo que
1
R A AR = 2 I
Entonces
A A = R( 2 I)R = 2 (RIR ) = 2 I
80
1
A
1
A
=I
1
1
A se tiene que U = A , ya que R = .
1
1
U U=
A
A = I = U es unitaria
Llamando U =
y, por tanto,
A = U
con U unitaria
Los sistemas mejor condicionados son aquellos que tienen sus filas o columnas
ortogonales y mientras mayor sea la dependencia lineal existente entres ellas
peor es el condicionamiento del sistema.
Al ser (U A) = (A) trataremos de utilizar metodos de resolucion de sistemas
de ecuaciones lineales que trabajen con transformaciones unitarias que no empeoren su condicionamiento como lo hace, por ejemplo, el metodo de Gauss
basado en la factorizacion LU y que tambien estudiaremos a continuacion.
2.3
2.3.1
M
etodos directos de resoluci
on de sistemas lineales
Factorizaci
on LU
81
1 0 0 0
u11 u12 u13 u1n
0 u33 u3n
A=
l31 l32 1 0 0
..
.. . . .. ..
..
.. . .
..
..
. . .
. .
.
.
.
.
.
ln1 ln2 ln3 1
unn
y calculando los valores de los n2 elementos que aparecen entre las dos matrices.
3
1
2
1 0 0
u11 u12 u13
3
1
2
3
2 = l21 1 0 0 u22 u23 =
6
l31 l32 1
0
0 u33
3
0 8
u11
u12
u13
= l21 u11
l21 u12 + u22
l21 u13 + u23
l31 u11 l31 u12 + l32 u22 l31 u13 + l32 u23 + u33
por lo que de la primera fila obtenemos que
u11 = 3
u12 = 1
3l21
= 6
=
l21 + u22 = 3
2l21 + u23 = 2
u13 = 2
ya obtenidos) se tiene que
l21 =
2
u22 =
1
u23 = 2
82
l31 = 1
3l31
= 3
= l32 =
l31 + l32
=
0
1
es decir: 6
3
1
2
1
3
2 = 2
0 8
1
0
1
1
0
3
0 0
1
0
1
2
1 2
0 4
(2)
a11 a12 a1n
(2)
0 a(2)
a2n
22
(2)
A =
.. . .
.
..
. ..
.
.
(2)
(2)
an2 ann
(2)
a21
podemos ver que es no nulo, ya que
a11
83
Reiterando el procedimiento se puede ver que todos los elementos que vamos
obteniendo en la diagonal son no nulos y, por tanto, validos como pivotes. Es
decir, puede realizarse la factorizacion LU .
Comprobar si una matriz admite factorizacion LU estudiando si todas sus
matrices fundamentales son regulares es un metodo demasiado costoso debido
al n
umero de determinantes que hay que calcular.
Corolario 2.13 Toda matriz de diagonal dominante admite factorizaci
on LU .
Demostraci
on. Es consecuencia directa de los Teoremas 2.8, 2.9 y 2.12.
Corolario 2.14 Toda matriz hermtica y definida positiva
hermtica A = A
(
x Ax 0 x
definida positiva
x Ax = 0 x = 0
admite factorizacion LU .
Demostraci
on. Las matrices fundamentales de estas tienen todas determinante positivo, por lo que el Teorema 2.12 garantiza la existencia de las matrices L y U .
Una vez realizada la factorizacion LU , el sistema Ax = b puede escribirse de la
forma LU x = b y llamando U x = y transformamos el problema de resolver el
sistema cuadrado Ax = b en la resolucion de los sistemas triangulares Ly = b
y U x = y.
Ly = b
Ax = b
Ux = y
Ejemplo 2.8 Consideremos el sistema Ax = b con
A= 6
3
1
2
3
2
0 8
0
b= 1
5
84
1 0 0
y1
0
Ly = b 2 1 0 y2 = 1
1 1 1
y3
5
U x = y 0
0
2.3.2
la matriz A.
= y = 1
4
1
2
x1
0
1
1 2 x2 = 1 = x = 1
x3
0 4
4
1
Factorizaci
on de Cholesky
Es conocido que toda matriz hermtica y definida positiva tiene sus autovalores
reales y positivos y, ademas, en la factorizacion LU todos los pivotes son reales
y positivos.
n de Cholesky]
Teorema 2.15 [Factorizacio
Toda matriz A hermtica y definida positiva puede ser descompuesta de la
forma A = R R siendo R una matriz triangular superior.
Demostraci
on. Por tratarse de una
sabemos que admite factorizacion LU .
u11 u12
1 0 0
l21 1 0 0 u22
.
A=
.. . . ..
..
..
. .
.
.
.
..
u1n
u2n
=
..
..
. .
0
0
ln1 ln2 1
1 0 0
u11 0
l21 1 0 0 u22
=
.. . . ..
.. . .
..
..
.
.
.
.
.
.
ln1 ln2
u11 0
0 u22
= L
..
..
.
.
0
..
.
0
0
..
.
unn
0
0
V =
unn
1 u12/u11
0
1
.
..
.
.
.
unn
0
0
0
0
..
.
u1n/u11
u2n/u22
..
..
=
.
.
0
u22
= L
..
..
.
.
0
0
...
0
0
..
.
unn
u11
0
0
u22
.
..
.
.
.
0
0
85
...
0
0
..
.
unn
A = BR
u11
0
0
u22
0
0
0
0
u33
0
B = L
0
es triangular inferior.
..
..
..
..
...
.
.
.
.
0
0
0
unn
u11
0
0
u22
0
0
0
0
u33
0
R=
V es triangular superior.
0
..
..
..
..
..
.
.
.
.
.
0
0
0
unn
Como A es hermtica, BR = A = A = R B , por lo que (R )1 B = B R1 , y
dado que (R )1 B es triangular inferior y B R1 es triangular superior, ambas
han de ser diagonales.
Por otra parte,
B R1 = (LD) (DV )1 = D L V 1 D1 = DL V 1 D1 = L V 1
ya que las matrices diagonales conmutan.
Dado que la matriz L V 1 tiene unos en la diagonal y es igual a B R1 que
es diagonal, debe ser B R1 = I, por lo que B = R o, lo que es lo mismo,
B = R , es decir A = R R con R = DV .
Hemos visto que toda matriz hermtica y definida positiva admite factorizacion
de Cholesky, pero podemos llegar mas lejos y enunciar el siguiente teorema.
Teorema 2.16 Una matriz hermtica y regular A es definida positiva si, y
s
olo si, admite factorizacion de Cholesky.
Demostraci
on. Si es hermtica y definida positiva admite factorizacion LU
con todos los elementos diagonales de U (pivotes) positivos, por lo que admite
factorizacion de Cholesky.
86
4
2i
4 + 2i
x1
0
2
2 2i x2 = 0
2i
4
4 2i 2 + 2i
10
x3
Realicemos la factorizacion R R directamente,
4
2i
4 + 2i
r11 0
2
2 2i = r12 r22
2i
4 2i 2 + 2i
10
r13 r23
es decir
0
r11 r12 r13
0 0 r22 r23
r33
0
0 r33
2
Se obtiene multiplicando, que r11
= 4 = r11 = 2.
2r12 = 2i = r12 = i
Utilizando este resultado tenemos que
2r13 = 4 + 2i = r13 = 2 + i
2
2
2
r12
+ r22
= 2 = r22
= 1 = r22 = 1.
2
0 0
2 i 2+i
x1
0
1 0 0 1
1 x2 = 0
i
2i 1 2
0 0
2
x3
4
87
0
0
2
0 0
y1
R y = b i
1 0 y2 = 0 = y = 0
2i 1 2
y3
4
2
0
1
2 i 2+i
x1
Rx = y 0 1
1 x2 = 0 = x = 1
1
x3
2
0 0
2
2.4
M
etodos iterados de resoluci
on de sistemas lineales
x x = 2(x x) = x x = 0 = x = x
88
(2.1)
(2.2)
89
(I K)(x x) = 0
Como I K es invertible, x = x, y el metodo es consistente.
Teorema 2.18 Un metodo iterado de la forma xn+1 = Kxn + c consistente
con el sistema Ax = b es convergente si, y s
olo si, lim K n = 0.
n
Demostraci
on. Por tratarse de un metodo consistente con el sistema Ax = b,
se verifica que c = (I K)A1 b, por lo que
xn+1 = Kxn + (I K)A1 b
restando el vector solucion x a ambos miembros, podemos escribir
xn+1 x = Kxn (K +I K)x+(I K)A1 b = K(xn x)+(I K)(A1 bx)
y dado que A1 b x = 0 obtenemos que xn+1 x = K(xn x).
Reiterando el proceso se obtiene:
xn x = K(xn1 x) = K 2 (xn2 x) = = K n (x0 x)
lim (xn x) = ( lim K n )(x0 x)
(2.3)
lim (xn x) = 0
lim xn = x
90
Demostraci
on.
Existencia y unicidad
Veamos, en primer lugar, que la ecuacion x = Kx + c posee solucion
u
nica.
En efecto: x = Kx + c = (I K)x = c. Este sistema tiene solucion
u
nica si, y solo si, el sistema homogeneo asociado (I K)z = 0 admite
solo la solucion trivial z = 0, es decir, si I K es invertible.
La solucion z no puede ser distinta del vector nulo ya que de serlo, como
kKk < 1 se tiene que al ser (I K)z = 0, o lo que es lo mismo, z = Kz
kzk = kKzk kKkkzk < kzk
lo cual es un absurdo, por lo que el sistema homogeneo solo admite la
solucion trivial y, por tanto, el sistema completo x = Kx + c posee
solucion u
nica.
Convergencia
Probaremos ahora que la sucesion (xn ) converge a x.
Dado que xn+1 x = (Kxn + c) (Kx + c) = K(xn x), podemos
reiterar el proceso para obtener que xn x = K n (x0 x) por lo que
kxn xk kK n kkx0 xk kKkn kx0 xk
y dado que kKk < 1, pasando al lmite se obtiene
lim kxn xk = 0 = lim xn = x
91
Demostraci
on.
n suficiente
Condicio
Si 1 , . . . , m son los autovalores de la matriz K, los de la matriz K n son
n1 , . . . , nm .
(K) < 1 = |i | < 1 (i = 1, . . . , m) = i , 2i , . . . , ni , . . . 0
por lo que los autovalores de la matriz lmite lim K n son todos nulos,
n
es decir, lim K n = 0 por lo que
n
K = M 1 N
c = M 1 b
Dado que
(I K)A1 b = (I M 1 N )(M N )1 b = M 1 (M N )(M N )1 b = M 1 b = c
y la matriz (I K) = (I M 1 N ) = M 1 (M N ) = M 1 A es invertible,
estamos en las condiciones del Teorema 2.17 por lo que xn+1 = Kxn + c es
consistente con el sistema Ax = b.
92
D=
a11 0
0
0 a22 0
0
0 a33
..
..
..
.
.
.
0
0
0
..
.
0
0
0
..
.
E =
ann
F =
2.4.1
0 a12 a13
0 0 a23
0 0
0
.. ..
..
. .
.
0 0
0
0
0
0
a21 0
0
a31 a32 0
..
..
..
.
.
.
an1 an2 an3
..
.
0
0
0
..
.
a1n
a2n
a3n
.
..
. ..
0
M
etodo de Jacobi
xn+1 = Jxn + c
con
J = D1 (E + F )
c = D1 E
93
Demostraci
on. La matriz J = D1 (E + F ) tiene todos los elementos diagonales nulos y las sumas de los modulos de los elementos de sus filas son todas
menores que 1 ya que
|aii | >
n
X
|aik |
n
X
|aik |
<1
|aii |
i = 1, 2, . . . , n =
k=1
k 6= i
k=1
k 6= i
2.4.2
M
etodo de Gauss-Seidel
xn+1 = L1 xn + c
con
L1 = (D E)1 F
c = (D E)1 b
2.4.3
M
etodos de relajaci
on (SOR)
1
D+F
=M N
94
(D E)x = (1 )D + F x + b =
x = (D E)1 (1 )D + F x + (D E)1 b
Metodos de relajacion
(
xn+1 = L xn + c
1
L = (D E)
con
(1 )D + F
c = (D E)1 b
La matriz L recibe el nombre de matriz de relajaci
on.
Si = 1 la matriz se reduce a L1 = (D E)1 F , es decir, se trata del
metodo de Gauss Seidel.
Si > 1 se dice que se trata de un metodo de sobre-relajaci
on
Si < 1 se dice que se trata de un metodo de sub-relajaci
on
Teorema 2.24 Una condicion necesaria para que converja el metodo de relajaci
on es que (0, 2).
Factorizaciones ortogonales
2.5
95
Factorizaciones ortogonales
2.5.1
Factorizaci
on QR de Gram-Schmidt
a11 a12
a21 a22
Consideremos la matriz regular A =
..
..
.
.
an1 an2
donde ai representa a su columna i-esima.
a1n
a2n
. = (a1 a2 an )
..
. ..
ann
y1
h a1 , y 1 i h an , y 1 i
.
..
..
..
Q A = .. (a1 an ) Q A =
.
.
.
yn
h a1 , y n i h an , y n i
0 r22 r2n
Q A = R =
.. . .
.
..
. ..
.
.
0
rnn
96
2.5.2
Factorizaci
on QR mediante rotaciones
Consideremos la matriz
a11 a1i
. .
. . ...
..
ai1 aii
.
..
.
A=
.
.
aj1 aji
.
..
.
.
.
an1 ani
a1j a1n
..
..
.
.
aij ain
..
. . . ..
.
.
ajj ajn
.. . .
.
. ..
.
anj ann
1
0
0
0
. .
..
..
..
.. . .
.
.
.
cos
sen
.
..
..
..
.
.
.
Qji = .
.
.
.
.
0 sen cos 0
.
..
..
. . ..
.
. .
.
.
.
0
0
0
1
La matriz Qji A nos queda
Factorizaciones ortogonales
a011 a01i
. .
. . ...
..
0
ai1 a0ii
.
..
.
Qji A =
.
.
0
aj1 a0ji
.
..
.
.
.
a0n1 a0ni
97
a01j a01n
..
..
.
.
a0ij a0in
.
..
..
. ..
.
0
0
ajj ajn
.. . .
.
. ..
.
0
0
anj ann
con
Q = Qk Q2 Q1
98
2.5.3
Factorizaci
on QR de Householder
nn
si v = 0
IK
H=
I
vv si v 6= 0
vv
Proposici
on 2.27 La transformaci
on H de Householder asociada a un vector
v Kn posee las siguientes propiedades:
a) H es hermtica (H = H).
b) H es unitaria (H H = HH = I).
c) H 2 = I o lo que es lo mismo, H 1 = H.
Demostraci
on.
a) H =
2
I vv
v v
=I
2
2
(vv ) = I vv = H
v v
v v
HH = HH = I vv
I vv =
v v
v v
2
4
2
= I vv +
vv vv =
v v
v v
4
4
4
4
= I vv + 2 v(v v)v = I vv + vv = I
v v
(v v)
v v
(v v)
c) H 2 = HH = HH = I.
Factorizaciones ortogonales
99
n geome
trica en Rn
Interpretacio
Sean v Rn un vector tal que kvk2 = 1 y H la transformacion de Householder
asociada a el:
H = I 2vv T
Dado un vector x Rn se tiene que
Hx = I 2vv T x = x 2vv T x = x 2vh x, v i =
= x 2v(kxk kvk cos ) = x 2v(kxk cos ) =
= x 2v con = kxk cos
donde representa el angulo que forman los vectores x y v.
3
x
Q
k
6Q y
Q
y + v
Q
36
Q
Q
Q
Q
-
x v
v
-
100
2
2
vv )x = x v(v x) = x
v v
v v
b) x k v = x = v
Hx = (I
2
2
2
vv )v = v vv v = v v(v v) =
v v
v v
v v
= v 2v = v = x
En particular, para x = v se obtiene Hv = v.
n geome
trica en Cn
Interpretacio
Cualquier vector x Cn puede ser descompuesto de forma u
nica en la suma
de uno proporcional a v y otro w perteneciente a la variedad W ortogonal a
v, es decir
x = v + w con w v
As pues,
Hx = H(v + w) = H(v) + Hw = v + w
Hx es el vector simetrico de x respecto del hiperplano ortogonal a v.
Factorizaciones ortogonales
101
n de las transformaciones
Determinacio
Caso real
Proposici
on 2.29 Si x 6= y son dos vectores de Rn con kxk = kyk, la
transformacion de Householder asociada al vector v = x y transforma
al vector x en el vector y, es decir, Hx = y.
Demostraci
on. Dado que ambos vectores tienen la misma norma,
h x + y, x y i = kxk2 h x, y i + h y, x i kyk2 = 0
6x + y
y
KA
A
A
x
A
x -y
A
x = (x1 , x2 , . . . , xn )T
La transformacion de Householder asociada al vector v = x y transforma x en y y deja invariante a cualquier vector que tenga nulas todas
sus coordenadas a partir de la k + 1-esima.
Ejemplo 2.11 Sean
x = (1, 1, 1, 2, 2)T
102
2
2
vv = I vv
v v
12
verifica que:
Hx = (I
2
2
2
vv )x = x v(v x) = x v6 = x v = y
12
12
12
2
2
2
vv )w = w v(v w) = w v 0 = w
12
12
12
Caso complejo
Considerense los vectores de igual norma
x = (x1 , x2 , . . . , xn )
k(xk+1 , . . . , xn )T k
xk+1 , 0, . . . , 0)T
y = (x1 , x2 , . . . , xk ,
|xk+1 |
La transformacion de Householder asociada al vector v = x y transforma x en y y deja invariante a cualquier vector que tenga nulas todas
sus coordenadas a partir de la k + 1-esima.
Ejemplo 2.12 Sean
p
|3i|2 + |4i|2
y = (i,
3i, 0)T = (i, 5i, 0)T
|3i|
La transformacion de Householder asociada al vector
v = x y = (0, 2i, 4i)T
H=I
2
2
vv = I vv
v v
12
Factorizaciones ortogonales
103
verifica que:
Hx = (I
2
2
2
vv )x = x v(v x) = x v10 = x v = y
20
20
20
2
2
2
vv )w = w v(v w) = w v 0 = w
20
20
20
n QR de Householder
Factorizacio
Sea A = (a1 a2 an ), donde ai representa la columna i-esima de la matriz.
a11
kx1 k
r11
a21
0 0
Sean x1 = a1 =
.. e y1 = .. = .. .
.
.
.
an1
0
0
La transformacion de Householder H1 , asociada al vector v1 = x1 y1 , transforma x1 en y1 , es decir, anula a todos los elementos de la primera columna
situados debajo de a11 .
(1)
(1)
r11 a12 a1n
(1)
0 a(1)
a2n
22
(1) (1)
(1)
H1 A = .
.. . .
..
= (a1 a2 an )
.
.
.
.
.
0
(1)
en la que ai
(1)
(1)
an2 ann
(1)
(1)
a21
a21
(1)
(1)
(1)
a22
k(a22 , . . . , an2 )T k
(1)
(1)
, la trans0
Tomando x2 = a2 =
a32 e y2 =
..
..
.
(1)
an2
0
(1)
104
Reiterando al procedimiento se puede transformar la matriz A en una triangular superior R en, a lo mas, n 1 transformaciones.
Llegados a ese paso se tiene que
Hk Hk1 H1 A = R Q A = R
con
Q = Hk Hk1 H1
de donde
A = QR.
con
Q = H1 H2 Hk
1 1 1
p
1
12 + 22 + (2)2
3
Como x1 = 2 e y1 =
0
= 0 , se tiene que
0
0
2
v1 = x1 y1 = 2
2
1/3
2/3 2/3
2
2
2
1/3
2/3
H1 = I v1 v1 = I 2 2 2 2 = 2/3
v1 v1
12
2/3
1/3
2
2/3
1/3
2/3 2/3
1 1 1
3 5 1/3
1/3
2/3
1/3
H1 A = 2/3
2
0
1 = 0
4
2/3
1/3
5/3
2/3
2
7
1
0
3
5
5
5
0
x2 = 4 y2 = 42 + 32 = 5 = v2 = x2 y2 = 1
3
0
0
3
0
1
0
0
2
2
3/5
H2 = I v2 v2 = I
1 0 1 3 = 0 4/5
v2 v2
10
0 3/5 4/5
3
Factorizaciones ortogonales
H2 H1 A = 0
0
105
3 5
1/3
3 5 1/3
0
0
1/3 = 0
19/15 = R
4/5
3/5 0
4
5
5/3
3/5 4/5
0
0 17/15
0
3
1/3
2/15
14/15
Q = H1 H2 =
2/3
2/3
1/3
2/15
2/3
11/15
Observese que H1 A =
(1)
11 a12
0
..
.
A(1)
(1)
a1n
0
un orden inferior al de la matriz A.
El vector v2 tiene la primera coordenada nula, por lo que
H2 = I v2 v2 =
v2 v2
H2 (H1 A) =
1 0 0
..
(2)
H
.
(1)
(1)
11 a12 a1n
1 0 0
0
0
.
..
(2)
.
A(1)
H
.
.
0
0
H2 H1 A =
(1)
11 a12
0
..
.
H(2) A(1)
(1)
a1n
0
Es decir, H2 deja invariantes a los elementos de la primera fila y la primera
columna de H1 A.
106
Analogamente, H3 =
0 0 0
1 0 0
..
(3)
.
H
0 0
filas y las dos primeras columnas de H2 H1 A y as
1
0
0
..
.
p
1
12 + 22 + (2)2
x1 = 2 y1 =
0
2
0
tiene:
3
= 0 =
0
2
v1 v
v1 v1 1
H1 = I
1/3
H1 A =
2/3
2/3
v1 = x 1 y1 = 2
2
1/3
2
2
= I 2 2 2 2 = 2/3
12
2
2/3
2/3 2/3
1 1 1
3 5
1/3
2/3
2
0
1 = 0
4
2/3
1/3
2
7
1
0
3
2/3
1/3
2/3
2/3
1/3
1/3
1/3
5/3
2/3
4
3
5
0
1/3
5/3
!
.
Tomando
4
3
x2 =
(2)
!
y2 =
42 + 32
0
2
2
= I2 v2 v2 = I2
v2 v2
10
1
3
= v2 = x2 y2 =
1 3
1
3
4/5
3/5
3/5
4/5
Por lo que H2 = 0
0
107
0
0
4/5
3/5
3/5 4/5
H(2) A(1) =
Podramos obtener
4/5
3/5
3/5
4/5
4
3
1/3
5/3
!
=
19/15
5
0 17/15
3 5
1/3
19/15
H2 H1 A = 0
5
0
0 17/15
2.6
!
a1 1
b1
ma1 + n = b1
m
= b2
ma2 + n = b2
a2 1
n
ma3 + n = b3
a3 1
b3
108
Decir
el
queel sistema no posee solucion equivale a decir que
b1
a1
vector
1 .
1
Definici
on 2.13 [Sistema superdeterminado]
Se define un sistema superdeterminado como aquel sistema de ecuaciones lineales Ax = b en el que A Kmn con m > n, x Kn y b Km .
Supongamos que se tiene un sistema superdeterminado
a11
.
..
an1
.
..
am1
a1n
..
...
.
ann
..
.
amn
x1
..
.
xn
b1
.
..
= bn
.
..
bm
1in
b
109
6
c
C(A)
1
.
1 a1 + 2 a2 + + n an = b
A .. = b
n
Multiplicando esta ecuacion por a1 , a2 , . . ., an , obtenemos
1 h a1 , a1 i + + n h a1 , an i = h b, a1 i = h b, a1 i
.................................................
.................................................
1 h an , a1 i + + n h an , an i = h b, an i = h b, an i
que equivale a
a1 a1 a1 an
1
..
.. ..
...
.
. . =
an a1 an an
n
a1 b
..
.
an b
es decir
a1
1
.
..
. a1 an .. =
an
n
a1
..
. b
an
o, lo que es lo mismo:
1
.
A A .. = A b
n
As pues, la solucion del sistema A Ax = A b nos proporciona las coordenadas,
respecto de la base formada por las columnas de la matriz A, del vector b
proyeccion ortogonal de b sobre el espacio columna C(A).
110
Definici
on 2.15 [Ecuaciones normales de un sistema]
Las ecuaciones A Ax = A b reciben el nombre de ecuaciones normales del
sistema superdeterminado Ax = b.
n]
Definici
on 2.16 [Sol. en mnimos cuadrados: Pseudosolucio
Las soluciones del sistema determinado por las ecuaciones normales de un sistema superdeterminado Ax = b reciben el nombre de soluci
on(es) en mnimos
cuadrados y de todas las posibles soluciones en mnimos cuadrados, la de menor norma recibe el nombre de pseudosoluci
on del sistema.
Observese que si la matriz A no tiene rango maximo, lo u
nico que se dispone del
espacio columna de A es de un sistema generador y no de una base, por lo que
las coordenadas del vector proyeccion respecto de dicho sistema generador no
son u
nicas obteniendose infinitas soluciones en mnimos cuadrados del sistema.
2.6.1
BAx = Bb
posean la misma pseudosolucion, han de tener igual solucion (han de ser equivalentes) los sistemas
A Ax = A b
(BA) BAx = (BA) Bb A (B B)Ax = A (B B)b
por lo que solo podremos garantizar que ambos sistemas son equivalentes si
B B = I ya que, en dicho caso, ambos sistemas son el mismo.
Es decir, las u
nicas transformaciones que podemos garantizar que no alteraran
la solucion de un sistema superdeterminado son las unitarias.
111
Dado que las transformaciones de Householder son unitarias, podemos utilizarlas para resolver sistemas superdeterminados.
Consideremos el sistema superdeterminado Ax = b (en el que suponemos A
de rango maximo). Mediante transformaciones de Householder H1 , H2 , . . . , Hn
podemos transformar la matriz A en otra de la forma
0 t22 t2n
.. . .
..
..
!
.
.
.
.
HA = Hn H1 A =
0 0 tnn =
0 0 0
.
..
..
..
.
.
0 0 0
La pseudosolucion de este sistema superdeterminado es la solucion del sistema
!
T
x = T Hb
(HA) (HA)x = (HA) Hb
T
b01
.
..
!
T
o llamando Hb = b0 = b0n , T
x = T b0 .
.
..
b0m
b01
.
0
..
b1
0
..
b0m
de la pseudosolucion del sistema superdeterminado Ax = b se hace resolviendo
el sistema
0
b1
.
T T x = T ..
b0n
y dado que estamos suponiendo que A tiene rango maximo, la matriz T posee
inversa y por tanto T , por lo que la solucion es la misma que la del sistema
112
triangular
b01
.
T x = ..
T x = b
b0n
Una vez calculada la pseudosolucion, la norma del error esta representada por
la distancia kb bk que viene dada por
b 0
b01
1
0
b1
. .
.
.. ..
0
..
!
b0 b0
bn+1
T
0
n n
..
x bn
=
=
.
.
0 b0n+1
..
b0m
.. ..
.
.
b0m
0
b0
m
Por u
ltimo, si la matriz A no tiene rango maximo, sus columnas no son linealmente independientes, por lo que solo constituyen un sistema generador
(no una base) del espacio columna C(A). Ello nos lleva a la existencia de
infinitas n-uplas (1 , 2 , . . . , n ) soluciones del sistema Ax = b y, por tanto, a
infinitas soluciones en mnimos cuadrados del sistema superdeterminado, pero
teniendo en cuenta que al ser u
nica la proyeccion ortogonal b de b sobre el espacio columna C(A), todas ellas representan diferentes coordenadas del vector
b respecto del sistema generador de C(A) dado por las columnas de A.
Sin embargo, el error cometido kb bk es el mismo para todas las soluciones
en mnimos cuadrados del sistema. De entre todas ellas, la de menor norma
eucldea es la pseudosolucion.
2.7
Ejercicios resueltos
Ejercicios resueltos
113
El n
umero de condicion de Frobenius viene dado por F (A) = kAkF kA1 kF .
kAk2F = a2 + b2 + (a + )2 + b2 = 2a2 + 2b2 + 2a + 2
kA1 k2F =
2a2 + 2b2 + 2a + 2
b2 + b2 + (a )2 + a2
=
b 2 2
b 2 2
Por lo que:
2F (A) =
|2a2 + 2b2 + 2a + 2 |
(2a2 + 2b2 + 2a + 2 )2
=
(A)
=
.
F
b2 2
|b |
202
202 + 20 + 2
=
20 + ||
||
||
A A =
18
P () =
27
3
4
27
41
3
5
4
5
3
3
!
.
4
5
!
=
18
27
27
41
= ( 18)( 41) 272 = 2 59 + 9.
114
2 (A) =
2
=
1
59
59
3445
2
s
3481 36
59 3445
=
=
2
2
s
59 + 3445
y
2 =
2
(59 + 3445)2
59 + 3445
59 + 3445
=
=
=
6
36
59 3445
2 (A) = 19.61568707 . . .
3a + 3b
4a + 5b
!
= 0 3(3a + 3b) + 4(4a + 5b) = 0 =
25a + 29b = 0
29
a=
25a + 29b = 0
3
=
25
29
25
Tomando, por ejemplo, a =
y b =
(el otro caso es analogo),
3
3
obtenemos:
Ejercicios resueltos
B=
3
4
4 3
115
!
0.6
0.8
0.8 0.6
= 5 U con U =
(
El sistema resultante es
3x + 4y = 7
4x 3y = 1
!
unitaria.
y su n
umero de condicion
eucldeo es 2 (B) = 1.
Ejercicio 2.3 Sea {0.5, 1.5, 2.5} y consideremos el sistema iterado
1
1
!
!
1
1
1
x
xn+1
n
+
=
y
yn+1
n
1
1
+1
1
1
Se pide
a) Resolver el sistema resultante de tomar lmites !
para probar
en caso
! que, !
!
x0
x1
x2
de que converja, el lmite de la sucesion
,
,
...
y0
y1
y2
no depende de .
b) Para que valores de converge la sucesion?
c) Para los valores anteriores que hacen que la sucesion sea convergente,
con cual lo hace mas rapidamente?
!
!
x0
0.5
d) Comenzando con el vector
=
, aproximar iteradamente
y0
0.5
el lmite de la sucesion utilizando el valor de que acelere mas la convergencia.
n:
Solucio
a) En caso de que converja, tomando lmites obtenemos que
!
!
!
1
1
1 x
1 0
x
1
1
=
+
1
1
0 1
y
y
1
+1
1
o lo que es lo mismo
1
2 1
1
1
x
y
1
1
=
1 =
1
116
1
1
1 1 +
1
1
por lo que
x=y
1
1
1
x=1
x
y
0
1
x=y=1
6= 1
ya que
1
1
1
b) El polinomio caracterstico de la matriz
del metodo
1
1
+1
1
1
2
iterado es P () = 2 + 2 que admite la raz doble .
!
=
4/5
4/5
x2
y2
!
=
23/25
x3
y3
23/25
x
y
121/125
!
=
121/125
1
1
!
...
!
que era la
Ejercicios resueltos
117
a) El sistema a resolver es Ax = b
x
y
13
11
4
3
v1 v2 = h v1 , v2 i = 0 = 35 + 25 = 0 = = 7/5
por tanto,
"
!
25
1
v2 =
7
5
25
R = Q A =
4
3
!#
3/5
4/5
4/5
3/5
3/5
4/5
4/5
Q=
4 5
3 5
3/5
5 7
0 1
3/5
4/5
Se obtiene, por tanto, que A = QR donde Q es unitaria y R triangular superior. El sistema se transforma en otro triangular de la
manera siguiente:
Ax = b QRx = b Rx = Q b
En nuestro caso:
Q b =
4/5
3/5
3/5
4/5
13
11
y = 1.
17
1
17
1
118
4
42 + 32
5
x=
y=
=
v =xy =
3
0
0
2
H = I vv =
v v
1 0
0 1
1 3
3
9
!
=
1
3
4/5
3/5
3/5
4/5
4/5
3/5
3/5
4/5
13
11
17
1
17
1
cuya solucion
x=2
y = 1.
2
donde 2 el
1
mayor y 1 el menor de los valores singulares de la matriz A.
b) El n
umero de condicion eucldeo viene dado por 2 (A) =
Los valores singulares son las races cuadradas positivas de los autovalores de la matriz A A.
Cuando calculamos el n
umero de condicion de la matriz R del sistema
transformado, realizaremos el mismo proceso con esta nueva matriz, es
decir, debemos calcular los autovalores de la matriz R R.
Ejercicios resueltos
119
Dado que
!
A A =
4 3
5 5
R R =
5 0
7 1
4 5
3 5
5 7
0 1
25 35
35 50
25 35
35 50
los valores singulares de las matrices A y R son los mismos, por lo que
se obtiene el mismo n
umero de condicion eucldeo.
El polinomio caracterstico de A A es p() = 2 75 + 25, por
lo que sus autovalores son 1 ' 74.665 y 2 '0.335 y, por tanto,
los valores
singulares de la matriz A son 2 ' 74.665 ' 8.64 y
2
' 14.9
1
1 1 1
x
0
0
1 y = 4
2
2
7
1
z
7
n:
Solucio
x= 2
2
3
y= 0
0
v1 = x y = 2
2
H1 = I3
2
v v
v1 v1 1 1
2
1
= I3 2
3
2
2
2
= I3
2 2
12
2
1/3
2
2
2 2 = 2/3
2/3
2
2
3 5 1/3
x
1
4
/3 y
0
5/3
0
3
z
obtiene
2 2
2/3
1/3
2/3
22/3
10
= /3
1/3
2/3
2/3
1/3
120
x=
!
y=
5
0
!
v2 = x y =
1
3
2
1
H2 = I2 v2 v2 = I2
v2 v2
5
H2
4
3
1/3
5/3
!
=
19/15
5
0 17/15
1
3
1 3
10/3
1/3
H2
=
!
=
4/5
3/5
3/5
4/5
37/15
34/15
22/3
3 5
1/3
x
19/15 y = 37/15
5
0
0
0 17/15
z
34/15
cuya solucion es x = 1, y = 1, z = 2.
Ejercicio 2.6 Buscar la solucion de mnimos cuadrados del sistema Ax = b,
siendo:
3 1
0
A= 4
y
b= 2
2
0
1
1
a) A traves de sus ecuaciones normales.
b) Por el metodo de Householder.
n:
Solucio
a) Las ecuaciones normales, dadas por A Ax = A b son
! 3 1
!
! 0
3 4 0
3 4 0
x
=
2
4
2
1 2 1
y
1 2 1
0
1
1
Es decir:
25 5
5 6
x
y
!
=
8
5
Ejercicios resueltos
121
25 5
0 5
x
y
8
17/5
23
,
125
y=
17
.
25
b)
3
kx1 k
5
2
x1 = 4 = y1 = 0 = 0 = v1 = x1 y1 = 4
0
0
0
0
2
2
H1 = I3 v v1 2v1 v1 = I3
4 2 4 0 =
1
20
0
3/5
4/5
0
4
= /5 3/5
0
0
0
1
Aplicando la transformacion al sistema, se obtiene
!
8/5
5
1
= 6/5
0 2
y
0
1
1
Para que
(1)
x2
2
1
(1)
se transforme en
(1)
y2
kx2 k
0
!
=
!
5
0
(2)
5
(1)
(1)
v2 = x2 y2 =
1
(2)
H2 =
2 5/5
5/5
5/5
5/5
1
0
2
5
= H2 = 0 /5
5/5
0
5/5
2 5/5
122
!
8/5
5 1
x
= 17/5 5
5
0
y
4/5 5
0 0
17
23
porlo que la pseudosolucion del sistema es x =
,y=
y el error
125
25
4
viene dado por ' 0.3578.
5 5
2.8
Ejercicios propuestos
(
x + y = 2
2x + y = 3
a) Calcular su n
umero de condicion de Frobenius.
Sol : F (A) = 7.
b) Calcular a para que el n
umero de condicion del sistema resultante de
sumarle a la segunda ecuacion la primera multiplicada por dicha constante a, sea mnimo.
Sol : a = 3/2.
Ejercicio 2.8 Comprobar que la
A=
0
0
0
matriz:
2
4
4
0
0
1 0 0 0 0
1 1 0 0 0
yU =
Sol : L =
0
2
1
0
0
0
0
3
1
0
0 0 0 4 1
fundamentales son regulares.
0
3
9
9
0
1
0
0
0
0
0 0
0 0
4 0
16 5
16 25
2
2
0
0
0
0
3
3
0
0
0
0
4
4
0
0
0
0
5
5
Ejercicios propuestos
123
1 2i
6
1 + 3i
1 2i
x1
3
1 + i x2 = 1 + i
1 3i
1 2i
1 + 2i
1 i
2
x3
Sol : x1 = 1 2i, x2 = 3 i, x3 = 1 + 2i.
p p
2p
x 3y + 5z = 5
8x y z = 8
2x + 4y + z = 4
por el metodo de Gauss-Seidel, utilizando MATLAB, observamos que el programa se detiene en la iteracion 138 dandonos el vector (inf inf -inf)T .
124
0
3 5
Sol : L1 = 0
24 41
0 90 154
b) Utilizar los crculos de Gerschgorin para estimar el modulo de los autovalores de L1 .
Sol : |i | 244.
c) Justificar el porque de la divergencia del metodo.
Sol : (L1 ) > 1.
d) Existe alguna condicion suficiente que deba cumplir la matriz de un
sistema para garantizar la convergencia del metodo de Gauss-Seidel?
Hacer uso de ella para modificar el sistema de forma que el proceso sea
convergente?
Sol : Llevando la primera ecuacion al u
ltimo lugar, la matriz del sistema
resultante es de diagonal dominante y por tanto converge el metodo.
Ejercicio 2.13
a) Dado un sistema Ax = b, el metodo de Gauss-Seidel consiste en construir la sucesion xn+1 = L1 xn + c, a partir de un vector inicial x0 . Si
conocemos el valor de xn+1 podramos determinar el de xn haciendo
xn = L1
1 (xn+1 c)?
Sol : No. L1 no tiene inversa. Porque?, justifcalo.
b) Si la matriz A del sistema es de diagonal estrictamente dominante,
puede ser el radio espectral de L1 mayor que 1?
Sol : No. Porque?, justifcalo.
c) Si, para un determinado sistema y comenzando con un determinado vector x0 , el metodo de Gauss-Seidel requiere 50 iteraciones para aproximar
la solucion con un error menor que y en la iteracion 49 se pierde la primera coordenada del vector x49 y la sustituimos por un valor arbitrario,
se obtendra en el paso siguiente la solucion buscada con el mismo error
que si no hubiesemos perdido el dato? que ocurrira si la coordenada
que perdemos del vector x49 es la segunda en vez de la primera?
Ejercicios propuestos
125
realizar
dos
pasos
1
x
16
1 y = 0
2
z
0
del
a b
x
A=
, x=
y b=
con
c d
y
, R.
126
!
1 2
e) Comprobar la matriz A =
es otro ejemplo para la no conver1 1
gencia del metodo de Gauss-Seidel.
!
1
Calcular, para dicha matriz y el vector b =
el termino general
1
de la sucesion xk obtenida
por el metodo de Gauss-Seidel a partir del
!
m
vector x0 =
y comprobar que dicha sucesion no converge para
n
valores arbitrarios de m y n.
Existe alg
un vector inicial x0 para el que converja el metodo? y, en
caso de existir, contradice dicho ejemplo el hecho de que el metodo no
sea convergente?
!
2k n + 1
Sol : xk =
que diverge si n 6= 0. No existe contradiccion
2k n
porque? Justifcalo.
Ejercicio 2.15 Se quiere encontrar una funcion de la forma f (x) = ax3 +bx+c
que pase por los puntos (1, 4), (2, 23) y (2, 21).
a) Plantear un sistema de ecuaciones para calcular los coeficientes de f y
resolverlo usando la descomposicion LU de la matriz del sistema.
Sol : f (x) = 2x3 + 3x 1.
b) Usar una sucesion de Sturm para saber cuantas races reales tiene la
ecuacion f (x) = 0.
Sol : Solo una.
c) Separar dichas races por intervalos adecuados para que se den las hipotesis de las condiciones de Fourier.
Sol : x [0.3, 0.4]
d) Cuantas iteraciones son necesarias para obtener las races reales con 6
cifras decimales exactas usando para su calculo el metodo de Newton?
Sol : Tres.
e) Aplicar dicho metodo para calcularlas con una precision de 12 cifras
decimales exactas asegurando en cada paso del metodo el n
umero de
cifras que se van obteniendo.
Ejercicios propuestos
127
Sol : x = 0.312908409479.
Ejercicio 2.16 Se considera el
1
1
A=
1
1
2
3
0
2
y
b
=
.
0
1
1
1
Se pide:
a) Calcular la pseudosolucion, a traves de las ecuaciones normales, utilizando el metodo de Cholesky.
Sol : x = 1, y = 1/2.
b) Sea v = (1, 1, 1, 1)T . Demostrar que la transformacion de Householder
asociada al vector v transforma la primera columna de la matriz A en el
vector (2, 0, 0, 0)T dejando invariante la segunda columna de A as como
al vector b.
c) Calcular la pseudosolucion del sistema utilizando transformaciones de
Householder, as como la norma del error.
128
1 1 0
1
1 0 1 x
2
y =
0
1 1 1
z
1 2 1
1
2
1
0
2
1
2
x
y
= 1
5
1
1
A=
1
1
7 15
7
7
4 8
y b=
5
0 1
3 6
9
1 5 5
7
1 2 3
16
A=
y
b=
1 1 3
3
1 2 1
10
Ejercicios propuestos
129
!
2 2
6
x1
y b = 3 ,
A = 1 1 , x =
x2
3
2
2
y un vector unitario u. Se pide:
a) Demostrar que si H = I 2uuT es la matriz de Householder, asociada al
vector u, entonces: H es ortogonal, H 2 = I y kHak2 = kak2 cualquiera
que sea el vector a.
b) Obtener la matriz de Householder que transforma el vector (2, 1, 2)T
en otro de la forma (, 0, 0)T , con > 0.
2
1 2
Sol : H = 1
2
2 .
2
2 1
c) Aplicando el metodo de Householder, probar que el sistema Ax = b
posee infinitas soluciones en cuadrados mnimos y que el error cometido,
al considerar cualquiera de ellas, es el mismo.
Sol : x = (1 + , )T R, kEk = 3.
d) Obtener la pseudosolucion del sistema Ax = b.
Sol : ( 1/2 , 1/2)T .
Ejercicio 2.24 Sea el sistema Ax = b, donde
!
0 3
x
A = 3 5 , x =
y
y
4 0
10
b=
6 .
8
130
0
15 20
1
Sol : Hu =
16
12 .
15
25
20
12
9
d) Obtener la solucion en mnimos cuadrados del sistema Ax = b, utilizando
el metodo de Householder, y determinar la norma del error.
Sol : x = 68/25, y = 6/5, kEk = 8.
e) Sin haber resuelto el apartado anterior, podran predecirse Hu A y Hu b
de las relaciones geometricas entre L =< u >, L y los vectores columnas
implicados?
Sol : S. Si A = (a1 a2 ), Hu a1 = (5, 0, 0)T , Hu a2 = a2 , Hu b = b.
Ejercicio 2.25 Se considera el
A= 4
12
2
3
5 y b= 1
0
13
1 0 0
!
3 2
3
T Ax = T b 4 5
= 1
y
13/12
1 0
Ejercicios propuestos
131
Calcular su pseudosolucion haciendo uso de las ecuaciones normales. Determinar la norma del error.
!
3 2
x
A= 0
y
3 , x =
y
4
4
2
b = 0 .
1
3/5
0 4/5
Sol : Hu =
0
1
0 . Si A = (a1 a2 ), Hu a2 = a2 H2 b = b.
3/5
4/5
0
d) Obtener la solucion en mnimos cuadrados del sistema Ax = b, utilizando
el metodo de Householder y determinar la norma del error. Operando
con el ordenador, puede obtenerse una pseudosolucion distinta de la
132
1 1
2
x
A= 0
3 3 , x = y
0 4
4
z
0
b = 1 .
2
1
0
0
Ejercicios propuestos
133
Ejercicio 2.28
a) En lo que sigue, Hv denota la transformacion de Householder asociada al
vector v. Sean x, y, v, z vectores no nulos, con Hv x = y y z v. Probar
que Hv v = v y Hv z = z. Determinar razonadamente todos los vectores
w tales que Hw x = y.
b) Se considera el sistema de ecuaciones dado por
12
1
0
x
2
2
1 y = 1
1
1
0 1
z
1
b.1) Estudiar el condicionamiento del sistema, utilizando la norma 1.
Sol : 1 (A) = 6.
b.2) Resolver el sistema por medio de transformaciones de Householder.
Sol : x = 2, y = 1, z = 1.
b.3) Desde un punto de vista numerico, sera razonable resolver el sistema escalonando por Gauss? Razonar la respuesta.
Sol : No.
4 1 4a
c) Demostrar que el vector c = ( , , 1)T y la matriz
3 2
3
0 23
0
L1 = 0
0 12
0
0 2a
3
son los propios del metodo de Gauss-Seidel asociado al sistema
3
1
0
x
2
2
2
1 y = 1
0
a
0 1
z
1
d) Estudiar, en funcion del parametro a, el caracter diagonal dominante
por filas de la matriz de coeficientes del sistema dado, as como el radio
espectral de L1 . Para que valores de a es convergente el metodo anterior?
p
Sol : Diagonal dominante si |a| < 1, (L1 ) = a/3. Converge si |a| < 3.
134
5/3
4/3
Sol : x1 = 1/2 y x2 =
1 , kEk = 1/2. x3 es la solucion
1
1
exacta pero con aritmetica de ordenador es solo una buena aproximacion.
Ejercicio 2.29 Sea el sistema Ax = b, donde
!
1 1
2
x
A = 0 , x =
y b=
y
2 2
con
> 0 y , R
1/3
2/3 2/3
1/3
2/3 .
Sol : = 2, Hv = 2/3
2/3
1/3
2/3
b) Determinar el conjunto de vectores b para los que se verifica Hv b = b,
siendo Hv la matriz del apartado anterior. Encontrar, entre ellos, el que
tiene menor norma eucldea.
Sol : b = (2, , 2)T con R. (2, 1, 1)T .
c) Hallar la pseudosolucion del sistema Ax = bm , para = 2 y bm =
(2, 1, 1)T , utilizando transformaciones ortogonales para determinar el
error.
Sol : x = 5/6, y = 1/2, kEk = 1.
d) Probar que si una matriz real B tiene sus columnas linealmente independientes, entonces B T B es definida positiva.
e) Sea el sistema AT A x = AT bm , con y bm como en el apartado (c).
e.1) Sera posible utilizar una descomposicion AT A = GGT , con G
triangular inferior, para resolver el sistema?
Ejercicios propuestos
135
0 5
A = 3 0 ,
4 0
x=
x
y
b= 2
11
!
y
1
2
A= 4
8 ,
1 2
x=
x
y
!
y
1
b= 5
3
136
2
1
3
!
2
0
x
6
A=
y b=
x=
1 2
0
y
0
2
3
a) Encontrar una transformacion de Householder que transforme la primera
columna de la matriz A en el vector r = (3, 0, 0, 0)T .
2/3
2/3
1/3
0
2/ 1/ 2/
0
3
3
3
Sol : H =
.
1
2
2
/3 /3
/3
0
0
2/3
1/3
2/3
0
2/
0 1/3 2/3
3
Sol : Q =
.
2/3
1/3 2/3
0
0
2 1/3
Ejercicios propuestos
137
donde se encuentra la trayectoria de Marte alrededor del Sol. En las instrucciones indicaba introducir en el calculador magico una serie de coordenadas
locales (xi , yi , zi ), obtenidas con el telescopio marciano, y automaticamente
proporcionara los coeficientes , , . Entre otras cosas, sugera introducir
entre 5 y 10 coordenadas para que el ajuste obtenido en el sentido de
los mnimos cuadrados promediara cientficamente los errores de observacion...
a) Plantear el sistema superdeterminado, A= b, con =(, , )T , para
determinar el plano , cuando las coordenadas locales son
(2, 1, 0), (1, 2, 1), (0, 1, 2), (1, 0, 1), (0, 1, 0).
Puede ser nulo el error cometido para la pseudosolucion del sistema?
Sol : El error no puede ser nulo.
b) Poniendo A = [a1 a2 a3 ], donde ai indica la correspondiente columna de
A, razonar si es posible encontrar una transformacion de Householder
que transforme a1 en a2 . Hallar una matriz unitaria, Q, de modo que
Qa1 = a3 .
0
0
1
0
0
0 1
0
0
0
0
0
0
0
Sol : Q =
1
.
0
0
0 1
0
0
0
0
0
1
c) Obtener las ecuaciones normales, B= c, del sistema inicial A= b.
Esta la matriz B mal condicionada para la norma || || ?
Sol : (B) = 15/2. Bien condicionada.
d) Probar que los metodos iterados de Jacobi y Gauss-Seidel aplicados al
sistema B= c son convergentes. Cual de ellos converge mas rapido?
Sol : Gauss-Seidel mas rapido que Jacobi.
e) Partiendo de 0 = (0, 0, 0)T , obtener la aproximacion 3 , al aplicar 3
pasos del metodo de Gauss-Seidel al sistema B= c, operando con dos
cifras decimales. Cual es el error obtenido al tomar 3 como la solucion
en mnimos cuadrados de A= b?
Sol : 3 = (0.09, 0.55, 0.33)T con kE3 k ' 1.01.
138
1 5 5
hiperplano de la forma x + y + z = t
1
0
0
0
1
2
4
1
Ejercicios propuestos
139
=
=
=
=
=
3
2
2
1
2
3. Interpolaci
on
Definici
on 3.1 Interpolar una funci
on f (x) es encontrar otra funci
on g(x)
con determinadas caractersticas (un polinomio, un cociente de polinomios,
una funcion trigonometrica, etc.) tal que g(xi ) = f (xi ) en un conjunto de
puntos S = {x0 , x1 , . . . , xn } con x0 < x1 < < xn que recibe el nombre de
soporte.
La funcion g(x) recibe el nombre de funci
on de interpolaci
on de la funci
on
f (x) en el soporte {x0 , x1 , . . . , xn }.
Diremos que el soporte es regular si la diferencia entre dos puntos consecutivos
del soporte es siempre la misma, es decir, si xi xi1 es constante cualquiera
que sea i = 1, 2, . . . , n.
La finalidad la interpolacion es la de aproximar la funcion f (x) en un punto
x 6 S de tal forma que se pueda decir que f (x) ' g(x) una vez encontrada la
funcion g(x).
Si x [x0 , xn ] se dice que estamos interpolando.
Si x 6 [x0 , xn ] se dice que estamos extrapolando.
Ejemplo 3.1 Supongamos conocidos los valores de una determinada funcion
f (x) en el soporte {0, 1, 2}, es decir, se dispone de la tabla
0
x
f (x) 1
1
3
2
7
c=1
= a = b = c = 1
a+ b+c=3
4a + 2b + c = 7
141
142
Interpolacion
3.1
Interpolaci
on polinomial
1 x0
1 x1
.. ..
. .
1 xn
xn0
a0
xn1 a1
.
..
. =
. ..
..
xnn
an
f0
f1
..
.
fn
Interpolacion polinomial
143
n]
Teorema 3.2 [Error de interpolacio
Sea P (x) el polinomio de interpolaci
on de una funci
on f (x) en el soporte
{x0 , x1 , . . . , xn }.
Si f (x) es una funcion n + 1 veces derivable, con f (n + 1 (x) continua, y x un
n
umero real cualquiera, el error que se comete al aproximar f (x) por P (x)
viene dado por
(x) = |f (x) P (x)| =
|f (n + 1 (c)|
|x x0 | |x xn |
(n + 1)!
z(xi )
=0
z(x)
z(x)
=0
z(x)
Por tanto, la funcion g(x) se anula en x, x0 , . . . , xn+1 , es decir, en n + 2 puntos. Si ordenamos estos puntos y los denotamos por t1 , t2 , . . . , tn+2 , en cada
intervalo (ti , ti+1 ) el teorema de Rolle nos garantiza la existencia de un punto
ci tal que g 0 (xi ) = 0 (Figura 3.1)
t1
c1
t2
c2
t3
c3
tn+2
cn+1
144
Interpolacion
d(x) (n + 1
z
(t), podemos particularizar en t = c y
z(x)
obtenemos
0 = d(n + 1 (c)
d(x)
d(x) (n + 1
z
(c) = f (n + 1 (c) P (n + 1 (c)
(n + 1)!
z(x)
z(x)
por lo que
d(x)
(n + 1)! = f (n + 1 (c)
z(x)
o lo que es lo mismo,
f (x) P (x) = d(x) =
f (n + 1 (c)
f (n + 1 (c)
z(x) =
(x x0 ) (x xn ) =
(n + 1)!
(n + 1)!
|f (n + 1 (c)|
|x x0 | |x xn |
(n + 1)!
x I
se tiene que
(x)
k
|x x0 | |x x1 | |x xn |
(n + 1)!
1
|1 0| |1 /4| |1 /2| ' 4.08 102 < 101
3!
es decir, hemos obtenido el valor de sen 1 con una cifra decimal exacta.
Interpolacion polinomial
145
Proposici
on 3.3 Sean P (x), Q(x) y R(x) los polinomios de interpolaci
on de
la funcion f (x) en los soportes {x0 , . . . , xn }, {x0 , . . . , xn1 } y {x1 , . . . , xn }
respectivamente. Se verifica entonces que
x x0
P (x) = Q(x) +
R(x) Q(x)
xn x0
Demostraci
on. Consideremos el polinomio
x x0
T (x) = Q(x) +
R(x) Q(x) .
xn x0
Es obvio que como los grados de Q(x) y R(x) no son superiores a n 1, T (x)
no puede tener grado superior a n.
T (x0 ) = Q(x0 ) = f0
Si xi {x1 , x2 , . . . , xn1 }
xi x0
xi x0
R(xi ) Q(xi ) = fi +
(fi fi ) = fi .
T (xi ) = Q(xi ) +
xn x0
xn x0
xn x0
R(xn ) Q(xn ) = R(xn ) = fn .
T (xn ) = Q(xn ) +
xn x0
Por lo que T (x) es el polinomio, de grado no superior a n, que interpola a f (x)
en el soporte {x0 , . . . , xn }, es decir, T (x) = P (x).
3.1.1
Interpolaci
on de Lagrange
Definici
on 3.2 Polinomios de Lagrange
Dado un soporte {x0 , x1 , . . . , xn }, se denominan polinomios de Lagrange a los
polinomios definidos por
n
Y
x xj
Li (x) =
xi xj
j =0
j 6= i
i = 0, 1, 2, . . . , n
146
Interpolacion
z(x)
(x xi )z 0 (xi )
(3.1)
0 si i 6= j
1 si i = j
Interpolacion polinomial
147
(x 2)(x 3)(x 4)
1
= (x3 9x2 + 26x 24)
(1 2)(1 3)(1 4)
6
L1 (x) =
(x 1)(x 3)(x 4)
1
= (x3 8x2 + 19x 12)
(2 1)(2 3)(2 4)
2
L2 (x) =
(x 1)(x 2)(x 4)
1
= (x3 7x2 + 14x 8)
(3 1)(3 2)(3 4)
2
L3 (x) =
(x 1)(x 2)(x 3)
1
= (x3 6x2 + 11x 6)
(4 1)(4 2)(4 3)
6
148
3.1.2
Interpolacion
Interpolaci
on de Newton
Proposici
on 3.5 El polinomio de interpolaci
on de una funci
on f (x) en el
soporte {x0 , x1 , . . . , xn } es de la forma
P (x) = c0 + c1 (x x0 )+
+ c2 (x x0 )(x x1 )+
+ c3 (x x0 )(x x1 )(x x2 )+
..
.
+ cn (x x0 )(x x1 )(x x2 ) (x xn1 )
donde los coeficientes c0 , c1 , . . . , cn dependen de x0 , . . . , xn y los valores que
toma la funcion en dichos puntos f0 = f (x0 ), . . . , fn = f (xn ).
Demostraci
on. Como el polinomio P (x) interpola a la funcion f (x) en el
soporte, se tiene que
P (x0 ) = f0 = c0 = f0
P (x1 ) = f1 = f1 = f0 + c1 (x1 x0 ) = c1 =
P (x2 ) = f2 = f2 = f0 +
f1 f0
x1 x0
f1 f0
(x2 x0 ) + c2 (x2 x0 )(x2 x1 ) =
x1 x0
Interpolacion polinomial
149
obtenemos:
f [x0 , x1 ] =
f1 f0
10
1
f [x1 ] f [x0 ]
=
=
=
x1 x0
x1 x0
31
2
f [x1 , x2 ] =
f [x2 ] f [x1 ]
f2 f1
1 1
2
=
=
=
x2 x1
x2 x1
43
1
f [x2 , x3 ] =
f [x3 ] f [x2 ]
f3 f2
2 (1)
3
=
=
=
x3 x2
x3 x2
54
1
f [x0 , x1 , x2 ] =
f [x1 , x2 ] f [x0 , x1 ]
2 1/2
5
=
=
x2 x0
41
6
f [x1 , x2 , x3 ] =
f [x2 , x3 ] f [x1 , x2 ]
3 (2)
5
=
=
x3 x1
53
2
f [x0 , x1 , x2 , x3 ] =
5/2 ( 5/6)
f [x1 , x2 , x3 ] f [x0 , x1 , x2 ]
5
=
=
x3 x0
51
6
150
Interpolacion
0
1/2
5/6
5/6
2/1
4
5/2
3/1
0
1/2
5/6
5/6
2/1
4
5/6
3/1
5/6
2
1/2
5/18
5/2
Interpolacion polinomial
151
5
(x 1)(x 3)(x 4)(x 5) =
18
1
(5x4 80x3 + 430x2 889x + 534)
18
Sean Pn (x) y Pn1 (x) los polinomios de interpolacion de la funcion f (x) en los
soportes {x0 , x1 , . . . , xn } y {x0 , x1 , . . . , xn1 } respectivamente.
Sabemos que
Pn (x) = Pn1 (x) + f [x0 , . . . , xn ](x x0 ) (x xn1 )
y ademas (vease el Teorema 3.2)
f (x) Pn1 (x) =
f (n ()
(x x0 ) (x xn1 )
n!
f (n ()
(xn x0 ) (xn xn1 )
n!
f (n ()
(xn x0 ) (xn xn1 ).
n!
f (n (c)
n!
Definici
on 3.3 [Diferencias finitas]
Dados y0 , y1 , . . . , yn , se definen las diferencias finitas k yi como
yi = yi+1 yi
k yi = (k1 yi )
152
Interpolacion
y1 = y2 y1
2 y1 = y2 y1
y2 = y3 y2
f [x0 , . . . , xk ] =
Demostraci
on. Haremos induccion en k.
Para k = 1 sabemos que f [x0 , x1 ] =
f0
f1 f0
=
.
x1 x0
h 1!
k
k
f [x1 , . . . , xk+1 ] f [x0 , . . . , xk ]
f [x0 , . . . , xk+1 ] =
= h k! h k! =
xk+1 x0
kh
=
k f1 k f0
k+1 f0
=
hk k! k h
hk+1 (k + 1)!
x x0
h
x x0
h
2 f0
+
2!
x x0
h
x xn1
h
x x1
h
+
Interpolacion polinomial
153
Pn (x) = f0 + f0
n f0
+
n!
x x0
h
x x0
h
Pn (x) = f0 +
2 f0
+
2!
x x0
h
x x0
1 +
h
x x0
(n 1)
h
x x0
, se tiene que
h
2 f0
n f0
f0
t+
t(t 1) + +
t(t 1) (t (n 1))
1!
2!
n!
Es decir:
!
t
f0 +
1
Pn (x) = f0 +
!
t
2 f0 + +
2
!
t
n f0
n
Ejemplo 3.6 Sea f (x) una funcion que toma los valores {3, 45, 175, 441} en
el soporte regular {2, 4, 6, 8}.
Las diferencias finitas vienen dadas por
fi fi 2 fi 3 fi
3
42
88
48
45 130 136
175 266
441
por lo que
t
P3 (x) = 3 + 42
1
t
+ 88
2
t
+ 48
3
!
=
= 3 + 42 t + 44 t (t 1) + 8 t (t 1) (t 2) con t =
x2
2
154
Interpolacion
fi 2 fi 3 fi 4 fi
42
88
48
24
130 136
72
266 208
474
!
t
y obtenemos que P4 (x) = P3 (x)+
4 f0 = P3 (x)+t(t1)(t2)(t3) =
4
1
(x 2)(x 4)(x 6)(x 8) =
16
1
1
31
P4 (x) = x4 x3 + x2 26x + 25
16
4
4
P4 (x) = x3 x2 x + 1 +
Cu
ando debemos realizar la interpolaci
on de Lagrange y cu
ando la de Newton?
Si queremos calcular el polinomio de interpolacion de varias funciones
en un mismo soporte, utilizaremos los polinomios de Lagrange, ya que
no dependen de la funcion a interpolar sino solo del soporte utilizado.
Si lo que queremos es interpolar una funcion en un determinado soporte
e ir a
nadiendo puntos a este u
ltimo, obviamente utilizaremos la interpolacion de Newton, donde distinguimos dos casos:
Si el soporte (o posteriores soportes ampliados) no es regular, utilizaremos el metodo de las diferencias divididas.
Si el soporte (y posteriores soportes ampliados) es regular, utilizaremos el metodo de las diferencias finitas.
Hay que destacar que cuando hablamos de a
nadir puntos al soporte, hablamos
de pasar, por ejemplo, del soporte regular {0, 2, 4, 6} al {0, 2, 4, 6, 8, 10} es
decir, de pasar del soporte
{x0 , x1 , . . . , xn }
al
Interpolacion polinomial
155
Otro problema diferente es el siguiente: supongamos que se quiere aproximar una funcion f (x) en el intervalo [a, b] y para ello construimos un soporte
{x0 , x1 , . . . , xn } con x0 = a y xn = b.
Si posteriormente pretendemos afinar la aproximacion a
nadiendo mayor cantidad de puntos al soporte pero con la condicion de que el primero siga siendo a
y el u
ltimo b, el proceso, tanto si lo hemos realizado mediante la interpolacion
de Lagrange o la de Newton, hay que realizarlo de nuevo desde el principio.
Hasta que punto es bueno afinar un soporte?
meno de Runge
Feno
Dada una funcion continua en [a, b], podra pensarse que la sucesion Pn (x) con
n N de polinomios de interpolacion, obtenidos al aumentar el n
umero de
puntos del soporte, converge a la funcion f (x) es decir, podramos pensar que
lim |f (x) Pn (x)| = 0
x [a, b]
P2 (x) = 1
1 2
x
17
1
(85 21x2 + x4 )
85
que podemos ver representada junto a la funcion f (x) en la Figura 3.2 (Dcha.).
156
Interpolacion
1
(1700 1124x2 + 304x4 31x6 + x8 )
1700
Interpolacion polinomial
157
Figura 3.4: Las funciones {log(1 + x), P4 (x)} y {log(1 + x), P8 (x)}
Figura 3.5: Las funciones {log(1 + x), P16 (x)} y {log(1 + x), P32 (x)}
Sin embargo, si volvemos a utilizar los puntos medios para obtener un soporte
de 33 puntos, podemos ver en la Figura 3.5 (Dcha.) que el fenomeno de Runge
junto a la acumulacion de errores hace que el polinomio obtenido deje de ser
una buena aproximacion de la funcion
3.1.3
Interpolaci
on de Hermite
)
en los puntos del soporte
{x0 , x1 , . . . , xn }
158
Interpolacion
P 0 (x0 ) = f00
P 0 (x1 ) = f10
..
.
P (xn ) = fn
P 0 (xn ) = fn0
n h
X
i
ak + bk (x xk ) L2k (x)
k=0
)
k = 0, 1, . . . , n
Interpolacion polinomial
159
n de Hermite]
Teorema 3.10 [Error de interpolacio
Sea f (x) una funcion 2n + 2 veces derivable con derivada de orden 2n + 2
continua y sea P2n+1 el polinomio de Hermite que interpola a f (x) en el soporte
{x0 , x1 , . . . , xn }.
Existe un punto c del intervalo que determinan los puntos x, x0 , . . . , xn en el
que se verifica que
f (x) P2n+1 (x) =
f (2n + 2 (c)
(x x0 )2 (x xn )2
(2n + 2)!
Demostraci
on. Sean d(x) = f (x) P2n+1 (x) y z(x) = (x x0 ) (x xn ) y
considerese la funcion
d(x)
g(t) = d(t) 2 z 2 (t)
z (x)
La demostracion es similar a la del Teorema 3.2.
Ejemplo 3.10 Si aplicamos este metodo a la funcion del Ejercicio 3.8, en el
soporte {4, 2, 0, 2, 4} obtenemos el polinomio de grado 8 (en realidad se
busca de grado 9 pero al ser una funcion par, el termino de grado 9 se anula)
P8 (x) =
1
(7225 3129x2 + 569x4 41x6 + x8 )
7225
1
(2890000 2558224x2 + 1613584x4 626688x6 + 144408x8
2890000
19527x10 + 1507x12 61x14 + x16 )
160
Interpolacion
Si comparamos con los resultados obtenidos en el Ejercicio 3.8, podemos observar la mejora que produce la imposicion de que coincidan no solo los valores
de la funcion, sino que tambien lo hagan los de su derivada, en los puntos del
soporte. Sin embargo, sigue manifestandose el fenomeno de Runge, es decir,
se mejora el resultado en la parte central del intervalo, pero en los extremos,
la diferencia entre el polinomio interpolador y la funcion es considerable.
Es posible interpolar una funci
on sin que aparezca el fen
omeno de Runge?
La manera de evitarlo es hacer una interpolacion polinomial a trozos, es decir,
lo que se conoce como una interpolaci
on por splines.
3.2
Interpolaci
on por splines
3.2.1
161
Splines c
ubicos
i = 1, 2, . . . , n 1
(3.2)
00
S|
(xi )
[ xi ,xi+1 ]
i = 0, 1, . . . , n
162
Interpolacion
00
00
S
(a) = S
(b)
i = 1, 2, . . . , n
i = 0, 1, . . . , n
00
S|
[x ,x
i
i+1 ]
i+1
(x) = Mi
xi+1 x
x xi
+ Mi+1
.
hi+1
hi+1
i+1
(x) =
]
163
S (xi+1 ) = yi+1
obtenemos
Mi 2
Mi 2
hi+i + Bi = yi = Bi = yi
h
6
6 i+1
Mi+1 2
yi+1 yi hi+1
hi+i + Ai hi+1 + Bi = yi+1 = Ai =
(Mi+1 Mi ).
6
hi+1
6
Podemos, por tanto, determinar los valores de las constantes Ai y Bi , que
determinan el valor de S (x) en el intervalo [xi , xi+1 ], en funcion de los momentos.
El problema se reduce, por tanto, a calcular los momentos para cada uno de los
intervalos, para lo que utilizaremos la u
nica condicion de (3.2) que no hemos
utilizado:
0
S|
[x
i1 ,xi ]
0
(xi ) = S|
[x ,x
i
i+1 ]
(xi ).
yi+1 yi yi yi1
hi+1
hi
h2
h2 + h3
h2
h1 + h2
2
..
h3
h2 + h3
..
.
...
..
...
hn1
hn1 + hn
hn1
hn2 hn1
2
M1
M
2
.
.
.
..
.
M
n1
164
Interpolacion
y2 y1 y1 y0
6
h1 + h2 h2
h1
y3 y2 y2 y1
6
h2 + h3
h3
h2
..
.
..
.
6
yn yn1 yn1 yn2
hn1 + hn
hn
hn1
Este sistema puede resolverse por cualquiera de los metodos iterados estudiados en el Captulo 2 ya que, al ser la matriz del sistema de diagonal dominante,
todos ellos son convergentes.
Ejemplo 3.11 Si aplicamos le interpolacion por splines c
ubicos a la funcion
del Ejemplo 3.8
f (x) =
1
1 + x2
en la particion
= {4, 3, 2, 1, 0, 1, 2, 3, 4}
3.3
Ejercicios resueltos
Ejercicios resueltos
165
n:
Solucio
f (x) = ln x
1
f 0 (x) =
x
f (1) = 0
f (2) = ln 2
f 0 (1) = 1
f 0 (2) = 0.5
x2
=2x
12
L1 (x) =
x1
=x1
21
ak = f (xk )
i
P2n+1 (x) =
ak +bk (xxk ) L2k (x) con
k=0
bk = f 0 (xk ) 2f (xk )L0k (x k)
h
i
h
i
Para n = 1 se tiene: P3 (x) = a0 + b0 (x 1) L20 (x) + a1 + b1 (x 2) L21 (x)
con
n h
X
a0 = f (1) = 0
a1 = f (2) = ln 2
de donde
h
i
P3 (x) = (x 1)L20 (x) + ln 2 + (0.5 2 ln 2)(x 2) L21 (x)
y sustituyendo los valores de L0 (x) y L1 (x) obtenemos
h
i
P3 (x) = (x 1)(2 x)2 + ln 2 + (0.5 2 ln 2)(x 2) (x 1)2
Para x = 10 5
h
i
P3 (1.5) = 0.5 0.52 + ln 2 + (0.5 2 ln 2)(0.5) 0.52 ' 0.409073590
El error viene dado por:
|f (v (x)|
|f (v (x)|
= (x 1)2 (x 2)2 max
=
x[1,2]
x[1,2] (2n + 2)!
4!
6 (x 1)2 (x 2)2
(x 1)2 (x 2)2
=
max =
x[1,2] x4
24
4
0.52 (0.52 )
(1.5)
= 0.015625
4
Es decir:
ln 1.5 = 0.409073590
con un error
0.015625.
166
Interpolacion
a0 = 5
P3 (1) =
a3 + a2 + a1 + a0 = 3
1 0
1 1
1 2
1 3
0 0
1 1
4 8
9 27
a0
a1
a2
a3
5
3
1
13
a1 = 3,
a2 = 2
a3 = 1
1 3 5 2
x x + 3x
2
2
1
3
L2 (x) = x3 + 2x2 x
2
2
L3 (x) =
1 3 1 2 1
x x + x
6
2
3
Ejercicios resueltos
167
-5
2
1
4
1
4
12
3
13
!
t
f (x0 ) +
0
!
t
f (x0 ) +
1
!
t
2 f (x0 ) +
2
!
t
3 f (x0 )
3
168
Interpolacion
x x0
x0
=
= x, por lo que:
h
1
!
!
!
!
x
x
x
x
P3 (x) = 5
+2
+2
+6
=
0
1
2
3
donde t =
= 5 + 2x + 2
x(x 1)
x(x 1)(x 2)
+6
=
2!
3!
3.4
Ejercicios propuestos
n=2
n=3
1 3
1
(x 3x + 2) (x3 6x2 + 11x 6)
2
6
L1 (x)
x2 + 2x
1 3
(x 5x2 + 6x)
2
L2 (x)
1 2
(x x)
2
1
(x3 4x2 + 3x)
2
L3 (x)
1 3
(x 3x2 + 2x)
6
e
Sol : P1 (x) = (e 1)x + 1 con x(x 1). e ' 1.85914 con 0.34.
2
Ejercicios propuestos
169
3e
< 0.175.
27
b) Calcular P (0.01) y compararlo con el valor dado por la calculadora para
e0.01 .
Sol : P2 (0.01) ' 1.01181, e0.01 ' 1.01005, |P2 (0.01) e0.01 | = 0.00176.
Ejercicio 3.9 Dada la tabla
x
y
0
1
1
6
2 3
31 98
se pide:
4. Integraci
on num
erica
Se pretende,
Z b en este tema, dar una aproximacion numerica del valor de una
integral
f (x)dx en los distintos problemas que se presentan en la practica,
a
como son:
Conocida una primitiva F (x) de la funcion f (x) sabemos que
Z b
f (x)dx = F (b) F (a)
a
h
i2
1
dx = log x = log 2 log 1 = log 2
x
1
Z
en donde habra que evaluar
(x)dx.
1
171
172
Integracion numerica
4.1
F
ormulas de cuadratura
Pn (x) =
a
n Z
X
i=0
yi Li (x)dx =
n
X
i=0
Rb
a
Z
yi
Li (x)dx =
a
n
X
ai y i
i=0
i=1
Por tanto:
P (x) = 1 = b a = a0 + a1 + + an
b2 a2
P (x) = x =
= a0 x0 + a1 x1 + + an xn
2
.......................................................
.......................................................
bn+1 an+1
P (x) = xn =
= a0 xn0 + a1 xn1 + + an xnn
n+1
(4.1)
Formulas de cuadratura
173
1
a0
x n a1
.
..
. =
. ..
..
xnn
an
1 1
x0 x1
..
..
.
.
n
x0 xn1
ba
b 2 a2
2
..
.
n+1
a
bn+1
n+1
admite solucion u
nica ya que el determinante de su matriz es un Vandermonde
y, por tanto, no nulo.
Una vez calculados los coeficientes ai se obtiene una formula de aproximacion
que solo dependera del soporte.
Para cada soporte, las formulas reciben el nombre de f
ormulas de cuadratura.
Ejemplo 4.1 Vamos a integrar una funcion f (x) en [0, 1] considerando los
soportes:
S1 = {0, 1/3, 1/2}
y
S2 = { 1/4, 1/2, 3/4}.
a) En el soporte S1 = {0, 1/3, 1/2}
1
1
1
a2 =
2
2
1
1
a2 =
4
3
cuya solucion es
a0 =
1
2
a1 =
3
2
a2 = 2
luego
Z
0
1
3
f (x)dx ' f (0) f ( 1/3) + 2f ( 1/2)
2
2
174
Integracion numerica
1
3
1
1
b0 + b1 + b2 =
4
2
4
2
P (x) = x2 =
1
1
9
1
b0 + b1 + b2 =
16
4
16
3
cuya solucion es
b0 =
2
3
b1 =
1
3
b2 =
2
3
luego
Z
0
4.2
2
1
2
f (x)dx ' f ( 1/4) f ( 1/2) + f ( 3/4)
3
3
3
F
ormulas de Newton-C
otes
x1 = a + h
xi = a + ih
xn = a + nh = b
Formulas de Newton-Cotes
175
(x x0 )(x x1 ) (x xn )
=
(x xi )(xi x0 ) (xi xi1 )(xi xin1 ) (xi xn )
(x a)(x a h) (x a nh)
=
(x a ih) ih (i 1)h h (h) (2h) ((n i)h)
(x a)(x a h) (x a nh)
=
(x a ih) i! (n i)! hn1 (1)ni
x a x a
x a
1
n
h
h
h
=h
=
(x a ih) i! (n 1)! (1)ni
x a x a
=
xh a
x a
1
n
h
h
i i! (n 1)! (1)ni
h
Por lo que haciendo t =
xa
se tiene que
h
Li (x) =
t(t 1) (t n)
(t i) i! (n i)! (1)ni
Por tanto:
Z
ai =
Z
Li (x)dx =
(1)ni h
=
i! (n i)!
Z
0
t(t 1) (t n)
hdt =
(t i) i! (n i)! (1)ni
t(t 1) (t n)
dt =
ti
ni
ai = h(1)
n
i
n!
Z
0
z(t)
dt
ti
176
Integracion numerica
Demostraci
on.
n
nk
!
Z
z(t)
dt
n!
0 t (n k)
Haciendo t n = u = dt = du se tiene que
k
ank = h(1)
k+1
ank = h(1)
n!
n
nk
k+1+n+1
= h(1)
n
k
= h(1)
nk
Z
0
u(u 1) (u n)
du =
uk
!
Z
(1)2k n!
n
k
(u + n)(u + n 1) (u)
du =
u + k
n!
n+k
= h(1)
n
nk
u(u 1) (u n)
du =
uk
n!
Z
0
z(u)
du = ak
uk
Teniendo en cuanta la Proposicion 4.1, solo hay que calcular la mitad de los
coeficientes.
n]
Teorema 4.2 [Error de aproximacio
Al aplicar la formula de Newton-C
otes para un entero n, el error que se comete
viene dado por:
Si n es par:
n+3 (n + 2 Z
h f
(c)
n =
(n + 2)!
t t(t 1) (t n)dt
Si n es impar:
n+2 (n + 1 Z n
h f
(c)
n =
(t 1) (t n)dt
(n + 1)!
0
Formulas de Newton-Cotes
177
4.2.1
F
ormula del trapecio
ba
2
f (a) + f (b)
ba
ba
f (a) +
f (b) = (b a)
2
2
2
El metodo del trapecio nos aproxima la integral por el area de la region plana
limitada por las rectas x = a, x = b, y = 0 y la recta que pasa por los puntos
(a, f (a)) y (b, f (b)), es decir, el area de un trapecio (ver Figura 4.1).
f (x)
f (b)
f (a)
!
!
!!
!
!
!!
!
!!
(b a)3 |f 00 (c)|
(b a)3
max |f 00 (x)|
12
12 x[a,b]
178
Integracion numerica
obtenemos:
Z
ln x dx ' 1
1
ln 2 + ln 1
ln 2
=
' 0.34657359027997
2
2
max |f (x)| =
max 2 =
1=
= 0.08333333333333
12 x[1,2]
12 x[1,2] x
12
12
4.2.2
F
ormula de Simpson
a+b
Para el caso n = 2 tenemos que x0 = a, x1 =
y x2 = b.
2
!
n
i2 b a
0 Z 2 t(t 1)(t 2)
b a h t3
t2
n0
a0 = h(1)
dt =
3 + 2t =
n!
t0
4
3
2
6
0
0
ba
a2 = a0 =
6
2(b a)
ba
Dado que a0 + a1 + a2 = b a, se tiene que a1 = b a 2
=
.
6
3
Se tiene, por tanto, que
Z b
ba
2(b a) a + b
ba
f (x)dx '
f (a) +
f(
)+
f (b)
6
3
2
6
a
o, lo que es lo mismo:
Z b
i
b ah
a+b
f (x)dx '
f (a) + 4f
+ f (b)
6
2
a
El error cometido en la aproximacion numerica de la integral vendra dado
(vease el Teorema 4.2) por
5
ba
|f (v (c)|
(b a)5 (v
(b a)5
2
=
=
|f (c)|
max |f (v (x)|
90
2880
2880 x[a,b]
Formulas compuestas
179
Ejemplo 4.3 Para calcular la integral del Ejemplo 4.2 por el metodo de Simpson obtenemos
Z 2
1
3
1
ln x dx ' (ln 1 + 4 ln + ln 2) = (4 ln 3 3 ln 2) ' 0.38583460216543
6
2
6
1
y el error vendra dado por
6
1
1
(b a)5
(v
=
max |f (x)| =
max 4 =
6 = 0.00208333333333
2880 x[a,b]
2880 x[1,2] x
2880
4.3
F
ormulas compuestas
4.3.1
i
x2 x0 h
f (x0 ) + 4f (x1 ) + f (x2 ) +
6
i
x4 x2 h
+
f (x2 ) + 4f (x3 ) + f (x4 ) + +
6
i
xn xn2 h
+
f (xn2 ) + 4f (xn1 ) + f (xn ) =
6
hh
=
f (x0 ) + 4f (x1 ) + 2f (x2 ) + 4f (x3 ) + 2f (4 ) + +
3
i
+ 2f (xn2 ) + 4f (xn1 ) + f (xn ) =
h
f (x0 ) + f (xn ) + 2 f (x2 ) + + f (xn2 ) +
=
3
+ 4 f (x3 ) + + f (xn1 )
f (x)dx '
a
Llamando
E = f (x0 ) + f (xn )
P =
f (xi )
i par
i 6= 0
i 6= n
se tiene que
Z
f (x)dx '
a
h
(E + 2P + 4I)
3
I=
X
impar
f (xi )
180
Integracion numerica
(b a)5
max |f (v (x)|
180 n4 x[a,b]
Ejemplo 4.4 Volvamos a calcular la integral del Ejemplo 4.2 por la formula
compuesta de Simpson para n = 10.
E = ln 1 + ln 2 = ln 2 ' 0.69314718055995
P = ln 1.2 + ln 1.4 + ln 1.6 + ln 1.8 ' 1.57658408756302
I = ln 1.1 + ln 1.3 + ln 1.5 + ln 1.7 + ln 1.9 ' 1.93562168961455
por lo que
Z 2
1
ln x dx ' (0.69314718055995+21.57658408756302+41.93562168961455)
30
1
Z 2
ln x dx ' 0.38629340380481
1
max |f (x)| =
max 4 =
6 3.3334 106
4
180 n x[a,b]
1800000 x[1,2] x
1800000
4.3.2
h
f (x0 ) + f (x1 ) + f (x1 ) + f (x2 ) + + f (xn1 + f (xn )
f (x)dx '
2
ba
f (x)dx '
f (x0 ) + f (xn ) + 2 f (x1 ) + f (x2 ) + + f (xn1 )
2n
h3 00
h3
|f (c1 ) + f 00 (c2 ) + + f 00 (cn )|
n max |f 00 (x)| =
x[a,b]
12
12
Ejercicios resueltos
181
(b a)3
max |f 00 (x)|
2
12 n x[a,b]
Ejemplo 4.5 Calculemos de nuevo la integral del Ejemplo 4.2 por la formula
compuesta de los trapecios para n = 5.
Z 2
1
ln x dx '
[(ln 1 + ln 2) + 2(ln 1.2 + ln 1.4 + ln 1.6 + ln 1.8)]
10
1
1
3.84631535568599 = 0.38463153556860
10
con una cota de error de
1
1
(b a)3
00
= 1 0.0034
m
a
x
|f
(x)|
=
m
a
x
2
12 n x[a,b]
300 x[1,2] x2 300
'
4.4
Ejercicios resueltos
k=0
n h
X
k=0
(1)n
h
n!
Z
0
n
k
z(t)
dt =
n! 0 t k
Z
n
z(t) i
(1)n n h X z(t) i
dt = h
dt.
tk
n!
tk
0
k=0
Z
182
Integracion numerica
y, en consecuencia,
n
X
(1)k ak
k=0
n
k
(1)n
=h
n!
z 0 (t)dt = h
in
i
(1)n h
(1)n h
z(t) = h
z(n) z(0) .
n!
n!
0
n
X
(1)k ak
k=0
Z
Ejercicio 4.2 Dada la integral
0
n
k
= 0.
1 x2
dx se pide:
1 + x2
a) Calcularla exactamente.
b) Calcularla, aproximadamente, por la formula basica de Simpson.
c) Calcularla por la formula compuesta de Simpson de 11 sumandos.
d) Aplicar la siguiente formula:
Z 1
p i
p
1h
f (x) dx ' 5f ( 3/5) + 8f (0) + 5f ( 3/5)
9
1
comprobando que integra, exactamente, polinomios de grado 5.
n:
Solucio
Z 1
Z 1
h
i1
1 x2
2
a)
dx =
1+
dx = x + 2 arctg x = 1 +
2
2
1+x
2
0
0 1+x
0
Z 1
1 x2
dx = 1 + ' 2.57079632679490
2
2
0 1+x
b) La formula basica de Simpson (n = 2) establece que:
Z 1
i
hh
10
1
f (x) dx '
f (0) + 4f (0.5) + f (1)
donde h =
= .
3
2
2
0
por lo que
Z 1
0
1 x2
1
dx ' (1 + 4 0.6 + 0) ' 0.56666666666667
2
1+x
6
(b a)5
1
1
max |f (v (x)| =
48 =
0.00416666666667
2880 x[a,b]
2880
240
Ejercicios resueltos
183
f (x) dx '
0
h
i
h
f (0) + f (1) + 4 f (0.1) + f (0.3) + f (0.5) + f (0.7) + f (0.9) +
3
h
i
+2 f (0.2) + f (0.4) + f (0.6) + f (0.8)
Z
0
1 x2
1
dx ' (1 + 11.44925864003328 + 4.67463056905495) =
2
1+x
30
Z
0
1 x2
dx ' 0.57079630696961
1 + x2
Con un error
(b a)5
1
(v
m
a
x
|f
(x)|
=
48 2.6667 105
180 n4 x[a,b]
1800000
p
p
1 3/5
1
f ( 3/5) = f ( 3/5) =
=
1 + 3/5
4
1 x2
1 1 1
1
1 21
7
dx
'
+
8
1
+
5
=
2
1+x
2 9
4
4
18 2
12
Z 1
1 x2
dx ' 0.58333333333333
2
0 1+x
Veamos. por u
ltimo, que la formula es exacta para polinomios de grado
no superior a cinco.
k+1 1
Z 1
k+1
si k es par,
x
1
(1)
k+1
xk dx =
=
=
k + 1 1
k+1
1
0
si k es impar.
184
Integracion numerica
Por tanto:
Z 1
1 dx = 2
1
x dx = 0
x2 dx =
x dx = 0
1
2
x dx =
5
1
4
2
3
x5 dx = 0
Ejercicios resueltos
185
Z 2
0 para k = 1, 2, . . .
Jk =
cos kx dx =
2 para k = 0
0
La formula de los trapecios es:
i
hh
f (0) + 2f (h) + 2f (2h) + + 2f ((n 1)h) + f (2)
Tn =
2
Pero al ser f (2) = f (0) podemos escribir:
n1
i
X
hh
Tn =
2f (0) + 2f (h) + + 2f ((n 1)h) = h
f (jh) =
2
j=0
n1
2 X 2j
Tn =
f(
)
n j=0
n
eik
2j
n
j=0
n1
X
ei
2jk
n
j=0
2k
cos 2k
=
1
n
2k
= 0, 2, 4, . . . k = 0, n, 2n, . . .
n
2k
sin n = 0
Por tanto, si 0 < k < n se tiene que:
n1
X
j=0
Si k = 0 es
n1
X
eik
2j
n
ik 2j
n
ei
2nk
n
i 2k
n
1
1
11
i 2k
n
j=0
= 0.
2n
= 2. Por tanto:
n
h
i
Tn (sin x) = Img Tn (eikx ) = 0 para k = 0, 1, 2, . . .
h
i 0 para k = 1, 2, . . . , n 1
Tn (cos x) = Re Tn (eikx ) =
2 para k = 0
que coinciden con los valores de las integrales.
186
4.5
Integracion numerica
Ejercicios propuestos
x+
2
2(1 c2 )
|x + 1||x c||x 1|
(x)
max |f 000 ()|
6
[1,1]
P2 (x) =
5x + 13
con c = 0.1 y comparar con el
2
Ejercicios propuestos
187
Z
i
1
1h
1
1
f
(x)
ln
x
dx
'
11f
(0)
+
19f
(
)
+
f
(
)
+
f
(1)
32
3
3
0
Sol :
Z 1
Z
b)
2
ex
dx
x
ex (4 x) dx :
m
n
2 3 4 5 6
2 2 4 8 12
188
Integracion numerica
1 4 13 2
x x + 3.
12
12
Bibliografa
[1] Ledanois, J.M., Lopez, A y Pimentel, J. Metodos Numericos Aplicados a
la Ingeniera. Ed. McGraw Hill.
[2] Burden, R. y Douglas Faires, J. Metodos Numericos (3 edici
on). Ed.
Thomson - Paraninfo.
[3] Demidovich, B.P. y Maron, I.A. C
alculo Numerico Fundamental. Ed.
VAAP. 1977.
[4] Froberg, C.E. Introducci
on al An
alisis Numerico. Ed. Vicens Vives. 1977.
[5] Kincaid, D. y Cheney, W. An
alisis Numerico. Ed. Addison-Wesley Iberoamericana. 1994.
[6] Mathews, J.H. y Fink, K.D. Metodos Numericos con MATLAB. (Tercera
edicion). Prentice Hall. 1999.
189