Documentos de Académico
Documentos de Profesional
Documentos de Cultura
. ..-.----
. ifR·, ,,
1 • 1
\• 1
1 :-
1
' ['.
.
' ).' '·'
. '\¡
1.• _ Kincaid\
l
[,1 'I . ,¡
numer1co
· ·. '. Cheneffl
>¡.1'
I .iu ;'
!'11··
• ¡,
1 '
=
Esta obra se diseñó para los estudiantes de ingeniería, ciencias y computación que cursan
el segundo año de la licenciatura.
'1 ,
.J
Se presentan algoritmos y métodos comúnmente utilizados en las ciencias de la compu-
1:
.f l.
il
. tación, con base en temas especiales del análisis numérico, como son la solución numérica
a ecuaciones diferenciales, álgebt:Í Íineal numérica y teoría de la aproximación. El enfoque
1
·\ � l1 �
',1
Las matemátjcas ·del. cálculo científico
. �
�
·.·
I
matemático del libro ofrece una amplia gama de teoremas, demostraciones e ideas .r/l I'
�\
interesantes que a su vez inspiran múchos procedimientos de computación y estimulantes ;:, ¡1
rnestionamientos de las ciencias de la computación.
g� .i!
11m' r,: l
David Kincaid Ward Cheney
Los problemas son de dos tipos: analíticos'y de computación, lo que permite al estudiante ; 1
familiarizarse con dos tipos de programación y le ayuda a tener una visión más profunda
de los algoritmos.
9 71\ ::i ,,
�\B '00
\lfJ. ·'..', '.')
\i 1' �.�l:\.i¡
I! OTRAS OBRAS DE INTERÉS PUBLICADAS POR
r/l
ADDISON-WESLEY IBEROAMERICANA:
j f
=
� Q.
/
ATKINSON y HARLEY: Introducción a los métodos numéricos con Pascal (64041)
(
GRIMALDI: Matemática discreta y combinatoria. Introduccióny aplicaciones (64406) f¡,.\ � ¡.al
l.• �
LANG: Introducción al análisis matemático (62907) �\
MEYER: Probabilidad y aplicaciones estadísticas, edición revisada (51877)
i
'
9
I¡ , -
11!l. ,; �
r ,r e.
i\,¡ �· .\,
� - t /l
1
\i
-
"""
�,
' ::? �\'.
':l
,, �
l o
l
'
',-------......1,' 1
\'
·I ¡:.
• ,. 1 I
/
1
.:1 1
1
\ v:-
.,/
\
1,
1\
9;000H
(
\'i: 1
)
1,,
'
•
TT
ADDISON
WESLEY
.,
9 ''78DZW601305
I
A
TT ADDISON-WESLEY IBEROAMERICANA ,.
Argentina • Brasil • Chile • Colombia • Ecuador • España
·,\, Estados Unidos • México • Perú • Puerto Rico � Venezuela ISBN D-201-60130-3 601SO • 'I
Versión en español de
Rafael Martínez Enríquez
y
Carlos Torres Alcaraz
Universidad Nacional Autónoma de México
Con la colaboración de
Hans Luis Fetter Nathanksy
Universidad Autónoma Metropolitana
Unidad lztapalapa, México
V
vi Prefacio Prefacio vii
las rutinas disponibles en las bibliotecas científicas. Dos ejemplos recomendables de Analysis, Computer Sciences Department, Mathematics Department,Texas Institute of
bibliotecas matemáticas de uso general son IMSL (1990] y NAG [1990]. Computational Mechanics y Computation Center ofThe University ofTexas en Austin.
Un elemento importante de este libro (y esencial en cuanto a sus propósitos peda Los editores y el equipo técnico de la Brooks/Cole Publishing Company nos han
gógicos) es la gran cantidad de problemas que se incluyen para que el estudiante los re apoyado durante el desarrollo de este proyecto. En particular expresamos nuestro reco
suelva. Los hay de dos tipos: problemas analíticos y problemas de computadora. Los nocimiento a la labor de Jeremy Hayhurst y de MarleneThom.
problemas de computadora se identifican mediante un superíndice "e" antes del número Agradeceremos cualquier comentario, sugerencia, pregunta, crítica o corrección
del problema, tal como se indica: c5_ En la mayor parte de los casos se necesita disponer que los lectores se tomen la molestia de hacemos llegar.
de una computadora que tenga al menos 32 bits de longitud de palabra. A su vez, los
problemas de computadora son de dos tipos: aquellos para los cuales los estudiantes David Kincaid
diseñan su propio código, y aquellos en los que se utiliza el software ya existente. Cre WardCheney
emos que ambos tipos de prácticas son necesarias. No siempre es sencillo utilizar el
software desarrollado por otra persona, aun si está suficientemente documentado, como
suele suceder en los casos de las bibliotecas mencionadas anteriormente. Por otra parte,
los estudiantes en general adquieren un mayor entendimiento de un algoritmo después
de codificarlo y probarlo por sí mismos, que cuando utilizan un paquete de software.
Al final del libro se ha incluido una sección con sugerencias y con algunos problemas
resueltos.
Puede llevarse a cabo un curso normal de un semestre apoyándose en las secciones
sin asterisco de los capítulos 1 a 4 y 6 a 8. Un curso de dos semestres puede abarcar
todas las secciones sin asterisco de los capítulos 1 a 9 y además agregar algunos temas de
interés. Debido a lo ambicioso que resulta el libro, algunas secciones requieren mayor
preparación por parte del lector. Dichas secciones en general están en la parte final de
los capítulos, de manera que el lector no se sienta presionado, indebidamente, desde el
principio. Tales secciones aparecen marcadas con un asterisco.
Agradecimiento. Nos complace expresar nuestro reconocimiento a todas las per
sonas que nos han ayudado en la preparación de este libro. El apoyo administrativo vino
de Sheri Brice, Margaret Combs, Jan Duffy, Katherine Mueller, y Jenny Tsao de Toe
University of Texas, en Austin. Muy en especial agradecemos a Margaret Combs, del
Departamento de Matemáticas, quien transcribió a TJ3X innumerables versiones de cada
sección y preparó las nuevas conforme eran requeridas como notas de clase a lo largo
de los años. Ningún problema de tipografía le resultó difícil mientras avanzaba en el
dominio del arcano arte de la disección y reacomodo de las macros de TJ3X, con el fin de
cumplir con tareas inusuales. Sobre este punto resulta apropiado expresar públicamente
nuestro agradecimiento a Donald Knuth por su excelente contribución a la comunidad
científica, la cual se concretó a través del sistema de tipografía TJ3X.
Debemos también dar las gracias, por su ayuda de carácter técnico o por haber leído
y comentado versiones previas del manuscrito, a las siguientes personas: Thomas A.
Atchison, Frederick J. Carter, Philip Crooke, J. D' Archangelo, J. R. Hubbard, Victoria
Hunter, Carole Kincaid, Patrick Lang, Tadeusz Liszka, Giles Wilson Maloof, A. K.
Rigler, Rio Hirowati Shariffudin, Laurette Tuckerman, Charles Votaw y A. J. Worsey.
Por otra parte, David Young siempre se mostró generoso con sugerencias y consejos.
También ayudaron ciertos estudiantes avanzados que participaban como asistentes de
nuestros cursos; en particular damos las gracias a David Bruce, Nai-ching Chen, Ashok
Hattangady, Ru Huang, Wayne Joubert, Irina Mukherjee, Bill Nanry,Tom Oppe, Marcos
Raydan, Malathi Ramdas, John Respess, Phien Tran, Linda Tweedy y Baba Vemuri.
Nuestro agradecimiento se extiende a las siguientes instituciones por los apoyos
de carácter técnico y por permitirnos el uso de sus instalaciones: Center for Numerical
ÍNDICE GENERAL
Capítulo l. PRELIMINARES MATEMÁTICOS 1
1.1 Conceptos básicos y teorema de Taylor 1
1.2 Órdenes de convergencia y conceptos básicos adicionales 9
*1.3 Ecuaciones en diferencias 20
Capítulo 2. ARITMÉTICA DE LA COMPUTADORA 29
2.1 Números de punto flotante y errores de redondeo 29
2.2 Errores absolutos y errores relativos; pérdida de dígitos significativos 42
2.3 Cálculos estables y cálculos inestables; condicionamiento 49
Capítulo 3. SOLUCIÓN DE ECUACIONES NO LINEALES 59
3.1 Método de la bisección 59
3.2 Método de Newton 65
3.3 Método de la secante 77
*3.4 Puntos fijos e iteración funcional 82
*3.5 Cálculo de ceros de polinomios 91
*3.6 Homotopía y métodos de continuación 111
Capítulo 4. RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES 119
4.1 Álgebra de matrices 120
4.2 La factorización LU y la factorización de Cholesk:y 129
4.3 Pivoteo y construcción de un algoritmo 143
4.4 Normas y análisis de errores 165
4.5 Series de Neumann y refinamiento iterativo 175
*4.6 Solución de ecuaciones con métodos iterativos 185
*4.7 Métodos del descenso más rápido y del gradiente conjugado 209
*4.8 Análisis de errores de redondeo en el método de Gauss 224
Capítulo 5. TEMÁS SELECTOS DEL ÁLGEBRA LINEAL NUMÉRICA 231
5.1 Problema de valores propios de una matriz: Método de la potencia 231
5.2 Teoremas de Schur y Gershgorin 242
*5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 250
*5.4 Descomposición en valores singulares y seudoinversas 264
*5.5 Algoritmo QR de Francis para el problema de valores propios 275
Capítulo 6. APROXIMACIÓN DE FUNCIONES 285
6,1 Interpolación polinomial 285
6.2 Diferencias divididas 303
6.3 Interpolación de Hermite 313
6.4 Interpolación por splines 323
*6.5 B-splines: Teoría básica 342
*6.6 B-splines: Aplicaciones 353
6.7 Series de Taylor 364
*6.8 Mejor aproximación: Teoría de mínimos cuadrados 369
*6.9 Mejor aproximación: Teoría de Chebyshev 381
*Las secciones marcadas con asterisco pueden onútirse si el instructor lo cree conveniente.
ix
x Índice general Capítulo 1
9.1 Ecuaciones parabólicas: Métodos explícitos 591 significa que a cada número a positivo le corresponde un número 8 también positivo tal
9.2 Ecuaciones parabólicas: Métodos implícitos 599 que IJ(x) -LI es menor que a, siempre que O< jx- el < 8. Si no hay un número L con
9.3 Problemas sin dependencia temporal: Métodos de diferencias finitas 606 esta propiedad, el límite de f en e no existe.
*9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 611 Por ejemplo, la ecuación
*9.5 Ecuaciones en derivadas parciales de primer orden; curvas características 619 lím x2 = 4,
*9.6 Ecuaciones de segundo orden cuasilineales; características 627 x....2
2
*9.7 Otros métodos para problemas hiperbólicos 637 es verdadera ya que jx -41 < a siempre que O< jx-21 < a(5+a)-1• (Véase el Prob. l.)
9.8 Método de mallas múltiples 644 Como ejemplo adicional, nótese que la ecuación
*9.9 Métodos rápidos para la ecuación de Poisson 654
lxl
Capítulo 10. PROGRAMACIÓN LINEAL Y TEMAS RELACIONADOS 659 lím = L.
x-0 X
*10.1 Convexidad y desigualdades lineales 659
*10.2 Desigualdades lineales 665 no es verdadera para cualquier número L. Para entender esto, sea s = 1 y supongamos
10.3 Programación lineal 670 que llxl/x-LI < 1 siempre que O< !xi< 8. En tal caso tenemos que lxl/x = 1 cuando
10.4 Método del símplex 675 x = f8 y lxl/x = -1 cuando x = -!8. Como no hay un número L que satisface
11-LI < 1 y 1- 1-LI < 1, decimos que el límite no existe.
RESPUESTAS Y SUGERENCIAS 687
Sif está definida sólo en un subconjunto específico X de la recta real, la definición
BIBLIOGRAFÍA 693 de límite se modifica de manera que lf(x)-LI < a, siempre que x E X y O< lx- el < 8.
ÍNDICE DE MATERIAS 709
2 Capítulo 1 Preliminares matemáticos 1.1 Conceptos básicos y el teorema de Taylor 3
entoncesf'(O) no existe. Sif es una función para la quef'(c) existe, decimos quef es en donde 1 < é, < x. La sumatoria I: a la derecha del signo de igualdad produce una
diferenciable en c. Si J es diferenciable en c, entoncesf es continua en c. (Véase el función polinomial enx. Ésta puede considerarse como una función simple que aproxima
Prob. 18.) a la más compleja función 1n x. El último término a la derecha puede considerarse como
El conjunto de todas las funciones continuas sobre la recta real lR. se denota con un término de error. Éste nos dice qué tanto difiere el polinomio de lnx. Nótese que este
C(JR.). El conjunto de funciones para las que J' es continua en todas partes se denota término no es un polinomio en virtud de queé, depende de x de un modo no polinomial.
con C 1 (JR.). En consecuencia, la aseveración del párrafo anterior se puede escribir en Podemos reescribir la ecuación como:
forma sucinta como C 1 (lR.) e C(JR.). Esta inclusión es propia, puesto que son muchas
las funciones continuas cuyas derivadas no existen. La función!(x) = lxl es un ejemplo. lnx = (x - 1) -Jcx - 1)2+i(x - 1)3 - · · ·+(-1)"-1 �(x - 1)" +En(x),
Denotamos con C2(JR.) al conjunto de todas las funciones para las queJ" es continua
en todas partes. De manera semejante se define C"(lR.) para cada número natural n. Por
último, C00 (JR.) es el conjunto de funciones que tienen la propiedad de que todas sus donde
1 1
derivadas sean continuas en toda la recta real. Ahora tenemos que: IEnCx)j = - -é,-(n+l)(x - 1r 1 � - - (x - 1r1•
n+l n+l
C00 (JR.) e ... e c2(JR.) e C 1 (JR.) e C(]R). Hay que observar en esta estimación que 1 < é, y que E,-Cn+ 1l < l .
Ahora suponga que vamos a utilizar l a serie para calcular 1n2. Tendremos en este
Una función conocida de C00 (lR.) esf(x) = eX. caso:
De la misma manera, definimos C"[a, b] como el conjunto de funciones! para las
que ¡en) existe y es continua en el intervalo [a, b]. 1 1 1 1 1
ln2 = 1 - + - +. ..+(-1) - 1 ; +E.(2) = �
n
¿,(-1) -1 k +E.(2)
k
Un teorema importante relativo a las funciones de C"[a, b] es el teorema de Taylor. 2 3 4
k=l
El teorema de Taylor y la fórmula de Lagrange para el residuo con IE.(2)j < 1/(n + 1). Calcular In2 con una precisión de uno a 10 8 requiere que n
se elija de modo que E.(2) � 10-8• Esto significa que 1/(n+ 1) � 10-s o bien que
TEOREMA 1 Sif E C"[a, b] y si¡<n+l) existe sobre el intervalo (a, b), entonces para puntos cuales n + 1 � 10 8. Un cálculo de tal precisión requeriría un polinomio con cien millones de
quiera c y x en [a, b] hay un punto é, entre c y x tal que: términos. En cambio, un cálculo semejante para In 1 .5 se puede realizar con la misma
precisión con tan sólo ¡veintidós términos! (Véase el Prob. 19.)
f(x) = ¿n 7¡¡/1 Ckl(c)(x -d +E.(x), ( 1)
Con frecuencia en los argumentos matemáticos se utiliza el caso especial n = 1 del
teorema de Taylor. Se conoce como el teorema del valor medio. Éste indica que sif
k=O
donde es una función de C[a, b] y sif' existe sobre (a, b), entonces parax y c en [a, b]
En (x) = -1 -¡C"+1l(é,)(x -ct+ 1 .
(n+l)! J(x) = J(c)+J'(é,)(x -c),
4 Capítulo 1 Preliminares matemáticos J.J Conceptos básicos y el teorema de Taylor 5
en donde I; se encuentra entre c y x. Tomando x = b y c = a, y reordenando, se llega a Otras formas para la fórmula de Taylor
la importante ecuación: Se puede obtener aún otra forma para la serie y el término de error en la fórmula
f(b) - f(a) = J'(i;)(b - a) donde a</;<b. de Taylor si se reemplazan x por x+h y c por x en el teorema 1. El resultado es
Un caso particular del teorema del valor medio es el Teorema de Rolle. En él
se establece que si f es una función continua sobre [a, b], J' existe sobre (a, b) y
¿ k'¡<kl(x)h
n
1
f(x+h) = +E (h)
k
f(a) = f(b) = O, entonces¡'@ = O para algún 1; en (a, b). Ésta es una consecuencia
n
k=O (3)
inmediata de la ecuación precedente. (En realidad, en un desarrollo formal el teorema de
Rolle se demuestra primero, derivándose después el teorema de Taylor como una de sus En (h) = _l_ ¡(n+l)(/;)hn +I '
consecuencias.) Tanto en el teorema de Rolle como en el del valor medio puede haber (n+l)!
más de un punto 1; en el intervalo [a, b] que satisfaga la ecuación dada.
En el capítulo 6 necesitaremos una forma distinta del teorema de Taylor. en donde el punto 1; se encuentra entre x y x+h.
Para las funciones con valores y argumentos vectoriales también se tienen fórmulas
El teorema de Taylor con la forma integral para el residuo y series de Taylor. Así, sif es un mapeo de JRn en JRm, hay fórmulas que expresan!(x+h)
en términos def(x),f' (x),f" (x), etc. En estos casos la mayor dificultad radica en definir
TEOREMA 2 Si f E cn+l ¡a, b] entonces para cualesquiera puntos x y c en [a, b] las derivadas apropiadas. Estas cuestiones se consideran en detalle en muchos libros de
Ln k.-/kl(c)(x
1 texto, tales como Bartle [1976], K. T. Smith [1971] y Dieudonné [1960]. Aquí tan sólo
f(x)= -el+ R (X), n (2) mencionaremos algunos casos especiales que necesitaremos más adelante.
k=O Para una función!: JR2 -> R la expresión más sencilla de la fórmula de Taylor se
donde
Rn (X) = 1
1 ¡x¡ +l\t)(x - t) dt.
<n n
escribe así:
n. e n 1 8 8 )i
f(a+ h, b+k) =; i! ( h +k y f(a, b)+En (h.k)
Demostración Recordemos la fórmula para la integración por partes 8x 8
(4)
ju dv=uv-jv du, 1 8 8 n+l
En(h,k) = ( h k ) f(a+9h, b+9k),
(n+l)! 8x 8y
+
y apliquémosla a la integral Rn tomando
(x - t)n
dv = ¡<n +l\t) dt.
en donde 9 es un número entre O y 1. El significado de estos términos tan misteriosos es
u= el siguiente:
n.,
El resultado es
1 l r-x ¡x
Rn = 1 �¡<nl(t)(x - t)" = + n ¡< l (t)(x - tr dt
1
] ( 8
h +k y
8 ) º f(a, )=f(a, )
8x 8
n b b
n. t-c e
8 8 1 8f a¡)
=-�¡<nl (c)(x - c)"+Rn-1· h
( 8 +k ) f(a, b) = (h +k y (a, b)
n. x 8 y ox 8
8 8 2
Si iteramos este proceso de integración por partes, eventualmente llegaremos a
28 ¡ 82¡ 28 ¡
2 2
n 1 (h8 +k8y ) f(a, b) = (h ox2 +2hk y +k 2 ) (a, b)
8x8
Rn = - ¿ -/kl(c)(x- d+Ro.
k
x 8y
k=I
y así sucesivamente. El teorema que rige la aplicabilidad de la fórmula (4) es el siguiente.
Como
Ro = [J'(t) dt = f(x) - f(c),
TEOREMA 3 Si todas las derivadas parciales de orden n+1 de f son continuas en el rectángulo
tenemos que definido por lx - al � lhl y IY- bl � lkl, entonces hay un número 9 en el intervalo
n 1 abierto (O, 1) para el que la fórmula (4) es válida.
¿
f(x) = f(c)+ k!¡(kl(c)(x - e/+Rn,
k=I
lo que completa nuestra demostración. 111 Ejemplo ¿Cuáles son los primeros términos en la fórmula de Taylor paraf(x, y) = cos(xy)?
6 Capítulo 1 Preliminares matemáticos 1.1 Conceptos básicos y el teorema de Taylor 7
Respuesta Para esta función tenemos que Si x es un número decimal, su aproximación por truncamiento a n dígitos es el
número :X que se obtiene al descartar todos sus dígitos más allá del n-ésimo. Tenemos
af = -y sen(xy)
- af = -x sen(xy)
lx- x\ < 10-n. (6)
ax ay
a 2f ? a 2f a 2f _ 2 x x
La relación entre x y es tal que x - arroja O en las primeras n posiciones y x =
fü2 = -y- cos(xy) axa y = -xy cos(xy)- sen(xy) ayz - -x cos(xy). x + 8 x 10-n con O � 6 < l. Así, tenemos que \x - il = \6\ x 10-• < 10-• y la
desigualdad (6) se cumple.
Así, si tomamos n = I en la fórmula de Taylor (4), el resultado es
SERIE DE PROBLEMAS 1.1
cos[(a+ h)(b + k)] = cos(ab)- hbsen(ab)- kasen(ab)+ E1 (h, k).
l. Demuestre que lx2 - 41 < g cuando O< lx-21 < o(5 +e)- y pruebe que lím,-2x = 4.
1 2
El residuo E1 es la suma de tres términos, a saber, 2. Demuestre que lím,-1(4x+ 2) = 6 por medio de una prueba tipo o-&.
3. Demuestre que lím,-2(1/x) = f por medio de una prueba tipo o-&.
-ih2(b + ek)2 cos [(a+ 9h)(b +9k)]
4 . Encuentre el número 1; que se menciona en el teorema del valor medio en el caso de lafunción
-hk { (a +9h)(b +9k) cos[(a +9h)(b +9k)] + sen[(a +9h)(b +9k)]} f(x) = 3- 2x +x2 y el intervalo [a, b] = [ l. 3].
5. Encuentre la serie de Taylor para la funciónf(x) = coshx alrededor del punto e = O.
-!k\a +9h)2 cos[(a+ 9h)(b +9k)]. 11111
6. Si la serie para lnx se corta después del término que comprende a (x- 1 )1000 y después se
utiliza para calcular In 2, ¿qué cota se puede imponer al error?
Redondeo 7 . Encuentre la serie de Taylor paraf(x) = i! alrededor del punto e= 3. Después simplifique
El redondeo es un concepto muy importante en los cálculos científicos. Considere la serie y demuestre cómo se podria haber obtenido directamente a partir de la serie para J
alrededor de e = O.
un número decimal positivo x de la forma O.___ ... ___ con m dígitos a la derecha del
punto decimal. Se redondea x a n cifras decimales (n < m) de una manera que depende 8. Demuestre que lafunciónf(x) = x sen( l/x), conf(O) = O, es continua, mas no diferenciable
en O.
del valor del dígito (n + 1). Si este dígito es O, 1, 2, 3 o 4, entonces el n-ésimo dígito
no se cambia y los que le siguen se eliminan (redondeo por defecto). En cambio, si el 9. Determine si la siguiente función es continua, una vez diferenciable o dos veces diferenciable:
n-ésimo primer dígito es 5, 6, 7, 8 o 9, entonces el n-ésimo dígito se incrementa en una
unidad y los que le siguen se eliminan (redondeo por exceso). (La situación en que 5 es f(x) = {x3 + X - 1 X;;; Ü
x3-x-1 x>O.
el n-ésimo primer dígito se puede manejar de varias maneras. Por ejemplo, hay quienes
prefieren redondear por exceso sólo cuando el dígito anterior es par, en el supuesto 10. Responda la pregunta del problema 9 para la función
de que esto sucede aproximadamente la mitad de las veces. En aras de la simplicidad
nosotros hemos decidido siempre redondear por exceso en tal circunstacia.)
j(X)
= {X2 X;;;¡
He aquí algunos ejemplos de redondeo correcto a cuatro dígitos de números con x x> l .
siete dígitos: 11. Repita e l problema 4 para la funciónj(;c) = x6 +x4 - 1 en e l intervalo [O, 1 ].
. 1735499 ...., .1735 12. Seaj(x) = x-3(x - senx), para x '# O. ¿Cómo debería definirse f(O) para que f fuese
.9999500...., 1.000 continua en O? ¿Sería también diferenciable?
13. Sea k un entero positivo y sea O< a.< l. ¿A qué clase C"(lR) pertenece la función i+« ?
. 4321609 ... ., .4322
14 . Demuestre que: si f E C"(lR), entonces J' E c"-1(lR) y J:f(t) dt pertenece a la clase
Si x se redondea de modo que x es su aproximación con n dígitos, entonces c•+1 (1R).
!
lx- xi � x 10-•. (5)
15. Demuestre directamente el teorema de Rolle ( y no como un caso particular del teorema del
valor medio).
Para ver por qué es cierto esto último, razonemos de la manera siguiente: si el n-ésimo 16. Demuestre que: sif E C"(IR) y f(xo) = f(x1 ) = · · · = f(x.) = O para xo< xi < · · · < x.,
entonces/"l(I;) = O para algún 1; E (Xo, x.).
!
primer dígito dex esO, l , 2, 3 o 4 entoncesx = x+s cons < x 10-• y (5) se cumple. En
x x
cambio, si es 5, 6, 7, 8 o 9, entonces x = + 10-n donde es un número con los mismos 17. Demuestre que la funciónf(x) = x2 es continua en todas partes.
primeros n dígitos que x y todos los restantes iguales a O. Ahora, x = x+ 8 x 1o-• con 18. Demuestre que una función es necesariamente continua en cualquier punto en el que es
i
6 � y x- x = (I - 6) x 10-n. Como 1- 6 � !, la desigualdad (5) se satisface. diferenciable.
8 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 9
19. (a) Obtenga la serie de Taylor en O para la funciónf(x)=ln(x +1). Escriba la serie usando 34. ¿Cuántos términos se requieren en la serie
la notación de sumatorias. Dé dos expresiones para el residuo cuando la serie se trunca.
00 1
(b) Determine el menor número de términos que deberán incluirse en la serie para aproximar e='°'
i...J-¡
n.
In 1.5 con un margen de error menor que 1o-s. n=O
(c) Determine el número de términos necesarios para aproximar In l .6 con un error no mayor
para aproximar al número e con un error inferior a 6/10 de unidad en el vigésimo lugar
que 10-10• decimal?
20. Muchas veces se utiliza la aproximación sen x � x para valores pequeños de x. Con la
ayuda del teorema de Taylor estime el error en esta aproximación. ¿Para qué valores de x es 35. Encuentre los dos primeros términos del desarrollo de Taylor para x1l5 alrededor del punto
correcta esta aproximación hasta la sexta cifra decimal? x = 32. Aproxime la raíz quinta de 31.999999 recurriendo a estos dos términos de la serie.
¿Qué tan precisa es la solución?
21. Para valores pequeños de x ¿qué tan correcta es la aproximación cosx � I -!x2 ? ¿Para
qué valores de x es correcta esta aproximación hasta la tercera cifra decimal? 36. Demuestre o refute la siguiente afirmación: Sif es diferenciable en x, entonces para a. ;e 1
22. Haga una crítica del siguiente razonamiento: La función! definida ';=omo J'(x) = h-+0
lím[f(x +h) - f(x +a.h)]/(h - a.h).
x3+x x�O
f(x) = { 37. Encuentre el polinomio de Taylor de grado dos para la funciónf(x) = e1:,; sen x desarrollado
x3-x x � O en torno al punto it/2.
tiene las siguientes propiedades:
38. Determine la forma de Lagrange para el residuo al aplicar el teorema de Taylor a la función
lím J"(x) = lím 6x = O f(x) = cos x, tomando n = 2 y e=rt/2. ¿Qué tan pequeño se debe hacer !x -rt/21 para
x-o+ x-o+
!
que el residuo no sea mayor que x 10-4 en valor absoluto?
lím J"(x)= lím 6x = O. 39. En el ejemplo que ilustra la fórmula de Taylor se obtuvo un error de la forma (-l )"(n +
Por lo tanto,!" es continua.
x-o- x-o-
n- r
1 � -•-1(x -1 1 • Compare este error con el que surge en la forma integral del residuo.
23. Use el teorema de Taylor con n=2 para probar que la desigualdad 1 +x < i! es válida para
todos los números reales, excepto para x = O.
24. Derive la serie de Taylor con residuo para ln(l +x) alrededor de l . Deduzca una desigualdad 1.2 Órdenes de convergencia y conceptos básicos adicionales
que proporcione el número de términos que deben tomarse para aproximar In 4 con un error
menor que z-m. En los cálculos numéricos, especialmente con las máquinas computadoras de alto rendi
25. ¿Cuál es el tercer término de la serie de Taylor para x2 +x -2 alrededor del punto 3? miento, sucede con frecuencia que la respuesta a un problema no se obtiene de inmediato.
26. Con la serie de Taylor para 11 ¿cuántos términos es necesario considerar para aproximar e2 Más bien, lo que se genera es una sucesión de respuestas aproximadas cada vez más pre
con una precisión de cuatro cifras decimales (por redondeo)? cisas.
27. Pruebe que sif es diferenciable en x, entonces
lím(2h)-1[f(x +h) -f(x -h)] =J'(x). Sucesiones convergentes
h-+O
Demuestre que para algunas funciones que no son diferenciables en x el límite anterior existe. Pensemos en una situación ideal en la que se busca un solo número real como
(Véase Eggermont [ 1988] o el problema 36.) respuesta a un problema. Puede ser, por ejemplo, un cero de una ecuación complicada
28. Desarrolle la serie de Taylor paraf(x) = ln x en tomo a e; escriba el resultado en notación de o el valor numérico de una integral definida difícil de trabajar. En tal caso, un programa
sumatorias y dé el término para el residuo. Supongamos que lx -el < 1 y que se quiere una de computación quizá produzca una sucesión de números reales x1, x2, x3, ... que se
precisión menor que Í x 10-1 ¿cuál es el mínimo número de términos que deben considerarse estén aproximando a la solución correcta.
en la serie para alcanZl!f tal precisión?
29. Determine los dos primeros términos de la serie de Taylor para r alrededor de 1 y .el
Escribimos:
lím X =L,
residuo E1. n-+oo n
30. Determine el polinomio de Taylor de segundo grado para si a cada números positivo le corresponde un número real r tal que jx. -LI <s siempre
cosx)
f(x) = / que n > r. (En este casones un entero.)
al desarrollar en tomo al punto it.. Por ejemplo:
, n+ 1
31. Desarrolle la función fi en series de potencias de (x -1) y aproxime /0.9999999995 hasta hm --=1
el décimo lugar decimal. n-+oo n
ya que
32. Suponga que lxl < f y determine por medio del teorema de Taylor la mejor cota superior n 1
para ¡ : - 1 ,<s
(a) 1 cos x -( l -x2/2)1 (b) 1 sen x -x(l -x2/6)1.
33. Determine una función que pueda llamarse linealización de x3-2x en 2. siempre quen> ¡¡-1.
10 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 11
Como un ejemplo más, recordemos la ecuación Estas nociones nos proporcionan un método para comparar dos sucesiones, siendo
más frecuente su uso cuando ambas sucesiones convergen a cero. Si Xn _, O, Un _, O,
lím (1+ !)",
e= n-..oo y Xn = O(un ), entonces Xn converge a cero al menos tan rápidamente como Un, Si
n Xn = o(un ), entonces Xn converge a O más rápido que Un,
por medio de la cual se puede definir el importante número irracional e. Si calculamos He aquí algunos ejemplos:
�=o
la sucesiónx,, = (1+ 1/n)", encontramos que algunos de sus elementos son
n!n =o(D
X¡o = 2.593742 (2)
X30 = 2.674319
xso = 2.691588 �=o(rL) (3)
G)
X¡ooo = 2.716924.
�+e-n = O (4)
El anterior es un ejemplo de una sucesión que converge más bien en forma lenta, ya que
el límite es e= 2.71828 18 . . . y en el milésimo término aún hay un error de 0.00135 8.
Como ejemplo de sucesión que converge rápidamente, considérese la que se define e-n=o(� (5)
recursivamente como sigue:
)·
Tomando un ejemplo de la sección 1.1 podemos escribir:
X¡ =2
{
+¡
n -l
Xn+l = �Xn (n f: 1). In2-¿(-li-1k
1 =O � .
k=I
( ¡) (6)
significa que hay constantes r y C tales que lf(x)I ;;;; Clg(x)I siempre que x � r. Así, Demostración Sean A y B respectivamente el menor y el mayor valor de u(x) en [a, b]. En tal caso
por ejemplo,
Vx2 + 1 = O(x) (x-+ oo), A;;;; u(x);;;; B (a;;;; X;;;; b).
se puede escribir, con la notación matemática para sumas y productos ¿; y TI, como
En general, si hay dos constantes C y a. y un entero N tales que sigue:
n n ( k )
¿
m m
El teorema del valor medio para integrales
Sk = Sn + Sn+I + · · · + Sm Y II Yk = YnY +I · · · Ym
n
Otro teorema del valor medio de uso frecuente en el análisis numérico es el siguiente: k= n k=n
TEOREMA 1 Sean u y v dosfunciones reales y continuas sobre el intervalo [a, b] con v � O. Entonces
s
existe un punto en [a, b] tal que
y, debido a lo anterior,
X = x(m-n+l) II
m m
Por convención, si m < n, entonces El concepto correspondiente relativo a la máxima cota inferior o ínfimo se define
como sigue. Escribimos u = mci S o u = ínf S si:
I> II
m m
a�x�b (x ES).
y'= l+sen y y(O) = O.
En esta situación se dice que b es una cota superior de S y a una cota inferior. Por Una función importante, llamada función error y denotada con erf(x), se define por
supuesto, S tiene muchas cotas superiores: si e � b, entonces c también es una cota
superior de S. Es obvio que no hay una máxima cota superior. Sin embargo, hay una
medio de la integral:
2 r
erf(x) = a J e-1 dt.
2
Ejemplo 1 ¿Qué número es el sup S si S = {x: x2 < 2}? recuperando de esta manera dos funciones explícitas. Del mismo modo, de la ecuación
Respuesta Dado que S = {x: -vz< x < VZ}, la mínima cota superior es vz. 111 sen(y+7) = x3 - 2
Si f es una función, la notación sup,eAf(x) significa sup{f(x) : x E A}. Por
ejemplo, podemos recuperar una función explícita resolviendo para y:
sup sen x = ! y= sen- 1 (x3 - 2) - 7.
O<x<rt/6
16 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 17
Aquí también se cuenta con múltiples funciones, puesto que son varias las ramas de la Respuesta Para contestar esta pregunta tomemos (xo, Yo)=(-1, 1) y definamos
función inversa del seno que se pueden escoger.
En general, si G es una función prescrita, y si (xo,yo) es un punto particular en G(x,y)=X1 + 2y8 -l
donde G(x0,y0) = O, esperamos que haya puntos cercanos que satisfagan la ecuación
G(x,y)=O, es decir, esperamos que cuando x sufra una pequeña alteración, un cambio En tal caso G(xo, Yo)=O Y
apropiado para y haga que siga siendo válida la ecuación G(x,y) = O. Por lo tanto, y aG 7
32
-= 16y-y.
debería ser una función de x en una vecindad de xo. La figura 1. 1 nos muestra un caso ay
típico.
En consecuencia, aG(xo, Yo)/ay *' O. Por el teorema de la función implícita, y es una
función de x continuamente diferenciable cerca de xo =-1. 11
z
Si f es una función definida implícitamente por G(x,y) = O, entonces, para x en
algún intervalo, G(x,f (x))=O. Si queremos calcular!' (x) podemos recurrir a una técnica
familiar del cálculo. Derivamos la ecuación G(x,y) = O con respecto a x, recordando
que y se interpreta como una función de x. El resultado es:
z = G(x,y)
aa aar1y -_ 0
ax+ ay dx
de donde obtenemos
= ªª ªª
-! y
dx
dy ax / ay
!'(x) = �� /��-
Xo
La derivada que así se obtiene es probablemente una función de x y y.
X Ejemplo 3 ¿Cuál es el valor de dy/dx en el punto (2, 1), siy(x) se define implícitamente por medio
de la ecuación x3 -y1 + 4x2+y4 - 24 =O?
Respuesta La derivación total de la ecuación con respecto a x nos da
Figura 1.1 La superficie G intersecta al plano xy mostrando la curva G(x,y)=O. 3x2 -7y6 : +8x+4y3 : =0.
2. Demuestre que los elementos de la sucesión del problema 1 son menores que 3. 23. Las cuatro expresiones eh, (1- h4)-1 , cos(h), y 1+ sen(h3 ) tienen el mismo límite cuando
3. Demuestre que Xn = x+o(l ) si y sólo si lúnn-oo Xn = x. h-+ O. Expréselas en la siguiente forma con los valores enteros óptimos de a. y�.
4. Verifique la validez de las ecuaciones (1) a (8) del texto. f(h) = e+ O(h") = e+ o(l,h
5. Para una n fija, demuestre que :E;=o i = 1/(1- x)+o(x") cuando x-+ O.
24. ¿Cuál es el límite y cuál la razón de convergencia de la siguiente expresión cuando h -+ O?
6. Demuestre que si Xn = O(a.n ), entonces CXn = O(a.n).
7. Demuestre que si xn = O(a.n ), entonces Xn/ ln n = o(a.n ). (1 +h)-i
8. Encuentre el valor óptimo para k en la afirmación cos x-1+x /2 =O(i) cuando x -+ O. 2 h2
9. Demuestre que si Xn = o(a.n ), entonces Xn = O(a.n ). Demuestre que el recíproco de este Exprésela en las formas dadas en el problema 23.
enunciado no es cierto.
25. Encuetre el valor óptimo para� tal que para n fija
10. Demuestre que si Xn= O(a.n) y y. = O(a..), entonces Xn+Yn = O(a..).
1
11. Demuestre que si Xn = o(a.n ) y Yn = o(a..), entonces Xn +Y• = o(a..). --
1-x
= l +x+x2+···+xn+O(r)B (Ü<x< !)
12. Demuestre que para cualquier r > O, x! = O(e') cuando x-+ oo:
13. Demuestre que para toda r > O, ln x = O(x') cuando x -+ oo. cuando x -+ O. Repita el problema para o(x1'). ¿Existe un valor óptimo en este caso?
14. Demuestre que si a.. -+ O, Xn = O(a.n ) y Yn = O(a..), entonces XnYn =o(a..). Explique su respuesta.
15. Demuestre que si x. = O(a..), entonces a.;;- 1 = O(x;;- 1 . Demuestre que lo mismo sucede 26. Demuestre que las siguientes afirmaciones son falsas:
(a) t! - I = O(x2 ) cuando x-+ O
)
17. Definimos inductivamente la sucesión Xn por medio de la ecuación Xn+I = F(x.). Suponga 27. Supongamos que [a.] -+ O y que A. > l. Demuestre que :E:=o akA.k = o(A.") cuando
mos que xn -+ x cuando n-+ oo y que F'(x) = O. Demuestre que x.+2-x..1 = o(Xn+l-x.). n -t OO.
18. Demuestre que toda función suficientemente lisa se puede aproximar en un intervalo de <28. Considere la relación recursiva
longitud h por medio de un polinomio de grado n con un error que es 1) cuando h
-+ O. ow•
xo = l xi=c
19. (a) Considere la serie {
�D.
Xn+l = Xn +Xn-l (n;?; 1).
x2 3x3 9x4
e
tmx
= l+x+-+-+-+···
2! 3! 4! (lx1 (a) Se puede demostrar que cuando e=(1+../5)/2, se obtiene la fórmula cerrada
Conserve tres de sus términos y estime el resto de la misma valiéndose de la notación o con
el valor optimo cuando x-+ O.
(b) Repita el problema con la notación O y la serie
Xn = (1 \ ../5
)"
x2 7x4 62x6
ln tan x=ln x+-+-+-+· ··
3 90 2835
(o< lx\ <D. (b) De manera similar, cuando e=(1 - ../5)/2,
20. Determine el conjunto de valores para y y 8 para los que la parte +· ·· de la serie
k=l
n-l
1 ;r!
ln(l+x) = ¿(-l/- +·· ·
k
(c) Si e= I, entonces
c-2../sr
Xn =
31. Cuando se resuelven ecuaciones diferenciales, a menudo se obtienen soluciones en forma Una sucesión es, formalmente, una función compleja definida en el conjunto de los
implícita. Demuestre que la ecuación enteros positivos N= { 1,2,3,...} . Es sólo cuestión de conveniencia el que escribamos
Xn en vez de x(n) para denotar el valor de la función x en el argumento n.
2x3y1+x2y+l =e En el conjunto V definimos dos operaciones:
define una solución de la ecuación diferencial
t=
x +y= [x¡ +y¡,x2 +Y2,x3 +Y3,...]
-(6x2/+2xy+l)/(4x3y+x2 ). /\.X= (A..X¡ ,A..X2,A..X3 ,••.J.
Una forma compacta de escribir estas ecuaciones es:
32 . La ecuación de Kepler usada en astronomía esx-y+e seny = O, en donde e es un parámetro
en el intervalo [O, !]. Pruebe que para cada número real x hay un número real y que satisface (x+y)n = Xn +Yn Y (A..X)n = A..Xn-
la ecuación. Demuestre que si O � e < l, entonces dy/dx es continua en todas partes.
33. Encuentre los puntos x en los que la ecuación Hay en V un elemento cero, a saber, O = [O,O,O,...]. Con estas definiciones V se
convierte en un espacio vectorial. La verificación de los postulados de los espacios
y-ln(x+y) = O
vectoriales es tediosa y poco edificante. El espacio vectorial V es de dimensión infinita;
define implícitamente a y como una función de x. Calcule dy/dx. en efecto, el siguiente conjunto de vectores es linealmente independiente:
34 . Dé un ejemplo que muestre por qué el axioma de la mínima cota superior no se cumple para /ll =
el sistema de los números racionales. [l. O, O, O, ... ]
35. ¿Se cumple el axioma de la mínima cota superior para el sistema de los números enteros? /2l = [O,1,O,O,...]
36 . ¿Cuáles son los valores de las siguientes expresiones? /3l = [O ,O,1,O,...]
(a) sup,Elll tan-1 x (c) sup,¡:;0 e-x
(d) sup,Ell. (x2 + 1)-1
etcétera.
(b) ínf,E11 e-x
37. Use el teorema del valor medio para integrales para demostrar que Nuestro interés se limitará a los operadores lineales L: V -> V. De estos, uno de
los más importantes es el operador de desplazamiento, que se denota E y se define por
/6 lcosxdx=! medio de la ecuación:
[0
Ex= [xz,X3, X4,...] donde x = [x¡ ,Xz,x3, ... ]
para alguna y en el intervalo (0, it/2 ). Así, (Ex)n = Xn+l · Está claro que E se puede aplicar varias veces en forma consecutiva
38. Dé un ejemplo que muestre por qué en el teorema 2 la hipótesis sobre la continuidad de u no para producir, por ejemplo, (EEx). = Xn+2 o (Ek x)n = Xn+k· En lo que resta de esta
se puede suprimir. sección nos ocuparemos sólo de aquellos operadores que se pueden expresar como
combinaciones lineales de potencias de E. Estos operadores se llaman operadores en
diferencias lineales (con coeficientes constantes y rango finito). Su forma general es:
*1.3 Ecuaciones en diferencias m
L= ¿c;fÍ . (1)
A menudo, los algoritmos para cálculos numéricos se diseña para generar sucesiones i=O
de números. Por consiguiente, nos será de utilidad desarrollar un fragmento de la teoría de Por supuesto, Eº se define como el operador identidad, (E°x)n = (lx). = x•. En la
los espacios de sucesiones lineales. Esta teoría la necesitaremos en el capítulo 8 para ecuación (1) podemos ver que los operadores lineales en diferencias de la forma ( 1)
analizar los métodos lineales de pasos múltiples. constituyen un subespacio lineal en el conjunto de los operadores lineales de V en V.
Las potencias de E proporcionan una base para dicho subespacio.
Conceptos básicos Observe que Len la ecuación (1) es un polinomio en E, es decir, una combinación
lineal de potencias de E. De este modo, podemos escribir L = p(E), donde p es
A continuación, V designará al conjunto de sucesiones infinitas de números com un polinomio llamado polinomio característico de L y que se define de la siguiente
plejos, como por ejemplo: manera:
X= (x¡,Xz, X3,, ..]
p(A) = L C¡A. . i
El problema que se estudiará aquí es el de encontrar todas las soluciones de una inducción que Xn = a.u. + Pvn para toda n. En realidad, si esta igualdad se cumple para
ecuación de la forma Lx = O, donde L es un operador del tipo (1). De la linealidad de L índices menores que n, también lo hace paran, pues
resulta que el conjunto {x: Lx = O} es un subespacio lineal de V. Este último se llama
espacio nulo de L. Podemos considerar que la ecuación Lx = O está resuelta cuando se X11 = -3Xn-l - 2xn -2
ha encontrado una base para el espacio nulo de L.
A fin de saber en términos generales qué se puede esperar, consideremos un ejemplo
= 3(a.un-l +Pvn-1) - 2(a.un-2 +Pvn-2)
concreto de L, digamos co = 2, c1 = -3, c2 = 1 y las restantes c; = O. La ecuación = a.(3un-l - 2un-2) +�(3vn-l - 2vn-2)
que resulta de ello, conocida como ecuación en diferencias, se puede escribir de tres
=O.Un+ �v•.
maneras:
(E2 - 3E1 +2E°)x = O Este ejemplo ilustra el caso de un polinomio característico con ceros simples.
[l, O, -2, -6, -14, -30, ...] Demostración En primer lugar, si A. es un número complejo y u = [A., 1.2, 1.3, .•.] entonces Eu = A.u
ya que (Eu)n = Un+! = A.n+I = A.(A.") = A.un. Volviendo a aplicar el operador E
[!, ], 1, !, ...] obtendremos, en general, E1 u = 1.i u. Puesto que E0 se ha definido como el operador
[2, 4, 8, 16, ...]. identidad, tenemos que Eºu = 1.0 u. Así, si pes un polinomio definido por p(A.) =
¿;;:0 c;A. i, entonces
De éstas, la primera solución es más misteriosa que las otras dos, pues no es obvio cuál ( m ) m m
es su término general. En cambio, las otras dos soluciones son de la forma x. = A.", p(E)u= ;c;E i u= ;c;(Ei u)= ;c¡A.;u = p(A.)u.
donde A. = 1 o 2. Resulta natural la pregunta acerca de la existencia de otras soluciones.
Si hacemos Xn = A." en (2) obtenemos: Si p(A.) = O, entonces p(E)ú = O, como se afirmó.
Seapun polinomio cuyos ceros A.1, 1.2, •.• , Am , son simples y distintos de cero. Hay
A.n+2 _ 3A.n+I +2A.n = O una solución de la ecuación en diferencias p(E)x = O; a saber, u<kl = [1.k, 1.r A.�, ...J
que corresponde a cualquier cero A. k , Sea x cualquier solución de la ecuación en dife
A.n (A.2 - 3A. +2) = Ü
rencias. Queremos expresar a x en la formax = ¿;;= 1 aku (kl _ Tomando las primeras m
A."(A. - l )(A. - 2) = O componentes de las sucesiones en esta ecuación, tenemos:
Este simple análisis nos muestra que sólo hay otra solución del tipo que se busca, a X¡ = ¿akA.t (i = l,2, ... , m). (4)
saber, [O, O, O, ...]. Ésta se llama solución trivial. Por otra parte, las soluciones u y v k=I
definidas por un = I y v" = 2" constituyen una base del espacio de soluciones de (2).
Para verificar esto, consideremos una solución arbitraria de (2), digamos x. Buscamos La matriz de m x m que tiene como componentes a las A.� es no singular, pues de lo
constantes a. y � tales que x = a.u+ �v. Esta ecuación significa que x11 = a.u11 +� v11 para contrario tendríamos la ecuación no trivial:
toda n. En particular, paran= 1 y 2, tenemos que:
¿ b;1.f = O, ¿ b;1.�-1 = O.
m
o
i=I i=I
X¡= U +2�
{ (3) (Esta última ecuación muestra un polinomio de grado m - l que tiene m ceros.) Así, la
X2 = U +4�. ecuación (4) determina a a 1, a2, ..• , am de manera única. Sólo nos resta demostrar que
la ecuación (4) es válida para todos los valores de i. Seaz = x- ¿;;=I aku( k¡. Entonces
La ecuación (3) determina unívocamente a a y � en virtud de que el determinante p(E)z = O o, lo que es lo mismo, ¿;;:0 C;Zn+i = O para toda n. En otras palabras,
de la matriz [; ¡] es distinto de cero. (Se trata del determinante de una matri: de
Vandermonde tal como se define en la sección 6.1.) Ahora podemos demostrar por Zn+m = -c,; 1 (CoZn +C¡Zn+I + · · · + Cm-!Zn+m-1) (n = 1,2.... ). (5)
24 Capítulo 1 Preliminares matemáticos *1.3 Ecuaciones en diferencias 25
Adviértase que Cm ;t O en virtud de que el polinomio p tiene m ceros diferentes y es, Respuesta La ecuación es de la forma p(E)x= O, donde p(l)= 413 + 7A.2 + 21 - l . Los factores
por consiguiente, de grado m. Como Z; = O para i = 1, 2, ... , m, la ecuación (5) nos de p son (1 + 1)2 y (41 - 1). Como se ve, p tiene un cero de multiplicidad dos en -1 y
demuestra, al utilizarla repetidas veces, que un cero simple en 1 /4. Las soluciones básicas son:
podemos ver que cada sucesión x'(1), x" (1), ... está acotada. 01éanse los problemas 22
d(k-1) y 23.)
X
(A)= dlk-1 ['/\., ,,
k-1,
/\.-,
13' ...]
Para demostrar el recíproco, supongamos que la condición (ii) es falsa. Si p tiene
un cero 1 que satisface 111 > 1, entonces la sucesión x(l) no está acotada. Si p tiene un
TEOREMA 2 Sea p un polinomio que satisface p(O) ;t O. Se puede obtener una base para el espacio cero múltiple 1 que satisface 111 � 1, entonces x'(1) no está acotada, ya que su término
nulo de p(E) de la manera siguiente: asóciese a cada cero 1 de p de multiplicidad k las general satisface la desigualdad
k soluciones básicas x(l), x'(l), ... , xlk -ll(l), donde x(l)= [l,12, 13 , ...].
lxnl= ln l"- 1 1= nlll"- 1 � n. 11111
Ejemplo 1 Determine la solución general de la ecuación en diferencias Ejemplo 2 Determine si la siguiente ecuación en diferencias es estable:
Respuesta La ecuación es de la forma p(E)x = O, con p('J,.) = 4')..3 + 7')..2 + 2').. - l. Por el ejemplo 9. Demuestre que si L1 y Lz son combinaciones lineales de potencias de E, y L1 x = O, entonces
anterior, p tiene un cero doble en -1 y un cero simple en 1/4. En consecuencia, la Lilzx = O.
ecuación es inestable. 11 10. Desarrolle una teorí a completa para la ecuación en diferencias E'x = O.
1 1. Dé bases que consten de sucesiones reales para el espacio de soluciones de
Un ejemplo de ecuación en diferencias con coeficientes no constantes aparece en
(a) (4E° - 3E2 + E3 )x = O (c) (2E6 - 9E5 + 12E4 - 4E3)x = O
¡�
la teoría de las funciones de Bessel. Estas funciones In de Bessel se definen por medio
(b) (3E - 2E + E )x = O
º 2
(d) (1tE2 - V2E + log2 · E°)x = O.
de la fórmula:
J.(x) = -1 cos(x sen e - n9) de
=
12. Demuestre que si p es un polinomio con coeficientes reales y si z [z 1, z2, ...] es una
solución compleja de p(E)z = O, entonces el conjugado de z, la parte real de z y la parte
1t o imaginaria de z, también son soluciones.
Es obvio, a partir de la definición, que JJ.(x)J � l. No tan obvia, pero no por ello menos 13. Resuelva
cierta, es la fórmula recurrente: (a) Xn+l - nxn = O (b) Xn+l - Xn = n (c) Xn+I - Xn = 2
1 14. Defina un operador ti mediante
ln(X) = 2(n - l )x- ln-l (x) - ln-2(x)
f1x = [X2 - X¡, X¡ - X2,X4 - X¡,•.•].
Si (para cierto argumento x) conocemos J0(x) y 11 (x), la relación recurrente se puede
utilizar para calcular ]z(x), h(x), ..., J.(x). Este procedimiento deviene inestable y Demuestre que E = I + ti, y que si p es un polinomio,
de poca utilidad cuando 2n > Jxl porque los errores de redondeo, que inevitablemente
p(E) = p(l) + p' ([)ti+ !p'' (/)ti2 + ....
ocurren, se multiplicarán por el factor 2nx- 1, que a la larga llega a ser muy grande.
(Véase el problema 25.) 15. (Continuación) Demuestre que six = 1)..),.2)..3, ...] y p es un polinomio, entoncesp(!:i)x =
Para obtener mayor información acerca de las funciones calculables por medio de p(7c- 1 )x. Describa como se resuelve una ecuación en diferencias que se escribe en la forma
relaciones recurrentes, vea Abramowitz y Stegun [1964, p.xiii], Cash [1979], Gautschi p(ti)x=O.
[1961, 1967, 1975] y Wunp [1984]. 16. (Continuación) Demuestre que
1001.11101 = 1 X 23 +0 X 22 +0 X 21 +1 X 2º
+1xZ- 1 +1xZ-2 +1xr3 +0xZ-4 +1xZ-5.
Este número real se representa como 9.90625 en notación decimal. (Verifíquese.)
En general cualquier entero � > 1 puede utilizarse como base para un sistema
numérico. Los números representados en base � incluirán los dígitos O, 1, 2, 3, 4, . . . ,
� - l. Si el contexto no aclara cuál es la base numérica que se utiliza para el número N,
se puede utilizar la notación (N)�. Así tenemos que, de lo anterior,
(1001.11101)2 = (9.90625)10.
29
30 Capítulo 2 Aritmética de la computadora 2.1 Números de punto flotante y errores de redondeo 31
Ya que la computadora típica se comunica con el usuario humano utilizando el sis bit en q sea 1, y que por lo tanto no requiera almacenamiento. Los 23 bits que se reservan
tema decimal, aun cuando internamente utiliza el sistema binario, debe efectuar procesos en la palabra para la mantisa pueden utilizarse para almacenar el 2° , 3er, ..., 24° bits en
de conversión. Estos procesos ocurren durante la entrada o salida de la información. Nor q. En efecto, la máquina tiene una mantisa de 24 bits para sus números de punto flotante.
malmente el usuario no tiene que preocuparse de dichas conversiones, pero debe tener Se dice que un número real expresado como aparece en la ecuación 2 tiene la forma
conciencia de que implican pequeños errores de redondeo, como se verá más adelante. de punto flotante normalizádo. Si puede representarse con 1ml ocupando 7 bits, y q
Las computadoras no son capaces de trabajar con números reales expresados con ocupando 24 bits, entonces es un número de máquina en la MARC-32 . * Cuando este
más de un número fijo de dígitos. La longitud de palabra de la computadora impone una número se utiliza como un dato de entrada, o como el resultado de un cálculo, surge
restricción sobre la precisión con que pueden representarse los números reales. inevitablemente un error al representarlo de la manera más precisa posible mediante un
número de máquina.
La restricción de que 1ml no requiera más de 7 bits significa que
Notación científica normalizada
En el sistema decimal cualquier número real puede expresarse mediante la nota 1ml � (1111111)2 = 27 - 1 = 127.
ción cientifica normalizada. Esto significa que se desplaza el punto decimal y que las
potencias de 10 adecuadas se suministran de tal manera que todos los dígitos aparecen a En tanto que 2 127 ::::; 1038 , la MARC-32 puede manejar números tan pequeños como
la derecha del punto decimal y que el primer dígito que aparece es distinto de cero. Por 10-38 y tan grandes como 1038 • Éste no es un intervalo de magnitudes suficientemente
ejemplo generoso para algunos cálculos científicos y, por ésta y otras razones, debemos escribir
732.5051 = .7325051 X 103 ocasionalmente un programa en aritmética de doble precisión o de precisión extendida.
Un número de punto flotante en doble precisión se representa mediante dos palabras de
-0.005612 = -.5612 X 10-2. computadora, y usualmente la mantisa tiene al menos el doble de bits. Por esta razón
En general, un número real x distinto de cero puede representarse en la forma resulta que la precisión se extiende, aproximadamente, al doble de posiciones decimales
que en el caso de la precisión sencilla Además, los cálculos en doble precisión son más
x=±rxlOn (1)
lentos que en precisión sencilla, a menudo en un factor de 2 o más.
donde r es un número tal que to � r < I y n es un entero (positivo, negativo, o cero). La restricción de que q requiere no más de 24 bits significa que nuestros números de
Resulta evidente que si x = O, entonces r = O; en los casos restantes podemos ajustar n máquina tienen una precisión limitada cercana a las siete cifras decimales, ya que el bit
de tal manera que r se encuentre en el intervalo dado. menos significativo en la mantisa representa unidades de 2-24 (aproximadamente 10-7).
Exactamente de la misma manera podemos utilizar la notación científica en el Por lo tanto, los números expresados mediante más de siete dígitos decimales serán objeto
sistema binario. En este caso tenemos que de una aproximación cuando se den como datos de entrada a la computadora. Por otra
parte, algunos números decimales sencillos, como 1/10, no son números de máquina en
x=±qx2m (2) una computadora binaria. (Véase la ecuación (9) más adelante en esta sección.)
donde ! � q < I (si x * O) y m es un entero. El número q se llama mantisa y el entero En una computadora binaria los números de punto flotante están distribuidos de
manera algo irregular, concentrándose más o menos cerca del cero. En la máquina sólo
m exponente. En una computadora binaria tanto q como m estarán representados como
números en base 2. se tiene un número finito de números de punto flotante, y entre potencias adyacentes de 2
siempre existe el mismo número de números de máquina Dado que los espacios entre
las potencias de 2 son más pequeños cerca del cero y más grandes lejos de él, se obtiene
Computadora hipotética MARC-32 una distribución desigual de números de punto flotante, con una densidad mayor cerca
En una computadora típica los números se representan de la manera ya descrita, del origen.
pero con ciertas restricciones sobre q y m impuestas por la longitud de palabra disponible. Un entero puede utilizar para su representación todos los bits de una palabra de com
Para ilustrar esto consideremos una computadora hipotética a la cual llamaremosMARC- putadora, con la salvedad de que se debe reservar un bit para el signo. Por consiguiente,
32. Tiene una longitud de palabra de 32 bits (dígitos binarios) y por lo tanto es similar en laMARC-32 los enteros están comprendidos entre -(231 -1) y 231- I = 2147483647.
a muchas computadoras personales modernas. Supongamos que los bits que componen En los cálculos científicos no es común trabajar exclusivamente con números enteros.
una palabra están acomodados de la siguiente manera cuando-representan números reales: La representación de punto flotante para un número real de precisión sencilla en la
1 bit computadora hipotética MARC-32 de 32 bits se divide en 3 campos, tal como se muestra
signo del número real x
1 bit en la figura 2.1. En este caso S es el bit que representa el signo de x, s es el bit que
signo del exponente m
7 bits representa el signo de m, E es el exponente de 7 bits, y F es la fracción de 23 bits del
exponente (entero 1ml)
23 bits número real x que junto con un 1 inicial implícito da como resultado el campo de dígitos
mantisa (número real lql)
Dado que un número real distinto de cero x = ±q x 2m puede normalizarse de tal manera *(Nota del R.T.) Esto es, puede ser representado exactamente en esta computadora particular. La mayoría de
los números reales no pueden ser representado de manera exacta en la MARC-32.
que su mantisa se encuentre en el rango 1/2 � q < 1, se puede suponer que el primer
32 Capítulo 2 Aritmética de la computadora 2.1 Números de punto flotante y errores de redondeo 33
significativos (.L __ ...___ ) 2 . Por consiguiente, los números máquina normalizados en donde cada a; es O o 1 y el bit principal es a1 = l. Un número máquina próximo
no nulos son cadenas de bits cuyos valores se decodifican como sigue: se obtiene al descartar los bits excedentes a2sa 26.... Este procedimiento suele llamarse
truncamiento. El número resultante es:
x=(-I)5xqx2m
x' = (.a¡a2.., a24)z X 2m. (3)
donde
q = (0.lF)z y m = (-1)' x E Obsérvese que x' se encuentra a la izquierda de x en la recta real. Otro número de
máquina próximo queda a la derecha dex , y se obtiene mediante el proceso de redondeo
en la que el principal bit significativo en q se sabe que es 1 y que no se almacena de
por exceso. Esto significa que eliminamos el exceso de bits como se hizo anteriormente,
manera explícita.
pero en esta ocasión aumentamos en una unidad el último bit remanente a 2 4. El número
La representación que utiliza la MARC-32 para los números reales sigue el patrón de
la representación usual de punto flotante en máquinas de 32 bits, excepto que se ha omi que resulta es:
x" = ((.a¡a2,,. a24)2 + T24) X 2m. (4)
tido por simplicidad la caracterización o el seso, del exponente m. Hemos optado por dar
sólo una breve descripción, dado que estas cuestiones dependen significativamente de la Tal como lo muestra la figura 2.2, se presentan dos situaciones. El más cercano entrex'
máquina. Por ejemplo, las computadoras que recurren a la aritmética de punto flotante y x" se selecciona para representar ax en la computadora.
siguiendo la norma oficial vigente utilizan 80 bits para sus cálculos internos. Existen
conceptos adicionales -como bit de protección, exponentes con signo, bit de redondeo,
bit de adhesión, números desnormalizados, números sin normalizar e indeterminacio
nes- que participan en cualquier análisis detallado de este tema. Como información x' x'
X x" X x"
adicional pueden consultarse los siguientes textos: Standard far Binary Floating-Point
Arithmetic ANSI/IEEE [1985] y A Radix-lndependent Standardfor Floating-Point Arit Figura 2.2 Dos posiciones representativas parax
hmetic ANSI/IEEE [1987]. Entre los artículos de interés sobre este tema se encuentran:
Cody [1988], Cody et al. [1984], Coonen [1981], Hough [1981], Raimi [1969], y Scott Six' representa mejor ax, entonces resulta que
[1985].
lx-x'I � �lx"-x'I =�X z-2 4 X 2m = 2m-25. (5)
signo del exponente (s)
En este caso el error relativo está acotado como sigue:
.
signo de la mantisa (S) Exponente(E) Mantisa nonnalizada ( F) 2m-25 2-25 2-25
<��=�<�=z-M
= q X 2m q = ! (6)
Bits: 1 7
1
Punto
radical
23
En el segundo casox está más cercana ax" que ax', y se concluye que:
implícito
lx-x"I � �lx"-x'I =2m-2S
Figura 2.1 El campo de precisión sencilla de la MARC-32 . El mismo análisis muestra que el error relativo no excede de 2-24. Para el proceso de
truncamiento se utiliza una cota diferente. (Véase el Prob. 2.)
En ocasiones, durante el transcurso de un cálculo, se genera un número de la forma
Números máquina próximos
±q x 2m , donde m queda.fuera del rango permitido por la computadora. Si mes dema
Deseamos ahora estimar el error en que se incurre al aproximar un número real siado grande se dice que ha ocurrido un desbordamiento por exceso. Si mes demasiado
positivox mediante un número máquina próximo en la MARC-32. En este caso supone- pequeño decimos que tuvo lugar un desbordamiento por defecto. En la MARC-32 esto
mos que significa que m > 127 o que m<-127, respectivamente. En el primer caso (desborda
x=q X 2m !s.q<l 1ml � 127 miento por exceso) se tiene una condición de error fatal. En muchas computadoras la
2- ejecución del programa se interrumpirá de manera automática cuando se use en algún
Formulamos la siguiente pregunta: ¿Cuál es el número máquina más cercano a x?. cálculo la variable que contiene la indeterminación. En el segundo caso ( desborda
Escribimos: miento por defecto) muchas computadoras simplemente asignan a la variable el valor O
X= (.a¡az.,. a24 a25a 26,,,) 2 X 2
m y el cálculo continúa.
34 Capítulo 2 Aritmética de la computadora 2.1 Números de punto flotante y errores de redondeo 35
Todo lo anterior acerca de la MARC-32 se resume diciendo que, si x es un número En este caso x' se obtuvo por truncamiento y x" mediante redondeo por exceso. Para
real distinto de O dentro del intervalo de la máquina, entonces el número de máquina x• determinar cuál de los dos está más cercano a x, calculamos x -x y x" - x, y con
más cercano a x satisface la desigualdad: ello decidimos cuál de los números debe tomarse comojl(x):
1
x• � z-2 4 2
X
� ¡ (7) X -X = (.101010 ...)2 X 2-24 = X 2-24
1
3
· 2
Si se toma 8 = (x* -x)/x, podemos escribir esta desigualdad de la siguiente forma: 1
X 1 - X= (X - X ) - (x-X ) = 2-24- 24 1 X 2-2 4
- X 2- = -
1 11 1
3 3
x* = x(l+8) 181 � z-2 4 (8) Por consiguiente tomamos jl(x) = x", y el error de redondeo absoluto es:
Con frecuencia se utiliza la notaciónjl(x) para representar el número de máquina de 1 z-24
lfi(x)-xl = x
punto flotante x* más cercano a x. El número 2-24 que aparece en las desigualdades 3
anteriores se llama error de redondeo unitario para la MARC-32. Nuestro análisis muestra Por lo tanto el error de redondeo relativo es:
que el número de bits asignados a la mantisa está directamente relacionado con el error
1 2-24
de redondeo unitario de la máquina y determina la exactitud de la aritmética de la lfl(x)-X 1 -
_ 1..2__ = z-25 < z-24
2 11
computadora. lxl 3
Deben esperarse errores de redondeo siempre que se introduzcan datos en la com
putadora. Ni siquiera un número sencillo, como 1/10, puede almacenarse de manera Análisis del error de punto flotante
exacta en la MARC-32 (o en cualquier otra máquina binaria), a pesar de que se representa
de manera exacta en una máquina decimal. De hecho A continuación utilizaremos la MARC-32 como modelo para estudiar los errores que
surgen al hacer cálculos con la máquina y que se originan en los límites impuestos a
1 la longitud de palabra. Suponemos que el diseño de la máquina es de tal manera que
= (0.0001 1001 1001 1001 ...)z (9)
10 siempre que se deban combinar aritméticamente dos números primero se forma correc
Ejemplo 1 ¿Cuál es la forma binaria del número x = 2/3? ¿Cuáles son los dos números de máquina tamente la combinación, luego se normaliza, a continuación se redondea y, finalmente,
x' y x" próximos en la MARC-32? ¿Cuál de éstos se escogerá comojl(x)? ¿Cuál es el se almacena en la memoria en la forma de una palabra de máquina. Para aclarar esta
error de redondeo absoluto y cuál el relativo al representar x como jl(x)? cuestión tomaremos el símbolo 8 como indicador de cualquiera de las cuatro operacio
nes aritméticas básicas+,-, x o+. Si x y y son números de máquina y si x 8 y debe
Respuesta Para determinar la representación binaria escribimos calcularse y almacenarse, entonces lo más cercano que podemos aproximar a x 8 y me
2 diante una palabra de máquina sencilla es redondeando mediante jl(x 8 y) y almacenado
= (.a1a2 a3 ...)2 dicho número.
3 Para ilustrar este proceso tomaremos una máquina decimal que opera con cinco
Multiplicamos por 2 para obtener dígitos decimales en su sistema numérico de punto flotante y consideremos dos números
de máquina
4
= (a¡.a2a3 .. .)z X= .31426 X 103 Y= .92577 X 105
3
Al utilizar un acumulador de longitud doble para ios resultados intermedios obtenemos:
Por lo tanto, al tomar la parte entera de ambos lados obtenemos a1 = l . Si restamos 1
tenemos que XX y = .2909324802 X 108
5
= (.a2a3a4 . ..)z x+y= .9289126 X 10
3 X - y= -.92262740 X 10
5
Repitiendo el paso previo concluirnos que
X+ y :,:: .3394579647 X 10-Z
2
X= = (.101010...)2 La computadora con cinco decimales los almacenará en la forma redondeada siguiente:
3
Los dos números de máquina próximos, cada uno con 24 bits, son: jl(xy) = .29093 X !08
jl(x+ y)= .92891 X 105
x'= (.101010 ... 10IO)z jl(X-y)= -.92263 X 105
x" = (.101010 ... 1011)2. jl(X + y) = .33946 X 10-Z
36 Capítulo 2 Aritmética de la computadora 2.1 Números de puntoflotante y errores de redondeo 37
En estos resultados los errores relativos son 8.5 x 10-6, 2.3 x 10-6, 2.8 x 10-6, y operaciones aritméticas en registros especiales que tienen más bits que los números de
6.0 x 10-6, respectivamente, todos ellos menores que 10-� máquina usuales. Estos bits extra se llaman bits de protección y permiten que los números
Cuando se trabaja con computadora conviene saber que las cuatro operaciones existan temporalmente con una precisión adicional. Después está claro que, se utiliza
aritméticas satisfacen ecuaciones como la siguiente: un procedimiento de redondeo para un número en este registro especial con el fin de
crear un número de máquina. Tanto el número de bits de protección como otros detalles
fi(x0y) = [x0y](l +8) JoJ � e difieren de una máquina a otra, y en ocasiones es difícil aprender exactamente cómo una
máquina específica maneja estas cuestiones. El terna puede estudiarse más ampliamente
Al hablar de computadoras en general, suponemos que esta ecuación es válida y que se en el texto de Stembenz [1974] y en muchos otros artículos de la bibliografía sobre
puede tomar e como el redondeo unitario para dicha máquina. En cualquier computadora computación. Vea también Feldstein y Tumer [1986], Gregory [1980], Rall [1965],
bien diseñada esta suposición será literalmente válida, o estará tan próxima a serlo que Scott [1985] y Waser y Flynn [1982].
las discrepancias pueden ignorarse en un análisis de redondeo.
Anteriormente habíamos establecido que para la MARC-32 Épsilon de la máquina
fi(x) = x(l +8) Jol �r24 Los resultados que hemos descrito para la MARC-32 son válidos para otras máquinas
si se hacen las modificaciones adecuadas. Si una máquina funciona con una base � y
para cualquier número real x dentro del rango de la MARC-32. Por ende utiliza n posiciones en la mantisa de sus números de punto flotante, entonces
La siguiente tabla muestra los resultados de la ejecución de este algoritmo en varias obtenemos
computadoras. Los valores que se presentan deberán estar dentro de un factor de 2 Sk*+l -Sk+I
respecto de la precisión real de la máquina. Pk+l =
Sk+I
_ (S¡ +xk+1)(l +Ok) -(Sk+xk+I)
-
longitud Sk+l
Computadora de palabra precisión sencilla s precisión doble s l
[Sk( +Pk) Xk+dO +Ok) -(Sk +Xk+1)
+
=
CrayX-MP 64 r47 ::::l 0.71 X 10-I4 r95 ::::l 0.25 X 10-23 Sk+l
CDC Cyber 205
CDC Cyber 170n50
64
60
r46 ::::l 0.14 X 10-I3
r48 ::::: 0.36 X 10-14
r93 ::::: o.10 x
r 95 ::::: 0.25 X
10-21
10-23
=&k +Pk (s�:J (1+8 ) k
DEC 2060 36 r27 ::::l 0.75 X 10-3 T62 ::::l 0.2 1 X 10-18 Puesto que Sk < Sk+l y l&kl � s, podemos concluir que
DEC VAX 1 1nso 32 T24 ::::l 0.60 X 10-7 T56 ,::; 0.14 X 10-16
SUN 32 T23 ::::l 0.12 X 10-6 r 52 ::::l 0.22 X 10-IS IPk+II � s +IPki(l +e)=g +91Pkl.
IBMRISC Systern/6000 32 T23 ::::l 0.12 X 10-6 z-52,::; 0.22 X 10-IS donde e=1 +s. De esta manera se obtienen las desigualdades sucesivas:
IBM3081 32 z-ZO ::::l 0.95 X 10-6 2-52 ::::: 0.22 X 10-IS
!Poi=O
IP1I � S
Análisis del error relativo IP2I � e+Ss
IP31 � e+S(e+Ss ) =e+9e+92 e
A continuación presentamos un teorema que ilustra cómo puede analizarse el error
de redondeo relativo que se da en cálculos muy grandes. El teorema señala aproxima
damente que al sumar n +1 números máquina positivos, el error de redondeo relativo
no debe exceder de ne, donde s es el error de redondeo unitario de la máquina utili El resultado general es
zada. (Este resultado deberá ser fácil de recordar, ya que n es el número de adiciones
implicadas.) IPn l � e +es +92 s +93 s +···+en-l e
=e(l +e+...+en-!)
TEOREMA Sean Xo, x1, .•• , Xn números máquina positivos en una computadora cuyo error de·re
dondeo unitario es s. Entonces el error de redondeo relativo al calcular ¿7=0 X¡ de la =s(�)
manera usual es a lo sumo (1 +st -l. Esta cantidad es aproximadamente igual a ne. 9-1
= s el +et- 1)
Demostración Sea Sk =Xo +x1 +· · ·+Xk , y seas; la cantidad que la computadora calcula en lugar de
Sk . Las fórmulas recursivas para estas cantidades son: =(1 +et-1
Utilizando el teorema del binomio tenemos que
So=xo S =xo
{ { 0 (1 +sr -1 =1 +(�) e+(�) e2 +(;) s3 +· · · -1 ::::: ns 11
sk +i = sk +xk+i Sk+l =jl(Sk +Xk+I)
Ejemplo 2 Suponga que se define un número x mediante la serie infinita
A efectos del análisis definimos
para un valor grande de n, y a continuación redondeamos Xn, reteniendo una cierta 8. Demuestre que, según las suposiciones hechas acerca de la MARC-32 se obtiene fl(x) =
cantidad de dígitos después del punto decimal. Digamos que se han retenido m dígitos. x/(1 +15), donde joj:;; T .
24
¿Se puede asegurar que el último dígito (el m-ésimo después del punto decimal) es 9. Demuestre que fi(}) = x'(l + o/-1, donde jllj :;; s, en el caso en que x es un número
correcto? máquina de punto flotante en una computadora con redondeo unitario s.
10. Demuestre mediante ejemplos que a menudofl[fi(xy)z] a= fl[xjl(yz)] para números máquina
Respuesta Sea in el valor redondeado de x•. Deseamos que x, y, y z. Con frecuencia este fenómeno se describre de manera informal diciendo que la
1
multiplicaci6n de máquina no es asociativa.
lin -xi� X 10-m. 11. Demuestre que si x y y son números máquina en laMARC-32 y si jyj :;; jxjT25 , entonces
2
fl(x+y)=x.
Si Xn se ha redondeado correctamente para obtener in, entonces 12. Si 1/1O se ha redondeado correctamente a un número binario normalizado (.a¡ a2 ••• a24 )z x 2"',
¿cuál es el error de redondeo?, ¿cuál es el error de redondeo relativo?
lin -x.l ��X 10-m 13. (a) Si 3/5 ha sido redondeado correctamente al número binario normalizado (.a1a2 ... a24)2 ,
-2 ¿cuál es el error de redondeo? (b) Responda la misma pregunta,pero ahora para 2/7.
Pero 14. ¿Es to - T24) un número máquina en laMARC-32? Fundamente su respuesta.
lin -xi� lin -x.l + lxn -xi� X 10-m + lxn -xj.
1 15. Sean xi, x2, ..., Xn números máqnina positivos en la MARC-32. Tómese s. como la suma
2 x1 +x2+...+xn y as; como la correspondiente suma en la computadora. (Suponga que
Esta desigualdad no se puede mejorar, y demuestra que, a menos que x. = x, no podemos la suma se efectúa en el orden dado.) Demuestre lo siguiente: Si x;+1 � T24 S; para cada i
entonces
lograr que li n - xi� X 10-m.
! ¡s; -s.J/Sn:;; (n -1)2-24
Es más realista pedir que lin -xi < fo x 10-m. Esto nos lleva a requerir que Xn
satisfaga lo siguiente: 16. Demuestre el sensible aumento de precisión de la desigualdad (7)
x-x· ¡ 1
X 10-m + lxn -xi < X 10-m, (10) l--<--
X = 1+224
1 6
2 !O
para la representación de números en laMARC-32.
o que lxn - xi < 10-m-l. De este requisito se puede calcular n. La desigualdad es
equivalente a 17. ¿Cuántos números máquina normalizados existen en la MARC-32? (No tome en cuenta el
25. En este problema utilice laMARC-32. Detennine una cota para el error relativo que surge al entre la Tierra y Júpiter sería algo asombroso, ¡pero no sería aceptable que un cirujano
calcular (a+ b)/(c +d) para números máquina a, b, e, d. cometiera un error de esa magnitud al efectuar una incisión!)
26. ¿Cuáles de los siguientes son números máquina en la MARC-32? (i) 1040 (ii) Z- 1 + Z-26 Ya hemos considerado errores relativos en nuestro análisis de los errores de redon
(iii) 1/5 (iv) 1/3 (v) 1/256 deo. La desigualdad
(
¡x-f x) �e
I
27. Seax = 2 16 +Z- 8 +Z-9 +Z- 10• Seax• el número máquina más cercano ax en laMARC-32.
¿Cúal es el valor de lx -x· ¡?
28. Critique el siguiente argumento: al combinar aritméticamente dos números máquina en la es una declaración acerca del error relativo implicado en la representación de un número
MARC-32, el error de redondeo relativo no puede exceder Z-24• Por lo tanto, al combinar n real x mediante un número máquina de punto flotante cercano.
de dichos números, el error de redondeo relativo no puede exceder (n - l )Z- 24•
29. Seax=2 12 +Z- 12. Pérdida de dígitos significativos
(a) Calcule en laMARC-32 los números máquinax' yx" que se encuentran justo a la derecha
y a la izquierda dex, respectivamente. A pesar de que los errores de redondeo son inevitables y difíciles de controlar, se
(b) Para este número, pruebe que el error relativo entre x yft(x) no es mayor que el error de da otro tipo de errores que sí podemos someter a nuestro control Una de las grandes
redondeo unitario en laMARC-32. preocupaciones del análisis numérico consiste en entender y controlar varios tipos de
30. ¿ Que error de redondeo relativo puede surgir al calcular el producto den números máquina en errores. A continuación nos ocuparemos de un tipo de error que con frecuencia aparece
laMARC-32? ¿Cómo cambia su respuesta si los n números no son necesariamente números como consecuencia de descuidos durante el proceso de programación.
máquina (pero se encuentran dentro del rango de la máquina)? A fin de ver el tipo de situación en que puede producirse un error relativo de gran
31. Dé ejemplos de números reales x y y para los cuales ft(x 0 y) ,t. ft(fl(x) 0 ft(y)). Ilustre las magnitud, vamos a considerar una resta entre dos números cercanos entre sí. Por ejemplo,
cuatro operaciones aritméticas utilizando una máquina con cinco decimales.
32. Si escribimos IT=1(1 +o;) = 1 +e, donde lo,! � Z-24. ¿cúal es el rango de valores posibles X= .3721478693
para e? ¿Es !el � n2�24 una cota acorde con la realidad? y = .3720230572
33. Suponga que los números Z1, z2 •... se calculan a partir de los datosx, a1, a2,... mediante el X - y= .0001248121
algoritmo z1 = a1, Zn = xz._1 +a. paran f 2. (Éste es el algoritmo de Homer.) Suponga
que los datos son números máquina. Demuestre que los Zn obtenidos en la computadora son
los números que resultarían al aplicar una aritmética exacta a los datos perturbados. Acote Si los cálculos se llevaran a cabo en una computadora decimal con mantisa de cinco
la perturbación en términos del error de redondeo unitario de la máquina dígitos, veríamos que
34. La cantidad (1 + el"- 1 se presenta en el teorema de esta sección. Pruebe que si ne< .01, jl(x) = .37215
entonces (1 +e)"- 1 < .01006.
jl(y) = .37202
35. Demuestre la ecuación (1O) utilizando las hipótesis dadas en el texto.
jl(x)- jl(y) = .00013
36. ¿Cúantos números de punto flotante hay entre potencias de 2 sucesivas en laMARC-32?
37. ¿Qué otros números, además de los enteros positivos, pueden utilizarse como base de un Por lo tanto, el error relativo es muy grande:
sistema numérico? Por ejemplo, ¿podemos utilizar 11?
x -y- (fi(x)-jl(y)] = \.0001248121- .000131 � 4%
I
l X- y . .0001248121
2.2 Errores absolutos y errores relativos; pérdida de dígitos significativos Siempre que la computadora deba desplazar dígitos en la mantisa para lograr un número
de punto flotante normalizado, se añadirán ceros en el lado derecho. Estos ceros ca
Cuando se aproxima un número real x mediante otro número x*, el error que resulta es recen de sentido y no representan una exactitud adicional. Por lo tanto jl(x)- jl(y) se
x-x•. El error absoluto es representa en la computadora como .13000 x 10-3, aunque los ceros en la mantisa sólo
lx-x•¡ sirven para denotar el lugar decimal.
y el error relativo es
¡x �x· ¡. Sustracción de cantidades casi iguales
Como regla, deberemos evitar situaciones en las que la exactitud se pueda ver
En las mediciones científicas es usualmente el error relativo el que resulta relevante. La comprometida por restar cantidades casi iguales. Un programador precavido estará
información acerca del error absoluto suele ser poco útil si no se conoce la magnitud de alerta para evitar este tipo de situaciones. Consideremos el siguiente ejemplo con el fin
la cantidad que se está midiendo. (Un error de sólo un metro al determinar la distancia de ilustrar lo que se puede lograr al volver a programar.
44 Capítulo 2 Aritmética de la computadora 2.2 Errores absolutos y errores relativos; pérdida de dígitos significativos 45
x3 x5 x
- ---+--···
1
Teorema sobre la pérdida de precisión
3! 5! 7!
La siguiente es una pregunta interesante: ¿cuántos bits significativos se pierden al Si x está cerca del cero, entonces se puede utilizar una serie truncada, tal como se hace
efectuar la sustracción x- y cuando x es cercano a y? Una respuesta precisa depende en este enunciado de asignación:
de los valores particulares de x y y. Sin embargo, podemos obtener cotas en términos de
la cantidad J1- y/xi, la cual resulta una medida conveniente de la cercanía entre x y y. y+- (x3 /6)(1- (x2/20)(1- (x2/42)(1-x2/72)))
El siguiente teorema proporciona cotas superiores e inferiores de mucha utilidad. (El
teorema es válido para todo tipo de máquina.) Si se necesitaran valores de y para un rango amplio de valores dex en esta función, sería
mejor emplear ambos enunciados de asignación, cada uno en su propio rango intervalo.
TEOREMA Si x y y son números de máquina binarios normalizados de puntoflotante, positivos, y En este ejemplo se necesita ampliar el análisis con el fin de determinar el rango
tales que x > y con intervalo apropiado de los valores dex para cada uno de estos enunciados de asignación.
Z-q -
:S 1- � :S 2-P, Utilizando el teorema sobre pérdida de precisión, observamos que la pérdida de bits en la
x-
entonces en la resta x- y se pierden a lo más q, y al menos p bits significativos.
sustracción del primer enunciado de asignación puede limitarse a un bit cuando mucho
si se restringe x, de tal forma que
Demostración Demostraremos el caso de la cota superior y dejaremos el de la cota inferior como
ejercicio para el lector. Las formas de punto flotante binarias normalizadas para x y y 1-�>�
=2
X
son:
(Aquí estamos considerando sólo el caso en que senx > 0.) Con una calculadora resulta
x = rx2" (! � r<1) sencillo determinar que x debe ser por lo menos 1.9. Así, para Jxl � 1.9, deberemos
y = sx2m (!�s<l). utilizar el primer enunciado de asignación que implica x - senx, y para lxl <1.9
Dado que x es mayor que y, la computadora quizá tenga que desplazar y de manera que deberemos utilizar una serie truncada. Podemos verificar que, en el peor de los casos,
su exponente sea el mismo que el de, x antes de restarle y. Por consiguiente, debemos (x = 1.9) con siete términos de la serie se obtiene y con un error máximo de 10- 9.
escribir y como: (Véase el problema 33.)
Si se quiere construir un subprograma para y = x - senx utilizando un cierto
{
y = (s X 2m-n) X 2",
número de términos de la serie anterior, observe que cada término puede obtenerse del
y entonces tendremos que anterior mediante las fórmulas:
X -y = (r - S X 2m-n) X 2".
La mantisa de este número satisface t¡ ={
sx2 m
r - s X zm -n = r ( ¡ - -- ) = r (1- - <z-P.
y) -tnX2
T X zn X tn+l = ---------::;-
(2n+2)(2n+ 3)
(n � 1)
{
se pueden obtener inductivamente mediante: SERIE DE PROBLEMAS 2.2
1. ¿Cuántos bits de precisión se pierden en una computadora cuando efectuamos la sustracción
S¡ = t¡ x -senx parax = !?
Sn+l = Sn + tn+l (n � 1). 11 2. ¿Cuántos bits de precisión se pierden en la sustracción 1 -cosx cuando x = i?
En algunos casos la pérdida de dígitos significativos puede evitarse o mejorarse '3. Escriba y ensaye un programa para calcular
recurriendo a la doble precisión. En esta forma de cálculo a cada número real le corres
f(x) = ,/x2 +1 -1
ponden dos palabras de almacenamiento. Esto duplica, por lo menos, el número de bits
en la mantisa. Algunas partes cruciales del cálculo se pueden llevar a cabo en el modo de g(x) =i/(Vx2+ l+ 1)
doble precisión, a la vez que las partes restantes se efectúan en precisión sencilla. Esto
para una sucesión de valores dex, como: s- 1, 3-2, s-1, .... Aunque/= g, la computadora
resulta más económico que ejecutar el problema completo en el modo de doble precisión, dará resultados diferentes. ¿Cuáles de los resultados son de fiar y cuáles no?
en tanto que este modo aumenta el tiempo de cálculo ( y por ende el costo) por un factor
'4. Escriba y verifique una subrutina que ¡¡cepte un número máquina x y que proporcione el
que oscila entre dos y cuatro. Esto ocurre porque la aritmética de doble precisión suele
ejecutarse por medio del software, mientras que la aritmética de precisión sencilla se
=
valor y x -senx con casi toda la precisión de la máquina.
lleva a cabo mediante el hardware. 5. Encuentre una identidad trigonométrica adecuada para que 1 -cosx pueda calcularse con
precisión para valores pequeños de x. La identidad deberá llamar a las funciones del sistema
para senx o cosx. (Existen dos respuestas correctas.)
Evaluación de funciones 6. Encuentre, para la función del problema 5, una serie de Tay lar adecuada que se pueda calcular
con precisión.
Se presenta otra situación en la que tiene lugar una pérdida drástica de dígitos
significativos. Esto sucede para ciertas funciones cuando se evalúan en argumentos muy 7. Encuentre una forma de calcular,/x.4 +4 -2 sin que haya una pérdida inecesaria de dígitos
significativos.
=
grandes. Ejemplifiquemos esta situación con la función coseno, que tiene la propiedad
de la periodicidad: 8. Analice el problema de calcular senhx a partir de su definición: senhx f (e" -e-').
cos(x + 2mt) = cosx. 9. Al resolver la ecuación cuadrática ax + bx+e = O mediante la fórmula
2
Mediante el uso de esta propiedad la evaluación de cosx para cualquier argumento puede
efectuarse mediante el cálculo en un argumento reducido en el intervalo [O, 2it]. Las x = (-b± )b 2 -4ac)/(2a)
subrutinas de bibliotecas disponibles en las computadoras recurren a esta propiedad habrá una pérdida de dígitos significativos cuando 4ac sea pequeño comparado con b 2, ya
mediante un proceso llamado reducción de dominio. También se pueden utilizar otras que
propiedades, como: Vb 2 -4ac :.:e Jbl
cos(-x) = cosx = - cos(it - x).
Sugiera un método para soslayar esta dificultad.
Por ejemplo, la evaluación de cosx enx = 33278.21 se efectúa encontrando el argumento 1O. Sugiera cómo se podría evitar la pérdida de dígitos significativos en los siguientes cálculos:
reducido
(a) ,/x2 +1 -x (f) logx -1
y= 33278.21 - 5296 X 2it.
(b) logx -logy (g) (cosx -e-')/ senx
Aquí conservamos dos decimales en vista de que en el argumento original la exacti (c) X-'(senx - x) (h) senx -tanx
tud se limitaba a sólo dos lugares decimales. El argumento reducido posee tres cifras (i) senhx -tanhx
(d) vx+2 - .fi
significativas, aun a pesar de que el argumento original pueda haber tenido siete cifras sig
nificativas. Por lo tanto, el coseno tendrá a lo sumo tres cifras significativas. No debemos (e) e" - e U) ln(x +Vx2 +1) (Ésta es la función senh-1 x.)
caer en el error de pensar que la precisión infinita disponible para 5296 x 2it = 2.46 11. Para cualquier xo > -1, la sucesión definida recursivamente mediante
se transfiere al argumento reducido y. Tampoco debemos equivocarnos por la aparente 1
precisión en el resultado impreso de una subrutina. Si en la subrutina coseno se propor Xn+I = 2"+ [Vl +2-nx, -1]
ciona un argumento y con tres dígitos significativos, entonces el valor cos y no tendrá converge a ln(xo+1). (Véase Henrici (1962, p. 243].) Modifique esta fórmula de tal manera
más de tres cifras significativas, aun cuando aparezca como que no haya pérdida de dígitos significativos.
12. Ordene las siguientes fórmulas para calcular tanx - senx cuando x es próximo a O, de
cos(2.46) = -0.7765702835. acuerdo con su precisión
(La razón de ello es que la subrutina considera al argumento como si tuviera tanta (a) senx[(l / cosx) -!] (d) (x2/2)(1 -x2/12) tanx
exactitud como la que corresponde a la precisión de la máquina, lo cual, por supuesto, (b) fxl (e) fx2 tanx
no sucede.) (c) (senx)/(cosx) -senx (f) tanxsen2x/(cosx+1)
48 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 49
13. Encuentre maneras de calcular las siguientes funciones sin que haya una pérdida de dígitos 24. La serie I::1 k-1 se conoce como serie armónica. Es una serie divergente. Las sumas
significativos seria: parciales s. = I:;= 1 k-1, pueden calcularse recursivamente al establecer S1 = 1 y utilizar
(a) (l-x)/(I+x)-I/(3x+I) (c) é- cosx- senx s. = s.-1 + n-1. Si este cálculo se efectuase en su computadora, ¿cuál sería la mayor s.
que se obtendría? (No intente hacerlo experimentalmente en su computadora; es demasiado
(b) )x+l/x-)x-I/x costoso. Vea Schechter [1984].)
c¡4_ Use su computadora para imprimir los valores de las funciones 25. Encuentre una forma de calcular con precisión/(x) = x+ e' - e3' para valores pequeños
dex.
- -
f(x) = x8 - 8x1 + 2sx6 56.x5 + 1oi 56.x3 + 28x - 8x+ 1
2
26. (a) Encuentre una manera de calcular con precisión para valores cercanos al cero la función
g(x) = (((((((x - 8)x+ 28)x - 56)x+ 70)x - 56)x+ 28)x - 8)x+ 1
8
f(x) = (e""'' - e')/x3
h(x) = (x - 1)
(b) Determine lím,-o/(x).
en 101 puntos igualmente espaciados y que cubran el intervalo [0.99, 1.01]. Calcule cada 27. Explique por qué no hay una pérdida seria de dígitos significativos debida a la sustracción
función en fonna directa sin que tenga que agrupar o factorizar. Observe que las tres funciones si se emplea la aproximación
son idénticas. Explique por qué no todos los valores impresos son positivos, como debiera
suceder. Si dispone de una graficadora, utilícela para hacer el gráfico de estas funciones X- Senx::::,: (x3 /6)(J - (i/20)(1 - :i2 /42) )
cerca de 1.0, empleando una escala que agrande los valores de la función de manera que se
observen las variaciones implicadas. (Véase Rice [1983].) 28. Al calcular la suma de una serie infinita I:: 1 x., suponga que se desea una respuesta que
15. Discuta el cálculo de e-' para x > O a partir de la serie tenga un error absoluto menor que e. ¿Causa problemas detener la suma de ténninos cuando
la magnitud de éstos es menor que e? Ejemplifique esto con la serie I:: 1 (0.99)".
2
-, =I-x+ x x3 29. Repita el problema 28 con las suposiciones adicionales de que los términos x. toman valores
e -3!+··· positivos y negativos de manera alternada, y que fx.f converge monótonamente a O. (Utilice
21
un teorema del cálculo referente a las series alternadas.)
Sugiera una mejor forma de efectuar el cálculo, suponiendo que no se dispone de la función
del sistema para e'. 30. Muestre que si x es un número máquina en la MARC-32 y si x > 1t. 225 , entonces cosx se
calculará sin dígitos significativos.
'16. Escriba y verifique uncódigo que proporcione valores precisosde 1-cosxpara-¡¡ � x � 1t. c31. Un experimento numérico interesante consiste en calcular el producto escalar de los siguien
Cerca del cero utilice una serie de Taylor y en otro caso el subprograma para el coseno. tes dos vectores:
Determine con cuidado el dominio donde deberá utilizarse cada método, de tal manera que
se pierda a lo sumo un bit. X= [2.718281828, -3.141592654, J.414213562, Ü.5772156649, 0.3010299957]
'17. Escriba y verifique un subprograma función para/(x) = X-2 (1 - cosx). Evite la pérdida y= [1486.2497, 878366.9879, -2237492, 4773714.647, 0.000185049]
de dígitos significativos en la sustracción para todos los argumentos de x, y (por supuesto) Calcule el sumatorio de las cuatro fonnas siguientes:
tenga cuidado con la dificultad que representa x = O.
(i) en orden ascendente I;;=1x,y,
18. Para algunos valores de x habrá una cancelación por sustracción al calcularf(x) = 1+cos x.
¿Cuáles son estos valores de x y cómo puede evitarse la pérdida de precisión? (ii) en orden descendente I:'.=•x,y,
(iii) en orden del mayor al menor (sume los números positivos, de mayor a menor, luego
19. Considere la función/(x) = ..- 1 (1 - cosx) . sume los números negativos de menor a mayor, y luego sume ambos resultados parciales) .
(a) ¿Cuál es la definición correcta de/(0) ?, lo que es lo mismo: ¿cuál.es el valor que hace (iv) de menor a mayor (inversamente a como �e realizó la suma en el método anterior).
continua a/?
Utilice tanto la doble precisión como la precisión sencilla para un total de ocho respuestas.
(b) Si se emplea la fónnula dada, ¿en la vecindad de qué puntos ocurre una pérdida de dígitos
significativos? Compare los resultados con el valor correcto con siete decimales 1.006571 x 10-9 . Justifique
sus resultados.
(c) ¿Cómo se puede evitar la dificultad que aparece en (b)? Encuentre un método que no use
la serie de Taylor. '32. (Continuación) Repita el problema anterior, pero elimine el 9 final de X4 y el 7 final de x5•
(d) Si la nueva fórmula que proporcionó en (c) comprende una cancelación por sustracción ¿Qué efectos provoca este pequeño cambio en los resultados?
en algún otro punto, describa cómo evitar dicha dificultad. 33. Demuestre, utilizando el ténnino de error del teorema de Taylor, que se requieren al menos
siete términos en la serie del ejemplo 2 si se desea que el error no exceda 10-9•
20. Sea/(x) = -e-2x +i!. ¿Cuál de estas fónnulas para/ es más exacta para valores pequeños
dex? (i) x (ii) 3x (iii) 3x( l-x/2) (iv) 2-3x
(v) lf( l - e3')
2.3 Cálculos estables e inestables; condicionamiento
21. Si en el cálculo de y = .¡x2 + 1-1 se pierden a lo sumo 2 bits de precisión, ¿qué restricción
se debe imponer ax?
22. ¿Para qué rango de valores de 9 aporta la aproximación sen 9 :::::: 9 resultados correctos hasta En esta sección presentarnos otro tema que aparece con frecuencia en el análisis numé
tres posiciones decimales (redondeadas) ? rico: la distinción entre los procesos numéricos que son estables y los que no lo son. Dos
23. ¿Cuán buena resulta la aproximación cosx:::::: 1 para valores pequeños dex? ¿Cuán pequeño conceptos estrechamente relacionados con ellos son los de problema bien condicionado
debe ser x para una precisión de 4 x 10-8 ? y problema mal condicionado.
50 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 51
Inestabilidad numérica Por lo tanto, este algoritmo es inestable. Cualquier error que se presente en Xn se
multiplica por 13/3 al calcular Xn+l· Existe por ende una posibilidad de que el error
De manera informal decimos que un proceso numérico es inestable cuando los pe enx1 se propague ax15, aumentado en un factor de (13/3) 14 • Ya que el error absoluto en
queños errores que se producen en alguna de sus etapas se agrandan en etapas posteriores x1 es aproximadamente 10-s y que (13/3) 14 es casi igual a 109 , el error en x15, debido
y degradan seriamente la exactitud del cálculo en su conjunto. exclusivamente al error eilx1, podría alcanzar el valor de 10. De hecho, los errores de
Un ejemplo nos permitirá explicar este concepto. Considere la sucesión de números redondeo adicionales surgen al calcular cada uno de losx2,x3, .•• y estos errores quizá
reales definida inductivamente mediante también se propaguen hastax1s con varios factores de la forma (13/3f
1
Otra manera de explicar este fenómeno es observando que la ecuación (1) es una
Gr
Xo = , X¡ ecuación en diferencias cuya solución general es
3
=
(1)
Xn+I = �Xn - ixn-1 (n � 1). Xn =A +B(4)".
{
or
Es fácil observar que esta relación de recurrencia genera la sucesión Tanto A como B son constantes determinadas por los valores iniciales x0 yx1. (El lector
debería consultar la sección 1.3 para conocer la teoría de las ecuaciones en diferencias
Xn = (2) lineales.) Aunque sólo deseamos calcular la solución de (2) correspondiente a A = I y
B = O, resulta imposible evitar la contaminación debida a la componente no deseada 4".
Esta última dominará eventualmente a la solución deseada.
De hecho, es obvio que la ecuación (2) se cumple paran = O y 1. Admitiendo su validez El que un proceso sea numéricamente estable o inestable debería decidirse con base
para n ;;; m, entonces su validez para n = m + 1 se comprueba escribiendo en los errores relativos. Así, si hay errores grandes en un cálculo, la situación puede ser
del todo aceptable si los resultados son grandes. En el ejemplo anterior iniciamos con
13 4 13 l m 4 l m-l valores xo= 1 y X¡ = 4. La relación de recurrencia (1) se mantiene intacta y entonces
Xm+I =
3xm - 3xm-1 = 3 (3) - 3 (3) los errores continuarán propagándose y creciendo como antes. Sin embargo, ahora la
1 +l
or-l [ �J or
solución correcta es Xn = 4'" y los resultados del cálculo son correctos hasta la séptima
cifra significativa. A continuación presentamos algunos de ellos:
= =
:-
X1 = 4.000006
Si la definición inductiva (1) se utiliza para generar numéricamente la sucesión, por
ejemplo en la MARC-32, entonces algunos de los términos calculados tendrán una gran X10 = J.048576 X 106
falta de precisión. A continuación presentamos algunos de ellos, calculados en una Xzo = 1.099512 X ]012
computadora de 32 bits similar a la MARC-32.
En este caso los valores correctos son suficientemente grandes como para opacar los
Xo = l. 0000000
errores. Los errores absolutos sin duda son grandes (como antes) pero son relativamente
X¡ = 0.3333333 (7 dígitos significativos correctamente redondeados)
despreciables.
Xz = 0.1111112 (6 dígitos significativos correctamente redondeados)
Otro ejemplo de inestabilidad numérica lo proporciona el cálculo de los números
X3 = 0.037Q373 (5 dígitos significativos correctamente redondeados)
X4 = 0.0123466
X5 = 0.0041187
X6 = 0.0013.857
(4 dígitos significativos correctamente redondeados)
(3 dígitos significativos correctamente redondeados)
(2 dígitos significativos correctamente redondeados)
Yn = [x"i!dx (n � 0). (3)
X7 = 0.0005131 (1 dígitos significativos correctamente redondeados)
Xg :::: 0.0003757 (O dígitos significativos correctamente redondeados) Si aplicamos la integración por partes en la integral que define a Yn+I se obtiene la
X9 = 0.0009437
siguiente relación de recurrencia:
XlQ = 0.0035887
X¡¡ = 0.0142927 Yn+I = e - (n + l)Yn· (4)
X¡z = 0.0571502
X13 = 0.2285939 De lo anterior y del hecho evidente de que y0 = e - 1 obtenemos y1 :
X¡4 = 0.9143735
x15 = 3.657493 ((2) incorrecto con error relativo de 108) YI = e - Y o= e - (e - 1) = 1
52 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 53
Utilizando la relación (4) e iniciando con y¡ = 1 generemos Y2, y3, ... , y1s en una Respuesta Seaf(x)=sen- 1 x. Entonces
computadora similar a la MARC-32. Algunos de los resultados son:
xf'(x) X
=
Y2=.7182817 f(x) v'l-x 2 sen- 1 x
Yll = 1.422453
Para x próxima a 1, sen- 1 x � 1t/2, y el número de condición se vuelve infinito conforme
y¡5 = 39 711.43
x se acerca a !, ya que se aproxima mediante 2x/(itv'l-x2 ). Por lo tanto, pequeños
errores relativos en x pueden conducir a grandes errores relativos en sen- 1 x cerca de
Estos no pueden ser correctos. De hecho es obvio, como se deduce de (3), que la sucesión x=l. •
y satisface y¡ > yz > ... > O y que el límn-oo Yn = O. (Ciertamente, para O < x < 1,
la expresión x. decrece monótonamente hacia cero.) Una vez sabido esto, a partir de la Consideremos ahora el problema de localizar un cero (o raíz) de una función! (En
ecuación (4) vemos que lím._ (n +l)y. = e. el capítulo 3 este problema se estudia desde el punto de vista algorítmico.) Sean f y g
dos funciones de clase C2 en una vecindad de r, donde r es una raíz de f
00
Así, sif'(x) no es muy grande, el efecto de la perturbación sobref(x) es pequeño. Sin Obviamente las raíces def son los enteros 1, 2,... 20. ¿Cómo se altera la raíz r = 20
embargo, usualmente en estas cuestiones es el error relativo el que resulta significativo. cuandof se perturba af +i:g? La respuesta es
Al perturbar x en una cantidad h tenemos que h/ x es el tamaño relativo de la perturbación.
Igualmente, cuando se perturba a f(x) y se obtiene f(x +h), el tamaño relativo de la g(20) 20 20
perturbación es h � -i:-- = -i:- �-elO9
!'(20) 19!
f(x+ h)- f(x) � hf'(x) = [xf'(x)] (�)
f(x) f(x) f(x) x Por tanto, un cambio de magnitud e en el coeficiente de x20 de f(x) puede provocar
una perturbación de la raíz 20 del orden de 109 e. Por consiguiente las raíces de este
por consiguiente, el factor xf'(x)/f(x) sirve como un número de condición para el polinomio son sensibles en grado sumo a las perturbaciones en los coeficientes. (Véase
problema. el problema 15.)
Otro tipo de número de condición aparece asociado c�n la solución de sistemas
Ejemplo ¿Cúal es el número de condición para la evaluación ·de la función arco seno? lineales de la forma Ax=b; esto se discutirá con detalle en la sección 4.4. De manera
54 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 55
breve, el número de condición de la matriz A se denota con K(A) y se define como el SERIE DE PROBLEMAS 2.3
producto de las magnitudes de A y su inversa; es decir, l. Encuentre la solución analítica de esta ecuación en diferencias con los valores iniciales dados:
debe considerarse con un alto grado de escepticismo. <3_ Las funciones de Bessel Y. satisfacen la misma fónnula de recurrencia que las funciones J•.
La matriz de Hilbert de orden n, Hn = (hij ), se define por hij =1/(i+j - 1) , (Véase la Sec. 1.3.) Sin embargo, utilizan distintos valores iniciales. Parax = 1 éstos son:
donde 1 � i � n y 1 � j � n. Esta matriz se utiliza con frecuencia para llevar a cabo
Yo = O.08825 69642 f¡(l) = -0. 78121 2 821 3
comprobaciones, debido a su naturaleza mal condicionada. De hecho, K(Hn ) aumenta
rápidamente con n, como puede apreciarse en la fórmula K(Hn ) = ce35". Este número Calcule Y2(l), Yi(l), ... , Y20(1) usando la fónnula de recurrencia. Trate de decidir si los
de condición se ha calculado utilizando la norma IIAII = máx.i,j lal Un problema de resultados son o no confiables.
prueba interesante consiste en resolver el sistema linealHnx = ben una computadora con 4 . Las integrales exponenciales son las funciones E n definidas por
valores crecientes den y con b; = I::7=1 hij· La solución deberá ser x = (1, 1, ... , 1)7:
Para valores pequeños den la solución calculada es muy exacta, pero conformen aumenta
la precisión se deteriora rápidamente. De hecho, cuando n es aproximadamente igual
E,(x) = j00(l't")- 1
dt (n � O,x> O).
t
j=O
aj [ xiJ d:x =[ xi¡'(x) d:x
O O
(O� i � n).
precisión deberán emplearse al calcular y¡, y2, ... , y20, si deseamos que y20 sea exacta hasta
5 decimales?
8 . Existe una función! de la forma
la matriz de coeficientes en las ecuaciones normales es la matriz de Hilbert de orden Xn = 2xn-1 + Xn-2
n+ l. Las funciones x -,. xi forman una base muy mal condicionada del espacio de tiene una solución general de la forma
polinomios de grado n. Una buena base para este problema puede ser proporcionada por
un conjunto ortogonal de polinomios. Esto se estudiará en la sección 6.8. Xn= A7'."+Bµ"
56 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 57
¿Es esta relación de recurrencia una buena forma de calcular x. a partir de cualesquiera Use una rutina que sea capaz de calcular raíces complejas con doble precisión. La expresión
valores iniciales xo y xi? dada para P es la forma desarrollada del polinomio de Wilkinson discutido en el texto:
10. La sucesión de Fibonacci se genera mediante las fórmulas
p(x) = (x - 20)(.x - 19)(.x - 18)(.x - 17)(.x - 16)(.x - 15)(.x - 14)
ro= J r¡ = J Tn+I = Tn+rn-1,
x (x - 13)(x - 12)(.x - l l)(x - IO)(x - 9)(x - 8)(x - 7)
de modo que la sucesión inicia como 1, 1, 2, 3, 5, 8, 13, 21, 34, .... Demuestre que la x (x - 6)(x - 5)(x - 4)(x - 3)(x - 2)(x - 1).
sucesión [2rn /rn-i] converge a 1 + Js. ¿La convergencia es lineal, superlineal, cuadrática?
11. (Continuación) Si la relación de recurrencia en el problema anterior se usa con valores Verifique las raíces calculadas Zk, con k = 1, 2, ... , 20, mediante el cálculo de fP(Z1c)f,
iniciales ro = I y r1 = (1 - Js)/2, ¿cuál es en teoría el valor correcto de rn (n f; fp(Z1c)f, Y IZic - kf. Explique su respuesta.
2)? ¿Proporcionará dicha relación de recurrencia una manera estable de calcular r. en este (b) Repita el apartado (a) ocho veces después de cambiar el coeficiente de x2º de P(x) por
caso? 1 + e, donde e = 10-21< para k = 8, 7, ... , l. ¿Coinciden sus resultados de computadora
'12. (Dahlquist) Se define con el análisis presentado en el texto? Explique la respuesta.
¡
Xn = ¡ t"(t+5)-I dt. (c) Wtlkinson demostró que al cambiar el coeficiente -210 por -210 - Z-23 las raíces 16
y 17 se transforman en el par complejo 16.73 ...± i2.8I2 .... Reproduzca este experimento
numérico.
Demuestre que xo = In 1.2 y que Xn = n-1 - 5xn-I paran= 1, 2, .... Calcule xo, X¡, ... ,
x10 utilizando esta fórmula de recurrencia y dé una estimación de la precisión de x10. Nota Cultural A finales de la década de los cuarenta, Jim Wilkinson era un joven científico
'13. (Continuación) Encuentre una manera de calcular con exactitud xzo, quizá reemplazando el que trabajaba con Alan Turing y otros en el National Physical Laboratory en Inglaterra.
integrando por una serie de Taylor truncada. Después de calcular xzo con toda la precisión El proyecto que interesaba a este grupo era una nueva máquina llamada la computadora
Pilot ACE. Con el fin de hacer una prueba de rutina en la máquina, escribió un programa
que puede aportar la máquina, use la recursión hacia atrás para obtener X19, x1s, ... , xo. ¿Es
correcto el valor de xo? ¿Qué se puede decir respecto de las otras Xn ? ¿Se comporta de sirviéndose del método de Newton para calcular las raíces de este polinomio. Sin esperar
manera distinta la relación recursiva cuando se emplea en forma regresiva? Si así sucede, que apareciera algún tipo de dificultades, inició la iteración de Newton conxo = 21 y supuso
explique por qué. que habría una convergencia rápida hacia la raíz más grande, en este caso 20. Al suceder que
los resultados numéricos no eran los esperados, se dedicó a investigar un poco más este
'14. Si se usa unan descendente las funciones de Bessello(x), 11 (x), ... pueden calcularse usando asunto. A la larga, éste y otros experimentos numéricos lo llevaron a desarrollar un área
la relación de recurrencia de la sección 1.3. Así, iniciamos con n = N y procedemos completamente nueva de la matemática numérica: el análisis regresivo del error. Para más
regresivamente con la fórmula detalles sobre el trabajo de James Hardy Wilkinson se puede consultar la obra Biographical
2n Memoirs of Fellows of the Royal Society, de L. Fox (1987].
ln-1 (x) = -Jn(x) -ln+I (x) (n = N, N - 1, ... , 1)
Para empezar establecemos lN+I (x) = O y lN (x) = l . Éstos son valores aproximados.
Después de calcular IN-1 (x), lN-z(x), ... , lo(;c), los multiplicamos por un factor (es decir,
reemplazamos In por V.) usando la identidad
¿ I.(x) = l .
00
lo(x)2 + 2 2
n=l
Obviamente N debe ser suficientemente grande como para que el valor supuesto para
lN+i(x) = O sea razonable para la precisión esperada. Esta técnica la desarrolló J. C. P.
Miller. Tomando N = 51 en el proceso descrito anteriormente calcule 10(1), 11 (1), ...,
lso(I).
'15. (El Polinomio Pérfido, Wilkinson (1984])
(a) Usando una subrutina para encontrar raíces, tomada de la biblioteca de programas de su
centro de cálculo, calcule las 20 raíces del polinomio P, donde:
19 18 17 16
P(x) = x2° - 210x + 20615x - !256850x + 53327946x
15 14 13
- 1672280820x + 40171771630x - 756111184500x
12
+ 11310276995381x - 135585182899530x 11
+ 1307535010540395x 10 - 10142299865511450x9
+ 63030812099294896x8 - 311333643161390640x7
+ 1206647803780373360x6 - 3599979517947607200.x5
4
+ 803781182264505!776x - 12870931245150988800x3
+ 13803759753640704000x2 - 8752948036761600000x
+ 2432902008176640000.
Capítulo 3
x-tanx = O
x-asenx=b
Sif es una función continua sobre el intervalo [a, b] y sif(a)f(b) < O, entonces! debe
( , b). Dado que f(a)f(b) < O, la función f cambia de signo en el
tener un cero en a
intervalo [a, b] y, por lo tanto, tiene por lo menos un cero en el intervalo. Ésta es una
consecuencia del teorema del valor intermedio para funciones continuas, que establece
que sif es continua en [a, b], y se satisface la desigualdadf(a) < y < f(b), entonces
f(x) = y para algún x E (a, b).
El método de bisección explota esta idea de la siguiente manera: síf(a)f(b) < O,
entonces calculamos e = !(a+ b) y averiguamos sif(a)f(c) < O. Si lo es, entonces f
tiene un cero en [a, e]. A continuación rebautizamos a e como by comenzamos una vez
más con el nuevo intervalo [a, b], cuya longitud es igual a la mitad del intervalo original.
59
3.1 Método de bisección 61
60 Capítulo 3 Solución de ecuaciones no lineales
Sif(a)f(c) > O entoncesf(c)f(b) < O, y en este caso rebautizamos a c como a. En ambos Cuando se usó el algoritmo de la bisección en una computadora similar a la MARC-32 se
casos se ha generado un nuevo intervalo que contiene un cero de f, y el proceso puede obtuvo la siguiente lista de datos de salida, empezando con el intervalo [-4, -3]:
repetirse. Claro está que sif(a)/(c) = O, entoncesf(c) = O y con ello se ha encontrado k c f(c)
un cero. Sin embargo, debido a los errores de redondeo, es poco factible que en la 1 -3.5000 -0.321
computadoraf(c) sea cero. Así, el criterio para concluir no deberá depender de que 2 -3.2500 -0.694 X 10-l
f(c) = O. Se debe permitir una tolerancia razonable, tal como \f(c)\ < 10-s en la MARC- 3 -3.1250 0.605 X 10-l
32. (Para una descripción de la computadora hipotética MARC-32 puede consultarse
la sección 2.1.) La figura 3.1 muestra los dos casos, suponiendo queJ(a) > O > J(b). La
ilustración hace patente por qué el método de bisección encuentra un cero, mas no todos, 14 -3.1830 0.193 X 10-4
en el intervalo [a, b]. El método de la bisección también se conoce como método de la 15 -3.1831 -0.124 X 10-4
bipartición. 16 -3.1831 0.345 X 10-5 11111
Varias de las partes de este seudocódigo necesitan una explicación adicional. En pri
f(b)
f(x) mer lugar, el punto medio c se calcula comoc <- a+(b-a)/2, en lugar de c +- (a+b)/2.
Al hacerlo así se sigue la estrategia general de que, al efectuar cálculos numéricos, es
mejor calcular una cantidad añadiendo un pequeño término de corrección a una apro
Figura 3.l(b) El método de la bisección elige el subintervalo derecho. ximación obtenida previamente. Forsythe, Malcolm y Moler [1977, pág. 162] dan un
ejemplo en el que el punto medio c, calculado mediante (a+ b)/2 en una computadora
con precisión limitada ¡se sale def intervalo [a, b]! En segundo lugar, es mejor determi
Ejemplo 1 Use el método de la bisección para encontrar la raíz más cercana a O de la ecuación nar si la función cambia de signo en el intervalo recurriendo a que signo(w) ;1: signo(u),
i' = senx en lugar de utilizar que wu < O, ya que esta última requiere de una multiplicación in
Respuesta Si se esbozan las gráficas de i' y sen x, resulta evidente que no existen raíces positivas de necesaria. Por otra parte, e corresponde al cálculo de la cota del error que se establece
f(x) = i' - senx y que la primera raíz a la izquierda del O está en el intervalo [-4, -3]. en el teorema que se verá más adelante. Finalmente hay que darse cuenta de que en el
62 Capítulo 3 Solución de ecuaciones no lineales 3.1 Método de bisección 63
satisfaga. Por ejemplo, considere las dos curvas de la figura 3.2. En el caso (a) la gráfica
f es casi horizontal cerca del cero, lo cual corresponde a una raíz múltiple, y el método de
bisección puede presentar dificultades al determinar este cero con una precisión alta. La
curva (b) obviamente no es continua, pero la continuidad de una función puede resultar
difícil de verificar previami:me. A pesar de que éstos son ejemplos patológicos, optemos
por detener la ejecución del algoritmo cuando cualquiera de los tres criterios se satisfaga.
Esto con el fin de tener un código robusto.
�l':I - l> X
Análisis de errores
Con el objeto de analizar el método de la bisección denotemos con [ao, b0], [a1, b ¡ ],
y así sucesivamente, a los intervalos que surgen en el proceso. Se puede hacer las
\f(c)\ <Epero\b-a\ >li siguientes observaciones sobre estos números:
f
ao � a¡ � a2 � · · · � bo (1)
bo � b1 ;:;; b2 ;:;; · · · ;:;; ao (2)
Figura 3.2(a) Fallo del criterio Jb - aJ < 6. 1
bn+I - ª•+l = (bn - a.) (n � 0).
2
(3)
algoritmo participan tres criterios para detener la ejecución del algoritmo. Primero, M Resumiendo lo anterior tenemos el siguiente teorema acerca del método de la bisección.
señala el máximo número de pasos que permitirá el usuario. Siempre se debe contar con
este tipo de resguardo para reducir la posibilidad de que el proceso de cálculo caiga en TEOREMA Si [ao, bo], [a¡, b ¡ ], ... , [an , bn], ... , denotan los intervalos en el método de la bisección,
un ciclo (loop, en inglés), infinito. Por otra parte, la ejecución del programa se puede entonces los límites lím....... ª• y lím....... bn existen, son iguales y representan un cero
00 00
detener, ya sea cuando el error es suficientemente pequeño o cuando lo es el valor de def Si r= lím....... Cn y Cn = !(an + bn ), entonces
00
f(c). Los parámetros 6 y e controlan esta situación. Se puede dar ejemplos en los que
se satisface uno de los dos criterios que detienen la ejecución del cálculo sin que el otro se [r - c.[ ;;;; r<n+l)(bo - ao).
64 Capítulo 3 Solución de ecuaciones no lineales 3.2 Método de Newton 65
Ejemplo 2 Supongamos que el método de bisección se inicia con el intervalo [50, 63]. ¿Cuántos 10. Encuentre una raíz positiva de
pasos deben darse para calcular una raíz con una precisión relativa de una parte en 10-12?
x2 - 4x senx+(2 senx)2 = O
Respuesta El requerimiento sobre la precisión relativa significa que
que sea exacta hasta la segunda cifra significativa. Use una calculadora.
Ir - c.1/lrl � 10-12•
I l. Considere el método de bisección y a [1.5, 3.5] como intervalo inicial
Sabemos que r � 50 y por lo tanto basta que se satisfaga la desigualdad (a) ¿Cuál es la longitud del intervalo en el paso n-ésimo?
(b) ¿Cuál es la máxima distancia posible entre la raíz r y el punto medio de este intervalo?
Ir - c.l/50 � 10-12• 12. Aplique el método de la bisección a una función continua para obtener intervalos [a0, bo],
[a1, bt ], y así sucesivamente. Sea r = límn-oo ª•· ¿Cuáles de los siguientes enunciados son
Por el teorema anterior inferimos que la siguiente condición es suficiente: falsos?
(a) ao � a1 � a2 � · · ·
r(n+l) X (13/50) � 10- 12.
(b) Ir- Z- 1(a.+b.)I � T"(bo -ao), (n?; 0)
Al igual que en la sección 3.1, nos encontramos frente a una función! cuyos ceros Solución El algoritmo precedente se ejecutó en una máquina con una mantisa de 48 bits en precisión
se han de determinar numéricamente. Sea r un cero def y sea x una aproximación ar. simple. (Los números de máquina de doble precisión tienen 96 bits, lo que corresponde
Sif" existe y es continua, por el teorema de Taylor sabemos que: aproximadamente a 28 cifras decimales.) La funciónf'(x) = e' - (1 +x2)-1, al igual
quef debieron programarse. Se eligió como punto inicial x0 = -7. Los resultados del
programa de cómputo son los siguientes:
O= f(r)= f(x +h)= f(x) +hf'(x) + O(h2),
k X f(x)
donde h= r - x. Si hes pequeña (es decir, x es próximo ar), es razonable ignorar el o - 7.00000000000000000000000000 -.702 X 10-l
término O(h2) y resolver el resto de la ecuación para h . En consecuencia, el resultado es 1 -10.67709617664001399296984386 -.226 X 10-l
h= -f(x)/f'(x). Si x es próximo ar, x-f(x)/f'(x) debería estar aún más próximo ar. 2 -13.27916737563271290859786319 -.437 X 10-2
El método de Newton comienza con una estimación Xo de r a partir de la cual se define 3 -14.05365585426923873474831753 -.239 X 10-3
inductivamente una sucesión de aproximaciones 4 -14.10110995686641347616312706 -.800 X 10-6
5 -14.10126977093941594621579506 -.901 X 10-ll
Xn+l = Xn -
f(Xn)
(n � 0). (1) 6 -14.10126977273996842508300314 -.114 X 10-2o
f'(Xn) 7 -14.10126977273996842531155122 -.000
8 -14.10126977273996842531155122 -.000
Algoritmo de Newton
Los resultados muestran una rápida convergencia de las iteraciones. De hecho, en cada
El siguiente es un algoritmo muy simple que realizaM pasos del método de Newton paso el número de dígitos correctos parece duplicarse. Nuestro análisis revelará por qué
a partir de un valor inicial x: sucede esto. 1!11
inputx, M
Interpretación gráfica
Y,._ f(x)
output O, x, y Antes de someter a examen las bases teóricas del método de Newton, consideremos
for k= 1, 2, . . . , M do su interpretación gráfica. Si tomamos como base su descripción, podemos decir que el
X,._ X - yjf'(X) método de Newton consiste en la linealización de la función. Es decir,! se reemplaza
y,._ f(x) por una función lineal. La manera usual de hacerlo es reemplazarf por los dos primeros
output k, x, y términos de su serie de Taylor. De este modo si
end.
f(x)= f(c) +!'(c)(x - c) + �!"(c)(x - c)2 + · · ·
Un seudocódigo más detallado, que incluye criterios de suspensión de la ejecución, es
el siguiente:
entonces la linealización ( en c) produce la función lineal
inputxo, M, 8, E
v <--- f(xo )
f(x)= f(c) +f'(c)(x - c).
output O, xo, v
if lvl < s then stop
Obsérvese que fes una buena aproximación def en una vecindad de c; de hecho, tenemos
for k= I, 2, . . . , M do
que f(c)= f(c) y f'(c)= f'(c). Así, la función lineal tiene el mismo valor y la misma
X¡,._ xo - v/f'(xo)
V,._ j(X¡) pendiente que la función! en el punto c. De este modo, lo que hacemos en el método
outputk,x1, v de Newton es construir la tangente a la gráfica def en un punto cercano ar, y observar
if x
l 1 -xol < 8 or lvl < s then stop en qué lugar interseca esta línea al eje x. (Véase la Fig. 3.3.)
xo ,._ x1 end. Con esta interpretación gráfica en mente, podemos imaginar con facilidad funcio
nes y puntos iniciales para los que la iteración de Newton fracasa. En la figura 3.4
Cualquier programa para computadora que se base en alguno de estos algoritmos reque mostramos una de estas funciones. En este ejemplo la forma de la curva es tal que
rirá subprogramas o procedimientos para calcularf(x) y f'(x). para ciertos valores iniciales la sucesión [x.] diverge. Lo que todo esto significa es que
cualquier enunciado formal acerca del método de Newton debe contemplar la suposición
Ejemplo 1 Realizando los cálculos con doble precisión, aplique el método de Newton y encuentre
de que xo está suficientemente próximo a un cero, o que la gráfica de f tiene una forma
el cero negativo de la funciónf(x) = e' - 1.5 - tan- 1 x. especial.
68 Capítulo 3 Solución de ecuaciones no lineales 3.2 Método de Newton 69
f(x)
Por el teorema de Taylor sabemos que
1
Línea tangente o= f(r) = f(x.- e.)=f(x.)- e.f'(x.) + ze�f"(�n ),
i(x) = f(x,) + f'(x,) (x - x,) donde �. es un número entre Xn y r. De esta ecuación resulta que
e.J'(x.)-f(x.) = 1"(�.)e�.
Poniendo esto en la ecuación (2) obtenemos el resultado
/1 "(r) 2
en+! = 21/"(�.) en2 ;::; 2 e = Ce•2.
f'(x.) f'(r) . (3)
Esta ecuación nos dice que en+! es aproximadamente e� multiplicado por una constante.
----�-+-----4-------------X Este envidiable estado de cosas se llama convergencia cuadrática. En muchas aplica
x, ciones la convergencia cuadrática explica la aparente duplicación de la precisión que se
obtiene con cada iteración del método de Newton.
Aún debemos establecer la convergencia del método. Desde la perspectiva de la
ecuación (3), la idea de la demostración es simple: si en es pequeño y si el factor
Figura 3.3 Interpretación geométrica del método de Newton.
f!"(�.)/f'(x.) no es muy grande, entonces en+! será más pequeño que e•. Definase una
cantidad c(o) que depende de 8 mediante la igualdad
1
c(o) = - máx l!"(x)I/ mín IJ'(x)I (8> O). (4)
-----------=-...-------/(x) 2 lx-r!;;áo !x-r!;;á6
�I!"(�o)/!'(xo)I;;; c(o).
Figura 3.4 Un ejemplo de no convergencia del método de Newton.
De este modo de la ecuación (3) resulta:
lx1- rl = led � e5c(o) = leolleolc(o) � leoloc(o) = leolP < leol � o.
Análisis de errores Esto nos muestra que el siguiente punto, X¡, también está a menos de 8 unidad�s de r.
El argumento se puede repetir, obteniéndose los siguientes resultados:
Vamos ahora a analizar los errores en el método de Newton. Por errores queremos
decir las cantidades le1I;;; pleol
en=Xn- r
le2I;;; Pled ;;; P leol
2
(No tomamos en cuenta errores de redondeo.) Supongamos que/" es continua y que r le3I;;; Piezl;;; P3 leol
es un cero simple def, tal quef(r) =O* J'(r). A partir de la definición del método de
iteración de Newton tenemos que
Puesto que O ;;; p < 1, tenemos que límn...... pn = O, de modo que lím._,.00 en = O. En
00
Funciones implícitas
resumen, lo que obtenemos es el siguiente teorema acerca del método de Newton. Una aplicación interesante del método de Newton se tiene en la evaluación de
TEOREMA! Sea f" continua y sea r un cero simple de f. Hay una vecindad de r y una constante funciones que se encuentran definidas implícitamente. En la sección 1.2 se examinó
C tales que si el método de Newton se inicia en esa vecindad, los puntos sucesivos se el teorema de la función implícita Éste señala que en ciertas condiciones más bien
hacen cada vez mds cercanos a r y satisfacen generales, una ecuación de la forma G(x, y) = O define a y como una función de x. Si x
ha sido prescrita, la ecuación G(x, y) = O puede resolverse para y recurriendo al método
de Newton. A partir de un punto inicial apropiado yo definimos y1, y2, ..• mediante
\xn+I -r[ ;;; C(xn -r)2 (n � O).
aG
Yn+l = Yn -G(x, Yn)/ (x, Yn).
Hay situaciones en las que se tiene la seguridad de que la iteración de Newton ay
converge a partir de cualquier punto inicial que se elija. Como muestra ofrecemos el
siguiente teorema. Podemos utilizar el método para construiruna tabla de la función y(x). Si la tabla contiene
un registro (X m Yn), y lo que queremos es calcular otro registro cercano (X n+l,Yn+il,
TEOREMA 2 Si f pertenece a la clase C2 (]R), es creciente, convexa y tiene Ún cero, entonces el cero comenzamos la iteración de Newton con (xn+I, Yn). El resultado de la iteración será el
es único y la iteración de Newton convergerá a él a partir de cualquier punto inicial. valor correctoYn+l que satisface la ecuación G(xn+l,Yn+1l = O. Dado que G(xn, Yn) = O y
que X n+l está cercano a X n, es de esperar que G(xn+i, y.) sea pequeño y que unos cuantos
pasos del método de Newton nos darán la corrección pertinente a y. para alcanzar de ese
Demostración Recordemos que una función es convexa si f"(x) > O, para toda x. Puesto que f es modo la igualdad exacta G(xn+l, Yn+1) = O.
creciente, f' > O sobre l., debido a la ecuación ( 3), en+! > O. Así, X n > r para n � l .
Como f e s creciente,f(xn) > f(r) = O. En consecuencia por la ecuación ( 2), en+I < en. Ejemplo 3 Haga una tabla de x versus y, donde y se define como una función implícita de x. Utilice
Así, las sucesiones [en] y [xn l son decrecientes y están acotadas inferiormente ( por O G(x, y) = 3x1 + 2y5 - x3 +y3-3, comenzando en x = O y proceda por incrementos de
y r respectivamente). Por lo tanto, los límites e* = límn......00 e. y x* = lím.......00 X n 0.1 hasta llegar ax = 10.
existen. De la ecuación ( 2) tenemos que e•= e* -f(x*)/f'(x*), de dondef(x*) = O y
x* = r. 1111 Solución Seax = O y y = l. Suponemos que serán suficientes cuatro pasos del método de Newton
para alcanzar la máxima precisión de la máquina. He aquí un posible algoritmo:
Ejemplo 2 Encuentre un método eficiente para calcular raíces cuadradas basándose en el método inputx <-O;y <-1; h <-0.l;M <- IOO;N <-4;
de Newton. output O, x, y, G(x,y)
for i 7 l. 2,...,M do
Solución SeaR > O y x = /R.En este casox es una raíz de la ecuaciónx 2 -R = O. Si aplicamos
<-x+h
el método de Newton (1) a la funciónf(x) = x2 - R, la fórmula de iteración se puede
X
for j = 1, 2,... ,N do
escribir aG
X n+I = 1(x.+R/xn), y ..... y -G(x. y)/ /x, y)
a
end
(Esta fórmula es muy antigua y se atribuye a Heron, un ingeniero y arquitecto griego, output i, x, y, G(x,y)
quien vivió en el periodo que abarca los años 100 a. C. a 100 d.C.) Si por ejemplo end.
queremos calcular vTI e iniciamos con Xo = 4, las aproximaciones sucesivas son las
siguientes, ( dadas en forma redondeada para mostrar sólo los dígitos que son correctos): Tenemos M pasos para la variablex, y en cada uno de ellos hay N iteraciones en el método
de Newton. Un programa que se base en este algoritmo necesitará dos subprogramas o
X¡= 4.12 procedimientos, uno para calcular G(x,y) y el otro para calcular 11 G/ay. (Este último
X2 = 4.123 106 resulta ser independiente de x en este caso.) Dichas funciones son:
X3= 4.123 1056 256 1 77
X4 = 4.123 1056 256 1 7660 5498 2 140 9856. G(x,y) = 3x 7 +2y5 -x 3 +y3-3
8G
y) = i0y4 +3y2.
El valor correspondiente a x4 es correcto hasta la vigésimo octava cifra decimal, pudién ay ex.
dose observar la esperada duplicación de los dígitos significativos en estos resultados.
Este método, combinado con una reducción del dominio, se utiliza con frecuencia en las A cóntinuación mostramos algunos valores de la función implícita calculados por medio
subrutinas con que se calculan raíces cuadradas. 11 de este algoritmo:
72 Capítulo 3 Solución de ecuaciones no lineales 3.2 Método de Newton 73
1.000000 0.00 J ]
kl
o.o
0.1 1.000077 0.00 hik) l/2(x \kl ,Xik))
0.2 1.000612 0.89 X 10-IS
se resuelve por medio de la eliminación gaussiana, un tema que examinaremos en el
capítulo 4. Resolver el sistema jacobiano puede resultar difícil cuando J es casi singular.
2.0 -2.810639 -0.82 X 10-IO Para examinar sistemas más grandes y con más variables no se necesitan ideas nove
dosas. No obstante, en estas situaciones es muy conveniente disponer de un formalismo
8.0 -19.92635 Ü.56 X 10-9 de matrices y vectores. El sistema de ecuaciones
{ donde H = (h¡ ,h2,... ,hnl y F'(X) es la matriz jacobiana de orden n x n con compo
fz(x¡ ,X2) = Ü.
(5)
nentes rtf¡/r¡xj. El vector de corrección H se obtiene al resolver el sistema de ecuaciones
En el supuesto de que (x1, x2) es una solución aproximada de (5), calculemos sendas lineales en (9). Teóricamente esto significa que
correcciones h1 y h2 , de modo que (x1 + h1, x2 + h2) sea una mejor aproximación a la
solución. Utilizando sólo términos lineales en el desarrollo de Taylor en dos variables H = -F'(X)-1 F(X), (10)
(véase la Sec. 1.1), tenemos que
aunque en la práctica H se suele determinar a partir de (9) mediante eliminación gaus
Ü = f¡(X¡ +h1 ,X2 +h2) �J¡(X¡,X2) +h¡- +h2 - siana, soslayando de este modo el costoso cálculo de la matriz inversa en (10). En
{
Bf¡ Bf¡
a X¡ consecuencia de esto, el método de Newton paran ecuaciones no lineales con n varia
8
aX2
!2
Ü = fz(x¡ +h¡ ,X 2 +hz) � fz(x¡ ,X 2) +h¡ B!z
- +hz-.
bles viene dado por
(6)
x
1 = [ªMax1 of1/a 2]. Con mucha frecuencia resolver sistemas como el que se presenta en (8) es una tarea
8h/ox¡ f)fz/8x2 difícil. La referencia usual en la materia es Ortega y Rheinboldt [1970]. Vea también
Rheinboldt [1974], Ostrowski (1966], Byrne y Hall (1973], Schnabel y Frank (1984],
Para resolver (6) es necesario que J sea no singular. Si esta condición se satisface, la Eaves, Gould, Peitgen y Todd (1983] y Allgower, Glasshoffy Peitgen (1981].
solución es
(X ,X )
= _¡-1 [f ¡ ¡ z ].
[h¡]
hz fz(x¡,xz) SERIE DE PROBLEMAS 3.2
En consecuencia, el método de Newton para dos ecuaciones no lineales en dos variables es 'l. Escriba un programa para máquina computadora que resuelva la ecuación x = tan x por
medio de método de Newton. Encuentre las raíces más cercanas a 4.5 y 7.7.
x(k) h(k)
J = +
J, 2. Encuentre el punto inicial positivo más pequeño para el cual el método de Newton diverge,
(k+ll
3. Aplique el método de Newton af(x) = x2 -q (donde q > O). Demuestre que si x. tiene '17. La ecuación
después del punto decimal k dígitos correctos, entonces x.+1 tendrá después del punto decimal 2x4 +24x3 +61x2-16x+1=O
al menos 2k-1 dígitos correctos, con tal de que q > 0.006 y k � l.
4. Demuestre que si el método de Newton se aplica a una función! para la cualf" es continua tiene dos raíces cerca de O. l. Encuéntrelas por medio del método de Newton.
y f(r) =O"# J'(r), entonces lím._00 e.+ie;;-2 existe y es igual af"(r)/[2J'(r)]. ¿Cómo se 18. Suponga que r es un cero de multiplicidad dos de la función!, de modo quef(r)=f' (r) =
puede utilizar este hecho en un programa para verificar si la convergencia es cuadrática? O "# J"(r). Demuestre que si f" es continua, con el método de Newton debemos tener
5. Encuentre el punto positivo donde la función f(x) = x -2 tan x alcanza su valor mínimo en+1 :::; fe. (convergencia lineal).
calculando los ceros de J' con el método de Newton. 19. Considere una variante del método de Newton, en la que sólo se necesita una derivada, es
6. Método de Steffensen. Considere la fórmula de iteración decir,
Xn +l = Xn -
f(x.)
Xn+l = Xn-f(xn)/g(xn ), f'(xoJ"
inicial real a partir del cual la iteración del método de Newton complejo converja a alguno convergerá linealmente a un cero def si el punto inicial está próximo a dicho cero.
de estos ceros? Responda la misma pregunta respecto de los puntos iniciales complejos.
28. Demuestre que si r es un cero de multiplicidad k de la función f. la convergecia cuadrática
16. Si el método de Newton se aplica a la funciónf(x) = x2-I y xo = 10 10 , ¿cuántos pasos de la iteración de Newton se restablece con la siguiente modificación:
se requerirán para obtener una raíz con una precisión de 10-8? (Encuentre la respuesta
analíticamente, no experimentalmente.) Xn+l = Xn -kf(xn)/J' (x.).
76 Capítulo 3 Solución de ecuaciones no lineales 3.3 Método de la secante 77
29. (Continuación) Cuando se está utilizando el método de Newton, ¿cómo pueden detectarse 3.3 Método de la secante
los ceros múltiples al examinar el comportamiento de los puntos (x.,f(x.))?
'30. El polinomio p(x)=x3+94x2- 389x+294 tiene ceros 1, 3 y -98. El punto.ro= 2 debería Recordemos que la iteración de Newton se define mediante la expresión
ser en este caso un buen punto inicial para calcular cualquiera de los ceros pequeños por
medio de la iteración de Newton. Haga los cálculos y explique lo que sucede. Xn+I = Xn - f(xn ) . (1)
f'(xn)
'31. Desarrolle cinco iteraciones del método de Newton complejo aplicándolo a la función com
plejaf(z)= l +z2+e', tomando como valor inicial zo=-1 +4i. Una de las desventajas del método de Newton es que utiliza la derivada de la función
cuyo cero se busca. Para superar esta dificultad se han propuesto una serie de métodos.
'32. Encuentre los cuatro primeros ceros de la funciónf(z) = 1 +i +e' ordenados en forma Por ejemplo, la iteración de Steffensen (Prob. 6 de la Sec. 3.2)
creciente de acuerdo a sus módulos. ¿Cómo sabe el lector que se trata de los cuatro primeros
ceros y que no ha omitido alguno? [f(x.)]2
Xn+I = Xn - __..c.____
'33. Efectúe cinco iteraciones del método de Newton (para dos funciones no lineales con dos f(x. +f(x.))-f(x.)
variables) para el sistema siguiente: nos da una manera de atacar el problema. Otra medida consiste en reemplazar f' (x) en
la ecuación (1) por un cociente de diferencias como el siguiente:
f1 (x,y)=1+i - l+e' cosy
{h(x,y)= 2xy+l seny. f(x.)-f(Xn-1)
!' (xn ) � . (2)
Xn - Xn-1
Utilice como valores iniciales xo = -1 y yo = 4. ¿Está relacionado este problema con el La aproximación dada por (2) tiene su origen en la definición de f' en ténninos de un
problema 31 y tienen ambos un comportamiento numérico similar? Explique.
límite, a saber:
' ím f(x)-f(u)_
J (x) = l
'34. Use el método de Newton para encontrar una raíz del sistema no lineal
U-+X X -U
4/+4y+52x=19 Cuando se ha llevado a cabo tal sustitución, el algoritmo resultante se conoce como
método de la secante. Su expresión es
r_
{ 169x2+3/+ l l lx- lOy=10.
Xn - Xn-1
Xn+I = Xn -f(xn ) ] (n � 1) (3)
35. El método de Halley para resolver la ecuaciónf(x)=O hace uso de la fórmula de iteración l](x.)-f(Xn-1
Xn+I
u:
= Xn - if;)2 -jJ;'
Ya que el cálculo de Xn+I requiere conocer x. y Xn-1 , se debe dar al principio los valores
de dos puntos iniciales. Sin embargo, cada Xn+I requiere sólo una nueva evaluación de
/2
f (El algoritmo de Steffensen necesita dos evaluaciones def para cada nueva Xn+I ·)
dondefn=f(x.) y así sucesivamente. Demuestre que esta fórmula es el resultado de aplicar La interpretación gráfica del método de la secante es similar a la del método de
la iteración de Newton a la función!//f. Newton. La línea tangente a la curva se reemplaza por una línea secante. (Véase la
Fig. 3.5.)
36. Comenzando en (0, O, 1), efectúe una iteración del método de Newton para sistemas no
lineales con el sistema Ejemplo Utilice el método de la secante para encontrar un cero de la función
xy- z2=1
f(x) = x3 - senh x + 4x + 6x + 9.
2
{ xyz- i +l=2
e'-e!+z=3. Respuesta Una gráfica aproximada sugiere que hay un cero entre 7 y 8. Tomamos estos puntos
como xo y x1 en el algoritmo. Cuando se ejecutó este código en una máquina similar a
Explique los resultados. la MARC-32, se obtuvieron los siguientes resultados.
37. Efectúe dos iteraciones del método de Newton con los siguientes sistemas: rt Xn f(x.)
(a) Comenzando en (0, 1)
{
4xf-xi=O
O . 7.00000 0.417 X 102
l 8.00000 -0.665 X 103
4x1xi-x1 = l. 2 7.05895 0.208 X 102
3 7.11764 -0.183 X 10 1
(b) Comenzando en (l. 1) 4 7.11289 0.710 X 10-l
xy2+iy+x4 = 3 5 7.11306 0.244 X 10-3
{
x2=-2. 0.610 X 10-4•
3 5 S
x y -2xy- 6 7.11306 11111
78 Capítulo 3 Solución de ecuaciones no lineales 3.3 Método de la secante 79
válido que lf(Xn+i)I ;;; IJ(x.)!. Con esto se tiene plena seguridad de que el valor absoluto
de la función es no-creciente.
f(x)
Análisis de errores
Procedemos ahora a presentar el análisis de errores asociado al método de la secante.
A partir de la definición del método de la secante (3) , tenemos que, con n = Xn-r: e
f(x.)Xn-1-f(xn_ ¡)xn
en+! = Xn+l-r= f(xn )-f(Xn-1)
-r
_ f(xn )en-1-f(Xn-1)
- f )-f
e
n
____...,�----f----4>-----+-----__.,.x (xn (Xn-1)
Factorizando el término enen-1 e insertando (xn-Xn-1)/(xn-Xn-1) obtenemos:
output O, a, u
Cambiando el índice a n- 1 se obtiene:
output 1, b, v
for k= 2, 3, ..., M do f(xn_¡)/en-1= J '(r) + �en-tf"(r) + O(e�_1).
if lul < lvl then
a+-+b Haciendo una sustracción entre estas expresiones incluimos que:
U+-+V
f(xn ) /en-j(Xn-1) /en-1= ( n- n-1)!"(r) + O( 2n _1).
1
endif 2
e e e
a+-b
f(xn )/en-J(Xn-1)/ en-l
U+-V � �2f"(r).
b+-b-vs Xn-Xn-1
V+-f(b) La primera expresión entre paréntesis en la ecuación (4) se puede escribir como
Xn-Xn-1
output k, b, v
if !vi < e o lb-al < i5 then stop �f
f (xn )-f(Xn-1) '(r)'
end.
Por ende hemos demostrado que
Dese cuenta de que en el seudocódigo los puntos extremos de [a, b] pueden inter
cambiarse para lograr que lf(b)I ;;; IJ(a)I se satisfaga. Así, para el intervalo [xn , Xn -il n+l
If"(r)
en n-1= Cen n-!·
�
se satisface que lf(x.)I ;;; lf(Xn-i)I, y para el siguiente intervalo [Xn+l• x.] también es 2. f'(r)
e e e (5)
3.3 Método de la secante 81
80 Capítulo 3 Solución de ecuaciones no lineales
Esta ecuación es similar a la que apareció en el análisis del método de Newton, velocidad se enc uentra directamente relacionada con los costos. Para algunos problemas
es decir, la ecuación (3) de la sección 3.2. Para encontrar el orden de convergencia del de cálc ulo intensivo (tales como la solución numérica de ecuaciones en derivadas par
método de la secante postulamos la sig uiente relación asintótica: ciales),la ve locidad es la consideració n más importante. En cambio, en lo que se refiere
al software de propósito general que se utilizará por una amplia gama de usuarios, la
ª confiabilidad y la robustez son las características deseadas. Se dice que un algoritmo o
len+ d "'Alenl . (6)
subprograma es robusto si es capaz de enfrentarse a una amplia variedad de situacio nes
en--+ co e implica una numéricas distintas sin la intervenció n del usuario. A lo largo de m uchos años se ha n
Esto significa que el cociente len+1l/(Alen J ) tiende a 1 conform
ª
hecho esfuerzos extraordinarios para generar paquetes matemáticos de uso general que
convergencia de orden a.. Por lo tanto
posean ambos atributos. Dos buenos ejemplos de tales paquetes son las colecciones
1 1ª
len l "'Ale n-11 Y len-11 "'(A - len l) / . IMSL [1990] y NAG [1990].
ª (7)
En todas las labores de cálculo científico se recomienda el uso de los paquetes de
muestran en las relaciones
Sustituimos en la ecuación (5) los valores asintóticos que se software existentes en el mercado, en lugar de los programas que uno mismo elabora,
(6) y (7). El resultado es excepto en algunas aplicaciones especiales. Para el problema de encontrar raíces el mejor
1ª 1ª software disponible resulta complicado, ya que debe incluir varios procedimientos que
ª
Alenl "'CJenW / lenl 1 . permitan asegurar tanto la convergencia global como la convergencia local rápida. Estos
objetivos en ocasiones entra n en conflicto, como ya se mencionó anteriormente.
Esto se p uede escribir como
1 1 i l-a+l/ll.
A1+ /ac- ,.., e (8)
SERIE DE PROBLEMAS 3.3
Dado que el lado izquierdo de esta relación es una co nstante distinta de cero mientras l. Deduzca la ecuación (4).
que en --+ O, concluimos que 1 - a.+ 1/a. = O, o que a. = ( l + v'S)/2 � 1.62. Por lo 2. En el método de la secante demuestre que si Xn -> q conforme n -> oo y si f (q) 1' O,
tanto, la razó n de convergencia del método de la secante es superlineal (es decir, mejor entonces q es un cero def
que li neal). Podemos ahora determinar A, dado que el lado derecho de la relación (8) es
c3_ Escriba un subprograma que ejecute el método de la secante en una función!, suponiendo
l. Así, usando la ecuación 1+ 1/a. = a., obtenemos que los dos puntos iniciales están dados. Verifique la rutina con estas funciones:
[!"( ) 10.62 (a) sen(x/2) - 1 (b) e' - tanx (c) x3 - I2x2 +3x + l.
1 1 al el a = ca-1= co.62= _,_
A= c /0+ / = / 2f'(r) 4. Usando los desarrollos de Taylor para f(x+h) y f(x +k) deduzca la siguiente aproximación
def(x):
ente, que
Con dicho valor para A el método de la secante nos dice, finalm J' (X) ;:; k f(x +h)- h f(x +k) +(h - k )f(x)
2 2 2 2
(k-h)kh
len+ d � Alen l(l vS)/2.
+
c5_ Programe y verifique un refinamiento del método de la secante que utilice el valor aproximado
Ya que (1+v'S)/2 � 1.62 < 2, la rapidez de convergencia del método de la secante no es def (x) dado en el problema anterior. Esto es, use esta aproximación para/ (x) en la fórmula
para el método de Newton. Se necesitan tres puntos iniciales. Los dos primeros pueden ser
tan buena como la del método de Newton, pero sí mejor que la del método de bisección . arbitrarios, y el tercero se puede obtener mediante el método de la secante.
Sin embargo, cada paso del método de la secante requiere sólo una nueva evaluación de
fu nció n, en tanto que cada paso del método de Newton necesita dos evaluaciones, las 6. Si se utiliza el mét<>do de la secante en la funciónf(x)=x2- 2, c�n xo=O y xi = 1,¿cuál
es el valor de x2?
de f(x) y f'(x). Ya que para estos algoritmos la evaluación de fu ncio nes constituye la
principal carga computacional, un par de pasos en el método de la secante es comparable 7. ¿Cuánto vale x2 si.xo= l,x1 =2,f(xo) = 2,yf(xi)= 1.5 en una aplicación del método de
a un paso en el método de Newton. Para dos pasos en el método de la secante tenemos que la secante?·
<s. Escriba subprogramas para ejecutar el método de la bisección, el método de Newton y el
ª2
ª 1+1X
len+2I "'Alen+1I "'A len l = A1+1llei3+v5)/Z. método de la secante. Deberán funcionar con una función arbitraria F. En cada caso, la se
cuencia de llamada que se utiliza debe incluir un parámetro M que indique el máximo número
a del método de Newton, de pasos que permitirá el usuario. Éste deberá ser capaz de establecer la precisión deseada
Esto es co nsiderablemente mejor que la convergencia cuadrátic (e y i5 como en el seudocódigo de esta sección). Estos códigos estarán en precisión sencilla.
o de la se cante requerirán
ya que (3+ v'S)/2 � 2.62. Claro está que dos pasos del métod
más.trabajo por iteración. (a) Verifique sus subprogramas con la función
Newton, de la se-
Los tres métodos discutidos hasta este momento (bisección, de
o omú e el análisi s méri o y p articularmente e n el 2x
cante) ilustran un fenóme f(x)=tan -1 x-
n nu c
I+xi·
n c n
y la confiabilidad. La
cálculo científico; ésta es la interdependencia entre la velocidad
82 Capítulo 3 Solución de ecuaciones no lineales *3.4 Puntos fijos e iteración funcional 83
Intente obtener el cero positivo con la precisión total de la máquina. El algoritmo definido de esta manera se llama iteración funcional. Para el caso del
(b) Utilice el cero enc ontrado en el inciso anterior como punto de partida para el método de método de Newton la función F se expresa mediante
Newton con la función
g(x) = tan-1 x. f(x)
F(x) = x -
c9_ Selec cione una rutina de la biblioteca de programas disponible en su computadora con el f'(x)'
fin de resolver una ecuación!(x) = O sin utilizar derivadas. Verifique el c ódigo sobre estas
funciones en los intervalos dados: en tanto que para el método de Steffensen resulta que
(a) x20 - 1 en[O,10] (e) x 19 + 10-4 en (-0.7 5,0.5]
(b) tan x - 30x en[l,l.57] (t) x5en[-l, 10] (x) 2
F(x) = x - (f ]
(c ) J - (1 - x) 1° en[O,1] (g) x9 en[-1, 10] f(x +f(x)) - f(x)
(d) x3 + 10-4 en[-0.7 5,0.5] (h) xe_¡. en (-1, 4] Se podrían citar muchos más ejemplos de casos de iteración funcional, pero nos limita
(Véase Nerinckx y Haegemans[197 6].) remos a estudiar brevemente la teoría general.
1O. La relación llamada igualdad asintótica entre dos sucesiones se escribe Xn "' Yn, y significa La fórmula (1) puede utilizarse para generar sucesiones que no convergen, como
que límn-oo(Xn /Yn ) = l. Demuestre que si Xn "'Yn, Un "' Vn, y e 1' O, entonces sucede, por ejemplo, con la sucesión 1, 3, 9, 27, ... , que se obtiene six0 = 1 y F(x) = 3x.
(a) CXn "'cyn (c) Xn Un "'YnVn (e) Yn "'Xn Sin embargo, nuestro interés recae principalmente sobre los casos para los cuales existe
(b) x� "' y� (d) si Yn "' Un entonces Xn "'Vn lím.....00 x•. Suponga entonces que
11. Demuestre que la fórmula para el método de la secante se pue de escribir en la forma Üm X =S.
n->oo n
f(xn)xn-1 - x,J(xn-1)
Xn+l = ¿Cuál es la relación entres y F? Si F es continua, entonces
f( xn) -f(Xn-1)
Explique por qué en la práctica esta fórmula resulta inferior a la que aparece en la ecuación F(s) = F( lím x.) = Iím F(x.) = Iím Xn+I = s.
n-+oo n-+oo n-+oo
(3).
'12. Programe y verifique el algoritmo de la secante usando el mismo ejemplo que aparece en el Así, F(s) = s y llamamos as punto fijo de la función F. Podemos considerar al punto
texto. A continuación repita el cálculo utilizando como puntos iniciale s 3 y 10. Explique lo fijo como un valor al que se fija la función durante el proceso iterativo.
que sucede. Con frecuencia un problema matemático puede reducirse al problema de encontrar
13. (Un polinomio de muy alto grado.) Una anualidad es un depósito de dinero sobre el cual un punto fijo de una función. Aplicaciones muy interesantes de esto aparecen en la
se hacen pagos (no nece sariamente iguales) a intervalos regulares de tie mpo. En una forma teoría de ecuaciones diferenciales, en teoría de optimización y en muchas otras áreas.
de anualidad el fondo se invierte con un interés constante, r, por intervalos. Al finalizar cada La función F, cuyos puntos fijos se buscan, será usualmente una transformación entre un
intervalo se toma el interés compuesto. Suponga que los pagos están represe ntados por las
cantidades a1, az, . . . y que V; denota el valor acumulado de la anualidad, calculado justo espacio vectorial y otro. Nuestro fin es analizar el caso más sencillo en que F envía en
de spués de que se ha hecho el pago a;. Entonces Vi = a1 y sí mismo algún conjunto cerrado C e R El teorema que se demuestra a continuación
se ocupa de las aplicaciones contractivas. Se dice que una transformación (o función)
V;= Vi-1(1 + r) + a; (i = 2,3, .. . ). F es contractiva si existe un número 11, menor que 1 que satisfaga
El factor (1 + r) representa el interés rV;-1 producido por Vi-1 durante el intervalo corres
pondiente. Demuestre que Vn = I:;=1 a;xn-1, donde x = 1 + r. IF(x ) - F(y)I i 11,lx - YI (2)
e 14. (Continuación) Se hacen 60 pagos mensuales en una anualidad. De l primer al quinto años para todos los puntos x y y en el dominio de F. Tal como se ilustra en la figura 3.6, la
los pagos son, re spe ctivamente, $200, $27 5, $312, $380 y $400. Justo después de que se ha distancia entrex y y se transforma en una distancia menor entre F(x) y F(y) por la acción
hecho el último pago, el valor acumulado de la anualidad es $24,738. ¿Cuál e ra la tasa de
interés mensual? Use el método de la secante para encontrar el cero del polinomio que se de la función contractiva F.
obtiene.
Teorema de la aplicación contractiva
TEOREMA Sea F una aplicación contractiva que va de un conjunto cerrado C e lR a C. Entonces
*3.4 Puntos fijos e iteración funcional F tiene un puntofijo único. Más aún, este punto fijo es el límite de toda sucesión que se
obtenga a partir de la ecuación (1) con cualquier punto inicial xo E C.
El método de Newton y el de Steffensen son ejemplos de procedimientos mediante los
cuales se calcula una sucesión de puntos con una fórmula como la siguiente: Demostración Usamos la propiedad contractiva (2) junto con la ecuación (1) para escribir
Xn+I = F(x.) (n � O). (1) lxn -Xn-1 I = IF(xn-1) - FCx.-2)1 i AIXn-1 - Xn-zl. (3)
.
84 Capítulo 3 Solución de ecuaciones no lineales *3.4 Puntosfijos e iteraciónfu.ncional 85
F(x) Ya que A. < 1, entonces lx -YI = O. Finalmente, tome nota de que el puntos que
se obtiene pertenece a C, ya ques es el límite de una sucesión cuyos elementos están
��
Este teorema puede demostrarse para una aplicación contractiva de cualquier espa
F(b) cio métrico completo en sí mismo.
F(y)
Ejemplo 1 Demuestre que la sucesión [xn l en el teorema de la aplicación contractiva satisface el
F(x) criterio de Cauchy de convergencia.
F(a)
¡._,:::::_+-___...,_______..,_-t-------+-X Respuesta Recuerde el criterio de Cauchy para la sucesión [xn J: dado cualquier e, existe un entero
a b N, tal que lxn -Xml < s, siempre que n, m ;;; N. Si n ;;; m ;;; N, entonces por la
desigualdad triangular y la ecuación que se sigue de (3) tenemos:
Este argumento puede repetirse para obtener =A.m¡x¡ _ .xol(l +A.+A.2 +...+A.n-1-m)
veamos que la sucesión [xn l converge si y sólo si la serie Ejemplo 2 Demuestre que la sucesión [xn ] definida recursivamente como se muestra a continuación
es convergente.
co
{XO =-15
¿( xn-Xn -1)
n=l Xn+l = 3-�lxnl (n;;; 0).
converge. Para demostrar que la serie converge basta con demostrar que la serie f
Respuesta La función F(x) = 3- lxl es una contracción ya que
co
¿lxn-Xn-il 1 1 1 1
IF( x)-F( y)I = 13-zlxl-3 + zlYII = 2IIYI- �zly-xl
n=l
converge. Esto resulta sencillo pues podemos utilizar el criterio de comparación y lo por la desigualdad triangular. Como resultado de apelar al teorema de la aplicación
hecho previamente para obtener contractiva ocurre que la sucesión debe converger al único punto fijo de F, el cual es 2
como se ve de inmediato. En el teorema podemos tomar C en JR. 11
co co
¿ lx -X -1I �¿=l A."-1lxi-xol = l _l A.lx1-xol-
n n Ejemplo 3 Utilice el teorema de la aplicación contractiva para calcular un punto fijo de la función
n=l n
1
Ya que la sucesión converge, tómese s =límn-co Xn . Por lo tanto F(s) = s, tal como F(x) =4+ sen2 x
3
se había dicho anteriormente. (Observe que la propiedad contractiva hace que F sea
continua.) Respuesta Por el teorema del valor medio sabemos que
Respecto de la unicidad del punto fijo, tenemos que si x y y son puntos fijos, entonces
1 · 2 2
¡F(x)-F(y)I = 1 sen2x-sen2yl = 1 cos2sllx-yl � /x-yl
lx-YI =IF(x)-F(y)I �11.lx-y¡. 3 3 3
86 Capítulo 3 Solución de ecuaciones no lineales *3.4 Puntos fijos e iteración fu.ncional 87
para alguna i; entre x y y. Esto muestra que Fes contractiva, con').. = 2/3. Por el Utilizando la serie de Taylor para F(x.) desarrollada alrededor de s tenemos que:
teorema de la aplicación contractiva resulta que Ftiene un punto fijo. Un programa de
computadora que calcule este punto fijo puede inspirarse en el siguiente algoritmo, el
en+I = Xn+l - s = F(xn) -F(s)
cual lleva a cabo 20 iteraciones iniciando con un valor de 4.
= F(s+e.)� F(s)
·]
input x +- 4; M+-20
for k = 1, 2, .. . , M do
= [F(s)+enF'(s)+ Je;F"(s)+. . - F(s)
x+-4+fsen 2x
outputk,x 1 1
n (s)+ .. · + --é-lp
= enF'(s)+ -e2F" 1 qp r
end. n q( -l)(s) + -en q( )(":,n )
2 (q _ l )! q!
El programa genera 20 líneas de salida, algunas de las cuales se muestran aquí: y por lo tanto
k X en+! - ..!_,e qp
. q( )(r":,n ) . (4)
q.
1 4.3297861
2 4.2308951 Sabiendo que lírn .....00 Xn = s, deducirnos de la ecuación (4) que:
3 4.2736338
\en+I\
l ím
n-+oo \en\q
= q..!_Fq
! ( )(s). (5)
14 4.2614830
15 4.2614840 Recuérdese que en la sección 1.2 se estableció que para cualquier sucesión [x.J que
16 4.2614836 converge a un punto s (sea que provenga o no de una iteración funcional), definimos el
orden de convergencia como el mayor número real q, tal que el límite
20 4.2614837
\Xn+I - s\
lím
El punto fijo aparece en la última línea con una precisión de siete dígitos decimales. 11 n-+oo \xn - s\q
[F(x)J4
88 Capítulo 3 Solución de ecuaciones no lineales *3.4 Puntos fijos e iteración funcional 89
y por lo tanto tendremos en general que Dése cuenta de que esto puede interpretarse como x = lúnn-oo Xn , donde x1 = ,.¡p, x2 =
,/p + /p. y así sucesivamente.
f"(s)
F "(s) = ' * O. 13. Sea p > l. ¿Cuál es el valor de la siguiente fracción continua?
f (s)
Si se representa a F en el entorno de un punto fijo s mediante una serie de Taylor x=---,---.
p+
l
00 1 p+-
"-F(k)(s)(x -d p+···
L., k!
k=O Utilice las ideas del problema anterior para resolver éste. Usando el teorema de la aplicación
y si Xn+I = F(xn), entonces el orden de convergencia es el primer entero q, tal que contractiva demuestre que la sucesión de valores converge.
F(ql(s) * O. El problema 16 pide una demostración de esta afirmación. 14. (Continuación) Encuentre las raíces de la ecuación cuadrática x2 + px + q = O usando un
método iterativo.
15. SeaFuna aplicación contractiva de un intervalo [a, b] en sí mi�mo, y seas el punto fijo de F.
SERIE DE PROBLEMAS *3.4 Sia � x � by IF(x)-xl < e, ¿es cierto que jx-sl < e? Demuestre que jx-sl < e(l-";..)-1,
l. SiF es contractiva de[a, b] a ( a, b] y si xn+l = F(x.), conxo E [a, b], entonces lx.-si �C";.." donde ";.. es la constante de la ecuación (2).
para una C apropiada. Demuestre lo anterior y dé una cota superior para C. Aquí s es un 16. Demuestre el enunciado que hace referencia en el libro al orden de convergencia en el método
punto fijo de F. de iteración funcional.
2. Demuestre que si F: [a, b] -> lR, con F' continua y si IF'(x)I < 1 en [a, b], entonces Fes 17. La mayoría de los procesos iterativos no son tan sencillos como el que se expresa mediante
una contracción. ¿Sucede por necesidad que F tiene un punto fijo? Xn+l = F(x.), con F: lR -+ R Por ejemplo, podríamos tener una transformación F: JR2 -,.
3. Demuestre que si Fes una aplicación continua de [a, b] en [a, b], entonces F debe tener un JR2• Demuestre que el método de bisección y el método de la secante son de este tipo. En
punto fijo. A continuación determine si esto resulta cierto para funciones de lR en JR. cada caso defina explícitamente a F.
4. Demuestre que las siguientes funciones son contractivas en los intervalos indicados. Deter 18. DemuestrequesiF' es continua y si IF'(x)j < 1 en el intervalo [a, b], entoncesFes contractiva
mine los valores óptimos de";.. en la ecuación (2). en [a, b]. Demuestre que para un intervalo abierto esto no necesariamente resulta cierto.
(a) (1 + x2)-1 sobre un intervalo arbitrario 19. Si el método de iteración funcional se aplica a la función F(x) = 2 + (x - 2)4, empezando
CbHx sobre l �x�5 por x = 2.5, ¿cuál es el orden de convergencia? Encuentre el intervalo de valores iniciales
para el cual converge esta iteración funcional. Dése cuenta de que 2 es un punto fijo.
(c) tan-1 x sobre un intervalo cerrado arbitrario que excluya al O
20. Demuestre que las siguientes funciones son contractivas en los dominios dados, y sin em
(d) !xi i sobre !xi� ! bargo, no tienen punto fijo en estos dominios. ¿Por qué esto no contradice al teorema de la
5. En astronomía se conoce como ecuación de Kepler a la siguiente expresión: x = y-e sen y, aplicación contractiva?
con O < e < I. Demuestre que para cada x E (O, 7t] existe una y que satisface la ecuación. (a) F(x) = 3 - x2 en[-!, ll (b) F(x) = -x/2 en (-2, -1] U[l, 2].
Interprete este problema como uno de punto fijo.
21. Demuestre que sif es continua en [a, b] y satisface a �f(a) y f(b)�b, entonces/ tiene un
6. Considere una función de iteración de la forma F(x) = x + f(x)g(x), donde f(r) = O y punto fijo en el intervalo [a, b]. Observe que no suponemos que a �f(x) � b para toda x
f' (r) * O. Encuentre las condiciones precisas sobre la función g que aseguren que el método en [a,b].
de iteración funcional tendrá una convergencia cúbica a r si inicia cerca de r.
22. ¿Cuál es la condición más débil que podemos imponer al intervalo [e, d] para que resulte
7. Si en una calculadora de mano se introduce un número y se presiona repetidamente la tecla que cada aplicación continua de [a, b] en [e, d] tenga un punto fijo?
que corresponde al coseno, ¿qué número aparecerá eventualmente? Demuéstrelo.
23. Encuentre el orden de convergencia de las siguientes sucesiones:
8. Demuestre que la sucesión generada por la iteración Xn+l = F(x.) convergerá si jF'(x)i �
";.. < l en el intervalo[xo - p,xo + p], donde p = jF(xo) -xoj/(1 - ";..). (a) Xn = (1/n)i (c) Xn = (1 + 1/n)Í
9. ¿Qué propiedades especiales debe tener/ si el método de Newton aplicado af converge (b) Xn = yÍi (d) Xn+l = tan-l Xn.
cúbicamente a un cero de/? 24. Para encontrar un cero de la función! podemos buscar un punto fijo de la función F(x) =
10. Si intentamos encontrar un punto fijo de Futilizando el método de Newton en la ecuación x - f(x)/!'(x). Con el fin de localizar un punto fijo de F podemos resolver la ecuación
F(x) - x = O, ¿qué fórmula de iteración resulta? F(x) - x = O usando el método de Newton. Una vez hecho esto ¿cuál es la fórmula para
generar la sucesión Xn?
11. Si¡' es continua y positiva en [a, b] y sif(a')f(b) < O, entonces! tiene exactamente un cero
en (a, b). Demuestre lo anterior y muestre también que con un parámetro adecuado ";.., se 25. Demuestre que la función F definida como F(x) = 4x(l -x) envía el intervalo[O, l ] sobre sí
puede obtener el cero, utilizando el método de iteración funcional con F(x) = x + ";..f(x). mismo y no es una contracción. Demuestre que tiene un punto fijo. ¿Por qué no contradice
este resultado al teorema de la aplicación contractiva?
12. Seap un número positivo. ¿Cuál es el valor de la siguiente expresión?
26. Si el método de iteración funcional se utiliza en la función/(x) = !Cl + x2)-1, con punto
inicial xo = 7, ¿converge la sucesión resultante? Si así resulta, ¿cuál es el límite? Justifique
x=Jp+Jp+�. rigurosamente sus respuestas.
90 Capítulo 3 Solución de ecuaciones no lineales
*3.5 Cálculo de ceros de polinomios 91
27. Demuestre o refute el enunciado: si f: lR -,. [a, b] y si Fes contractiva en [a, b], entonces
f tiene un punto fijo único que puede calcularse mediante el método de iteración funcional, 41. Considere un método iterativo de laforrnax.+1 = x. -f(x.)/g(x.). Suponga que converge a
iniciando el cálculo en cualquier valor real. un punto 1; que es un cero simple de la función!, mas no un cero de la función g. Establezca
la relación entre f y g de tal manera que el orden de convergencia del método sea tres o
28. Dé ejemplos de funciones que no tienen puntos fijos pero que sí poseen las siguientes mayor que tres.
características:
(a)f: [O, 1] -+ [O, l]
(JJ)f:(0, 1)-,. (0, l ) yes continua *3.5 Cálculo de ceros de polinomios
(c)f:A-+ A y es continua, conA= [O, l ] U [2, 3]
(d)f: lR-+ lR y es continua. Los métodos desarrollados en las secciones anteriores, en particular el método de New
29. Demuestre que la funciónf(x) = 2 + x-tan -I x tiene la propiedad lf'(x)\ < 1. Pruebe quef ton, pueden utilizarse en el caso en el que las funciones sean polinomios. Sin embargo,
no tiene punto fijo. Explique por qué este resultado no contradice el teorema de la aplicación y cuando sea posible, al encontrar los ceros de los polinomios explotaremos las carac
contractiva. terísticas especiales de este tipo de funciones. Más aún, en el caso de los polinomios el
30. Este problema se ocupa de la función F(x) = 10 - 2x. Demuestre que f tiene un punto problema se complica frecuentemente debido a que deseamos calcular los ceros com
fijo. Tómese un xo arbitrario y defina Xn+l = F(xn), paran ;;; O. Encuentre una fórmula no plejos (aun cuando el polinomio tenga coeficientes reales) o porque buscamos todos los
recursiva para x•. Demuestre que el método de iteración funcional no da lugar a una sucesión ceros de un polinomio dado. Por ello, la cuestión de encontrar los ceros de un polinomio
convergente, a menos que xo tenga un valor particular. ¿Cúal es este valor especial de Xo? merece un tratamiento especial, tratamiento que ha recibido durante un periodo de casi
¿Por qué este resultado no contradice al teorema de la aplicación contractiva?
400 años.
31. Sea F continuamente diferenciable en un intervalo abierto, y suponga que F tiene un punto Iniciamos con algunos de los más importantes resultados teóricos, muchos de los
fijo s en este intervalo abierto. Demuestre que si \F' (s)\ < 1, entonces la sucesión definida cuales probablemente resultarán conocidos para el lector. Un polinomio se escribe de la
mediante iteración funcional converge as si empezó suficientemente próxima a s.
siguiente manera:
32. Sea!� q � l ydefinaf(x) = 2x-qx2. Si se utilizaF,¿sobre qué intervalo se puede garan
tizar que el método de iteración converge a un punto fijo? (Este problema está relacionado p(z) = anz" + an-!Zn-l + .. · + a2z2 +a¡Z + ao, (1)
con el problema 7 de la sección 3.2.)
33. Escriba dos procedimientos de punto fijo diferentes para encontrar ceros de la funciónf(x) = en la que los coeficientes ak y la variable z pueden ser números complejos. Si O, ª" :;,
zx2 + 6e-z - 4. entonces p tiene grado n. Nos interesa encontrar los ceros de p, y entonces surge la
pregunta: ¿los hay? El siguiente teorema (demostrado primeramente por Gauss en
34. ¿Sobre cuáles de los siguientes intervalos es contractiva? la funciónf(x) = Jx 1799) responde a esta pregunta.
(i) [1/2, oo] (ii) [1/8, 1] ( iii) [l/4, 2] (iv) [O, l ] (v) [1/5, 3/2].
35. Una función f recibe el nombre de contracción iterada si Teorema fundamental del álgebra
\F(F(x)) - F(x)\ � :\.\F(x) - x[ (:\. < 1). TEOREMA 1 Todo polinomio no constante tiene al menos un cero en el campo de los números com
plejos.
Pruebe que toda contracción es una contracción iterada. Demuestre que una contracción
iterada no necesita ser una contracción ni tampoco ser continua.
La historia de este teorema y de los intentos por demostrarlo se pueden leer en el
36. Si al utilizar el método de iteración funcional en F(x) = x2 + x -2 se obtiene una sucesión libro de Kline (1972, págs. 597-606]. La demostración moderna usual es un corolario
convergente de números positivos, ¿cuál es el límite de esta sucesión y cuál fue el punto
inicial? del teorema de Liouville. Vea, por ejemplo, Bak y Newman [1982], Henrici (1974],
Ahlfors [1966], y otros textos de análisis complejo.
37. Considere una función de iteración de la forma f(x) = x -f(x)f'(x), dondef(r) = O y El teorema fundamental no afirma la existencia de ceros reales, y los ejemplos más
J' (r) ;o O. Encuentre las condiciones precisas que debe satisfacer la función!, de modo que
el método de iteración funcional converja al menos cúbicamente a r si empezó cerca de r. sencillos, como sucede con z2 + 1, prueban que un polinomio no necesita tener ceros
reales aun cuando sus coeficientes sean todos reales.
38. Analice el método de Steffensen (Prob. 6, Sec. 3.2) como un ejemplo de iteración funcional. Si el polinomio p, con grado n no menor que uno, se divide por un factor lineal
Determine su orden de convergencia.
z - c, el resultado es un cociente q y un residuo r. El último es un número complejo, y
39. Un estudiante recuerda de manera incorrecta el método de Newton y escribe Xn+I = el primero es un polinomio de grado n - l. Podemos representar este proceso mediante
f(xn)/J'(x.). ¿Se encontrará con este método un cero def? ¿Cuál es el orden de con
vergencia? la ecuación
p(z) = (z - c )q(z) + r.
40. Demuestre que el siguiente método tiene una convergencia de tercer orden al calcular ../R.:
De aquí vemos (al dejar que z = c) que p(c) = r. Este resultado se conoce como el
x.(x; + 3R) teorema del residuo. Si c es un cero de p, entonces r = O, y tenemos entonces que
Xn+l =
3x�+R . p(z) = (z - c)q(z).
92 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 93
Así, z- c es un factor de p(z). Esta última observación se conoce como teorema del Ejemplo 1 Encuentre un disco centrado en el origen que contenga todos los ceros del polinomio
Factor.
Escribamos ahora p(z) = (z - r1)q1 (z), donde r 1 es cualquier cero de p. Por el p(z) = z4- 4z3 + 7z2- 5z- 2.
teorema fundamental q 1 tiene un cero, llamémoslo r2 (a menos que q 1 sea de grado cero).
Por lo tanto, q 1 (z) tiene un factor z- r2, y podemos escribir p(z) = (z- r 1 )(z- r2)q2(z). Respuesta Por el teorema anterior, tal disco tiene un radio
Siguiendo este proceso, llegamos eventualmente a un punto donde el proceso se detiene
debido a que los grados de los qk decrecen en uno a cada paso. Por ende, qn será una p = 1 + !a4¡-r máx l akl = 8. 111
O�k<4
constante y la última ecuación es
Otra idea útil para el análisis de polinomios es la siguiente: Tome el polinomio p
p(z) = (z- r1)(z- r2) · · · (z- rn)qn. de la ecuación (1) y considere la función s(z) = z" p(l/z). Entonces:
rn , entonces el producto ffi=1 (z- rk) no puede ser cero. En vista de que algunos de
los ceros rk pueden ser iguales unos a otros, entonces un polinomio de grado n puede
= ª" + ªn-IZ + ª•-2z2 + · · · + aoz".
tener a lo sumo n ceros. La multiplicidad de un cero es el número de veces que el factor Esto prueba que s es un polinomio cuyo grado es n a lo sumo. Sus coeficientes se pueden
que le corresponde aparece en la factorización de p. Si combinamos las afirmaciones escribir de inmediato dado que son los mismos coeficientes de p, excepto que aparecen
anteriores con el teorema fundamental obtenemos lo siguiente: en el orden inverso. Por otra parte, resulta obvio que para un número complejo zo distinto
TEOREMA 2 Un polinomio de grado n tiene exactamente n ceros en el plano complejo, conviniendo de cero, la condición p(zo) = O es equivalente a la condición s(l/zo) = O. Por lo tanto,
que cada cero debe contarse un número de veces igual a su multiplicidad. tenemos el siguiente resultado:
TEOREMA 4 Si todos los ceros de s están en el disco {z : lzl � p }, entonces todos los ceros no nulos
Con frecuencia es deseable tener cierta idea sobre el lugar en el que se localizan
de p se encuentranfuera del disco {z : lzl < p- 1 }.
los ceros de un polinomio en el plano complejo. Muchos resultados, como la regla de los
signos de Descartes, se pueden encontrar en la bibliografía que se ocupa del problema
de localizar los ceros. Véase, por ejemplo, la sección 5.5 de Young y Gregory [1972], Ejemplo 2 Encuentre un disco centrado en el origen, en el cual no haya ceros de p, siendo p el
la sección 5.5 de Stoer y Bulirsch [1980], el tratado de Marden [1966], o el volumen polinomio del ejemplo anterior.
l del tratado en tres volúmenes de Henrici [1974]. El siguiente teorema, tomado del Respuesta El polinomio s al que hace referencia el teorema anterior es
libro de texto de Conte y de Boor [1980], nos proporciona una cota superior fácilmente
calculable para los módulos de los ceros. s(z) = -2z4 - 5z3 + 7z2- 4z + l.
TEOREMA 3 Todos los ceros del polinomio de la ecuación (1) se hallan en el disco cerrado cuyo Por el teorema 3 sabemos que todos los ceros de s se encuentran en un disco centrado
centro está en el origen del plano complejo y cuyo radio es en el origen y con radio
p = 1 + lanl-1 máx l akl·
p = 1 + !a4¡-i máx lakl =
O�k<4
l
O�k<n
Por lo tanto, basándonos en el teorema anterior, concluimos que los ceros de p se en
cuentran fuera del disco de radio 2/9. Por ende todos los ceros de p están en el anillo
Demostración Elija c = máx lakl de manera que clan ¡-1 = p- l. Si lzl > p, entonces
O�k<n 2/9 < lzl < 8 en el plano complejo. ti
L
;;,; l anz"I - c lzl
k=O
k Para un cálculo más eficiente de los valores de un polinomio se hará uso del al
goritmo de Homer. Este algoritmo también se conoce como multiplicación anidada y
\:Omo división sintética. Veremos que también es útil para otros propósitos. Si se tiene
= lanz"I - c!z l"(lzl- 1r 1 un polinomio p y un número complejo zo, el algoritmo de Horner proporciona el número
= la.z"l{ l - c1a.1-1 clzl-1)- 1 } p(zo) y el polinomio
p(z)- p( zo)
q(z) =
> !a. z"l{ l - c!a.1-1 cp-1)- 1 } = o. 11 z- zo
(2)
*3.5 Cálculo de ceros de polinomios 95
94 Capítulo 3 Solución de ecuaciones no lineales
El algoritmo de Homer también se usa para realizar una deflación, que es el proceso
El grado del polinomio q es uno menos que el grado de p. De esta ecuación resulta que
mediante el cual se cancela un factor lineal del polinomio. Sizo es un cero del polinomio
p, entonces z-zo es un factor de p, e inversamente. Los ceros restantes de p son los
p(z= ( -zo)q(z) + p(zo)-
) z (3)
n- 1 ceros de p(z)/(z - za).
Representemos el polinomio desconocido q por Ejemplo 4 Efectúe una deflación sobre el polinomio del ejemplo anterior, utilizando el hecho de
n-l que 2 es uno de sus ceros.
q(z=
) bo + b¡Z +···+ bn-lZ _
Respuesta Usamos la misma regla de cálculo que se presentó con anterioridad:
Cuando esta forma para q(z) y la forma análoga para p(z) se sustituyen en la ecuación (3), -4 7 -5 -2
los coeficientes de las potencias correspondientes dez de ambos lados de la ecuación 2 2 -4 6 2
pueden igualarse término a término. Las ecuaciones que se obtienen de esta acción son: -2 3 1 O.
( - 3)(z3 - z2 + 4z + 7) + 19.
p(z)= z 11
96 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 97
El cálculo muestra que Ejemplo 6 Lleve a cabo la iteración de Newton con el polinomio utilizado en todos los ejemplos
anteriores, empezando por zo= O.
p(z) = (z- 3) + 8(z- 3) + 25(z- 3) + 37(z- 3)+ 19.
4 3 2 11
Si esto se aplica a un polinomio p, puede utilizarse un método eficiente que incorpore al A continuación tenemos una demostración formal de la validez del algoritmo de
algoritmo de Horner para calcular p(z) y p'(z). Ya habíamos observado que si se utilizan Horner.
sólo dos pasos del algoritmo de Horner completo, obtenemos c0= p(zo) y c1 = p'(zo). TEOREMA 5 Sea p(x) = a.x" + · · · + a¡x +ao. Defina los pares (aj,�j ) paraj = n, n- I, ..., O a
Ambos pasos se pueden combinar en el seudocódigo. Por otra parte, desistimos de través del algoritmo
sobreimponer valores a los coeficientes de entrada debido, a que éstos se utilizaran en
pasos posteriores de la iteración. Presentamos a continuación un seudocódigo que genera { (Cln, Pn) = (an, 0)
a= p(zo) y p= p'(zo), suponiendo que pes de la forma dada en la ecuación (1) y que
(aj, Pj) = (aj+ XClj+I, Clj+I +xPj+!) (j = n- I, n- 2, ...,O )
se proporcionazo:
inputn, (a;: O� i � n),zo
(l <- ª• Entonces no = p(x) y �o= p' (x).
p <-O
for k = n- I, n- 2, ...,O do Demostración Sin= O, entonces p(x)= a0 y
P <-a+zoP
a <- ak +zoa (no, Po) = (ao,O).
end
output a,�- Es obvio que a0 = p(x) y Po = p'(x). En consecuencia, el teorema es cierto paran=O.
Si nos referimos a este seudocódigo como HORNER (n, (a; : O � i � n),zo,a, �), Sin= I, entonces p(x) = a 1 x + ao y
entonces un seudocódigo para tomar M pasos con el método de Newton para un polinomio
dado, iniciando en zo, será de la siguiente manera: (no,Po) = (ao + xa¡, Cl¡+xP1) = (ao+ xa¡, a¡) = (p(x), p' (x)).
input n, (a;: O� i� n), zo, M, s
forj= 1,2,...,Mdo De modo que el teorema es cierto para n = I.
call HDRNER (n,(a;: O� i� n), Zo, a, P) Suponga que el teorema es cierto para todos los índices n menores que m. Sea
Z; <-Zo-a/P
output a,p,z1 p(x)= Cmx!" + · · · + C¡X+ co = co+ x(cmx!"- 1 + · · · + c2x + e¡) = co + xq(x).
ü iz;-zol < s then stop
ZO <- Z¡ En consecuencia,
end. p'(x) = xq 1(x) + q(x).
98 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 99
Sean n = m - 1, an = Cm, ªn-1 = Cm-1, ... ' a2 = C3, a¡ = C2 y ao = C¡. Como el Método de Bairstow
teorema es cierto para q, aplique el algoritmo a q(x) = anx n + ...+a 1 x+a0. Por hipótesis Si un polinomio sólo tiene coeficientes reales, aun así sus ceros pueden ser com
de inducción, lo que se obtiene es a.0 = q(x) y �o = q'(x). Si se aplica el algoritmo a plejos. En este caso es posible calcular los ceros complejos, dos de ellos en cada paso,
p obtenemos el mismo conjunto de pares (a.n , �n), ... , (a. 1,�¡), (a.o,�o) (debido a que usando exclusivamente la aritmética de los reales. El procedimiento para hacer esto se
(cm,..., c2, c 1)= (an ,... ,a 1, ao)), pero al final queda un par más por calcular, a saber conoce como método de Báirstow, el cual se considerará a continuación.
Dado un número complejo z = x + iy, su número conjugado es z = x -iy. Un
(a.-1,�-1)= (a_¡ +xa.o,a.o +x�o) resultado básico que se utilizará más adelante nos dice lo siguiente:
= (co +xq(x),q(x) +xq'(x)) TEOREMA 7 Si p es un polinomio cuyos coeficientes son números reales, y si w es un cero complejo de
= (p(x),p '(x)) 11111
p, entonces w también es cero de p, y (z -w)(z -w) es un factor cuadrático real de p.
-
Observe que podríamos definir nuestra sucesión mediante Demostración Sea p(z)= anzn +ªn-1 z" 1 + · · · +a¡z +ao, donde todos los coeficientes ak, son números
reales. Ya que w es un cero de p, tenemos
(a.n-1 , �n-1 ) = (an-1 +xa ., an) Ü= an w" +an-JW-l + · · · +a¡W +ao.
{
(0.j,�j )= (aj +XO.j+J,0.j+I + X�j+I) (j= n -2, n - 3, ..., O)
Tome el conjugado en ambos lados, usando repetidamente las reglas z1 + z2 = z1 + z2 y
z 1 z2 = z1zi. Dado que las ak son reales, el resultado es
o como
O= anw" +an-1 w•-1 + · · · +a¡w +ao.
(a.n,�n) = (an-1 + xan,an)
{ Por lo tanto, W es un cero de p. Como w no es real, w y W son ceros distintos de p. En
(0.j,�j )= (aj-1 +XO.j+I ,0.j+ I +�j+J) (j= n- l,n-2, ..., 1)
consecuencia, p contiene el factor cuadrático:
Éstas son inferiores ya que no se ocupan den= O. (z -w)(z -W)= z2 -(w + w)z + wW.
TEOREMA 6 Sean Xk, y Xk+I dos iteraciones sucesivas que resultan de la aplicación del método de Este factor es real ya que w + W y wW son reales. 11
Newton a un polinomio p de grado n. Entonces existe un cero de p en una vecindad de Los ceros complejos del polinomio real p aparecen en pares conjugados y estos
Xk de radio nlxk -Xk+1 I en el plano complejo. pares inducen factores cuadráticos reales de p. Por ello resulta razonable buscar factores
cuadráticos, lo cual puede hacerse con la ayuda de la iteración de Newton.
Demostración Sean r¡, r2, ... , rn los ceros de p. Entonces p(z) = C rr;=¡(Z - rj). El término de TEOREMA 8 Si el polinomio p(z) = a.z" +a._ 1 z•-I +· · · +a0 se divide entre el polinomio cuadrático
corrección en la iteración de Newton es -p(z)/p'(z). La derivada de p es z1 - uz -v, entonces el cociente y el residuo
=I
En detalle esta ecuación nos dice que
Pero esto es imposible, dado que el promedio de n números no puede ser mayor que
cada uno de ellos.
Este teorema lo demostró Bodewig [1946).
11 takl=
k=O k=2
(t
bkl-2) (z2 -uz -v) + b1(z -u) +bo.
100 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 101
Si igualamos los coeficientes de i' de ambos lados de la ecuación,el resultado es: La solución de este sistema queda de la siguiente forma:
(en+! = C n = 0) Ejemplo 7 Utilizando el método de Bairstow e iniciando con el punto (u, v) = (3, -4), encuentre
Ck = bk+I + UCk+I + VCk+2
(4) un factor cuadrático real del polinomio usado en los ejemplos anteriores.
dk = bk +I + udk+I + vdk+2 (dn+I = d,, = Ü). Respuesta Se escribió en doble precisión un programa de computadora que se apoya en el seudo
Dado que estas relaciones de recurrencia obviamente dan lugar a la misma sucesión, código presentado líneas arriba. En la séptima iteración se obtuvo:
11ecesitamos sólo la primera de ellas. El esbozo del proceso es de la manera siguiente: u = 2.2756822036510
se les asignan valores iniciales a u y a v,se buscan correcciones, denotadas por 8u y 8v,
V = -3.6273650847118
de modo que las ecuaciones
bo = 0.2 X 10-t4
bo(u+8u, v+8v) = b ¡ (u+8u, v+8v) = O b ¡ = o.o.
sean correctas. Al igual que en la sección 3.2, se linealizan estas ecuaciones escribiendo Ya que b0 y b1 son prácticamente cero, podemos aceptar a u y a v como los valores
aproximados de los coeficientes en el factor cuadrático -? - uz - v. Combinando los
Bbo Bbo resultados de éste y de otros ejemplos anteriores podemos mostrar la factorización del
bo(u, v) + Bu8u + 8v8v = O polinomio p. (Se muestran sólo tres dígitos de precisión en la presentación.)
8b 1 &b¡
b¡ (u, v) + }u + Bv8v = o. z4 - 4z3 + 7z2 - 5z - 2 = (z - 2)(z + 0.276)(z2 - 2.28z + 3.63).
a
Los valores de los coeficientes se han dado previamente con mayor exactitud. A partir del
En vista de las observaciones anteriores,el sistema se convierte en: factor cuadrático se pueden calcular dos ceros complejos de p (usando sus coeficientes
más precisos),que son:
co c
2
8u
[cr c1] [8v] = _ [bbo(u,
(u, v)
v)
].
1.1378411018255 ± í(l.5273122508866). 1111
1
102 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 103
Para completar el análisis del método de Bairstow necesitamos establecer ( con una En este caso p es un polinomio de grado n. En la definición de C el signo se escoge de
hipótesis razonable) que el jacobiano J no es igual a cero en el punto solución. manera que I C I sea lo más grande posible. 11
TEOREMA 9 Sea (uo,va) un punto tal que los ceros de z 2 - uaz-va son ceros simples de p. Entonces Para este algoritmo el siguiente teorema de Kahan [1967] juega un papel análogo
eljacobiano en el método de Bairstow novale cero en (uo, va). al teorema 6 .
TEOREMA 10 Si p es un polinomio, si z es cualquier número complejo, y si C se calcula con el algoritmo
Demostración En cada paso del proceso tenemos: de Laguerre, entonces p tiene un cero en el plano complejo dentro de una vecindad de
z con radio ,/ñ/C.
p(z)= (z2 -uz -v)q(z) + b1 (z - u)+ba.
La derivación parcial respecto de u y dev nos proporciona estas dos ecuaciones: Demostración Al igual que en el teorema 6, denotamos los ceros de nuestro polinomio con r1, r2, ... ,
rn. Podemos suponer que p(x) = rr;=l (x - rj), con el coeficiente principal igual a
T] T] T] uno, ya que las fórmulas para A, B, y C no se ven afectadas por cualquier factor escalar
O= -zq(z)+(z2- uz-v)-q - b1 +-(z-
b1 bo
u)+-
T]U T]U T]U vinculado a p. Derivando p y haciendo Uj= (rj -z)- 1 obtenemos:
T]q T]b1 T]bo
O= -q(z)+(z2 - uz-v)-+-(z- u)+-. n n n n
T]V T]V T]V
A partir de las hipótesis sabemos que z 2 - u0z -va tiene dos ceros, llamémoslos z 1 y
p'(z) =¿TI (z- rk)= ¿p(z)/(z -rj)= -p(z) ¿ Uj.
j=l k=l j=l j=l
zz. Resulta entonces que p(z1 ) = O, p (z2 ) = O, b1 = O y ba = O. En las ecuaciones k-,j
Z¡ +-zo+ 1/C
n
=n 2
end.
j=I
� n máxfui-fAf2
2 En este algoritmo, a. es p(zo), � es p'(zo) yy es !p''(zo).
J LEMA 1 Sean v1, v2, ... , Vn números reales cualesquiera. Tómese a. = I:7=1 V¡ y� = I;;=I v¡.
=n2 máxfui-f(n- l)D+Cf2 Entonces los números v1 se encuentran en el intervalo cerrado cuyos extremos son:
J
=n máxfui-f(C-D)+nDf2
2 n-1[a.± ,/(n- l)(n�-a.2)]. (11)
J
=n 2 máxfui-f C-Df2 - 2nRe[D(C-D)]-n 2fDf2 Demostración Basta con demostrar que v1 se encuentra en el intervalo descrito. Recurriendo a la
J
desigualdad de Cauchy-Schwarz:
ypor lo tanto
(f (tx¡) (tyJ) ,
2
fCf2+ (n- l)fDf2 � n máxf u¡f2 = n/ mín lz- r¡f2. � (12+1 2+ .. ·+ i2)(v�+v�+ · · ·+v�)
J J
Esto lleva a == (n- l)(v�+v5+ · · ·+v�)
mfn fz- rj[ 1
� n/ {fC[ +(n- l)fDf }
2 2
= (n-1)(�-vf) = (n-1)�- nvf+ vf
J
106 Cap(tulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 107
Demostración El polinomio p es de la forma p(x) = c IJJ=I (x- rj), Ya que la afirmación que se Nuestro análisis anterior muestra que
quiere demostrar es independiente de c, podemos suponer que c = l. Al igual que en
la demostración del teorema 10, con Vj = (x- rj)-1 , a. = ¿J=I Vj, y � = ¿J=I vJ, rj � Yk+I <Yk<.. ·<X<Z¡< · ..<Zk<Zk+l <l"j+I·
tenemos:
Ya que la sucesión [yk] decrece y está acotada inferiormente por rj, debe converger.
n Digamos que Y k 1 y. De las fórmulas de iteración se desprende que:
p'(x)/p(x) = :Z::::>j = a. (13)
j=l 1/u(yk ) = Yk-Yk+I -> O.
n
[(p'(x)) -p(x)p"(x)j/(p(z)) 2 =
2
¿ vJ = �.
j=l
(14) Por lo tanto u(y k) -> oo. Ahora, la fórmula para u indica que p(yk) -> O. De donde
p(y) = O y y = rj, De manera similar concluimos que Zk i rj+l ·
En el caso restante, el punto inicial no se encuentra entre dos ceros de p. Digamos
Del lema 1 se deduce que todos los números Vj se encuentran en el intervalo cuyos que x > r •. Suponga también que p(y) > O en(r n, oo). Procediendo como antes tenemos:
extremos están dados por la fórmula (11). Cuando los valores de a. y de � en las
ecuaciones (13) y(14) se sustituyen en esta fórmula, el resultado es la fórmula (12). il O< (x- r n)- 1 � u(x).
TEOREMA 11 Sea p un polinomio real cuyas raíces son todas reales. La sucesión producida por el De aquí se concluye que rn �x- 1/u(x) < x. Usando el mismo razonamiento vemos
algoritmo de Laguerre con un punto inicial arbitrario converge monótonamente a un que la sucesión [yn], tal como se definió anteriormente, decrece y converge a r.. 111
cero de p.
Se pueden encontrar estudios acerca del método de Laguerre en Bodewig [1946],
van der Corput [1946], Durand [1960], Foster [1981], Galeone [1977], Householder
Demostración Tomemos los ceros de p ordenados como r1 � r2 � • · • � r n. Suponga que x no es
[1970], Kahan [1967], Ostrowski [1966], Parlett [1964], Redish [1974], y Wtlkinson
un cero. Entonces, según el lema 2, todos los números (x-r¡)-1 se encuentran en el [1965].
intervalo cuyos extremos son:
2. Cualquier cero que se obtenga mediante el uso del método de Newton en un una estación de trabajo, y a partir de ella se generó una gráfica coloreada. Los conjuntos
polinomio reducido deberá refinarse inmediatamente aplicando el método de de tres colores se acomodaron en una forma increíble que exhibía una aparienciafractal.
Newton al polinomio original, tomando como valor inicial la mejor estimación Esto significa que, al agrandar una parte del plano donde se unen dos conjuntos, obser
que se tenga del cero. Sólo se podrá continuar con el siguiente paso de defleción vamos que se repite el mismo patrón general. Esta propiedad se mantiene si se repite el
una vez que se haya realizado esto. proceso de magnificación. Más aún, ¡todo punto frontera del primer conjunto es punto
Recomendamos que el lector consulte a Wtlkinson [1984] y a Peters y Wilkinson frontera del segundo conjunto, y también es punto frontera del tercer conjunto!
[1971] para profundizar en el tema. Se podrían estudiar muchos otros métodos para Recientemente se han publicado varios artículos y libros sobre fractales y caos.
encontrar las raíces de polinomios. En particular el método de Laguerre resulta muy Se puede encontrar información adicional en, por ejemplo: Barnsley [1988], Curry,
atractivo, debido a su favorable comportamiento global de convergencia Jenkins y Garnet y Sullivan [1983], Dewdney [1988], Glieck [1987], Mandelbrot [1982], Peitgen
Traub desarrollaron un método robusto muy adecuado para una amplia gama de software y Richter [1986], Peitgen, Saupe y Haeseler [1984], Pickover [1988], y Sander [1987].
[1970a]. Otras referencias que no se han mencionado son Allgower, Glasshoff y Peitgen
[1981], Gautschi [1979, 1984], Henrici [1974], Householder [1970], Ostrowski [1966], SERIE DE PROBLEMAS *3.5
Jenkins yTraub [1970b], Marden [1966], Smale [1981], Stoer y Bulirsch [1980], Ralston
y Rabinowitz [1978], y Traub [1964]. 1. Use el algoritmo de Homer para encontrar p( 4) si
A continuación se presenta una breve descripción de cómo se obtuvo la ilustración
p(z) = 3z 5
7 - 5z3 + z2 - Bz + 2
- z4
de la portada de este libro. Involucra el uso del método de Newton en el plano complejo.
Sea p un polinomio de al menos grado dos, y sea� uno de sus ceros. Si el método 2. Tomando el polinomio del problema 1, encuentre su desarrollo en serie de Taylor alrededor
de Newton se inicia en un punto z en el plano complejo, generará una sucesión definida del punto zo = 4.
por las ecuaciones: 3. Con el polinomio del problema 1, use el método de Newton empezando en el punto zo = 4.
¿Cuál es z1?
zo =z Zn+I = Zn - p(Zn)/p1(Zn) (n � 0). 4. Tomando el polinomio del problema 1, aplique el método de Bairstow con (u, v) = (3, 1)
como punto inicial. Calcule las correcciones ou y ov.
Si lím...... Zn = �, decimos que z ( el punto inicial) es atraído hacia �. El conjunto
00
de puntos z que son atraídos hacia � es conocido como la cuenca de atracción que 5. Encuentre para el polinomio del problema 1 un disco centrado en el origen que contenga
todos los ceros.
corresponde a �- Cada cero de p tiene una cuenca de atracción, y estos conjuntos son
ajenos entre sí, ya que una sucesión que converge a un cero de p no puede converger 6. Encuentre para el polinomio del problema 1 un disco centrado en el origen que no contenga
ningún cero.
a otro. Algunos números complejos no pertenecen a cuenca de atracción alguno; éstos
son los puntos iniciales para los que la iteración de Newton no converge. Dichos puntos 7. ¿Sucede alguna vez que el teorema 3 proporcione el radio del círculo más pequeño centrado
en el origen que contiene todos los ceros de un polinomio dado?
excepcionales constituyen el conjunto de Julia de p, así llamado en honor de G. Julia,
un matemático francés que publicó en 1918 una importante memoria sobre el terna. Si <g. Escriba un programa que tome como entrada los coeficientes de un polinomio p y un punto
todos los ceros de p son simples, las cuencas de atracción son conjuntos abiertos en el específico zo. y que como salida proporcione los valores de p(zo), p' (zo). y p"(zo). E�criba el
seudocódigo con sólo un ciclo. Póngalo a prueba con el polinomio del problema 1, tomando
plano complejo, y el conjunto de Julia es la frontera de cada cuenca de atracción. zo = 4.
En la portada de este libro se muestran las cuencas de atracción para el polinomio
p(z) = z3 - l . Las tres raíces de p son las raíces cúbicas de la unidad
<9, Escriba un programa que implemente el método de Newton complejo para un polinomio
que tenga coeficientes complejos, con un punto inicial en el plano complejo y un número
dado de iteraciones. Verifique su programa en el polinomio del problema 1, empezando por
O)¡= 1 0>2 = (-1 +v3i)/2 0)3 = (-l -v3i)/2. zo=3-2i.
10. Demuestre que todo polinomio que tiene coeficientes realespuede factorizarse en un producto
Tomamos una región cuadrada en el plano complejo y generamos un número grande de de factores lineales y cuadráticos que tienen coeficientes reales.
puntos de la malla en este cuadrado. Para cada punto de la malla se realizó una verifi 11. Verifique las relaciones de recurrencia y los valores iniciales dados para Ck y dk en la discusión
cación aproximada para determinar a qué cuenca de atracción pertenecía Esta verifica acerca del método de Bairstow.
ción consistió en seguir las primeras 20 iteraciones de Newton y constatar si alguna de
12. En el caso del polinomio p(z) = 9z4 7z3 + z2 - 2z + 5, calcule p(6), p1 (6), y el siguiente
punto en la iteración de Newton que empieza por z = 6.
-
ellas estaba a una distancia menor de 0.25 de una raíz. Si éste era el caso, las iteraciones
posteriores darían lugar a una convergencia cuadrática hacia dicha raíz. Este hecho se
estableció utilizando la teoría de convergencia normal del método de Newton en el plano 13. Usando la definición de multiplicidad que se adoptó en el texto, demuestre que si z es una
raíz de multiplicidad m de un polinomio p, entonces p(z) = p'(z) =· ·, =/m-l)(z) =O y
complejo. Así se generó un listado de puntos de la malla que pertenecían a cada cuenca /m>(z) a= O.
de atracción. Se asiguó un color a la cuenca de atracción de la raíz ro 1, y otros dos colores
a las cuencas correspondientes a las raíces 0>2 y m3• Estos tres conjuntos (de hecho sólo 14. Demuestre el enunciado inverso de la afirmación hecha en el problema anterior.
los puntos de la malla que les correspondían) se mostraron en la pantalla de colores de 15. ¿Genera el método de Bairstow una sucesión (uk, vk) que converja en forma cuadrática?
110 Capítulo 3 Solución de ecuaciones no lineales *3.6 Homotopía y métodos de continuación 111
16. Escriba un algoritmo que produzca una deflación en p(z) cuando se conoce una raíz Zo, <27. Diseñe un programa de computadora que utilice el método de Newton complejo para calcular
pero que calcule los coeficientes del polinomio reducido en orden ascendente, es decir, de las cuencas de atracción de las raíces cúbicas de la unidad, tal como se estudió en esta sección.
manera que el término constante aparezca primero. Muestre sus resultados en la terminal de gráficas de la computadora o estación de trabajo.
e 17. Experimente con el método de Laguerre codificado en aritmética compleja Encuentre las
cuatro raíces del polinomio utilizado en los ejemplos de esta sección.
<18. Usando el método de Newton y el polinomio p(z) = i3 - 1, encuentre tres puntos iniciales
cercanos(a no más de 0.01 uno del otro) de manera que las sucesiones resultantes converjan *3.6 Homotopía y métodos de continuación
a raíces distintas. Usando un graficador conecte puntos sucesivos con segmentos de línea, y
muestre las trayectorias de estas sucesiones de puntos dentro de un cuadrado que contenga
las raíces. En esta sección consideramos el problema de encontrar las raíces de una ecuación
e19. Escriba una rutina de computadora que utilice el método de Newton y la deflación para
encontrar todas las raíces de un polinomio. Verifique la rutina utilizando el polinomio f(x) = O.
pérfido de Wtlkinson, presentado en el problema 15 de la sección 2.3. (1)
20. Deduzca la ecuación(4).
Aquíf es una aplicación de un espacio lineal en otro, digamosj: X ...... Y. Este problema
21. Demuestre el siguiente resultado refiriéndolo al polinomio p(x) = ao + a¡x + · · · + an x". Para es suficientemente general para incluir sistemas de ecuaciones algebraicas, ecuaciones
una x dada hacemos (a.n, �n, Yn ) = (an, O , O) y definimos inductivamente: integrales, ecuaciones diferenciales, y otros más. Los métodos que se consideran a
(a.j, �j, yj) =(aj+ XC1.j+l, C1.j+l + �j+l, �j+l + xyj+l) continuación involucran una estrategia algo diferente de la utilizada en las secciones
anteriores, y este nuevo enfoque requiere la solución numérica de sistemas de ecuaciones
paraj = n - I, n - 2, ... , O. Entoncesp(x) = a.o,p'(x) = �o, y p"(x) = 2yo. diferenciales ordinarias, tema que no se tratará en este libro hasta el capítulo 8. Además,
22. Demuestre en el análisis del método de Laguerre que: una de las maneras de ilustrar el método incluye el problema de la programación lineal,
n
el cual se abordará en un capítulo posterior.
C2 +(n- l)D2 = �uf.
j=l Conceptos básicos
23. En la descripción del método de Laguerre se dijo que las cantidades Ay B son funciones de La idea básica del método de continuación es (incluir) el problema dado en una
z y dependen del polinomio p dado. Sea r un cero de p . Demuestre que las funciones
correspondientes Ay B parap(z)/(z-r) son: familia de problemas que dependan de un parámetro, utilizando un parámetro t que
recorre el intervalo [O, l]. Se hace corresponder el problema original con t = 1, y
A+(z-r)-1 y B-(z-d. se hace que otro problema con solución conocida corresponda a t = O. Por ejemplo,
podemos definir
24. Demuestre que si p es un polinomio de grado n con coeficientes reales, entonces
h(t, x) = tf(x) + (1 - t)g(x). (2)
"
(n - 1) [p/(x)]2 >
= np(x)p (x).
La ecuación g(x) = O deberá tener una solución conocida. El siguiente paso es elegir
<25. Escriba y ponga a prueba un programa que calcule todos los ceros de un polinomio complejo. los puntos to, t1, .•. , tm de manera que
Utilice el método de Laguerre y calcule los ceros en orden creciente de magnitud. Utilice
el procedimiento de deflación sobre un polinomio y mediante la iteración de Laguerre con el O = to < t¡ < tz < · · · < tm = l.
polinomio original refine cualquier cero obtenido del polinomio reducido. Para verificar su
programa calcule todas las raíces del polinomio:
A continuación intentamos resolvercada ecuaciónh(t¡, x) = O, (O� i� m). Suponiendo
x8 - 36/ + 546x6- 4536x5 + 22449x4- 67284x3 que se utilizará algún método iterativo (tal como el método de Newton), es prudente
+ l l 8124x2 - 109584x + 40320 = O. utilizar la solución en el i-ésirno paso como punto de partida en el cálculo de la solución
en el (i + 1)-ésimo pasó.
Las raíces correctas son los enteros !, 2, ... , 8. A continuación resuelva la misma ecuación,
pero con el coeficiente de x1, cambiado a-37. Observe cómo una pequeña perturbación en Este procedimiento puede considerarse como un remedio para la dificultad que
los coeficientes puede provocar fuertes cambios en las raíces. Por ende, las raíces son afecta al método de Newton: la necesidad de un buen punto inicial.
funciones inestables de los coeficientes. La relación (2), que incluye el problema original (1) en una familia de problemas,
<26. Modifique el algoritmo de Laguerre de manera que los polinomios que aparecen como aporta un ejemplo de una homotopía que conecta las funciones f y g. En general,
cociente se salven en la aplicación del algoritmo de Horner. Esto hace innecesario un cálculo
por separado del polinomio deflacionado después de que se ha calculado un cero. Verifique una homotopía puede ser cualquier conexión continua entre f y g. Fonnalmente, una
su programa con: homotopía entre dos funciones f, g: X ---> Y es una transfonnación continua:
z4 -(10 + 26z)z3 -(216 + !90i)z2 +(1140 + 636i)z-(72- 68i) = O. h: [O, 1] x X ---> Y, (3)
112 Capítulo 3 Solución de ecuaciones no lineales
*3.6 Homotopía y métodos de continuación 113
Al igual que t, la variable s parte de O . El valor inicial de x es x(O) = x0• Con ello se �
dispone de valores iniciales adecuados para la ecuación diferencial (9).
Ya que f y g son aplicaciones de R" en JR", entonces h es una aplicación de JE.•+l Fin
en lR". Por lo tanto, la derivada h'(y) está representada por una matriz A den x (n + 2.0
1). El vector y(s) tiene n + I componentes, las cuales denotamos con 11 1, 11 2, ••. ,
Tln+ ¡. Recurriendo al lema que aparece más adelante obtenemos otra forma de la ecuación
(9), a saber,
TI¡ = (-!/ det(Aj) ( l�j�n+ l), (10) Principio
h(t, x) =
�1�2 - 1 +7t
Figura 3.7 La trayectoria generada en el ejemplo 2.
La ecuación diferencial (9) está dada por
[
oh¡/at EJhi/0�1 8h1/B�2 �'. = [1 2�1 -6�2] [�] =
] [ J
oh2/8t fJhi/8�1 8h2/8�2 ; 7 �2 �1 O
[º]. Ol) Demostración Seleccione cualquier fila (por ejemplo la i-ésima) de A y añada una copia de él a la cabeza
de A, como si fuera una nueva fila. Esto genera una matriz B de (n + 1) x (n + 1) que
�
obviamente es singular, debido a que la fila i de A aparece dos veces en B. Al desarrollar
��
Sin embargo, es preferible usar la ecuación (10) y escribir las ecuaciones diferenciales el determinante de B a partir de los elementos de su fila superior obtenemos:
en la forma
t' = -(�t +6�1) t(O) = O n+l
En este sistema las derivadas se toman respecto de s. Dado que desearnos que t varíe de Ya que esto es cierto para i= 1, 2, . .. , n, tenemos que Ax= O. 1111
O a 1, es evidente (a partir de la ecuación que determina t) que debemos hacer que s se
desplace hacia la izquierda. En forma alternativa, podemos recurrir a la homogeneidad
del sistema y simplemente cambiar los signos del lado derecho de las ecuaciones pre
Relación con el método de Newton
sentadas en (12). Siguiendo este camino, y llevando a cabo una integración numérica, El nexo entre los métodos de homotopía y el método de Newton es más profundo
llegamos a los siguientes dos puntos: de lo que parece a primera vista. Empecemos con la homotopía
s = .087 t= .969 �l = -2.94 �2= 1.97 h(t, x)= f(x) - e-1f(xo). (13)
s = .088 t= 1.010 �l= -3.02 �2 = 2.01.
En esta ecuación, t varía desde O hasta oo. Buscamos una curva o trayectoria, x = x(t),
Tal como se hizo en el ejemplo 1, puede utilizarse cualquiera de estos puntos para iniciar en la cual
una iteración de Newton. La figura 3.7 ilustra la trayectoria generada por esta homotopía O= h (t,x(t))= f(x(t)) -e-1f(XQ).
11
Como es usual, la derivación respecto de t nos lleva a una ecuación diferencial que
Una desventaja del método utilizado en el ejemplo 2 es que no tenemos conoci describe la trayectoria:
miento a priori del valor de s que corresponde a t = l. En la práctica es posible que se O= J'(x(t))x'(t) + e-tf(xo)
tenga que ejecutar el programa varias veces.
= J'(x(t))x'(t) +f(x(t))
LEMA Sea A una matriz de n x (n + 1). Una solución de la ecuación homogénea Ax= O está
dada por Xj = (-1)i det(Aj), donde Aj es A sin la columna j. x'(t) = -[f'(x(t))r f(x(t)) (14)
1
116 Capítulo 3 Solución de ecuaciones no lineales *3.6 Homotopía y métodos de continuación 117
Si esta ecuación diferencial se integra mediante el método de Euler (descrito en la sección y suponiendo que para alguna función acotada G,
8.2) usando un tamaño de paso 1, el resultado es la fórmula
f(x) = D(x)G(x). (17)
1
Xn+I = Xn - [f'(x.)]- f(x. ).
Si éste es el caso, entonces de las ecuaciones (15) y (17) obtenemos:
Es evidente que ésta es la fórmula para el método de Newton. Está claro que se pueden
esperar mejores resultados integrando la ecuación (14), con un método numérico más x/ =x;G;(x)
preciso y un tamaño de paso variable. (Para estas cuestiones consulte el capítulo 8.)
y claramente x/ -> O si X¡ -> O.
Para satisfacer la condición (ii) basta con pedir que Ax1 = O. Ya que x' = f = DG,
Programación lineal debemos exigir que ADG = O. Esto se resuelve convenientemente si hacemos G = PH,
El método de homotopía se puede utilizar para resolver problemas de programación donde Hes cualquier función, y Pes la.proyección ortogonal sobre el espacio nulo de
lineal. (Tales problemas se discuten en el capítulo 10.) Este enfoque nos conduce de AD.
manera natural al nuevo algoritmo propuesto por Karmarkar [1984]. Al explicar el Finalmente, para asegurar la validez de la propiedad (iii); deberemos seleccionar H
método de homotopía en este contexto seguimos de cerca la descripción debida a Brophy de manera que crx(t) sea creciente. Así, deseamos que
y Smith [1988]. El lector que desee explorar con mayor profundidad estas ideas puede
d
consultar provechosamente las otras referencias que aparecen más adelante. 0< dt(cYx(t)) = cr x' = crf(x) = crDG=crDPH.
Considere el problema de programación lineal estándar:
De es una selección conveniente para H, ya que en este caso, si v = De, entonces
maximizar crx
{ (15)
sujeto a Ax = byx � O. crDPH = crDPDc = vr Pv = (v, Pv)
x' =f(x) x(O) = xº . (16) En particular xº deberá seleccionarse de esta forma. En la práctica Pv no se calcula
mediante la fórmula (19), sino resolviendo la ecuación BBrz = Bv y utilizando
La tarea que enfrentamos es determinar una f apropiada. Para satisfacer la condición
(i) debemos asegurar que siempre que una componente x; tienda a O, su velocidad r¡(t) Pv = v-Brz.
también se aproxime a O. Esto se puede lograr escribiendo
El problema de valor inicial (18) no necesita resolverse con mucha precisión. Se puede
[XI Ü1 usar una variante del método de Euler. Recuérdese que el método de Euler para la
Xz ecuación (16) nos dice que:
D(x) =
0 Xn x(t + 8) = x(t) + Bx' (t) = x(t) + of(x).
118 Capítulo 3 Solución de ecuaciones no lineales Capítulo 4
Utilizando este tipo de fórmula generamos una sucesión de vectores xº, x 1 , • • • mediante
la ecuación RESOLUCIÓN DE SISTEMAS
/ = i + 8,J(i).
+l
DE ECUACIONES LINEALES
Aunque resulta muy tentador tomar el valor de 8k tan grande como sea posible, en tanto
se satisfaga el requerimiento xk+I E :F, esto conducirá a un punto xk+1 que tenga al
menos una componente igual a cero. Como mencionamos antes, esto provocará otras 4.1 Álgebra de matrices
dificultades. Lo que parece funcionar bien en la práctica es tomar a 8k aproximadamente 4.2 La factorización LU y la factorización de Cholesky
como 9/10 del paso máximo posible. Éste último se calcula fácilmente; es la A. máxima 4.3 Pivoteo y construcción de un algoritmo
para la cual xk+I � O. (La restricción Ax = b se mantiene automáticamente.) 4.4 Normas y análisis de errores
4.5 Series de Neumann y refinamiento iterativo
*4.6 Solución de ecuaciones con métodos iterativos
SERIE DE PROBLEMAS *3.6 *4.7 Métodos del descenso máximo y del gradiente conjugado
l. Resuelva el sistema de ecuaciones *4.8 Análisis de los errores de redondeo en el método de Gauss
X -2y+ l +y3 - 4= -X - y+ 2/ - 1 = 0
mediante el método de homotopía utilizado en el ejemplo 2, iniciando con el punto (O, O).
(Todos los cálculos se pueden hacer sin recurrir a métodos numéricos.)
2. Considere la homotopía h(t, x) = tf(x)+ (1 - t)g(x), en la cual
El objetivo principal de este capítulo es examinar los aspectos numéricos que se presentan
2
f(x) =x -5x+6 g(x) =i-1. al resolver sistemas de ecuaciones lineales de la forma
Pruebe que no existe una trayectoria que conecte un cero de g con un cero def. a¡¡xi. + a¡2X2+ a13X3 + · · · + a¡nXn = b¡
3. Sea y = y(s) una función diferenciable de IR a IR" que satisface la ecuación diferencial (9). az¡X¡ + a22X2+ a23X3 + · · · + a2nxn = b2
Suponga que h(y(O)) = O. Demuestre que h(y(s)) = O.
4. Si se utiliza el método de homotopía del ejemplo (2) en el sistema a3¡X¡ + a32X2+ a33X3+ · · · + a3nXn = b3 (1)
119
120 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.1 Álgebra de matrices 121
con ayuda de una computadora, y los distintos métodos para controlarlos y reducirlos. 3 2 -1 = 6 -3
[1 3] [ 3 9]
Finalmente, vamos a introducir el tema de los algoritmos iterativos para resolver este 4 -4 12 -12
problema.
l. 5 -6 ; � -4
[2 1 3] [ -3
]= �
1;]
[-
2 1 5 3 19
O 3
4.1 Álgebra de matrices O 1 -2 -5 -2
Cuando se trata con sistemas de ecuaciones lineales hay un concepto de equivalen
En esta sección daremos un repaso a los conceptos básicos de la teoría de matrices. El cia que es muy importante. Considere dos sistemas de ecuaciones, cada uno de ellos
material adicional sobre este tema se irá introduciendo y examinando en las secciones compuesto de n ecuaciones con n incógnitas:
subsiguientes cuando así sea necesario.
Ax=b Bx=d.
Si los dos sistemas tienen exactamente las mismas soluciones, decimos que son equi
Conceptos básicos
Una matriz es una disposición rectangular de números como, por ejemplo, valentes. En lugar de resolver un sistema de ecuaciones, podemos resolver cualquier
3.0 1.1 -0.12 sistema equivalente; ninguna solución se pierde y ninguna nueva aparece. Esta idea tan
3.2 simple es la sustancia de nuestros procedimientos numéricos. Dado un sistema de ecua
6.2 o.o 0.15
[
0.6 -4.0 1.3
l 7 -17]
(3 6 ll [ -4.7 ] ciones cuya solución se busca, lo transformamos -por medio de ciertas operaciones
0.11 elementales- eh un sistema equivalente más simple que podemos resolver en su lugar.
9.3 2.1 8.2
Las operaciones elementales que mencionamos en el párrafo anterior son de los
Éstas son, respectivamente, una matriz de 4 x 3, una matriz de 1 x 4 y una matriz de siguientes tres tipos. (Aquí E; representa a la i-ésima ecuación del sistema.)
3 x 1. Al describir las dimensiones de una matriz, el número de filas (líneas horizontales) (i) Intercambiar dos ecuaciones del sistema: E¡ H E¡
se indica primero y el número de columnas (líneas verticales) en segundo lugar. Las (ii) Multiplicar una ecuación por un número distinto de cero: 'U¡ -+ E¡
matrices de 1 x n se llaman vectores fila. Las matrices de m x 1 se llaman vectores
columna o simplemente vectores. (iii) Añadir a una ecuación un múltiplo de alguna otra ecuación: E¡+ "A.E¡ -+ E¡
Si A es una matriz, las notaciones ªif , (A)if o A(i,j) se utilizan para denotar al
elemento en la fila i y la coiumnaj. Por ejemplo, si A denota a la primera de las matrices TEOREMA 1 Si un sistema de ecuaciones se obtiene a partir de otro por medio de una sucesiónfinita
que se muestran arriba, entonces A(3, 2) = -4.O. La traspuesta de una matriz se denota
Ar y es la matriz definida como (Ar )if = ají· Volviendo a nuestro ejemplo, la traspuesta
� operaciones elementales, los dos sistemas son equivalentes.
de la matriz A es Demostración Basta con examinar el efecto de una sola aplicación de cada operación elemental. Su
3.0 0.2 0.6 9.3 ponga que una operación elemental transforma el sistema Ax=b en el sistema Bx=d.
Ar = [ 1.1 O.O -4.0 2.1] . Si la operación es del tipo (i), los dos sistemas constan de las mismas ecuaciones aunque
-0.12 0.15 1.3 8.2 estén escritas en distinto orden. Es evidente que si x es una solución del primer sistema
Cuando una matriz A tiene la propiedad de que Ar = A, decimos que A es simétrica. también resuelve al segundo y viceversa. Si la operación es del tipo (ii), suponga que
Si A es una matriz y J.. un escalar (es decir, un número real en este contexto) fue la i-ésima ecuación la que se multiplicó por un escalar J.. con J..* O. Las ecuaciones
entonces J..A se define como (J..A)if = J.. a¡¡ Si A=( a if) y B = ( b¡¡) son matrices de i-ésima yj-ésima de Ax = b son:
m x n, entonces A+ B se define como (A+ B)if = a¡¡+ b¡¡. Obviamente, -A significa
(-1 )A. Si A es una matriz de m x p y B es una matriz de p x n, entonces AB es una a¡¡X¡ + · · ·+ ainXn = b¡
matriz de m x n definida como
(2)
a¡¡X¡ + · · ·+ a¡nXn = b¡
y
¿ aikb (1 � i � m, 1 �j � n).
(3)
y la i-ésima ecuación en Bx = d es
(AB)if = kj
k=I
He aquí algunos ejemplos de estas operaciones algebraicas: J..a¡¡X¡ + · · ·+ Aa ¡nXn = J..b ¡. (4)
[� -i]
4 -4
+ [� -�] = [ ;
8 2 12 -2
-!] Como J..* O, cualquier vector x que satisfaga la ecuación (2) satisface la ecuación (4)
y viceversa. Por últímo, suponga que la operación es de tipo (iii) y que se ha sumado
122 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.1 Álgebra de matrices 123
a la i-ésima ecuación A veces la j-ésima ecuación. En· tal caso la i-ésima ecuación de Demostración Sea C = BA - I + B. En tal caso
Bx = des:
(a¡¡ + A.aj ¡)X¡ + · · · + (a¡n + A.ajn)Xn = b; + Abj , (5) AC = ABA -Al+ AB = A -A+ I = I
Observe en particular que la j-ésima ecuación del sistema Bx = d no ha cambiado. y C (al igual que B) es una inversa por la derecha de A. Por el teorema 2, B = C, por lo
Si Ax = b, entonces las ecuaciones (2) y (3) son verdaderas. En consecuencia (5) es tanto BA = l. 11
verdadera. Por lo tanto Bx = d. Por el contrario, si suponemos que x es una solución
de Bx = d, entonces las ecuaciones (3) y (5) son verdaderas. Si se sustrae A veces la De los teoremas 2 y 3 se sigue que si una matriz cuadrada A tiene una inversa por
ecuación (3) de la ecuación (5), el resultado es la ecuación (2). Por lo tanto Ax = b. 11 la derecha B, ésta es única y BA = AB = l. En tal caso llamamos a B la inversa de A y
decimos que A es invertible o no singular. (Es obvio que B también es invertible y que
A es su inversa.) Escribimos B = A- 1 y A= B-1• He aquí un ejemplo:
Propiedades de las matrices
[-i �] [1 2] = [l 2] [-i �] = [1 º].
La matriz de n x n 2 -2 3 4 3 4 O 1
1 o o o 2 -2
o 1 o o Si A es invertible, el sistema de ecuaciones Ax=b tiene la solución x = A-1 b.
I= O 1 o CuandoA- 1 esté disponible, esta ecuación nos da un buen método para calcular x. Por
'� el contrario, si A- 1 no está disponible, no debería calcularse en general, con el solo
o o o propósito de obtener la solución x. Más adelante desarrollaremos métodos de mayor
eficiencia.
se llama matriz identidad. Tiene la propiedad de que 1A = A = Al para toda matriz A Las operaciones elementales que ya hemos visto se pueden realizar mediante la
den x n. multiplicación de matrices como se indica a continuación. Se define una matriz ele
Si A y B son dos matrices tales que AB = I, se dice que B es una inversa por la mental como una matriz de n x n que se origina al aplicar una operación elemental a la
derecha de A y que A es una inversa por la izquierda de B. Por ejemplo, matriz identidad de n x n. Las operaciones elementales, expresadas en términos de las
º] [ º] [ º]
filas de la matrizA, son:
l
1 O 1 (i) El intercambio de filas de A: A, H A,
[010 � =01· (6)
�
(ii) Multiplicar una fila por una constante distinta de cero: AA, -> A,
(iii) Añadir a una fila un múltiplo de otra fila: A, + A.A, -> A,.
En este ejemplo podemos ver que la inversa por la derecha de una matriz, en caso de que
exista, no es necesariamente única. No obstante, para las matrices cuadradas la situación En esta descripción, hemos denotado las filas de A con subíndices, A,, A,, y así sucesiva
es mejor, como a continuación se muestra. mente. Cada operación elemental sobre las filas de A se puede realizar multiplicando A
por la izquierda con una matriz elemental. He aquí tres ejemplos, cada uno de los cuales
TEOREMA 2 Una matriz cuadrada puede tener a lo sumo una inversa por la derecha. ilustra un tipo de operación:
º]o
jk (i) O O 1 a3¡ a32 a33 a31 a32 a33
i=l
1 0 ª11 a12 a13 a11 a12 a13
Por lo tanto, cada columna de I es una combinación lineal de columnas de A. Como las [o 1 [ª21 a22 a23] = [ a21 a22 a23 ] .
columnas de I generan lR", lo mismo sucede con las columnas de A. En consecuencia, O A 1 a31 a32 a33 A.a21 + a3¡ A.a22 + a32 Aa23 + a33
las columnas de A forman una base de JR" y los coeficientes bjk en la ecuación (7) están Si lo que buscarnos es aplicar una sucesión de operaciones elementales a las filas de A,
determinados en forma única. 111 introducimos matrices elementales E1, E2, ••• , Em y escribimos la matriz transformada
-como
TEOREMA 3 Si A y B son dos matrices cuadradas y AB = I, entonces BA = l. EmEm-1 ·' · E2E1A.
124 Capítulo 4 Resoluci6n de sistemas de ecuaciones lineales 4.1 Álgebra de matrices 125
Cuando una matriz es invertible, tal sucesión de operaciones elementales con sus Una matriz A es definida positiva si xrAx > O para todo vector x no nulo. Este
filas la reducen a I. De este modo, concepto es de fundamental importancia en el estudio de las matrices. Por ejemplo, la
matriz
EmEm-1 · • · E2E1A=f. A= [� ; ]
De lo anterior resulta que A-1 = EmEm-l · · · E2E1. En consecuencia, A- 1 se puede es definida positiva, pues
obtener sometiendo a I a la misma sucesión de operaciones elementales con sus filas.
He aquí un ejemplo que nos muestra el cálculo de una inversa:
[i ;][::]
º
X
T
Ax= [x¡ X2] = (X¡ +xd +xf +Xi> 0
]
1 2 3 1 O
A= 1 I 3 3] [ O 1 O =l
para toda x1 y x2 salvo x1 = x2 = O. Aquí xrAx se llama forma cuadrática. De los
º
l2 4 7 O O 1 problemas 18 a 20 se deduce que al tratar con matrices definidas positivas podemos
]
1 2 3 [ 1 O suponer que son simétricas. Verificar que una matriz es definida positiva a partir de la
E1A = [O 1 O] -1 1 O = E1I definición no es, en general, una tarea sencilla, ya que la definición hace referencia a un
º
2 4 7 O O 1 vector arbitrario x * O. Si A es definida positiva y es simétrica, sus valores propios son
reales y positivos.
]
[1 2 3 1 O
E2E1A = O 1 O] [ -1 1 O = E2E1I
º
,o O 1 -2 O 1 Partición de matrices
]
[1 O 3 3 -2 A menudo conviene dividir las matrices en submatrices y calcular los productos
E3E2E1A = O 1 O] [ -1 1 O = E3E2E1I como si dichas submatrices fuesen números. Un ejemplo de este procedimiento es el
]
9 -2 -3
;] �]
1 O
o
[-�
[ -1 1 O =E4E3E2E1I=A-1.
E4E3E2E1A = [O 1 O ] [ 1 -1 o 1
O O 1 -2 O 1 O -1 [ �
1 o o
Aquí las matrices elementales son: o 1 1
º º 1
] ]
1 -1
[ 1 O [ 1 O
E1 = -1 1 O E2= O 1 O 1 2 7] [ 2
º
O O 1 -2 O 1
3 2
]
1 -2 1 O -3 ]
E3 = [O 1 O E4= O -1
[O 1 O] 3 2
O O 1 O O 1 5
TEOREMA 4 Para toda matriz n x n las siguientes propiedades son equivalentes: Si estas matrices se dividen como se muestra y si cada submatriz la representamos con
una sola letra, tendremos un producto de la forma:
(i) La inversa de A existe; es decir, A es no singular.
(ii) El determinante de A es distinto de cero. [A11 A12 [Bu B12] _ [C11 C12] .
-
(iii) Las filas de A forman una base de ntn. A21 A22J B21 B22 C21 C22
(iv) Las columnas de Aforman una base de JR.".
Podemos verificar que Cij=I:;;=l A;,B,¡. Así, por ejemplo,
(v) Como aplicaci6n de ntn en ntn, A es inyectiva (uno a uno).
(vi) Como aplicaci6n de R" en ntn, A es suprayectiva (sobre). 1 O 1]
1 O 1 -1 1 O
(vii) La ecuaci6n Ax = O implica que x = O. [1 21[_ ]+ 1 -1 O 1 [ = [ ¡ 2 7]
1 l 2 � 1 O
(viii) Para cada b E JR.", hay exactamente una x E nt•, tal que Ax=b. �
] 1 1
(ix) A es un producto de matrices elementales.
(x) O no es un valor propio de A. y, como muestra el cálculo, C11 = A11B11 + A12B21-
126 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.1 Álgebra de matrices 127
A fin de establecer un resultado de alcance general respecto de esta técnica, consi PROYECTO DE PROGRAMACIÓN
deremos tres matrices A, B y C, que se han dividido en submatrices:
A, , ]
Para aquellos lectores interesados en la experimentación numérica, sugerimos un proyecto de
ª ª
programación que se puede desarrollar por etapas. El proyecto incluye escribir un cierto número
[Au A12 ... B12
de subrutinas para llevar a cabo algunas tareas básicas en álgebra lineal Esta colección de su
brutinas le suministrará un paquete personal de programas con los que podrá resolver sistemas de
A21 A22 ... A2n B21 B21c
[" "]
B22 ' ecuaciones, factorizar matrices de varias maneras y calcular valores propios y seudoinversas. La
A= B=
e"
primera parte del proyecto se describe en los problemas 12 (Sec. 4.1), 4 (Sec. 4.3), 50 a 55 (Sec.
4.3) y 56 (Sec. 4.4).
Ami Am2 ... Amn Bn1 Bn2 Bnk
[
C 21 C22 C
C2uk
C= 1. Pruebe que cualquier operación del primer tipo se puede realizar con cuatro operaciones de
los otros tipos, restringiendo). a los valores ±1.
Cm1 Cm2 cmk l 2. ¿Es cierto el teorema 1 para aquellos sistemas en que el número de ecuaciones difiere del
número de incógnitas?
TEOREMA 5 Si cada producto AisBsj se puede formar y si Cij=¿� 1 A;, B ,j, entonces C=AB. 3. Demuestre que cada operación elemental se puede anular por medio de una operación del
mismo tipo.
4. Considere el sistema de ecuaciones lineales Ax = b, donde A es una matriz de m x n,
Demostración Seanm¡ x nj las dimensiones deAij y Ín¡ XÍij las dimensiones de Bij· ComoAisBsj existe, x es den x 1 y b es de m x l. Denote los vectores columna de A con At, A2, ..., A•.
m,
se debe tener n, = para toda s. En tal caso Cij tendrá dimensiones m; x Íij .
Demuestre que el sistema tiene una solución si y sólo si b pertenece al espacio lineal generado
por {A1 ,A2, ...,A.}. Demuestre que si {A1,A2•... ,A.} es linealmente independiente, el
Considere ahora un elemento arbitrario Cij de la matriz C. Suponga que Cij se ubica sistema tiene a lo sumo una solución.
en el bloque C,, en la fila p y la columna q de C,,. En tal caso: 5. Sea E(p, q, t.) la matriz que resulta de añadir). veces la fila q a la fila p en la matriz identidad
den x n. Demuestre (suponiendo que p et q) que se cumple la igualdad E(p, q, A)-1 =
i=m¡ +m2 +···+m,_¡ +p ( 8) E(p, q, -A.). Demuestre que para cualquier matriz A de m x n, el producto AE(p, q, t.) se
calcula añadiendo A. veces la columna p a la columna q en A.
j=Íi¡ +Íi2+···+Íi,-1 +q. (9) 6. Una matriz monomial es una matriz cuadrada en la que cada fila y cada columna contiene
exactamente una sola componente distinta de cero. Demuestre que toda matriz monomial es
no singular.
En consecuencia,
7. SeaA una matriz subdividida en bloques de forma
Cij= (C,,)pq A=[g ;]
= (tAnBrs) en donde los bloques son de n xn. Demuestre que si B - I es no singular, entonces, para
t=I I pq k � I,
n A'=[i' CB'-1)c1-
n-1c].
l l [ t=;
=¿(AnBrs)pq
r=l 8. Multiplique las siguientes matrices, utilizando primero el método del producto por bloques
y después el producto ordinario.
¿ ¿(An)
= ¡,u(Brs)aq
o o
�] !]
i] [ ¡ 1]
2] [ 1 -1
t=la=I o -1 1
o
[ �
1 o
Por la ecuación (8), sabemos que los elementos (An)pu están en la fila i de la matriz A. o 1 1
1 O -2
Estos elementos cubren la fila i de A, pues 1 � t � n y 1 � a. � n,. De la misma 2 1
1 1 -1
manera, por la ecuación (9) sabemos que los elementos (Brs)aq están en la columnaj de
B. Aquí también resulta que toda la columna está presente y conserva su orden natural. 9. En relación al problema 7, encuentre la estructura de bloques deAk cuando
Por lo tanto:
n A=[��].
Cij= ¿(A\Jl (B)�j = (AB)q. 11
�=! Demuestre su resultado por inducción matemática.
128 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 La factorización LU y la factorización de Cholesky 129
10. Demuestre que el conjunto de todas las matrices triangulares superiores de n x n es una Demuestre que Ao es simétrica, A1 es antisimétrica, que A = Ao +A1 y que para toda x,
subálgebra del álgebra de las matrices de n x n. En otras palabras, demuestre que el conjunto ?Ax = xrAo.x. Esto explica por qué, al estudiar las formas cuadráticas, podemos restringir
es algebraicamente cerrado bajo las operaciones de suma, producto y multiplicación por un nuestra atención a las matrices simétricas.
escalar.
21. Dé un ejemplo de una matriz simétrica A que contenga sólo componentes positivas con la
11. Demuestre que la inversa de una matriz triangular superior no singular es una matriz triangular propiedad de que xrAx sea negativa a veces.
superior.
22. ¿Puede una matriz tener una inversa por la derecha y una inversa por la izquierda que no
<12. Escriba y ponga a prueba subrutinas o procedimientos para lo que sigue: sean iguales entre sí?
(i) STORE (n, x, y), que sustituye el n-vector x por eln-vector y.
(ii) PROD (m, n, A. x, y), que multiplica el n-vector x por la matriz A de m x n y almacena el
resultado en el m-vector y.
(iii) MULT (k, m,n, A, B, C), que calcula C = AB, donde A es de k x m, B es de m x n y C es de 4.2 La factorización LU y la factorización de Cholesky
kxn.
(iv) DOT (n, x, y, a), que calcula (con aritmética de doble precisión) el producto escalar ¿�=l x¡y¡
y almacena la respuesta como un número real a de precisión simple. Nota: x;, y¡: a son Consideremos un sistema den ecuaciones en n incógnitas x1, x2, ••• , x•. Éste se puede
números de precisión simple. escribir en la forma
13. Sea A una matriz inversible den x n, y sean u y v dos vectores de R.". Encuentre condiciones
necesarias y suficientes para u y v para que la matriz a11 a12 a13 an X¡ b¡
¡
a21 ª22 a23 a2n Xz b2
a31 a32 a33 a3n 1 rX3 1 = rb3
[J �]
sea invertible, y dé una fórmula para la inversa cuando ésta exista. an1 ª•2 an3 ... aMJ LXnJ Lbn
14. Sea D una matriz en forma de particiones: Denotemos las matrices en esta ecuación con A, x y b. Así, el sistema es, simplemente,
D= [� f] Ax=b. (1)
a a 1
o o o aM x. b.
18. Una matriz cuadrada A se dice que es antisimétrica cuando A = -A. Demuestre que si A
r
En este caso el sistema se reduce a n ecuaciones simples y la solución es:
es antisimétrica entonces xrAx = O para toda x.
19. (Continuación) Demuestre que los elementos de la diagonal de una matriz antisimétrica son b¡ /a ¡
O y que su determinante también es O cuando la matriz es de orden impar. b2/a¡22
20. (Continuación) Sea A una matriz cuadrada, y defina x= b3/a33
1
A1 = (A-A)
1
r
Ao = -(A+AT ) b./aM
2 2
130 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 La factorización LU y la factorización de Cholesky 131
Si a¡¡ = O para algún índice i, y b; = O también, entonces X¡ puede ser cualquier número Hay otro tipo de sistemas que se puede resolver fácilmente con ideas similares: a
real. Si a¡¡ = O y b; O, el sistema no tiene solución alguna.
* saber, los sistemas que se obtienen al permutar las ecuaciones de un sistema triangular.
Continuando la búsqueda de soluciones fáciles para el sistema (1), supongamos que Para esclarecer este punto, considere el sistema:
A tiene una estructura triangular inferior. Esto significa que todos los elementos de A
distintos de cero se sitúan sobre la diagonal principal o debajo de ella y el sistema (1) es: · a l1 a12 Ü XI [bl]
ª21 a22 a23 J x2] = b2 .
a¡ X¡ b [ [
11 a31 Ü Ü X3 b3
o o (4)
a21
¡ a22 Ü X2 b2¡
rX3 r
o
a31 a32 a33 Ü
º = b3 Con tan sólo reordenar las ecuaciones podemos obtener un sistema triangular inferior:
a3¡ Ü Ü] XI b3
a.1 a.2 an3 ··· ann J LXnJ Lbn
[a11 a12 Ü X2 = b¡ .
[ ] [ ]
Para resolver este sistema, supongamos que a;¡* O para todo i; en tal caso x1 se obtiene a21 a22 a23 b2
(5)
ecuación, resuélvala para x2. Procediendo de la misma forma, se obtienen x1, x2, ••. , Xn , Este sistema se puede resolver de la manera previamente indicada En otras palabras,
uno por uno y en este orden. En este caso el algoritmo formal para encontrar la solución deberíamos resolver las ecuaciones del sistema (4) no en el orden usual 1, 2, 3 sino en
se llama sustitución progresiva: el orden 3, 1, 2.
Tratemos de describir de un modo formal la propiedad de matrices que acabamos
input n, (au), (b;) de considerar. Deseamos decir que una fila de A, digamos la fila p 1, tiene ceros en
las posiciones 2, 3, ... , n. Después, que otra fila, digamos la fila p2, tiene ceros en las
for i = l, 2, ... , n do
i-1 posiciones 3, 4, ... , n, y así sucesivamente. Si éste es el caso, utilizaremos la fila p 1 para
x¡ .- b; - a¡jXj / a¡¡ obtener X¡, la fila p 2 para obtener x2, y así sucesivamente. Si reordenásemos las filas en
� (2)
( ) el orden p 1, p2, ••. , Pn la matriz resultante sería triangular inferior.
¿ Cómo resolvemos Ax = b cuando A es una matriz triangular superior o triangular
inferior permutada? Supongamos que el vector de permutación (p 1, p 2, ... , Pn ) es cono
end
output (x¡) cido o fue determinado ¡;,reviamente de algún modo. Modificando nuestros anteriores
algoritmos, llegamos a la sustitución progresiva para sistemas permutados:
Como es costumbre, cualquier suma del tipo X¡ en donde � < (l se interpreta
1:r=
como O. input n, (au), (b;), (p¡)
Se pueden utilizar las mismas ideas para resolver un sistema que tiene una estructura
for i = 1, 2, ..., n do
triangular superior. En este caso el sistema matricial tiene la forma: i-1
X¡ .- (b; - .t
1=1+1
a¡jXj) jau (3)
end
1=1+1
(7)
Los algoritmos (2), (3), (6) y (7) no se han especificado con suficiente detalle como superior unitaria (u;; = 1 para cada i). Estos casos especiales revisten una particular
para que puedan traducirse directamente a alguno de los lenguajes de programación co importancia.
nocidos. Por ejemplo, el algoritmo (7) requeriría del siguiente conjunto de instrucciones Para deducir un algoritmo para la factorización LU de A, comenzamos con la
más elaborado: fórmula para la multiplicación de matrices:
input n, (aij), (b;), (p¡)
for i = n, n - 1, .. . , 1 do
¿l Usj = ¿ l;sUsj·
n mín(i,¡)
¿l1csUsk+l UkJc.
k-I
I:
k-1
ekkukk = ªkk - e1csu,k Ejemplo Encuentre las factorizaciones de Doolittle, Crout y Cholesky de la matriz
s=l 603020
forj = k + 1, k + 2, ... , n do A= [ 302015
f
]
2015 12
ukj -(akj - e1csu,j) /ekk
º]
Respuesta La factorización de Doolittle es, a partir del algoritmo,
s=I
end
!
1 O 603020
for i = k + 1, k + 2, ..., n do A= [ 1 O [ O 5 5 ::LU
l3 1 1l ] O O 3
eik -(a¡k - � eisUsk) / Ukk
En vez de calcular las otras dos factorizaciones directamente, las podemos obtener a
end partir de la factorización de Doolittle que acabamos de ver. Si ponemos los elementos
de la diagonal de U en una matriz diagonal D, podemos escribir
º] º] ! !] =
end
1 O 60O l
OUtpUt (eij ) , (U¡j)•
A=
[
i 1 O [ O 5 O [O 1 1 WU
11 1
3
0 013 001
Observe el posible paralelismo (simultaneidad ) en el cómputo de la k-ésima fila de
U y de la k-ésima columna de L. (Véase el Prob. 59.) Si escribimos L = W, obtenemos la factorización de Crout:
En la factorización A = LU con L triangular inferior y U triangular superior, se
obtienen, a partir de la ecuación ( 9 ), n2 ecuaciones para los n2 +n elementos desconocidos
60O
A = [ 305 O
º] [1 O
l l]
i i = LU
de L y U. Obviamente, n de ellos deben especificarse. Una factorización más general 205! 001
permitiría que n elementos de L y U fuesen especificados y resolvería el sistema de
ecuaciones resultante. Desafortunadamente, dicho sistema podría ser no lineal en eif y La factorización de Cholesky se obtiene al descomponer Den la forma D 1 12D 1 12 en la
u9. (Véase el Prob. 53.) En el algoritmo recién expuesto hay que especificar, ya sea ekk, factorización LD fJ, asociando un factor a L y el otro a fJ. Así,
o Ukk, para después calcular los elementos de la k-ésima columna de L y de la k-ésima
fila de U, antes de movernos a la siguiente fila y a la siguiente columna Es más, en estos
l O
! º] [y'bO O º] [y'bO O º] 1 ! !]
iv'3 iv'3
A= [ 1 O O v5 O O v5 O [O 1 1
º] [
cálculos el orden k = l , 2, ..., n es importante.
i
1 1 O O O O O O 1
!v65 v'5 l = LF
=
[ v65 v'5
inputn, (aif) ! y5 !J3 o o !J3
fork = 1, 2, ... , n do 11
ekk -1
forj = k, k + 1, .•. , n La factorización más importante es A = LU, donde L es una matriz triangular
k-1 inferior unitaria y U es una matriz triangular superior. De ahora en adelante, cuando
Ukj -ªkj - e1csu,jL
s=I
nos refiramos a una factorización LU, nos referiremos a una factorización en la que L
es triangular inferior unitaria. He aquí una condición suficiente para que una matriz
end cuadrada A tenga una descomposición LU.
136 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 Lafactorización LU y lafactorización de Cholesky 137
TEOREMA 1 Si los n menores principales de la matriz A de n x n son no singulares, entonces la matriz Demostración Recuerde que una matriz A es simétrica y definida positiva si A = A r y xrAx > O, para
A tiene una descomposición LU. . todo vector x distinto de cero. Se sigue de inmediato que A es no singular, pues A no
puede aplicar ningún vector distinto de cero en el vector cero. Es más, al considerar
Demostración Hay que recordar que el k-ésimo menor principal* de la matriz A es la matriz vectores especiales de la forma x = (x1, xz, ... , Xk, O, O, ... , Ol, podemos ver que los
menores principales de A son también definidos positivos. El teorema I implica que A
[a¡¡ a¡z · · · aul tiene una descomposición LU. Debido a la simetría de A, tenemos que
a21 a22 · · · a2 k
Ak = ... .. .. . ...
. LU=A=A T = urLr.
ªkl ªk2 . .. ªkk
Lo cual implica que
Sean A k , Lk , y Uk los k-ésimos menores principales de las matrices A, L y U, respecti U(Lrr1 = i-Iur.
vamente. Nuestra hipótesis es que A1, A2, .. ., A. son no singulares.
Supongamos, para los propósitos de una demostración.inductiva, que Lk -l y Uk-l El miembro izquierdo de esta ecuación es una matriz triangular superior, mientras que el
ya se obtuvieron. Si en la ecuación (9) i y j se encuentran entre los números 1, 2, ... , miembro derecho es una matriz triangular inferior. (Véase el Prob. l .) En consecuencia,
k-I, también s se ubica en ese dominio. En consecuencia, la ecuación (9) nos dice que hay una matriz diagonalD tal que U(Lrr i = D. Per lo tanto, U=DLr y A=WLr .
Por el problema 2 7,D es definida positiva y sus elementos d;¡ son positivos. Denotando
=
con D 1 12 la matriz diagonal cuyos elementos sobre la diagonal son ..[clü, tenemos que
A k-1=Lk -1Uk-1
A = LF con L LD1 12, la cual es la factorización de Cholesky. La demostración de
Como por hipótesis A k-I es no singular, Lk-I y Uk-1 también son no singulares. Al ser que esta factorización es única se deja como ejercicio para el lector. 111
Lk-I no singular, podemos resolver el sistema
k-1 El algoritmo para la factorización de Cholesky es un caso especial del algoritmo
¿ l;,u,k=aik (1�i�k-1) general para la factorización LU. Si A es real, simétrica y definida positiva, entonces,
s=I por el teorema 2, tiene una factorización única de la forma A = ur, en donde L es
triangular inferior y tiene una diagonal positiva. Así, en la ecuación (8), U = Lr. En el
para u,k con 1�s�k-l . Estos elementos se encuentran en la k-ésima columna de k-ésimo paso del algoritmo general, el elemento de la diagonal se calcula por medio de
U. Dado que Uk -l es no singular, podemos resolver el sistema
et .
k-1
k-1 I/Z
lkk = (akk-; ) (13)
¿fksUsj = akj (l�j�k-1)
s=l
En este caso, el algoritmo para la factorización de Cholesky es el siguiente:
para lks con 1�s�k-l . Estos elementos están en la k-ésima fila de L. A partir de
las igualdades input n, (aij)
L lksUsk = L
k k-1
for k = 1, 2, ... , n do
ªkk = l ksUsk + ekk ukk
f-
k-1 1/2
s=I s=l
lkk (ªkk-;lt)
podemos obtener Ukk, pues ekk ya se especificó que es unitario. De este modo, todos
los elementos necesarios para formar Lk y Uk ya están definidos. La inducción queda for í = k + I , k + 2, ... , n do
completa al observar que e¡¡u¡¡ = a¡¡ y, por lo tanto, e¡¡ = 1 y u11 = a 11•
Factorización de Cholesky
11
l ;k f- ( a¡k - f
s=I
l;,l ks) /ekk
end
Como ya se mencionó, hay una factorización de matrices que resulta muy útil en end
algunas situaciones. A esta factorización se le ha dado el nombre del matemático André output (eij ).
Louis Cholesky, quien demostró el siguiente resultado:
El teorema 2 garantiza que ekk > O. Observe que la ecuación (13) nos da como
TEOREMA 2 Si A es una matriz real, simétrica y definida positiva, entonces tiene una factorización resultado para j�k
única A = Ur en donde L es una matriz triangular inferior con diagonal positiva.
¿ et � e� ,
k
ªkk = j
*N. del R.T. El ténnino 'principal minor' se emplea con dos significados diferentes.
s=I
138 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 Lafactorización LU y lafactorización de Cholesky 139
de donde concluimos que 11. SeaA una matriz den x n. Sea (p¡, p2, •.. , p.) una permutación de (1,2, ... ,n) tal que (para
i = 1, 2, ... ,n) la fila i de A tiene elementos distintos de cero sólo en las columnas p1,
pi, ... , p;. Escriba un algoritmo para resolver Ax= b.
J
¡ikj ¡ � ¡a; (1 �j � k).
12. Demuestre que toda matriz de la forma A = [ � � tiene una factorización LU. Demuestre
En consecuencia, cualquier elemento de L está acotado por la raíz cuadrada de un ele que aun en el caso de que L sea triangular inferior unitaria, la factorización no es única. (Este
mento diagonal correspondiente de A. Esto implica que los elementos de L no se hacen problema. al igual que los problemas 13 y 15, ilustra la máxima de Taussky: Si una conjetura
muy grandes en relación con A, aun sin pivoteo. (El pivoteo se explicará en la siguiente acerca de matrices es falsa, por lo general puede descalificarse con un ejemplo de 2 x 2.)
sección.)
Tanto en el algoritmo de Cholesky como en el de Doolittle, los productos escalares
i
13. Demuestre que toda matriz de la forma A = [ � J tiene una factorización LU. ¿Tiene
de vectores deberían realizarse con doble precisión, a fin de evitar una acumulación de una factorización LU en la que L es triangular inferior unitaria?
errores de redondeo. (Véase el Prob. 6 de la Sec. 4.1.) <¡4_ Diseñe un algoritmo eficiente para invertir una matriz triangular inferior A den x n. Su
gerencia: Utilice el hecho de queA-1 también es triangular inferior. Escriba en código su
algoritmo y póngalo a prueba con la matriz cuyos elementos son aij = (i +j)2 para i i;; j.
SERIE DE PROBLEMAS 4.2 Tome n = 1O. Desarrolle el producto AA-l para comprobar que la matriz que se calculó es
la inversa.
l . Demuestre los siguientes hechos, necesarios en la demostración del teorema 2.
(a) Si U es triangular superior e inversible, entonces u-1 es triangular superior.
15. Encuentre todas las factorizaciones LU de A = [ j J
1� en las que L es triangular inferior
unitaria.
(b) La inversa de una matriz triangular inferior unitaria es una matriz triangular inferior
unitaria. 16. Si A es invertible y tiene una descomposición LU, entonces todos los menores principales
(c) El producto de dos matrices triangulares superiores (inferiores) es una matriz triangular deA son no singulares.
superior (inferior). 17. Suponga que el sistema Ax = b tiene la siguiente propiedad: Hay dos permutaciones p =
(p ¡ , pi, ... , p.) y q = (q¡,q2,... ,q.) de ( l ,2,...,n), tales que, para cada i, la ecuación
2. Demuestre que si una matriz no singular A tiene una factorización LU, en donde L es una número p; contiene sólo las variables Xq1, Xq2, •••, Xq,. Escriba un algoritmo eficiente para
matriz triangular inferior unitaria, entonces L y U son únicas. resolver este sistema.
3. Demuestre que los algoritmos (2), (3), (6) y (7) siempre resuelven Ax = b cuando A es no 18. Cuente el número de multiplicaciones y/o divisiones necesarias para invertir una matriz
singular. triangular inferior unitaria.
4. Demuestre que una matriz triangular superior o inferior es no singular si y sólo si los ele 19. Demuestre o refute: Si A tiene una factorización LU en la cual L es triangular inferior
mentos de su diagonal son todos diferentes de cero. unitaria, entoncesA tiene una factorización LU en la cual U es triangular superior unitaria.
5. Demuestre que si todos los menores principales de A son no singulares y l;; ;e O para cada i, 20. Dé un algoritmo para invertir una matriz A suponiendo que su factorización LU es conocida.
entonces Ukk ;t O para 1 � k � n. (Use los problemas 8 y 14.)
6. Demuestre que la matriz A = [ � n no tiene una factorización LU. Advertencia: Esta no 21. Desarrolle un algoritmo para invertir una matriz A que tiene la propiedad de que a¡¡ = O
siempre que i +j � n.
es una simple consecuencia del teorema que se demostró en esta sección.
22. Utilice el teorema de Cholesky para demostrar que las siguientes propiedades de una matriz
7. (a) Escriba la versión parafilas del algoritmo de Doolittle que calcula lak-ésima fila de ( y simétrica son equivalentes: (a) A es definida positiva; (b) hay un conjunto de vectores
lak-ésima fila de U en elk-ésimo paso. (Consecuentemente, en elk-ésimo paso el orden en linealmente independientes x<l) , x<2> , ••., x<•> de JR", tales queAij = (x<l))7 (xU>J.
el cómputo es la, P.1c2, •••, lu-1, Ukk, ••• , ui,,.)
23. Determine la corrección del siguiente algoritmo para resolver Ux = b en el caso en que U
(b) Escriba la versión para columnas del algoritmo de Doolittle que computa la k-ésima es triangular superior:
columna de U y la k-ésima columna de L en el k-ésimo paso. (Consecuentemente, en el
k-ésimo paso el orden en el cómputo es u1k, U2k, •.• , Ukk, lk+l, ••. , ln1c.) forj=n,n-1,... ,ldo
X¡ <- b¡ /Ujj
8. Haciendo uso de la ecuación uu-1 = I, obtenga un algoritmo para encontrar la inversa de for i = 1, 2, ...,j - 1do
una matriz triangular superior. Suponga que u-1 existe, es decir, que los elementos sobre b; <- b; - UijXj
la diagonal en U son todos diferentes de cero.
end
9. Calcule el número de operaciones aritméticas que implica cada uno de los algoritmos (2), end.
(3), (6) y (7).
24. Demuestre que si los menores principales de A son no singulares, entonces A tiene una
10. Una matriz A= (aij) en la que aij = O cuandoj > i oj < i-1 se llama matriz deStieltjes. factorización LDU en la cual Les triangular inferior unitaria, U es triangular superior unitaria
Diseñe un algoritmo eficiente para invertir dicha matriz. y D es diagonal.
140 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 La factorizaci6n LU y la factorización de Cholesky 141
25. (Continuación) Si A es una matriz simétrica cuyos menores principales son no singulares, 37. Considere la matriz tridiagoual definida positiva
º·º
entoncesA tiene una factorización LDLr, en la cual L es triangular inferior unitaria y D es
diagonal. o.o
]
136.01 90.860
A - [ o.o -67.590 132.01 46.260 ·
r _ 90.860 98.810 -67.590 O.O
26. (Continuación) Escriba un algoritmo para computar la factorización LDL de una matriz
simétricaA. Su algoritmo deberá hacer aproximadamente la mitad del trabajo que realiza
el algoritmo estándar de Gauss. Observación: Este algoritmo puede fallar cuando algunos
. o.o o.o 46.260 177.17
menores principales de A son singulares. (Esta modificación del algoritmo de Cholesky no Utilizando hasta cinco dígitos significativos, factorice A de las siguientes maneras:
(a) A = LU, donde Les triangular inferior unitaria y U es triangular superior.
implica el cálculo de raíces cuadradas.)
27. Demuestre: A es definida positiva y Bes no singular si y sólo si BABr es definida positiva. (b) A = LDU, en donde Les triangular inferior unitaria, Des diagonal y U es triangular
superior unitaria.
28. Cuando A es definida positiva, ¿también lo es r 1 ? (c) A = LU, en donde L es triangular inferior y U es triangular superior unitaria.
-17 ] .
38. Determine la factorización LU de la matriz
A=
6 10
A= [ 12 26 4 ,
º]
Determine en forma directa (es decir, sin recurrir a la eliminación gaussiana) la factorización
A = LDLr, en la que Des diagonal y Les triangular inferior unitaria.
O 9 12
30. Desarrolle un algoritmo para encontrar en forma directa la factorización UL de la matriz A, en donde L es una matriz triangular inferior con doses en su diagonal principal.
en donde L es triangular inferior unitaria y U es triangular superior. Dé un algoritmo para 39. Demuestre que si una matriz singular tiene una factorización de Doolittle, dicha factorización
resolver ULx = b. no es única.
31. Encuentre la factorización LU de la matriz 40. Demuestre la unicidad de la factorización A = U7, en donde Les triangular inferior y tiene
una diagonal positiva.
3 O l
A= [O -1 3] ,
41. Una matriz que es simétrica y definida positiva (SPD) tiene una raíz cuadrada X que es SPD.
2 13 10 .
1 3 O De este modo, X = A. Encuentre X s1• A = [10 17]
en donde L es triangular inferior y U es triangular superior unitaria. 42. Desarrolle algoritmos para resolver el sistema lineal Ax = b en dos casos especiales:
(a) aq = O, cuandoj ;;¡ n-i; (b) aij = O cuandoj > n+ 1-i.
32. Factorice la matriz A = [ � ;] de modo que A = LL7 con L triangular inferior. 43. Encuentre todas las factorizaciones de Doolittle de la matriz
determine directamente la factorización LL7, en la cual L es una matriz triangular inferior 44. Demuestre que si A es simétrica, entonces en su factorización LU las columnas de L son
con elementos positivos en la diagonal. múltiplos de las filas de U.
34. Suponga que la matriz no singular A tiene una factorización de Cholesky. ¿Qué se puede
45. Para la matriz A = U 1]
� , encuentre todas las factorizaciones LU y tod�s las factoriza
U ¡6
decir del determinante de A?
ciones UL en las que L es triangular inferior unitaria.
�n
] en la que Ly U tienen elementos
46. Una matriz Pes aquella en la que a¡¡ = O paraj ;;¡ n-i; una matriz Q es una matriz P con
35. Determine lafactorización LU de la matriz A=
la propiedad adicional de que a,n-i+I = 1 parai = 1, 2, . .. , n. Encuentre 1afactorizaci6n
[-i
diagonales unitarios.
c36. Resuelva el siguiente sistema con el método de Cholesky: PQde la matrizA =
0.05x1 + 0.07x2 + 0.06xi + 0.05x.i = 0.23 47. (Continuación) Diseñe un algoritmo para obtener la factorización PQ de una matriz. De
manera similar, diseñe un algoritmo para resolver un sistema de ecuaciones de la forma
0.07x1 + O. l0x2 + 0.08xi + 0.07x.i = 0.32 PQx=b.
{
0.06x1 + 0.08x2 + O. lOXJ + 0.09x.i = 0.33
48. Suponiendo que la factorización LU de una matriz A está disponible, escriba un algoritmo
0.05xi + 0.07x2 + 0.09xi + O. lOx.i = 0.31. para resolver la ecuación x7A = b7.
142 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 143
e49. Escriba un subprograma o procedimiento que instrumente el algoritmo general para la facto 4.3 Pivoteo y construcción de un algoritmo
rización LU. Los elementos diagonales dados se pueden almacenar en una tabla D. Después,
puede utilizarse una tabla lógica asociada para indicar si un elemento de D pertenece a la
diagonal de Lo a la de U. Ponga a prueba la rutina con algunas matrices de Hilbert, cuyos En las secciones anteriores se presentó una versión abstracta de la eliminación gaussiana a
elementos son aij (i + j - 1)-1. Para cada matriz, haga las factorizaciones de Doolittle, guisa de factorización LU de una matriz. En esta sección se describe la forma tradicional
Crout y Cholesk:y =
más algunas otras con elementos específicos sobre la diagonal.
de la eliminación gaussiana y se relaciona con la forma abstracta. Después, se hacen las
50. Si A tiene una factorización de Doolittle, ¿cuál es una fórmula simple para el determinante modificaciones necesarias para elaborar una transposición satisfactoria de la eliminación
de A? gaussiana a la computadora. A lo largo de este estudio, usaremos las palabras ecuación
y fila de un sistema matricial en forma indistinta.
l]-
51. Sea
25 o o o
27 4 3 Eliminación gaussiana básica
A=
. � 54 58 O
[ o 108 116 O He aquí un sistema simple de cuatro ecuaciones con cuatro incógnitas que utiliza
100 o o o 24 remos para ilustrar el algoritmo gaussiano:
Determine, para la matriz A, la factorización LU más general en la que L es triangular inferior
unitaria. Demuestre que el algoritmo de Doolittle produce una de estas factorizaciones LU. 6 -2 2 4 12
52. Sea A una matriz simétrica cuyos determinantes de los menores principales son no negativos.
¿Tiene la matriz A + el las mismas propiedades para e > O?
12 -8 6
[ 3 -13 9
-6
10
4 1 -18
Xz _
3] X3 -
X4
34
[X¡] [
27 ]
-38
. (1)
55. Encuentre condiciones precisas sobre a, b y e para que la matriz [: t] sea difinida no concluir el primer paso, el sistema tiene el siguiente aspecto:
4]
negativa. 6 -2 2 12
57. Demuestre o refute: Una matriz simétrica A es definida no negativa si y sólo si los determi Pese a que la primera fila se utilizó en el proceso, no sufrió cambio alguno. En este primer
nantes de todos sus menores principales son no negativos. paso nos referimos a la fila 1 como la fila pivote. En la etapa siguiente del proceso,
t]
la fila 2 se utiliza como fila pivote y -4 es el elemento pivote. Sustraemos 3 veces la
58. Encuentre condiciones necesarias y suficientes sobre a, b y e para que la matriz [: segunda fila del tercero, y -!
vez la segunda fila del cuarto. Los multiplicadores son en
T
tenga una factorización LL con L triangular inferior. i.
esta ocasión 3 y - El resultado es
4]
59. En este problema la notación X;,i;k denota la parte de la k-ésima columna de la matriz X que 6 -2 2 12
va desde la componente i hasta la componente j. En forma análoga, la notación Xti:j denota
la parte de la k-ésima fila de X que va desde la componente i hasta la componente j.
(a) En relación a la ecuación (11), demuestre que la misma se puede escribir como
O -4 2
[O
O
O 2
O 4
2
-5
-13
[X¡] [
Xz
X3 =
X4
10
-9 ]
-21
. (3)
Uu+i:n = (Atk+l:n - Lt1:k-1M)/lkk, El último paso consiste en sustraer 2 veces la tercera fila del cuarto, de modo que 2 es
tanto el multiplicador como el elemento pivote. El sistema resultante es
j] [;:] [i�]-
donde M es la matriz cuyas filas son U,k+l:n, para 1 ;;; i ;;; k - l.
(b) Efectúe una transformación análoga con la ecuación (12). Los cálculos discutidos en este 6 -2 2
problema tienen la forma y +- y - Mx. Se pueden llevar a cabo con gran eficiencia en una O -4 2
(4 )
super computadora vectorial. (Para mayores detalles véase Kincaid y Oppe (1988] y Oppe [O O 2 =
y Kincaid (1988].) o o o -3 X4 -3
144 Capítulo 4 Resolución de sistemas de ecuaciones lineales
4.3 Pivoteo y construcción de un algoritmo 145
Este sistema es triangular superior y equivalente al sistema original, en el sentido de l columna k l columnaj
que las soluciones para ambos son las mismas. No obstante, el segundo de ellos es más w
�¡ . . . � ... w ... w
fácil de resolver; se comienza con la cuarta ecuación y se trabaja hacia atrás ascendiendo u � �
por filas. La solución es
..
x-[=!l
Los multiplicadores utilizados al transformar el sistema pueden colocarse en una fila k o ... o w ...
º
matriz triangular inferior unitaria L= (fif) �
� ... ªq �
m
o ... o
]
1 O O
2 1 O O
[
L= ! 3 1 O . (5)
-1 -! 2 1 fila i o ... o � .. . �
g
... �
m
Observe que cada multiplicador se ha escrito en el lugar del cero de la matriz que él
contribuyó a producir. La matriz U = (uif) formada por los coeficientes del sistema
resultante, es triangular superior o ... o �
M ... �
� ... �
M
6 -2 2 4
U= [ O -42 2 ]
. Nuestra tarea consiste en describir cómo se obtiene A(k+I) a partir de A(kl. Para originar
(6)
O O 2 -5 ceros en la columna k debajo del elemento pivote a a't], sustraemos múltiplos de la fila
O O O -3 ka las filas debajo de él. Las filas 1, 2, ... , k no se alteran. Por consiguiente, la fórmula
{
correspondiente es:
Estas dos matrices nos dan la factorización LU de A, siendo A la matriz de los coeficientes
º
del sistema original. Así, a(k) &i�k
]
�t) - (a�) 1ai1)ai?
g
ar
!)
=
j]
6 -2 2 4 1 O O 6 -2 2 &i�k+lyj�k+l (8)
12 -8 6 10 2 1 00 0-42 &i�k+lyj��
= [ l [O
3]
[ (7)
3 -13 9 3 1 O O 2
-6 41 -18 -1 -! 2 1 O O O -3 Luego definimos U= A(nl y definimos L de la siguiente manera:
No es difícil cerciorarse de lo anterior. Si sabemos cómo obtener U a paritr de
A, podemos, invirtiendo el proceso, obtener A a partir de U. Si representamos las filas a�l /a't] Síi � k + 1
de A con A1 , A2, A3 , A4 y los de U con U¡ , U2, U3 , U4, el proceso de eliminación
f;k= { 1 Sí i= k (9)
nos da, por ejemplo, U2 = A2 - 2A¡. De aquí que A2 = 2A1 + U2 = 2U1 + Uz. Los O Si i � k-1.
coeficientes 2 y l están situados en la segunda fila de L. Análogamente, las operaciones
con las filas que conducen a la fila 3 son U3= (A3 - !A1) - 3U2, por lo que tenemos Aquí A = LU es la factorización gaussiana estándar de la matriz A con L trian gular
A3 = !A1 + 3U2 + U3 = 1U1 + 3U 2 + U3 . Por lo tanto, los coeficientes!, 3, 1 deben inferior unitaria y U tri angular superior. Debería estar claro a partir de las ecuaciones·
ocupar la tercera fila de L, y así sucesivamente. (8) y (9), al igual que del ejemplo numérico que acabamos de ver, que este proceso de
Para describir formalmente el desarrollo del algoritmo gaussiano, podemos inter eliminación fallará en caso de que alguno de los elementos pivote sea igual a cero. Ahora
pretarlo como una sucesión den -1 pasos mayores que dan como resultado una sucesión podemos demostrar:
de matrices, como a continuación se indica:
TEOREMA 1 Si todos los elementos pivote a't] son distintos de cero en el proceso recién descrito,
A = A(ll -> A(2l -, .·. _, A(nl. entonces A= LU.
Al terminar el paso k - 1, la matriz A(k) estará concluida; su aspecto se muestra en el Demostración Observe que at1l = atl si i � k oj � k - l. Advierta además que Ukj = ªkJ) = ai?.
siguiente diagrama. Por último, vea que f;k = O si k > i y Uk¡= O si k < j. Supongamos que i � j. Por los
4.3 Pivoteo y construcción de un algoritmo 147
146 Capítulo 4 Resolución de sistemas de ecuaciones lineales
Aquí el algoritmo falla en virtud de que no hay forma de añadir un múltiplo de la primera
hechos que acabamos de observar, tenemos ecuación a la segunda, de modo que el coeficiente que se obtenga para x1 sea igual a
cero. (Véase el problema 6 de la sección precedente.)
¿ l;kukj = ¿ l;kukj = ¿ l;ka�l
n i i
(LU);j= La dificultad con que acabamos de tropezar persiste en el siguiente ejemplo, en el
k=1 k=l k=1 cual e es un número muy pequeño aunque distinto de cero.
í-1 Al aplicar el algoritmo gaussiano a (1 1), se obtiene el siguiente sistema triangular supe-
= ¿(a\¡1- at+ll) + ai> = ªijl l= ªij· rior:
k=l 1
=
[� 1- s-1J[;�J [2- c 1 ]·
1
(12)
Análogamente, si i > j, entonces
La solución es
j j 2- s- 1
�n (k) _ � (k)
a(k+l) Xz=---1 �1
( LU)ij = L. �;kakj - L.( aij - ij ) { 1- s- (13)
k=l k=l
x1 = (1 - x2)E-l � O.
l)
= a(i1j ) - a(iij+ = a(1)
ij = aij En 1/computadora, si E es suficientemente pequeño, 2-c 1 y -e 1 se computarán como
un mismo número. De la misma manera, el denominador 1-c 1 y-s- 1 se computarán
pues at> = O para i � j + 1 y k � j + l. 11
como un mismo número. Por lo tanto, en tales circunstancias, x2 se calculará como 1 y
Dada una matriz A = (ag), un algoritmo para llevar a la práctica el proceso básico x1 como O. Dado que la solución correcta es
de eliminación gaussiana que acabamos de describir es el siguiente: 1
{X1=- �1
input n, (a;j) 1-E
for k = 1, 2, ..., n- 1 do 1- 2E
Xz=--:a:;1,
for i = k + 1, k + 2, ..., n do 1-E
z +- aik/akk la solución calculada es exacta para x2, ¡pero es extremadamente inexacta para x1 !
a,k +- O En la computadora, cuando e es muy pequeño, ¿por qué el cómputo de 2 - E-1
forj = k + 1, k + 2, ..., n do nos da el mismo número de máquina que el cómputo de -e 1 ? La respuesta es que
ag +- ag- Wkj antes de que tenga lugar la sustracción, se debe hacer coincidir los exponentes en la
end forma de punto flotante de 2 y s- 1 desplazando el punto radical. Si este desplazamiento
end es suficientemente grande, la mantisa de 2 será cero. Por ejemplo, en una máquina con
end siete posiciones decimales similar a la hipotética MARC-32, con E = 10-8, tenemos
i,- = 0.1000000 x 10 y 2 = 0.2000000 x 10 • Si 2 se reescribe con exponente 9,
1 9 1
output (aij).
9 1
tenemos que 2 = 0.000000002 x 10 y 2- c =-0.099999998 x 109 , de tal modo
En este caso se supone que todos los elementos pivote son distintos de cero. Los multi que 2- e- 1 = -0.1000000 x 109 =-s-1 en la máquina.
plicadores se eligen de tal modo que al calcular las componentes debajo de la diagonal Un último ejemplo nos mostrará que no siempre es la pequeñez del coeficiente a11
principal de A éstas resulten iguales a cero. En.el algoritmo, en vez de efectuar el cómputo la que causa el problema. Más bien, es la pequeñez relativa de a11 respecto de los otros
correspondiente, simplemente sustituimos cada una de dichas componentes por un cero. elementos en su fila. Considere el siguiente sistema, el cual es equivalente al precedente:
Pivoteo \ e l
u � ][:�] = [
e;l (14)
El algoritmo gaussiano que acabamos de describir no es satisfactorio en la me
dida en que fracasa ante sistemas que son fáciles de resolver. Para aclarar este punto, El algoritmo gaussiano simple produce
consideremos los siguientes ejemplos elementales. El primero de ellos es:
1 ¡;-1 Xl
= ¡;-1
[� i1[::J [0 1- ¡;-l] [Xz] [ 2- ¡;-l] .
(15)
=[] (10 )
; .
148 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 149
La solución de (15) es Al comparar este algoritmo con el proceso básico de eliminación gaussiana, podemos ver
2-e- 1 que son idénticos, salvo por dos cambios. Primero, el cómputo de los multiplicadores se
Xz=---1 �1
{ l -e- ha desplazado fuera del ciclo j, ya que no dependen de j. Segundo, el primer subíndice
x 1 = e-1 -e-1x2 � O, de los elementos de la tabla de coeficientes A incluye a la permutación p. Por supuesto,
Nuevamente, para e muy pequeño, x2 se computará como 1 y x 1 se computará como O, cuando la permutación corresponde al orden natural (p¡ = i) lo que se obtiene es el
lo que, al igual que en el caso anterior, ¡es erróneo! proceso básico.
Las dificultades en estos ejemplos desaparecerán si se cambia el orden de las ecua
ciones. Así, el intercambio de las dos ecuaciones del sistema (11 ) nos lleva a
Eliminación gaussiana con pivoteo de filas escaladas*
[! i][::] = [�]. Vamos a describir un algoritmo llamado eliminación gaussiana con pivoteo defilas
escaladas que permite resolver un sistema den x n
La eliminación gaussiana aplicada a este sistema nos da
Ax=b.
=
[ � 1 �e] [::] [ 1 � 2e] '
El algoritmo consta de dos partes: una fase defactorización (conocida también como
cuya solución viene dada por
eliminación hacia adelante) y una fase de solución (que comprende actualización y
1-2e sustitución hacia atrás). La fase de factorización se aplica sólo a A, y tiene como
X2=--� l
{ 1-e finalidad producir la descomposición LU de PA, donde P es la matriz de permutación
X¡=2-X¡ � l. derivada de la permutación p. (PA se obtiene a partir de A permutando sus filas.) El
sistema lineal permutado es
La conclusión que podemos extraer de estos ejemplos elementales es que un buen
PAx=Pb.
algoritmo debe incluir el intercambio de ecuaciones en un sistema cuando las circuns
tancias así lo exijan. Por razones de economía en el cómputo, preferimos no mover La factorización PA = LU se obtiene de un algoritmo modificado de eliminación gaus
las filas de la matriz en la memoria de la computadora. En vez de ello, simplemente siana que explicaremos en breve. En la fase de solución consideramos dos ecuaciones
elegimos las filas pivote de una manera lógica. Suponga que en vez de utilizar las filas Lz = Pb y Ux = z. Primero, la parte derecha b se vuelve a ordenar de acuerdo con P y los
en el orden 1, 2, ... , n -1 como filas pivote, utilizamos las filas p¡, pz,..., Pn-1· En resultados se almacenan en b, es decir, b <- Pb. Acto seguido, Lz = b se resuelve para
este caso, en el primer paso los múltiplos de la fila p 1 se sustraerán de las otras filas. z y los resultados se almacenan en b, es decir, b <- L- 1 b. Como L es triangular inferior
Si introducimos una componente Pn de modo que (p¡, pz, ..., Pn ) sea una permutación unitaria, esto equivale a un proceso de sustitución hacia adelante. Este procedimiento se
de (1, 2, ... , n), entonces la filaPn no figurará como fila pivote, pero podemos decir que llama actualización de b. Por último, se utiliza la sustitución hacia atrás para resolver
los múltiplos de la fila p 1 se sustraerán de las filas p2,p3,... ,Pn· En el siguiente paso, los Ux = b paraxn , Xn-1, ••• , X¡.
múltiplos de la fila p2 se sustraerán de las filas p3, p4,... , Pn, y así sucesivamente.
En la fase de factorización comenzamos por calcular la escala de cada fila. Escri
He aquí un algoritmo que lleva a cabo esta tarea. (Se supone que la permutación
bimos:
p ha sido determinado de antemano y consiste en los números naturales 1, 2, ... , n en
¡¡
laP; 11/Sp; es máximo y se intercambia p¡ con Pj en la permutación p. El paso efectivo de donde
eliminación incluye sustraer (a¡,,1 /ap, 1) veces la filap1 de la fila p¡ para 2 � i � n. O l
Para describir el proceso general, suponga que estamos preparados para producir
ceros en la columna k. Inspeccionamos los números lapikl/sp, para k � i � n buscando
P= o o l
1 O
una componente que sea máxima. Si j es el índice del primero de los cocientes más
grandes, intercambiamos Pk conpj en la tablap y sustraemos (ap,k/ap,k) veces la filapk
3 -6]
de la fila p; para k + 1 � i � n. -6 8
He aquí cómo funciona esto con la matriz: A=[! -2 1
La matriz de permutación P se obtiene a partir de la permutación p escribiendo
6
3 - ]
[ (P)ij = 8p,j· En otras palabras, P se forma al permutar las filas de la· matriz identidad I
A= 21 -6 8 . conforme a las componentes de p.
3 -2 1 He aquí un algoritmo para llevar a cabo la fase de factorización de la eliminación
gaussiana con pivoteo de filas escaladas:
Al principio, p= (1, 2, 3) y s= (6, 8, 3). Para elegir la primera fila pivote, examinarnos
los cocientes {2/6, 1/8, 3/3}. El mayor corresponde aj = 3, por lo que la fila 3 es input n, (aij)
la fila pivote, de modo que intercambiamos p¡ con p3 obteniendo p = (3, 2, 1). Ahora for i = 1, 2, ... , n do
[� n _±.Ql
sustraemos múltiplos de la fila 3 de las filas 2 y 1 para producir ceros en la primera p¡ +- i
columna. El resultado es s¡ +- máx¡�j�n laijl
3 3 3 end
1 16 23
3 -3 3 · for k= 1, 2, ... , n - 1 do
3 -2 1 seleccione j � k tal que
Las componentes en las posiciones a11 y a21 son los multiplicadores. En el siguiente 1/
lap; kl/sPi � lap,k sp, para i = k, k + 1, ..., n
paso, la elección de la fila pivote se hace sobre la base de los números lal'22 I /sl'2 y Pk H Pj
lap,21/Sp; · El primero de estos cocientes es (16/3)/8 y el segundo es (13/3)/6. De este for i = k + 1, k + 2, ... , n do
modo, j = 3 e intercambiamos p2 conp3. Después, un múltiplo de la fila p2 se sustrae
z +- ap,k/ll¡,,k
de la filap3. El resultado es p = (3, 1, 2) y
ap,k +- z
l
for j = k + 1, k + 2, ... , n do
[� .!1 -n -t.
3 3 -3
1 16 ap,} +- ap,j - zap,j
3
±!!1 end
3 -2
end
El último multiplicador se almacena en la posición a22. end
output (aij), (p¡).
Si las filas de la matriz original A se intercambiasen de acuerdo con la última
permutación p, tendríamos una factorización LU de A. Tenemos, en consecuencia, Observe que los multiplicadores se guardan en A en las posiciones donde se habrían
producido los ceros en el proceso de eliminación. Por lo tanto, todos los datos necesarios
°][' -rll
para reconstruir la factorización LU están almacenados en esta tabla. Sin embargo, el
2
usuario debería ser consciente de que el algoritmo escribe sobre los valores de la tabla
PA= [lt
O
- original A. La matriz A se debería guardar en una tabla por separado, en caso de que se
O
o 1¡o -n
O
:
3 -n 1
I vaya a necesitar después.
Para resolver Ax = b una vez que la fase de factorización se ha llevado a cabo con
' -2 A, aplicamos a b la fase hacia adelante del algoritmo, utilizando la tabla final p para la
= 2 3 -6 ,
[
ll permutación y los multiplicadores que fueron determinados en la fase de factorización
1 -6 8 del algoritmo. Después, se lleva a cabo la sustitución hacia atrás, es decir, se resuelve
152 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 153
para Xn, Xn-I, ... , x1 en este orden. He aquí el algoritmo que cumple con la fase de Estas dos ecuaciones dependen de dos hechos: de que la fila Pk de A(n) se fijó en el paso .
solución del algoritmo. k, y de que la columna k de A(n) se fijó en el paso k +1. De este modo
n
input n, (a;j), (p¡), (b;)
<•)
aPkl_ =a<pk;)_¡ y ap( ¡k) = ap<k,k+I)
for k =1, 2, ..., n -1 do
Es más, la fórmula que acabamos de dar para l;k es válida cuando i = k, ya que produce
for i = k +1, k + 2, ..., n do un 1 para ekk. Ahora suponga que i ;;; j. Tenemos:
bp, <- bp, - ap,k bp,
�e �( e
i
end i-1
(LU)¡¡ = L., ik uk ¡ = L., ap(k,k)/ ap(k),k) ap(kü) + ¡¡ap(i),j
end
k =I k =I
_t
for i = n, n - 1, ... , 1 do i-1
k =I
¡=t+I
end Si i> j, entonces
output (x¡).
°"
sistema triangular superior, es decir, se trata de una sustitución hacia atrás. Por supuesto, j -1
la permutación p debe utilizarse para evitar que las cosas se embrollen. Observe que la (I )
= L., (ipk¡¡) _ aP;J (k+I)
)
PU = aPU = aPU·
+ il.
suma j es nula cuando i = n, de modo que Xn = bp./ap,n· k =I
matriz de permutación. Daremos una demostración formal de este resultado, construida Es así como hemos demostrado que, para todos los pares (i,j),
según el modelo de la prueba del teorema1. Tal demostración no depende de la estrategia
{
que se utiliza para determinar los pivotes. (PA);¡ = (LU)ij. 111
Sean p¡, p2, • • • , Pn los índices de las filas en el orden en que se seleccionaron como
filas pivote. Sea A(!) = A y defínanse A (Z), A <3l, ..., A (n) recursivamente con la fórmula TEOREMA 3 Si lafactorización PA = LU se lleva a cabo con el algoritmo gaussiano con pivot�o de
filas escaladas, la solución de Ax = b se encuentra resolviendo en primer lugarLz = Pb
a��) Si i � k o i> k> j
y en segundo lugar Ux = z. De igual manera, la solución de l A = cr se encuentra
ap<k¡J:ll = ap(k¡¡) (ap(k,k) /ap(k,k) )ap(k;)¡_
- Si i > k y j> k (16) resolviendo primero urz = e y después LrPy = z.
ikl¡a<kl Si i> k y1· = k
p, k p;k Demostración Esto se deja como un ejercicio para el lector. 11
TEOREMA 2 Defina una matriz de permutación P cuyos elementos son P;j = Bp,j- Defina una ma
triz triangular superior U cuyos elementos son u;¡ = atJ si j � i. Defina una matriz El seudocódigo para resolver Ax = b en términos de L y U tiene el siguiente
aspecto:
triangular inferior unitaria L cuyos elementos son f;¡ = a¡7J si j < i. En tal caso,
PA=LU.
input n, (lij ), (uij), (b;), (p;)
Demostración Con base en la fórmula recursiva tenemos: for i = 1, 2, ... , n do
¿ e z¡
i-1
k)
Uk_J· =a<•)_=
P,J a(P,J_ (j "?;, k) z; ...... bp, - ij
j=I
e-1k=a<•)¡k
p
= ap(k¡k+I)=ap<k¡k) /ap(k;)k (i "?: k) end
154 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 155
.t
fori=n,n-1, ..., l do Considere el primer paso (k = 1) que se da en el proceso de factorización cuando
se opera con una matriz A de n x n. El cómputo necesario para definir p1 ( el índice de la
X¡ <- (z¡- UijXj) /u¡¡ fila pivote) comprenden divisiones (n ops) . Para cada uno de las n - 1 filas numeradas
1=1+!
P2, p3, ... , Pn, se calcula un multiplicador (1 op) y un múltiplo de la fila p1 se sustrae
end de la fila p¡ para 2 � i � n. Los ceros que se generan en la primera columna no son
output (x¡). computados. Así, el multiplicador y el proceso de eliminación consumen n ops por fila.
Como el número de filas procesadas es den -1, tenemos n(n -1) ops. A éstas hay que
Se puede escribir el mismo algoritmo utilizando las componentes de la matriz A añadirles las n ops necesarias para determinar p1• El total es de n2 ops.
que se origina con el proceso gaussiano. El resultado es El resto del proceso de factorización se puede interpretar como una repetición del
primer paso con matrices cada vez más pequeñas. Por ejemplo, en el segundo paso la
input n, (aif), (b¡), (p¡) fila p1 y la primera columna no se toman en cuenta. El cálculo de componentes en este
fori=l,2, ... ,ndo caso es como si el primer paso se aplicara a una matriz de(n-1) x(n-1). Esto significa
Z¡ <- ¿
bp, -
i-1
i=I
apJZ¡
que la factorización requiere
n2 + (n - 1) 2 + ...+ 32 +22 -3
- ln3 + ln2 + ln -1 ;:::; ln3 + ln2
2 6 3 2
end
.t
for i = n, n - 1, ..., 1 do operaciones extensas. En la fórmula anterior usamos el hecho de que I:;=t k2 =
X¡ <- (
Zi -
1=1+1
apJXj) /ap,i
!n(n +1)(2n +1) . Cuando n es grande, el término }n3 es dominante. De este modo,
encontrar la factorización LU con pivoteo de filas escaladas requiere aproximadamente
in3 operaciones extensas cuando n es muy grande.
end Un examen de la segunda fase del algoritmo nos muestra que la actulización de la
output (x¡). parte derecha b toman-1 pasos. En el primero de ellos hay n -1 operaciones extensas;
en el segundo hayn -2, y así sucesivamente. El total es
Recordando que p-l = pT, el seudocódigo para resolver/ A = cT es el siguiente:
(n - 1) + (n - 2) + · · · +1 = !n2 - !n.
input n, (aij), (c;), (p¡)
forj = 1,2, ...,ndo En la fórmula anterior usamos el hecho de que I:;=t k = !n(n +1). En la sustitución
<- (
j -1 hacia atrás hay una operación extensa en el primer paso ( computar x.). Después hay
Z¡ C¡ - � apJZi) /aPiÍ sucesivamente2, 3, ... , n operaciones extensas. El total es
end 1 + 2 + 3 + · · · + n = !n2 + fn
forj = n, n - 1, ... , 1 do Pot consiguiente, el gran total para esta fase del algoritmo es n2• Para resumir nuestras
YPi <- ¿
Z¡ -
n
i=j+I
apJYp,
conclusiones formulamos el siguiente resultado de carácter más general.
TEOREMA 4 Si la eliminación gaussiana se utiliza con pivoteo de filas escalonadas, la solución del
end sistema Ax= b para Afija y m vectores distintos b comprende aproximadamente
output (y¡).
!n3 +(! +m)n2
separado. Es más, podemos computar A - I en 0(1n3) ops, puesto que se trata de un Una desigualdad equivalente es
caso especial de una situación que ya hemos analizado con anterioridad; es decir, AX = I
se puede resolver para cada columna de A-I resolviendo Ax(i) = e¡ utilizando n valores
L laiil > L J(an/au)avl-
n n
para i. Tenga en mente que A -I no se debería computar cuando se resuelve Ax = b; más Ja;d -
bien, lo que se debe resolver es x directamente. j=2 2 j=
j,;:i
Matrices diagonalmente dominantes Con base en el predominio diagonal en la fila i, sabemos que
j=2
Si la matriz de coeficientes tiene esta propiedad, entonces en el primer paso de la elimi
nación gaussiana podemos utilizar la primer fila como fila pivote, ya que, en virtud de la Sin embargo, estó último es cierto en virtud que la fila 1 es diagonalmente dominante:
desigualdad (17), el elemento pivote a11 es distinto de cero. Al terminar el primer paso n n
nos gustaría saber que la segunda fila se puede utilizar como la siguiente fila pivote. Esta Jau!>¿ Ja1jl =} 1> ¿Jalj/a111- 11
situación se rige por el siguiente teorema. j=2 j=2
TEOREMA 5 La eliminación gaussiana sin pivoteo preserva una matriz diagonalmente dominante. COROLARIO 1 Toda matriz diagonalmente dominante es no singular y tiene unafactorización LU.
Demostración Basta con considerar el primer paso de la eliminación gaussiana (el paso en que se Demostración El último teorema y el teorema 1 implican que una matriz A diagonalmente dominante
producen los ceros en la columna 1), ya que los pasos subsiguientes son una imitación tiene una descomposición LU en la cual L es triangular inferior unitaria. Por el teorema
de éste, salvo que se aplican a matrices de menor tamaño. anterior, la matriz U es diagonalmente dominante. En consecuencia, sus elementos sobre
Así, sea A una matriz de n x n con predominio diagonal. Teniendo en cuenta los la diagonal son distintos de cero, de modo que L y U son no singulares. 11
ceros producidos en la columna 1 y el hecho de que la fila 1 no sufre cambio, debemos
demostrar que para i = 2, 3, ... , n, COROLARIO 2 Si la versión de pivoteo con filas escaladas de la eliminación gaussiana se aplica a
n
una matriz diagonalmente dominante, los pivotes serán los usuales: 1, 2, ... , n. Por
consiguiente, en este caso el trabajo de elegir los pivotes se puede omitir.
Ja¡¡lJ> ¿Ja�lJ
j=2
j:1:i Demostración Por el teorema 5, basta con demostrar que el primer pivote que se elige en el algoritmo
es l. Por lo tanto, es suficiente demostrar que
En términos de A, esto significa que
n
Ja11I/S¡ > Ja;¡J/s¡ (2 � i � n).
Ja¡¡ -(a¡¡/a11)a¡¡J> ¿ [aij - (an/a11)a1jl Por el pred.ominio diagonal, Ja¡¡J = máxj laiil = para toda i. Por consiguiente,
S¡
j=2
j,;,i Ja11 I/s¡ = l . Para i ?; 2 tenemos:
O 11 2
En este despliegue, los elementos de la matriz que no se muestran son ceros. 1 Ü 1 j X2 Ü
¡ , _, , .1 n ¡ ºJ
=
Supondremos que la matriz de coeficientes es tal que el pivoteo es innecesario Ü 1 -1 1- X3 3
para resolver el sistema. Esto es cierto, por ejemplo, cuando la matriz es simétrica y 3 X4 1
definida positiva. En este algoritmo, utilizamos la eliminación gaussiana simple, y la (d)
parte derecha de la igualdad (el vector b) se procesa simultáneamente. En el paso 1,
un múltiplo de la fila 1 se sustrae de la fila 2 para producir un cero en el lugar que 12 8 - 4 10 xz = 1- 0
originalmente ocupaba a1. Observe que d2 y b2 sufren alteraciones, pero c2 no. El 3 1- 3 3 3 X3 39 -
[¡ ¡["] ] [ ']
múltiplo adecuado es a¡ /d 1 . Por lo tanto, el primer paso se compone de los siguientes -
6 42 -18 X4 1- 6
reemplazos: (e)
d 2 ,,_d2 - (a¡/d¡ )c1 O 2
4 9- 21 x2 14
b2 ,,_b2 - (a¡ /d1)b1 . 8166 5 X3
=
3-
Los pasos restantes en la fase de eliminación hacia adelante son exactamente iguales al 2 3 21 X4 Ü
{
puede escribirse en la forma
Xn ,,_ bn /dn.
-
El siguiente paso es �o =
a(kl
, . Sii -� k o j <k
Xn-1 ,,_ (bn-1 - Cn-1Xn )/dn-l ª;¡ a�kl (a/;l;atl)ai? Si i > ky j '?, k.
160 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 161
3. Sea (p i, p2, ..., p.) una permutación de (1, 2, ...,n ) y defina la matriz P con P¡¡ = /5p1¡. Sea entonces el algoritmo para los sistemas tridiagonales, por lo menos en teoría, surtirá efecto
A una matriz arbitraria den x n. DescribaPA, AP, p-I y PAP-1• en virtud de que no se encontrará ningún elemento pivote igual con cero. Remítase a la
ecuación (19) para la notación.
e 4. La eliminación gaussiana con pivoteo total trata tanto las filas como las columnas en un
orden distinto del orden natural. Así, en el primer paso, el elemento pivote ag se elige de 13. Escriba un algoritmo especial de eliminación gaussiana para resolver sistemas de ecuaciones
tal modo que Ja;¡ 1 es el valor máximo de toda la matriz. Esto determina que la fila i sea lineales cuando A tiene la propiedad de que aij = O para i > j + l. No haga uso del
la fila pivote y la columna j sea la columna pivote. Los ceros se producen en la columna pivoteo. Incluya en el algoritmo el procesamiento de la parte derecha del sistema. Cuente
j sustrayendo múltiplos de la fila i de las otras filas. Escriba el algoritmo que realiza este las operaciones necesarias para resolver Ax = b.
proceso. Serán necesarios dos vectores de permutación.
1 4. Cuente las operaciones en el algoritmo para sistemas tridiagonales que aparece en el texto.
5. SeaA una matriz den x n con factores de escalas;=máx1;.¡�.Jal Suponga que todos los s;
son positivos y sea B la matriz cuyos elementos son (aij/s;). Demuestre que si la eliminación 15. Vuelva a escribir el algoritmo para sistemas tridiagonales de modo que el orden en que se
hacia adelante se aplica tanto a A como a B, los dos L-tablas finales son iguales. Encuentre procesan las ecuaciones y variables se invierta.
una fórmula que relacione las matrices finales A y B (después de ser procesadas).
16. Demuestre el teorema relativo a las operaciones extensas en la eliminación gaussiana.
6. En ocasiones es aconsejable modificar un sistema de ecuaciones Ax = b, introduciendo
nuevas variables y, = d1x;, en donde los d1 son números positivos. Si las x; corresponden 17. Ejemplifique el funcionamiento de la eliminación gaussiana con pivoteo de filas escaladas
a magnitudes físicas, entonces este cambio de variables corresponde a un cambio de las cuando se le aplica a la matriz
unidades por medio de las cuales se mide x;. Por ejemplo, si decidimos cambiar x1 de
centímetros a metros, y1 = 10-2x1. En términos de matrices, definimos una matriz diagonal [-9 l 17]
D con las d; como componentes sobre la diagonal, y establecemos y = Dx. El nuevo A= 3 2 -1
sistema de ecuaciones es AD-1y = b. Si d¡ se elige como máx1:;¡;:;¡. JagJ, llamamos a esto 6 8 1
equilibración de columnas. Modifique los algoritmos de factorización y solución a fin de
incorporar laequilibración de columnas. (Los dos algoritmos juntos aún resolverán Ax = b.) Muestre la tabla de factores de escala. La matriz final A deberá tener escritos los multiplica
7. Demuestre que en el algoritmo gaussiano con pivoteo total (es decir, con pivoteo en las filas dores en la posición correcta. Determine P, L y U y verifique que PA = LU.
y las columnas), los multiplicadores se encuentran en el intervalo [-1, l]. (Véase el Prob.4.)
18. Ilustre el funcionamiento de la fase de eliminación gaussiana con pivoteo de filas escaladas
cuando se aplica a la matriz
J]
8. Sea A una matriz de n x n que al ser procesada por eliminación hacia adelante da como
resultados la matriz B y la permutación p =(p¡, p2, ..., p.). Sea P la matriz que se obtiene ¡ -2
al escribir las filas y las columnas de la matriz identidad en el orden p1, p2, ..., p•. Demuestre [2 -4
que la descomposición LU de PA se obtiene de la siguiente forma: Sean C = PB, Lg = Cij 3 -5
paraj < i y Uij = C;¡ para i � j. (Obviamente, U;¡ = O si i > j y L;¡ = O sij > i y L¡¡ = l.)
Muestre todos los pasos intermedios: los multiplicadores, la tabla s de factores de escala y
9. Si el factor U de la descomposición LU de A es conocido, ¿cuál es el algoritmo para c�lcu el vector p de permutación. Muestre también la matriz final A que resulta de la aplicación
lar L? completa del algoritmo.
10. Ilustre el funcionamiento de la eliminación gaussiana con pivoteo de filas escaladas en este 19. Este problema nos muestra cómo la solución de un sistema de ecuaciones puede ser inestable
caso (sólo en la fase hacia adelante ). en relación a pequeñas perturbaciones en los datos. Resuelva Ax = b con cada una de las
siguientes matrices, con b = (100, lf. (Véase Stoer y Bulirsch [1980, p. 185].)
2 -2 -4
[1 1 -1]
3 7 5 A1 =
[i 6] A2 =
[i o.oi]
Muestre la tabla de factores de escala (s1, s2, s¡) y la última permutación (p 1, pi, p¡). Muestre
la matriz.final A con los multiplicadores escritos en el orden que les corresponde. 20. Suponga que O< s< i-22• Si se utiliza el algoritmo de Gauss sin pivoteo para resolver el
sistema
11. Lleve a cabo las instrucciones del problema 10 con la matriz {SX¡ +2x2 = 4
x1-x2=-l
3 7 3
1 t
4 '. en la MARC-32, ¿cuál será el vector solución (x¡, x2)?
[4 1 o] 21. Resuelva el siguiente sistema por medio de la eliminación gaussiana con pivoteo total (tal
como se le describe en el problema 4 ):
1 2. Suponga que A es tridiagonal. Defina co = O yª• = O. Demuestre que si A es diagonalmente
dominante por columnas [-9 J 17] [X¡] [ 5]
3 2 -1 X2 = 9
Jd;J > lad + lci-d (1 � i � n), 6 8 l X3 -3
162 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 163
22. Resuelva el sistema 30. Utilice la eliminación gaussiana con pivoteo de filas escaladas para encontrar el valor del
determinante de
0.264Lt1 +0.1735x2+0.8642x3 = -0.7521 [o -1 o 1]
{ 0.9411Xt +0.017fo +0.1463X3 = 0.6310 A= O 1 O 1
1 1 2 O
-0.864lx1 - 0.4243x2 +0.07 l lxi = 0.2501 2 O 1 O
utilizando la eliminación gaussiana y: (a) sin pivoteo, (b) pivoteo de filas escaladas. 31. Considere el sistema
23. Escriba un algoritmo para resolver el sistema Ax= b bajo las condiciones siguientes: Hay x2+2x3 = 1
una permutación (p1 ,p2, ••• , p.) de (1, 2, ... , n) tal que para cada i, la ecuación p; contiene { 2x1 - X2= 2
sólo a la variable x;.
2x2+xi= 3
24. Repita el problema anterior suponiendo que para cada i, la ecuación i sólo contiene la
variable Xp¡ - Determine la factorización PA = LU, donde P es una matriz de permutación. Utilice la
factorización para obtener det(A).
25. Repita el problema anterior suponiendo que para cada i, la ecuación p; sólo contiene la
variable xp,. Proporcione el algoritmo más simple en este caso. 32. Considere
26. (a) Demuestre que si aplicamos la eliminación gaussiana sin pivoteo a una matriz simétrica 3 2 -1
A, entonces l;1 = a¡¡/au. A= [ 6 6 2]
(b) A partir de lo anterior, demuestre que si se suprimen la primera fila y la primera columna -1 1 3
de A(2l, se obtiene una matriz de (n - 1) x (n - 1) que es simétrica Concluya que no es
necesario computar los elementos bajo la diagonal de la matriz más pequeña. Por medio Utilice la eliminación gaussiana con pivoteo de filas escaladas para encontrar la factorización
de la inducción matemática demuestre que lo mismo sucederá en cada paso de la fase de
factorización. PA=WU
(c) Demuestre que la cantidad de cálculo requerida es casi la mitad si se compara con el caso
de las matrices no simétricas. en donde L es una matriz triangular inferior unitaria, U una matriz triangular superior unitaria,
(d) Utilice la simplificación para resolver el sistema D una matriz diagonal y P una matriz de permutación.
33. En los siguientes problemas fijamos el valor de n y denotamos con 1 al conjunto {1, 2, ... ,
0.6428x 1 +0.3475x2 - 0.8468xi= 0.4127 n}. Una permutación de 1 es una aplicación p: 1....1. en donde la flecha doble indica que
{ 0.3475x1 + l.8423x2 +0.4759x3 = 1.7321 p es suprayectiva. De este modo cada elemento de 1 es la imagen p(i) de algún elemento
-0.8468x1 +0.4759x2 + l.2147xi= -0.8621 i de 1. La permutación identidad se define como u(i) = i para toda i E 1. Demuestre
que si p y q son dos permutaciones de 1, entonces también po q lo es, definiéndose esta
última aplicación de la manera usual con la ecuación (po q)(1) = p(q(¡)). Demuestre que
27. Considere la matriz po (qo r) = (po q)o r y quepo u = uo p = p.
o 4 25 79
[ 9O 167 392 89
99
] 34. (Continuación) Demuestre que cada permutación p tiene una inversap-1, la cual satisface
1 1
p o p- = u = p- o p. El conjunto de todas las permutaciones de 1 se llama grupo
O 6 6 49
simétrico de 1.
Marque con un círculo la componente que será utilizada como elemento pivote en la eli
minación gaussiana con pivoteo de filas escaladas. La tabla de los factores de escala es 35. (Continuación) Dé un algoritmo para determinar la inversa de cualquier permutación
s = (80, 89, 160, 30). dada. (Una permutación de 1 se puede representar en la computadora como un vector
28. Muestre la matriz que resulta de aplicar la fase hacia adelante de la eliminación gaussiana (p( l),p(2), ... , p (n)).)
con pivoteo de filas escaladas a la matriz 36. Suponga que se nos da un sistema de ecuaciones Ax = b con A de n x n. Sean p y q
dos permutaciones de {1, 2, ... , n}. Escriba un algoritmo para resolver el sistema bajo la
2 -2 -4 suposición de que para i = !, 2, ... , n, la ecuación con número p; contiene solamente
[1 1 -1] la variable Xq1•
3 7 5
37. (Continuación) Repita el problema anterior bajo la hipótesis de que para cada i, las variables
En la matriz final, escriba los multiplicadores en los lugares adecuados. Xq1 , xq,, •••• Xq1_, no figuran en la ecuación con número p;.
º]
29. Encuentre el det(A) para 38. (Continuación) Repita el problema 36 bajo la.premisa de que para cada i, la variable Xqi
2 1 figura sólo en las ecuaciones correspondientes a los números p¡, pi, ... , p;.
A= [1 4 1
O 1 2 39. (Difícil) Encuentre un algoritmo para resolver Ax = b bajo la hipótesis de que todos los
elementos ay son cero, a menos que li -ji � 1, (i,j) = (!, n) o (i,j) = (n, 1). Use la
sin calcular el determinante por desarrollo de menores. eliminación gaussiana sin pivoteo.
4.4 Normas y análisis de errores 165
164 Capítulo 4 Resolución de sistemas de ecuaciones lineales
40. Cuente el número de operaciones extensas que hay que realizar en la factorización LU de c52. Escriba y pruebe programas que incluyan la equilibración de columnas en el algoritmo
una matriz de n x n, suponiendo que no se realiza pivoteo. gaussiano (Prob. 6.)
41. Sea A una matriz de n x n con predominio diagonal en sus columnas. Esto significa que c53_ Escriba y pruebe programas para resolver los sistemas Ax = by lA = cr con una sola
factorización de A (con pivoteo de filas escaladas) y otros dos subprogramas en donde se
resuelva para x y y respectivamente.
¿laifi<laiil (1 �j � n)
c54_ Escriba y pruebe programas para resolver el sistema Ax = b utilizando equilibración de
i=l
t*j columnas, equilibración de filas y pivoteo total. (Consulte los problemas 4 y 6 si no entiende
la terminología.)
Determine si la eliminación gaussiana sin pivoteo preserva dicho predominio diagonal.
'55. Escriba una subrutina GAUSSJ (N, A, B. X, P. S, D) que resuelva un sistema Ax= b de n x n
42. Sea A una matriz diagonalmente dominante. Se define el exceso en la fila i con la ecuación por el método de Gauss-Jordan con equilibración de columnas y pivoteo de filas escaladas.
En el algoritmo de Gauss-Jordan (sin pivoteo), en el k-ésimo paso principal se sustraen
múltiplos de la fila k de las demás filas, de tal modo que el coeficiente de x, es O en todas las
e,= la¡¡! -¿!aij! filas menos la k-ésima fila. Al final, la matriz será diagonal (en vez de triangular superior,
i=l como en el método de eliminación gaussiana). En el pivoteo de filas escaladas, la fila p, se
fr.i utiliza como pivote para producir coeficientes O para x, en todas las filas menos la fila p,.
La equilibración de columnas, tal como se examinó en el problema 6, se debería realizar al
Muestre que en la demostración del teorema 5 es cierto lo que sigue: principio. Los divisores necesarios en este proceso deberían guardarse en una tabla D, pues
se necesitarán al final para obtener x.
¿ !aij -a11alj/a11! +e¡.
"
!au -a¡¡au/a11!;;; 56. Demuestre o refute la conjetura natural de que si una matriz tiene la propiedad
j= Z
O.<:!a¡¡¡;;;¿laijl (1 � i � n),
Y el exceso en la fila i no disminuye con la eliminación gaussiana. i=l
fr.i
e 43. En relación al problema 26, escriba un programa que lleve a cabo la fase de factorización de
la eliminación gaussiana con una matriz simétrica. Suponga que no se requiere el pivoteo. entonces la eliminación gaussiana sin pivoteo conservará esta propiedad.
44. Sea p una permutación de { l. 2, ... , n}, y sea P la matriz de permutación correspondiente.
(Es decir,Pij = l5p,¡.) Sea q la inversa de p y Q la matriz de permutación correspondiente a 57. (a) Demuestre que el cómputo del determinante de una matriz por desarrollo de menores
comprende (n - l )(n!) ops.
q. Demuestre que p-1= Q. Diríjase a los problemas 33 a 35 en caso de necesidad.
(b) Demuestre que la regla de Cramer necesita de (n2 - 1)(n!) ops.
45. (Continuación) Demuestre que si Pes una matriz de permutación, entonces p-1 = PT.
(c) Demuestre que el método de Gauss-Jordan comprende !n(n +1)2 :::a !n3 ops y es, par lo
46.. Si A es de n x n y B es de n x m, ¿cuántas multiplicaciones y divisiones se requieren para tanto, 50% más costoso que la eliminación gaussiana.
resolver AX= B mediante la eliminación gaussiana con pivoteo de filas escaladas? ¿Qué se
puede decir cuando B= l?
47. Demuestre o refute: Si A es tridiagonal y Pes una matriz de permutación, entonces PAP-1
es tridiagonal. 4.4 Normas y análisis de errores
48. Suponga que la tabla de factores de escala se vuelve a computar en cada paso mayor de
la eliminación gaussiana con pivoteo de filas escaladas. Demuestre que para toda matriz
simétrica con predominio diagonal, la eliminación gaussiana produce los mismos resultados Para discutir los errores en problemas numéricos que manejan vectores resulta útil recu
sin pivoteo que con pivoteo de filas escaladas. rrir a las normas. Usualmente nuestros vectores son elementos de uno de los espacios
49. Demuestre el teorema 3. IR", pero ello no impide que una norma pueda definirse en cualquier espacio vectorial.
'50. Escriba y ponga a prueba algunos programas que lleven a cabo la eliminación gaussiana
con pivoteo de filas escaladas. En los problemas 19, 21, 22 y 26 encontrará algunos casos Normas vectoriales
interesantes para ponerlos a prueba.
5 L En el algoritmo de la eliminación gaussiana con pivoteo de filas escaladas, suponga que los Definida sobre un espacio vectorial V, una norma es una función 11 · II que va de V
factores de escala se redefinen como sigue: al conjunto de reales no negativos que satisface los siguientes tres postulados:
S¡ = la¡¡ 1 +!a,2! +···+!a,.¡.
llxll > O si x .<: O, x E V (1)
Demuestre que al. aplicar el algoritmo que resulta de ello a una matriz diagonalmente domi
nante, el orden entre los pivotes será el orden natural (1, 2, ..., n). Escriba y pruebe algunos IIAXII = IAI llxll si A E IR, x E V (2)
programas en los que se desarrollen las ideas expuestas en el problema 26, especialmente la si x, y E V (desigualdad del triángulo).
eliminación gaussiana sin pivoteo para sistemas simétricos. llx + YII � llxll + IIYII (3)
166 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.4 Normas y análisis de errores 167
Podemos considerar llxll como la longitud o magnitud del vector x. Una norma sobre Xz
Xi Xi
un espacio vectorial generaliza la noción de valor absoluto, lrl, de un número real o
complejo. La norma sobre 1n más conocida es la norma Euclídea, la cual se define
(O,!)
mediante
�xr
n 1/2
X= (4,4,-4, 4)7 V= (Q,5,5,5)7 w = (6,0,0,0)7. TEOREMA! Si 11 · 11 es cualquier norma sobre In, entonces la ecuación (6) define una norma sobre
el espacio lineal de todas las matrices n x n.
Respuesta Los resultados se muestran en la siguiente tabla.
Demostración Verificaremos que se satisfacen los tres axiomas correspondientes a una norma. Pri
11 · lli ll · 112 11 · lloo mero, si A * O, entonces A tiene al menos una columna distinta de cero. Digamos
X 16. 8. 4. que A(J) * O. Considere el vector en el que 1 es la j-ésima componente, es decir,
V 15. 8.66 5. x = (0,... ,O,l. O,. .. ,Di. Es obvio que x * O y que el vector v = x/ llxll tiene norma
w 6. 6. 6. 11 l. Por consiguiente, por la definición de IIAII ,
Para entender mejor estas normas es ilustrativo considerar 12. En la Figura 4.1
IIAxll _ IW''I\ O.
mostramos imágenes, para las tres normas dadas anteriormente, que corresponden al
conjunto
IIAII � IIAvll =
llxll - > "Txf
{ x: x E lR.2, llxll � l } . Acto seguido, debido a la propiedad (2) de la norma vectorial, tenemos:
Este conjunto se llama esfera unitaria o bola unitaria en un espacio vectorial bidimen
sional. IIAAII = sup{I\Uull: = 1} = IAI sup{IIAull : llull = 1} = IAI IIAII-
Normas matriciales Para verificar la desigualdad del triángulo usamos la propiedad análoga de la norma
vectorial y el problema 4. Con esto en mente escribimos:
Pasemos ahora a ocuparnos del problema de la definición de normas para matrices.
Si bien podríamos tratar con normas de matrices en general, sujetas sólo a los mismos
IIA+BII = sup{ ll(A+B )uil: llull = 1}
requerimientos ( 1) a (3), usualmente preferimos que la norma matricial esté Últimamente
ligada a una norma vectorial. Si se ha especificado una norma vectorial 11 · 11, su norma � sup{ IIAull+ IIBul\: llull = 1 }
matricial subordinada se define como � sup{IIAull : llull = 1} + sup{IIBull : llull = 1}
IIAII = sup{IIAull : u E Rn, llulJ = 1}. (6) = IIAil+IIBII 1111
168 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.4 Normas y análisis de errores 169
podemos escribir:
l lx-xll ::;
IJAl loo = sup IIAul Joo = sup {�á.t
j(Au);J} = � { sup l(A u);f} l lx
- IJJ - BAll (11)
ll•lloo=l ll•lloo=l 1='=n 1='=n ffulloo=l
La desigualdad (11)da una cota superior para llx-x ll / ll xll, y este cociente se considera
ll
Esto nos da una medida de la perturbación sobre x. Para obtener una estimación de la
TEOREMA 2 Si la nonna vectorial 11 · [J 00 se define mediante perturbación relativa escribimos:
� \W II IIAll l \xl\! � t .
entonces su nonna matricial subordinada está dada por 1 lb ll
ll l
Por consiguiente ,
máx
IIAlloo = l�i�n ¿ [aijl· \\x-i x \ 1 ¡¡ llb -b l l
j=l < \IAII I\A- (12)
x \ = ll ll ·
b
11
ll l
Además de las propiedades básicas (1)a (3), una norma matricial subordinada a
una norma vectorial tiene otras propiedades. Por ejemplo: La desigualdad (12)nos dice que el error relativo en xno es mayor que K(A)veces
el error relativo en b, donde
" "= 1 (9) =
K(A) \IA\IIW 1 11. (13)
El número K(A)se llama número de condición de la matriz A. Su valor depende de la
IIABII� IIAII II BIJ. (10) norma vectorial seleccionada al iniciar el análisis. En la desigualdad (12)se observa que
si el número de condición es pequeño, entonces pequeñas perturbaciones en b conducen
La demostración de (9)se obtiene de manera inmediata de la definición (6), y la ecuación a pequeñas perturbaciones en x. La desigualdad K(A)� 1siempre se cumple.(Véase
(10)se deduce de las ecuaciones (6)y (7.) el Prob. 13. )
170 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.4 Normas y análisis de errores 171
Para ejemplificar el uso del número de condición tomemos e > O y lo cual se deduce de inmediato de
1- e 1 -1 + e 1
111111
Una matriz con un número de condición grande se dice que está mal condicionada.
Si se emplea la norma oo tenemos que, usando la ecuación (8), JIAJJ 00 = 2 + �-'l_ Para una matriz A mal condicionada habrá casos en los que la solución de un sistema
J¡A- 1 JJ 00 = e-2(2+e). PortantoK(A) = [(2+e)/e]2 > 4/e2 . Si e � 0.01, K(A) � 40,000. Ax = b será muy sensible frente a pequeños cambios en el vector b. Dicho de otro
En tal caso una pequeña perturbación relativa de b puede inducir una perturbación relativa modo, para lograr una cierta precisión en la determinación de x, requerimos una precisión
40,000 veces mayor en la solución del sistema Ax = b. significativamente mayor de b. Si el número de condición de A es de tamaño moderado,
Si resolvemos numéricamente un sistema de ecuaciones se dice que la matriz está bien condicionada.
Ax=b
formar una idea de lo buena que es la aproximación x calculando Ax y viendo si su valor l. Demuestre que las normas llxlloo, llxllz, llxllt satisfacen los postulados (1), (2) y (3) para
normas.
es cercano a b. Con ello se obtiene el vector residual
2. Demuestre que llxlloo ;;; llxll2 ;;; llxllt para todo x E IR", y que las igualdades pueden darse
aun para vectores distintos de cero.
r = b-Ax.
3. Demuestre que JJxJh ;;; nlJxlJoo Y que IJxJJ2;;; /ñllxlloo para x E IR".
La diferencia entre la solución exacta x y la solución aproximada x recibe el nombre de 4. Demuestre que para dos funciones cualesquiera cuya imagen está en R
vector de error,
e=x-x. sup[f(x) +g(x)] ;;; supf(x) +sup g(x)
La relación 5. Para la norma matricial en el teorema 2, demuestre o refute: IIABlloo = IIAlloollBlloo- ¿Qué
Ae=r. (14) sucede en el caso especial IIA2 lloo = IIAII;.,?
entre el vector de error y el vector residual tiene una importancia fundamental. 6. Demuestre que una norma definida sobre IR" debe de alguna manera tomar en cuenta todas
Dése cuenta de que x es la solución exacta del sistema lineal Ax = b, el cual tiene el las componentes de un vector. Demuestre que la norma llxlloo es la más sencilla en IR". (Para.
ello tiene que definir un concepto adecuado de simplicidad.)
segundo miembro perturbado,b = b- r. A continuación establecemos relaciones entre
los errores relativos de x y de b. En otras palabras, deseamos relacionar.JJx- xJl/ll xll 7. Determine si las siguientes expresiones definen normas en IR":
con JJb-bJJ/JJbJJ = Jlrll/llbll- El siguiente teorema muestra que el número de condición (a) máx{Jx2J, lxil, ..., Jx.l}
K(A) juega un papel importante. n
(b)¿lxd3
l
_ J!.1 < J!:Jl < K(A)J!.1
K(A) JJbll = JJxlJ =
t
i=l
JJbJJ
TEOREMA3
(c) { lx.1 11 r
2
8. Defina IIAII = I:;=t I:7=t laijl· Demuestre que ésta es una norma matricial (esto es,
una norma sobre el espacio lineal de todas las matrices den x n). Demuestre que no es una
llbll = IW rll llAxll � IW II IJrll llAll ll xll norma subordinada a norma vectorial alguna. ¿Satisface los criterios que se establecen en
1 1
(b) Demuestre mediante un ejemplo que el supremo y el ínfimo en general no pueden inter 21. Sean= 3 y tomemos
cambiarse. 4 -3 2
(c) Demuestre que 4. = [-1 O 5] .
2 6 -2
sup ínff(a,b) � ínf sup/(a,b)
aEA bEB bEB aEA Entre todos los vectoresx que satisfacen l lxll oo � 1, encuentre uno para el cual IIAxl loo , sea
tan grande como sea posible. Proporcione además el valor numérico de IJ A lloo -
10. Demuestre que para cualquier norma vectorial y su norma matricial subordinada, y para
cualquier matriz A den x n, existe un vector x;o O tal que IJAx lJ = IIAll llx ll - 22. La norma e00 ponderada es una norma sobre IR." de la forma
IxJ l l = máx w;lxd,
11. Demuestre que para la norma vectorial definida en la ecuación(5) la norma matricial l�i�n
subordinada es
donde w1, w2 , ..., w. son números positivos que se han fijado y reciben el nombre de pesos.
Demuestre que esta norma satisface, en efecto, los postulados de una norma. ¿Cuál es la
IIAllt = máx "'""'"laijl norma matricial subordinada?
l�!>n�
23. Demuestre que si 11 · 11 es una norma sobre un espacio vectorial, y que si definimos llx ll' =
- i=l
12. ¿Satisfacen las normas matriciales subordinadas la igualdad IIABII = l!BAII? Justifique su al xJ ll , donde a en un número positivo fijo, entonces 11 · II' también es una norma.
respuesta. 24. Si se usa la misma construcción del problema anterior en el caso de una norma matricial
subordinada, ¿es la norma resultante también una norma matricial subordinada?
13. Demuestre que el número de condición de una matriz invertible debe al menos valer l.
25. Sea 11 · II una norma sobre un espacio vectorial V. Parax y y en V se defined(x, y)= llx-yll
14. ¿Qué clase de matrices tienen número de condición igual a 1? Demuestre que d tiene las siguientes propiedades:
(a) d(x,x) = O
15. Usando la norma matricial IIA ll t (Prob. 11), calcule el número de condición de la matriz (b)d(x, y)=d(y,x)
1 1 +e] (c)d(x,y)>O six;oy
[ 1-e 1 ·
(d)d(x,y) �d(x, z ) +d(z,y)
16. Usando la norma matricial IIAll oo , ecuación(8), calcule el número de condición de la matriz (U na función que posee estas cuatro propiedades se denomina métrica.)
c26. Genere subrutinas para calcular la norma de un vector y de una matriz cuadrada. Use la
G 1�]- norma máxima, llxll oo , y su norma matricial subordinada.
17. Sea A una matriz den xn con matriz inversa C=(cij). Demuestre que al resolver el sistema 27. Dé llil ejemplo de una matriz bien condicionada cuyo determinante tenga un valor muy
Ax= b, una perturbación de magnitud de o en b¡ provoca una perturbación de c;¡/5 en x;. pequeño.
28. Calcule el número de condición de una matriz triangular inferior de n x n que tiene unos
18. (Continuación) Demuestre que una perturbación de magnitud o en a¡k producirá una per positivos en la diagonal y unos negativos debajo de la diagonal. Use la norma matricial
turbación de aproximadamente-CijXkÓ enx;.
1 1 · lloo •
19. (Continuación) En algunas ocasiones la siguiente cantidad se usa como número de condi 29. Demuestre que si A tiene un punto fijo no trivial(es decir, Ax= x;o O), entonces IIAIJ � 1,
ción de una matriz A de n x n: para cualquier norma matricial subordinada.
30. Dé un ejemplo de una norma sobre IR2 tal que la norma de(1, 0) sea 2 y la norma de(1, 1)
M(A)= n máx laijl máx l c ijl , sea l .
31. ¿Existe una norma sobre IR tal que 11(1. 0)11 = 11(0, 1) 11 = ll(l, N?
2
l�ij�n l;';ilj�n
donde C es la inversa de A. Demuestre que si Ax = b y si se perturba sólo una de las 32. (Véanse los Prob. 2 y 3.) Encuentre las condiciones precisas sobrex para que se satisfaga
componentes de b (digamos que en llila cantidad e), entonces !ax perturbada(denotada por (a) llxl loo = Jlx ll1 (b) J xl l loo = IxJ ll2 (c) IxJ J l t = J xJ l J 2
i) satisface:
33. Demuestre que IIAII es el número M más pequeño que satisface IIAxll � M llx lJ para todax .
llx - xlloo < M(A)L
IxJ lloo = IJb lloo · 34. Para cualquier matriz A den x n se define IIAII, = (¿;= 1 ¿;=1at)1l2• (Ésta se llama
norma de Frobenius.) ¿Es una norma matricial subordinada? Responda la misma pregunta
20. En el texto se demuestra que si Ax = b y Ax = b , entonces para IJ AII = máx1�,¡�. laij J . Demuestre que estas ecuaciones definen normas sobre el espacio
vectorial de todas las matrices de n x n.
- 35. ¿Es necesariamente cierto, para cualquier norma matricial subordinada, que la norma de una
llx -xl l � K(A)llb-bl l . matriz de permutación sea uno? Explique su respuesta.
IxJ ll - lbll
·· 1-
36. Dado un vector x = (xi,x2, ...,x.l E IR.", definimos lxl , el valor absoluto del vector x,
Demuestre que para toda matriz no singular A esta desigualdad se vuelve igualdad para
como el vector(xJ 11, lx2 I, ...' 1x.1r
Para los vectores X, y definimos también X � y para
reindicar que x; � y, para i = 1, 2, ... , n. Demuestre que las normas 11 · l l1, 11 · 1 12 y 11 · l loo,
algunos vectores by b. (Es obvio que buscamos b ;o O y b ;o b.) poseen la propiedad de que si lxl � IYI, entonces l lx ll � IIYII-
174 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.5 Series de Neumann y refinamiento iterativo 175
37. Para cualquier número real p � 1,la fórmula 47. Sea 11· II una norma sobre l.",y A una matriz den x n. Haga llxlJ' = IJA xlJ. ¿Cuáles son las
\lx!Jp=
(n ) 1 /p
condiciones que se deben imponer sobre A para asegurar que también 11 · 11' es una norma?
48. Demuestre que si utiliza la norma Euclídea, el conjunto
�lxl
H = {x E lR" : llx - ali = IJx - bll}
define una norma. (La demostración se encuentra en el texto de Bartle [1976, pág. 61].) representa un hiperplano (es decir,una traslación de un subespacio lineal de dimensión n -1),
Demuestre que para cada x E JR" pero lo mismo no resulta generalmente cierto si se usan otras normas. Ilustre esta situación
en el caso n = 2.
lím llx!Jp = !Jxlloo ·
p-oo
49. Demuestre que el número de condición tiene la propiedad
Esto ilustra el por qué de la notación JI·
K(AA) = K(A) (A.;0).
38. Demuestre las siguientes propiedades de normas:
(a) JJOII = 0 50. Demuestre que si una matriz cuadrada A satisface la desigualdad IJAxlJ � 8llxll para toda x,
t
(b) IJx+yJJ � IIJxll - llY III con 8 > O, entonces A resulta no singular,y JJA-1 11 �a-1• Este resultado es válido para
cualquier norma vectorial y su norma matricial subordinada.
(c) lltil ll � !Ji�IJ para vectoresi1>,P ,.. . ,x<ml 51. Demuestre que si A es diagonalmente dominante,entonces tendrá la propiedad mencionada
en el problema 50. Proporcione un valor de 8 para cuando se utiliza la norma 11 · !loo·
39. Sea IJ · 11 una norma sobre lR". Defina 52. Demuestre que si A es no singular existe entonces una o > O con la propiedad de que A +E
es no singular para todas las matrices E que satisfacen IIEJJ < o. Esto se puede demostrar
IJx\l' = sup{u x : u E lR ", !Ju\l = 1}. para cualquier norma sobre el espacio vectorial de todas las matrices de n x n.
r
Demuestre que esta ecuación define una norma. Demuestre que al repetir el proceso se 53. Demuestre que en el problema 52 podemos utilizar
obtiene la norma original; es decir, (11 · JJ')' = 11 · !J. Demuestre que para toda x,y E lR",
o = ínf{IIAxlJ : JlxlJ = 1}.
lhl�\lxlJ IIY II'
Es este caso se usan la norma vectorial y la norma matricial subordinada.
40. Demuestre la siguiente desigualdad para los números de condición definidos en la ecuación
(13): 54. Sea A una matriz de n x n y N su espacio nulo (kernel). Defina
!C(AB)�!C(A)K(B).
o = ínf{IJA x\l : llxll = 1 y x.LN}.
41. Calcule los números de condición usando las normas IIAJJ¡, JJA ll2,y IJA IJoo :
(a)[a+la a - l ª] 1
(b)[-2O O!] (c)[1ª 1] Demuestre que si IJEIJ < o,entonces rango (A+ E) � rango (A).
55. Demuestre lo siguiente: si A es no singular, entonces existe una matriz singular en una
42. Use los problemas 2 y 3 para demostrar que
vecindad de radio IIA -1 ¡¡-1 centrada en A. En este caso la norma puede ser cualquier norma
1 2 matricial subordinada.
n- IIA ll2�n- 1 IJA IJoo � IJA ll2�n 1 IIA IJi �n!IA ll2-
1 2 1
,{!]
3 -k-1
¿Ak -+ (l-A)-1 (cuando m -+ oc).
-2+k-4] k=O
yCk) = [
+ l)k-1 y Basta con demostrar que
l
(k
k
e- m
f
teorema no es válido para espacios lineales normados de dimensión infinita. (Como estimación:
ejemplo de lo anterior vea el problema 20.) IIU-A)-1 11 � f)A kll � IIAll k =
Otro resultado importante acerca de espacios lineales normados de dimensión finita k=O k=O l -\AIJ'
es el que nos refiere que en dichos espacios toda sucesión de Cauchy converge. Por ello, si
una sucesión [y(kl] en un espacio lineal normado de dimensión finita satisface el criterio Ejemplo 1 Use la serie deNeumann para calcular el inverso de la matriz
de Cauchy [0.9 -0.2 -0.3
lím sup llv(il -v(i)II = O, B = O.I 1.0 -0. l ] .
k-oo i,j?;k
0.3 0.2 1.1
entonces necesariamente existe un punto v E V, al cual converge la sucesión. Respuesta Sea B = l - A, donde
Estas ideas se pondrán en uso en el caso de vectores en 1.n y matrices de n x n. En 0.1
0.2 0.3
el siguiente teorema tomamos a 11 · 11 como una norma cualquiera sobre l." y usamos su A= [ -0.I O.O 0.1] .
norma matricial subordinada 11 · 11 conforme se definió en la sección 4.4. -0.3 -0.2 -0.1
Ya que IIA[\ = 0.6, la serie deNeuman ¿�Ak converge as-1• Usando el algoritmo
00
º]
Series de Neumann que aparece en el problema 23, calculamos algunas de las sumas parciales:
TEOREMA 1 Si A es una matriz de n x n, tal que IIAII < 1, entonces l -A es invertible y o 1 O 1 [ 1.1 0.2 0.3
¿Ak = [ O 1 O I>k = -0.1 1.0 0.1 ]
00 k=O O O l k=O -0.3 -0.2 0.9
(l -A)-1 = ¿Ak. (1) 2 [ 1.00 0.16 0.32
k=O
¿Ak = -0.14 0.96 0.06]
k=O -0.28 :....Q.24 0.80
Demostración Primero demostraremos que l-A es invertible. Si no es invertible, entonces es singular,
y por lo tanto existe un vector x que satisface llxll = 1 y ([ - A)x = O. De este hecho se
concluye que
1 = \lx[\ = IIAx\l � [\A[[ \lxll = I IA[[ 19 [ 1.00000000 0.14285714 0.28571429
¿Ak = -0.12500000 0.96428571 0.05357143 ]
lo cual contradice la hipótesis de que [\A \1 < l. k=O -0.25000000 -0.21428571 0.82142857
4.5 Series de Neumann y refinamiento iterativo 179
178 Capítulo 4 Resolución de sistemas de ecuaciones lineales
El proceso se puede repetir con el fin de obtener mejores soluciones x <2l, x<3l, . . . . El
La última suma parcial que se muestra proporciona s- 1 con 8 dígitos decimales de
éxito del método depende de calcular los residuos r(0 con doble precisión, con el fin de
precisión. 11
evitar la pérdida de dígitos significativos que resulta de la resta. Por consiguiente, la
A continuación se presenta una variante del Teorema 1: expresión b¡ - 4=! aifxJ°l se evalúa en doble precisión. (Recuerde que idealmente r(0
debería ser el vector cero, y que la sustracción inherente al cálculo de r<•) debe involucrar
TEOREMA 2 Si A y B son matrices de n x n tales que 111-ABII < 1, A y B son invenibles. Además, cantidades casi idénticas.)
00
Ejemplo 2 Utilice el refinamiento iterativo para resolver el sistema
00
1 1
A- 1 =BB- 1 A- =B(AB)- =B¿([ -ABi se obtiene recurriendo a la sustitución hacia atrás. Varios pasos de mejoramiento iterativo
k=O proporcionan los siguientes resultados:
00
Así, la solución exacta de la ecuación Ax=b es (i) Precondicionamiento mediante equilibración de filas.
00
(ii) Precondicionamiento mediante equilibración de columnas.
x=B¿(I-ABlb. (8) (iii) Pivoteo total.
k=O (iv) Precondicionamiento o escalamiento en cada uno de los pasos principales del
proceso de eliminación.
TEOREMA 3 Si III - ABI\ < 1, entonces el método de mejoramiento iterativo dado por la ecuación (v) Mejoramiento iterativo al final.
(6) da lugar a la sucesión de vectores
La equilibración de filas es un proceso que consiste en dividir cada fila de la
m matriz de coeficientes por el máximo elemento en valor absoluto de dicha fila; es decir,
x(
m)
=B¿(!-AB/b (m � O). multiplicar la fila i por r; = 1/ máx 12?.• la;,¡\ para 1 � i � n. Después de haber hecho
k=O esto, los nuevos elementos, lig, satisfarán máx 1 ?.i?. n jag = 1 para 1 � i � n. En la
1
= (I-BA)(x'ml-x) Al igual que en el caso anterior, es preferible tomar c¡ como un número, de la forma 2m
tan cercano como sea posible a 1/ máx 1?.i?.n la¡¡!. Nuestras ecuaciones uriginales
Por consiguiente, n
l\x(m+l)-x\\ � \\!-BA\\ \\x( )-x\\ ¿aijXj = b;
m
(l � i � n)
� \\I-BAl\2\\x -1)-xi\
(m j=l
(2) = b;
�
� \\!-BA\¡m llx(Ol _xi\ t(c¡ag) (1 � i � n)
C¡
¡=I
Ya que hemos supuesto que III - BAII < l, los errores ¡¡x<m>-xll convergen a cero
conforme m -+ oo para cualquier iºl. Después de la fase de cálculo de soluciones habremos obtenido soluciones aproximadas
para las componentes x¡/c¡. Estas soluciones deberán multiplicarse por c¡ para obtener
x¡. Por consiguiente también se tendrán que almacenar los valores c1, c2, •.. , c•. La
Equilibración equilibración de columnas se escribe, usando matrices, como:
Para resolver sistemas de ecuaciones lineales en casos extremadamente críticos, se
puede añadir un cierto número de refinamientos a los procedimientos de factorización y (AC)(C- 1 x) = b,
de cálculo de soluciones descritos en la Sección 4.3. Discutiremos brevemente cinco de
estas técnicas: donde C = diag(c¡).
182 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.5 Series de Neumann y refinamiento iterativo 183
Si ya se llevaron a cabo los procesos de equilibración de columnas y filas de nuestro 3. Demuestre que si [JA11< l, entonces
sistema, la estrategia de pivoteo total en el paso inicial se puede reducir sin problema a
una mera búsqueda del elemento de mayor valor numérico en la matriz. Este elemento 1
determina, tanto la primera fila de pivoteo, como la primera columna en la que se ge li(J-A)- 11 � 1 + \ AJI
1
nerarán los ceros por el proceso de eliminación. Esto significa que buscamos trabajar 1
con las columnas no en el orden natural 1, 2, 3, ... , n, sino en el orden determinado por 4. Demuestre que si A es invertible y IIA-BJJ< JIA- [J-1, entonces
esta estrategia de pivoteo que aporta una mayor precisión a los cálculos. Se necesitan
IIA-l -B- 1 11 < IIA-111 III -A- BII
1
dos arreglos de permutación, uno para alistar los números de fila de los elementos pivote
= l -llI-A- 1 BJJ'
sucesivos, y otro para alistar los números de columna correspondientes. (Véanse los
Probs. 4 y 6 de la Sec. 4.3.) 5. Demuestre que si IJAB-III< 1, entonces (con E en lugar de AB-I)
La cuarta técnica en nuestra lista de refinamientos es la de precondicionamiento
o escalamiento. Dicha técnica contribuye a una organización más lógica de la fase de r1 = B-BE+ BE2-BE3 +.. ·.
factorización, en vista de que cada paso del algoritmo será igual al anterior, excepto por
el hecho de que se aplica a matrices más pequeñas. 6. Demuestre que si A es invertible, entonces para cualquier B
La quinta técnica de nuestra lista es el mejoramiento iterativo, la cual se estudió
previamente. _ rip 111-ABJI
IIB = IIA II
La utilidad de la equilibración de columnas y filas, como un proceso de pre
condicionamiento, ha sido motivo de controversias. Se puede. observar que la 7. Demuestre o refute el siguiente enunciado: si 1 = IIAIJ > JIBJI, entonces A-Bes invertible.
equilibración de filas, seguida de la eliminación gaussiana con pivoteo de filas sin 8. Demuestre que si JIA11< l, entonces
escalamiento, es virtualmente equivalente a efectuar una eliminación gaussiana con
pivoteo de filas escaladas. Por consiguiente, una estrategia razonable consiste en iniciar (/+A)-1 =l-A+A2 -A3 +...
con equilibración de columnas, seguida de una eliminación gaussiana con pivoteo de
filas escaladas. 9. Demuestre o refute el siguiente enunciado: si JJAB-I JJ< 1, entonces JJBA-IJJ< l.
El siguiente ejemplo muestra la diferencia entre equilibración fila-columna 10. Demuestre que si JIAJJ< l , entonces JIU +Ai- 1 JJ � (1-IJAll)- 1 .
1 108 10-8 1 --+ [ 10
-8 1 11. Demuestre que si A es invertible y IIB-Ali< JJr1 11-1 , entonces
[
2 o] ____, [
1 oJ 1 J
o· 00
y equilibración columna-fila
s- 1 =r 1 ¿u-Br 1 ) k
[! 1]- [!
k=O
[l 108 1
]- 12. Demuestre que para cualquier matriz A de n x n
2 0 10 10]·
m-1
Dése cuenta de que la equilibración fila-columna equivale a un escalamiento en dos fases m
A =l-(l-A) ¿A ,
k
del sistema por medio de matrices diagonales, digamos R y B, tales que k=O
((RA)B)(B- x) = (Rb),
1
13. Critique la siguiente "demostración", de que toda matriz den x n es invertible: dada una
matriz A elija una norma vectorial, de manera que 111-A 11< 1 cuando se usa la norma
en tanto que la equilibración columna-fila corresponde a matricial asociada. Utilice luego el teorema acerca de la serie de Neumann.
14. Demuestre que si ínf,ea 111-MIi< 1, entonces A es invertible.
(S(AC))(C- 1 x) = (Sb)
15. Demuestre que las matrices de n x n invertibles forman un conjunto denso en el conjunto
para algunas matrices diagonales C y S. de todas las matrices de n x n. Esto significa que si A es una matriz de n x n y si e > O,
entonces existe una matriz invertible B, tal que [JA-BJJ< &. (Véase el Prob. l.)
16. Demuestre que si JJAB-/[J = &< 1, entonces
SERIE DE PROBLEMAS 4.5
l. Demuestre que el conjunto de matrices de n x n invertibles es un conjunto abierto en el
conjunto de todas las matrices de n x n. Por ello, si A es invertible, existe entonces un
1
(-º )
IIA- -BJI< IIBII 1-e
número positivo e tal que toda matriz B que satisface JIA-BJI< e también es invertible.
17. Demuestre que la operaciónx ,-, Ax es continua. Es decir, para una A fija, demuestre que si
2. Demuestre que si A es invertible y JI B-Ali< [JA- 1 JJ- 1 , entonces Bes también invertible. una sucesión [x(kl ] converge ax, entonces [Ax(kl] converge a Ax.
184 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 185
18. Demuestre que si E es una matriz de n x n para la cual IIE II es suficientemente pequeña, 28. Considere el sistema lineal = ,
entonces [ 1 � 6 �] [;� ] [ 3 � 6] para una pequeña o > O.
11([- E)-l - (l + E)il � 3 IIEll ,
2
(a) Usando la solución aproximadax = (3, O{, compare la norma infinito del vector residual
¿Qué tan pequeña debe ser IJ E II? y la norma infinito del vector de error. ¿Qué se concluye de esto?
(b) Determine el número de condición ic00(A). ¿Qué sucede conforme o se hace pequeña?
19. Muestre que si A es invertible, entonces
(c) Lleve a cabo un paso de mejoramiento iterativo basándose en la solución aproximada x.
IIAxll ;:;; llxll lW 1 !1- 1 29. Demuestre que si III-ABII < 1, entonces BA es invertible. (En este caso A y B son matrices
cuadradas. ¿Qué sucede si no lo son?)
20. Considere el espacio vectorial V de todas las funciones continuas definidas sobre el intervalo
[O, 1]. Dos normas importantes sobre V son las siguientes: 30. Demuestre que si III-cA•¡¡< 1 para alguna e y algún entero n;;;; !, entonces A es invertible.
[
31. Demuestre que si existe un polinomio p sin término constante, y que satisface
llxlloo = máx lx(t)I llxllt = lx(t)I dt
O�t�I III-p(A)II< !,
Demuestre que la sucesión de funcionesx.(t) = f tiene las propiedades siguientes: IJx. IJoo = entonces A es invertible.
1 y llxnlit -> O conforme n --> oo. Por lo tanto, dichas fórmulas conducen a nociones de
convergencia diferentes. 32. Demuestre que si p es un polinomio con término constante co y si !col + III-p(A)II < 1,
entonces A es invertible.
21. Demuestre que si IIAB -III < 1, entonces 2B - BAB es una mejor aproximación para la
matriz inversa de A que B, en el sentido de que A(2B - BAB) está más cerca de l. <33_ Resuelva el siguiente sistema lineal y utilice tres pasos de mejoramiento iterativo. Imprima
<22. El propósito de este proyecto es diseñar y verificar procedimientos que son refinamientos de r, e, y x después de la iteración
los algoritmos dados en el texto. Los refinamientos que se incorporarán son los siguientes:
(i) Equilibración de columnas. 60 30 20 X¡ [11º]
[30 20 15] [X2] = 65 .
(ü) Equilibración de filas. 20 15 12 X¡ 47
(iü) Pivoteo total.
(iv) Añadir al final dos pasos de refinamiento iterativo. Como alternativa, diseñe por separado
un subprograma �ue acepte A, x , by mejore doblemente (o m veces) a x . En este caso cada
residuo b; - ¿j=l alfXj deberá calcularse con doble precisión y luego redondearse con
precisión sencilla. Tenga en cuenta que la matriz original A y el vector b deben almacenarse *4.6 Solución de ecuaciones mediante métodos iterativos
con el fin de calcular los residuos. Verifique sus códigos mediante la solución del problema
Ax = b, donde n = 10 y
El método de Gauss y sus variantes son conocidos como métodos directos para resolver
(! � i, j � n) el problema matricial Ax = b. Se ejecutan a través de un número finito de pasos y
ªlf = (i/ l l'Í
{ generan una solución x que sería exacta si no fuera por los errores de redondeo.
b; = i[l -(i/11) ]/(33-3i ) (1 � í � n),
1º
En contraste, un método indirecto da lugar a una sucesión de vectores que ideal
Como segunda prueba de sus códigos h!ga n = 4, ªlf = l/(2n-i-j+ 1), y b; = I:;=1 a;¡. mente converge a la solución. El cálculo se detiene cuando se cuenta con una solución
La solución deberá ser x = (1, 1, 1, ll. Para la tercera prueba repita lo anterior con n = 10. aproximada con cierto grado de precisión especificado de antemano o después de cierto
Incluya suficientes enunciados de impresión, para que se aprecien los detalles, en particular número de iteraciones. Los métodos indirectos son casi siempre iterativos por natura
la solución inicial y las soluciones que se obtuvieron usando el mejoramiento iterativo. leza: para obtener la sucesión mencionada se utiliza repetidamente un proceso sencillo.
Para sistemas lineales grandes, con miles de ecuaciones, los métodos iterativos
23. Sea B k = z;=OAÍ. Demuestre que la sucesión [Bk] puede calcularse recursivamente me
con frecuencia muestran ventajas decisivas respecto de los métodos directos, en cuanto
diante las fórmulas Bo = I y Bk+I = I + ABk.
a velocidad y requerimientos de la memoria de la computadora. En ocasiones, si los
<24_ Usando una matriz de prueba A de dimensión 3 x 3 y el método del problema anterior, calcule requerimientos sobre la precisión no son muy fuertes, bastará con un número modesto
B= ZJ! 0 Ai y vea si (I-A)B !>:! l. Asegúrese de que IIA 11< 1 para alguna norma matricial de iteraciones para obtener una solución aceptable. Para sistemas ralos (en los cuales
subordinada. una proporción grande de los elementos de A son ceros) los métodos iterativos son con
25. Dé una serie que represente a A-1 bajo la suposición de que l!I-a.Al!< 1 para algún escalar frecuencia muy eficientes. En problemas ralos, los elementos distintos de cero de A
conocido et. se almacenan algunas veces en un formato de almacenamiento ralo, mientras que en
26. Demuestre, en un espacio lineal normado, que si una sucesión de vectores converge, entonces otros casos ¡no es en absoluto necesario almacenar A! Esta última situación ocurre con
debe satisfacer el criterio de Cauchy. frecuencia en la solución numérica de ecuaciones en derivadas parciales. En este caso
27. Demuestre que si A está mal condicionada, entonces existe una matriz singular cercana a A. se puede generar cada fila de A conforme sea necesario, pero no se retiene después de
De hecho, existe una matriz singular dentro de un radio l!All /ic(A) de A. usarse. Otra ventaja de los métodos iterativos es que usualmente son estables y de hecho
186 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 187
amortiguan errores (debidos al redondeo o a errores pequeños) conforme el proceso se Las iteraciones de Jacobi y de Gauss-Seidel convergen al parecer a un mismo límite,
lleva a cabo. pero la segunda lo hace más rápido. Observe que, en contraste con un método directo,
Para dar a entender la idea general, vamos a describir dos métodos iterativos fun la precisión que se obtiene en la solución depende del momento en que se detenga el
damentales. proceso. 11
Ejemplo 1 Considere el sistema lineal
[-� -�][;�]=[-!]
Conceptos básicos
Pasamos ahora a considerar los métodos iterativos dentro de un marco matemático
más general. Un tipo general de procesos iterativos para resolver el sistema
¿ Cómo se puede resolver por medio de un procedimiento iterativo?
Respuesta Un procedimiento natural consistiría en resolver la i-ésima ecuación para la i-ésima Ax=b (1)
incógnita de la manera siguiente:
se puede describir de la siguiente manera. Se recurre a una cierta matriz Q, llamada
X(k) - 2 r\k-l) + d1 matriz de descomposición, y el problema original adopta la forma equivalente
1 - r-i
_ -ªx (k-1 ) _ 19
X2(k) - Qx = (Q - A)x + b. (2)
9 1
Este procedimiento se conoce como método o iteración de Jacobi. Inicialmente, se La ecuación (2) sugiere un proceso iterativo que se concreta al escribir
eligen como x[ºl y xfl las mejores suposiciones disponibles o simplemente se igualan
= (Q - A)x(k-1) + b
;q
a cero. En tal caso, las ecuaciones anteriores producen lo que esperamos sean valores (k � 1).
k
Qx( ) (3)
mejorados x\1) y 1l. El proceso se repite un número prescrito de veces o hasta que se
alcance lo que se considera una buena precisión en el vector (x\kl, xrf. He aquí algunos El vector inicial x<0l puede ser arbitrario; si se dispone de un buen candidato como
valores seleccionados de las iteraciones del método de Jacobi para este ejemplo: solución se debe utilizar como x(Ol . Diremos que el método iterativo de la ecuación (3)
converge si converge para cualquier vector inicial x . A partir de la ecuación (3) se
(O )
k x(1k) 4k)
puede calcular una sucesión de vectores x , x , . • . , y nuestro objetivo es escoger una
<l) (Z)
30 0.196615 -0.262154 En esta sección se mostrará que ambas condiciones se satisfacen si resulta sencillo
40 0.199131 -0.265508
resolver el sistema Qx(k) = y y si Q-1 es una aproximación de A -1•
50 0.199777 -0.266369
Para empezar observe que si la sucesión ¡x(kl ] converge, digamos a un vector x,
Es evidente que este proceso iterativo se podría m.odificar de modo que el más reciente entonces automáticamente x es una solución. En efecto, si simplemente se toma el límite
valor de x\kl se utilice en la segunda ecuación. El método que de ello resulta se llama en la ecuación (3) y se usa la continuidad de las operaciones algebraicas, el resultado es
método o iteración de Gauss-Seidel. Sus ecuaciones son:
Qx = (Q - A)x + b (4)
§,.ik-1) + d7
_ 7--¿
X(kl ) -
lo que significa que Ax = b.
rikl - � (k ) - 1 Para tener la seguridad de que el sistema (1) tiene una solución para cualquier vector
·-¿ - 9 x 1 9
b, supondremos que A es no singular. Supondremos también que Q es no singular, de
A continuación mostramos algunos resultados del método de Gauss-Seidel: tal manera que la ecuación (3) pueda resolverse para cualquier vector desconocido x(k).
Habiendo hecho estas suposiciones, podemos usar la siguiente ecuación para llevar a
k x(lk) x2(k)
cabo el análisis teórico:
o 0.000000 0.000000
10 0.219773 -0.249088 x<k) = (l - Q-lA)x(k-1) + Q-1 b. (5)
20 0.201304 -0.265308
30 0.200086 -0.266590 Se debe enfatizar que la ecuación (5) resulta conveniente para el análisis, pero en cuanto
40 0.200006 -0.266662 al trabajo numérico x(k) , casi siempre se obtiene resolviendo la ecuación (3) sin utilizar
50 0.200000 -0.266666 Q - 1.
188 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 189
Observe que la solución x satisface la ecuación El siguiente algoritmo ejecuta la iteración de Richardson:
X= (1-Q- 1 A)x+Q- 1 b. (6) input n, (aij), (b ¡), (x¡), M
for k = I, 2, ..., M do
As� x es un punto fijo de la transformación for i = 1, 2, . . ., n do
n
para cualquier x<OJ. Observe que de la hipótesis 111 -Q- 1A 11 < 1 se deduce (por el X(
O)
= (0.000000, 0.000000, 0.000000/
Teorema 1 de la Sec. 4.5) la inversibilidad de Q- 1A y la de A. Por lo tanto tenemos el X (! )
= (0.611 l l l, 0. 61 l l l l, 0.611 l l lf
TEOREMA 1 Si IIJ - Q- 1AII < 1 para alguna norma matricial subordinada, entonces la sucesión
generada por la ecuación (3) converge a la solución de Ax= b para cuqlquier vector
inicial iºl. X( I )
O
= (0.279498, 0.279498, 0.279498/
=
Si la norma o 111-Q-1 AII es menor que 1, resulta seguro detener el proceso
iterativo cuando ¡¡x<kl -x<k -1) 11 sea pequeño. Incluso podemos probar (Prob. 35) que x(
40l
= (0.333107, 0.333107, 0.333107) 7
�� ¿ laij/a¡¡I .
Teorema l la iteración de Richardson dará lugar a una solución de Ax= b (en el limite) n
si 111-AII < 1 para alguna norma matricial subordinada. (Dos clases de matrices con la 111- Q- 1 A lloo = (13)
¡='= " j=I
propiedad requerida aparecen en los problemas 2 y 3). ¡.i
190 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 191
TEOREMA 2 Si A es diagonalmente dominante, entonces la sucesión que resulta de la iteración de Otra manera de interpretar lo anterior es que el sistema original Ax = b se ha reemplazado
Jacobi converge a la solución de Ax = b para cualquier vector inicial. por D-1Ax = D-1 b, donde D = diag(a¡¡). De manera alternativa, se pueden evitar las
divisiones mediante un proceso previo que utiliza otro tipo de escalamiento para el
Demostración La dominancia diagonal significa que sistema. Un ejemplo sería el escalamiento a ambos lados (D-112AD-r/2)(D1/2x) =
(D-112b ), donde D 1 12 = diag(.Ja¡i), a condición de que los elementos diagonales de A
n
sean positivos. Dése cuenta de que si A es simétrica, entonces este escalamiento preserva
la¡¡!> ¿laiji (1 � i � n).
la simetría. Para muchos de los métodos iterativos, este sencillo trabajo previo puede
j=l aportar grandes beneficios en cuanto a eficiencia o velocidad de convergencia.
fa'i
u¡ +- (b¡ - f, aijxj) /a¡¡ y c = Q-1b. Deseamos encontrar una condición necesaria y suficiente sobre G, de
manera que la iteración definida por la ecuación (14) converja para cualquier vector
j=I inicial. Pero antes de ello se deben tratar algunos asuntos preliminares.
j1;i
end
Los valores propios de una matriz A son los números complejos A para los cuales la
matriz A-Uno es invertible. Estos números son las raíces de la ecuación característica
for i = 1, 2, ... , n do
de A:
X¡+- U¡
det(A - U) = O.
end
output k, (x¡) (Si lo desea, el lector puede adelantarse y leer la sección 5 .1, donde se analizan más a
end. fondo estos conceptos.) El radio espectral de A se define mediante la ecuación
Éste y otros algoritmos en esta sección se pueden hacer más eficientes si se llevan a p(A) = máx{1l .I: det(A - Al)= O}
cabo todas las divisiones antes de iniciar la iteración. De esta manera podríamos iniciar
el cálculo con estas operaciones: Por consiguiente p(A) es el número más pequeño, tal que el círculo con este radio,
centrado en el cero del plano complejo , contendrá todos los valores propios de A.
for i = 1, 2, ...,ndo Se dice que una matriz A es semejante a una matriz B si existe una matriz no
d = 1/a¡¡ singular S tal que s-1AS = B. Resulta entonces que las matrices semejantes tienen los
b¡ +- db¡ mismos valores propios. Más aún, resulta fácil ver que los valores propios de una matriz
for j = 1,2, ... ,n do triangular son los elementos sobre su diagonal.
aij =daij
end TEOREMA 3 Toda matriz cuadrada es semejante a una matriz triangular superior (posiblemente
end. compleja) cuyos elementos fuera de la diagonal son arbitrariamente pequeños.
Entonces la sentencia de reasignación para U¡ se convierte en Demostración Sea A una matriz de n x n. Recurrimos a un resultado conocido, como el teorema de
Schur que se incluye en la sección 5 .1. El teorema establece que A es semejante a una
L aijXj·
n
u¡ +- b¡ - matriz triangular superior T = (tij ), que pudiera ser compleja. Hagamos ahora O < e < I,
j=l y D = diag(e, e2, . . . , e"). Mediante un cálculo elemental se concluye que el elemento
fa'i genérico de D-1rD es tijej-i_ Ya que Tes una matriz triangular superior, los elementos
192 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 193
debajo de la diagonal en D- 1TD son O, en tanto que los elementos por encima de la El teorema 4 nos dice que para cualquier matriz su radio espectral es menor que su
diagonal satisfacen valor en norma para cualquier norma matricial subordinada y, además, existe una norma
lt;/f-i � 6lt;jl, matricial subordinada con un valor arbitrariamente cercano al radio espectral.
A continuación proporcionamos una condición necesaria y suficiente sobre la matriz
en vista de que j > i y 6 < l . Disminuyendo el valor de 6, esta cota superior se puede de iteración G para la convergencia del método iterativo asociado.
hacer tan pequeña como se desee. 1111
IA-1 llxll = 11:l..xll = IIAxll � IIAll 114 x(2l =G2x (O) +Ge +e
x(3l =G3x(Ol +G2c +Ge+e,
Por consiguiente IA-1 � IIAII , de donde se deduce que p(A) � IIAII- Tomando el ínfimo
se obtiene p(A) � ínf 11 _ 11 IIAII- cuya fórmula general es
Para la desigualdad inversa usamos el teorema anterior. Dicho teorema afirma que k-1
para cualquier 6 > O existe una matriz no singular S, tal que s-1 AS = D + T, donde D x'kl = Gk x(O)+¿de. (15)
es una matriz diagonal y T es estrictamente triangular superior, con IITll oo � 6. Acto j=O
seguido tenemos: Usando la norma vectorial que indujo nuestra norma matricial tenemos:
11s- AS ll 00 = IID +Tll oo � IIDlloo +IITlloo• IIG x( lll � IIG ll llx( ll\ � IIGll llx( lll-+ O conforme k-+ oo
1 k º k º k º
En vista de que D tiene en su diagonal los valores propios de A, resulta que Recurriendo al teorema acerca de la serie de Neumann ( teorema 1 en la Sec. 4.5) obte-
nemos:
00
máx IA.d = p(A).
IIDll oo = l;;éi;;én ¿de= (1 -G)-1 c.
j=O
Por consiguiente, tenemos: Haciendo que k -+ oo en la ecuación (15) resulta:
II S- ASll oo � p(A) +s. lím ikl = (l -G)-1 c.
1
k-oo
Usando el resultado del proble� (6) sabemos que la función 11 · ll::O definida mediante Para demostrar el enunciado recíproco, suponga que p(G) � 1 y elija u y A. de
\\All:X, = II S- AS\\oo
1 manera que
Gu = A.u IA-1 � 1 u ;t O.
es una norma matricial subordinada. Por otra parte se tiene que I\All::O � p(A) + 6. Si IA-1 =1, sea e = u y x(O) = O. De la ecuación (15) se deduce que x =
( k)
I;J;¿
du =
Tomando el ínfimo sobre todas las normas matriciales subordinadas obtenemos: ±ku, la cual diverge conforme k -+ oo. Si A.> 1, sea e= O y x(O) = u. De forma similar,
y debido a la ecuación (15), x(kl = du =A.k u, la cual diverge conforme k-+ oo. 111
ínf I\AII � p(A) +6
11·11 CORQLARIO La fórmula de iteración (3), es decir Qx(k) = (Q - A)x(k-1 ) + b, dará lugar a una
sucesión que converge a la solución de Ax = b, para cualquier x(O) , con la condición de
En vista de que due tomado de manera arbitraria, resulta que í nf 11 . 11 IIAII � p(A). 11 que p(l -Q-1A) < l.
194 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 195
Demostración Según el corolario anterior basta con probar que que permiten procesamiento vectorial o en paralelo. Dése cuenta de que la mejoría en
p(l-Q-1A) < l. la eficiencia del algoritmo de Gauss-Seidel se puede obtener mediante un trabajo previo
sobre el sistema. De hecho, las observaciones hechas acerca de la iteración de Jacobi
Con esto en mente tomemos un A. que sea cualquier valor propio de/ -Q-1A . Sea x son también válidas en este caso.
un vector propio asociado. Sin perder generalidad suponemos que llxlloo= l . Tenemos
ahora que Ejemplo 3 Considere el sistema
1
(l-Q-A)x=A.X o Qx-Ax=t..Qx.
Ya que Q es la parte triangular inferior de A, incluyendo su diagonal,
2 -1 X¡ º]2
[ 1 6 -2 [X2] = [-4] .
4 -3 8 X3 5
= A. LªijXj (1 � i � n). Use la iteración de Gauss-Seidel iniciando conx (O)=(0, O, Of.
n i
- L aijXj
')...a;;X;
i-1
= -AL aijXj - L
n
aijXj (1 � i � n).
[
! -! º] XI
[X2] = [
1]
t ! -i -i .
j= I j=i+I
= [� t +
1=1+1 1= 1
output k, (x;)
end
Jkl -lx(k) + lx(k) + 1
""j =
2 - 61 33 3
end. 2 l 8 3 8
196 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 197
El proceso de cálculo genera los siguientes valores Se dice que una matriz A=(a¡j) es hermitiana si A*= A. En este caso A*= (Zlj¡)
es la traspuesta conjugada de A. Finalmente, se dice que una matriz A es definida
x(
l)
= (1.000000,-0.833333, -0.187500/ positiva si (Ax,x) > O para toda x i: O. Observe que si A es hermitiana, entonces
(Ax,y) = (x,Ay).
A continuación presentamos un teorema que establece condiciones para la conver
gencia del método SOR, en el caso de que A sea hermitiana y definida positiva
x(5) = (0.622836, -0.760042,0.0285661/
TEOREMA 7 En el método SOR, suponga que se escoge la matriz Q como aD-C, con un parámetro
real a, con una matriz D que es hermitiana y definida positiva, y con una matriz C que
ilO) = (0.620001, -0.760003, 0.0299981/ satisface C+ C* =D-A. Si A es hermitiana y definida positiva, si Q es no singular; y
si a> f, entonces la iteración SOR converge para todo vector inicial.
x(
l3)
= (0.620000,-0.760000, 0.03000000/ 11 D emostración Al igual que en la demostración anterior, tomamos G = I -Q- 1 A e intentamos demostrar
que el radio espectral de G satisface p ( G) < 1. Sea 'J.,. un valor propio de G y x un vector
propio correspondiente al mismo A. Si se define y = ([ - G)x se pueden verificar las
Método SOR siguientes igualdades:
El siguiente ejemplo de método iterativo importante es el que se conoce como sobre
y=x-Gx=X-AX=Q- 1 Ax (16)
rrelajación sucesiva, comúnmente abreviado como SOR (siglas en inglés de successive
overrelaxation). En vista de que deseamos presentar una teoría general para el método Q-A=(aD-C) - (D - C-C*) = aD - D + C*. (17)
SOR que sirva para matrices y vectores sobre el campo de los números complejos, vamos
a revisar primeramente algunos de los conceptos relevantes para este escenario. Usando (16) deducimos que
Si y es un número complejo, entonces y se puede escribir de la forma y = a+ i�,
donde a y� son números reales e i 2 = -1. El conjugado de y se define como (aD-C)y = Qy=Ax. (18)
El módulo de y es Ir! = ,ja.2+�2 = ..fif. El espacio de los n-vectores complejos se (aD-D + C*)y = (Q-A)y=Ax-Ay= A(x-y)
denota por IC". En este espacio el producto escalar se define mediante la ecuación = A(x - Q- 1 Ax) = AG.x. (19)
y en donde se ha utilizado el hecho de que A es hermitiana. Si).. ,t. 1, el lado izquierdo de SOR:
la ecuación (24) es positivo. Por ende también el lado derecho debe ser positivo y lll < l .
1
{ Q = ro- (D-roC1i )
Por otra parte, si)..= 1 entonces y=O debido a que y= (1-l)x y Ax=O , resultado
que se·deduce de la ecuación (18). Este hecho contradice la condición (Ax, x) > O para G = (D-roCi )- (roCu+(1-ro)D)
cualquier x,;:. O. Por consiguiente, p(G) < 1 y el método SOR converge.
(D-roCi)x (k) = ro(Cux(k -l)+ b)+(1-ro)Dx(k-ll,
Cuando se utiliza el método SOR, una elección común es utilizar D como la diagonal
de A y hacer de C la parte triangular inferior de A, excluyendo la diagonal. Sin embargo,
el teorema 7 no presupone esta posibilidad de elección. Una vez más el lector debe estar SSOR:
consciente de que en los textos el parámetro a. generalmente aparece como 1/ro. Como
{ Q = (ro(2-ro))- 1(D-roCi )D- (D-roCu) 1
1 1
consecuencia de ello O < ro < 2. La cuestión de elegir ro de manera que se obtenga
G = (D-roCu)- (roCi +(I-ro)D)(D-@C¿r (roCu+(1-ro)D)
la convergencia más rápida para la iteración SOR se estudia en Young [1971], Varga
[1962], Hageman y Young [1981], Wachspress [1966], Issacson y Keller [1966], y en (D-roC¿ )x<k-I/2l = ro(Cux(k-l) +b)+(1-ro)Dx(k-l)
muchos otros libros.
(D-roCu )x (k) = ro(Cdk-l/2l +b)+(1-ro)Dx(H /2l
Matrices de iteración En esta lista se ha incluido otro método iterativo básico, el de sobrerrelajación suce
Suponga que A se ha separado de la siguiente manera: siva simétrica (SSOR, siglas en inglés de symmetric successive overrelaxation). Cada
iteración del método SSOR consiste de una iteración SOR hacia adelante, que calcula
en cierto orden las incógnitas y luego una barrida SOR hacia atrás, que las calcula en
A=D-Ci-Cu,
el orden inverso. Lo que se considera la mejor elección de los parámetros de relaja
miento para los métodos SOR y SSOR está ligado a preguntas complejas con respuestas
con D= diag(A), Ci es el negativo de la parte triangular inferior, estrictamente, de A, y igualmente complicadas, que no se comentarán aquí.
Cu es el negativo de la parte triangular superior, en sentido estricto, de A. Otra partición
posible es similar· pero con bloques como componentes. En el caso de la discretiza
ción de ecuaciones en derivadas parciales, la primera etapa de partición corresponde a Extrapolación
puntos sobre una malla, en tanto que la etapa posterior corresponde a agrupamientos A continuación presentamos una técnica general denominada extrapolación, la cual
de puntos de la malla, ya sea por líneas o por bloques. puede utilizarse para mejorar las propiedades de convergencia de un proceso iterativo
. A continuación se presenta un resumen de las matrices clave correspondientes a los lineal. Con este fin presentamos la fónnula de iteración:
métodos iterativos básicos presentados en esta sección.
Richardson:
k
x( ) = Gx(k-l) +c. (25)
ya que y ;t O. Recuerde que el objetivo de la iteración (25) es dar como resultado una Con ello hemos demostrado que
solución de la ecuación x = Gx +c. Si G = I - Q- 1 A y c = Q- 1 b, entonces este
proceso corresponde a la resolución del sistema Ax = b. -1+yd � 11. ;;;í 1 -yd,
Antes de intentar la determinación de un valor óptimo para el parámetro y, necesi
tamos un resultado acerca de los valores propios. por consiguiente p(G1) � 1 -yd. Para que el lector asegure, de que nuestra elección
de y es la óptima, vea que si y aumenta, entonces el extremo izquierdo del intervalo
TEOREMA 8 Si A. es un valor propio de una matriz A, y si p es un polinomio, entonces p(A.) es un valor en la ecuación (28) se mueve hacia la izquierda. Si dicho punto es un valor propio de
propio de p(A). Gy, entonces p(Gy ) aumentará. Si y disminuye, continuará siendo válido un argumento
semejante al anterior. 111
Demostración Sea Ax = A.X con x ;t O. Entonces A2x = A.Ax = 11.2x. Utilizando inducción y una
verificación por separado para k =O, tenemos: Debe observarse que este proceso de extrapolación puede utilizarse en métodos que
por sí mismos no son convergentes. Todo lo que se requiere es que los valores propios
Akx = 11.kx (k = O, 1,2, ...). de G sean reales y se encuentren en un intervalo que contenga a l.
Si A es una matriz cuyos valores propios A.¡, A.2, ... , A.n son reales, definimos:
Porlo tantoA.k es un valor propio de Ak. Para un polinomio p se escribe p(z) =I:Z=o ck zk.
Entonces m(A) = rnín11.¡ M(A) = máxA.¡. (29)
¿ c A x = ¿ CkA. x = p(A.)x.
m m
i i
p(A)x = k
k k
1111
k=O k=O Por lo tanto, en el teorema 9 podemos tomar a = m( G) y b = M(G).
El teorema 5 nos permite decir que es necesario y suficiente que p(G7) < 1 para
asegurar la convergencia del método extrapolado que define la ecuación (26). Suponga Ejemplo 4 En el caso de la iteración de Richardson tomamos Q =I y G = I-A. Si A sólo tiene
que no conocemos con precisión los valores propios de G, sino que sólo conocemos un valores propios reales, lo mismo es cierto para G. El teorema 8 nos permite decir que
=
intervalo [a,b] sobre la recta real que los contiene a todos. El teorema 8 nos dice que
los valores propios de la matriz Gy yG+( 1 - y)l se encuentran en el intervalo cuyos
extremos son ya+ I -y yyb+ I -y. ¿Es posible seleccionar y de forma que p(G7) < 1?
M(G) = 1-m(A), m(G) = 1-M(A). (30)
Denote con A(A) al conjunto de valores propios de cualquier matriz A. Entonces: Si m(A) > O o M(A) < O, entonces la aceleración es posible en la iteración de Richardson.
La y óptima, calculada según lo indica el teorema 9, es
p(Gy ) = máx 111.I = máx ly11.+ 1-yl � máx lr11.+ 1-y¡. (27)
l.EA(G,) l.EA(G) a;P.;:éb
y =2/[m(A)+M(A)].
Demostraremos que si 1 r;J. [a, b], entonces y puede elegirse de manera que p(G1) < l .
El radio espectral resultante, teniendo en cuenta que d = m(A), es:
TEOREMA 9 Si l a única información disponible acerca d e los valores propios d e G nos indica que se
encuentran en el intervalo [ a,b], y si I r;J. [a, b], entonces la mejor elección para y es p(G1) = [M(A) -m(A)]/[M(A)+m(A)].
2/(2-a - b). Con este valor para y, p(Gy ) ;;;í 1-lrld, donde d es la distancia de I a
[a,b]. 11111
Demostración Suponga la:¡_ hipótesis y tome el valor dado de y. Ya que 1 r;J. [a, b ], resulta que a > 1 o Ejemplo 5 La iteración de Jacobi puede utilizarse como se indica en el problema 9. Hagamos:
b < l . Haremos la demostración sólo para el segundo caso, dejando el primero para la
sección de problemas. Ya que a ;;;í b < 1, resulta que y> O y d = 1 -b. Por lo tanto, D = diag(a¡¡, a22, ..., aM)
cualquier valor propio A. de G7 satisface la desigualdad:
y apliquemos la iteración de Richardson al problema D- 1Ax = D- 1 b. Usando el
ya+ 1-y � A. ;;;í yb+ 1 -y, (28) resultado del ejemplo anterior concluimos que si m(D- 1 A) > O o M(D- 1 A) < O, entonces
es posible la aceleración en la iteración de Richardson. Además, el radio espectral de la
tal como se mencionó en los párrafos anteriores. Por consiguiente,
matriz de iteración será:
11. ;;;í yb+ 1 -y = 1+y(b - 1) = 1 -yd.
p(Gy ) = [M(D- 1 A)-m(D- 1 A)J/[M(D- 1 A) +m(D- 1 A)].
Más aún,
A.� ya+! -y =y(a+b-2)+ 1+y(l -b) = -1+yd si se utiliza la y óptima y= 2/[m(D- 1 A)+M(D- 1 A)]. •
202 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 203
Aceleración de Chebyshev sujeto a la condición de que el coeficiente más grande sea 2 k -l. Estos polinomios se
La aceleración de Chebyshev es un procedimiento de aceleración más general que pueden generar recursivamente mediante las fórmulas:
también se puede usar en un algoritmo iterativo lineal. Como antes, consideremos un
To(z) = 1, T1(z) = z
método iterativo básico: {
x(k) = Gx ( k-l) + c. Tk(Z) = 2zTk-1(z)-Tk-2(z) (k � 2).
Se supone que la solución al problema es un vector x que satisface la ecuación x = Suponga ahora que los valores propios de G están contenidos en un intervalo [a, b]
Gx + c. Durante el proceso, al llegar al k-ésimo paso, habremos calculado los vectores que no incluye al 1; digamos que b < l. Nos interesamos en el siguiente problema de
x (l) , x (2) , ...x (kl , y nos preguntamos si alguna combinación lineal de estos vectores valores extremos:
puede ser una mejor aproximación a la solución que la dada por ik). Suponemos que mín { máx P (z) .
P,(1)=1 a;;;;z;;;;b I k I}
ªb ) + a\kl + · .. + at ) = 1 , y hacemos:
k
La solución de este problema está contenida en los siguientes cuatro lemas. Dichos
resultados incluyen los polinomios de Chebyshev, Tk> los cuales se discutieron antes y
ik) = I: af liil.
k
i=O
k sobre los que se dirá algo más en la sección 6.1. El conjunto de polinomios que tienen
a lo más grado k, se denota con ITk ·
LEMA 1 Sea� E lR \ (-1, 1). Si p E rrk y p(�) = 1, entonces IIPII � la.l, donde a. = 1 /Tk (�) y
Usando técnicas que nos resultan familiares obtenemos: IIPII =máx-1;:;;,;:;;1 IP (t)I .
k k Demostración Suponga que p satisface las hipótesis pero no la conclusión. Sea t; =cos(in/k) para
ikl -x = ¿a?\x (i) -x) = ¿a[k) G(il(x (O) -x) O � i � k. Estos puntos son los extremos de Tk. De hecho,
i=O i=O
Tk(t;)=cos(kcos-1 t;)=cosirc=(-1{
= P( G) (x (O) -x)
Sea cr=sgna. . Entonces
donde P es el polinomio definido mediante P(z) = ¿�=o ªf l z;. Al tomar la norma
k
cr(-li[a.Tk (t;) -p(t¡)] � la.1-IIPII > O.
obtenemos:
Con ello se demuestra que el polinomio a.Tk-p toma, de manera alternativa, valores
llu( ) -xll � IIP(G)ll ll x O -xll-
k ( )
positivos y negativos en los puntos to, t ¡ , ... , tk. Por consiguiente, este polinomio tiene
En este caso se puede utilizar cualquier norma vectorial y su norma matricial subordinada. al menos k ceros en el intervalo (-1, 1 ). También se anula en el punto � , dando un total
Recuerde que el teorema 4 nos indica que el ínfimo de IIP(G)II sobre todas las normas de por lo menos k + 1 ceros. Ya que a.Tk-p es de a lo sumo grado k, debe ser por lo
matriciales subordinadas es p(P(G)); ésta es la cantidad que se debe minimizar. Si los tanto igual a O, lo cual es una contradicción. 1111
valores propios µ; de G se encuentran dentro de algún conjunto S acotado en el plano
complejo, entonces por el teorema 8, LEMA 2 Sea a< b < l. Si p E rrk y p(l)= 1, entonces IIPII � 1/Tk(w(l)). En este caso
en la cual los coeficien tes de p k se ob tienen a partir de las ecuaciones Se deduce que u COJ =x (OJ y que u (ll se calcula con la fórmula que aparece en el lema. Esto
-1 a.=[2w(l)] -2 se deja para que el lector lo verifique. Usando ecuaciones demostradas con anterioridad,
P1=2 P k=(I- ªP k- 1) (k � 2). y con x que satisface x =Gx + c, resulta:
Demos tración Se define �k =T k(w(I)). Apoyándose en la relación Tk(t) = 2tT k_ 1(t)-T k-z(t) y en u(k)-x=P¡;(G)(u(O)-x)
que� kP k(t) =T k(w(t)), obtenemos:
=[P kP1(G)P k-1(G) + (1- Pk)P k-z(G)](u(O)-x)
P k(t) =�¡ 1Tk(w(t)) =�¡ 1 [2w(t)T k- 1(w(t))-T k-2(w(t))] =P kP 1(G)(uCk-l) -x) + (1- P k)(u(k-Z) -x).
=2�¡ 1� k-1 w(t)P k- 1(t)-�k 1� k-2P k-2(t) Esto se puede escribir como:
u(kl=P kP 1(G)u(k-lJ + (1- Pk)ulk-ZJ+p k [l-P ¡(G)]x.
1 1
=2�¡ � k-1 w(I)P ¡(t)P k-1(t)-�¡ � k-2Pk-2(t)
En este caso hemos utilizado la ecuación w(I)P 1(t) = w(t), la cual puede verificarse Un cálculo sencillo nos revela que el último término en esta ecuación es igual a pk"(c .
fácilmente . Resulta conveniente definirpk =2p¡ 1p k-1w(l)=a.- 1!2p¡ 1p k-l · Usando Finalmente nos damos cuenta de que
nuevamente la relación de recurrencia para los polinomios de Chebyshev, obtenemos:
P 1(G)=y G+(l- y)l. 1111
�k =T k(w(I)) =2w(I)T k- 1(w(I))-T k-2(w(I))=a.-z� k- 1-� k-2 Igual que en el caso del método de extrapolación, también aquí podemos obtener
1
1 =2w(l)p¡ Pk-l-p¡ p k-2=P k- P¡ Pk-2·
1 1 una cota superior para el radio espectral de P k(G):
Así, la relación de recurrencia para Pk puede escribirse como: p (Pk(G))= máx 111 � máx 1P k(1)1
A-EA(Pk(G)) A-EA(G)
-1
4 -1 -1
4 0 -1 Xz _ 0
º [X¡] ¡-4
LEMA 4 Los vec tores u(k)en el método de aceleración de Chebyshev pueden calcularse recursi
vamen te a partir de un vec tor inicial arbi trario u(O) mediante las fórmulas:
[
-1 0 4 -1 ] X3 - 4]
0 -1 -1 4 X4 -4
usando la aceleración de Chebyshev del método de Jacobi.
u(!)=y[Gu(O)+ c]+(1- y)iº)
(r=2-!-a) Respues ta Primero cambiamos la escala del sistema mediante D- 1 Ax=D- 1b, donde D=diag(A) ,
ikl=Pk[y(Gu (k- 1)+ c)+(1- y)u (k-!J¡+(1- P k)ik-2) . y obtenemos una matriz de iteración de Jacobi, cuyos valores propios se encuentran en
el intervalo [-!, !J. Se puede acelerar la convergencia de este método básico usando
Demostración Mantenemos toda la notación establecida con anterioridad En particular, la aceleración de Chebyshev. Comenzando con el vector inicial u=(0, O, O , O)Z: en una
computadora similar a la MARC-32, después de diez iteraciones encontramos que con
k verge a la solución aproximada u=(-0.999996,-0.500002, 0.500002,-0.999996?.
ulk)= L i=O
k
a\ \(i) P k(t) ="a (kl i
L.' t .
i=O
206 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 207
Puede escribirse un algoritmo para el método de aceleración de Chebyshev de la 2. Demuestre que si A tiene la propiedad (fila unitaria diagonalmente dominante)
manera siguiente:
input u, a, b, M, o a¡¡= 1 > ¿la;¡¡ (1 �i�n)
y .--2/(2-b-a) i=l
jr-i
a.- [4(b- a)/(2-b - a)]2
entonces funciona la iteración de Richardson.
outputO, u
3. Repita el problema 2 suponiendo que (columna unitaria diagonalmente dominante)
call Extrap (y, n, G, e, u, v)
output 1, v
p.- 1/(1-2a) ªii = I> ¿laiji (l;;¡j�n )
i=l
call Cheb (p. y, n, G, e, u, v) i'1-j
{t f
los cocientes.
l. Demuestre que si A es diagonalmente dominante y si Q se elige igual que en el método de
Jacobi, entonces r; = laijl} /{la¡;!- laql}
1
p(l - Q- A) < l. 1=1+1 ¡=l
208 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4. 7 Métodos del descenso más rápido y del gradiente conjugado 209
16. Demuestre que si A es no singular, entonces AA• es definida positiva. las matrices de descomposición Q y las matrices de iteración G dadas en esta sección son
17. Demuestre que si A es definida positiva, entonces sus valores propios son positivos. correctas.
18. Demuestre que si A es definida positiva, también lo son A2. A3 ,•. . así como A-1, A-2,••• 31. Encuentre la forma explícita para la matriz de iteración I- Q-1A, suponiendo que se utiliza
19. ¿Existe una matriz A tal que p(A) < IIAI\ para todas las normas matriciales subordinadas? el método de Gauss--Seidel y que
20. Demuestre que si p(A) < I, entonces I -A es invertible y (I - A)-1 = I::OAk . 2 -1
-1 2 -1
21. ¿Resulta cierto que p(AB) ;;; p(A)p(B) para todos los pares de matrices den x n? ¿Se obtiene
-1 2 -1
la misma respuesta si A y B son matrices triangulares superiores? A=
22. Demuestre que el proceso de iteración básico planteado en la ecuación (3) es equivalente a
lo siguiente. Dado x<kl, calcule r<kl = b - Ax(kl , despeje zC l de la ecuación QzCkl = /kl, y
k
-1 2 -1
<k•IJ ikl + z<kl -1 2
defina x = .
23. ¿Forman las matrices herrnitianas de ordenn un espacio vectorial sobre el campo complejo? 32. Caracterice a la familia de todas las matrices A no singulares den x n para las cuales un
paso del algoritmo de Gauss--Seidel resuelve el sistema Ax= b, suponiendo que se inició el
24. Usando la notación del problema 22, demuestre que proceso con x = O.
33. Dé un ejemplo de una matriz A que no sea diagonalmente dominante y para la cual converja
,Ck+tl = (l _ AQ-1)/kl
el método de Gauss--Seidel aplicado a Ax= b.
l•1 = (I- Q-1A)l
l l
34. ¿Cómo se simplifica el método de aceleración de Chebyshev si el método básico es el de
Jacobi?
25. Demuestre que para matrices no singulares A y B, p(AB) = p(BA). (Si es posible, demuestre 35. Demuestre que si el número 6 = III- Q-1AII es menor que 1, entonces
un resultado más fuerte.) ¿Cuál es la relevancia de este hecho para el problema 24?
1\i l- x!I;;; � \!x'kl- x<k-1)\1
k
26. ¿Cuáles son las condiciones necesarias y suficientes sobre la matriz diagonal D para que se
1 6
pueda demostrar que si A es definida positiva también lo es DA?
36. Demuestre que
<27. Programe el método de Gauss--Seidel y póngalo a prueba con los siguientes ejemplos:
T.(t) = �(b" +b-") b = t+ /t2="I
3x+y+z = 5 3x+y+z= 5
37. Demuestre el teorema 9 para el caso en que a > l .
(a) { X+ 3y - Z = 3 (b) { 3x+y-5z = -1
3x+y-5z = -1 x+3y-z = 1 38. Usando l a definición, demuestre que una matriz A definida positiva es herrnitiana; es decir,
A es definida positiva si x•Ax > O para todo x E C" distinto de cero. En particular, si se va
a utilizar esta definición, la matriz A definida positiva debe ser simétrica. Sin embargo, si
Analice lo que sucede cuando estos sistemas se resuelven por eliminación gaussiana sin
se utiliza la definición alternativa xr Ax > O para todo x E IR" distinto de cero, entonces no
pivoteo.
hace falta que la matriz definida positiva sea simétrica.
<28. Use la iteración de Gauss-Seidel en un problema para el cual
Utilice (0.33116, 0.70000{ como punto de partida y explique qué ocurre. En esta sección vamos a desarrollar al8llllOS métodos especiales para resolver el sistema
29. Demuestre que el método de Gauss--Seidel es un caso especial del método SOR.
Ax=b
30. Demuestre que las siguientes matrices
cuando A es una matriz de n x n simétrica y definida positiva. Esto significa que
'R.=l-A
:J = l-D-1A A T =A
1
g = l- (D- CiT A
lw = l- ro(D- roCi)-1A Ax > O
r
x para x ;= O.
U., = l-ro(D-oiCu)-1A A lo largo de esta sección vamos a utilizar la notación para el producto escalar de
1 dos vectores x y y con componentes reales
-1
S., = l- ro(2-ro)(D-oiCu) D(D-roCi)- A
n
son las matrices de iteración para los métodos de Richardson, Jacobi, Gauss-Seidel, SOR r
(x, y) = x y= ¿x;y;.
hacia adelante, SOR hacia atrás, y SSOR, respectivamente. A continuación demuestre que i=l
210 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4. 7 Métodos del descenso más rápido y del gradiente conjugado 211
Algunas de sus propiedades más simples son las siguientes: Utilizando este valor t, podemos calcular el mínimo de q sobre del rayo:
(i) (x, y) = (y, x)
(ii) (ax,y) = a.(x, y), para toda constante a. q(x+tv) = q(x)+t[2(v,Ax-b) +t(v,Av)]
(iii) (x + y, z) = (x, z) + (y,z) = q(x)+t[2(v,Ax-b) + (v, b-Ax)J
(iv) (x,Ay) = Wx, y) = q(x)-t(v, b-Ax)
Por la propiedad (i), el orden de los argumentos en las propiedades (ii)-(iii) se puede = q(x)- (v, b-Ax)2 /(v,Av) (4)
invertir.
Comenzamos estableciendo la equivalencia de dos problemas numéricos que de
penden de A y b. Nuestro cálculo nos muestra que al pasar de x a x +tv siempre hay una reducción en el
valor de q, a menos que v sea ortogonal al residuo, es decir, (v, b -Ax) = O. Si x no es
LEMA Si A es simétrica y definida positiva, el problema de resolver Ax = b es equivalente al una solución del sistema Ax= b, hay muchos vectores v que satisfacen (v, b-Ax) -¡,. O.
problema de minimizar laforma cuadrática Por consiguiente, si Ax -¡,. b entonces x no minimiza q. Por el contrario, si Ax = b,
no hay ningún rayo que emane de x sobre el cual q tome un valor menor a q(x). En
q(x) = (x,Ax) -2(x, b). consecuencia, una x con tales características es un mínimo para q. 1111
Demostración En primer lugar, veamos cómo se comporta la función q a lo largo de un rayo unidimen
sional. Para ello, consideremos x + tv, con x y v vectores y t un escalar. La figura 4.2 La demostración anterior sugiere un método iterativo para resolver Ax = b. Pro
nos muestra por qué podemos considerar esto como un rayo unidimensional. cedemos por minimización de q a lo largo de una sucesión de rayos. En el k-ésimo
paso de tal algoritmo se dispondrá de x<0J , x< 1J , x<2J , ..., x . Después, utilizando cierta
<k )
¡;z
fórmula, se elige una dirección de búsqueda v<kJ conveniente. El siguiente punto de
nuestra sucesión es:
X( +I)
k
= i + t V(
k)
k
k)
,
donde
(v <kJ,b-Ax<kl)
tk =
(v <kl,Av <k))
Figura 4.2 Ejemplo de un rayo unidimensional.
Muchos métodos iterativos tienen la forma general
Un cálculo directo hace patente que para todo escalar t:
x< +I)
k
= x< J + t v <kl,
k
k
q(x+tv) = (x+tv,A(x+tv))-2(x+tv,b)
= (x,Ax)+t(x,Av)+t(v,Ax)+t2(v,Av)-2(x,b)-2t(v,b) para valores específicos del escalar t y los vectores v <k J . Si llv(kJ II = 1, entonces tk mide
k
= q(x) + 2t(v,Ax)-2t(v, b) + t2 (v,Av) la distancia que nos movemos de x para obtener x k+I)_ (Véase la Fig. 4.3.)
< k) <
d
(2)
di + tv) = 2(v,Ax -b) + 2t(v, Av).
q(x
Cuando la derivada en (2) es cero, hay un mínimo de q a lo largo del rayo. El valor de t
que nos da este punto mínimo es, por lo tanto,
t = (v, b - Ax)/ (v, Av). (3) Figura 4.3 Movimiento a lo largo del vector de dirección v<k).
212 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más rápido y del gradiente conjugado 213
modo que el vector x en curso puede sobrescribirse. La misma observación se aplica a donde U es la matriz den x n cuyas columnas son u(ll,u(Z) ,... , u(n) . Es obvio que A y
los vectores v(O) , v(I), ..•. Por lo tanto, podríamos escribir alternativamente: U son no singulares, y que las columnas u(I) ,u(2), ... , u(•) son una base de JR.n .
input x, A, b, M TEOREMA 1 Sea { u(ll ,u(2l, ...,u (•)} un sistema A-ortonormal. Defina
output 0,x ii) = x(i-1)+(b-Ax (i-1),uUl)u(i) (i � i � n),
for k = 1,2, 3,... , M do
en donde x(O) es un punto arbitrario de lR.". Entonces Ax< ) = b.
n
v+-b-Ax
t +- (v, v)/(v,A v) Demostración Defina t; = (b-Ax(i-I),u (i)), de modo que la fórmula recursiva se convierta simple
x+-x+tv mente en
outputk,x X(¡) = X(i-l)+t;i¡).
end. Con esto y con la relación (AuVJ,u Ul) = Oij,deducimos las siguientes ecuaciones:
El método del descenso más rápido rara vez se usa en esta clase de problemas debido Ax(L) = Ax(i- ll+t;Au(I)
a su lentitud. La manera en que éste podría marchar en un problema bidimensional Ax(n) = Ax(O) +t ¡ Au(ll+· · ·+t.Ai•l
está representada en la figura 4.4, en la que mostramos las curvas de nivel de la forma
cuadrática q. (Ax(n ) -b, u(i)) = (A x(O) -b, iº)+t¡
A continuación podemos ver que la parte derecha de esta última ecuación es O:
t; = (b-Ax(i-!J,u(L))
= (b-Ax(ºl, uUl)+(Ax (O) -Ax(!) ,u(i))+· · ·+(A x(i-Z) -Ax(i-1) ,él )
= (b-Ax(Ol,u(i) )+(-t ¡ Ai1l , u(i) )+· · ·+(-t;-1Au(i-I), u (¡))
= (b-Ax(ºl,u(I) )
Nuestro análisis muestra que Ai•l -b es ortogonal (en el sentido usual ) a los vectores
i1l,u(2), ..• , u(•),y por ende debe ser cero. 11
Figura 4.4 Interpretación geométrica del descenso más rápido.
214 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más rápido y del gradiente conjugado 215
Vamos ahora a describir una manera de desarrollar este método. Sea A una matriz Método del gradiente conjugado
de n x n simétrica y definida positiva. Es muy fácil comprobar que la ecuación
Un tipo particular del método de la dirección conjugada es el método del gradiente
n n conjugado de Hestenes y Stiefel [1952]. Éste se aplica a los sistemas de la forma Ax = b,
(x,y)A = (x,Ay) = ¿¿aijXíYj en los cuales A es una matriz simétrica y definida positiva. En el método del gradiente
i=l j=l conjugado las direcciones de búsqueda y(il a las que se hace referencia en el teorema 2,
se eligen de una en una en el proceso iterativo y forman un sistema A-ortogonal. No
define un producto escalar. A éste le corresponde una norma cuadrática llx lli = (x, x)A· obstante, la propiedad distintiva es que los residuos r(i) = b -Ax(i), forman un sistema
Si aplicamos el proceso de Gram-Schmidt con este producto escalar al conjunto { el1l , ortogonal en el sentido ordinario, es decir, (rCil , r(D ) = O para í *" j.
e<2l , ... , e<•l } de vectores unitarios estándar, el resultado es un sistema A-ortonorrnal El método del gradiente conjugado es preferible a la eliminación gaussiana simple
{ u(ll, uC2l , ... , uCnl }. El proceso de Gram-Schmidt (que discutiremos con mayor amplitud cuando A es muy grande y rala. Teóricamente, el algoritmo del gradiente conjugado nos
en la sección 5.3) se describe como sigue: dará la solución del sistema Ax = b en n pasos a lo sumo. No obstante, en la práctica el
algoritmo se utiliza como un método iterativo que produce una sucesión de vectores que
converge a la soluciór.. En los problemas mal condicionados, es frecuente que los erro
u
(í)
= (ilv(i) IIA r 1 v(i) donde ylíl = é) - ¿(el'1, uii'! )A uú\ res de redondeo impidan que el algoritmo nos proporcione una solución suficientemente
j<i precisa en el n-ésirno paso. Cuando Hestenes y Stiefel [1952] presentaron el método
del gradiente conjugado, éste causó una gran conmoción. Sin embargo, el interés dis
Por la naturaleza especial de los vectores elíJ, estas fórmulas se reducen a: minuyó cuando se descubrió que la propiedad de la terminación finita no era asequible
en la práctica. Esta propiedad era indeseable para un método directo. Veinte años más
u(i) = (llvCilllA ) - vCO donde yli) = /íl - ¿(Au Ci\ u Ul.
1
tarde hubo un interés renovado por el método cuando se consideró como un método
j<i
iterativo. Lo que no debemos esperar de un método iterativo es obtener la solución
con absoluta precisión después de n pasos. De hecho, lo que se espera es obtener una
Por ejemplo, uC 1l = (1/faíi)e(l l . Las fórmulas nos indican que cada uCíl es una combi respuesta satisfactoria en menos de n pasos para sistemas extremadamente grandes. En
nación lineal de los vectores unitarios e<1l , e<2J , ... , eCíl . La matriz U, cuyas columnas los problemas bien condicionados, el número de iteraciones necesarias, para que el mé
son u< 1 l , uC2), .•• , uC•l , es por tanto triangular superior. La ecuación urAU = I, que todo del gradiente conjugado converja satisfactoriamente, puede ser muchÓ menor que
mencionamos previamente, nos da A = (Ur )-1 u- 1, la cual es una factorización LU. el orden del sistema. La historia del método ha sido escrita por Golub y O'Leary (1989].
De este modo, la solución de Ax = b se calcula con una variante de la eliminación El algoritmo formal del gradiente conjugado es el siguiente. (Este seudocódigo
gaussiana sin pivoteo. no se diseñó para ejecutarse en una computadora. Más tarde veremos un algoritmo
En los trabajos numéricos es preferible utilizar sistemas A-ortogonales a sistemas adecuado para tal fin.)
A-ortonorrnales. Un conjunto de vectores v( l), v(Z) , ... es A-ortogonal si (v(i) ,AvVl ) = O, inputiºl ,M,A, b, e
siempre que i "#- j. De un sistemaA-ortogonal podemos pasar a un sistemaA-ortonormal rCO) +- b - Ax(O)
por medio de un proceso de normalización: y(O) +- rCO)
1
output O, x(O), rC0l
uiíJ = (llv(i) IIA )- /íl. for k = O, I, 2, ... ,M - 1 do
if v(OJ = O then stop
Si cada vector v(íl es distinto del vector cero y A es una matriz definida positiva, los tk +- (rik>, r(k)) /(/kl,Av(k))
vectores u ,) formarán un sistemaA-ortonormal. El siguiente es el análogo al teorema l .
(
(x k+I) +- x(k) + t v k)
(
k
r(k+l) +- r(k) - tkAv(k)
TEOREMA 2 Sea { vC l l, vC2l, ... , v(•l } un sistema A-ortogonal de vectores distintos de cero correspon
dientes a una matriz A de n x n definida positiva. Defina if llr(k+l ) II� < e then stop
sk +- (rCk+l), r(k+l)) /(r(k l, r(k ))
(k +I +- r(k+I + Sky(
) ) k)
(b -Ax(i- 1)' v(í)) ro V
xli) = xií-1) + y (1 � i � n) output k + 1, x(k+l ) , ,Ck+l)
(y<O,Av(O )
end.
en donde xCO ) es arbitrario. En tal caso, Ax(n) = b. En el algoritmo, si v(k) = O entonces x es (teóricamente ) una solución del sistema
( k)
lineal Ax= b. La ejecución del algoritmo en una computadora requiere lugar de alma
}c
216 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más r ápido y del gradiente conjugado 217
cenamiento para cuatro vectores, a saber, x( k) , ,-(k) , vCk) y AvCkl . También se debe hacer Supongamos ahora que el teorema es válido para una cierta m. Con base en esto, lo
provisión para el cómputo de los productos AvCk) . (Esto puede o no requerir el alma demostraremos para m+ l . Con este propósito en mente, suponemos que vCOl , v( ll , ... ,
cenamiento de toda la matriz A .) El trabajo en cada iteración es muy modesto, siendo vCm+l) son todos diferentes de cero. Por hipótesis de inducción, los incisos (a) a (f) son
igual a un sólo producto matriz-vector para Av( k) , y tan sólo dos productos escalares válidos. Queremos demostrar que
(después de las primeras iteraciones) para (vCkl ,AyCkl ) y (r (k+ll ,r (k+ll) . Observe que el
criterio de detención incluye el número JJr (k+llll1 = (r (k+ll ,r (k+ll ) , que es muy fácil de (a') (r (m+ll, v(íJ ) = O (0�i �m)
(b') (r (m+ll , r(m+l)) = (r (m+l),v(m+l) )
calcular, pues r (k+ll se tiene disponible. Por consiguiente, un código de computadora
(c') (vCm+ll,Av(i) ) = O (O�i �m)
para el método del gradiente conjugado debería basarse en el siguiente algoritmo.
(d') r (m+l) = b-Ax(m+l)
(e') (,-{m+l),,-J.il) = O (O�i �m)
input X, A, b, M, e, 8
(f') r (m+l) * O
r+-b-Ax
V+-r Para (a'), sea i = m. Tenemos:
c +- (r, r)
for k = 1, 2, ... , M do (r(m+l),y<m)) = (r(m)- tmAyCm l ,V(m)) = (r(ml ,V(m) )-tm(v(m) ,Aylm))
if (v, v) 1/2 <8 then stop = (r(ml ,y<m) ) = (r(ml ,r(m)) = O.
z+-Av
t +-c/(v,z) Utilizando (b). Si O�i <m, por (a) y (c),
X+-X+tv
r+-r-tz (r(m+ll ,v(i)) = (r(ml ,v(i) )-tm(y<ml ,Av(i)) = O.
d +- (r,r)
if d2 <e then stop Para demostrar (b'), utilizamos el inciso (a') concluyendo que
v +- r +(d/c)v
(r(m+l),y<m+l)) = (r (m+l) ,r(m+l)+Sm V(m) ) = (r (m+ll ,r (m+ll).
c+-d
output k, x, r Para demostrar el inciso (c') tomamos s_ 1 = O y vHl = O donde quiera que estos
end. términos aparezcan. Si O�i �m, entonces
TEOREMA 3 En el algoritmo del gradiente conjugado,para todo entero m <n, si v(Ol ,v(ll,... ,v Cm) son (v( m+ll ,Av(!)) = (/m+l)+Smy<ml ,Avf'))
vectores distintos de cero,entonces r ( ) = b-Ax( íJ para O�i �m ,y {r ( Ol , r (l l ,•. . ,,.<m)}
i
Demostración Vamos a demostrar algo más; a saber, que (según las hipótesis dadas) cada uno de los
siguientes incisos es válido: = rl (/m+l) ,yli) _ S¡_¡V(i-1) _ V(i +l)+sií))
+sm (v(ml ,AvCil)
(a) (r (m),v(í)) = O (O�i <m)
(b) (r<1\ r (i) ) = (r (í) ,v(il ) (O�i�m) = rl [(rfm+l l,yli)) _ S¡_¡ (r fm+l), V(i-1)) _ (r (m+ll, V(i+l))
(c) (vCml,Av( i) ) = O (O�i <m)
(d) r (í) = b-Ax(i) , (O�i�m) +s¡(,Cm+ll ,ylil )J+sm (V(ml ,Avf'1).
(e) (,-{mJ,r CíJ) = O (0�i <m)
,.<z) * O Si i <m, por el inciso (a'), r <m+ll es ortogonal a v<íJ , vCi-ll y vC +Il. También, por el inciso
i
(f) (0�i �m)
( ml , <11 ) = ( m+ll ,A Cil ) = O. El caso i =mes
(c), v Av
< O. Por consiguiente, en este caso v< v
La demostración es por inducción sobre m. En el caso m = O suponemos que y(Ol * O, especial. De una ecuación previa tenemos que
debiendo demostrar los incisos (a) a (f). Observe que (a), (c) y (e) son identidades nulas
en este caso. En cuanto a (b), (d) y (f), resultan de manera inmediata de la definición del
(v(m+ll ,Ay<m)) = t;l(r (m+l),y<m) _ Sm-JV(m-l) _ V(m+l)+Sm V(m) )
algoritmo, pues
,(0) = b-Ax(O) = y(O) Q. * +s (v(m),Aylm)).
m
218 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más rápido y 1el gradiente conjugado 219
Por el inciso (a'), /m +l) es ortogonal a y (ml y v(m-l) . Por lo tanto donde
A= S T A S
(y (m +l),Ay (m )) = -t,;;1(/m +l),y (m +l) ) +sm (r (ml,Av (m) ) { x=s-1x
= -t,;;t(r (m +ll, v(m +l)) +sm (v(m),Ay (m )) b= ST b
(V(m), AV(m))
= (/m +l)' V(m +l)) es tal que K(A)< K(A). Como un producto secundario, el método iterativo que se utiliza
(r( m ),r(m)) para resolver el sistema precondicionado puede que converja más rápido que como lo
(,(m +l), ,(m +l)) m haría con el sistema original. En vez de tomar una matriz arbitraria S, supondremos
+ (V( )' AV(m)) que la matriz de descomposición Q simétrica y definida positiva se puede factorizar de
(r(m),,(m))
modo que
Q-1=SS T.
Podemos ver, utilizando (b'), que esta expresión es cero.
Para demostrar (d'), escribimos: La razón de todo esto se hará clara en breve.
El algoritmo formal del gradiente conjugado se puede escribir para el sistema pre
b - A./m +l)=b - A(x(m) + lm y (m ))=b -Ax (m ) - tm Ay (m) condicionado como sigue:
=,(m ) _ ( /m ) _ , (m +l))=, (m +l) ,(O)=b _ A_t(O)
í)(O)=,(O)
Para demostrar (e'), sea O;;; i;;; m y pongamos L¡=O y vHl=O.Entonces a partir
del inciso (a') tenemos: for k = O, l ,...,M do
1k=(ik),,(kl) / (v(k),Av(k ))
(r (m +l),r(f¡)= (r (m +l), yUl -S¡-¡V( i-1)) x(k +t)=ik ) + tkv(k )
= (/m +l),v(f¡) -Si-1 (/m +ll, v(i-1)) = O. ,(k +l)= ,<k ) _ tk Av(k )
sk=(,(k+I),,<k+I)) / (,<kl,,<k ))
Para el inciso (f'), utilice (c') y el hecho de que A es definida positiva como sigue: v<k+t) =;-(k+ll + skv<kl
end.
O< (v (m +ll,Av (m +l))=(r(m +l) +sm y (m l,Ay (m +l))
Al precondicionar el sistema original, toda dispersión en la matriz A se puede
=(/m+l),Ay (m+l) ) + Sm (y{m ),Aim +l)) destruir al formar A. De este modo, en vez de conformar explícitamente el sistema pre
=(/m +l),Aim +l)). condicionado, quisiéramos utilizar el sistema original y realizar el precondicionamiento
implícitamente dentro del algoritmo.
Escribimos
En consecuencia, ,(m +l) � O. 11
ik l=S-lik )
El teorema y su demostración están adaptados del libro de Stoer y Bulirsch [1980].
í)ik )=s-ly(k)
inputx, A, b, M, 8, e 4. Sean A una matriz definida positiva y b un vector fijo. Para toda x, el vector residual es
rt-b-Ax r = b- Ax y el vector de error es e = A - t b- x. Demuestre que el producto interno del
resuelva Qz = r para z vector de error con el vector residual es positivo, a menos que Ax = b.
5. Sean A una matriz simétrica, Ax = b y y un vector arbitrario. Con q definida como en el
V f- Z texto, demuestre que
c ,- (z, r) ((x-y),A(x-y)) = (b,r1 b) +q(y).
fork = 1, 2, ... , M do Esto muestra que minimizar q(y) es equivalente a minimizar ((x- y),A(x-y)).
if (v, v) 112 < 8 then stop 6. Con t definida como en la ecuación ( 3), demuestre que si y = x + tv, entonces v.l(b -Ay),
es decir, (v. b-Ay) = O.
zt-AV
7. Demuestre que en el método del descenso más rápido
t ,-c/(v,z)
X t-X+tv q(x(k+tl) = q(x(kl)- [J/klf[4/(/kl ,Ar(kl ),
rt-r-tz donde /kl = b-Ax(k).
resuelva Qz = r para z 8. Si {u(t)' u(2l , ..., u(•l} es un conjunto de vectores ortonormal en el sentido usual, y si estos
d ,- (z, r) vectores se utilizan como direcciones de búsqueda para minimizar q ¿se alcanzará la solución
después de n pasos?
if d2 < ethen
9. Sea A una matriz de n x n. Demuestre que de la existencia de un sistema A-ortonormal
e;- (r;r) {u't)· u(2l, ..., u'"l} se infiere que A es simétrica y definida positiva.
if e2 < e then stop 10. Demuestre que en el método del gradiente conjugado,
endif
lk = (/kl, /kl)/ (/kl, Av (k))
v ,-z+(d/c)v
Sk =-(/k+t),Av(k) )/ ( v(kl,Av(k))
c ,-d
output k, x, r '11. Programe y ponga a prueba el método del gradiente conjugado. Un buen problema para
ponerlo a prueba es la matriz de Hilbert con un simple vector b:
end. n
¡
El método del gradiente conjugado precondicionado es un área de intensas investi ªU = (i+j+ 1)-t b, = 3LªU (1 � i,j � n)
gaciones. Hay toda una gama de elecciones para Q, tales como la matriz de sobrerrela i=l
jación sucesiva simétrica y muchas otras. También hay paquetes de cómputo asequibles 12 . En el método del gradiente conjugado, demuestre que si /kl = O, entonces Ax(k) = b.
que contienen rutinas del gradiente conjugado y otros métodos iterativos. Ejemplos de
13. ¿Para qué valores de tk el método del descenso más rápido se reduce al método de Richardson?
ello son los paquetes ITPACKV 2D de Kincaid, Oppe y Young [1989], NSPCG de Oppe, ¿Qué condiciones debemos imponer a lk y a A para que el método del descenso más rápido
Joubert y Kincaid [1988], o PCGPAK [1984]. Nosotros hemos modelado nuestra presen sea equivalente al método de Jacobi?
[X¡ ] [
tación del método del gradiente conjugado precondicionado basándonos en la de Ortega 14. Considere el sistema lineal
[1988]. Ahí encontrará usted información adicional, al igual que en muchos otros libros,
tales como el de Golub y van Loan [1989]. 2 Ü -1 J
[-2 -lQ Q ] X2 = -12 ]
-J -1 4 X¡ 2
SERIE DE PROBLEMAS *4.7 Tomando como vector inicial a iºl = (O, O, ül, efectúe dos iteraciones de cada uno de los
l[
siguientes métodos: (a) Jacobi (b) Gauss-Seidel (c) Gradiente conjugado.
l. Demuestre que si A es simétrica, entonces el gradiente de la función
'15. Resuelva el siguiente sistema a partir de x'ºl = O usando el método que se indica: (a) Jacobi
q(x) = (x, Ax)- 2 (x, b) (b) Gauss-Seidel (c) Gradiente conjugado
JO 1 2 3 4 [Xt 12
en x es 2(Ax- b). Recuerde que el gradiente de una función g: IR" -,. l. es el vector cuyas 1 9 -1 2 -3 x2 -27
componentes son Bg/Bx,, para i = 1, 2, ... , n. [ 2 -1 7 3 -5] X3 = 14]
3 2 3 12 -1 X4 -J7
2. Demuestre que el valor mínimo de q(x) es-( b, A - 1 b). 4 -3 -5 -J 15 X5 12
3. Demuestre que en el método del descenso más rápido, v(kl .l /k+tl . Nota: La matriz de coeficientes es simétrica y definida positiva, mas no diagonalmente
dominante.
224 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.8 Análisis de los errores de redondeo en el algoritmo gaussiano 225
*4.8 Análisis de los errores de redondeo en el algoritmo gaussiano Cuando todas estas cuestiones se toman en cuenta, los números computados con el
algoritmo gaussiano se pueden describir con las ecuaciones:
Vamos a investigar ahora los errores de redondeo que surgen inevitablemente al resolver ()
un sistema de ecuaciones lineales: -(k+!) _ áIJ i�k
aij - -(k)
- [áfl - ft(fika )] i>kyj>k
{fi � kj
{
Las fórmulas que definen la descomposición LU son las siguientes:
áf l
+I
= [áfl -(l -oij)lik á�l]/0 -oif) (i>k, j>k)
a(k)
ij i�k
(k+I) (k) _ t a(k)
a9 = aq ,k k ¡ i>kyj>k lik = (1 + Oik)á�)/áW (i > k).
o j�k<i
La primera de las dos ecuaciones se puede escribir en la forma
i<k
eik = i=k -(k+l) _ -(k) - l -<k)+ <k>+ , -(k+l)
{ �a(k) 'a(k) i>k aij - ªif ikakj 81
g ,k ákj 8ifªij (i>k, j>k).
ik ¡ kk
Para analizar la matriz E(kl, considere primero el caso i > k, j = k. De ecuaciones En la práctica, antes de aplicar este teorema, debemos conocer el número
previas tenemos que
P = máx la(kl1
l�4 �n IJ ,
_ a-(k+I) _ a(k)+ e(- k)a(- k)
ei(kk) -
j
ik ik ik kk
k) - -< k) Éste puede calcularse durante la ejecución del algoritmo si se añade el código adecuado.
= O -aik + e ikakk
- <
= -a�l+ ( a�1 / a(;])(1+oik) a(;] TEOREMA 2 Si X¡, X2, ..., Xn y y¡, Y2, ..., Yn son números máquina, entonces el valor máquina de
concluimos que f.<kl.4.(kl = f.< kl.4.(•l. Recuerde que A(Il =Ay que el factor triangular k -1
superior computado U es Ü = J.<•l. Tomando E= I:;;;;/ E (kl, tenemos que = [;x;y;(l+8;)+x kyk(1+8') ] (1+8)
Je1ll = IB;k l ¡a)fll ;;;i sp (i > k) 18;+8+MI;¿; CI +e/+z-i -1 18+o'+8o'I;¿; c1+d -1.
( k) • e- - k • - k < ,,_
1 e¡j I = 1 uij ikak< j)+ u;j' ai< j +t) ¡ = ""'P (i > k. j > k). La primera de estas desigualdades se establece al escribir
La segunda desigualdad se demuestra de manera similar. Esto completa la inducción. Esto lo interpretamos como una ecuación matricial
(L+t:.)y = b,
Ahora se requiere la siguiente estimación para k � n + 1:
(6)
en donde t:. es la matriz triangular inferior cuyos elementos son lgo¡¡ , siempre que
(l + e) -1= [l + ke + --e +···+e ] -1
I �j � i � n. De este modo
k k(k-1) z k
k- I
[¡+-e+ (k-l)(k-2)
= ke e +···
] 11
TEOREMA 4 Sea U una matriz triangular superior no singular de n x n. Si los elementos de U y c
2
2 2 ·3
son números máquina, y ne < entonces la solución calculada y de Uy = c satisface
!,
� ke [1+ +( +· · exactamente un sistema perturbado
I IY · ]
(U+t:.)y = c con ¡t:.¡¡ I � J(n + l)e[ug[-
= kej(l-!ke) < �ke.
Demostración Se deja como ejercicio.
En el último paso se utilizó la hipótesis de que ke � ne < ! . Finalmente 1
TEOREMA 5 Sean los elementos de A y b números máquina. Si se utiliza el algoritmo gaussiano con
� (l + et+2-i-1::;; �(n+2-i)e::;; �(n+l)e. 11 pivoteo por filas para resolver Ax = b, la solución calculada x es la solución exacta de
un sistema perturbado
TEOREMA 3 Sea L una matriz triangular inferior unitaria de n x n, cuyos elementos son números
máquina. Sea b un vector cuyas componentes son números máquina. La solución (A+F)x=b en el cual Jj¡¡J � 10n2ep.
calculada de Ly = b es el vector y, que es la solución exacta de
Aquí n es el orden de la matriz A, p = máx 1�4¡,k�n l at\ y e es el error de redondeo
(L+t:.)y = b con lé:.;¡ I ::;; �(n+l)ell;¡ ¡. (3) unitario de la máquina. Se supone que ne < !.
Aquí e representa el error de redondeo unitario de la máquina, y se supone que ne < !. Demostración Por los teoremas l, 3 y 4, y en vista de que ne<!, tenemos lo siguiente:
Demostración La solución exacta del sistema Ly = b se calcula con la fórmula A+E = ÍÜ [e¡¡ ¡ � 2nep
(Í+t:.)y=b lé:.;¡I � J(n+l)eilij[
y¡ = b;- ¿ l;¡y¡ (Ú+t:.')x=y it:.iji::;; �(n+l)elii;¡ ¡.
i-1
j=I
(1 � i ::;; n),
Los valores calculados y1, Y2, ... , Yn satisfarán una ecuación de la forma
Al reunir estas ecuaciones obtenemos:
b = (L+t:.)y = (L+A)(ú+t:.')x = (íü+t:.ú+fo' +M')x
= (A+E+t:.ú + fo'+M')x = (A+F)x,
y; = ¡ b;- ¿ l y¡(I + 8;¡) (1 + 8u),
í i-1 ]/
1=1 donde F = E+AÚ + fo' + M'. Recurrimos a las cotas dadas más arriba para obtener
ij (4)
1 n+l 36 n+1
=n2ep {� + 2 + 8( )
2}
n 5 n n
para después reescribirla así:
¿ t y¡(I + 8 ) = b;.
25
if ij La cantidad dentro de las llaves no puede ser mayor que 10. 1111
j=l
230 Capítulo 4 Resolución de sistemas de ecuaciones lineales Capítulo 5
Las cotas impuestas por el teorema 5 se pueden mejorar si se pone más atención
a los detalles en los teoremas 1 a 5 y si se calcula IIFl! 00 El lector debería consultar
•
TEMAS SELECTOS
Forsythe y Moler [1967], Golub y Van Loan [1989], Wtlkinson [1965] e Isaacson y
J(.eller [1966]. DEL ÁLGEBRA LINEAL NUMÉRICA
SERIE DE PROBLEMAS *4.8 5.1 Problema de los valores propios de una matriz: el método de la potencia
l. Demuestre el teorema 4. 5.2 Los teoremas de Schur y Gershgorin
2. En el teorema l, demuestre las desigualdades *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados
*5.4 Descomposición en valores singulares y seudoinversas
(k) *5.5 Algoritmo QR de Francis para el problema de los valores propios
\IE lloo :;;; (1+ 2(n- k)]ep
2
IJE\1 00 :;;; n ep.
El estudio de los valores propios de una matriz requiere cierta familiaridad con los
números complejos, por lo que comenzamos con un breve repaso de las nociones básicas
que se necesitan.
Conceptos básicos
El campo l de los números reales tiene el defecto de que un polinomio de grado n
con coeficientes reales no necesariamente tiene n ceros (o raíces) reales. Por ejemplo,
el polinomio p(x) = x2 - 2x+ 2 carece de ceros reales. Este defecto se supera de golpe
extendiendo el campo de modo que contenga al elemento (no real) i. Éste elemento se
caracteriza por la ecuación i2 = -1. El campo que se obtiene de esta manera se denota
con C, y sus elementos se llaman números complejos. Estos números tienen la forma
y=a-ip
lrl = )a2 +V
231
232 Capítulo 5 Temas selectos del álgebra lineal numérica 5.1 Problema de los valores propios de una matriz: el método de la potencia 233
Una de sus consecuencias es que todo polinomio de grado n se puede descomponer como La condición de que la ecuación (1) tenga una solución no trivial es equivalente a
un producto de n factores lineales. cada una de las siguientes condiciones:
El espacio vectorial e• se compone de todas las n-tuples complejas tales que
A- M mapea algún vector distinto de cero en O (2)
X= (X¡,Xz,... ,x.l, A- U · es singular (3)
donde Xj E C para 1 � j � n. Si el vector complejo x se multiplica por el número det(A- U)= O. (4)
complejo1, el resultado es otro vector complejo, a saber,
De este modo nosotros podemos, en principio, resolver la ecuación (4) para las incógnitas
AX = (AX¡, AXz, ..., AX./. ), y así calcular los valores propios de A. La ecuación (4) se conoce como la ecuación
característica de la matriz A. Si esta ecuación se escribe con más detalle resulta:
De esta manera, podemos considerar a C" como un espacio vectorial sobre el campo de
escalares C. En el espacio C", el producto interno y la norma euclidiana se definen, a¡¡ - A. a12 a13 ª1•
n
det ¡ a31 a32 a33 -1 a3. 1 =0.
Observe que La función determinante se define como una suma de términos que son productos de
(x,y) = (y,x) (x, ly) = �(x,y) elementos de la matriz. De acuerdo con esta definición podemos ver que la parte izquierda
de la ecuación (4) tiene la forma de un polinomio de grado n en la variablel. Éste es
y el polinomio característico de A. De golpe, nos vemos llevados a la conclusión de
(x+y, z) = (x,z) + (y, z). que una matriz de n x n tiene exactamente n valores propios, siempre y cuando éstos se
Si A es una matriz con elementos complejos, con A* denotamos su conjugada tras cuenten con las multiplicidades que tienen como raíces de la ecuación característica.
puesta: (A*)ij = Aji· En particular, si x es una matriz de n x l (o vector columna), Para aclarar estos conceptos, determinemos los valores propios de la matriz
entonces x*= (i¡) es una matriz de l x n (o vector fila), y [1 2 1]
n
A= O I 3 .
y*x = (x,y) = ¿x¡y¡ 2 1 1
i=l La ecuación característica es
¿ [xi[ .
n n
x*x = (x,x) = JJxj[� =¿x¡i; = 2 1-1 2 1
i=l i=l det [ O 1-1 3 ] =-13 +312 +2\+8=-(\- 4)(12 +1+2)=0.
2 1 1-1
Sea A una matriz den x n (cuyos elementos pueden ser números complejos). Seal un
escalar (un número complejo). Si la ecuación Las raíces de la ecuación característica son
De acuerdo con la primera de nuestras hipótesis, los valores propios J..1, J..2, ...),n , dado.) Entonces
se pueden indexar de modo que $(x k =1ef[$(u' ll )+$(E(k))]
( )
) (8)
JJ..d > JJ..2 1 � JJ..3J � ... �JJ..nl- En consecuencia, los cocientes siguientes tienden a 1e 1 cuando k-+ oo:
De acuerdo con la segunda de nuestras hipótesis, hay una base {u(Il , uC2l , ... , u<nl } de $(ik+l <n +$(dk+ll )
IC" tal que rk - - [$(u l) ]
)
binación lineal de los elementos de la base u<ll , u<2l , ... , u(n , el coeficiente de u(l ) es
)
se va alineando cada vez más con u(l) a medida que k -+ oo, el método también nos
distinto de cero. Así, puede proporcionar al vector propio u( ll . En la literatura sobre el tema se encuentran
muchas variaciones y refinamientos del método de la potencia.
x<0l = a¡u(ll +a2 i2l+ · · ·+an u< ) (a¡ :;é O).
n
(6)
X(l) =Ax O( )
x(2l =Ax(ll x( )
k
= Ax(k -1) El algoritmo para el método de la potencia tal como lo acabamos de describir es el
siguiente:
de modo que input n, A, x, M
x kl = Akx(ºl.
<
(7) outputO,x
for k = I, 2, ..., M do
En el análisis siguiente no hay pérdida de generalidad al absorber todos los coeficientes
a; en los vectores u"1 que multiplican. Por lo tanto, la ecuación ( 6) se puede escribir y <-Ax
como r <-$(y)/$(x
X(O) = u( )+u(2)+ ...+ u<•l.
X <-y
)
l
output k, x, r
De esta ecuación y (7) tenemos que end.
x(
k) = Aku(I) +A ku(2)+ ...+A ku'n) Aquí,$ es algún funcional lineal.
En las realizaciones prácticas del método de la potencia, es recomendable introducir
y utilizando la ecuación (5), llegamos finalmente a una normalización de los vectores x<k ), ya que de otra manera podrían converger a cero
o crecer sin límite. Por ello, podemos modificar la iteración como sigue:
ik ) =J..fu(ll +1e1u'2) + ...+1e!u<nl .
input n, A, x, M
Esta última ecuación se puede volver a escribir en la forma outputO, x
ComoJ1e 1 I > J 1ej J para 2 � j � n, podemos ver que los coeficientes (1ej /1e d tienden a output k, x, r
cero y el vector entre paréntesis converge a uOl cuando k -+ oo. end.
236 Capítulo 5 Temas selectos del álgebra lineal numérica 5.1 Problema de los valores propios de una matriz: el método de la potencia 237
Se puede utilizar aquí cualquier norma que sea conveniente: la norma l00 llxll oo =
, TEOREMA 1 Sea [r.] una sucesión numérica convergente al límite r. La nueva sucesión
máx 1:,;;:,;. lxd, por ejemplo. Los cocientes r son los mismos que en la versión no norma
rnrn+1- r�+I
lizadadel algoritmo. (En el problema 2 se pide la demostración de esta aseveración.) s. = (n � O)
r n+2- 2rn+I + r.
Ejemplo 1 Para ilustrar el método de la potencia se tomaron una matriz y un vector inicial de la converge a r más rápido, sirn+I-r = (c+o.)(r.-r) con e
! l< 1 y lím ......00 On =O. En
siguiente forma:
[6 -5] efecto, (s.- r)/(r.- r)-+ O cuando n-+ oo.
lineal $. En la siguiente tabla mostramos los vectores normalizados x'k) y los cocientes + h n+z)- 2(r+h n+I)+ (r +h n )
rk para algunos valores de k: +2- h�+I
hn h n
= r+
-
n+1 2hn+l + n
k=O X = (-1.000000, 1.000000, 1.000000)
h h
(O)
k=I X(!) = (-1.000000, 0.333333, 0.333333) ro= 2.0 Utilizando la hipótesis hn+l =(e+8.)h. se obtiene hn+1 =(e+On+1 )(c+o.)hn y
k=2 pl =(-1.000000,-0.111111,-0.111111) r¡ = - 2.0
k=3 i3) = (-1.000000,-0.407407, -0.407407) hn ( e+8n+1 )( e+ o.)h.- ( e+8.) h� 2
r2 = 22.0 Sn - r = -----------=
k=4 x( l = (-1.000000,-0.604938, -0.604938)
4
r3 = 8.90909 (c+8.+1 )(c+8.)h.-2( +o.) .+ .
c h h
(c+8.+1)(c+8n)- (c+8.) 2
= n
h
rk rk+Z- ri+i
Sk=---�� En consecuencia, podemos computarA.; 1 aplicando el método de la potencia aA-1 . No
rk+2 - 2rk+l + rk es una buena idea computar primero la inversa A- 1 y utilizar después x(k+I) = A- 1 x(k) .
Esta sucesión converge más rápido que la original, todo de acuerdo con el siguiente En vez de ello, podemos obtener x'k+l) resolviendo la ecuación
resultado general (teorema de la aceleración de Aitken). Ax(k+l) = x(k) _
238 Capítulo 5 Temas selectos del álgebra lineal numén·ca 5.1 Problema de los valores propios de una matriz: el método de la potencia 239
Esto se puede hacer con eficiencia utilizando el método de eliminación gaussiana Lo Resumen
único que se necesita es efectuar una vez la fase de factorización de la eliminación
Resumimos estos resultados en la siguiente tabla:
gaussiana y repetir la fase de solución cambiando las partes derechas de x(OJ a x( 1l de x( 1l
a x<2l , y así sucesivamente. Éste es el método de la potencia inversa. Método Ecuación Valor computado
potencia z'k +tl =A:/<l máximo valor propio A1
Ejemplo 2 Ilustramos el método de la potencia inversa con la matriz del ejemplo anterior. Su potencia inversa A..'k+IJ =x( kl mínimo valor propio An
factorización LU es potencia con desplazamiento x(k + 1J =(A -µl)x(<l valor propio más alejado deµ
º]
potencia inversa con desplazamiento (A -µl)x( k+IJ =x'kl valor propio más cercano aµ
6 5 -5 1 O 6 5 -5
[ 2 6 -2] [j
= 1 O [O ] t -t
2 5 -1 l3 .lQ 1
Ll
O O ll
Ll SERIE DE PROBLEMAS 5.1
Comenzamos con el vector x = (3, 7, -13f y computamos 25 pasos del proceso. En l. Sea A una matriz den x n con un conjunto den vectores propios {u'º, u (2l , ... , u'•l }
cada paso obtenemos x<k+ I) resolviendo Ux (k+I) = L- 1x(k) _ Un cociente se computa e linealmente indepediente. Sean Aé1 =;\.;u'" y P la matriz cuyas columnas son los vectores
ulll , ul2l , ... , él. ¿Cómo es p- 1AP?
imprime; a saber, rk =x\k+ I)jx\kl. Antes de avanzar al siguiente paso,x<k+l) se normaliza
(es decir,se divide por su norma f00 ). He aquí un fragmento de los resultados: 2. Demuestre que si las versiones normalizada y no normalizada del método de la potencia
comienzan en el mismo vector inicial, los valores de r en los dos algoritmos serán los
k=O O
x( ) =(
3.000000, 7.000000, -13.000000) mismos.
k=l x(!J =(-0.801653, -0.008264, -1.000000) ro=-5.8889 3. En el método de la potencia sea r¡ = �(x( k+ll)N(x(kl). Sabemos que lím k-oo rk = A. 1 .
k=2 x(2l =(-0.950887, -0.017735, -1.000000) ri = 1.19759 Demuestre que los errores relativos cumplen con
k=3 x(3l =(-0.987589, -0.007125, -1.000000) r2 = 1.02750
k=4 x <4l = (-0.996882, -0.002233, -1.000000) 73 = 1.00446 Tk - A.¡ _ A.2 k
--- ( - ) Ck'
A. [ A. [
k=6 x(6) =(-0.999805, -0.000171, -1.000000) rs = 1.00012
donde los números Ck forman una sucesión convergente (y por ende acotada).
k=11 x(ll) =(-1.000000, 0.000000, -1.000000) r10 = 1.00000. 4. (Continuación) Demuestre querk +t -A.1=(c+o¡)(rk-t..1),donde !el < 1 y límn -oo Ok=O,
de modo que la aceleración de Aitken es aplicable.
El resto de las iteraciones no mostró ningún cambio. 111 5. Demuestre que en la aceleración deAitken, (s. -r)/(r.+2 -r)-. O cuandon-. oo, siempre
que e ;t O.
En esta etapa hemos bosquejado el método de la potencia para computar el mayor
de los valores propios de A y el método de la potencia inversa para computar el valor 6. Cuente el número de multiplicaciones y divisiones implicadas en la ejecución de m pasos
del método básico (no normalizado) de la potencia.
propio más pequeño de A. Si consideramos la matriz desplazada A -µl, podemos lograr
un procedimiento para computar el valor propio de A más cercano a un valor dado µ. 7. Demuestre que en el método de la potencia normalizado, los vectores x(kl convergen a un
Suponga que un valor propio de A, digamos A k, satisface la desigualdad O< IAk -µ < s, 1 vector propio cuando f.1 > O.
donde µ es un número complejo determinado con anterioridad. Suponga que los demás
8. Diseñe una modificación simple para el método de la potencia que le permita manejar el
valores propios de A satisfacen la desigualdad IAi - µ >s. En vista de que los valores
1
siguiente caso: t..1=-�> IAil ¡;; 1"'41 ¡;; · · · ¡;; lt..nl-
propios de A-µ! son los números A;-µ,el método de la potencia inversa se puede aplicar
a A-µ!, obteniéndose como resultado un valor aproximado de (Ak -µ)- 1. Nuevamente, 9. ¿Qué puede usted demostrar acerca de la aceleración de Aitken si la sucesión [r.J sólo
la sucesión de vectores que el método demanda se obtendrá al resolver las ecuaciones satisface la hipótesis lr.+1 - rl � clr. -rl, en donde O< e< 0.2?
(A - µl)x(k+I) = x (kl. La descomposición gaussiana de A - µ! debería computarse 10. Permita que los valores propios de A satisfagan las desigualdades A.¡ > A.2 > · · · > "'• ( todos
una sola vez en este algoritmo. Dado que el procedimiento computa z = (Ak - µ 1, >- ellos reales mas no necesariamente positivos). ¿Qué valor del parámetro� se debe utilizar
podemos recuperar A k de la fórmula Ak =z- 1 + µ. Este algoritmo se llama método de para que el método de la potencia converja lo más rápidamente posible a;\.1 cuando se aplica
la potencia inversa con desplazamiento. a la matriz A +�I?
De manera semejante,podemos computar el valor propio,digamos A k , más alejado 11. Si alguna de las matrices A o Bes no singular, demuestre que I -AB tiene los mismos valores
de un valor dado µ. Suponga que hay una & positiva tal que !Ak - µI >&,para algún propios que I - BA.
valor propio A k de A, y que para todos los demás valores propios A ¡ de A se tiene que
12. Si el método de la potencia se aplica a una matriz real con un vector inicial también real,
O< IA; - µ¡ < &. Al aplicar el método de la potencia a (A - µJ) se obtiene z =A k - µ. ¿qué sucederá si un valor propio dominante es complejo? ¿Se puede aplicar en este caso la
Por consiguiente, A k =z + µ. teoría desarrollada en el texto?
240 Capítulo 5 Temas selectos del álgebra lineal numérica 5.1 Problema de los valores propios de una matriz: el método de la potencia 241
c13_ Aplique el método de la potencia a la matriz del ejemplo 1, tomando como vector inicial al O cuando p --+ oo, y tiende a 1/2 cuando p --+ l. ¿Qué sugiere esto respecto de los valores
vector (1, 2, 3f Desarrolle 100 pasos y explique la convergencia aparente en la etapa inicial propios de las matrices reales?
seguida de otra convergencia posterior a un valor diferente.
24. Para calcular i•l = Akx cuando los valores de k son muy grandes, podemos elevar al cuadrado
14. ¿ Cuál es el polinomio característico de esta matriz? en forma repetida las matrices:
a1 a2 a3 ª•-1 ª• m
1 o o o o A--+Az --+A4 - -+As--+ ... --+Az .
o 1 o o o m
Después, un simple producto matriz-vector produce x(Z l = A2• x. Compare este proce
dimiento con el método ordinario de la potencia. Cuente el número de multiplicaciones
o o o o o que requiere cada método para llegar a p•l. Demuestre que para valores muy grandes de
o o o 1 o m el método de los cuadrados es más económico. Esquematice una manera de evitar el
desbordamiento, escalando las potencias sucesivas de A.
15. Demuestre que para todo número complejo 1. <25. Escriba un programa para la computadora que realice el método de la potencia inversa y
póngalo a prueba con algunas matrices de su elección.
dim{x:Ax = M} =n - rango(A - U)
<26. (a) Escriba un programa que reproduzca en su computadora los resultados que se dan en el
16. Sea A = LU, con L una matriz triangular inferior unitaria y U una matriz triangular superior. ejemplo l. Divida su programa en un número suficiente de subrutinas o procedimientos para
Sea B=UL. Demuestre que B y A tienen los mismos valores propios. el cómputo de cada uno de los segmentos principales del algoritmo. (Por ejemplo, quizá
quiera el lector construir rutinas para: (i) multiplicar matrices y vectores, (ii) el producto
e17. Escriba un procedimiento o subrutina que desarrolle M pasos del método de la potencia punto, (iii) sustituir un vector por otro, (iv) la norma de un vector, (v) normalizar un vector,
normalizado cuando éste se aplica a una matriz A de n x n, a partir de un vector inicial x. y así sucesivamente.)
Incorpore la aceleración de Aitken. En cada paso, imprima el vector x(kl , el cociente rk y el (b) Incluya en su código la aceleración de Aitken y vuelva a ejecutar el programa. Escriba
valor acelerado Sk en curso, según se definieron en el texto. Ponga a prueba el procedimiento las conclusiones que pudo extraer de este proyecto.
con las matrices A - µl, donde
(i) <21. (a) Repita el problema 26 (a) con el ejemplo 2.
[" 1 ¡]
4 5 1 1
A= 1 1 4 2 y µ=O, 3, 6, 11.
(b) Repita el problema 26 (b) con el ejemplo 2.
<28. Escriba y ponga a prueba un programa para la computadora que calcule el valor propio más
1 1 2 4
alejado de un número complejo dado. Ponga a prueba la rutina con la matriz del ejemplo 1
(ii) de esta sección.
2 3 4
A= [7 -1 3] y µ=O, 5, 10. 29. Aproxime el radio expectral p(A) de la siguiente matriz, efectuando dos iteraciones del
1 -1 5 método de la potencia y utilizando la norma infinito para$. Tome (1, 1, lf como vector
inicial.
[ 2 O -1]
18. Suponga que la k-ésima fila de A es tal que r,;=t,¡.k lalil = O. Sea B la matriz que resulta A= -2 -10 O
al eliminar la fila k y la columna k de la matriz A. Demuestre que akk es un valor propio de -1 -1 4
A y que los demás valores propios de A también lo son de B.
Demuestre que cuando$ es una norma, los cocientes rk en el método de la potencia convergen
19. Una matriz de n x n es defectuoS,llf sus vectores propios no generan a iR". Demuestre que a 11.iJ.
1 1 ;¡¡¡;¡,
la matriz A = [ 0 1 ] es defectuosa.
30. Demuestre que para los cómputos, la siguiente forma de la aceleración de Aitken es preferible:
20. Demuestre que si una matriz den x n tiene n valores propios distintos, no es defectuosa.
21. Demuestre que el recíproco del teorema que se enuncia en el problema 20 es falso. Sk =rk - (tird
f:.2 r; '
22. En algunos experimentos se observó que al computar los valores propios de las matrices
reales, los valores obtenidos eran con mucha frecuencia números reales. Demuestre que una donde
matriz real de n x n tiene al menos un valor propio real cuando n es impar.
!::.rk =rk+l - rk !::.2rk =!::.rk+I - !::.rk.
23. (Continuación) Cualquier polinomio real se puede descomponer como un producto de fac·
lores cuadráticos y lineales, pudiendo tener dichos factores cuadráticos raíces complejas. Éstas son las diferencias hacia adelante, las cuales se examinarán en el capítulo 6.
Calcule cuál es la probabilidad de que un polinomio cuadrático real de la forma x2 + ax + b
tenga raíces reales, suponiendo que los coeficientes a y b son variables aleatorias uniforme· '31. Construya un ejemplo que demuestre que la aceleración de Aitken conduce a resultados
mente distribuidas en el cuadrado Jal � p, lb! � p. Demuestre que la probabilidad tiende a insensatos si no se detiene oportunamente.
242 Capítulo 5 Temas selectos del álgebra lineal numérica 5.2 Los teoremas de Schur y Gershgorin 243
5.2 Los teoremas de Schur y Gershgorin más adelante, hay una matriz unitaria U, tal que U x =�i1l. Dado que U es unitaria,
u-1 = u•, y �-lx= u•il) de modo que
Continuamos nuestro repaso de la teoría básica de los valores propios. Recuerde que
dos matrices A y B son semejantes entre s� cuando hay una matriz no singular P tal UAU*/1l = UA�- 1 x =�-1 A.Ux = A./1l.
que B = PAP- 1• La importancia de este concepto surge del teorema que establece que
dos matrices que representan una misma transformación lineal, con respecto a dos bases Esto demuestra que la primera columna de UAU* es Ai1l. Sea Á la matriz que se obtiene
distintas, son semejantes entre sí. al eliminar en UAU* la primera fila y la primera columna. Por hipótesis de inducción,
hay una matriz unitaria Q de orden n -1, tal que QÁQ* es triangular. La matriz unitaria
TEOREMA 1 Todas las matrices semejantes tienen los mismos valores propios. con que se reduce A a una forma triangular es
B=PAP-1•
pues
V=
[�
�Ju,
Vamos a ver que A y B tienen el mismo polinomio característico. Ciertamente,
V AV* = 1 º uAu· 1 º = l 1
det(B-U) = det(PAP-1 - U) [O Q] [O Q*] [O Qº][OA. A
".:'][O Q*º]
= det[P(A-A.J)P-1] º] ["'
= [o1 Q o wQ*] = ["' wQ* ]
ÁQ* o QÁQ*
= detP det(A-A./) detP-1
= det(A-U). En esta ecuación, w es un vector fila de orden n-1, y los ceros representan vectores
nulos de orden n-l . Como la matriz
Hemos incluido dos hechos básicos en este pasaje: el determinante del producto de dos
matrices es el producto de sus determinantes; el determinante de la inversa de una matriz
es el recíproco de su determinante. 11 [� �]
es unitaria, la demostración está completa. 1111
Faétorización de Schur
El teorema 1 sugiere una estrategia para encontrar los valores propios de A: con El lector habrá observado que la demostración que acabamos de ver no es cons
viértase A en una matriz B por medio de una transformación de semejanza, B= PAP-1, tructiva, pues apela a (y hace uso de) la existencia de valores propios, mas no aborda el
y calcule los valores propios de B. Si B es más simple que A, el cálculo de sus valores problema de cómo se pueden calcular.
propios quizá sea más fácil. Específicamente, si B es triangular, los valores propios de B
(y los de A) son simplemente los elementos diagonales de B. Esto nos lleva de un modo COROLARIO 1 Toda matriz cuadrada es semejante a una matriz triangular.
natural al teorema de Schur, según el cual la estrategia precedente siempre será posible
(al menos teóricamente). Recuerde que una matriz U es unitaria si UU* = J. Aquí,
U* denota a la conjugada traspuesta de U: (U*)ij = Úji· El siguiente es el teorema de
COROLARIO 2 Toda matriz hermitiana es semejante unitan·amente a una matriz diagonal.
Schur.
Demostración Si A es hermitiana, entonces A = A *. Sea U una matriz unitaria tal que UAU* es
TEOREJ.'\fA 2 Toda matriz cuadrada es unitariamente semejante a una matriz triangular. triangular superior. En tal caso (U AU*)* es triangular inferior. Pero
Demostración Procedemos por inducción sobre n, el orden de la matriz A. El teorema es trivial cuando (U AU*)* = U**A *u• = U AU*
n = I. Suponga que el teorema ya se demostró para todas las matrices de orden
n-1, y considere una matriz A de orden n. Sea A. un valor propio de A, y x un vector Así, la matriz U AU' es ambas cosas, triangular superior y triangular inferior; por con
propio correspondiente. No habrá pérdida de generalidad si suponemos que [jx[[2 = l. siguiente, se trata de una matriz diagonal. 1
Como es usual, denotamos con /1) al vector unitario estándar /1l = (1, O, ..., 0)1 . Sea
� = x1/[x¡\ si x1 * O, y� = 1 cuando x1 = O. Por el lema 2, que enunciaremos LEMA 1 La matriz I-w* es unitaria si y sólo si J!v[J� = 2 o v = O.
244 Capítulo 5 Temas selectos del álgebra lineal numérica 5.2 Los teoremas de Schur y Gershgorin 245
Demostración Para que la matriz U = I -w* sea unitaria se requiere 3 . Defina a= VZ/[fx-�e(ll [[2, v= a.(x -�eO) ) y U= I -vv*.
4. SeaÁ la matriz que se obtiene de U AU* al omitir la primera fila y la primera
I = UU*= (I -vv*)(l -vv*) columna.
= l -2w* +w*vv* En la sección 3.5 se examinó un proceso análogo de deflación para encontrar las
= I -2vv* + (v*v)(vv*) s,
raíces de un polinomio p. Después de encontrar una raíz, digamos podemos dividir p(x)
por x-s para obtener un polinomio de menor grado con las mismas raíces (excepto s).
= I -(2-v*v)vv*. La mayoría de los métodos numéricos para calcular valores propios computan un
valor a la vez. Cualquier método de este tipo se puede combinar con el procedimiento
(Aquí se movió la magnitud escalar v*v hacia el frente.) Una condición necesaria y de deflación para computar tantos valores propios de una matriz como se desee. No
suficiente para v es que v*v= 2 o vv• = O. 1111 obstante, en la práctica hay que aplicar esta estrategia con cautela, pues la sucesión
de valores propios puede estar contaminada por los errores de redondeo que se van
LEMA 2 Sean x y y dos vectores tales que ffx[[2 = ffy[[2 y (x, y) es real. En este caso hay una acumulando.
matriz unitaria U de la forma I -vv* tal que Ux= y.
Demostración Six= y, tómesev= O. Si x * y,nuestra inspiración nosllevaa suponer quev= a(x-y), Localización de valores propios
con a.= VZ/[fx-yff2. Esta elección de v nos conduce a: En la literatura sobre el tema hay una multitud de teoremas que indican de forma
burda dónde se sitúan los valores propios de una matriz en el plano complejo. El más
2
Ux -y= (I -vv*)x -y= x -w*x -y= x -y -a. cx -y)(x* -y*)x famoso de ellos es el teorema de Gershgorin.
= (x -y)[l -a2 cx*x -y*x)J. TEOREMA 3 El espectro de una matriz A de n x n (es decir, el conjunto de sus valores propios) está
Esta última expresión es igual con cero, pues el factor entre paréntesis es nulo. Para ver contenido en la unión de los siguientes n discos, D;, en el plano complejo:
t
esto, apoyémonos en las hipótesis x*x = y*y y y*x = x*y para calcular:
2i
{7'.. E C: 11-;l..¡-c¡¡I �
.
r,
j=I
jd;i+cijl = t
j=I
lc;ij}
Í*Í Í*Í
t ¿
n
1:i..-:i..¡[ � 1:i..-A.¡-cul +lcul � lc¡¡!+
1 1 1 ,. Eje real i=l
-2 -1 2 3 4 j,,;:i
il
Ejemplo 2 Los discos de Gershgorin para la matriz
se muestran en la figura 5.1. De la figura podemos deducir que todos los valores propios
de A satisfacen la desigualdad !�
11 I � 5. 11111 SERIE DE PROBLEMAS 5.2
l. Encuentre las factorizaciones de Schur de
TEOREMA 4 Si una matriz A se diagonaliza por medio de la transformación de semejanza p- 1AP, y
si B es una matriz arbitraria, entonces los valores propios de A+B se encuentran en la
unión de discos [-� �] y [ i 1i] ·
{1 E e: 17'..-A.¡I � Koo(P) IIBlloo},
t
2. Demuestre que los valores propios de A se encuentran en la intersección de los siguientes
donde 7'..1, 7'..2, ..., A.n son los valores propios de A y K00 (P) es el número de condición conjuntos D y E:
de P.
D = � {z E IC: Jz-a¡¡J ;;; lalfl)
t
Demostración Vamos a demostrar un resultado, en cierto modo más preciso. Si p- 1AP = D, la
{"
J"
diagonal de la matriz diagonal D consta de 7'.. 1 , 12, ... , 1n . Escribiendo "esp" por
espectro, tenemos:
Aplicando el teorema de Gershgorin a D + C, con C = p- 1 BP, concluimos que el 3. Demuestre que si).. es un valor propio de A, entonces hay un vector x distinto de cero, tal
espectro de A+ B se encuentra en la unión de los discos de Gershgorin de D + C, los que?A= A.Xr . (Aquíxr denota un vector.fila.)
248 Capítulo 5 Temas selectos del álgebra lineal numérica 5.2 Los teoremas de Schury Gershgorin 249
4. Demuestre que cuando A es hermitiana, la técnica de deflación da lugar a una matriz hermi 22. Demuestre que si a2 + b2 = 1 y c2 + d2 = 1, entonces la siguiente matriz es unitaria:
tiana.
ad ac b]
5. Demuestre que si la j-ésima columna de la matriz A satisface ag = O para i * j, entonces ªii [bd be -a .
es un valor propio de A. e -d O
6. Una matriz normal es aquélla que conmuta con su adjunta: AA• =A·A. Demuestre que si
A es normal, también lo es A - 'J.../ para todo escalar 7'.. Observe que podemos tomar a = sene, b = cose, e = sen $ y d = cos $ con e y $
arbitrarios.
7. Suponga que A es normal y que x y y son vectores propios de A correspondientes a valores
propios distintos. Demuestre que x•y = O. 23. Demuestre que si x es un vector que satisface = 1, entonces hay una matriz unitaria
cuya primera columna es x.
8. Demuestre que si A es normal, A y A· tienen los mismos vectores propios.
24. Sea JlxJl2 = 1 y U = l - 2xx·. Demuestre que U2 = l.
9. Demuestre que si A es normal, la condición AB = BA implica que A• B = BA •.
25. Sean A den x n, Bdem xm y C den xm. Demuestre que si el rango de C esmy AC = CB,
l O. Demuestre que si x y 7 son puntos de IC" que tienen la misma norma euclidiana, entonces entonces
hay una matriz unitaria U, tal que Ux = y. esp(B) e esp(A).
1 1. Demuestre o refute: si {xi, x2, ... , Xk} y {y1 , y2, ... , Yk} son conjuntos ortonormales de IC", 26. Si x*x=2,¿qué es (l-xx* )- 1 ?
entonces hay una matriz unitaria U, tal que Ux, = y, para 1 ;; i ;; k.
27. Sea x*x = l. Determine si I - xx* es invertible.
12. Demuestre que si (l - vv")x = y para alguna terna de vectores v, x, y, entonces (.x, y) es real.
28. Demuestre o refute: Si A es una matriz cuadrada, entonces hay una matriz hermitiana unitaria
13. Encuentre las condiciones precisas que deben satisfacer dos vectores u y v para que l - uv• U, tal que U AU es triangular.
sea unitaria.
29. Demuestre, sin calcularlos, que los valores propios de la matriz
14. Sea Q una matriz unitaria. Demuestre que
[6 2 1]
IIAll2 = II QAll2 = IIAQ ll2, A= 1 -5 O
2 1 4
15. Sea A una matriz diagonal. Demuestre que
satisfacen la desigualdad 1 ;; 17'.J;; 9.
IIAll2 = máx la¡¡I. 30. Demuestre que las partes imaginarias de los valores propios de la matriz
l�t�
16. Demuestre que si A es una matriz cuadrada, entonces IIA lli;; IIA"All2 ,
17. Denote con A¡ laj-ésima columna de A. Demuestre que IIA¡ll2 ;; IIAll2. Es esto cierto para
todas las normas matriciales subordinadas?
[! -1 _!]
2 2
[
matriz es igual a la suma de sus valores propios. (El teorema de Schur puede ser útil en este 3 1. Encuentre la factorización de Schur U AU* = T de la matriz
caso.)
19. Demuestre que si 7'.1 , 1'.2, ..., 7'.. son los valores propios de A, la traza de Am es 2.888 0.984 -1.440]
A= 1.184 3.312 -1.920
tr(Am) = 7'.f +7'.i + · · · +7'.:. -0.160 2.120 -0.200
20. Demuestre que si los valores propios de A satisfacen J1'. 1 I > J7'.¡J para i = 2, 3, ... , n, entonces 32. Demuestre que l -xx• es singular si y sólo si x·x= l. Encuentre la inversa en todos los
casos en que la matriz es no singular. (Véanse los Probs. 24, 26 y 27.)
33. Si Ja,, - 7'.J > "�-i .. Ja,¡I, entonces la matriz A -7'.l es diagonalmente dominante. Apo
1'.1 = lím tr(Am+1 )/ tr(Am ). i...J1- ,J$t
m-oo yándose en esta idea, demuestre el teorema de Gershgorin.
2 1. Demuestre que AB y BA tienen los mismos valores propios cuando A y B son matrices 34. Sea u un vector arbitrario y U = l -7'.uu*. Encuentre todos los valores complejos de 7'. para
cuadradas. los cuales U es unitaria.
250 Capítulo 5 Temas selectos del álgebra lineal numérica
*5.3 Factorizaciones ortogonalesy problemas de mínimos cuadrados 251
35. Suponga que la matriz A es semejante a una matriz B casi diagonal. ¿Podemos concluir
que los valores propios de A son muy próximos a los elementos de B sobre la diagonal? Con esto queda establecido que para todax E IC"
Demuestre un teorema acerca de esto, e investigue el problema cuando B es casi triangular.
n
36. Sea A una matriz de n x n y sean D1, D2, ... , Dn sus discos de Gershgorin. Suponga que x = ¿(x,v;)v;.
un valor propio ). se encuentra en Dk pero en ninguno de los otros discos. Sea x un vector (1)
i=l
propio correspondiente a J.. Demuestre que lxd > lx;! para i e;, k.
37. (a) Bosqueje los discos de Gershgorin para la matriz El término(x,v;)v; se conoce como la componente de x en la dirección v;. En la figura
5.2 mostramos un esquema de esta situación en 12.
[ O 2 -1]
-2 -10 O
-1 -1 4 r(X,V¡)V¡
una base ortonormal del espacio generado por {xi,x2,... ,xk},para k � l. tg +- 11Cj 112
Bj +- t/Cj
Demostración Procedemos por inducción sobre k. Si k = 1, por la ecuación (2) tenemos que end.
u¡ = Cllx1 ll2)-1x1. TEOREMA 2 Si se aplica el proceso de Gram-Schmidt a las columnas de una matriz A de m x n de
rango n, el resultado es una factorización
Por lo tanto, el conjunto {u 1} es ortonormal, y el espacio generado por él es idéntico
al espacio generado por {x1 }. Observe que 1Jx 1 Jlz "f:. O, pues el conjunto {x 1, x2, ...} es A = BT, (4)
linealmente independiente.
Suponga, como hipótesis de inducción, que {u¡,uz,... ,Uk- } es una base orto en donde B es una matriz de m x n con columnas ortonormales
normal del espacio generado por {x 1, x2, . . . , Xk- l} (espacio que I denotamos con y T es una matriz de
n x n triangular superior con diagonal positiva.
sp{x¡,xz,... , Xk- l} por su nombre en inglés span). Sea
V = Xk - ¿(xk,U¡)u¡. (3) Demostración En primer lugar, observe que el algoritmo anterior lleva a cabo el proceso de Gram
Schrnidt que está encapsulado en la ecuación (2). Acto seguido, concluimos la definición
de la matriz T haciendo tif = O, para i > j. Por el teorema l, las columnas de B constituyen
i<k
Entonces v es ortogonal a u¡, u2, ..., Uk-1, pues paraj < k, un conjunto de n vectores ortonormales de Rm , y cada Aj es una combinación lineal de
B 1, B2, ... , Bj , De hecho, por la ecuación (1),
(v, uj) = (xb uj) - ¿(xb u;)(u;, U¡')
L(Aj, B )B = L (A ,B )B + (A ,B )B
j
Aj =
j-1
i<k
L tgB + (A ,Bj}B ,
j-1
=
Cuando v = O podemos ver, por la ecuación (3), que xk E sp{u1, u2, ... , Uk-¡}. Ha- ¡ j j (5)
ciendo uso de la hipótesis de inducción concluimos que Xk E sp{x1,x2,... , Xk-¡}, lo
i=I
son linealmente independientes (los dos generan espacios de dimensión k), tenemos que = (Cj, Cj)/tjj = tjj,
sp{u1, u2,...,uk} = sp{x¡,Xz,... , xk}-
(6)
11
Si utilizamos el resultado de la ecuación (6) en la ecuación ( 5), obtenemos
Cuando el proceso de Gram-Schmidt se aplica a las columnas de una matriz, se
puede interpretar el resultado como una factorización matricial. En este caso, los pro j n
ductos internos que aparecen en el cálculo se pueden guardar en una matriz que será Aj = ¿tifBi = ¿tif Bi (l�j�n). (7)
uno de los factores. Aplicamos el proceso a las columnas A 1 , A 2 , ... , A n de una matriz
A de m x n, y llegamos finalmente después de n pasos a una matriz B de m x n cuyas
i=I i=I
columnas constituyen un conjunto ortonormal. He aquí el algoritmo Gram-Schmidt Ésta es otra manera de escribir la ecuación (4).
11
254 Capítulo 5 Temas selectos del álgebra lineal numérica *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 255
Demostración Para demostrar este teorema, escribimos el algoritmo de modo que las cantidades se = tkA - tkj dk = o
conserven en vez de sobrescribirse. Si no se hiciera esto, en una demostración formal, Aj
seria ambigua, ya que denotarla vectores distintos en las diferentes etapas del algoritmo. Resulta de la demostración inductiva precedente que A(n) es verdadera Esto
.
Reetiquetamos el conjunto original como {A\1\All, ...,A�1l}. El algoritmo es ahora el s1gruºfica que s1. i. < n, (A¡(n), A1(n)) = diºif
O .
. As1,, e1 conJunto {A(n1 ), A2(n), ... , An(n)}
siguiente: es ortogonal. Si B es la matriz cuya j-ésima columna es Aj"), entonces B* B =
T
Capítulo 5 Temas sele ctos del álgebra lineal numérica *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 257
256
diag(d1, d2, ••. , d.). Sea tkk = 1 y t1q = O si k > j. Para ver que A= BT, observe Si la matriz A de m x n es de rango n, entonces A•A es una matriz de n x n no singular
que la k-ésima columna de A está dada por (Prob. 2) y sólo hay una so lución de mínimos cuadrados, que se determina res olviendo
un sistema no singular de n x n, el de las llamadas ecuaciones normales:
Ak = A11l = (A11l -A1 l)+ (A1 l -Afl)+ · · ·+ (A�-l l -A1 l ) + A�
2 2 k l
(9)
-tlkA(¡!)+ t2k A2(Zl+ · • '+ tk-1,k Ak(k--1 )+ tkk Ak(
1 kl A*Ax=A* b.
e O O 1+e2 1 1
Aquí, A es de m x n, x es de n x 1 y b es de m x l . Supondremo s que el rango de A es A= [ l A*A= [ 1 l+e2 1 ] .
n, de lo que resulta que m � n. Por lo genera l, el sistema (8) no tiene solución debido a 1 1 l+e2
O e O (10)
O O e
que b no pertenece al subespacio de c de dimensión n, generado por las columnas de
s que se requier a encontrar una x que minimice la norma
m
A. Es frecuente en tales as
En A, el parámetro e distinto de cer o evita que el rango de A sea 1. En A•A es sólo e2
del vector residual b -Ax. La "solución" en mínimos cuadrado s de (8) es el vector x
c o
lo que evita que la matriz tenga rango 1. Así, la no singularid ad de A*A es una cuestión
que hace de llb -A xl12 un mínimo . (Según lo que hemos supuesto acerca del rango de
mucho más delicada cuando e es muy pequeña Por supuesto que en una computadora,
A, esta x será única)
podemos tener que A es de rango 3 y A• A de rango 1.
LEMA Si x es un punto tal que A• (Ax -b) = O, entonces x es una solución del problema de los
mínimos cuadrados. Factorización QR de Householder
Vamos a ocuparnos ahora de la más útil de las factorizaciones ortogonales, a saber,
Demostración Sea y cualquier otro punto. Dad o que A*(Ax -b) = O, conclui mo s que b - Ax es
o rtogonal al espacio co lumna de A. Es más, como A(x -y) está en el espacio co lumna
una debida a Alsto n Householder, que lleva su nombre. La idea es factorizar una matriz
de A, tenemos que (b -Ax, A(x - y)) = O, y la regla pitagórica no s da de m x n como un producto
A=QR,
\\b -Ay l\i = l\b- Ax+ A(x -y)l\i = llb -Axll�+ IIA(x - y) I\� � l\b -Axl\i· 11 donde Q es una matriz unitaria de m x m y R es una matriz triangular superior de m x n.
En realid ad, el algoritmo de factorizac ión produce
Si A se ha factorizado en la forma A = BT , tal como se describe en el teorema
anterior, la soluci ón en mínimos cuadrad os del sistema Ax = b será la solución exacta
del sistema de n x n
Q*A=R,
La matriz (B*B)- 1 es la matriz diag(d1 , tt¡ , ... , d,;- ), y los números d¡ so n lo s que Éstas se llaman reflexiones o transformaciones de Householder. Acerca del rango de
Gram-S hmidt. Como hemos señalado A no suponemo s na da.
1
ad de
1 1
Otra manera de abordar el problema de los mínimos cuadrado s asociado al si stema sea unitaria de manera que ([ -vv*)A empiece a parecerse a R. Específicamente,su
Ax = b co nsi ste en utilizar directamente el lema anterior. Así, la cantidad I\Ax - b\l2 primera co lumna debe tener la forma correcta, a saber,(�, O, O, ... , Ol. Denotemos la
será un mínimo si primera columna de la matriz inicial A con A ¡ . Queremo s que (l-vv*)A¡ = �e . Según
A*(Ax- b) = O. la demostración del lema 2 de la sección 5.2, esto se lleva a cabo como sigue: primero,
( l)
258 Capítulo 5 Temas selectos del álgebra lineal numérica *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 259
elegimos un número complejo � tal que l�I = IIA 11 h y (A 1, �eOl ) sea real. Después, producto de todas las matrices unitarias que se han utilizado como factores. Dado que Q
hacemos v = a(A1 - �eOl) con a = V2/IIA 1 - �/1)112- Esta descripción admite dos es unitaria, A = QR, tal como se quería. Ésta es la factorización QR de Householder.
elecciones de �, y nosotros elegimos aquella para la que haya menos cancelaciones al La ecuación Q* = Un-1Un-1 . . . U 1 nos lleva a Q = Ui U2 · · · u;_1. Por la fonna
computar la primera componente de v. Para entender cómo se hace esto, escriba los de Uk,
números complejos � y a11 en forma polar: U k = Ik-1 O
[ O ln-k+l - vv*]
� = IJA 1 Jliil> a1 1 = la 11 Jei8 . podemos ver que U k es herrnitiana (U¡ = U k), por lo que
Tenemos que Q = U1 U2··· Un-1·
(A1 , �i1l ) = a11� = la 11 J IIA 1 l 2iHl.
Ejemplo Ilustramos la factorización QR con la matriz
Éste debe de ser un número real, de modo que 9 - � es O o 1t. Si elegimos 9 - � = 1t, la
primera componente de v no tendrá cancelación sustractiva, pues 63 41 -88
42 60 51
9-
A = [ O -28 56] .
- �) = a(la 1 iieí9 - l�lei( "l) = a( la 11I + l�l)e .
i8
V¡= a(a 11
126 82 -71
Así, definimos � de la siguiente manera: En el primer paso computamos �, el cual puede considerarse como - IJA 1 11 2 , pues A 1 es
real:
� = - JIAi[[2 ei8 = - IIAill2 a1 1 /Ja 11 J- � = - IIA 1 lli = -11(63,42,0,126fll2 = -147.
El algoritmo para construir la matriz U en esta primera etapa es el siguiente: Después computamos a:
1
a = V2/IIA 1 - �/ llJ2 = V2/IJ(210,42, O,126f ll2 = 2 lv70
1
� <- -(a 11/la 11 l)JJA 1 lh ¡;,;:¡ .
!} ,
-5145 -3675 2940
uku k -1 ··. U1A = [ � U 1A = � [
O 1078 2989
.
35 O -980 1960]
donde J es una matriz triangular superior de k x k, O es la matriz nula de (m - k) x k,
o -196 1127
H es de k x (n - k) y W es de (m - k) x (n - k). Por el análisis previo, hay un vector En el segundo paso, los cálculos correspondientes son:
v E cm -k tal que I - vv* es una matriz unitaria de orden m - k con la propiedad de
que (J - vv*)W tiene ceros debajo del elemento inicial en su primera columna. Observe � = -11(30.8, -28, -5.6/112 = -42
ahora que
a = V2/Jl(72.8,-28,-5.6/IJ 2 = 0.018085
[� I -ºvv• ][� !] = [ � (/ - �v*)W]·
V= a(l.3[66, -0.50637, -0.10127)
7
En esta ecuación, el primer factor a la izquierda es unitario y lo denotamos con U k+l· -0.73333 0.66667 0.13333
El proceso termina cuando la columna (n - 1-ésima) de R queda en la fonna I - vv* = [ 0.66667 0.74359 -0.05128 ] .
apropiada. En ese momento tenemos una ecuación Q*A = R, donde Q* denota el 0.13333 -0.05128 0.98974
260 Capítulo 5 Temas selectos del álgebra lineal numérica
63 41 -88 ¡-·
*5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados
2 10 16 - -5
1]
261
[ ] -
14 -14 -7]
¡ 7
-
El segundo factor unitario es por consiguiente:
l
42 60 51 -6 -15 -12 -6 O -2
= o -5 11
l. o. o. o. -28 56 O O
o. -0.73333 0.66667 0.13333 12� 82 -71 -18 4 -1 10 O o o
U2 = o. 0.66667 0.74359 -0.05128
[o.
l
0.13333 -0.05128 0.98974 SERIE DE PROBLEMAS *5.3
y tenemos que l . Demuestre que six;: y y (xy), es real, entonces la matriz U = I - vu* es unitaria y satisface
-147. -105. 84. la igualdad Ux = y, donde v = x - y y u= 2 v/llvllf Explique por qué éste es un mejor
o. -42. -21.
método para construir las transformaciones de Householder.
U2U1A = o. O. 96.9231
. 2. Demuestre que si A es una matriz de m x n de rangon, entonces A•A es no singular.
[ o. O. 40.3846 3. Demuestre que si A es una matrizdem xn de rangon, entonces A*A es hennitiana y definida
positiva.
En el último paso, los cómputos correspondientes son:
'4. Programe el algoritmo de Gram-Schnúdt y el algoritmo modificado de Gram-Schnúdt, y
pruébelos para ver cuál es mejor. La primera prueba podría comprender una matriz de
� = -11(96.9231,40.3846)% = -105 20 x 10 con elementos aleatorios uniformemente distribuidos en el intervalo [O, !]. La
segunda prueba podría comprender una matrizde 20 x 1O con elementos generados por una
a= v2;11c201.9231, 40.3846)% = 0.0068677 función elemental como, por ejemplo,
l
de las pruebas de este tipo, vea Rice (1966].
Por consiguiente, el tercer factor unitario es:
5. Sea { u1, u2, .•. , u.} una base ortonormal de un espacio X con producto interno. Demuestre
l. o. o. o. que parax, y E X,
n
o. l.
U3 = O. O. -0.92308 -0.38462
o.
.
o. (a) llxJJ� =¿i=l
1 (x,u;) J
2
-
6. Sea X un espacio con producto interno, U un subespacio de X y {u1, u2, ... , u.} una base
-147. -105. 84.
5 4]
= 21 ¡-7
ortonormal de U. DefinaP: X .... U con la ecuación Px = ¿;;=1 (x, u;)u;. Demuestre que:
O. -42. -21. o -2 -1 (a)P es lineal
R=
o. o. -105. O O -5
l
(b) P es idempotente (es decir, P2 = P)
[ o. o. O.l O o o (c)Px=xpara todax E U
(d) jjPxJl2 � Jlxll2 para todax E X
Por último,
(La transformación P se llama proyección ortogonal de X sobre U.)
-0.42857 -Q28571 o. -0.85714
¡-·
7. ¿A qué es igual el determinante de una matriz unitaria? ¿A qué es igual el determinante de
una matriz ortogonal?
*_
Q -
U3 U2 U1
_
-
¡ 0.09524 -0.71429 0.66667 0.19048
0.47619 -0.57143 -0.66667 -0.04762 8. ¿Qué condición es necesaria y suficiente para que un conjunto ortogonal sea linealmente
-0.76190 -0.28571 -0.33333 0.47619 independiente? Demuestre que todo conjunto ortonormal es linealmente independiente.
-6 O -18 9. Sean u y x fijos. ¿Qué valor de t hace que Jiu- ttll 2 sea un núnimo? (La respuesta debe de
ser válida en el caso complejo.)
1 2 -15 14 4
-1 ]
= . 10. Demuestre que la matriz con elementos (x,; YÚ es unitaria cuando {x1,x2, ... ,x.} y {y1,
21 10 -12 -14 y2, . . . , y.} son bases ortonormales de C".
-16 -6 -7 10
11. Una matrizA se llama involución o se dice que es involutoria cuando A2 = l. Encuentre
Podemos verificar que A = QR; es decir, una condición necesaria y suficiente para que una matrizI - uv* sea una involución.
262 Capítulo 5 Temas selectos del álgebra lineal numérica *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 263
12. Sea v*v = 2. Demuestre que la matriz particionada c23. (Continuación) Escriba una subrutina o procedimiento para resolver un sistema de ecua
ciones Ax = b en el sentido de los mínimos cuadrados. Este procedimiento deberá hacer
llamados, es decir, referirse a el procedimiento del problema anterior.
[� l-ºvv·] 24. Demuestre que al resolver el problema de los mínimos cuadrados para la ecuación Ax = b,
podemos reemplazar las. ecuaciones normales por CAx = Ch, donde Ces cualquier matriz
es una involución. (Véase el Prob. 11.)
de n x m equivalente de filas a Ar.
13. ¿Es el producto de dos matrices involutorias una involución?
25. Sea A una matriz de m x n de rango n. Sea b cualquier punto de IRm . Demuestre que los
14. Si U y V son matrices unitarias, ¿se sigue de ello que conjuntos
K,. = {x E llt': [[Ax- b[[2 � A}
[g i] son cerrados y acotados. (Las normas en IRm y JR" pueden ser arbitrarias.)
es unitaria? 26. (Continuación) Asuma las mismas hipótesis que en el problema anterior. Demuestre que
si A = 2[[b[[2, entonces
15. (a) Demuestre que el conjunto de matrices unitarias (de un orden dado) es un grupo multi ínf [[Ax- b[[2 = ínf [[Ax - b[[2.
plicativo. xEltn :EKt
(b) Demuestre que el conjunto es cerrado bajo las operaciones A .... Ar, A* y A. 27. (Continuación) Si A es una matriz de m x n de rango n, entonces la solución en mínimos
16. Utilice el algoritmo de Householder para determinar la factorización QR de cuadrados de Ax = b satisface la desigualdad
[ -�O -�-4]
[[x[[2 � 2[[b[[2 [[Bl[2,
Demuestre que F(x) alcanza un mínimo cuando x es una solución de la ecuación 31. Dé un ejemplo de vectores x y y para los cuales (x, y) � O y [[x + y[[ i = [[x[[i + IIYll?-
r
32. Sea AB = Q donde Q es de m x n, B de n x n y Q*Q = l. Demuestre que QQ* es la
(A A+al)x=Ar b. proyección ortogonal de IRm sobre el rango de A. (Véase el Prob. 6.)
Demuestre que cuando x se define de esta manera, 33. Encuentre la solución en mínimos cuadrados del sistema
20. Sea Duna matriz diagonal y U una matriz unitaria. ¿Qué hipótesis adicionales sobre D se
necesitan para inferir que DU es unitaria? 34. Se afirma que en el problema precedente la solución es (29/21.-1/3( ¿Cómo se puede
verificar esto sin resolver el sistema para x y y?
21. Si U y AU son unitarias, ¿qué se puede concluir acerca de A?
35. Sea A una matriz de (n + 1) x n y rango n, y sea z un vector no nulo ortogonal a las columnas
'22. Escriba una subrutina o procedimiento que lleve a cabo el algoritmo modificado de Gram de A. Demuestre que la ecuación Ax + A.z = b tiene una solución en x y A. Demuestre
Schmidt. El dato de entrada de la subrutina será una matriz A de m x n de rango n, y los además que el vector x que se obtiene de esta manera es la solución en mínimos cuadrados
datos de salida serán las matrices By T. de la ecuación Ax = b.
1
L
264 Capítulo 5 Temas selectos del álgebra lineal numérica *5.4 Descomposición en valores singulares y seudoinversas 265
36. Para mostrar el efecto de los errores de redondeo cuando se usa el método de Gram-Schmidt Demostración La matriz A•A es una matriz hermitiana de n x n. También es semidefinida positiva,
no modificado, Noble y Daniel (1977] dieron el siguiente ejemplo. Sea E un número positivo pues
muy pequeño, tal que 1 + E y 3 + 2E son números de máquina, pero 3 + 2E + e2 se computa x'(A.A)x = (Ax)*(Ax);;; O.
como 3 + 2E. Aplique el proceso de Gram-Schmidt a los 3 vectores:
[3 2 3]
Elegimos vectores adicionales V¡ de modoque {V¡, v2, ..., vm} sea una base ortonormal
4 5 6 · de c . Sea P la matriz de m x m cuyas columnas son v 1, v2, ..., V . Sea D la matriz de
m
m
m x n que tiene cr1, cr2, ... , cr, en la diagonal y ceros en los lugares restantes. En tal
41. Programe y ponga a prueba la factorización de Householder.
e caso
42. Determine Koo(A) y K00 (A.A) utilizando las matrices de la ecuación (10). ¿Qué sucede A=PDQ.
cuando e --+ O? Para demostrar esto vamos a ver que
P*AQ* = D.
La descomposición en valores singulares es otra factorización matricialque tiene muchas Cuandoj ;;; r+ l , esto es igual a cero. En cambio, sij � r, el término es v1crjVj = O'jOij .
aplicaciones. Comenzamos su estudio con un teoremaque describe su fonna y asegura 1111
su existencia.
Los números cr 1, cr2, ... , cr. (que se toman no negativos) son llamados valores sin
TEOREMA 1 Toda matriz compleja A de m x n se puedefactorizar en la forma gulares de A. Son, por consiguiente, las raíces cuadradas no negativas de los valores pro
pios de A•A. La factorización A = PDQ del teorema anterior es una descomposición
en valores singulares.
A=PDQ, Observeque en la demostración hay algunos pasos en losque se hicieron elecciones
arbitrarias. Por ejemplo, el ordencr1, cr2, ... , crres arbitrario, y los vectores Vi+!, V¡+2, ••• ,
donde P es una matriz unitaria de m x m, D una matriz diagonal de m x n y Q una Vm dan lugar a cierta elección. Por consiguiente, una matriz siempre tendrá muchas
º]
Ejemplo 1 Encuentre una descomposición en valores singulares de la siguiente matriz: Hay cierto grado de libertad en la elección de v3 y v4• La más simple es
= (0 = (O
l
7OO V3 1,
O,, O)* V4 O, 1 )*.
, O,
º] [ º] [º
A O
[ 3OO .
=
º] º] º]
formamos las matrices: Para las matrices de m x n de la forma
1 OO O"¡
1O 7OO 0-2
p= [ o ¡ o Q O 1 OO
D = O
[ 3OO [ O1 O .
=
O O 1 o o o o O
OOO1 D= O"r
o
º ] [� º]
El lector podrá verificar que otra descomposición en valores singulares de A es
7OO 1 3OOº ] [º
¿ o o
.
º] o
11 donde cr; O,
> definimos la seudoinversa como la matriz den x m
o
0300=10
[ O 0700
[ 00O1
OOOO OO -1 OOOO -1
OO1 O O"¡
-1
O"z
Ejemplo 2 Encuentre una descomposición en valores singulares de la matriz
o -1.6o.6 D+
= cr-r 1
O 1.20.8 o
[ o o o] .
o o o o
º]
Respuesta Seguimos nuevamente la demostración del teorema. Encontramos que En ambos casos, los elementos de la matriz que no se muestran son ceros. La seudoin
versa de una matriz general A se define tomando primero una descomposición en valores
o o singulares
[ 4O
A*A=O A PDQ,
=
O O 1
para después poner
+
y hacemos o-=1 1, o-=
2 2 y o-=
3 O. (Hayotro orden posible.) Eligiendo vectores
A
= Q*D +P*.
propios y formando Q, tenemos que ( ntre
e otras elecciones posibles) Más adelante veremos que aunque la descomposición en valores singulares no es única,
o o 1] la seudoinversa de una matriz sí lo es.
[ 1
Q O
= - O Ejemplo 3 ¿Cuál es la seudoinversa de la matriz A del ejemplo
1?
1 OO
!]
Respuesta Como en este ejemplo P Q
y son matrices identidad, resulta de inmediato que:
y
r1 o
= Au=
V¡ ¡ 0
( 0.8,
.6, O,
O)*
O r1
A+ [
= �Au2 = 0
o o
= 1111
v2 ( .8,0
- O,
.6,O)*. o o
268 Capítulo 5 Temas selectos del álgebra lineal numérica *5.4 Descomposici6n en valores singulares y seudoinversas 269
Ejemplo 4 Encuentre la seudoinversa de la matriz A del ejemplo 2. En la medida en que x recorre todo en, también y lo hace, pues Q es suprayectiva; es
Respuesta Los resultados del ejemplo 2 nos dan:
decir, se transforma C" sobre e•. Por consiguiente:
[º
O l l O o º º' 08 00]
0.8 -0.6 O O
p = ínf JJAx -bJJ2 = ínf JJPDQx -bJJ2 = ínf JJ?*(PDQx -b)JJ2
A+= O -1 O ][O 0.5 o O l[ = ínf JJDQx -?*bJJ2 = ínf JJDy-cJJz.
X X
O
X
1 O O O O O o O 1 O
O O O 1
X
o o o
= [-0.4 0.3 O O
0.6 0.8 O O JJDy-cJJ� = ¿(cr;y; - d + ¿ e¡.
111 m
i=l i=r+l
Esta cantidad se minimiza tomando y;= c¡/cr; para 1 � i � r y permitiendo que Yr+l,
Sistemas inconsistentes y sistemas indeterminados
Las seudoinversas se aplican principalmente a sistemas de ecuaciones inconsistentes Yr+2 , ..., Yn tomen valores arbitrarios. Así,
o que tienen soluciones no únicas. Considere un sistema de ecuaciones escrito en forma
matricial como:
p=
( m )1/2
Ax=b,
donde A es de m x n, x es de n x 1 y b es de m x l. Se define la soluci6n mínima del
i�/
sistema como sigue: Entre todos los vectores y que dan un valor mínimo p, el de menor norma corresponde
a Yr+l = Yr+2 = · · · = Yn = O. Este vector viene dado por
(a) Si el sistema es consistente y tiene una única soluciónx, la solución mínima
esx.
(b) Si el sistema es consistente y tiene un conjunto de soluciones, la solución
y =D+c.
mínima es el elemento que tiene la menor norma euclidiana Por lo tanto, la solución mínima a nuestro problema es:
(c) Si el sistema es inconsistente y tiene una solución únicax en mínimos cuadra
dos, la solución mínima esx. X=Q*y = Q*D+ c = Q*D+rb=A+b. 11111
(d) Si el sistema es inconsistente y tiene un conjunto de soluciones en mínimos La seudoinversa juega el mismo papel respecto de los sistemas inconsistentes o
cuadrados, la solución mínima es el elemento que tiene la menor norma eucli indeterminados que la inversa respecto de los sistemas invertibles. Cabe señal·.rr que la
¡
diana. solución mínima de cualquier ecuación Ax=b es única, pues el conjunto K es convexo
Una definición alternativa es la siguiente. Sea y tiene un único elemento con norma mínima.
X=XAX (ii)
Con un razonamiento similar demostramos que v+ tiene las otras tres propiedades de
= XAYAX (i) Penrose en relación a D. Después, es muy fácil demostrar que A+ tiene las cuatro
=XAYAYAYAX (i) propiedades. Por ejemplo, la primera de ellas se demuestra como sigue:
=( XA)*( YA)*Y(AY)*(AX)* (iv) y (iii)
AA+A=PDQQ*D+P*PDQ
=A*X*A*Y*YY*A*X*A*
=(AXA)*Y*YY*(AXA)* =PDD+DQ
=A*Y*YY*A* (i) =PDQ=A.
= ( YA)*Y(AY)*
Las propiedades restantes se dejan como ejercicio para el lector. 11111
= YAYAY (iv) y (iii)
= YAY (ii)
Teoremas sobre la descomposición en valores singulares
=Y (ii) 111
TEOREMA 5 SiA tiene una descomposición A=PDQ en valores singulares tal como se describe en
Este teorema fue enunciado por R. Penrose [1955], y las condiciones (i)-(iv) se el teorema 1, entonces
conocen como las propiedades de Penrose. (a) el rango de A es r
(b) {u,+1, Ur+2, ... , un} es una base ortonormal del espacio nulo de A
TEOREMA 4 La seudo inversa de una matriz tiene las cuatro propiedades dePenrose. Por consiguiente,
cada matriz tiene una única seudoinversa. (c) {v 1, v2, ..., v,} es una base ortonormal del recorrido de A
(d) IIAll2=máx1�i�n lcrd
Demostración Sea A una matriz y sea
A=PDQ Demostración Puesto que P y Q son no singulares, A y D tienen el mismo rango, que es r.
Sir < i � n entoncesAu, = O, como se demostró en el teorema l. Dado que el rango
su descomposición en valores singulares. Se sigue que
de A es r, el espacio nulo de A tiene dimensión n - r. Por lo tanto, { u,+1, u,+2, •.• , un }
es una base del espacio nulo.
A+= Q*D+P*.
Como el rango de A es r, su imagen tiene dimensión r también. Tal como se
Si A es de m x n, también D lo es y tiene la forma demostró en el teorema 1, v ¡ = cr ;- 1Au, y {v1, v2, ... , v,} es una base ortonormal de la
imagen de la matrizA.
_ { CJ¡ si i=j � r En vista de que P y Q son matrices unitarias, operan como isometrías (es decir,
D9·· - mapeos que preservan la norma de un vector) sobre cm y en respectivamente. Por
O de lo contrario.
272 Capítulo 5 Temas selectos del álgebra lineal numérica *5.4 Descomposición en valores singulares y seudoinversas 273
'f,r; =
SERIE DE PROBLEMAS *5.4
= . 1 sup {crIYf + · · · +cr�y�: 1} l. Encuentre las descomposiciones en valores singulares de las matrices siguientes:
4
º]
1=!
[Oo OoO 7o
o o o
[2 1]
[_¡J.
= máx lcrd 11 2. Encuentre las soluciones núnimas de los siguientes sistemas de ecuaciones:
!�i�n
=
Una interpretación geométrica de la descomposición en valores singulares es inhe
(a) x1 +x2 b1 4X¡ :b¡
=
rente a la demostración del teorema l. En el siguiente teorema se expone una interpre
X¡ =b¡ Ox1 b2
(b) {x1=b2 (c) ?xi= bi
{
tación más fácil de visualizar. X¡ =b¡ Ox2 = b4
TEOREMA 6 Sea Luna transformación lineal de cm en IC". Hay bases ortonormales {u1, u2, ••• , um } 3. Encuentre A en el caso en que AA• es invertible.
+
de cm y {V¡, Vz, .. :' Vn} de C", de manera que 4. Encuentre A• en el caso en que A' A=l.
5. Encuentre A+ en el caso en que A es hermitiana e idempotente; es decir, A' = A y A2 = A.
Lu·' =
cr;v; si·1<
= ·<= mm
'(m, n)
6. Demuestre que si A es hermitiana también A+ lo es.
{
1
O si mín(m, n) < i � m
7. Si A es hermitiana y definida positiva, ¿cuál es su descomposición en valores singulares?
Demostración Sea {e1, e2, ••• , em } la base usual de cm y {e¡, ez, ... , en} la de C". Defina la matriz A de 8. Demuestre que la seudoinversión es una función discontinua de una matriz.
m x n por medio de la ecuación Le¡ = 'f,J=i A;¡e¡ , 1 � i � m. Elija una descomposición 9. Si A es hermitiana, ¿cuál es la relación entre sus valores propios y sus valores singulares?
en valores singulares de A, digamos A = PDQ. Denote las filas de P* con u1, u2, ••. , Um 10. Demuestre las siguientes propiedades de la seudoinversa:
y las columnas de Q* con v1, v2, .•. , vm . Como veremos, Lu¡ = cr¡v;, donde los cr¡ son (a) A* =A
los elementos diagonales de la matriz D de m x n. He aquí los cálculos que demuestran
(b) A+' =A'+ .
lo anterior. Sea k una variable entera que toma valores entre 1, 2, .. . , m. En tal caso,
11. Demuestre las siguientes propiedades de la seudoinversa:
(a) (AA't=A+•A+
luk = L (t(ub e¡)e¡) = t(uk, e;)le¡ (b) A+ =A'(AA't
12. Demuestre, mediante un ejemplo apropiado, que en general (ABt ;= s+ A+.
13. Demuestre: Teorema. Si A es una matriz de m x n y de rango r, con m ;;;; n ;;;; r, entonces A
¿¿(f*)kiAge
n m
= ¿(P*)k;¿ A;¡e¡ =
m n
singulares.)
n n
15. Sea A una matriz de m x n de rango r, con m f n f r y descomposición en valores 33. Demuestre que la proyección ortogonal de cm sobre el espacio columna de A es AA+ .
singulares A = PDQ. Demuestre que el sistema de ecuaciones Ax = b es consistente si y 34. Demuestre que si A es simétrica, también A+ lo es.
sólo si (P*b), = O parar< i � m.
35. Demuestre que si A y B son de rango completo entonces (AB/ = B+A+ . Una matriz A de
16. Sea A una matriz de m x n de rango r. Defina u,, v, y cr, igual que en la demostración del m x n tiene rango completo si rango(A) = mín(m, n).
teorema l.Demuestre que
36. Encuentre la seudoinversa de uv', donde u y v son elementos de IC".
� cr¡-1 u¡v¡•.
A+ = �
37. Encuentre la seudoinversa de una matriz de m x n en la que todos los elementos son l.
i=l
38. Utilice el teorema de Penrose para demostrar que si B , C y B C son de rango r, entonces
(Compare con el Prob. 14.)
17. Utilice el resultado del problema 14 para demostrar que si se tiene disponible una descom (BC)' = C* (CC*)-1(B'B)-1B*,
posición de A en valores singulares, entonces Ax se puede computar con un costo adicional donde B es una matriz dem x r y C es una matriz der x n.
de (n + m + l)r multiplicaciones y r(n + m - 1) - m adiciones. Compare este resultado con
la multiplicación directa, que cuesta nm multiplicaciones y (n - l)m adiciones. 39. Demuestre que los valores propios de una matriz semidefinida positiva son no negativos.
1 8. Demuestre que si A es hermitiana y semidefinida positiva, entonces sus valores propios son '40. Escriba un programa para la computadora que encuentre la solución mínima de un sistema
idénticos a sus valores singulares. de ecuaciones Ax = b, utilizando la descomposición en valores singulares y la seudoinversa.
19. Demuestre que si dos matrices son unitariamente equivalentes, entonces sus valores singu
lares son iguales. (Dos matrices A y B son unitariamente equivalentes si A = UBV, con
U y V matrices unitarias.)
20. Sea A una matriz den x n con valores singulares cr1, cr2, ... , cr •. Demuestre que el determi
*5.5 El algoritmo QR de Francis para el problema de los valores propios
nante de A es
det(A) = ±cr1cr2... cr. En la sección 5.2 demostramos el teorema de Schur, según el cual cualquier matriz
21. Denote con [[A[[ 2 la norma matricial subordinada a la norma vectorial euclidiana. Sean cuadrada es semejante unitariamente a una matriz triangular. Esto posibilita una facto
cr1 f cr2 f . . . f cr •. Los valores singulares de A demuestre que [[A[[2 = cr1. rización del tipo
22. Sea A una matriz cuadrada con descomposición en valores singulares A = PDQ. Demuestre UAU* = T, ( 1)
que el polinomio característico de A es ± det(D -\f*Q*). en donde U es unitaria y T es triangular. Dado que los valores propios de A y T son los
23. Sea A una matriz de m x n, y sea X una matriz de n x m que tiene las cuatro propiedades de
Penrose con relación aA. Demuestre que la solución minima del sistema Ax= bes Xb.
mismos, y en virtud de que los valores propios de una matriz triangular son simplemente
los elementos sobre la diagonal, encontraremos los valores propios de A escritos en
24. Demuestre que si A es real, tiene una descomposición real en valores singulares y una la diagonal de T. Aunque sabemos que la factorización (1) existe para toda matriz
seudoinversa real. A, computarla no es sencillo. Encontrar U debe ser tan difícil como encontrar todas
25. Si la suma en el problema 14 se trunca después de k sumandos, lo que queda es una aproxi
t
las raíces (complejas) de un polinomio de grado n, pues en realidad lo que estamos
mación de A. Demuestre que el error que deriva del truncamiento satisface computando son las raíces del polinomio característico de A. Por el problema 3, todo
polinomio es (salvo múltiplos escalares) el polinomio característico de una matriz.
\\A - cr¡Y¡U¡11 = crk+!,
2 Factorización QR
donde la normal matricial utilizada es la subordinada a la norma vectorial euclidiana. El algoritmo QR de Francis [1961] es un procedimiento iterativo concebido para
26. Demuestre que los cuadrados de los elementos de v,u1 suman 1. (La notación es la utilizada revelar los valores propios de A produciendo la matriz T de la ecuación (1). Como se
en la demostración del teorema l.) puede inferir de su nombre, el algoritmo hace uso de la factorización QR. Por ahora,
27. Sean U una matriz unitaria de m x m, V una matriz unitaria de n x n, D una matriz diagonal de todas las matrices serán de n x n.
m x n y A = UDV. Demuestre que los números [du[ ( 1 � i � n) son valores propios En la sección 5.3 se desarrolló un algoritmo para producir una factorización
deA'A.
2
La definición de D = diag(d¡¡) debería ser: La reducción de A aH por medio de transformaciones de semejanza unitarias utiliza
un algoritmo de Householder.En el primer paso, la primera columna se lleva a la forma
/l apropiada En el segundo paso, la segunda columna se lleva a la forma apropiada, y
d ¡¡ = { �¡ r¡¡J Si ru = 0
Sir¡¡;,: Ü
así sucesivamente. Permí.tanos describir el k-ésimo paso. Al comienzo del paso k,
las columnas de la 1 a la k - I tienen la forma correcta para una matriz superior de
Es fácil verificar que D es unitaria y que R= D*R tiene una diagonal no negativa Hessenberg. Dividamos de la siguiente manera la matriz parcialmente reducida, donde
El algoritmo QR en su forma básica es el siguiente: las dimensiones se indican por encima y a la izquierda de la matriz:
k n-k
A1 +-A
for k= 1, 2, ..., M do
k
n-k [i � l
factorización Q R: Ak = QkRk , donde Qk es unitaria
y Rk es triangular superior con diagonal no negativa Aquí, Bes una matriz superior de Hessenberg de k x k. La matriz Des de (n - k) x k, y
tiene ceros en todas partes excepto en la k-ésima columna. La matriz Ces de k x (n -k),
Ak+I +-RkQ k
y la matriz E es de (n - k) x (n - k). Las dos últimas matrices no tienen ninguna
end estructura especial. Sea U una matriz unitaria de ordenn - k. En tal caso
Si las circunstancias son favorables, la diagonal de Ak converge ( cuando k -, oo) a un
vector cuyas componentes son los valores propios de A.
[/ O] [B C] [/ O] [
O U D E O U*
=
B
UD UEU*
CU*] . (4)
En la práctica, el algoritmo QR básico se combina con varios procedimientos adi
cionales para economizar la aritmética y acelerar la convergencia. Esto lo vamos a
examinar de inmediato. Primero, observamos que todas las matrices Ak producidas en Seleccionaremos a U de modo que UD tenga en la k-ésima columna un vector
el algoritmo son unitariamente semejantes a A. Esto resulta de la ecuación (fl, O, O, ..., O/. Observe que la forma de la matriz Des
l·
podemos esperar, en el mejor de los casos, que Ak converja a una matriz "triangular" con
submatrices de 2 x 2 sobre su diagonal. Por lo tanto, basta con determinar U de modo que
Ejemplo 1 Vamos a reducir la siguiente matriz a la forma superior de Hessenberg por medio de Llevando nuevamente a cabo la ecuación (4), obtenemos finalmente la matriz superior
transformaciones de semejanza unitarias: de Hessenberg
tl 1 m
l. -5. -1.5395 -1.2767
-6. 8.5556 0.10848 3.6986
H= [ .
O. -5.9182 -2.1689 - l.!428]
[ [l]
qué es necesaria.
Así, la primera matriz U es
Ejemplo 2 Vamos a mostrar cuál es el resultado de aplicar el algoritmo QR a la matriz H de 4 x 4
del ejemplo l . En él, por medio de la iteración básica Ak = QkRk , Ak+l = Rk Qk , se
U= I - vv* = _!.. [ -5 14 -2 ] . genera una sucesión de matrices Ak . Mostramos aquí algunos de los resultados con un
15 -10 -2
-10 -5 -10
El primer paso se completa llevando a cabo la multiplicación indicada en la ecuación A 1 <- Hessenberg (A)
-[ ¡-;
(4). El resultado es 10.135 1.9821 -0.75082 5.5290
6.7949 -2.8402 0.52664 1.2616
A2 = [
0.19692 1.5057 1.7031]
"1
-5] o.
[[ m72 ] 1.7508 2.1994
45
385
45
_ 163
45
34
�
45
o. o.
UA�
m _3!!]
l
� [l -�
259 536 352
Aw = [
8.5556 -3.6222 0.75556 -0.068658 3.5669 0.16324 l
[ t.6 12
o.
O. 1.3778] 3.0089 -1.3822 ] O. O. o. 0.17645
[ o. 5.7556 [-2.3822 -1.5644- J
En el paso 2, la matriz parcialmente reducida en curso se divide en bloques tal como se 11.106 -4.7403 3.9060 -4.0296
muestra en la ecuación anterior. Los cómputos nos llevan a: O. -3.8526 -0.68985 1.2559
A20 = [ .
O. -0.032156 3.5706 0.15706 l
O. 0.17645
d = (1.3778, 5.7555/
o. o.
�= -5.9182 Podemos observar que la ansiada forma triangular superior no se puede alcanzar rápida
mente en virtud de que el elemento en la posición (3, 2) aún es lejano a O. Pese a que un
a.= 0.15218 valor propio, a saber, 0.17645, se ha determinado con mucha precisión cerca del décimo
V= (1.1103, 0.87590/ paso, la lenta convergencia a una matriz triangular superior, tan evidente en este ejemplo,
es muy importuna. Otro valor propio, 11.106, también se ha determinado rápidamente,
U= -0.23280 -0.97252] pero los dos de en medio sólo se pueden estimar con dos o tres cifras significativas en el
[ -0.97252 0.23280 vigésimo paso. 11
280 Capítulo 5 Temas selectos del álgebra lineal numérica *5.5 El algoritmo QR de Francis para el problema de los valores propios 281
La lenta convergencia del algoritmo básico se alivia por medio de desplazamientos Ejemplo 3 Ahora mostramos cuál es el resultado de aplicar el algoritmo QR con desplazamientos
efectuados sobre las sucesivas matrices, definiéndose un desplazamiento como el reem a la matriz de Hessenberg H del ejemplo l . Exhibimos los resultados después de cinco
plazo de una matriz A por A - z/. El algoritmo QR con desplazamientos procede de la pasos de la factorización QR con desplazamientos, junto con las matrices reducidas.
siguiente manera. A-+H
3]
B. Esto demuestra que esp(A) C esp(B) U esp(E).
Recíprocamente, si A es un valor propio de B, y si u es un vector propio corres matrices que se obtienen son:
pondiente (distinto de cero), entonces (u, Of resolverá (6). Si A es un valor propio de -3 3 7 2 -3 2 7
E, pero no un valor propio de B, entonces sea v un vector distinto de cero que satisface 4 2 -2 4 4 4 -2 2
Ev = \v. A continuación se resuelve la ecuación (B-M)u = -Cv. Esto se pudo hacer A-+ [ 1 -+ ¡
2 -1 O 3 2 3 O -1
puesto que A no es un valor propio de B. Entonces el vector (u, vl resuelve (6). Esto
demuestra que esp(B) U esp(E) e esp(A). 1 1 2 3 -5 1 -5 3 2
282 Capítulo 5 Temas selectos del álgebra lineal numérica
*5.5 El algoritmo QR de Francis para el problema de los valores propios 283
Después sustraiga de la fila 3 la fila 2 multiplicado por 1/2, y de la fila 4 la fila 2
6. Encuentre los valores propios de la matriz
¡]
multiplicado por 1/4. Haga lo mismo con las operaciones columna inversas. Es decir,
añada, a la columna 2 la columna 3 multiplicada por 1/2, y a la columna 2 la columna -1 -4
-� -¡ -� .
l
4 multiplicada por 1/4. (Véase el Prob. 3 de la Sec. 4.1.) Los resultados son: [
-
2 - 11 7 -3 � 7 3
3 3 2 3 7. Demuestre que en el algoritmo QR con desplazarnientosA1+1 , es unitariamente semejante a
4 4 -2 2 4 3 -2 2 4 1 -2 2 A1 .
O 1 1 -2 O 3 8. El problema de los valores propios generalizado consiste en encontrar los valores de ).
2 -2 - O � 1 -2 .
para los que la ecuación Ax = 1'.Bx tiene soluciones no triviales. Demuestre que el problema
- -6
O �7 � 1 ¡ O3 17
--;¡ 2
7
� ¡ o -� i !1 se puede reconstruir como un problema ordinario de valores propios cuando Bes no singular.
9. (Continuación) Demuestre que el valor propio para el problemaAx=1'.Bx se puede calcular
El pivoteo es necesario nuevamente al procesar la segunda columna. Llevando a cabo fácilmente si se conoce un valor propio generalizadoµ para el problema Ax= µ(B + tA)x.
las operaciones adecuadas con las filas y con las columnas inversas, obtenemos las dos
10. Elija dos números enteros p y q tales que 1 � p < q �n, y dos números complejos a y �
matrices siguientes, la última de las cuales es la que estamos buscando:
tales que lal 2 + 1� 1 2 = l. Sea U una matriz den x n que coincide con la matriz identidad
en todas partes, con la sola excepción de los cuatro elementos siguientes:
-
25
-
25 25 37
-3 4 7 3 -3 4 3 7 -3 4 -8 3
7 7 7 39 Upp = Uqq =a Upq =-Uqp = �.
4 2 -2 2 4 2 2 -2 4 2 --;¡ 2
o 31
-8 7
2
3
2 o 31
-8 3
2
7
2 o 31
-8
3
2 2
7 Demuestre que U es unitaria.
o 1 1 -2 o 1 -2 1 o o 50
-TI
59
TI
11. Sea A una matriz real con una estructura triangular superior de bloque
Au A12 A13 · · · Ain
O A22 A23 . . · A2n
SERIE DE PROBLEMAS *5.5 -
_
A [ O
..
O Aii · · · Ain
,,
. ... ... . . . ...
l. Sea A una matriz superior de Hessenberg den x n con un O en la posiciónAu-1. Demuestre
que el espectro de A es la unión de los espectros de las submatrices Aij (1 � i,j < k) y Aij o o o ... AM
(k<ü �n).
en la que cada A;; es una matriz de 2 x 2. Dé un procedimiento simple para calcular los
2. Demuestre que en el algoritmo QR se tiene queA1+1 = QiA1Q¡. A partir de este resultado valores propios deA, incluyendo demostraciones.
demuestre que la factorización QR de AI es 12. Demuestre o refute: Si U es unitaria, R triangular superior y UR superior de Hessenberg,
entonces U es superior de Hessenberg.
(Q1Q2 · · · Q¡)(R1R1-1 · · ·R1)= A1.
13. En relación con el problema 11, demuestre que A es singular si y sólo si al menos una A;; es
singular.
3. Sean ao, a¡, ... , ª•-l números complejos arbitrarios. Sea
14. Demuestre que si Tes triangular superior e invertible, lo mismo sucede con r-1.
p(t) = CZ0 + a¡t + a2t2 + · · · + ª•-ltn-l + t" 15. Demuestre que si A es superior de Hessenberg y Tes triangular superior, entonces AT y TA
son superiores de Hessenberg.
Se define la matriz asociada a este polinomio como la matriz n x n.
16. Demuestre que si T es triangular superior y AT es superior de Hessenberg, entonces TA
o 1 o o o o es superior de Hessenberg. (Suponga que A y T son de n x n, mas no necesariamente
o o 1 o o o invertibles.)
'17. Escriba las subrutinas o los procedimientos necesarios para reducir, con la ayuda de la
o o o 1 o o computadora, una matriz a su forma de Hessenberg a través de la ecuación (4 ); aplíquelas a
A=I
la matriz del ejemplo l .
o o o o 1 o '18. (Continuación) Añada las subrutinas o los procedimientos necesarios para llevar a cabo el
o o o o o 1 algoritmo QR básico y reproduzca los resultados del ejemplo 2.
-ao -a¡ az -a3 -an-2 -an-1 '19. (Continuación) Modifique las subrutinas o los procedimientos para la computadora, de modo
que lleven a cabo el algoritmo QR con desplazamientos. Reproduzca los resultados del
Demuestre que (-l)"p es el polinomio característico deA.
1
ejemplo 3. Asimismo, utilice las subrutinas para encontrar los valores propios de la matriz
4. Sea A la matriz del problema precedente. Demuestre queA"•1= I:;;=0 a;A;. 190 66 -84 30
5. Demuestre que para todo conjunto con n números enteros, hay una matriz entera den x n 66 303 42 -36
[336 -168 147 -112]
cuyo espectro es dicho conjunto de enteros. 30 -36 28 291
Capítulo 6
284 Capítulo 5 Temas selectos del álgebra lineal numérica
Los valores propios son 343, 294 y 147 ± !96i. APROXThfACIÓN DE FUNCIONES
c20. Escriba una subrutina o procedinúento pararmacio reducir una matriz a su forma superior de Hes
senber g a través de una sucesión de transfo nes de semejanza, como en el ejemplo 4.
Cada transformació n de semeja nza deberí a seguir el algoritmo esbozado en este ejemplo, es 6.1 Interpolación polinomial
decir, las operaciones elemen tales de la fila seguid as del inverso de la operación elemental
de la columna. Póngalas a prueba con la matriz del ejemplo 4. Aplíquela a la matriz del 6.2 Diferencias divididas
ejemplo 1 y compárela con el procedimient o que se da en el texto. 6.3 Interpolación de Hermite
r de Hessenberg, tal como se indica en el 6.4 Interpolación de splines
21. Al reducir una matriz den x na la forma superio as multip licaciones se requieren aproximada- *6.5 Los E-splines: Teoría básica
problema precedente y en el ejempl o 4, ¿cuánt
mente? *6.6 Los E-splines: Aplicaciones
6.7 Series de Taylor
*6.8 La mejor aproximación: Teoría de mínimos cuadrados
*6.9 La mejor aproximación: Teoría de Chebyshev
*6.1 O Interpolación en dimensiones superiores
*6.11 Fracciones continuas
*6.12 Interpolación trigonométrica y la transformada rápida de Fourier
6.13 Aproximación adaptativa
X Xo X¡ Xz Xn
y Yo y¡ Y2 Yn
p(x¡) == Yi (0 � i � n).
Se dice que tal polinomio hace una interpolación de los datos. A continuación presen
tamos el teorema que rige este problema.
285
286 Capítulo 6 Aproximación de fanciones
6.J Interpolación polinomial 287
TEOREMA 1 Si Xo, x1, ••• , Xn son números reales distintos, entonces para valores arbitrarios y0,
Aquí se ha adoptado la convención de que TI�0(x-Xj) = I, siempre que m < O. Los
y¡, ... , Yn existe un polinomio único Pn de a lo sumo grado n, de manera que:
primeros casos de la ecuación (4) son
pn (x;)=y¡ (O� i� n).
po(x) = co
Demostración Demostremos primero la unicidad. Suponga que hubiera dos polinomios, Pn y qn, que p¡(x)=co +c1(x-xo)
cumplieran con el enunciado del teorema. Entonces el polinomio Pn -qn tendría la
P2(x) = co +e¡ (x-xo) +c2(x-xo)(x-x1)
propiedad CPn -qn )(x;) = O para O � i � n. Ya que el grado de Pn-qn puede ser a
lo más n, este polinomio puede tener a lo más n ceros, en tanto que no sea el polinomio y así sucesivamente. Estos polinomios reciben el nombre de polinomios de interpola
=
cero. En vista de que las x; son distintas, Pn -qn tiene n + 1 ceros; debe por Jo tanto
valer cero. Por consiguiente, Pn qn ,
Para la parte del teorema que se refiere a la existencia procedemos de manera
ción en la forma de Newton.
Un método eficiente para evaluar Pk (x), suponiendo que se conozcan los cóeficientes
c0, c 1, •.• , ck, es el conocido como multiplicación anidada o Algoritmo de Horner.
inductiva. Para n = O la existencia es obvia, ya que una función constante p0 (un Éste se puede explicar muy fácilmente para una expresión arbitraria de la forma
polinomio de grado � O) se puede escoger de manera que po(xo) = yo. Supongamos
ahora que hemos obtenido un polinomio Pk-l de grado� k-1, con pk-i(x;)=y¡, para
IT dj=co +c do +c2dod + ..·+ckd d ..·d -l·
k i-1
O � i� k -l . Tratemos de construir Pk en la forma u=¿e; 1 1 o 1 k (5)
i=O j=O
Pk (x) = Pk-1(x) + c(x-Xo)(x-x¡) ···(x-Xk-1). (1)
La idea es presentarla en la forma:
Observe que éste es sin lugar a dudas un polinomio de, a lo más, grado k. Además, Pk
interpola los mismos datos que Pk -l, ya que U=(···(((ck )dk -1 +Ck_¡)dk-2 +Ck-2) +dk-3 + · · ·+C¡)lfo +CQ. (6)
El algoritmo para calcular u se puede desarrollar como sigue: denotamos con Uk,
Pk(x¡) = Pk-1(X¡) = y¡ (O� i� k-1).
uk -1, ... , uo las cantidades que se encuentran entre paréntesis, iniciando con los pa
réntesis más internos. Por ello
Procedamos ahora a determinar el coeficiente desconocido c a partir de la condición
Pk(xk) = Yk · Esto lleva a la ecuación
Uk +--q
P H(xk) + c(xk-xo)(xk-X¡) ···(xk-Xk-1) = Yk· (2) Uk-1 +-- Ukdk-1 +Ck-1
Uk -2 +-- Uk -ldk-2 +Ck-2
De la ecuación (2) se puede despejar c con toda seguridad, debido a que los factores que
multiplican a c no son cero. (¿Por qué?) 111 Uk -3 +-- Uk-2dk-3 +Ck-3
Podemos ahora escribir un algoritmo para calcular los coeficientes e; en la ecuación Forma de Lagrange del polinomio de interpolación
(4). Observe que el coeficiente e que aparece en la ecuación (2) es lo que posteriormente Presentamos ahora una forma alternativa del polinomio de interpolación p asociado
llamamos Ck. Por lo tanto la fórmula para Ck es: con una tabla de datos (x;, y;), con O� i � n. Es importante entender que existe uno y
sólo un polinomio de interpolación de grado � n asociado con los datos (suponiendo,
Yk -Pk-l (xk).. . . claro está, que las n + 1 abcisas x; son distintas). Sin embargo, existe ciertamente la
Ck =
(Xk -xo)(Xk -X¡)··· (Xk-Xk-1) posibilidad de expresar este polinomio de maneras distintas y de llegar a él a través de
distintos algoritmos.
A continuación presentamos un algoritmo para calcular co, ci, ..., en a partir de la tabla El método alternativo expresa a p en la forma:
de valores para xo, X¡, ... , Xn y para Yo, y¡, .. . , Yn· n
p(x) = Yofo(x) +y¡f¡(x) +··· +ynfnCx) = ¿Ykfk(x). (9)
co +- Yo k=O
for k = 1, 2, ... , n do En este caso lo, l1, .•• , ln son polinomios que dependen de los nodos x0, x1, ••. , Xn,
d +-Xk-Xk-1 más no de las ordenadas Yo, y¡, ... , Yn· En vista de que las ordenadas podrían ser todas
U+- Ck-1 iguales a cero, excepto por un 1 que ocupe la i-ésima posición, tenemos:
for i = k-2, k-3, ..., O do
¿
n n
sección. y
El algoritmo anterior fue programado y sometido a verificación, tal como se detalla
e= rrcxo-xj)- 1•
a continuación. Definimos el polinomio
j=l
2 Por consiguiente,
p3(x) = 4x3 + 35x -84x- 954. (7)
II --
n
x-x·
fo(x)= 1
•
En la siguiente tabla se proporcionan cuatro valores de esta función j=l
Xo-Xj
Un razonamiento ·similar nos permite obtener el resto de las l;, y entonces la fórmula
xL�6 I º general se expresa como:
y �-.:_ 23
-954 1 _-;-1 (8)
f;(x) = II x-xj (O� i � n). (10)
Dichos valores se utilizaron como datos de entrada a la rutina de computadora, y ésta j=O X¡ -Xj
j;,i
calculó correctamente los coeficientes c0 = 1, e¡ = 2, c2 = 3, c3 = 4. Éstos son los
coeficientes de la forma de Newton del polinomio en la ecuación (7), a saber: Para el conjunto de nodos x0, x1, ... , Xn, estos polinomios son conocidos como funciones
cardinales. Utilizando los polinomios cardinales en la ecuación ( 9) obtenemos la forma
p3 (x) = 1 + 2(x-5) + 3(x -5)(x + 7) + 4(x -5)(x + 7)(x + 6). de Lagrange de los polinomios de interpolación.
290 Capítulo 6 Aproximación de funciones 6.1 Interpolación polinomial 291
Ejemplo 1 Para los datos en la tabla (8) los nodos son 5, -7, -6, O. Por ende, las funciones precisión como resultado de resolver el sistema (12). (Véase Gautschi [1984].) Además,
la cantidad de trabajo invertida en la obtención del polinomio (11) resulta excesiva. Por
consiguiente no se recomienda este enfoque.
cardinales son:
_ (x +7)(x +6)x (x -5)(x +6)x Si en el polinomio de Lagrange (9) hacemos x = x¡ para O � i � n, obtenemos las
siguientes n +1 ecuaciones lineales:
f0(x) - f¡(x) =
[Yº]
(5 +7)(5 +6)5 (-7 -5)(-7 +6)(-7)
(x -5)(x +7)x (x _ 5)(x +7)(x +6)
fz(x) = f3(x) = fo(xo) f1(xo) · · · fn(xo) p(xo)
(-6 -5)(-6 +7)(-6) (O _ 5)(0 +7)(0 +6) p( ¡)
fo( ;¡) Í¡ X¡) · fn( ;¡) ¡
[ � .:: ] � = [ � ]
El polinomio de interpolación es:
fo(Xn) Í¡(xn) · · · fn(Xn) Yn
p3 (x) = fo(x) -23f1 (x) -54f2 (x) -954f3 (x).
p(x.)
X Xo X¡
y Yo y¡
i=O
Para el trabajo numérico probablemente es mejor utilizar la forma de Newton del polino
Respuesta La fórmula de interpolación de Lagrange nos da mio de interpolación. Esto se puede combinar con el algoritmo de diferencias divididas
(que se estudiará en la siguiente sección) para calcular los coeficientes requeridos. Por
p(x)=Yo -- +y¡ -- .
(x -x¡) (x -xo)
inmediato gracias a que los coeficientes de la fórmula de Lagrange son las y¡ dadas. Este
otra parte, la forma de Lagrange del polinomio de interpolación se puede escribir de
XQ -X¡ X¡ -XQ
11
hecho resultará de utilidad en el capítulo 7, cuando se generen las fórmulas de cuadratura.
Existen otros algoritmos para la interpolación polinomial, con sus ventajas y sus Otra ventaja adicional de la forma de Newton es que, si se añaden más puntos al
desventajas. En vista de que existe uno y sólo un polinomio de grado � n que toma los
valores dados en los n+I puntos ( distintos) elegidos, dichos algoritmos generan el mismo
problema de interpolación, los coeficientes ya calculados no necesitan cambiarse. Así,
puntos (xo, Yo) y (x¡, y1), y así sucesivamente. La forma de Newton acomoda fácil
en la ecuación (3), c0 depende del punto (x0, Yo ). Enseguida c1 depende de los dos
polinomio en diferentes formas. Por ejemplo, podemos pedir que nuestro polinomio se
exprese mediante potencias de x: mente puntos adicionales para ser interpolados.
p(x) = ao +a¡x +a2x 2 +· · · +anx".
El algoritmo de multiplicación anidada se aplica tanto a la forma de Newton como
(11) a la forma que se presenta en (11). Esto constituye una clara ventaja sobre la forma de
Las condiciones de interpolación, p(x¡) = y¡ para O � i � n, conducen a un sistema de
Lagrange. Sin embargo, también existen algoritmos para calcular la forma de Lagrange
n +I ecuaciones lineales que determinan ao, a1, .•• , ª"· Este sistema adopta la forma:
de manera eficiente. Vea Werner [1984] y las demás referencias que ahí se dan. Vea
también los problemas 31 y 32.
XQ X� Yo
X¡ XI a¡ y¡
Xo ªº
x'/ El error en la interpolación polinomial
X2 xi xi a2 = y (12)
t
Presentamos ahora algunos teoremas que tratan de la discrepancia entre una función
¡ y el polinomio que la interpola.
Xn x; x;: Yn
TEOREMA2 Sea f una función en cn+I [a, b], y sea p un polinomio de grado � n que interpola a la
ª"
Esta matriz de coeficientes se conoce como matriz de Vandermonde. Es una matriz función f en n +1 puntos distintos xo, X¡, .. ., Xn en el intervalo [a, b]. Para cada x en
no singular ya que el sistema tiene una solución única para cualquier elección de yo, [a, b] corresponde un punto i;, en (a, b) tal que:
y¡, ... , Yn (teorema 1). Por consiguiente, el determinante de la matriz de Vandermonde
es distinto de cero para los distintos nodos xo, x1, ••• , Xn, El problema 34 proporciona una
f(x) -p(x) = (n+IJ(i;,) (x -X¡).
n
¡
(n +1/
TI (13)
está mal condicionada, y por ello los coeficientes a¡ podrían no quedar determinados con
fórmula para este determinante. Sin embargo, con frecuencia la matriz de Vandermonde
,=O
292 Capítulo 6 Aproximación de funciones 6.1 Interpolación polinomial 293
Demostración Si x es uno de los nodos de interpolación X¡, la aseveración es obviamente cierta, en Las formas explícitas para algunos de los Tn son las siguientes:
vista de que ambos lados de la ecuación (13) se reducen a cero. Así, tomamos ax como
cualquier punto que no sea un nodo, y hacemos: T2(x)= 2x2 - 1
T3(x)= 4x3 - 3x
w(t) = IT(t-x¡)
i::O
q> =f - p - A.w,
T4(x)= 8x 4 - 8x2 + l
Ts(x)= I6x5 - 20x3 +5x
donde A. es el número real que permite que q>(x)= O. (Recuerde que x ha sido fijado.)
Por ende, T6(X) == 32x6 - 48x4 + 18x2 - l.
A.= f(x) p(x).
-
w(x) TEOREMA3 Para x en el intervalo (-1, 1 J, los polinomios de Chebyshev se expresan en
la siguiente
forma ce"ada:
Además, q> E cn+1 ¡a, b], y q> se anula en los n + 2 puntos x, x0, x1, ••• , Xn, El teorema Tn(x)= cos(ncos- 1 x) (n � O).
de Rolle nos dice que q>1 tiene al menos n + 1 ceros distintos en (a, b). Con el mismo
razonamiento se concluye que q>" tiene al menos n ceros distintos en (a, b). Si repetimos Demostración Recuerde la fórmula de adición para el coseno:
el argumento llegamos eventualmente a que q¡Cn+ll tiene al menos un cero, llamémoslo
�' en (a, b). Además, cos(A + B)= cosAcosB - senAsenB.
q¡Cn+l)= ¡<n+I) _ in+!) _ A.W(n+l)= ¡Cn+l) _ (n + l)!A.. De ella obtenemos:
Ésta es la ecuación (13) disfrazada. 1111 cos(n + 1)9 = 2 cose cos ne - cos(n - 1)9. (14)
Hagamos ahorae= cos- 1 x y x= cos9. La ecuación (14) demuestra que las funciones
Ejemplo 3 Si se aproxima la función f(x) = senx mediante un polinomio de grado nueve que fn definidas mediante
interpola a f en diez puntos del intervalo [O, l], ¿qué tan grande es el error en este fn(x)= cos(ncos- 1 x)
intervalo?
satisfacen este sistema de ecuaciones:
Respuesta Para responder a esta pregunta usamos la ecuación (13) del teorema anterior. Obviamente
[Jºº\�x)[ � 1 y íli=o [x -x;I� l. De esta manera, para toda x en [O, l], fo(x)= 1 f¡ (x)= x
{
fn+l (x)= Zxfn(x) -Ín-1 (x) (n � 1)
1
senx - p(x)[� < 2 .8 x 10-7• 11
lO! Se deduce entonces quefn= Tn para toda n. 111
A partir de la fórmula en el teorema 3 obtenemos propiedades adicionales de los
Polinomios de Chebyshev polinomios de Chebyshev, tales como:
En el teorema 2 hay un término que puede optimizarse si se escogen de manera
especial los nodos. El primero en hacer un análisis de este problema fue el gran ma [Tn (x)[� 1 (-l�x� l)
temático ruso Chebyshev (18 2 1-1894). De manera natural el proceso de optimización Tn(cos(j1t/n))= (-1/ (O�j� n)
conduce a un sistema de polinomios llamados polinomios de Chebyshev, de los cuales
daremos tanto sus definiciones como sus propiedades básicas. Tn(cos((2j - 1)/(2 n))7t) = O (1�j� n).
Los polinomios de Chebyshev (de primer tipo) se definen recursivamente como
sigue: Un polinomio mónico es aquel para el cual el término de mayor grado tiene coefi
ciente l. A partir de la definición de los polinomios de Chebyshev podemos observar
T0 (x)= 1 T1 (x)= x que para Tn(x) el término de mayor grado es 2n-1xn. Por consiguiente, 2 1 -•r. es un
{
Tn+1(x)= 2xT.(x)- Tn-i(x) (n � 1). polinomio mónico.
294 Capítulo 6 Aproximación de funciones 6.1 Interpolación polinomial 295
II Plloo = máx lp(x)I ¡;; 21 -•. Si se da una función continua f sobre un intervalo [a, b ], y si se construyen para
-1 �� 1 f polinomios de interpolación Pn de grados cada vez mayores (con nodos igualmente
espaciados), lo natural sería esperar que estos polinomios convergieran uniformemente
Demostración Haremos una demostración por contradicción. Suponga que a f sobre [a, b]. Es decir, esperamos que la cantidad
polinomio mónico de grado n. Entonces, converja a O conformen -. oo. Ya hemos visto ejemplos, comof (x)=sen x, donde esto
resulta cierto, pero debe reconocerse que sen x dista mucho de ser una función continua
(-Iip(x¡) � lp(x¡)I < 21 -•=(-liq(x¡) típica. Es de clase C00 sobre la recta real y, como función de una variable compleja, es
unafunción entera, lo cual significa que no tiene ninguna singularidad en (la parte finita
y por consiguiente de) el plano complejo.
El hecho sorprendente es que para la mayoría de las funciones continuas la cantidad
(-li[q(x¡) -p(x¡)] > O
llf-Pn 11oo no converge a O. El primer ejemplo de este hecho fue presentado por Meray en
(O� i � n).
Esto muestra que el signo en el polinomio q -p oscila n+ 1 veces sobre el intervalo 1884.Tomó como nodos las n raíces n-ésimas de la unidad en el plano complejo. Éstos
(-1, 1]. Debe por lo tanto tener al menos n raíces en (-1, 1). Pero esto no es posible, son puntos igualmente espaciados sobre el círculo unitario lz l= 1, tal como se muestra
debido a que q -p tiene, a lo más, grado n - l . (Recuerde que q y p son polinomios en la figura 6.1 paran=6. Denotamos estos nodos con ro1, ro2, ... , ro•. Considere ahora
mónicos, y que el término x" no aparecerá en q -p.) 11111 el problema de interpolar la función f(z)= 1/ z en los nodos ro1, ro2, ••. , ro•. Existe un
único polinomio Pn-l de grado n- 1 que resuelve el problema. No resulta sorprendente
que sea Pn-1 (z)=z"-1, ya que
Selección de nodos
Suponga en el teorema2que los nodos de interpolación se encuentran en el intervalo Pn -1 ©j =roJ. =-ro.Jn=-=
( ) n-1 1 I f( )
[-1, 1]. Si x está en el mismo intervalo, entonces �x también estará en dicho intervalo.
©j (1 �} � n).
©j roj
Por ende podemos deducir que
Midamos ahora la discrepancia sobre el círculo unitario entre f y Pn -1 · Tenemos:
máx lf(x) -p(x)I � -
lxJ�l
1
' máx lf•+ll(x)I máx (x -x¡)l.
(n+ 1) . Jxl�l Jxl�l i=O
\ft llf - Pn -1 lloo =máx lf(z) - Pn -1(z)I =máx lz -1 - z"- 1 I
lzl=l Jzl=l
El teorema 4 nos dice que (para cualquier conjunto de nodos):
=máx_!._l l -z"l=2
lzl=l lz l
� \IT(x -x¡)\ ;;;r•.
Jxl=l i=O
Este valor mínimo se alcanza si rr;=o(X -X¡) es el múltiplo mónico de Tn+I; es decir,
Eje imaginario
2-•rn+l · En consecuencia, los nodos serán las raíces de Tn+l · Estas son:
Plano complejo
W¡ = f(-1
" + ¡,/j) - -. Wz = -¡ (1 + ¡,/j) 1
2i+ 1
.I" 'a.
'-
( )
\
I
X¡ COS (O� i � n). /
W4: -1 /
=
W¡ = 1
2n+21t
1
\f(x) -p(x)I � - - máx \f(n+l\t)I .
2"(n+ 1)! Jrl�l Figura 6.1 Las 6 raíces sextas de la unidad.
296 Capítulo 6 Aproximación de fanciones 6.1 Interpolación polinomial 297
(Confonne z se desplaza alrededor del círculo /z/ = 1, lo mismo hace z", y cuando En la definición de gn.t, el término m es un coeficiente binomial que se define en
z" = -1 obtenemos el 2 del cálculo anterior.) Por consiguiente, en este ejemplo, Pn y f
se mantienen separadas siempre por dos unidades confonne n -+ oo.
Otro ejemplo, en esta ocasión sobre el dominio de los reales, lo dio Runge en 1901.
términos de
n
()
{ ni.
= k!(n-k)! o<k<n
= =
Éste consiste en la función f(x) = (x2 + 1)- 1 sobre el intervalo (-5, 5]. Si para esta fun k
O de otra fonna.
ción se construyen polinomios de interpolación Pn usando nodos igualmente espaciados
en [-5, 5], se encuentra que la sucesión 11! - p./100 no está acotada. En la siguiente Resulta esencial interpretar a B. como un operador lineal que mapea elementos de C[O, l]
sección se esboza un experimento de cómputo para observar este comportamiento. Aun en otros elementos. La linealidad de Bn se expresa en la ecuación
para valores modestos de n (digamos n = 15) observamos grandes oscilaciones en el
polinomio Pn· Trabajos posteriores debidos a otros matemáticos, como Faber, llevaron B.(af + bg ) = aB,J + bB.g (a, b E IR f. g E C[O, 1]),
al siguiente resultado, muy general, en 1914:
la cual se verifica fácilmente. Otra importante propiedad de estos operadores es que
TEOREMA 6 Para cualquier sistema de nodos dado son positivos. Esto significa que si f � O también B.J � O. La veracidad de esta
aseveración se confinna de inmediato a partir del hecho de que gnk � O sobre el intervalo
a � 4•) < x\") < · · · < x�•) � b (n � O) (15) [O, l]. (Consideramos todas las funciones como definidas sólo sobre el intervalo [O, l].)
Juntas, las propiedades de linealidad y positividad son muy poderosas, tal como lo
existe unafanción continua f sobre [a, b], de manera que los polinomios de interpolación indica el siguiente teorema demostrado por Bohman y Korovkin.
para f que utilizan estos nodos no convergen uniformemente a f.
Esta cuestión es un poco más sutil de lo que parece a primera vista. Como muestra TEOREMA 9 Sea Ln (n � 1) una sucesión de operadores lineales positivos definidos sobre C[a, b],
de ello tenemos el siguiente resultado en positivo: que toman valores en el mismo espacio. Si 1/LJ - f/1 00 -+ O para las tresfanciones
f(x) = 1, x, x2, entonces lo mismo es válido para toda f E C[a, b].
TEOREMA 7 Si f es unafanción continua sobre [a, b], existe entonces un sistema de nodos como el
de la ecuación (15) tal que los polinomios Pn de interpolación para f en dichos nodos Demostración Tomamos valores absolutos en el espacio C[a, b] y denotamos mediante /JI la función
satisfacen la expresión límn-co 1/f - Pn l/oo = O. cuyo valor en x es /f(x)/. Observe que si Les un operador lineal positivo, entonces la
siguiente cadena de implicaciones es válida:
Este teorema se obtiene a partir de la fusión de otros dos poderosos teoremas, el
teorema de aproximación de Weierstrass y el teorema de alternancia de Chebyshev. f � g => f - g � O => L( f - g) � O => Lf - Lg � O => L f � Lg.
Pasamos ahora al primero de estos dos resultados. (El segundo se considera en la
sección 6.9.)
Otra propiedad nos dice que L(/fl) � /Lf/, ya que /!/ � f y /!/ � -f, a partir de lo
cual se deduce L(/f/) � Lf y L(/f/) � -Lf.
El teorema de aproximación de Weierstrass Hagamos ahora hk(x) = xk parak = O, 1, 2. Definirnos las funciones a..,�. y Yn
TEOREMA 8 Si f es continua sobre [a, b] y si e > O, entonces existe un polinomio p que satisface igualando
/f(x) - p(x)/ � e sobre el intervalo [a, b].
ª• = L.ho - ho �. = L.h1 -h 1 Yn = L.h2 - hz.
Demostración Debido a que el cambio de variable x = a +t(b - a) puede utilizarse para pasar en ambos
sentidos entre [a, b] y [O, 1], basta con demostrar este teorema para el caso del intervalo Las hipótesis del teorema aseguran. que
[O, l]. Es evidente que un polinomio de una función lineal de tes un polinomio en t. Tal
como se explica más adelante, sif E C[O, l], la sucesión de polinomios de Bernstein -+ O 1/Mco -+O 1/Yn l/co -+ O.
B.J converge unifonnemente af. 11
Tratemos ahora acerca de los polinomios de Bernstein, presentados por Serge (Aquí y en lo que resta de la demostración estamos usando la nonna infinito.) Para la
Bernstein en 1912. Se definen mediante: parte principal de la demostración tomemos aj como un elemento de C[a, b]. Sea a > O.
ü)
Queremos demostrar que existe un entero m tal que:
Bnf = tf gn.t(x) donde gnk = G)l(l - x)•-k.
n � m => 1/Ln f -!/l oo < 3e.
298 Capítulo 6 Aproximacói n de funciones 6.1 Interpolación polino mi al 299
En vista de que f es continua sobre un intervalo compacto, entonces es uniformemente Si es necesario, aumente m, de manera que paran� m tengamos que l\!ll oo lla.n ll oo < s.
continua. Por consiguiente existe una o positiva tal que para toda x y toda y en [a, b], Con ello el último término de la expresión anterior no será mayor que 3s. 11
l x-YI < o =?- 1/(x)-/(y) I < e. Un detalle aún pendiente en la demostración del teorema de Weierstrass es mostrar
que B nhk -;. hk para k = O, I, 2. En este caso hk(x) = i. Para h0 usamos el teorema
Observe que con e= 21\/\\00 /02, obtenemos: del binomio para escribir:
Por lo tanto, para toda x y y en [a, b ], tenemos: Para h 1 tenemos, con ayuda del problema 35,
\f(x)-/(y)\ �e+c(x-y) .
n-1 ( )
\f-f(y)ho \ �eho+c[h 2-2yh¡ +lho].
=x ¿ n; ¡ J+lx"-1-k =x.
k=O
Para verificarlo basta con sustituir x y usar las definiciones de hk . Tomando en cuenta Por último, para k = 2, y usando dos veces el problema 35, tenemos:
las observaciones hechas al inicio de la demostración deducimos que:
ILnf-f(y)L n hol �SL n ho +c[L nh 2-2yL nh1 +y2L nho ]. (Bnh2 )(x) = ta G) 2
Ésta es una desigualdad entre funciones y por lo mismo tenemos la libertad de sustituir
� n 1k-1 !) n - l )J(l _ x) -
y en ella: = ( n- n-1 +n (k-1
L.i
n k
t
k=l
\(L nf)(y)-f(y)(L nho )(y)\ ;;; s (L n ho)(y)+c[(L nh2 )(y) -2y(L n h¡)(y) = n-I 2
+y 2(L n ho)(y)] n
x (n - )J- (¡ -xrz +::
k=2 n-2
n
2 2
= s [l +a.n<Y)] +c[y2+y.(y)-2y(y+�.(y)) n -I
=--x2-+-->x2.
x
+y2(1+a.n (y))]
n n
(d) 10. Demuestre que el coeficiente de x" en el polinomio p de la ecuación (9) es:
xJ 311[1[2
¿ y;
i:O
II
j=O
(x;-Xj)-1.
(e)
X 1.5 2.7 3.1 -2.1 -6.6 11.0
11. Demuestre que para cualquier polinomio q de grado ;j¡ n - 1
y o.o o.o o.o 1.0 o.o o.o
¿q(x;)II(x;-Xj)-1 =O.
2. El polinomio p de grado � n que intexpo!aa unafuncíónf dada en n+1 nodos preestablecidos j=O
i=O
está unívocamente definido. Por ende existe una transfonnacíón f ....,. p. Denote esta
transfonnación con L y demuestre que
12. Determine si el algoritmo
Lf = ¿f(x;)i;.
i=O
X+- anb n
fori=1,2, ...,ndo
Demuestre que L es lineal; es decir, X+- (X+an-i)b¡
L (af+bg) = aLf+b Lg. end
3. Demuestre que el algoritmo para calcular los coeficientes e; en la, fonna de Newton del calcula
polinomio de interpolación requiere n2 operaciones largas (multiplicaciones y divisiones).
x=¿ a;II b j.
4. Tomando en cuenta el problema 2, defina otra transfonnacíón G mediante la fónnula: i=O j=O
13. Demuestre que si tomamos cualquier conjunto de 23 nodos en el intervalo [-1, 1] e inter
Gf = ¿J(x;)fr. polamos la funciónf(x)=coshx con un polinomio p de grado 22, entonces en el intervalo
i=O [-1, !] el error relativo IP<x) - f(x)I/IJ(x)I no es superior a 5 x 10-16•
Demuestre que Gf es un polinomio de a lo más grado 2n , que Gf interpola af en los nodos, 14. Sea p un polinomio de grado � n - 1 que interpola a la funciónf(x) = senhx en cualquier
y que Gf es no negativa siempre que f es no negativa. conjunto de n nodos en el intervalo [-1, l], con la única condición de que uno de los nodos
sea el O. Demuestre que sobre [-1, 1J el error relativo obedece a la siguiente desigualdad:
5.. Discuta el problema de la determinación de un polinomio de a lo más grado 2, para el cual
p(O), p(l), y p'(�) toman valores preestablecidos, y � es un punto dado de antemano. IP(x)- f(x)I < �
6. Demuestre que la transfonnación L en el problema 2 tiene la propiedad de que Lq = q para !f(x)j = n!"
todo polinomio q de a lo más grado n.
15. ¿Cuál es el valor final de v en el algoritmo que se muestra?
7. (Continuación) Demuestre que para toda x:
V f- Ci-1
9. Demuestre que sí g interpola a la función! en XO, x1, ... , Xn-1 y sí h interpola af en xi,
u= I:II d¡.
i=l i=l
x2, ... , x., entonces la función
XI) - x 1 7. Suponga que p es un polinomio de grado mayor que n que interpola aj en n+1 nodos. ¿Qué
g(x)+ --[g(x)- h(x)] puede descubrir acerca def(x)- p(x)?
x. -xo
I 8. Demuestre o refute la siguiente aseveración: sí n es un divisor de m, entonces cada cero de
interpola aj enxo, x1, ... , x,. Observe que h y g no necesitan ser polinomios. T. es un cero de Tm .
ji
302 Capítulo 6 Aproximación de funciones 6.2 Diferencias divididas 303
19. Encuentre un polinomio que tome l os siguientes valores: 31. Tomando en cuenta el proceso de interpolación de Lagrange, defina
x 1\2\ O 13 w, = II(x,-x¡)-1.
¡
y 3 2 -4 1 1 5
i=O
20. Demuestre que parax � 1, Tn ( x ) = cosh(ncosh-1 x ). Demuestre que si x no es un nodo, entonces el polinomi o de interpolación se puede calcular
mediante la fórmula
21. Escriba l os polinomios de interpolación de Lagrange y de Newton para los siguientes datos:
f( x) 11
1=0 1=0
7 28
Esto se llama laforma baricéntrica del proceso de interpolación de Lagrange.
22. Encuentre las formas de Lagrange y de Newton de los polinomios de interpolación para los 32. Demuestre que el cálculo del valor dep en el problema 31 es estable en el sentid o de que,
siguientes datos: si las w; son calculadas incorrectamente, aun así se satisface la propiedad de interpolación
X 1-=� lím,-,, p(x) = y¡ (O� k � n).
33. Sea E un espacio vectorial de aimensión n + 1 de funciones definidas sobre un d ominio D.
f(x) foT1 1 -1
Sean Xo,x1, ..., Xn puntos distintos en D. Demuestre que el problema de interpolación
Escriba ambos polinomios en la forma a + bx + d- con el fin de verificar que so n idénticos
como funciones. f (x;) = y; (O� i� n) f E E
23. Considere los datos siguientes: tiene una solución única para cualquier elección de ordenadas y; si y sólo si ningún elemento
de E, además del O, se anula en todos los puntos xo,X¡, ..., Xn .
X -/f I o v1 34. Demuestre que
f(x) /(-/f) \ /(O) J(/f)
xo x5
Para estos datos, ¿cuál es el polinomio de interpolación de Newton y cuál el de Lagrange? X¡ XI
24. La fórmula para el coeficiente del término de orden superior de Tn es 2"-1 . ¿Cuál es la
detl l x2 x? �I= II (Xk - x¡)
fórmula para el coeficiente dex"-2?, y ¿qué ocurre con respecto a x"-1?
;¿
O�j<k�n
Xn
25. Encuentre el polinomio de interpolación para la tabla
X::
= (Xn -Xo)(Xn -X¡)(Xn -X2) · · · (xn -Xn I) · · ·
-
x]� 3 2 6 (X¡ -xo)(X¡ -X¡)(X¡ - x2)(x2- XQ)(X2-X¡)(X¡-Xo).
y 1-2 l -22 -1 -37 35. Demuestre que
Por supuesto, el polinomio p se puede construir como una combinación lineal de los Al resolver la ecuación (2) para c0, e¡ , ... , en , podemos ir de arriba hacia abajo,
polinomios básicos1, x,x 2, . . . ,x'. Como vimos en la sección anterior, esta base no es calculando el valor de los coeficientes Cj en el orden de sus índices. En este proceso,
recomendable, por lo que nosotros preferimos utilizar una más apropiada para la forma podemos ver que co sólo depende de f(Xo), que e¡ depende de f(xo) y f(x¡ ) , y así
de Newton del polinomio de interpolación: sucesivamente. De este modo, en depende def en Xo,x 1, ••. ,Xn. La notación
qj(x) = II(x-Xk)
j -1
Esto nos da una idea de por qué se adoptó el término diferencia dividida. Se puede
exhibir una tabla de diferencias divididas con la fonna siguiente:
(4 )
k=O
Xo f(xo) f[Xo,x¡]
qj(x¡) = II(x¡-xk) =O
j -1
si i�j-1. X¡ f(x¡ ).
A partir de ella es muy fácil formar el polinomio de interpolación:
k=O
TEOREMA 1 Las diferencias divididas satisfacen la ecuación: La información a la izquierda de la línea vertical ya se conoce,mientras que las cantidades
a su derecha se deben calcular. Para ello se utiliza la fórmula (11 ),cuyo carácter recursivo
f[x¡,X2,·.,,Xn]-/[Xo, X¡,••·,Xn-iJ . impone la estructura triangular de la tabla. Por ejemplo, los datos conocidos no nos
f[xo,xi,...,x.] = (11)
Xn-XQ
permiten calcular/(x3,x4],f[x2,X3,x4],etcétera.
Comparando las ecuaciones (1O) y (11),podemos ver que los coeficientes precisados
Demostración Primero,sea pk el polinomio de a lo más grado k que interpola a/ en los nodos Xo,x1,..., en el polinomio de interpolación de Newton ocupan la primera fila en el cuadro de las
Xk, Nosotros necesitaremos a p . y ªP•-1· Sea q el polinomio de a lo más grado n-1 diferencias divididas.
que interpola a/ en x1,x2,... ,x•. Tenemos:
x-x Ejemplo 1 Calcule un cuadro con las diferencias divididas para los siguientes valores de una función:
Pn(X) = q(x) + --" [q(x)-Pn -1(x)]. (12)
x.-xa
X 3 5 6
Esta igualdad se demuestra observando en primer lugar,que en ambos lados de la ecua
ción hay polinomios de a lo más grado n. Después, hay que verificar que estos po f (x) -3 2 4 (14)
linomios tienen los mismos valores en los puntos Xo, x1, ••• , x.. En consecuencia,
los polinomios deben ser idénticos entre si Examinemos ahora el coeficiente de Xn en Respuesta Arreglando verticalmente los valores de la función y calculando
las diferencias divididas
ambos lados de la ecuación (12). Éstos deben ser iguales,con lo que se llega a la ecua por medio de la fórmula (11), obtenemos lo siguiente:
ción (11). 11
J
-3 5/4 3/20
f[ x¡ ]-f[xo]
f[xo,xil = 5 2 2
X¡ -Xo ¡,
f[xo,X¡,x2] =
f[ Xz]-f[xo, x¡]
x¡, ¡ 6 4
x2-xa
etcétera. 1 11
,, i+,•••1 z+¡ - (1 3)
Xi+j -X¡
Un algoritmo para las diferencias divididas
Aquí, f[x;], f[x;,X;+il, f[x;,X;+1,X;+2l, f[x¡,X;+1,X;+2,X;+3J, etc., son, respectivamente,
i diferencias de orden O, 1,2, 3, etcétera. Para producir un polinomio de interpolación, lo más eficiente y recomendable es
Dada una tabla con los valores (x;,/ (x;)) de la función, podemos construir con ella quizá un algoritmo para calcular la tabla de las diferencias divididas. Cambiemos la
un cuadro sinóptico de las diferencias divididas. Se acostumbra desplegar dicho cuadro notación de modo que nuestro cuadro de las diferencias divididas tenga las componentes
Capítulo 6 Aproximación de funciones 6.2 Diferencias divididas 309
308
que se muestran a continuación: no alterar la parte de arriba, que es donde se están creando paulatinamente los valores
finales. He aquí el algoritmo:
XQ coo Co¡ CQ2 Co3 Co,n-1 Co,n
C¡z C ¡3 C1,n-l .fori=O, 1, ... ,ndo
X¡ CIQ cu
d¡ <- f (x¡)
X2 Czo Cz¡ c22 C23
end
forj = 1, 2, ..., n do
for i = j,j + 1, ... , n do
d¡ <- (d¡ - d¡_¡)j(X;-X¡_j)
Xn-1 Cn-1.0 Cn-1,I
end
Xn Cno end.
De nuevo, una línea vertical separa los datos (en este caso a su izquierda) de las compo
nentes que serán calculadas. Está claro que Al concluir el algoritmo, el vector d contiene todos los coeficientes del polinomio:
C¡¡ = f[X¡, Xi+I,, .. , Xi+¡]. n i-I
p(x) = ¿d¡ IIcx-x¡).
Al traducir la ecuación (13) se obtiene de inmediato el algoritmo siguiente:
i=O i=O
forj = 1, 2, ... , n do En los problemas al final de esta sección, la eficiencia de este procedimiento se compara
for i = O, 1, ..., n - j do con la del método que se examinó en la sección 6.1.
·Cij <- (Ci+l,j-1-Ci,j-1)/(X¡+¡ -X¡)
end
I¡·;.
Propiedades de las diferencias divididas
end.
Concluimos la sección con algunas propiedades interesantes de las diferencias di
En este algoritmo, los números CiQ (que son datos de entrada) son los valores de la función . vididas.
f en los puntos .x¡. Son también los valores que el polinomio de interpolación tendrá en
dichos puntos. El polinomio de interpolación es, por cierto, TEOREMA 2 La diferencia dividida es una función simétrica de sus argumentos. Es decir; si
p(x) = coo + coi (x - xa) + c02(x - xo)(x - X¡)+ · · · ¡1. (zo, Z¡, •.., Zn) es una permutación de (Xo, X¡, ... , x.), entonces
= ¿co; IIcx-x¡). Demostración El coefiente de x" en el polinomio de a lo más grado n, que interpola af en los puntos
i=O i=O zo, z1, ..., Zn, es la diferencia dividida que aparece en la parte izquierda de la ecuación
(15). Por su parte, el coefiente de x" en el polinomio de a lo más grado n, que interpola
Si el algoritmo de las diferencias divididas sólo se va a utilizar para computar los
aj en los puntos Xo, x¡, ... , Xn, es la diferencia dividida que aparece en la parte derecha
coeficientes del polinomio de interpolación de Newton, se puede emplear un algoritmo
de la ecuación referida. Estos polinomios son, por supuesto, uno solo. 11
que ocupe menos memoria en la computadora. Esto se logra utilizando una sola variable
con subíndice. Denotémosla con d = [do, d1, ••• , d.]. En un principio, ponemos en d los
valoresf(xa),f(x 1), ... ,f(x.) de la función. Observe que do ya es el primer coeficiente TEOREMA 3 Sea p el polinomio de a lo más grado n que interpola a la función f en un conjunto de
del polinomio de interpolación de Newton. Después, computamos la primera columna n + I nodos distintos Xo, X¡, ... , x•. Si t es un punto diferente de los nodos, entonces
de las diferencias divididas y ponemos sus valores en d1, d1, . . . , d•. Hecho lo anterior,
II
do habrá conservado su valor original, mas d1 se habrá convertido en el siguiente de n
los valores buscados. Después repetimos el procedimiento anterior, teniendo cuidado f (t) - p(t) =f[xa, X¡, ... ' Xn, t] (t - X¡). (16)
de almacenar las nuevas diferencias divididas en la parte de abajo del vector d, a fin de i=O
310 Capítulo 6 Aproximación de funciones 6.2 Diferencias divididas 311
Demostración Sea q el polinomio de a lo más grado n + l que interpola af en los nodos Xo, x 1, ••. , Xn, 6. Demuestre que las diferencias divididas son mapeos lineales en relación con las funciones.
t . Sabemos que q se obtiene añadiendo un témrino a p. De hecho, En otras palabras, demuestre la igualdad
5. Demuestre que sip es un polinomio de a lo más grado n, entonces Demuestre que si los números x; están ordenados como sigue:
15. (Continuación) Demuestre que 24. Determine el polinomio de interpolación de Newton para la siguiente tabla:
0 2 7
y 1 51 113 1 1 1 201
¿a.,x?=l yque ¿a.,=0. X
i=O i=O
16. Seaf(;:) = 1/x. Demuestre que 25. El polinomio p(x) = 2- ( x + 1) +x(x + I)-2x(x + l)(x- 1) interpola los primeros cuatro
'I'
1 , I '
Añada un término a p de modo que el polinomio que resulte interpole a la tabla entera.
17. Encuentre el polinomio de interpolación de Newton para los siguientes datos:
26. Escriba el polinomio de interpolación de Newton para los siguientes datos:
3/2 o 2 4 2 o 3
X
X
18. Demuestre que sif es un polinomio, entonces la diferencia divididaf[Xo,x1, ... ,x.] es un 27. Establezca un método de iteración para resolver la ecuaciónf(x) = O como a continuación
polinomio en las variablesxo ,xi, ..., x•. se indica: Sean q. el polinomio de interpolación cuadrático para los datos de la siguiente
tabla yXn+l el cero de q. más cercano ax•.
a la funciónf(x) = 1/(1 + x2) sobre el intervalo (- 5, 5]. Utilice nodos unifonnemente
'19. Paran=5, 10 y 15, encuentre el polinomio de interpolación de Newton p. correspondiente
espaciados. Compute en cada caso la diferenciaf(x) - p.(x) en 30 puntos distribuidos a Xn Xn-1 Xn-2
iguales distancias en el intervalo (-5, 5], a fin de observar la divergencia de Pn respecto def. f(;:n) 1 f(Xn-1) 1 f(Xn-2)
20. Demuestre que si u es una función que interpola af enXQ,xi, ..., Xn-1 y si v es una función
que interpola af enX¡, xi, ..., Xn , entonces la función
interpola af en Xo,xi, ..., x•. El término interpolación de Hermite se refiere a la interpolación de una función y de
21. (Continuación) Considere el arreglo algunas de sus derivadas en un conjunto de nodos. (Posteriormente se dará una definición
más precisa.) Cuando se hace una distinción entre este tipo de interpolación y otra más
Xo Yo ao bo co sencilla (en la cual no se interpolan las derivadas de una función), la última se denomina
X¡ y¡ a¡ b¡ interpolación de Lagrange.
xi y2 a2
X¡ Yl Conceptos básicos
en el cual, para algunax fija, las a;, b; y e; se calculan con las fónnulas: Un ejemplo de interpolación muy educativo y útil es el siguiente. Necesitamos e!
polinomio de menor grado que interpola a una función! y a su derivada f' en dos puntos
a;= [(x;+i-x)y; + ( x-x;)y,.¡]/(x1+1-x;) distintos, digamos·xn y x1• El polinomio buscado deberá satisfacer las siguientes cuatro
condiciones:
b; = [(x1+2-x)a; + (;:-x;)a,.¡]/(x;+2-x;) p(x,) = f (x,) p'(x,) =f'(x;) (i = O, 1).
e; = [(x;+J-x)b; + (x-x;)b1+il/C;:1+i-x;).
En vista de que se cuenta con cuatro condiciones, parece razonable buscar una solución
Demuestre que co es el valor del polinomio de interpolación cúbico enx. en I13, el espacio lineal de todos los polinomios de a lo más grado 3. Un elemento de
Il3 pone a nuestra disposición cuatro coeficientes. Sin embargo, en lugar de presentar a
22. (Continuación) Generalice el algoritmo sugerido en el problema anterior a fin de calcular p(x) en términos de 1, x, x2, x 3, lo hacemos como sigue:
p.(x) para cualquier n. Éste se conoce con el apelativo de algorittno de Neville.
'23. (Continuación) Programe el algoritmo descrito en el problema22 y póngalo a prueba. p(x) =a+ b(x- xo) + c(x- xnJ1 + d(x- xnJ1 (x - x¡).
L 1
314 Capítulo 6 Aproximación de funciones
6.3 Interpolación de Hermite 315
ya que esto simplifica el trabajo. Esto nos conduce a: interesado en el tema puede consultar la monografía de Lorentz, Jetter, y Riemenschnei
der [1983].
p'(x) = b +2c(x -xo) +2d(x -xo)(x -x1) +d(x -xd.
A continuación pasamos a estudiar una clase muy grande de problemas de inter
Con ello las cuatro condiciones sobre p se presentan así: polación que tienen soluciones únicas. Los problemas de esta clase restringida gene
ralmente se conocen como problemas de interpolación de Hermite. En un problema de
Hermite se supone que siempre que se da el valor de una derivada pV\x;) (en un nodo
f(xo) = a x;), también se dan los de p<Hl(x;), pU-Zl(x;), ... , p'(x;) y p(x¡). Escogemos nuestra
f'(xo) = b notación de manera tal que en el nodo x; se den k; condiciones de interpolación. Observe
que k; puede variar si la i cambia. Sean xo, X¡, •.• , Xn, los nodos y suponga que en el
f(x1) = a+bh + ch
2
(h=x1 -xo) nodo X¡ se dan las siguientes condiciones de interpolación:
!'(xi)= b + 2ch+dh2. PVl(x;)=cij (O�j�k;-1,0�i�n). (1)
Obviamente a y b se obtienen de inmediato. La e se calcula con la tercera ecuación, El número total de condiciones sobre p se denota mediante m +1 y por ende
pasando al lado izquierdo los términos que incluyen a a y a b. Finalmente, d puede
determinarse usando la cuarta ecuación. Por consiguiente, el problema tiene solución, m+1 = ko +k¡ +· · · +kn. (2)
sin importar los valores que adopten!(x;) y f' (x;). TEOREMA 1 Existe un único polinomio p en ITm que satisface las condiciones de interpolación de
En general, si se van a interpolar mediante un polinomio los valores de una funciónf Hermite en la ecuación (]).
y de algunas de sus derivadas, se deberán enfrentar algunas dificultades, debido a que los
sistemas lineales de ecuaciones (a partir de los cuales se espera calcular los coeficientes Demostración El polinomio p se busca en el espacio ITm y tiene por lo tanto m +1 coeficientes. El
del polinomio) pueden ser singulares. Un ejemplo sencillo ilustrará este punto. número de condiciones de interpolación que la ecuación (1) impone sobre p también es
m + l. Por lo tanto tenemos para resolver un sistema cuadrado de m +1 ecuaciones
Ejemplo 1 Encuentre un polinomio p que tome los siguientes valores: p(O) = O, p(l ) = 1, con m+1 incógnitas, y deseamos asegurarnos de que la matriz de coeficientes es no
p'(!) = 2. singular. Para demostrar que una matriz cuadrada A es no singular basta con mostrar
Respuesta En vista de que se tienen tres condiciones, proponemos una función cuadrática: que la ecuación homogénea Au = O tiene únicamente la solución cero (u = O). Para
el problema de interpolación que estamos tratando el problema homogéneo consiste en
p(x) = a+bx+cx2. encontrar p E ITm tal que
p<il(x;) = O (O� j�k; - l. O� i � n).
La condición p(O) = O conduce a a = O. Las otras dos condiciones nos dicen:
Dicho polinomio tiene un cero de multiplicidad k; en x; (O � i � n) y debe por lo tanto
1=p(l)=b+c ser un múltiplo del polinomio q dado por
2 = p'(!) = b+c.
q(x) = II(x -xi'.
n
i=O
Y por lo tanto, ninguna función cuadrática resuelve nuestro problema Observe que
la matriz de coeficientes es singular. Si ahora intentamos resolver el problema con un Observe, sin embargo, que q es de grado
polinomio cúbico: n
p(x)=a+bx+cx2+dx'. m+l=rk¡,
i=O
descubrimos que tiene solución, pero ésta no es única Al igual que antes a = O. Las
condiciones restantes son: en tanto que p es a lo más de grado m. Por lo tanto, concluimos que p = q = O. 11
1 = b+c+d
Ejemplo 2 ¿Qué sucede con la interpolación de Hermite cuando sólo existe un nodo?
2 = b+c+ !d. Respuesta En este caso necesitamos un polinomio p, digamos de grado k, para el cual
La solución del sistema es d = -4 y b +c = 5. 11
/i\ro) = Coj (O � j�k).
En este tipo de situaciones el problema general plantea serias dificultades, y su La solución es el polinomio de Taylor
estudio se lleva a cabo mediante la llamada interpolación de Birkhoff, tema al que se co c
le ha dedicado una cantidad considerable de trabajo en los últimos tiempos. El lector p(x) = coo +coi(x -xo) +2!2 (x -Xo)2 +· · · + ok (x -xo)k . 11
k!
316 Capítulo 6 Aproximaci6n defunciones 6.3 lnterpolaci6n de Hermite 31 7
p(x) = f(Xo) +!'(xo)(x-xo) + f[Xo, xo,X¡](x-Xoi En principio es posible desarrollar para la interpolación de Hermite fórmulas afines
a la fórmula de interpolación de Lagrange. Presentaremos una de dichas fórmulas que
+ f[xo,xo,X¡,X¡](x-Xoi(x-x¡) atañe a un caso muy importante. Al igual que antes, los nodos son Xo, x1, ••• , Xn, y
318 Capítulo 6 Aproximación de funciones 6.3 Interpolación de Hermite 319
suponemos que para cada nodo se han dado los valores de la función de su primera En el siguiente teorema se proporciona una fórmula para el error asociado a este
derivada. El polinomio p que buscamos debe satisfacer las siguientes ecuaciones: tipo de interpolación de Hermite.
p(x,) = c,o p' (x,) = e¡¡ (O� i � n). (8) TEOREMA 2 Sean xo, x1, ..., x. nodos distintos en [a, b] y seaf E c2n+2 [a, b]. Si p es el polinomio
de a lo más grado 2n + 1 tal que
De manera similar a como se hizo con la fórmula de Lagrange escribimos:
p(x;) = f(x;) p' (x,) = !'(x;) (O� i � n),
¿ c;oA;(x) + ¿ c;¡B;(x),
n n
p( x) = (9)
i=O i=O entonces a cada x en [a, b] corresponde un punto� en [a, b] tal que:
en donde A; y B, son polinomios con ciertas propiedades. Un momento de reflexión nos /2n+2) n
revelaque las siguientes propiedades se acomodan perfectamente a nuestros propósitos: f (x)- p(x) = (
2
TI(x-x¡) .
2n + 2) .1 i=O
A;(Xj) = 8ij B;(Xj) = o
Demostración Si x es un nodo, resulta obvio que la fórmula es correcta. Fijemos x suponiendo que no
A;(xj) = O B/(xj) = 8ij, es un nodo. Defina w y $ mediante
En efecto, si A, y B, poseen dichas propiedades, entonces resulta trivial mostrarque p, tal
como aparece en la ecuación (9), tendrá las propiedades de interpolación que aparecen
en la ecuación (8). Se puede ahora verificarque con ayuda de las funciones
w(t )= II(t -
i=O
xi $=f-p-1,.w,
II
n X X
- j donde A. se escogió de maneraque$(x) = O. Observeque$ tiene al menos n+2 ceros en
e,(x) = (O� i � n).
X¡-Xj [a, b], a saber x, Xo, x1, ... , x•. Por el teorema de Rolle sabemos que$' tiene al menos
j=O
�¡ n + 1 ceros distintos de los puntos ya ennumerados. Además,$' se anula en cada nodo.
Por consiguiente $' tiene al menos 2n + 2 ceros en [a, b]. Una vez más, por el teorema
A, y B, se pueden definir como sigue: de Rolle,$" tiene al menos 2n + I ceros en (a, b), y repitiendo el argumento concluimos
que $(2n+2) tiene un cero, llamémoslo �, en (a, b). Por tanto
A¡(x) = [1 - 2(x -x;)f/(x,)]f;(x) (O� i � n)
(O� i � n).
Q = $(2n+2)(�) = /2n+2)(�) _ P'2n+2\�) - A.W(2n+2)(�).
B,(x) = (x -x;)f;(x)
Dése cuenta deque cada e, es de grado n, y que por lo tanto A; y B; son de- grado 2n + I. Ya que p es de a lo más grado 2n + 1, resulta que p(2n+Z) = O. Ya que w(t) tiene como
Por consiguiente p será de a lo más grado 2n + l. Y así debería ser, en vista de que en término con la potencia más alta a t2n+2 , se concluye que w(2n+2l = (2n + 2)!. Usando
la ecuación (8) se impusieron 2n + 2 condiciones sobre p. esta información junto con el valor A. = [/(x) - p(x)]/w(x) en la ecuación para $(2n+Z),
La forma de Lagrange del polinomio de interpolación en el ejemplo 1 se expresa: obtenemos
O= /2n+Z)@ - [/(x) - p( x)]( 2n + 2)!/w(x),
p(x) = f(xo)Ao(x) +/(x1 )A 1 (x) +J'(.xo)Bo(x) +J'(x¡)B¡(x), que es otra forma de la ecuaciónquequeríamos comprobar. 11
donde
A0 (x) = [1 - 2(x-.xo)f�(xo)]f5(x) Diferencias divididas con repeticiones
A1 (x) = (1 - 2(x-X¡)f\ (x¡)]ff(x) El resto de esta sección se dedica a discutir el tema de las diferencias divididas
cuando se permiten repeticiones en los argumentos. Hay muchas maneras de proce
Bo(x) = (x -.xo)f5(x) der, como usar una definición recursiva (Braess [1984]) o una definición con determi
B1 (x) = (x-xi)Rf(x) nantes (Schumaker [1981]), o simplemente extendiendo la definición antes dada para
f[x0, x1 , ..., xnl en el caso de argumentos distintos. Tomaremos la última opción, si
y guiendo a Conte y de Boor [1980].
X-X¡ x-xo
fo(x) = f¡(X) = Recuerde que si los puntos x0, x1 , ... , Xn son distintos, entonces /[Xo, X¡, ... , Xn]
xo-x 1 X¡ -Xo se ha definido en la sección 6.2 como el coeficiente de x" en el polinomio de que rr.
1 1 interpola/ en x0, x1, ••• , x•. Definamos ahora el significado de interpolación para el
f�(X) = f\(x) = caso en que la lista de puntos incluye repeticiones.
Xo - X¡ X¡-Xo
320 Capítulo 6 Aproximación de funciones 6.3 Interpolación de Hermite 321
Definición Decimos que f interpola O en .ro, x 1, • • • , Xn si ¡{k-l)(�) = O para cada punto � que de lo que es una diferencia dividida, el coeficiente de x" en
p es f[.ro, x 1, ••• , x.]. Por
aparece k o más veces en la lista.ro,X¡, • • • , x•. consiguiente,el polinomio
Es fácil demostrarque un polinomio p interpolaO en x o, x¡, ...,Xn si y sólo si p(x) es de a lo más grado n- l . Como se muestra en los problemas 8 , 9 y 11,dicho polinomio
contiene el factor interpola aj en x0 , x1, ••• , x._ 1• Por la unicidad de q debemos tener:
q( x ) = íl( x - xj ).
j=O
TI(x -x;) = q( ).
n-1
p( x ) - f[Xo, x 1, •.• , x.] x
Sif y g son funciones talesquef-ginterpolaO en xo,x1,... ,Xn , entonces decimos
i=O
quef interpolag(o g interpola!) en.ro,X¡, ..., x•.
Usando esta terminología el teorema demostrado anteriormente en esta sección se Por lo tanto,
puede replantear de la manera siguiente:
TI( -x¡)
n-1
p(x) = q( x ) + f[xo, x ¡, ..., x.] x
TEOREMA 3 Sea Xo,x¡, ...,Xm una lista de puntos en la cual ningún elemento se repite más de k í=O
veces. Sea f una función de clase ck-l sobre un intervalo que contiene estos puntos.
n j-1
Ex iste entonces un polinomio único en ITm que interpola a f en los puntos dados.
= ¿f[XQ, x ¡, ..., xj]IT( x - x¡). 11
j=O í=O
La definición de f[ x o, x1, .•• , x .] en el caso general señala que es el coeficiente
rr.
de x" en el polinomio de que interpola a f en x0, x 1, ..• , x•. Si un número �
El problema final es establecer si las diferencias divididas en su forma general
aparece k veces en la lista,entonces esta definición necesita la existencia de la derivada
¡(k-ll(�). En el caso contrario no existe la diferencia dividida (es decir, no está definida). obedecen a la relación de recurrencia:
Una vez hecha esta definición,podemos pasar a demostrar la validez de la fórmula de
interpolación de Newton general. f[XQ,x¡, ..., x .] = {f[x ¡, Xz, ..., xn] -f[Xo,X¡, ...,x n-rl} /( x.-.ro).
n j-1
TI
p( x ) = ¿f[Xo,X¡, ..., Xj] (x- x¡). (10)
Supongamos que.ro � x1 � • • · � x•. Esto no conlleva ninguna pérdida de generalidad,
en cuanto que las diferencias divididas generalizadas son funciones simétricas de sus
j=O i=O argumentos.(La demostración de este hecho, proporcionada en la sección 6.2,también
es válida en el caso general.) La relación de recurrencia obviamente no se cumple en el
Recuerdeque por definición TI�0(x - x¡) = l . caso x. = .ro. Pero esta igualdad implica que.ro= x 1 = · · ·= x. y éste es precisamente
el caso para el cual desearemos usar la fórmula
TEOREMA 4 Sif es suficientemente diferenciable como para que existan las diferencias divididas que
aparecen en (1 O), entonces dicha ecuación da el polinomio p en IT.,que interpola a f
en x0, x 1, ••• , x•. f[Xo, Xo, · ·.,Xo] = �¡<n)(XQ).
n.
Demostración Procedemos por inducción sobren. Paran = O se afirma que f[x o] es el polinomio en En todos los demás casos la fórmula recursiva es válida. Procedemos ahora a demostrarlo
IIo que interpola aj enXQ. Esto obviamente es cierto. formalmente.
· Suponga ahoraque el polinomio q,definido mediante
n-1 j-1
TEOREMA 5 Sea Xo � x 1 � •• • � x.. Entonces las diferencias divididas obedecen a la siguiente
q( x ) = ¿f[Xo, X¡, ... ' Xj] I1(x- X;) fórmula recursiva:
j=O i=O
f[ x ¡, xz, ..., Xn ] - [ x o,x¡, ...,Xn-il
! si x . ;1:xo
interpola aj en x0, xi, ... , Xn-l · Sea p el polinomio enIIn que interpola aj en.ro,x 1, ••• , f[XQ,X¡, ...,Xn ]-
-{ X,. X¡
• (11)
x •. Los teoremas anteriores garantizan la existencia y la unicidad de p. Por definición ¡< )(xo)/n! six. = .ro
322 Capítulo 6 Aproximación defunciones
6.4 Interpolación de splines 323
Demostración Procedemos por inducción sobren. El polinomio en Il1 que interpola aj en Xo y x1 es: 6. Verifique las propiedades que deben satisfacer las funciones A; y B;.
7. Demuestre que el polinomio de Taylor
X
p(x) = { (x-xo)[f(x¡) -j( o)]/(x -Xo) +j(xa) (Xo ;=x1)
f'(xo)(x¡-xo) +j(xo) (Xo = x¡).
¿ {/1\xo)(x-xo)Í.
k-1
p(x)=
En este polinomio el coeficiente de x es: i=O },
Esto concuerda con la ecuación (11) . 9. Demuestre que sif interpola a g en.xo,xi, ... ,x,,,y si h interpola a O en estos puntos,entonces
f ± ch interpola a g en estos puntos.
Suponga ahora que la ecuación (11) es válida para todas las n, desde 1 hasta m-1.
inclusive. Sea x 0 � x 1 � • • • � Xm una lista de nodos, y considere el polinomio p en Ilm 10. Fije xo,x1,... , x. y demuestre que el conjunto de funciones que interpola O en estos puntos
que interpola aj en estos puntos. Si Xm = x0, entonces todos los puntos Xo, x 1, ••• , Xm es un álgebra; es decir, es cerrado bajo la adición, multiplicación, y multiplicación por
escalares.
son el mismo. En este caso, del problema 7 se deduce que p es el polinomio de Taylor
t
dej en xo dado por: 11. Demuestre que sifinterpola O en los nodos.xo,x1, ... , x.,entonces interpola O en los nodos
XO, Xt,... ,Xn-l.
p(x) = �j<kl (xo)(x-xof 12. Sea .xo < xi < · · · < Xn ,y seaf una función continuamente diferenciable. Demuestre que
k=O
a
El coeficiente de xm en p(x) es ¡(ml(x0)/m!, y esto muestra la validez de la ecuación a-f[ XO, X¡, ..., Xn] = j[XO, X¡, .•. , X¡, X¡, Xi+!, •.., Xn].
X¡
(11) para el caso en que n = m y Xm = xo. En el otro caso resulta válido el argumento
usado para demostrar el teorema 1 de la sección 6.2. 11 13. Tomando n = 2, escriba en detalle y luego simplifique las funciones A ; y B; que aparecen
en la ecuación (9).
14. Deduzca unafórmula paral/(x).
SERIE DE PROBLEMAS 6.3
15. (Use el teorema de Rolle) Seaf E C"[a, PJ. Suponga que f tiene un cero de multiplicidad
l. Use el método extendido de diferencias divididas de Newton para obtener un polinomio de mena y una raíz de multiplicidad k en p, con m � l , k � 1,y m+ k + 2 = n. Demuestre
grado 4 que ajuste los siguientes valores: que f•l tiene al menos un cero en (a, P ).
16. Considere el polinomio
X
p(x)
o
2[-4144
2
p(t) = b - (b - a) 3
[ (b-t)2
b
_
a
-2
(b-t)'
b
_
a
]
p'(x) -9 4
Demuestre que [p'(t)I � p'((a + b)/2) = 3/2,p(a) = a, p(b) = b, p'(a) = O y p' (b) = O.
p(x;) = y; p' (x;) = O (O� i� n) Una función spline está formada por varios polinomios, cada uno definido sobre un
subintervalo, que se unen entre sí obedeciendo a ciertas condiciones de continuidad.
4. ¿Qué condición se debe imponer sobre los nodos .xo y xi si se quiere que el problema de Para una definición formal procedemos como sigue: suponga que se han especificado
interpolación n + 1 puntos to < t¡ < · · · < tn, Estos puntos se llaman nudos. Suponga además que se
p(x;) = c;o p"(x¡) = c,1 (i = O, 1) ha fijado un entero k � O. Una función spline de grado k con nudos en to , t1, .•• , tn es
se resuelva con un polinomio cúbico (para Cij arbitrario)? una función S que satisface las siguientes condiciones:
5. Demuestre que el polinomio dado en la ecuación (6), con las diferencias divididas de las (i) en cada intervalo [t¡_ 1, t;), S es un polinomio de grado � k.
ecuaciones (4) y (5), satisface las condiciones de la ecuación (3). ( ) S tiene una derivada de orden (k-1) continua en [to, t.].
ii
6.4 Interpolación de splines 325
324 Capítulo 6 Aproximación defunciones
Si se han dado los nudos t¡ y los coeficientes a¡, b¡, el valor de S en x se obtiene
s.
r
s, identificando primeramente el subintervalo [t¡ , t;+I) que contiene a x. La función spline
¡ se puede definir sobre toda la recta real. Por conveniencia podemos utilizar la expresión
•1
So
1 /¡ /3
1
1
1 •
1
X
aax + bo sobre el intervalo (-co, tI) y la expresión ª•-Ix + bn -l sobre el intervalo
[tn -i, co). La función Ses continua, y por ello los polinomios que la integran se unen
/¡
en los nodos; es decir, S;(t;+1) = S;+i (t;+1). A continuación presentamos un seudocódigo
lo 1 1 /4. /5
1 1
.,__..!¡ para calcular el spline S(x) de primer grado.
S2 .___
Si
input (t;), (a¡), (b);, x, n
Figura 6.2 Un spline de grado O. for í = 1, 2, ... , n - I do
ifx < t¡ then
S(x) = a¡ _Ix+ b¡ _¡
outputS(x)
stop
end if
end
S(x)=ª•-IX+ bn-1
output S(x).
Splines cúbicos
Debido a que en la práctica los splines cúbicos (k = 3) se usan con frecuencia,
vamos a presentar con más detalle su construcción y la teoría subyacente. Supondremos
Figura 6.3 Un spline de grado l. que se ha dado una tabla de valores:
X to t¡ t.
tiene
Por consiguiente Ses un polinomio continuo por pedazos de a lo más grado k, que y Yo YI Yn (1)
derivadas continuas de orden hasta k( - I).
Los splines de grado O son funciones constantes por pedazos. Una forma explícita y que se debe construir un spline cúbico Spara interpolar la tabla. Sobre cada intervalo
de presentar un spline de grado O es la siguiente: [to, t¡], [tI, t2], ... , Un -1, tn], Sestá definida por un polinomio cúbico diferente. Sea S;
el polinomio cúbico que representa a Sen [t¡, t;+tl· Por ende:
So(x) = co x E [to, t1)
S¡ (X) = C¡ X E [tI, t2) So(x) E (to, t¡ ]
{.
X
S(x) =
S¡ (X) x E [tI , t2]
Sn _¡(x) = Cn -I X E [tn -I, tn )• S(x)= { . (2)
Los intervalos [t;-I, t¡) no se intersecan entre sí y por ello no surge ambigüedad al definir Sn-I (x) X E (tn -I, tn ]•
la función en los nudos. La figura 6.2 muestra un típico spline de grado O con seis nudos.
La figura 6.3 muestra la gráfica de una función spline de grado 1 típica con nueve Los polinomios S;_1 y S;interpolan el mismo valor en el punto t¡ y por ello:
nudos. Una función tal se puede definir explícitamente escribiendo:
S;_1 (t;) = y¡ = S;(t¡) (1 � i � n-1). (3)
So(x) = aax+ bo X E [to, t¡)
S1 (x) = aix+ b1 X E [tI, t2) Esto hace que S sea continuo automáticamente. Además, se supone que S' y S" son
S(x) = { . continuos, y estas condiciones se usarán en la deducción de una expresión para la función
spline cúbico.
Sn-1 (x) = an-!X+ bn-l X E [tn -I, t.).
326 Capítulo 6 Aproximación defunciones 6.4 Interpolación de splines 327
¿Proporciona la continuidad de S, S' y S" suficientes condiciones para definir un De manera análoga, si utilizamos la ecuación (7) para obtener S;_ 1, llegamos a:
spline cúbico? Se cuenta con 4n coeficientes en el polinomio cúbico por pedazos, ya
que hay 4coeficientes en cada uno de los n polinomios cúbicos. Sobre cada subintervalo h; 1 1
S¡_¡(t¡) = - -Zi-! + - --Zi-Yi- + .J!.....
h¡_¡
[t;, t;+d se tienen dos condiciones de interpolación, S(t;) = y; y S(t;+ 1) = Yi+ I, lo cual 6 3 h¡_¡ h¡_¡ ·
(9)
resulta en 2n condiciones. La continuidad deS no proporciona condiciones adicionales,
en vista de que ya se ha tomado en cuenta en las condiciones de interpolación. La
Si se igualan los términos del lado derecho de las ecuaciones (8) y (9), el resultado se
continuidad de S' proporciona una condición en cada nudo interior, Sf_1 (t;) = Sf (t;),
puede escribir como:
lo que corresponde a n - I condiciones adicionales. Análogamente la continuidad de
S" redunda en n - I condiciones. Por consiguiente se cuenta con un total de 4n -2
condiciones para determinar 4n coeficientes. Quedan aún dos grados de libertad, y hay 6 6
h¡_¡z¡_¡ + 2(h ¡ + h¡_¡)z¡ + h;Zi+I = - · ( Yi+l -y¡) - - · (y¡- y¡_¡). (10)
varias maneras de utilizarlos para nuestro beneficio. ht hi-1
Deducimos ahora la ecuación para S;(x) en el intervalo [t;, t;+1J. Primero definimos
los números z; = S"(t;). Obviamente losZ; existen para O � i � n y satisfacen Esta ecuación se utiliza sólo para i = I, 2, ... , n-1. (¿Por qué?) Esto genera un sistema
de n - I ecuaciones lineales para las n + 1 incógnitas zo, z1, • • • , z.. Podemos elegir
límS"(x) =Z; = IímS"(x) (1 � i � n -1) (4) zo y Zn de manera arbitraria y resolver el sistema de ecuaciones resultante para obtener
Zt, z2, ... ,Zn-t· Una excelente elección es zo = Zn = O. La función spline resultante
xlt; xjt;
se llama spline cúbico natural. (Esta elección de spline se apoya en un teorema que se
debido a queS" es continua en cada nudo interior. Ya queS; es un polinomio cúbico en demostrará más adelante.)
[t;, t;+d, Sf' es una función lineal que satisface S/' (t;) = Zi y Sf' (t;+1) = Zi+ t y por tanto
El sistema lineal de ecuaciones (10) para 1 � i � n - 1 con zo = O y Zn = O es
corresponde a la línea recta entre Z; y Z;+ 1
simétrico, tridiagonal, diagonalmente dominante, y de la forma
; x) =
Z¡ i+I Z
(5)
S"(
¡;1 U;+¡-x) + -¡1 ;(x-t;), U¡ h¡ Z¡ V¡
h¡ U2 h2 z2 V2
donde h; = t;+i - t;. Si integramos dos veces esta expresión obtendremos S;: h2 U3 h3 Z3 r V3
=
S;(x) =
Z¡ 3 Zi+I 3
(t;+ 1-x) + (x -t;) + C(x- t¡) + D(t;+i - x), (6) hn-3 Un-2 hn-2 Zn-2 l Yn-2
6h¡ 6h;
hn-2 Un-1 Zn-1 Yn-1
La ecuación (7) también se puede verificar fácilmente. Simplemente tome x = t¡ y Se puede resolver usando un algoritmo especial (eliminación gaussiana sin pivoteo de
x = t;+i para ver que se satisfacen las condiciones de interpolación. Una vez que se han filas escaladas ), como se muestra a continuación:
determinado los valores de zo, z1, ••• , Zn, se pueden utilizar las ecuaciones (2) y (7) para
calcularS(x) en cualquier x del intervalo [to, t.].
Para deterrninar·los valores de z1,Z2, ..., Zn-I utilizamos las condiciones de conti input n, (t;), (y¡ )
nuidad impuestas sobreS'. En los nudos interiores t¡ debemos tener queSf_1(t;) = Sf(t¡). for i = O, I, ..., n - I do
Si derivamos la ecuación (7) obtenemos Sf (x). Sustituyendo x = t¡ y simplificando h¡ ,__ t;+I - t¡
obtenemos:
b; ..... 6(y;+1-y¡ )/h¡
h·
S¡(t¡) = -jz;
h;
6
-
y¡ Yi+l
z+i I - h¡ + -¡;;· (8)
end
328 Capítulo 6 Aproximación de funciones 6.4 Interpolación de splines 329
=
En vista de que en este algoritmo se producen divisiones por u;, necesitamos de espaciados en el intervalo [ O, 2.25], interpolamos con una función spline cúbico S, e
mostrar que u;"#- O. Con esto en mente demostramos por inducción que u¡>h¡>O. Esto imprimimos las diferencias E(J) S(x)-f(x) en 37 puntos:
resulta evidente para i = 1, ya que u¡ = 2(ho +h¡ ). Si u¡_¡ >h;- 1 , entonces u; >h;,
debido a que X IE(x)I
0.0000 O.O
h2 l 0.0625 l .0732 1E-Ol
U¡ = 2(h¡ +h¡_¡)-_;::._>2(h¡ +h¡_¡ )-h¡_¡ >h¡ = t¡+¡ -t¡>Q
U¡_¡ 0.1250 7.52666E-02
0.1875 3.326 17E-02
Una vez que se han determinado los coeficientes zo, Z¡, ... , Zn, puede calcularse 0.2500 o.o
cualquier valor de la función spline cúbico (2) a partir de la ecuación (7). Dada cualquier
x es necesario determinar primero cuál de los intervalos 1.7500 o.o
1.8 125 3.64780E-05
(-oo, t¡ ), [t¡ , t2), ... , [tn-2, tn_ ¡ ), [tn- 1 , oo) 1.8750 6.36578E-05
1.9375 5.85318E-08
contiene a x. Por convención utilizamos So no sólo en (to, t¡ ], sino también en (-oo, to).
2.0000 o.o
2.0625 1.14083E-04
Igualmente utilizamos Sn-l en [tn-1 , tn] y en Ctn, oo). El intervalo que contiene a x se 2.1250 2.123 12E-04
determina examinando, de manera ordenada las diferencias, 2.1875 2.04682E-04
2.2500 o.o
X-tn-1, X-tn-2, ...,X-t¡
Los datos de salida muestran que el error, E, es cero en cada nudo. Para los puntos que
para ver si alguna es no-negativa. Si una de ellas es no negativa, tomamos la primera para no son nudos, IEI no es mayor que 0.1 1. El valor más grande de IEI se presenta en [to, t¡].
la cual esto ocurrió, digamos x-t¡. Entonces x-t; � O, pero x-t;+1 < O, y por lo tanto é¿Por qué?)
t¡ � x < t;+t· Si todos los términos examinados son negativos, entonces x E (-oo, t 1 ]. A Presentamos ahora un teorema que nos dice que el spline cúbico natural genera la
partir del índice i así determinado, usando la ecuación (7) se puede calcular el polinomio función de interpolación más suave posible. En el teorema se da el significado técnico
deseado S; en el punto x dado. Sin embargo, utilizando el problema 4 podemos reescribir de la palabra suave.
330 Capítulo 6 Aproximación defunciones 6.4 Interpolación de splines 331
TEOREMA 1 Seaf" continua en [a, b] y tomemos a= to< t¡ < ... < tn = b. Si S es el spline cúbico
natural que interpola af en los nudos t¡, para O � i � n, entonces:
[ [S"(x)]\ix � [ [J'1(x)] 2 dx
=
Demostración Sea g f -S. Entonces g(t;) = O para O � i � n y o 10 15 20 25
¡ S"g"dx � O
b
t{
Jaª
El dx}
i=I 11-1 Figura 6.4(b) Curva de spline con tensión baja (i: = 0.1 ).
=-t [ S"'g'dx=-te;[' g'dx de interpolación. Cuando i: -+ +oo, la curva tiende a la función lineal por pedazos, es
i=l tr-1 i=l t1-1 decir, al spline de grado l .
Un modelo matemático de una curva como la que acabamos de describir es el
L C (g(t )-g(t¡_¡)] = o
n
11 siguiente. Al igual que antes, tenemos nudos
=- ¡ ¡
i=l
to< t¡ <···<In
Recuerde que la curvatura de una curva descrita por la ecuación y = f(x) es la
cantidad
\J"<x)\ [1 + {f'(x)}2r ;
3 2 y datos y¡ para cada t;. El spline de tensión que buscamos es una función! que tiene las
siguientes propiedades:
Si se elimina el término no lineal entre corchetes, \f"(x) [ queda como una aproximación
de la curvatura. En la interpolación de spline cúbico natural lo que encontramos, ·de (i) f E C2 [to, tn]
bido a que la cantidad J: [!" (x)J2 dx se minimiza, es una curva con (aproximadamente) (ii) f(t;) = YÍ (O � i � n)
curvatura mínima sobre un intervalo.
(iii) Sobre cada intervalo abierto (t;_ 1, t;),f satisface¡(4l -i:2f" = O.
Splines de tensión Con ello, f tiene globalmente dos derivadas continuas, interpola los datos proporcio
En algunos problemas de ajuste de datos resulta útil disponer de un parámetro i:, nados, y satisface cierta ecuación diferencial en cada subintervalo. Es evidente que
que se conoce como tensión. Cuando i: tiene un valor grande la curva que pasa a través esta receta genera un spline cúbico cuando, = O, ya que las soluciones de la ecuación
de los puntos dados tendrá una tensión alta. Esto se puede interpretar como una fuerza ¡(4) = O son polinomios cúbicos.
Para determinar f procedemos igual que en el caso de los splines cúbicos. Por
que estira la curva, tensándola entre los puntos, tal como se muestra en las figuras 6.4 (a
y b). Cuando i: tiene un valor bajo, la curva toma una forma más cercana al spline cúbico =
consiguiente, tomamos z; f"(t;) y planteamos las condiciones que debe satisfacerf
6.4 Interpolación de splines 333
332 Capítulo 6 Aproximación de funciones
El enfoque poco sofisticado que hemos esbozado se puede utilizar para llevar a cabo
sobre el intervalo [t¡, t;+1J:
experimentos interesantes. Por ejemplo, a las dos curvas que se muestran en las figuras
6.4 (a) y 6.4 (b). En la primera tomamos t= 10 y en la segunda t = 0.1. Se utilizaron
¡(4) _ 't !'' = Ü
2
los mismos datos, compuestos de valores dados de la función en los puntos t; = i, para
f(t¡ )=y¡ f(t,+1) =Yi+l O�i�25.
Los splines de tensión fueron presentados por primera vez por Schweikert [196 6 ].
f11(t;) = Z; f" (t;+J)= Zi+I
Otros artículos relacionados con esto son los de Cline [1974a,b] y de Pruess [1976,
Se puede verificar que la solución a este problema de valor en la frontera para dos 1978]. Cline ha generado software para el cálculo de curvas y de superficies con la
puntos es
ayuda de splines de tensión. Una alternativa a los splines en tensión es el spline rígido
de Boor [1984]. Estas funciones son splines cúbicos ordinarios con nudos adicionales
(y datos también) colocados en las regiones en donde se desea que la curva cambie
J(_x)= {z; senh[t' (t;+J -x)] + Zi+l senh['t(x - t;)l} /['t2 sen h('th;)] abruptamente de dirección. La ventaja de los splines rígidos es que no necesitan de
(12)
+ (y¡ -z;/t2)(t;+l -x)/h¡ + (Yi+I -Z;+i/'t2 )(x -t¡)/h¡ programas nuevos de computadora y evitan la carga computacional derivada de usar
funciones hiperbólicas.
Una vez que se han determinado los coeficientesz;, esta ecuación se utilizará para calcular
los valores de f en el intervalo [t;, t;+il· Todo esto guarda una fuerte semejanza con el
caso de los splines cúbicos. Teoría de splines naturales de grado superior
Para que f sea globalmente de clase C2 se deben imponer las condiciones En la parte final de esta sección presentamos algunos elementos de la teoría de spli
nes naturales de grado superior. Los splines naturales sólo existen para grados impares,
límf'(x) = Iímf'(x) ( l � i�n-1) y por ello el grado se denotará por medio de 2m + l . Cuando m = I se tienen los splines
xlx, xTx,
cúbicos naturales, tal como se presentaron anteriormente. En el caso de la teoría general
en los nudos interiores. No se incluyen aquí los tediosos cálculos que esto implica. Basta es conveniente proceder de manera diferente. Al igual que antes, se da un conjunto de
con saber que se llevan a cabo de forma similar a como se hizo en el caso de los splines nudos:
cúbicos. El resultado es un sistema tridiagonal de ecuaciones conzo, z1, ..., Zn como to < ti < · · · < r•.
incógnitas, que se puede escribir en la forma
Un spline natural de grado 2m+1 es una función S E c2m (]R) que se reduce a un polinomio
a.;-1Zi-l + (�i-1 + �¡)Z¡ + CT.¡Zi+ l = Yi -Yi-1 (1� i�n -1), (13) de grado�2m + 1 en cada intervalo [to, t¡ ], [t¡, t2 ], ... , [tn-l, t.] y a un polinomio de a
lo más grado m en (-oo, to) y en (t., oo). Con esta definición, un spline cúbico natural
donde se utilizan las siguientes abreviaturas: se debe reducir a polinomios lineales en (-oo, to) y en (tn, oo).
El espacio lineal de todos los splines naturales de grado 2m + 1 con n+ I nudos to,
a.;= 1/h; -t/ senh(th;) t1 , . • . , tn, se denota con Af2m+l (t0, t1 , • . . , tn ) o, en aras de la brevedad, con N7:'+1 •
Resulta conveniente utilizar la llamada función de potencias truncada, denotada
�¡ = t cosh(th;) / senh('th; ) -1/h; por .xi;.. Ésta se define como x" si x � O, y como O si x < O. Esta función pertenece a la
y¡= t2(yi+l -y¡)/h¡ clase de continuidad cn- 1•
nar el vector
Puede observarse que se necesitan dos condiciones adicionales para determi TEOREMA 2 Cada miembro de N';;1"+1 tiene una representación del tipo
una posibili dad consiste en especifi car que
z. Al igual que en el caso del spline cúbico,
Zo = Zn = 0.
¿ a¡x + ¿ b;(x - t;)¡'."+
m n
, ,)
Los pasos que conducen a obtener un spline de tensión! que ajuste los datos (t; y S(x)= i 1
, (1 4)
son los siguientes: i=O i=O
l. Verifique que to < t¡ < · · · < tn.
2. Calcule h;, a.;, �¡, y¡ para O� í�n- l. con r,;=O b;�= O para O�j� m.
3. Tomez1 = Zn= O.
4. Resuelva el sistema tridiagonal (13) paraz; con 1� i�n- l. Demostr ación En el intervalo ( -oo, to) el spline S es un polinomio Po de a lo más grado m. Este
5. Use la fórmula (12) para calcular valores de f en el intervalo [t;, t;+d· polinomio determina los coeficientes a;. En el intervalo [to, t¡ ] S se reduce a un polinomio
¡
6.4 Interpolación de splines 335
334 Capítulo 6 Aproximación de funciones
Si los valores establecidos para S son l;, entonces (según el teorema 2) el problema de
p1 de grado 2m + l. Las condiciones de continuidad en to son interpolación requiere que resolvamos el sistema:
1 ) (O �j � 2m).
Pi (to)= PY (to)
m n
Lªii; + Lbj(t¡ -;)¡"'
+1
= ii (O� i � n)
j=O j=O
El Teorema de Taylor nos dice que p1 se puede escribir como
2m+ I
L bA = O (O � i � m).
1 j= O
p¡(x) = L -:¡ pi\to)(x-to)
i
j=O J
.
Éste es un sistema cuadrado de m + n + 2 ecuaciones con m + n + 2 incógnitas. Para
2m
1 v1 mostrar que no es singular basta con probar que el problema homogéneo correspondiente
=�L., -:¡.Po (to)(x- to) + b0(x - t 0 )
2m+t
tiene como única solución el cero.Suponga, por lo tanto, que S(t; ) = O para O � i � n.
1
=l
i=ºJ Demostraremos que
= Po(x) + bo(x - to)2m+1. l [s<m+ll (x)J dx = O ,
2
(15)
Esta ecuación muestra que en (-oo, t 1) donde a = to y b= t•. Usando integración por partes obtenemos:
en este intervalo, Aquí hemos explotado el hecho de que Ses un polinomio de a lo más grado men (-oo, a)
y que por lo tanto s<m+tl(a) = O. Igualmente, s<m +tl(b) = O. El argumento se repite
L
1
O=s<m+ll(x)= b;(2m + 1 )(2m) · ·· (m + l )(x- t;t, hasta que llegamos a
i=O l = (-I)m s<ll(x)S(2m+ l l (x)dx .
A partir de esta ecuación, y utilizando el Teorema del Binomio, obtenemos:
Como s<2m+ l) es constante por pedazos, resulta que
n
o= I:b;(x-t ¡r = I:b¡
i=O
n
i=O
I: � f-Íc-ti.
m
j=O
( )
]
n
1=(-l r L} , c;S'(x)dx=(-Ir¿ c;[S(t;) - S(t;-1)] =o.
,,
{"
n
Lo que aquí tenemos es un polinomio de a lo más grado men x. Sus coeficientes deben
anularse y, por lo tanto, r;=O b;t/ = Ü paraj = Ü, 1, ... , m. fl
Esto demuestra que la ecuación (15)es correcta . De ella podemos deducir que s<m+l) O .
Por tanto, Ses un polinomio de a lo más grado m. Ya que S tiene ceros en to, t1, ••• , tn
=
y n + 1 > m, concluimos que S = O . 1
TEOREMA 3 Sea to < t 1 < ·. · < t. un conjunto de nudos y tomemos O � m � n. Existe un único
Seguimos ahora con el análogo al teorema l .
spline natural de grado 2m + 1 que ajusta los valores preestablecidos en los nudos.
TEOREMA 4 Sean m � n yf E c m+!
[a, b]. Sea S e l spline natural d e grado 2 m + 1 que interpola af
Demostración Por el teorema 2se sabe que un spline natural tiene la forma: en los nudos a = to < t 1 < · · · < tn = b. Entonces
j=O j
6.4 Interpolación de splines 337
336 Capítulo 6 Aproximación defunciones
=O 7. Diga si la función del problema6 es un spline cúbico.
se hizo en el teorema l. Sea g f- S. Entonces =
Demostración Se procede igual que como
g(t;)
nte podem os demo strar:
para O � i � n. Integrando por partes repetidame 8. Determine todos los valores de a,b, c,d y e para los cuales la siguiente función es un spline
cúbico:
l lm+l)(x)S(m+ll(x)dx = O.
· a(x- 2)2 b(x-1)3 xE( -ce, l J
f(x) = { c(x- 2)2
+
xE[l, 3]
d(x- 2)2 +e(x- 3)3 xE[3, ce]
escribiendo:
Acto seguido se completa la demostración Acto seguido determine los valores de los parámetros de manera que el spline cúbico interpole
t
esta tabla:
[J-<m+Il(x)}1 dx = l 2
[s<m+l)(x) + g(m+ll(x)} dx X 1
0
1
1
1
4
=t m l l (m ll dx
¡s(m+l)(x)J2 dx + 2 [ s< + (x)g + (x) +
t [g(m+ll(x)]2 dx 9. Verifique que las ecuaciones (7), (9) y (10) del texto son correctas.
�t Zi = Q' (t;) están bien de finidos. Encuentre las ecuaciones que determinan zo, z1,••• ,z..
=
Debe rá descubrir que uno de los puntos z puede ser arbitrario,digamos por tanto que zo = O.
m+ll(x)J 2 dx 11
[s< 'l l. (Continuación) En alguna etapa del desarrollo del problema anterior encuentre una fonna
de determinar (zo, ZI, •.. , z.) de manera que r:=O z; sea un l!Únimo. Es decir,utilice esta
condición para erradicar la arbitrariedad que se mencionó en el pro blema anterior. Incorpore
esta modalidad en su algoritmo y póngala a prueba en la computadora.
SERIE DE PROBLEMAS 6.4 12. Demuestre que en el algoritmo que resuelve el sistema (10) sucede que u; > 2h; + h,-1 para
s de Zi,demuestre que para toda i = 1,2, ... ,
l. Usando el algoritmo que determina los valore todai=1,2,... ,n- l.
n -1,resulta U¡Zi + h;Zi+I - V¡ = o.
1 3. Determine los valores de a, b , e de mane ra tal que la siguiente función sea un spline cúbico
de la ecuación en el problema l . Entonces
2. (Continuación) Denote con E, al lado izquierdoecuación puede reducirse a la ecuación (10) con nudos O, l, 2:
( h,/u,)E,+ Ei+i = O. Demuestre que esta última
solución
si se usan las fónnulas e n los algo
ritmos . Esto significa que el algoritmo genera una
_ 3 +x- 9x2 xE[O, l]
de la ecuació n ( 1 0). f(x) - { a +b(x-1) +c(x-1)2 + d(x-1)3 xE[l, 2]
s 1;+1 por/¡+ h;,el resultado es:
3. Demuestre que si en la e cuación (6) sustituimo
Calcule d de forma que Jo2[f"( x)J2dx sea un mínimo. Finalmente,encuentre el valor de d
Zi+l - t;) 3- Zi (x- t¡- h;)3 + C(x-/;) - D(x- t,- h.). que hace de/ un spline cúbico natural y explique por qué este valor es diferente del que se
S¡(x) = 6h,
(x 6h; calculó previamente.
-t; - h} en la e cuación anterior y usando 14. Determine si la siguiente función es un spline cúbico:
4. (Continuación) Desarrollando el término (xla ecuación (11) del texto es corre cta.
los valores correc t d C y D, mue tre qu e
x3+x X� 0
s
tos de
e
'5. Trace una curva, semejante a un óvalo o unanos regular a lo largo de la curva y etiquételos f( x ) = {
x3 _ X X � 0.
manera que tengan una distribuc ión más o m
lectura de las coordenadas x y y en
to = !.O, t1 = 2.0,y así sucesivamente. Haga una de x(t) y y(t). Ajuste estas funciones
e
tabla
cada uno de los puntos elegidos para gene rar unaulta que l as fónnulas x = S(t) y y = S*(t) Demuestre que
mediante funciones spline S y S".Con ello res de la curva. Tomando varios casos,use un lím/"(x) = lím/'(x)
son una representación paramétrica
aproximada
e.
graficador automático y grafique la curva resultant
,ro ,10
coincide o no con la función 21. Encuentre el spline cúbico natural cuyos nudos son-1,O,1 y que toma los valores S(-1) =
13, S(O)=7, y S( l)=9.
l+x- x3 xE[O, l] 22. ¿Cuáles de las propiedades de un spline cúbico natural posee la siguiente función, y cuáles
f(x) = { 1- 2(x- 1)- 3(x- 1)2+4(x- 1)3 xE[ 1,2] no posee?
4(x- 2)+9(x- 2) 2- 3(x - 2) 3 XE[ 2,3].
f(x)={ (x+ l)+(x+ l) XE[-1,0]
3
1 t;+1
S;(x)dx =
h¡
+ )-
/i¡
+ ).
2 (y; y;+1 N(z; Z;+1
23. Encuentre un spline cúbico natural cuyos nudos sean-1,O, 1 y que tome los siguientes
valores:
t¡ X 1 -1 1 0 J 1
1,,
'º
S(x)dx
24. Determine los coeficientes a, b, e, d de manera que la función
18. Un teorema de cálculo asegura que sif es una función diferenciable en un punto, entonces
necesariamente es continua en ese punto. La razón de esto es muy sencilla: si existe el límite xE[-1.t]
S(x) =
{r-1
que define af'(x) 3xl _ 1 xE[l !J.
1ím f(x+h)-f(x)
J'(x)=h-0 ,
h
26. Repita el problema anterior para la función
entonces el límite del numerador por sí sólo debe ser cero, y esto equivale a quef sea continua
en x. Suponga ahora que para cierta función! y un cierto punto Xo se satisface
S(x) = x3- xE[-1,O]
{ 3xi _¡1 xE[O, l]
!ímJ' (x)=lím!' (x)
xJ.to <T.to
27. ¿Se puede definir a a y a b de manera que la función
¿podemos de aquí concluir queJ' es continua en Xo?
19. (Continuación) Cuando se busca determinar si una función cúbica por pedazos es un spline (x- 2)3+a(x- 1)2 xE[- oo, 2]
cúbico ¿basta con verificar que se satisface la ecuación
S(x)= { (x- 2)3- (x- 3)2 xE[ 2,3]
l ímf " (x) = límf"(t) (x- 3)3+b(x- 2)2 xE[ 3,+oo)
xjt xft
30. Determine el valor de (a, b, e) que hace de la función Luego, usando splines cúbicos S, y Sy como funciones interpolantes, ajuste x = S,(t) y
y = Sy(t). Esto dará lugar a una representación paramétrica de la curva original. Calcule un
{x3tlx x E (0, l ] número elevado de valores de S,(t) y Sy (t) para suministrarlos al graficador.
f(x) =
- 1) + a(x - 1) + b(x - 1) + e x E (1,3]
3 2
<3 6. Inicie con la silueta de la carrocería de un auto, tal como se ilustra en la figura 6.5. Como S(x)=ax+b+¿c;/x-t¡/
se indicó en este tipo de situaciones, haga una tabla de abcisas y ordenadas de cerca de diez i:::::l
puntos. Usando los valores de tensión,= 0.25, 4, 10, genere y grafique valores del spline
de tensión interpolante para ver cuál de ellos da lugar a la apariencia más agradable.
40. Demuestre que la función dada en la ecuación (12) resuelve el problema de valor en la
frontera para dos puntos.
41. Demuestre que, como se afirma en el texto, la ecuación (13) se deduce a partir de las
condiciones de suavidad global.
42. Demuestre que la matriz de coeficientes que aparece en la ecuación (13) es diagonalmente
dominante.
<43_ Interprete los resultados del siguiente experimento numérico y extraiga algunas conclusiones.
(a) Defina p como el polinomio de grado 20 que interpola a la funciónf(x) = (1 + 6x2r1
en 21 nodos igualmente espaciados en el intervalo (-1, 1]. Incluya como nodos a los ex
tremos del intervalo. Imprima una tabla con los valores def(x), p(x), y f(x) - p(x), en 41
puntos igualmente espaciados en el intervalo.
(b) Repita el experimento usando los nodos de Chebyshev dados por
Figura 6.S Silueta de un carro.
<37_ Dibuje una letra del abecedario script, como la que se muestra en la figura 6.6. Ahora x¡ = cos[(i - l)1t/20] (1 � i � 21)
reprodúzcala con la ayuda de splines cúbicos y un graficador. Proceda como se indica a
continuación. Elija un número modesto de puntos sobre la curva, digamos n = 15. Póngales (c) Con 21 nudos igualmente espaciados, repita el expefirnento u�ando un spline de interpo-
la etiqueta t = 1, 2,... , n. Para cada punto obtenga las coordenadas x y y correspondientes. lación cúbico.
342 Capítulo 6 Aproximación de funciones *6.5 Splines-E: teoría básica 343
I::_
· · · < L2 < L¡ <to<t¡ < t2 < · · · Schauder: cada vector en el espacio tiene una representación única en términos de una
serie infinita 00 C¡�.)
Vamos a suponer que esta sucesión de nudos queda fija a lo largo de esta sección, y que Las funciones � son el punto de arranque para una definición recursiva de todos
todos nuestros splines se basan en ella. los splines-E de grado superior. La relación de recurrencia básica es:
Splines-B de grado O
B� denota a los splines-E de grado O y éstos tienen la apariencia que se muestra en
Bf (x) = ( X -t¡ s:-1 + ti+k+I -X sf.:il
ti+k -t¡
) cx) (
ti+k+l-ti+I
)
(x) (k;;; 1). (1)
la figura 6.7. El índice i abarca a todos los enteros.
Todas las propiedades de los splines-E de orden superior se deducen de esta definición
recursiva. Mediante la presentación de algunas funciones lineales especiales
r-¡
1 1 Vf(x) = -
x t¡
(2)
1 ti+k-t¡
1
1 1 podemos escribir la relación de recurrencia en la forma más elegante, que se ofrece a
1
1 continuación:
1
.J._.____________ x Bf-
Bf = Vf 1 +(1- V!¡ )Bt¡ 1 . (3)
t¡_¡ I; l1+1 11+2 l;+)
sr
En vista de que es un polinomio por pedazos de grado O, y dado que Vf es lineal, B)
es un polinomio por pedazos de grado ;; l. El mismo razonamiento demuestra que, en
Figura 6.7 El spline-E sr general, Bf será un polinomio por pedazos de grado � k.
= O.
Los puntos en negro sobre la gráfica indican que definimos �(t¡) = 1 y �(t;+i)
La definición formal es Splines-B de grado 1
º 1 si t; ;; x < t;+i
B ' (x) = { Con la ayuda de la ecuación (1) podemos dar una fórmula explícita para B/(x),
O de lo contrario como se ilustra a continuación:
:
Estos splines-E constituyen una sucesión infinita, {si i E Z}. (En este caso Z
denota al conjunto de todos los enteros, positivos, negativos, o O.) Observemos algunas
- )
{o - t¡
t¡ t¡+ -
de sus propiedades más sobresalientes: B[(x) = ( X ) Br(x) + ( z X Br+I (x)
t;+i -t¡ t;+2 - t;+ 1
(i) El soporte de B�, definido como el conjunto de las x donde B�(x) ,t. O, es el si x < t¡ o x;;; t;+z
intervalo [t;, t;+1).
X si t¡ ;; X< ti+!
(ii) B�(x) � O para toda i y toda x. = t ¡ t
¡+ - ¡
(iii) � es continua por la derecha en toda la recta real. t;+2 - x
si t;+i � x < t;+2
(iv) 1::,_00 B�(x) = 1 para toda x. t;+z -t;+1
344 Capítulo 6 Aproximación de funciones *6.5 Splines-E: teoría básica 345
(¡ t¡+¡ l1+2
Debido a que tenemos en mente usar los splines-E Bf como una base para todos
Figura 6.8 El E-splines B/.
lineales de la forma I::_
los splines de grado k, estaremos interesados en las propiedades de las combinaciones
c;Bf(x).
00
L c;Bf= ¿ [c¡Vt+ci-!O-Vt)]Bf-
00 00
1
En la figura 6.8 se muestra la gráfica de B/. LEMA3 •
Nuevamente, pueden hacerse algunas observaciones acerca de las funciones B/: i=-oo i=-oo
(i) El soporte de B/ es (t¡, t¡+z). Demostración Usamos la ecuación (3) y un manejo elemental de series para obtener:
(ii) B/(x) � O para toda i y toda x.
¿ c¡B1 = ¿ c;[vtB1-1+(1-V : )B11 J
00 00
L L C¡_¡(l-Vf)B7-1
00
Para verificar la validez de esta última ecuación, tome x E R Dado que tj converge a+oo
00
= c;vts7-1+ 11111
cuando i crece, y converge a-oo cuando i decrece, podemos encontrar un índice j tal i=-oo
i=-oo
que� � x < tj+I · Sucede entonces que B/(x)=O para toda i, con la posible excepción
de i=j o de i=j- l. Por consiguiente, para esta x,
Procedimiento numérico
¿ Bf(x)=BJ_1(x)+B}(x) En el lema 3 los coeficientes e¡ pueden ser constantes o funciones. Este hecho nos
00
proporciona una manera de calcular los valores de una función dada en la forma:
i=-oo
t·+ i-x x-t-
¿ Cf(x)Bf(x).
00
Propiedades de los splines-B Suponemos que las funciones Cf están dadas; por supuesto, éstas pueden ser constantes.
Ahora definimos
Procedemos ahora a desarrollar, mediante una sucesión de lemas, las propiedades
importantes de la familia Bf (i E Z, k E N). c7- 1 (x)=Cf(x)Vt(x)+C7... 1 (x)[l -V¡k(x)]. (4)
LEMA 1 Si k � 1 y x � (t;, t;+k+¡), entonces Bf(x)=O. Usando el lema 3 y la fórmula (4) obtenemos:
Como ya sabemos, la expresión del lado derecho se puede calcular fácilmente: para Otras fórmulas útiles, que se comprueban trivialmente, son las siguientes:
ti � x < ti+!, su valor es J(x). Usando la ecuación (2) expresamos con todo detalle la
C
LEMA 5 Para k � 2,
dada se puede calcular como se indica a continuación. Determine el índice m tal que
tm � x < tm+I· Calcule el arreglo triangular
c� c�- 1 C;. �
d k
dxB¡ (x) = --
(k
) nk-1
ti+k -t¡ Jj
¡ (x) - (
k
li+k+I -I;+¡
nk-1
) Jji+I (x). (10)
c;_ 1 c�-:::.\ c,),_ 1
Cuando k = 1, la ecuación es válida para toda x excepto x = t¡, t¡+¡ , t¡+2•
C;_k+I c�-:::_\+1
Demostración La demostración se hace por inducción, dejándose para la sección de problemas los casos
c;_k k = 1 y 2. Suponemos que la fórmula es válida para una k fija, y con esta hipótesis
deducimos el caso siguiente. La hipótesis de inducción es la ecuación (10), la cual
usando la ecuación (5). Entonces S(x) = C�. reescribimos de manera más compacta usando la notación que se presentó líneas arriba:
en donde f = 1 para toda i. Luego fijamos x y usamos la ecuación (5) para calcular
C
De la relación de recurrencia básica, ecuación (3), tenemos:
B1(x) = sr(x) = l. 11
i=-oo i=-oo
!!_x8k+1 = v1k+1(ka.ksk-1
1 1
_ ka.k1+!sk-1 + k+1 �
t+l ) a.1 81
d I (13)
La derivada y la integral de los splines-B
+ Cl -vt�1)(ka.f+1Bf..:¡ - ka.f+2Bf+2 l- a.f:lsf+1·
1 1
El siguiente lema presenta una importante fórmula para la derivada de Bf. Es
conveniente usar la fórmula (2) para Vf y tomar
Reagrupando términos, obtenemos:
a.k=-1-. (6)
1 t;+k - t¡ !!_ 8k+1 = a.k+1sk + ka. kv k+isk-1 _ a. k+18 k
dx 1 1 1 1 1 1 1+! 1+!
Observamos que, con esta notación,
k k+ k-1 k + k-1 (14)
-k0.;+2 (l -vi+l1)8i+2 -kªi+l yki 18i+l
d k
xV; (x) = a.kI' (7) + ka.f+i (1-V¡:�1 )B�,:j 1.
d
348 Capítulo 6 Aproximación defunciones *6.5 Splines-B: teoría básica 34 9
En esta ecuación haremos las siguientes sustituciones, todas justificadas mediante las Demostración Utilizando la ecuación (20) podemos verificar que las derivadas de ambos lados de la
ecuaciones (8) y (9): ecuación son iguales si tomamos
k+t ni:-1 k+ 1 k-1 Se observa que Cj- Cj-l es cero excepto cuando j= i, de donde se deduce que:
- kO.;+J y i 1:Ji+l + kO.i + l(l- yi + l )B i +l
k k
La versión transformada de la ecuación (14) es: Con el fin de asegurarse de que las funciones a ambos lados de la ecuación no difieren
en una constante, observe que las dos se reducen a cero cuando x= t;. 1111
!!_g;+l k+I k+ I k k-1 -1
dx l = a.i g;l + k[a.t y¡ Bt + (ll (l _ yt+l)Ift+l ]
k+l k
(18) Propiedades adicionales
k+ I nk k+ l k nk-J } k-J
-U¡ + ¡ .Of+l- k [O.¡+¡ yi+llli+l + ¡ ( - yi +2)Bi +2 ] ·
+ U;k+l Sif es una función y K es un subconjunto de su dominio, entoncesflK denota la
k
Esta fórmula se puede usar cuando se lleva a cabo una diferenciación numérica, si bien '\""' Cj+ i-Cj+ i-1 Bk-11(tk+ , t .
O= S'I(tk+j, tk+j+1 ) = k L., (2 1)
j k+j+1)
la diferenciación numérica de datos "con ruido" es una empresa muy riesgosa en cuanto i=l
t¡+i+k- tj+ i j+i
a la credibilidad de sus resultados. Para k= 1, la ecuación (20) es válida para todas las
x, excepto en los nudos. Para llegar a esta ecuación usamos que Bf+k�l = O y EJ-1 = O en (tk +j, tk+j+ 1) . Usando
. , . de m
1a h1potes1s . ducc1on
k-1 ni:-1
., en { Bj+l k-1
.
, .Uj+z , ..., Ej+k } , conc1wmos .
que e1 co111u11to es
t¡ +1 linealmente independiente en el intervalo Uk+j, tk +j+i). Entonces en la ecuación (20)
LEMA 7 [,,, Bf(s) ds= e+� :� ) tBJ (x).
+
todos los coeficientes deben ser O, y por ello c0 = c1 = · · · = ck Si este valor común
r=i .
350 Capítulo 6 Aproximaci6n de funciones *6.5 Splines-E: teoría básica 351
se denota por A., tendremos que, por el lema 4, S(x) = i en Ct k+j,t k+j+ t), (Observe que 5.Cuente el número de multiplicaciones, divisiones, y sumas/restas que tienen lugar en el
en el lema 4 los únicos términos que no son cero en el intervalo (t k+i• t k+j+t) son EJ , algoritmo para calcular CfBf(x).
I;;:_
EJ+I ' ... , EJ+k ·) En vista de haber supuesto que S se anulaba en Ct k+i•t k+j+i), concluimos
00
LEMA 9 El conjunto de splines-E {E�k' E�k+1 ' ..., B!-i }, es linealmente independiente en t¡+ + t;.
f"' Bf(x) dx = � ��
(to,t.). L"'
8. Demuestre que si I;;:_ c¡Bf(x)= O para todax, entonces e¡= O para toda i.
Demostraci6n Sea S = ¿;;,:;�k c;E}, y suponga que Sl(to,t n) = O. En el intervalo (to, t 1) sólo E�k '
00
E�k +I' ... , E�, son distintos de cero, y por consiguiente: 9. Defina funciones des mediante la fórmula
O= Sl(to, t¡)= '¿ c;Ef 1 (to,t¡). (22) para k = O, tome u?( = l. Demuestre que
i=-k
s)
(to, t 1 ). Por tanto, de la ecuación (22) deducimos que e¡ = O cuando -k � i � O. 10. (Continuación) Demuestre que
Si todos los e, son O, hemos llegado a la conclusión deseada. Si no todos los e, son cero,
tomemosj como el primer índice para el cual Cj ,¡:. O. En vista de lo hecho anteriormente,
L Uf L uf- (s)Bt\x).
00
,Bf x) = x- )
00
contradicción:
( (
i=-oo i=-oo
12. (Continuación) Demuestre que todo polinomio de grado ;;; k se puede expresar en la forma
¿;:_ooc¡/Jf.
SERIE DE PROBLEMAS *6.5
1. Verifique la fórmula para BJ(t¡):
2
Bj(I¡) = ( ---
-
/¡ /¡_¡
) U(j+l + ( --- ) Oi,j+2·
0
l;+t - li-1
/¡ li+l -
t,+t -/¡_¡
Bf(x) = 1-
{
13. Con la misma notación del texto, demuestre que Bf está dado por las fórmulas
v,2 v,1
V!1Vi+tl
X E[/¡, /;+1)
x E [li+t, t¡+zl
2. Demuestre que si tm � x < lm+¡, entonces l - V¡�1 )( 1- V¡�z) X E [1i+2, li+l)
� x en otras partes.
i=-oo i=m-k
itoo
16. Demuestre que si sup¡ lti+t - td � m, entonces
17. Encuentre una cota superior para 28. ¿Cuál es el intervalo más pequeño para el cual [Bf. Bf.1 •..., B!.k+J-il es linealmente inde
1: [too
pendiente?
29. Demuestre que
e¡Bf(x{ dx.
¿Bf(x) = 1 (tk �X� lk+n).
i=O
18. Demuestre que para k � 3
30. Demuestre que
d2
¿ c¡Jt;(x) = k(k - 1) ¿ Bf-2(x)
00
-
(e¡. -�-t _ Ci-t c,-2)
00
- .
dxZ t1+k t, ti+1c-l - t¡-1 t¡+1c-1 - t¡ ¿Bf(x) >0 (t¡ <x < l..t+tl,
i=-oo i=-oo i=O
(k � 1).
i=-oo
En esta sección adoptamos la notación de la sección anterior. Dada una sucesión inicial
20. Dé un ejemplo de una función spline ¿:_00 c;Bf que no sea la función cero y que sin de nudos
embargo, se anule en todos los nudos. ··· < Lz < L¡ <to<t¡ < tz < ..., (1)
<21. Escriba y ponga a prueba una subrutina para calcular valores aproximados de g(x) =
J:f(t) dt en un intervalo [a, b]. El usuario proporciona la función! en un subprograma
se define un sistema de splines-E, Ef(x), sustentado en los nudos. Deseamos relacionar
estos splines-E con las funciones spline presentadas al principio de la sección 6.4. Ahí
separado. El método que se utilizará con,iste primero en interpolar! en [a, b] con un spline
J:
cúbico natural, S, usando n nudos igualmente espaciados, y luego utilizar g(x) ,::; S(t) dt. consideramos funciones que son de clase c•-1 globalmente y que se componen de
El usuario especificará los valores de a, b, y n. polinomios por pedazos de grado ;;i; k en los n intervalos [to, t¡], [ti, t2], ... ,[tn-I, t.].
Denotamos mediante S! a la familia de estos splines. La notación no exhibe los nudos por
22. Suponga que en la sucesión de constantes C!-t- C!-k+I • ..., C!, dos elementos adyacentes haber quedado estos fijos desde el principio. Consideramos que las funciones spline en
son iguales. Demuestre que la función spline S! tienen como dominio a [to, t.]. ¿Cómo se relacionan estas funciones con los splines-E
Ef? A lo largo de la sección suponemos que n ;;; l .
¿ c1i;(x)
00
i::-00
Bases del espacio S!
será un polinomio de grado menor que k en el intervalo (tm, lm+t). Con el fin de que el dominio de estas funciones sea el mismo, restringimos la función
23. Use el algoritmo que aparece después del lema 3 para demostrar que :z=:_ 00
c;.Bf es un Bf al intervalo [to, t.]. La notación para las funciones restringidas es Sf [(to, t.].
polinomio de grado � k en (tm, lm+1).
24. Use el algoritmo que aparece después del lema 3 para hacer nuevas demostraciones de los TEOREMA 1 Una base para el espacio S! es
lemas 1 y 2.
{Sff[to, t.]:-k ;;i; i ;;i; n -1}. (2)
25. Demuestre formalmente que Bf(x) > O en (t¡, l¡+1l si y sólo sij - k � i � j.
26. Demuestre que la fórmula (10) en el lema 5 es cierta para k = 1, excepto en los tres nudos Por consiguiente, la dimensión de S! es k + n.
t¡, !i+l, fi+2·
354 Capítulo 6 Aproximación de funciones *6.6 Splines-E: aplicaciones 355
Demostración Resulta obvio que las funciones en la ecuación (2) pertenecen a S!, ya que son splines LJ=I CjEJ. Para que esto sea posible hace falta que la matriz de interpolación A dada
de grado k, apoyados en la sucesión de nudos dada en (1). por
Pasamos a demostrar que la dimensión de S! es a lo más k + n. Esto se logrará Aij = BJ(x;) (1 � i,j � n) (4)
exhibiendo un conjunto de k + n funciones que generan S!. En efecto, cada elemento de sea no singular. Un bello teorema de Schoenberg y Whitney nos indica las condiciones
S! se puede expresar como: necesarias y suficientes para que se dé esta no singularidad, a saber, que la diagonal de
A no incluya ceros.
¿ a¡i + ¿ b (x - t;)!
k n-I
Para la demostración de este resultado seguimos las ideas de de Boor [1976, y
S(x) = ¡ (3) com.pers.]. Consta de varias partes que se considerarán por separado.
i=O i=l
LEMA 1 Si la matriz de la ecuación (4) es no singular, entonces Au;: O para 1� i� n.
En esta ecuación se usan las potencias truncadas:
t six � t¡ Demostración Suponga que A" = O para alguna r. Entonces E�(x,) = O, y por el lema 2 de la
(x-t¡)!={t- l sección 6.5, x, rj; (t,,t,+k+i), Suponga primero que x, �- t,. Si i � r � j, entonces
six < t¡
x;� x,� t,� t¡ y x; no está en el soporte de Bj. Como consecuencia, Aij = EJ(x;) = O.
Para demostrar la validez de la ecuación (3) empezamos con el intervalo [to, t1] en el Las primeras r filas en A se pueden interpretar como vectores en JR'- 1, debido a que
que todas las potencias truncadas son O. Sobre [to, t1], S(x) es un polinomio de grado k, Aij = O para j = r, r + 1, .. . , n. Por lo tanto este conjunto de filas es linealmente
digamos p0• Tenemos entonces po(x) = ¿�0 a¡}. Esta expresión determina todos los dependiente y por ende A es singular.
coeficientes a¡. En el intervalo [t1, t2], S(x) es otro polinomio, llamémoslo p1• Tomando En el otro caso, x, � t,+k+l · Si i � r � j, entonces x; � x, � t,+k+l � tj+k+l, y
en cuenta las condiciones de continuidad en t1, tenemos: Aij EJ(x;) = O. Las columnas numeradas del ! a r forman un conjunto linealmente
=
dependiente, debido a que sus componentes numeradas como r, r + 1, ... , n son todas
( p¡ - potl(t1 ) = O (O� r� k - 1). cero. Una vez más concluimos que A es singular. 11
En vista de que p 1-: p0 es de a lo más grado k, concluimos que (p1 - po)(x) = b 1(x- td LEMA 2 Si k = 1 y t¡ < X¡ < t;+2 para 1� i� n, entonces A es no singular.
para alguna b 1 . Por lo tanto escribimos:
Demostración Para demostrarlo utilizamos inducción sobre n. Si n = 1, la matriz A es una matriz de
k 1 x 1 con un único elemento All = E/(x¡);: O.
'\"" a;i. + b1(x - ti)k (to � x � t2).
S(x) = � Suponga ahora que el lema 2 se ha demostrado para todos los casos en que el número
+
i=O de nodos es menor que n. Considere entonces el caso de n nodos, con n � 2. Si existe
un índice r para el cual 1 � r � n - 1 y x, � t,+1, entonces para cualquier par (i,j)
Este mismo argumento se repite en t2, t3, ..., tn-1 para justificar los términos restantes que satisfaga i � r < j tendremos que X¡ � x, � t,+1 � tj y Aij = EJ(x;) = O. Por
en la ecuación (3). consiguiente la matriz A tendrá la forma:
La tercera parte de la demostración consiste en utilizar el lema 9 de la sección 6.5
y concluir que el conjunto de la ecuación (2) es linealmente independiente. Por lo tanto
es una base de S!. 11 A=[�
�]
La demostración del teorema 1 muestra que las funciones en la cual Ces una matriz de r x r y Des de (n - r) x (n - r). La matriz A es invertible
si y sólo si C y D son invertibles (véase el Prob. 11). Las matrices C y D son como a
1,x,x 2 , ... ,}, (x-t¡t (x - t2t ..., (x - t,-1)! A excepto por el hecho de tener menor tamaño (ya que r < n y n - r < n). Por tanto,
según la hipótesis de inducción, son invertibles.
forman una base de S!. Debido a que está muy mal condicionada, deberíamos tener Se puede utilizar un argumento similar cuandox, � t,+1 para algún índice r en el
precaución al usar esta base en los cálculos numéricos. En su lugar debería usarse la rango 2� r � n. En este caso, sij < r � i, entonces Aij = O. La estructura de A es
base de splines-E que se plantea en el enunciado del teorema.
A= [ �
�]
Matriz de interpolación
Las funciones spline se pueden utilizar para hacer interpolaciones en otros puntos con C y D matrices de (r - 1) x (r - 1) y (n - r + 1) x (n - r + 1), respectivamente.
además de los nudos. Seax1 < x2 < ... < Xn un conjunto de nodos dado. Nos gustaría El caso que vamos a considerar ahora es el que se ocupa de x; > t;+1 para 1� i �
interpolar datos arbitrarios dados en los nodos mediante una función spline de la forma n - 1 y X¡ < t;+i para 2� i� n. Esto tiene lugar si n = 1 (caso ya considerado), o si
· 356 Capítulo 6 Aproximación de funciones *6.6 Splines-E: aplica ciones 357
n =2. En este caso especial,n = 2, k = 1,x¡ > tz yx2< /3. Por ende t2<x1<x2<13. Vj de la ecuación (6) deben ser cero. Como en la ecuación (20) de la
sección 6.5, la
En el intervalo (12, t3) tenemos queEl(x) + E!(x) = l. Por lo tanto la matriz A tiene la fórmula para Vj es:
forma: Vj = k(Uj -Uj 1)/(lj+k-lj).
El(x¡) E!(x¡) - A. 1-A. -
[ ] [ J
E/(x2) E!(x2) µ 1-µ · Podemos utilizar esta fórmula para1;;j;;n+ I si acordamos en tomar uo =Un +! = O.
Que todos los coeficientes Vj se anulen significa:
=
El determinante esA. - µ E[(x1) -El(x2) > O. 11
U¡-Uo =Uz-U¡ = • • • =Un +I -Un = Ü.
El teorema de Schoenberg-Whitney nos dice lo siguiente.
Ya que uo = Un+I = O, llegamos a la conclusión de que todas las u; son cero.
TEOREMA 2 S uponga que x1 < x2 < ... < x.. Para que la ma triz A dada por A;j =E}(x;) se a no En el caso2 suponga que �l � tk+l y que �n+l > tn+I· EntoncesE1-1(�;) = O para
singular esnecesario ysuficiente que no haya e lementos igua les a cero ensu dia gona l. 1;;i;; n+ I, debido a que�; no está en el soporte de �- 1• En este caso inferimos, de
la ecuación (6), que
Demostración La necesidad ya se ha demostrado en el lema l . La suficiencia en el casok = O es trivial, n+I
debido a que la condición !3?(x;) '# O es equivalente a que t; � x;< t;+J· En vista de que ¿ vj13J- 1
(�;) = O (2;;i;;n + 1).
los soportes de los splines-E son ajenos entre sí, BJ(x;) = ºif· j=2
Para k =1, la demostración de la suficiencia se ha proporcionado en el lema 2.
Recurrimos ahora a la indución sobre k. Suponga que el teorema se ha demostrado Pero�; está en el soporte de (-1 para 2 ;; i ;; n + 1, por la hipótesis de inducción
para splines-E de grado < k. A partir de esta hipótesis lo demostramos para splines concluimos que vj = O para2;;j;;n + l . Como antes, esto conduce a:
de grado k. Por el lema 2 resulta que k � 2. Nuestra demostración requerirá, al
igual que en la correspondiente al lema2, otra inducción sobre n, aunque en este caso Uz -U¡ = U3 -Uz = · · · =Un+I -Un = Ü
seremos menos formales. Lo esencial en el argumento es que, si x, � t,+ 1 para alguna y en vista de queUn+l = O, entonces u; = O para1;;i ;;n.
r E { l,2, ...,n-1} o six, � t,+k para algunar E {2,3, ... ,n}, entonces la matriz A
En el caso3 suponga que �l < tk+ l y que �n ;; tn+l· Esto es semejante al caso2.
tendrá una estructura de bloque tal como aparece en el lema 2, y será invertible, como
Ahora�; está en el soporte de (-1 para1;;i;;n, y los mismos argumentos utilizados
se comprueba si usamos la hipótesis de inducción en las dos submatrices de A.
antes nos conducen a u; = O para1;;i;;n.
Podemos por lo tanto considerar que
Para el caso 4 suponga que �l � tk+I y que tn+I � �n+I· Tenemos ahora que
E�-1(�;) = O y queE!:;:¡1 �;) = O para1;;i;;n + l. La ecuación (6) nos da:
t;+¡<X¡< Xi+! < li+k+I (1� i�n-1). (5)
¿
n
Suponga que A es singular. Entonces Au = O para alguna u :t: O. Seaf = ¿�UjEJ. vjEJ- 1
(�;) = O (2;;i;;n).
Observamos de quef se anula en losn+2 puntos t1,x1,x2 , ... ,Xn , tn+k+I· Ya quek � 2, j
=2
f' existe y es continua. Por lo tanto se puede aplicar el teorema de Rolle para deducir la
existencia den+1 ceros,�;, def' distribuidos como sigue: Pero como �; está en el soporte de E7- 1 para 2 ;; i ;; n, repitiendo argumentos ya
familiares, concluimos que:
t¡<�¡<X¡<�2<X2< · ..<Xn-l<�n <Xn <�n+I < ln +k+l·
Uz -U¡ = U3 -Uz = · · · =Un -Un 1 = Ü.
-
Como se demostró en la ecuación (20) de la sección 6.5,f' es de la forma I:
También tenemos que
1:� vjBJ-1• Esto demuestra que todas lasUj son iguales, digamos que toman el valor A.. Por lo tanto
f = A.¿�EJ. Ya que E} � O y E1(xi) > O, la ecuaciónf(x1) = O demuestra que
A.=� •
¿
n+l
VjEJ- (�¡) =f'(�;) = 0
1
(1� i�n + 1). (6) Ejemplo Tomemos como nudos a todos los enteros. Si deseamos interpolar mediante combina
j I
= ciones lineales deE¡,Bi, ... ,E� ¿podemos usar el conjunto de nodos {3.1,3.5,3.6,6.1,
6.6}?
Usando la ecuación (5) vemos que�; pertenece al soporte de E7- 1 para2 � i � n. En
esta etapa aparecen varios casos. Respuesta En este caso, la condición dada por el teorema2 se puede escribir en la forma:
En el caso1 suponga que �1< tk+I y que �n+l > ln+l· Entonces �1 está en el soporte
de E�-! y �n+I en el soporte de E!:;:'/. Por ende, usando la hipótesis de inducción, la i<x;< i+3 ( l;;i�5).
matriz (EJ- 1(�;)) de (n + 1) x (n+ 1) es no singular. Por lo tanto, todos los coeficientes Se verifica fácilmente que esta condición es satisfecha por los nodos dados. 1111
358 Capítulo 6 Aproximación de funciones *6.6 Splines-E: aplicaciones 359
TEOREMA 3 Si se eligen nodos X¡, x2, .•• , Xn+k en [to, t.] que satisfacen
C¡ _3Bt-3(t¡)+C;-2Bf-i(t¡)+C¡_¡BL (t¡ ) = f(t¡ ) (1;::; i � n) (11)
ti-k-1 <X¡ < t¡ (1;::; i;::; n+k),
Se puede calcular los valores BJ(t,) necesarios usando el teorema 4 de la sección 6.5.
entonces se pueden interpolar datos arbitrarios en estos nodos mediante el espacio Los resultados son:
spline S!.
(t;+1-t¡)2
Bt-3(t¡) =
Demostración Por el teorema 1, el conjunto de funciones BJJ[to, tn ], con -k ;;; j ;;; n- 1 conforma (1;+1-t¡_2)(t;+1-t¡_ ¡ )
una base de S!. Reetiquetamos los nodos definiendo y¡ = x;+J+k para-k;;; i;::; n- l. n3 _ (ti+2-t¡)(t¡-t¡_¡) (t¡ -t;-2)(t;+1 -t¡ )
Entonces y; E sop(Bf), y, por el teorema 2, la matriz BJ(y;) es no singular. 11 11¡_2 (t¡ )- +
(1i+2-/¡ _¡)(ti+l-IH) (ti+l-t,-2)(1,+t -t¡ _¡ )
Si suponemos que Bf(x;) if: O para 1;::; i;::; n (que equivale a suponer que t; < x, < Bt-i(t;) =
(t¡ -t,-1)2
t;+k+i), entonces se puede tomar como función interpolante a (t;+2-t¡_ ¡ )(ti+l -t¡_¡ )
¿ c BJ(x).
n
Al igual que en el caso k = 2, se puede obtener una solución sencilla para el sistema
S(x) = j de ecuaciones; a saber, asignando valores arbitrarios a C-2 y a c_ 1, y luego calculando
j=l
recursivamente los valores de c0, c¡, ... , Cn -l, mediante la ecuación (11). Esta forma
Los coeficientes en esta ecuación se obtienen resolviendo el siguiente sistema lineal de de resolver el sistema (11) no es recomendable, debido a que no se explota la presencia de
ecuaciones: los dos parámetros extras c_2 y c_ 1. Es común que se imponga una condición adicional
n
sobre el spline en los nudos t1 y tn , es decir en cada extremo del intervalo en cuestión.
¿B}(x;)Cj = f(x¡ ) (i;::; i;::; n). (7 ) Por ejemplo, las condiciones para el spline natural se definen como S" (t 1 ) = S" (t.) = O.
j=l
El sistema de ecuaciones que se requiere resolver para el spline natural interpolante
Esta solución al problema de interpolación no es necesariamente la única. Echaremos se compone de la ecuación (11), junto con un par de ecuaciones adicionales proporcio
un vistazo a esta falta de unicidad al considerar el caso especial de la interpolación en nadas en los problemas 8 a 1O. Para orientarse acerca de la interpolación por splines y
los nudos. Suponga que x; = t,. El problema de interpolación para estos nodos requiere el arreglo de los cálculos el lector puede consultar a de Boor [1984]. (En ese libro, BJ
la solución del sistema denota un spline de grado k- l.)
L C Bj(t ) = f(t¡)
00
¡ (1 � i � n). (8)
j=-oo
j Métodos de aproximación no interpolatorios
Para ilustrar los métodos de aproximación no interpolatorios recurrimos a un mé
El caso más sencillo, k = O, se resuelve de inmediato usando BJ(t¡ ) = 8ij. Por lo tanto, todo muy elegante propuesto por Schoenberg [1967]. Dada una función!, definimos
tenemos Cj = f(tj) para 1 ;::;j;::; n. Como B}(t¡ ) = Bi-1.j, el caso k = 1 se resuelve de una función spline Sf mediante la ecuación
manera idéntica. Por ello c¡_1 = f(t;) para 1 � i � n.
Para resolver el problema de interpolación cuando k = 2, necesitamos el siguiente
¿ f(x;)Bf
00
1
hecho (véase el Prob. 2 de la Sec. 6.5): Sf = x¡ = k(t,:+1 +· · ·+l;+kl (12)
i=-oo
2 t¡ -t¡_¡ � li+I -t¡ �
Bj (t;) = - --0;-1,j+t ºi-2.j· (9)
l¡+¡ -t¡ _¡ ¡+¡ -t¡ _¡ Cuando k = O tomamos X¡ = t¡. En este caso no tenemos nada nuevo, debido a que la
ecuación (12) se reduce al esquema de interpolación discutido previamente. El mismo
De la ecuación (9) se deduce de inmediato que cada ecuación lineal en el sistema (8) comentario es válido para el caso k = l. Pero para valores superiores de k la función
tendrá sólo dos de las incógnitas. De hecho, la ecuación (8) es como sigue: spline Sf definida por la ecuación (12) no interpola aj en ningún conjunto preestablecido
t¡+¡ -t¡ t¡-t¡ _¡ de nodos. (Tales operadores reciben el nombre de operadores de cuasi interpolación.)
Ci- 2+---C¡_¡ - f(ti ) (1 � i;;; n). (10)
t¡+---
¡ -t¡_¡ l¡+t -t¡_¡ Las principales propiedades de este esquema de aproximación son las siguientes:
360 Capítulo 6 Aproximación defunciones *6.6 S plines-E: aplicaciones 361
El intervalo [to, tn] también se denota con [a, b], y suponemos que se tiene una función Demostración Recuerde queBf f O y que I:;:_ Bf = 1. Entonces, con una g como la de la ecuación
f definida en [a, b]. Se extiende la función! como se muestra en la figura 6.9. Así, sif
00
(13),
es continua en [a, b] también lo será su extensión.
lg(x) -f(x)I =/ t J(ti+2)B(
f x) -f(x) t Bf(x)/
i 00
Sea continua o no la función!, definimos su módulo de continuidad mediante la
i oo
ecuación:
ro(f;o) = máx IJ(x) -f(t)I.
[s-r[;;í6
Sif es una función continua definida en un intervalo [a, b], entonces es uniformemente
= litoo [f(t;+z)-f(x)]Bf(x)/
continua en ese intervalo. Esto significa que para cualquier e > O existe una o > O tal
� ¿ IJCt;+2)-f(x)IBf(x).
00
g = (13)
i=-oo Tomando en cuenta la definición de módulo de continuidad y el problema 21, resulta:
Con ayuda de esta función podemos demostrar el siguiente resultado. Jf(t¡+z)-f(x)I � ro(f;ko) � kro(f;o). 11
362 Capítulo 6 Aproximación de funciones *6.6 Splines-E: aplicaciones 363
Distancia de una función a un espacio spline 2. Seak = 2 y/(x) = x en la ecuación (12). Demuestre queS/ = f.
El resultado anterior se puede enunciar en términos de la distancia de f al espacio 3. Demuestre que
¿ t;+1t1+2Ef(x).
00
Sif es continua, entonces 9. (Continuación) Demuestre que siS = I:;J:_00 c¡ BJ, entoncesS"(t¡) = e¡_¡, donde e¡ se ha
Iímro(f;o) = o. definido en el problema anterior.
sio
10. (Continuación) Demuestre que el interpolante spline cúbico natural para la función f es
Por consiguiente, aumentando la densidad de los nudos se puede lograr que la cota I:;J;:\ c¡ EJ, donde los coeficientes satisfacen la ecuación ( l l ) del texto y las siguientes dos
superior de la ecuación (14) tienda a cero. condiciones naturales en los extremos, correspondientes a i = 1 e i = n:
Todavía es posible decir más en los casos en que la función! tenga más derivadas. (ti+2-/¡_¡)Ci-3 -(ti+2 + li+l -li-1 - t,-2)Ci-2 + (li+I -1;-z)ci-1 = 0
11. Sean C y D dos matrices cuadradas. Demuestre que
rn i1
TEOREMA 5 Sea r < k < n. Si f E C'[to, tn], entonces (con 8 como en el teorema 4):
Conforme g recorre S!, g' recorre todo s!-1. (Véase el Prob. 14.) Entonces, tomando 13. Sea K cualquier subconjunto de R Demuestre que para que {Et.... , E�} sea linealmente
independiente sobre K es necesario y suficiente que Kn (I;, 1;+1+1) no sea vacía para 1 � i � n.
el ínfimo sobre g en la desigualdad anterior, obtenemos:
14. Use el teorema 1 para demostrar que el operador derivada es suprayectivo si va des! as!-1•
- 15. Demuestre el lema 8 de la sección 6.5 planteándolo como un corolario del teorema de
dist(f, S!) � ko dist(f', s! 1).
Schoenberg-Whitney.
Este argumento se puede repetir r - 2 veces, dando lugar a: 16. Demuestre el lema 9 de la sección 6.5 planteándolo como un corolario del teorema de
Schoenberg-Whitney.
dist(f, S!) � k'o'-1 dist(f(,-ll, s!+1-') 17. ¿Es la siguiente una versión válida del teorema de Schoenberg-Whitney? Si los nodos x; no
se han ordenado necesariamente, entonces el que la matriz (BJ(x;)) no sea singular equivale
- -
� k' 18'ro(f(r 1);8) a la afirmación de que cada intervalo (t¡, t,+k+I), para l � i � n, contiene al menos un nodo.
� k'o'llt<')II 1 18. Use el método de demostración utilizado en el teorema 14, con el fin de probar un resultado
similar para el operador de Schoenberg.
19. (Continuación) Afine el resultado obtenido en el problema 18 para el caso de nudos igual
SERIE DE PROBLEMAS *6.6 mente espaciados.
l. Demuestre que la matriz EJ(x;) que aparece en la interpolación con splines-E tiene una 20. Pruebe el teorema !, mostrando que sólon + k elementos de la sucesión Ef tienen valores
diferentes de cero en [to, 1.].
estructura de bandas. Esto significa que si EJ(x¡ ) * O y x¡ < x¡+1 para cadaj, entonces cada
fila y columna de la matriz contiene a lo más 2k + I elementos distintos de cero. 21. Demuestre que ro(/; kli) � kro(f; o).
364 Capítulo 6 Aproximación defunciones 6.7 Series de Taylor 365
6.7 Series de Taylor El siguiente teorema resulta relevante en cuanto a sus aplicaciones.
TEOREMA 2 Sea r el radio de convergencia de E:o ak(x -el. Entonces la ecuación
En esta breve sección deseamos ilustrar (y enfatizar) la utilidad de las series de Tay
lor como mecanismo para hacer aproximaciones. Es evidente que el teorema de Taylor 00
resulta útil cuando se está tratando con funciones que tienen un cierto número de de f(x)= ¿ a (x -dk
rivadas continuas. Sin embargo, pierde importancia cuando lo que se tiene son datos k=O
empíricos o funciones con un número escaso de derivadas. Cuando se están usando define unafunción continuamente diferenciable en el intervalo lx -el< r. Más aún,
funciones para las cuales se puede aplicar el teorema de Taylor, no se debería soslayar
00
la posibilidad de representarlas eficientemente mediante un polinomio de Taylor.
Recuerde que si una función f posee una derivada continua de orden (n+ 1) en un J'(x) = ¿kak(x -c/- 1
intervalo (e - 8, e+ 8), entonces k=O
y esta serie tiene a r como radio de convergencia. Finalmente, si lb-el<r y lx-cl<r,
f(x) = p.(x)+ E.(x), entonces
[t(t)dt
donde Pn es un polinomio de grado � n y En es la función residuo. Estos se definen
como: puede calcularse integrando la serie{ término a término. La serie resultante tiene a r
6
• 1 k como radio de convergencia.
p.(x) = -
k! ¡< l(c)(;,; d
A manera de resumen, diremos que este teorema nos indica que podemos integrar
l y derivar una serie de potencias término a término en el intervalo de convergencia.
E (;,;)= _1 _¡<n+ )(� )(x - cr+¡ l�x -el<O.
n (n+ 1)! x Para ilustrar la manera en que funciona este teorema, pasamos a considerar una de
Un caso muy importante tiene lugar cuando e= O; esta serie se conoce como serie de
Maclaurin.
Usando el teorema de Taylor junto con un análisis de E.(;;) conformen -+ oo,
mediante:
S(;;)= -dt
1
las funciones trascendentes de orden superior, a saber, la integral seno. Ésta se define
x sent
1
(2k+ l)!
1·
Estas series se conocen como series de potencias. A continuación tenemos un teorema k=O
acerca de la convergencia de las series de potencias. 00
x sent 1
-dt = '°'(-1/-- t2k dt
0 t {:o (2k+ l)! 0
TEOREMA 1 Para toda serie de potencias
00 00
x2k+l
¿ak(x -d S(x)= ¿(- l/
k=O k=O (2k+ 1)!(2k+ 1)
existe un número r en el intervalo [O, oo] tal que la serie diverge para lx - el > r y La serie que hemos derivado para representar S(x) converge rápidamente para valores
converge para lx -el<r. pequeños de x. Así, con sólo diez términos podemos calcular S(l) con veinte lugares
decimales de precisión. (Véase el Prob. 37.)
El número r (puede ser+oo) se denomina radio de convergencia de la serie. Con Otro ejemplo semejante viene dado por:
frecuencia puede calcularse mediante el criterio de la razón. (Véanse los Prob. 1 y 2.) x 00 2k+l
El radio de convergencia de la serie del coseno, ecuación (1), es+oo; el de la serie de la r ldt= " X
(3)
lo k=O (2k+ l)k!
L.;
ecuación (2) es+ l.
366 Capítulo 6 Aproximación de funciones 6.7 Series de Taylor 367
SERIE DE PROBLEMAS 6.7 12. Usando la prueba del cociente (véanse los Prob. 2 y 3), demuestre que si lím._00 la,/a,+i l
l. Demuestre que [:0ak i y z:0ak X( -d tienen el mismo radio de convergencia. ¿Qué
existe o es + oo, entonces es el radio de convergencia de [:0ak (x-el.
sucede para [:0ak i+p, con p, un número natural? 13. Sea ao = 1 yª••l = (2 + (-l)"Ja, paran ;;; l. ¿Cuál es el radio de convergencia de
L..1c=
'\"00
oak(x-e) ?
k
¿(-1)\x- li f(x) = -
¡ o
X ln(l-t)
--dt -
( oo <x -
t
� 1)
2
- ¡· e_¡i.dt
1 9. Haga una crítica de las siguientes igualdades y realice las correcciones pertinentes.
¡
7. Encuentre una serie de potencias para la función = lux-
¿ 2k(2k)! ·
'e'-I k=O
f(x)= -dt
o t 20. Encuentre la serie de Maclaurin para la función
r
Use la serie que obtuvo para calcular f(l) con tres cifras significativas. (En este ejemplo
quiere decir dos lugares decimales.)Finalmente, demuestre que la suma de todos los términos ¡- cost
que no incluyó es tan pequeña que no afecta el resultado. Nota cultural: La función! juega f(x) = dt
un papel muy importante en matemáticas aplicadas. Para mayor información consulte la lo --t- .
obra de Abramowitz y Stegun [1964, cap. 5].
8. Demuestre que la funciónf( x) = z:0 ?/( k!i) es una solución de la ecuación diferencial Nota cultural: esta función se llama en ocasiones integral coseno y se denota porCin (x).
Esta nomenclatura no ha sido estandarizada.
y' =xy. 21. Encuentre la serie de Maclaurin para la integral de Fresnel:
¡·
9. Seaao = 1 yª• = a, 1/[2(n + l)] paran ;;; l. ¿Cuál es el radio de convergencia de
-
z:oakb
cp(x) = sent2dt
< 1 O. Escriba un subprograma o procedimiento que calcule la integral seno con diez decimales de
precisión para cualquierx en -
[ 1, !]. Permita que el número de términos en la serie dependa
de x. Programe una señal de salida que indique que se ha cometido un error cuando se use z:
z:
22. F( unción recíproca) Suponga que f(x) = 0aki, conao = l. Entonces, en alguna
unax que esté fuera del intervalo permitido.
vecindad de O, 1/f(x) está bien definida. Suponga una serie 0 bkl para la función
1 1. Seaf(x) la función cuya serie aparece en el problema 9. ¿Cuál es la serie de potencias para recíproca, y determine recursivamente las bk a partir del hecho de que el producto de las dos
J'(x)? Basta con qne obtenga una relación de recurrencias para los coeficientes. series es l.
368 Capítulo 6 Aproximación de funciones *6.8 La mejor aproximación: teoría de mínimos cuadrados 369
23. (Continuación) Use el resultado del problema anterior para encontrar las series de Maclau *6.8 La mejor aproximación: teoría de mínimos cuadrados
rin de x/(e' -1).
24. (Continuación) Demuestre que los coeficientes bk del problema anterior tienen la propiedad Uno de los problemas clásicos de la mejor aproximación se puede enunciar como sigue:
de que b3= bs= b7= ... =O. Nota cultural: los coeficientes k!bk se llaman números de se define una función continua f sobre un intervalo [a, b]. Para n fija, buscamos un
Bemoulli, y con frecuencia se denotan con Bo, B1, ... , Bk, polinomio p de a lo más grado n que se aparte tan poco como sea posible de f. La
25. (Continuació�) Demuestre que los números de Bemoulli en el problema 24 tienen la pro- desviación se puede medir mediante la expresión:
piedad:
n-1 máx. lf (x) -p(x)I,
¿( n Bk =O (n > 1).
a��b
k=O Se reconoce de inmediato que esto es muy distinto de interpolar simplementef en algún
Pruebe que conBo= 1 esta ecuación puede usarse para calcular B1, B2, ... , Bk yqueBo = 1, conjunto fijo de nodos y es distinto también de truncar simplemente la serie de Taylor
B1 = -i, B2 = !,Bi =O,B4=--fo. def, si es que tiene una. De hecho, tenemos aquí un problema extrema!, cuya solución
no es del todo evidente.
26. Demuestre que si r es el radio de convergencia de ¿;;:
k
0 akx , entonces el radio de la serie
derivada, I;:O kak} -1, también es r. Existencia
27. Demuestre que El problema lineal general de la mejor aproximación engloba al que acabamos de
-= 1-2 ¿X
00
x+I k
I I 1).
(X< describir. En este caso consideramos cualquier espacio lineal normado E y un subespacio
x-1 k=O G en E. Para cualquier f E E,la distancia de f a G se define como la cantidad
28. Encuentre una serie de potencias alrededor deO para la función cscx-1/x. dist(f, G) = ínf 11! -gll-
29. Encuentre la serie de Maclaurin para la función/ definida por la ecuación:
gEG
Ésta es una medida de la desviación mínima absoluta que esperamos alcanzar al aproxi
-ln(l -x)f(x)= mar el vector f mediante un elemento de G. Si un elemento g de G tiene la propiedad
1-x·
X
El subespacio G sería entonces el espacio II. de todos los polinomios de grado ;;;;
¿;;:,0 e¡} si co= 1 yen= (n/3)Cn-1 para n> 1?
33. ¿Cuál es el radio de convergencia de n, interpretado como un subespacio de C[a, b]. La sección 6.9 se ocupa de este tipo
particular de aproximación.
34. ¿ Cuál es el radio de convergencia de la serie ¿;:,0 e¡}, donde co = 1 y Cn+I =
(3n + 3)cn/(n + 5)? En el problema general de la mejor aproximación, uno de los puntos más importantes
es si existe una mejor aproximación paraf. A continuación presentamos un importante
35. Encuentre los tres primeros términos en la serie de potencias de x para e'°". teorema de existencia.
36. Encuentre una serie de potencias para TEOREMA 1 Si G es un subespacio de dimensión finita en un espacio lineal normado E, entonces
l e-'dt
cada punto de E posee al menos una mejor aproximación en G.
Demostración Seaf un elemento de E. Cualquier candidato, g, para ser una mejor aproximación def,
37. Demuestre que en la serie para la integral seno S(l) sólo se necesitan 10 términos para debe competir con el elemento cero de G; por ende,
obtener 20 lugares decimales de precisión. ¿Cuántos se necesitan para obtener 25 lugares
decimales? 11!-gil ;;;; 11!-011 = 11!11,
370 Capítulo 6 Aproximación de funciones *6.8 La mejor aproximación: teoría de mínimos cuadrados 371
Podemos por lo tanto reducir nuestra búsqueda al conjunto donde w es una función positiva y continua que ha sido fijada. En cualquier espacio con
producto interno escribimos f.L g si sucede que (f, g} = O. Escribimos f.LG si f.L g
K = {g E G: llg - fil � llfll}. para toda g E G.
El conjunto K es cerrado y acotado. Ya que G es de dimensión finita, entonces K es LEMA 1 En un espacio con producto interno se satisfacen las siguientes propiedades:
compacto. Dado que la función g 1-+ 11! - gll es continua, podemos hacer alusión al
(a) (I:7=1 aJ¡, g} = I:7=1 a¡(J¡, g}
teorema que nos dice que una función continua con valores reales sobre un conjunto
compacto alcanza su ínfimo. 11 (b) 11! + g¡¡2 = 111112 + 2(!, g} + ¡¡g¡¡2
(c) Sif.Lg, entonces 11! + gll2 = 11!112 + llgll2
Unicidad (d) l(J,g}I � ll!llllgll
(e) 11! + gll2 + 11! - gll 2 = 211!112 + 2llgf
En general, las llamadas mejores aproximaciones no son únicas. Un ejemplo sen
cillo surge al aproximarf(x) = cosx sobre el intervalo [O , n/2] mediante una función
g(x) = u, donde 11. es una constante a nuestra disposición. La figura 6.1O muestra varias Demostración La parte (a) se demuestra por inducción matemática, usando los axiomas (i) y (ii). La
mejores aproximaciones, para el caso en que se ha adoptado la norma en la ecuación (1). parte (b) usa los axiomas (i) y (ii), y la definición en (iv):
2 2
= 11111 + 2(f, g) + llgll
La parte (c), la ley pitagórica, se deduce de inmediato de la parte (b). La parte (d) es la
desigualdad de Schwarz. Para demostrarla suponga que no es válida para el par (f, g):
(f, g} = tf(x)g(x)w(x)dx, 11! - hll = IIU - g) + (g - hlll = 11! - gl¡ + llg - hll � 11! - gf
2 2 2 2
372 Capítulo 6 Aproximación de funciones *6.8 La mejor aproximación: teoría de mínimos cuadrados 373
h E Gy A. > O. Entonces
Para demostrar el enunciado inverso suponga que ges una mejor aproximación af. Sea Sistemas ortonormales
Existe otra fonna de enfocar los problemas de aproximación en un espacio con
-11! - gll
2 2 producto interno, y consiste en construir primero sistemas ortononnales. Decimos que
o ;; 11! - g +A.hll
2 2 2 una sucesión finita o infinita de vectoresf1 ,fz, ... en un espacio con producto interno es
= 11! - gll2 +2A.(f - g, h) +A. llhll - 11! - gll
(i,;: j)
ortogonal si
= A.{ 2(! - g, h ) +A.llhll2 }.
(f¡,[) = o
Haciendo que A. L O, obtenemos que (f - g, h) � O. La misma desigualdad debe ser Se dice que el conjunto es ortonormal si para toda i y j
satisfecha por -h, y por lo tanto (f - g, h) ;; O. Por lo tanto (f - g, h) = O. Ya que h
fue elegida de manera arbitraria en G,f - gj_G. 11 (J¡,Jj) = Oij
Observe que en esta situación la unicidad de la mejor aproximación es una conse Tales sistemas se adaptan muy bien para hacer aproximaciones gracias al siguiente
cuencia de la demostración que se acaba de ofrecer. resultado.
TEOREMA 3 Sea {g¡, gz, ..., gn} un sistema ortonormal en un espacio con producto interno denotado
Ecuaciones normales por E. La mejor aproximación a f mediante un elemento I:7=1 c;g; se obtiene si y sólo
si C¡ = (j, g¡).
mediante un polinomio g(.x) = c 1x + c2x3 + c3.x5 en el intervalo [-1, l], y donde se
Ejemplo 1 Use el teorema 2 para determinar la mejor aproximación de la funciónf(x) = senx
Demostración Sea Gel subespacio generado por g1, g2,••• , gn. Observe que la mejor aproximación,
I:;=1 c;g;, se caracteriza, al igual que en el teorema 2, por la condición:
utiliza la nonna
l/2
1
2
ll!II = { [ [f(x)J t1x }
Respuesta La función óptima g posee la propiedad ! - gJ_G, donde Ges el espacio generado por f- ¿ c;g;J_G.
1 n
g1 (x) = x, g2(x) = x3, y g3 (x) = .x5. Por lo tanto, se pide que (g- g ) = Opara i = l ,
f, ¡
i=l
2, 3. Estas ecuaciones se pueden escribir como:
c1 (g¡, g;) +c2(gz,g ) +c 3(g3, g;) = (f, g;) e; = (f, g;). Por otra parte,! - I:7=1 c;g; será ortogonal a G si y sólo si es ortogonal a
Por ello sólo necesitamos verificar que esta condición es equivalente a la condición
¡ cada vector gj de la base. Al calcular los productos internos requeridos obtenemos (para
(i = 1, 2, 3)
y se llaman ecuaciones normales en este problema. Suministrando los detalles se 1 ;;j;; n):
obtiene:
- cg g =( g) c g
r x2dx+cz ¡ x4dx+c3 ¡ x 6dx= ¡ X·Senxdx
v t ¡ ¡, ) f, j -t ¡(g¡, j)
l l l l
C1
Í-1 -1 -1 -1
! [:]=
3 5 C¡ U-�
[�'�;,:] •
[ 5l 'il
1 l Es un hecho conocido que una base ortononnal para nuestro subespacio tridimensional
'i 9 l l puede estar constituida por los siguientes tres polinomios de Legendre:
g¡(X) =x/v2}3
donde a. = sen 1 y � = cos l. Usando los valores numéricos para a. y � resolvetnos
el sistema y obtenemos c 1 :::; 348.9, c2 � -1491.1, y c3 � 1275.6. Los valores tan
gz(x) = (5x3 - 3x)/ jffj
grandes que se obtienen para estos coeficientes son un síntoma de que nos encontramos
Por tanto la solución a nuestro problema es el polinomio Z::;=1 c;g;, donde e; = (f. g;). El proceso de Gram-Schmidt
Así
Centramos por ahora nuestra atención en la cuestión de cómo obtener bases orto
c¡ = /fii / x · senxdx = 2/fii(a.- �) norrnales. En el siguiente teorema se describe el proceso de Gram-Schrnidt.
L
1
TEOREMA 4 Sea {v1, v2, ... , v.} una base de un subespacio U en un espacio con producto interno.
= /fii senx(5x3 -3x) dx = 2/fji (-18a.+ 28�) Defina recursivamente:
i-
c2
i-1
c3 = yll/2 L senx(63x -7 0x + 15x)dx = 2yll/2(4320 a.- 6728�)
5 3 u¡ = ( V¡-
11
�
1 (v;, u¡)u¡ ) 1 (V¡-
11 -
�
(v;, u¡)u¡) (i= 1,2, ... ,n)
donde a.= sen 1 y � = cos l. Usando valores numéricos para a. y � obtenemos las
Entonces {u ¡ , u2, . .. , Un} es una base ortonormal de U.
soluciones aproximadasc1 � 0 .7377 1, c2 � -6.7391x 10-2, yc3 � 2.2904x 10-3• En
vista de que ya se cuenta con la base ortonormal, estos resultados se pueden obtener con un
menor esfuerzo recurriendo a este segundo método. Dése cuenta de que los coeficientes Demostración Denote con U; al espacio generado por {V¡, v2, ... , v.}. Demostraremos por inducción
son de tamaño modesto, lo cual significa que nuestra base está bien condicionada. sobre i que
(i) {u¡, u2, ... , u;} e U;
Ley pitagórica generalizada y desigualdad de Bessel (ii) { u1, uz, ... , u;} es ortonorrnal
El siguiente resultado es una ley pitagórica generalizada. Para i = 1 vemos de inmediato que u 1 E U1 y que [Ju¡JJ = l. Suponga ahora que (i)
y (ii) son ciertas para el índice i - l . Entonces {u1, u2, ••• , ui-1} e U;_ 1 y v; � U;_ 1.
LEMA 2 Si [g¡, g2, ..., g.] es ortogonal, entonces
Por lo tanto v; no es una combinación lineal de u1, u2, ... , u;-¡, y el denominador en
la definición de u; no es O. Esto implica que u;_ está bien definida y pertenece a U¡ . Por
2
a¡g
=
a JJg; JJ ende {u1, u2, ... , u;} e U;. En vista de que z::;::(v;, u¡)u¡ es la mejor aproximación de
\\t f t 7 v; en U;_ 1 (por el teorema3 ), tenemos que, como consecuencia del teorema2, u¡J_U;-1.
Resulta entonces que u;j_{u1, u2, ... , u;- 1} y que, obviamente, JJu; JJ = l . 1111
Demostración Sin = 1, la igualdad es Óbvia. Si la ecuación es correcta paran, entonces resulta también
correcta paran+ I, debido a que ª•+lgn +l es ortogonal a z::;=1 a¡g;, y se utiliza el caso Una simplificación sorprendente ocurre cuando el proceso de Gram-Schrnidt se
1 t,, r � 1 t.,, J
elemental de la ley pitagórica: aplica a los monomios 1, x, x2, ... (en su orden natural). En el teorema siguiente
se puede utilizar cualquier producto interno mientras satisfaga la propiedad de que para
+ll�,,�dl' tres funciones cualesquiera:
(fg, h) = (f. gh).
• Es obvio que ésto es válido para el producto interno que comunmente se usa:
l
[ af lJg; IJ
2
+ ª�+1 JJg.+iJ12
=
i=l
LEMA 3 Si [g¡, g2, . .., g.] es ortonormal, entonces TEOREMA 5 La sucesión de polinomios definida inductivamente como sigue es ortogonal:
n
2 2 p.(x) = (x- a.)p.-1(x)- bnPn-z(x), (n;;; 2)
[ 1(f. g¡) 1 � IIJIJ
i=l
con po(x) = 1, p¡(x) = x - a¡, y
Demostración Tome g * = Z::7=1 (f. g; )g;. Por el teorema 3 , g* es la mejor aproximación af en el
espacio G generado por las g;. El teorema 2 nos indica que f - g* J_G. Utilizando dos ª• = (xp.-1,Pn-1)/(Pn-1,Pn-1)
veces la ley pitagórica obtenemos: bn = (XPn-l,Pn-z)/(Pn-2,Pn-2) ·
n
2
11!11
2
=
JI!- g* JJ
2
+ IJg * 112 ;;; IJg* 11 = 2
[ 1 (f. g; ) 1 11 Demostración Al ver las fórmulas resulta evidente que cadaPn es un polinomio mónico de grado n, y
i=l por lo tanto es diferente de cero. Como consecuencia de ello los denominadores en las
376 Cap ít ulo 6 Aproximación defanciones *6.8 La mejor aproxi mación: teoría de míni mos cuad rados 377
fórmulas no son cero. Demostramos ahora, por inducción sobren , que (p n,p¡) = O para Respuesta Haciendo el cambio de variablex = cose, escribimos el producto interno como sigue:
i = O, 1, ... , n - l. Paran = O no hay nada que demostrar. Paran = 1 observamos que
por definición dea 1:
(J,g) = ['f( cose)g ( cose) d e.
(pi,Po) = ( (x-a¡)po,Po) = (xpo,Po)-a¡ (po, Po) = O.
Suponga ahora la validez de nuestra afirmación para un índice n - 1, donde n � 2. Ya que T.(x) = cos(n cos- 1 x), entonces ( sin ;1: m)
Entonces:
( Pn, Pn- 2) = (X Pn-l, Pn- 2 )-an( Pn-!, Pn-2) -bn(Pn- 2, Pn- 2 ) = O = -2 [ cos(n+m) e+ cos(n-m) e]d e
11·o
Para cualquier i = O, 1 , ... , n- 3, tenemos: ! sen(n+m)0 sen(n-m)0]"=O
= 2 [ n+m + 1
= (x Pn-1, Pt)-an( Pn-1,pi)-bn( Pn- 2 , Pn-i) n-m
( Pn, Pt) 0
= (Pn-1, xp¡ )
Algoritmo
= (Pn-1,Pi+1+ai+ t Pi+b¡ 1
+ Pi-1)= O
Si se da un polinomio en la forma u = r;=O C¡p¡, donde los polinomiosp¡ son los
En el último paso hemos utilizado la fórmula de recurrencia para representar xp¡ . Sj descritos en el teorema5, entonces el cálculo de u(x) se puede llevar a cabo con eficiencia
i = O, deberíamos entonces escribir xpo =p¡+a1po. 1111 haciendo lo siguiente:
f
Ejemplo 2 Utilice el teorema5, con el producto interno J(x)g(x) dx, para obtener los polinomios dn+2 O
de Legendre.
i-
dn+l O i-
Resp ue sta Los primeros cálculos se efectúan como sigue: for k = n, n- 1, ..., O do
po(x) = 1 d k <-- C k+ (x -a k+1)d k +l-b k+2d k+2
end.
a¡= (xpo,Po)/(po,Po) =O
p¡(x) =X Entonces u(x ) = do.
a2 = (xp1,p1)/(p1,P1) =O He aquí la demostración de la validez del algoritmo:
Demostración Un polinomio mónico arbitrario de grado n puede representarse como Pn - ¿7,;;-¿ c;p¡. Demostración Usando el proceso de Gram-Schmidt podemos encontrar una matriz B den x n tal que
La norma de esta función será un mínimo si los vectores n
n-1
¿ C¡p;ll -l·
v; = ¿B¡,u,
Pn - n s=I
i=O
formen un conjunto ortonormal. Entonces
Esta relación de ortogonalidad se logra tomando c; = O para toda i, debido a que
111
Pn.lIIn-1 ·
Oij = (v;, Vj) = ( �B¡,u, , �BjrUr)
Si [u1, u2, .. .] es un sistema ortonormal en un espacio con producto interno E, se
define una familia de operadores de proyección Pn mediante la ecuación:
= ¿¿B¡,(u,,u,)B;.
n
Pnf = ¿(f. u;)u¡.
í=l Esta ecuación es de la forma I = BG Br. Por consiguiente Ges no singular. 11
TEOREMA 7 Los operadores Pn poseen las siguientes propiedades Resulta imposible resistirse a la tentación de ofrecer otra demostración de este
resultado. En vista de la observación hecha inmediatamente después del teorema 2,
(a) Pn mapea linealmente a los elementos de E al subespacio Un generado por el problema de aproximación descrito líneas arriba tiene una solución única. También
Ut, Uz, •.. , Un, resulta única la expresión de u en términos de la base, u = ¿ c;u;, por ser ésta una
(b) Cada Pn es una proyección; es decir, P� = Pn. propiedad de cualquier base. Por lo tanto nuestro problema tiene una solución única, a
(c) Cada Pn es una transformación ortogonal en el sentido de quef - Pnf .lUn. saber, (e¡, c2, ..., Cn)- Ya que esto es cierto para cualquier!, la matriz de coeficientes G
debe ser no singular.
(d) P,f es la mejor aproximación def en Un. El lema nos asegura que las ecuaciones normales tienen una solución única. Por
(e) Cada Pn es autoadjunta: (Pnf. g) = (f. Png). ello, en principio, cualquier base del subespacio U se puede emplear para resolver
el problema de aproximación. En la práctica debe tomarse en cuenta el número de
111 condición de la matriz de Gram. Recuerde las observaciones hechas acerca de la matriz
Demostración Se deja al lector. (Véase el Prob. 18.)
de Hilbert en la sección 2.3. Ésta es la matriz de Gram para las funciones u¡(x) = xj-I
cuando se utiliza el producto interno (f. g) = J0 f(x)g(x) dx. Desde el punto de vista
1
La matriz de Gram del condicionamiento, las bases más satisfactorias son las bases ortonormales, ya que
sus matrices de Gram son la matriz identidad.
Los problemas de aproximación en espacios con producto interno se pueden resolver
de manera elemental sin utilizar bases ortonormales. Si {u1, u2,... , un} es cualquier
base de un subespacio U, y si deseamos calcular una mejor aproximación en U para un SERIE DE PROBLEMAS *6.8
elemento f, podemos proceder como sigue. Para que un elemento u E U sea la mejor
aproximación def, según el teorema 2, es necesario y suficiente que u -f.LU. Una l. Usando la norma del supremo, encuentre la mejor aproximación a sen x mediante una función
u(x) = ;l.x en el intervalo [O, rc/2].
condición equivalente es que (u - f. u;) = O para 1 ;;; i ;;; n. Al escribir u= LJ=t CjUj
encontramos la condición: 2. Resuelva el problema 1 usando la norma cuadrática usual.
3. Suponga que deseamos aproximar una función par mediante un polinomio de grado � n,
6. Demuestre que la conocida matriz de Hilbert, con elementos 19. Sea t. el múltiplo mónico de T,. Encuentre la relación de recurrencia de tres términos
satisfecha por To, T1 , ....
a,¡=(l+i+1T1 (0 � i,j�n)
20. Encuentre una fórmula para dist(f, G), donde G es el subespacio generado por un conjunto
1
ortonormal (g¡, g2, ...,.g.].
es una matriz de Gram para las funciones 1, x, :r?-, ...,x•- •
21. Deduzca las siguientes expresiones para polinomios de Legendre
7. En un espacio vectorial con base { V¡, v2, ..., v.}, cualquier otra base se obtiene mediante
una transformación lineal
p¡(X)=xi - 3 x
5
Uj = ¿agvi (l�j�n) 6 3
4
p4(x) = x - x2 +
i=l 1 35
510 l 5
para la cual su matriz de coeficientes es no singular. Demuestre que la matriz que se genera ps(x)=x - -x +-x
de esta manera a partir del proceso de Gram-Schmidt es una matriz triangular superior. 9 21
8. Suponga, en la relación de recurrencia de tres términos que da lugar a los polinomios orto
gonales, que el producto interno está dado por (f, g) = fJ(x)g(x)w(x)dx, donde w es una
función par. Demuestre que a. = O para toda n. Demuestre también que p. es par si n es *6.9 La mejor aproximación: teoría de Chebyshev
par, y que Pn es impar si n es impar.
9. Sea {V¡, v2, ..., v.} un conjunto ortogonal de vectores en un espacio con producto interno. En esta sección vamos a trabajar con el espacio C(X) de todas la funciones reales y
¿Qué elección de coeficientes da lugar a un valor mínimo de 11/ - I:;=1 c¡V¡IJ? No elimine
la posibilidad de que alguno de los vectores v pueda ser cero. continuas definidas en un espacio topológico X. Supondremos que X es un espacio
de Hausdorff compacto. El lector que desee evitar toda consideración de la topología
10. En el algoritmo para calcular una combinación lineal de polinomios ortogonales, demuestre general puede imaginar que X es un conjunto cerrado y acotado en el espacio real, JRk
que se necesitan a lo más 2n-1 multiplicaciones. En el caso de los polinomios de Chebyshev
basta con n multiplicaciones. como, por ejemplo, un intervalo [a, b] en IR.
El espacio C(X) deviene un espacio normado (en realidad, un espacio de Banach)
11. Demuestre que b. es positivo en la fórmula de recurrencia de tres términos para generar si definimos la norma como:
polinomios ortogonales, probando que bn = 11Pn-dl /IIPn-2 IJ .
2 2
llf 11 = m áx IJ(x)I
xEX
12. Demuestre que para los polinomios de Legendre los coeficientes en la fórmula de recurrencia
de tres términos son a. = O ybn = (n - 1)2/[(2n - 1)(2n - 3)]. Esta norma es la que utilizaremos en esta sección.
13 . ¿Cómo tendría que cambiarse la fórmula de recurrencia de tres términos para generar poli El siguiente es un problema importante, relativo a la mejor aproximación en el
nomios ortogonales, si quisiéramos generar un sistema ortononnal? espacio C(X). Se dan un elemento f de C(X) y un subespacio de dimensión finita G
14. Aplique el proceso de Gram-Schmidt a la sucesión de funciones x >-+ (:r?- - 1)1, k = O, de C(X). Se pide aproximar aj con un elemento de G de la mejor manera posible. En
f
1, 2, ... usando el producto interno (u, v) = 1 u(x)v(x)dx. Demuestre que si la suce
consecuencia (al igual que en la sección precedente) definimos:
sión ortonormal resultante se renorrnaliza para formar una sucesión de polinomios m6nicos,
entonces estos últimos satisfacen una relación de recurrencia de la forma dist(f, G) = ínf 11! - gll
gEG
q.+1(x) = xq.(x) -b.qn-i(x).
y no preguntamos si hay una mejor aproximación, es decir, un elemento g E G, tal que
Dé una fórmula parab•. Determine los primeros tres q-polinomios.
15. Demuestre que un conjunto ortogonal de elementos diferentes de cero es por necesidad IIJ - gll = dist(J, G).
linealmente independiente.
16. Sea A una transformación lineal sobre un espacio con producto interno. Suponga que A Esta pregunta recibió una respuesta afirmativa en la sección precedente (teorema 1).
es auto-adjunta, lo cual significa que (Af,g) = (f,Ag) para toda/ y g. Demuestre que Podemos, por lo tanto, emprender la tarea de determinar mejores aproximaciones en
las soluciones de la ecuación AJ = V que corresponden a valores diferentes de "A. son este contexto. Para tener una idea de qué es lo que debemos esperar, consideremos un
mutuamente ortogonales. ejemplo.
17. Sea [u 1, u2, •••] una sucesión ortonormal. Demuestre que para cualquier/, los coeficientes
de Fourier (f, u.) son de cuadrado sumable: I:: 1 (f, u,)2 < oo. Ejemplo 1 Describa la mejor aproximación de la funciónf(x) = cosx en el intervalo [O, !l por un
18. Demuestre el teorema 7. elemento de I11 .
*6.9 La mejor aproximación: teoría de Chebyshev 383
382 Capítulo 6 Aproximación de funciones
Así, necesitamos entender con exactitud cuáles elementos ! de C(X) tienen el cero
como mejor aproximación en G, es decir, tienen la propiedad de que 11! 11 = dist(J, G).
Para un elementof E C(X) se define el conjunto crítico como:
TEOREMA 1 Para un elementof y un subespacio G de C(X), las siguientes propiedades son equiva
lentes:
(i) 11! 11 = dist(J, G);
,r/2
Figura 6.11 Aproximación de cos x en el intervalo [O, 1t/2]. (ii) ningún elemento de G tiene los mismos signos que f en crit (!).
Demostración Suponga que (i) es falso. Entonces para alguna g E G, 11!-gjj< I IJII- Para x E crit (!)
Respuesta Los elementos de II1 son funciones lineales, y sus gráficas son líneas rectas. La gráfica definimos cr(x) = sgnf(x) y escribimos:
de cos x junto con una función lineal no muy alejada de ella se muestran en la figura 6.11.
¿Es la función lineal que se muestra una mejor aproximación? No, pues se puede po cr(x)[f(x)- g(x)] � lf(x)-g(x)J � 11!-g ll< llfll = lf(x)I = cr(x)f(x)
ner más abajo,reduciendo la máxima desviación. También su pendiente se puede ajustar.
Así,cr(x)g(x) > O y g(x) tiene el mismo signo que f(x) en crit (f).
Para la mejor aproximación habrá tres puntos en los que se da la desviación máxima.
Ahora suponga que (ii) es falso. Sea g(x)f(x) > O en crit (!). No hay pérdida de
Estos serán, al parecer, los puntos O, � y un punto � en el interior del intervalo. Si
generalidad si suponemos que JJg 11 = l . Como crit (!) es un conjunto compacto y gf es
denotamos la desviación máxima con o y la función lineal con g(x) tenemos:
una función continua, hay una E positiva, tal que g(x)f(x) > E en crit (!). Sea
g(O) -f(O) = o O= {x E X:g(x)f(x) > e}
g@-f@=-0
{ En tal caso, O es un conjunto abierto que contiene a crit (!). Su complemento es un
g(1t/2)-f(1t/2) = o conjunto compacto ajeno a crit (!). Por lo tanto,
g'(�)-f'(�) = o
Estas cuatro ecuaciones sirven para determinar o,� y los dos coeficientes de la ecuación
p = máx{l f(x) ! : x E X\ O}< ll!II
g(x) = C¡ + CzX. 11 Tratemos ahora de aproximar a f por medio de \g, en donde el coeficiente A. ha de
escogerse juiciosamente. Veamos qué es lo que se necesita. En primer lugar,queremos
que la siguiente designaldad sea válida en un sentido puntual para los puntos de O:
Caracterizaciones de las mejores aproximaciones
Antes de pasar a la caracterización de las mejores aproximaciones, haremos una (f- \g)2 = J2- 2\gf + "-2 i � 11! 11 - 2A.e + "-
2 2
= 11!1! 2- \ (2e- A)< ll!ll 2
observación:
Como es fácil de comprobar, esto es cierto si O< A.< 2e . En segundo lugar, para los
LEMA 1 Las propiedades siguientes son equivalentes para todo elemento g E G: puntos restantes (es decir, aquellos en X\ 0) queremos que
COROLARIO 2 Para que un elemento g E Il¡ sea una mejor aproximación de un elementof E C[a,b] es
necesario y suficiente que lafunciónf -g tome el valor± 11! -gil con signo alternante
en al menos tres puntos de [a, b].
t t
Para que g sea una mejor aproximación de un elementof E C(X) es necesario y suficiente
convexas de puntos seleccionados de un conjunto dado S se llama cáscara convexa de
con que el conjunto crítico def -g contenga alguno de los tres patrones que se muestran
en lafigura 6.12: S. Así,
co (S ) = { 9;u¡: k E N, u; E S, 9; � 0, 9; = 1}
Convexidad
LEMA 2 Sea K un conjunto convexo y cerrado del" (o de cualquier espacio de Hilbert). En este
Se dice que un conjunto K en un espacio lineal es convexo si contiene a todo caso K contiene un único punto de norma mínima. Es más, las siguientes condiciones
segmento rectilíneo que conecte a dos puntos cualesquiera de K. Formalmente, esto se son equivalentes para K:
expresa mediante la implicación: (i) O r/. K;
(ii) hay un vector v tal que (v, u) > O para todo vector u E K.
K]
U, V E
9u+ (1 -9)v E K
O � 9 � ¡ :::} Demostración Sea p = ínf{lluJJ: u E K}. Seleccione Uj E k de modo que Jlujll ...... p. La sucesión [uj]
es de Cauchy, pues por la ley del paralelogramo:
!Ju; - Ujll
2
= 2¡Judl2 + 2llujll2 - liu¡ + ujf
...., = 2lludl2 + 2llu¡ll2 - 4ll (u¡ + u¡)/2112
/ ..............
� 2IJudJ + 21Juj¡¡z -4p2 ...... 2p2 + 2p 2 -4p 2 = O.
2
/ "'O...,
o-------f-___ .....o
", ............... Como el espacio es completo, la sucesión de Cauchy es convergente, digamos uj ...... u.
En tal caso u E K, pues K es cerrado, y por continuidad IJulJ = p. La unicidad se
// / / '\
'\
demuestra por medio de un argumento semejante al anterior: si uy u' son dos elementos
con norma p en K, entonces
------�
// '\,\.
'--- Jiu - u'JJ � 2JJulJ + 2JJu'JJ -4p2 = O.
2
o 2 2
\. Si (ii ) es cierto, (i) se sigue de inmediato. Para el recíproco, suponga que (i) es cierto.
'\ Sea v un punto de norma mínima en K. Tenemos que, para una u E K arbitraria y
9 E (O, 1)
Figura 6.12 Puntos críticos en una mejor aproximación. O� IJ9u+ (1 - 9)vll2 -1Jvll2 = IJ9(u - v) + vll2 - IJvJl 2 = 92 llu -vl2 + 29(u -v, v).
386 Capítulo 6 Aproximación de funciones *6.9 La mejor aproximación: teoría de Chebyshev 387
Demostración Si (ii) es falso, entonces podemos escribir O = ¿J=l 0;u; para ciertos 0; > O y u; E S
Esto demuestra que
2 + 2(u-v, v). convenientemente elegidos. Para toda v E JR• tenemos que
O� e¡¡u- vll
Permitiendo que e 1 O, concluimos que (u-v. v) � O, de donde (v, u) ;;; (v, v) > O. 11
O= (v, O) = ¿ 0;(v,u¡)
El resultado siguiente se conoce como el teorema de Carathéodory. i=l
TEOREMA 2 Sea S un subconjunto de un espacio lineal de dimensión n. Cada punto de la cáscara Está claro que no todos los números (v, u,) pueden ser positivos. Por consiguiente, (i) es
convexa de S es una combinación convexa de no más de n + 1 puntos de S. falso.
Para el recíproco, suponga que (ii) es cierto. Por el lema 3, co(S) es compacto.
Ahora se puede aplicar el lema 2 para concluir que (i) es cierto. 11
Demostración Sea p un punto de la cáscara convexa de S. No habrá pérdida de la generalidad si
suponemos que pes O. En tal caso tenemos que O = ¿�=l 0;u; para ciertos 0; E [O, 1)
Y u; E S, convenientemente elegidos, con í::J=l 0; = l. Es más, podemos suponer Solución de Chebyshev a las ecuaciones lineales
que dicha representación de O es mínima (es decir, k es tan pequeña como es posible). COROLARIO 4 Sea A una matriz de m x n, b E lRm, x E lR", cr; = sgn(Ax- b); e I= {i: !(Ax- b);I =
Se sigue de lo anterior que 0; > O para i = 1, ... , k. Si k � n + l, la demostración
habrá terminado. Por el contrario, si k > n + l, encuéntrese una combinación lineal no IIAx- b[[ oo }. Para que x minimice la norma IJAx- blJ00 es necesario y suficiente que
,
O sea un elemento de la cáscara convexa del conjunto { cr,A;: i E I}, donde A, denota la
trivial ¿�2 l;u; = O. Tome ").. 1 = O. Observe que para todos los números reales t, i-ésima fila de A.
¿�= 1 (0; + tl1)u; = O. Haga
$(t) = mín (0; + tl;). Demostración Cuando pretendemos minimizar [[Ax - blJ00 , buscamos una combinación lineal de las
l;;ái;;ák columnas de A lo más cercana posible a b. Los vectores columna de A los interpretamos
como funciones del conjunto T = {1.2, . ..,m}. El elemento que se aproxima es b
La función $ es continua, y $(0) > O. Además, para alguna t, $(t) < O. Por lo tanto, y el subespacio G de aproxirnantes es el espacio columna de A. Por el teorema de
hay una t0 tal que $(10) = O. Si 0( = 0; + t0l;, tenemos que 0( � O, mín 0( = O y Kolmogorov, la solución x se caracteriza por el hecho de que Iringún elemento de G
Sí = 01 > O. Por consiguiente, en la expresión¿J= 1 e;u;= O uno de los términos tiene tiene los signos cr; en l. De manera equivalente, el sistema cr,(Av); > O, i E I, es
a e; = O. Dividiendo por¿ 0f, podemos expresar a O como una combinación convexa inconsistente. Como este último se puede escribir en la forma (cr;A;, v) > O, i E /, el
de k- 1 elementos de S, lo cual contradice la supuesta minirnalidad de k. 11 teorema 3 nos proporciona una condición equivalente,a saber, O E co{cr;A; : i E I}. 11
LEMA 3 En todo espacio lineal normado de dimensión finita, la cáscara convexa de un conjunto Ejemplo 2 Utilice el resultado anterior para determinar si x = (2, 3f es la solución de Chebyshev
compacto es compacta. del sistema
5xi -7x2 = -14
Demostración Sea S un conjunto compacto en un espacio X de dimensión n. Considere el conjunto V
de todos los (n + 2)-tuplos 3X¡ + Xz = 8
Para la implicación (iii) => (iv), suponga (iii). Por el teorema de Carathéodory podemos
Xz
escribir:
k
( 3, 1) O = ¿ 0¡/(x¡)g(x¡)
"'l q-,+- .b.....!:: 1 1 1 .- X¡ i=l
(6, -1)
donde k � n + 1, 0; > O y x¡ E crít (!). Poniendo A¡ = 0¡/(x¡), resulta que A¡/(x¡) > O
y O = ¿�1 A¡g(x¡). La última ecuación nos muestra, utilizando la definición de g, que
paraj = 1, ... , n O = I:1=r A¡ gj(x¡) = (¿1=r "-i.x¡)(gi). Dado que G está generado por
las funciones gj, podemos ver que el funcional I:J=l A¡.X¡ aniquila a G.
Para la implicación (iv) => (i), suponga (iv). Si h E G entonces.
x(f)=f(x) (f E C(X)).
Subespacios de Haar
La linealidad de x se infiere mediante un simple cálculo: Definición Un subespacio G de C(X) de dimensión n es un subespacio de Haar si ningún elemento
de G (salvo 0) tienen o más ceros en X.
.x(af+�g)=(aj+�g)(x) = af(x)+�g(x)=ax(!)+�.x(g)
Ejemplo 4 El subespacio IIn-l de los polinomios de grado< n es un subespacio de Haar en C(X)
TEOREMA 4 Sean G un subespacio de C(X) de dimensión n y f un elemento de C(X). Los siguientes para todo subconjunto X de lR.
enunciados son equivalentes: El resultado siguiente nos muestra que los subespacios de Haar se adecúan muy
bien a los problemas de interpolación.
(i) 11/ 11 = dist(.f. G).
(ii) Ningún elemento de G tiene los mismos signos que f(x) en crít (!). LEMA 4 Un subespacio G de C(X) de dimensión n es un subespacio de Haar si y sólo si para
cualesquiera números reales A¡, A2, ... , "-n y puntos distintos y arbitrarios x1, x2, ... ,
(iii) O se halla en la cáscara convexa del conjunto {f(x)g(x):x E crít (/)}.
Xn de X, hay un único elemento g de G tal que g(x¡) = A¡ (1 � i � n).
(iv) Hay un funcional r:=I A¡.X¡ que aniquila a G y que satisface
X¡ E crít (!), ).¡ f(x¡ ) > O y k � n + l .
Demostración Tome una base {g 1, g2, ..• , g.} de G. El problema de interpolación consiste en determi
nar C¡, Cz, ••• , Cn tales que
Demostración La implicación (i) => (ii) es parte de la demostración del teorema de Kolmogorov que
ya hemos realizado.
L Cjgj(X ) = A¡
n
Para la implicación (ii) => (iii) supongamos (ii). Sea {g 1, gz, ... , g.} una base de ¡ (1 � i �n)
G. Es imposible que encontremos C¡, c2, ... , Cn tales que I:7= 1 c¡f(x)g;(x) > O en i=l
crít (/). Como esta desigualdad se puede escribir como (c,f(x)g(x)) > O, el teorema de
las desigualdades lineales implica que O se halla en la cáscara convexa del conjunto Si esto es resoluble para todas las elecciones de A¡, entonces la matriz con elementos
de puntos: gj(x¡) es no singular, y el problema homogéneo correspondiente (A¡ = 0) sólo tendrá la
{f(x)g(x):x E crít(f)} solución trivial (e¡=O para toda i). Así, ninguna combinación lineal de g¡, g2, . .. , gn
390 Capítulo 6 Aproximación defunciones *6.9 La mejor aproximación: teoria de Chebyshev 391
se puede anular en los puntos x1, x2, ••• , x•. Ésta es precisamente la propiedad de Haar TEOREMA 7 Sea G un subespacio de Haar en C(X) de dimensiónfinita, y sea A: C(X)-+ Gel mapeo
para G, pues los puntos x1, x2, .•• , Xn son arbitrarios. En vista de que el argumento es tal que IIJ -Af\l = dist (f, G). En tal caso, para cada f hay un número positivo A(/)
reversible, la demostración está terminada. 11 tal que:
liAf -Ah[[� A(j) [\f -h[[ h E C(X).
En los subespacios de Haar, se puede describir las mejores aproximaciones como
sigue: Demostración Por el teorema de la unicidad fuerte, hay un número positivo y(f) con la propiedad de
que para todo g E G,
TEOREMA 5 Sean G un subespacio de Haar de C(X) de dimensión n y f E C(X). Una condición
necesaria y suficiente para que 11!1 1= dist (f, G) es que haya un funcional de la forma lit -gil � 11!-AJII +r(f) IIAJ-g[\.
I:;7;¡
A;x; que aniquile a G y satisfaga X¡ E crít (/) y A¡f (x;) > O. Haciendo g=Ah, tenemos que
y(f) [IAJ -Ah\
[ � [\f -Ah[\- llf -Af ll
Demostración El teorema precedente nos da la misma condición necesaria y suficiente cuando n +I
se reemplaza por k. La ecuación ¿�=! A;g(x;)=O no puede ser válida de un modo no � 11!- h[I +llh-Ah[[ - 11!-Af 11
trivial, a menos que k � n +l . Para verificar lo anterior, tome una k � n y utilice la � 11!- h[l +llh-AJ 11 - lit -AJII
propiedad de interpolación de G (lema 4) para elegir una g E G tal que g(x;)= A¡ . En
consecuencia, tendríamosO= I::=l A;g(x,)= ¿�=! AT- illll � lit -hll +llh-!II +11!-AJII - 11!- A/11
=2 11!-hll 11
Unicidad de las mejores aproximaciones
Teorema de la alternancia de Chebyshev
El siguiente resultado se conoce como el teorema de la unicidad fuerte.
LEMA 5 Sea G un subespacio de Haar en C[a, b] de dimensión n. Suponga que tenemos n +I
puntos tales que a � Xo < X¡ < · · · < Xn � b y I:7=o t,.¡g(x;) = O para toda g E G. Si
TEOREMA 6 Sean G un subespacio de Haar de C(X) de dimensión finita y f un elemento de C(X) tal I:7=o \ Ad :ta O, entonces los números A van alternando el signo: A¡ A¡_¡ <O parai= 1,
que \\! 11 = dist (f, G). Hay una constante positiva y (que depende de f) con la propiedad 2, ..., n.
de que para todo g E G, \lf +gil � ll!ll +y[\g[\.
Demostración Para todo j E {1, 2, ...,n} razonamos como sigue. Por el lema 4, hay en G un único
[, elemento gj con la subsecuente propiedad de interpolación:
Demostración Sean la dimensión de G. Por el teorema anterior, haypuntos xo, x 1, ••• , Xn en crít (f)
y coeficientes positivos 0; tales que I:7=o 0,cr, g(x;) =O para toda g E G, donde cr; = gj(x;)=O paraO�i�j-2 yparaj+l �i�n
sgn/(x;). Sea h un elemento de norma 1 en G. Ya que I:7=o 0;cr;h(x;) =O, al menos {
uno de los números cr;h(x;) es positivo. Así, máx;cr;h(x;) > O. Como esta expresión es gj(xj )= 1
continua yla superficie de la esfera unitaria de G es compacta, inferimos que Y tenemos
O= Í:A,gj(x;)=Aj -1gj(xj -1) +Aj. (1)
y= ínfmáxcr;
h i
h(x;) > O
i=O
Ahora bien, gj(xj -i) >O, pues si gj (Xj-t) fuese menor o igual queO, concluiríamos que
Si g E G yg '#O, entonces para algunai, cr;g(x;)/l!g[\ � y. Por consiguiente, gj tiene n ceros, lo que va en contra de la propiedad de Haar. Por otra parte, la ecuación
(1) indica que si alguna Aj es cero, entonces todas son cero, lo que no concuerda con
11! +gll � cr¡f (:x¡) +cr;g(x;) � +y[[gl!. 11 nuestras hipótesis. En consecuencia, la ecuación (1) muestra que Aj y\-t deben tener
signos opuestos. · 11
COROLARIO 5 Si Ges un subespacio de Haar en C(X) de dimensión finita, entonces cada elemento de El siguiente resultado es el teorema de la alternancia de Chebyshev.
C(X) tiene una única mejor aproximación en G.
TEOREMA 8 Sea G un subespacio de Haar en C[a, b] de dimensión n, y sea X un subconjunto cerrado
Demostración Sea g una mejor aproximación a un elemento f de C(X). En tal caso, O es una mejor en [a, b]. Para todo elemento f E C(X), las sigui;nte propiedades son equivalentes:
aproximación de f - g en G. Si h E G yh '# O, entonces, por el teorema precedente, (i) 11! 11 = dist (f, G); es decir; f tiene a O como mejor aproximación en G.
(ii) Hay puntos Xo < X¡ < · · · < Xn de X, tales que f (x;-1)/(x;) = -111112 para
lit - g +h[l � lit -g[\ +y[[hll > lit -g[[. 1111 1 �i� n.
392 Capítulo 6 Aproximación defunciones *6.9 La mejor aproximación: teoría de Chebyshev 393
Demostración Por el teorema precedente, (i) es equivalente a Éste es otro problema de aproximación de Chebyshev, aunque sólo comprende al con
(üi) hay puntos XQ, ••• , Xn en crít (!) y coeficientes t..o, ... , "-n tales que junto finito de puntos Xk. Después, se elige un punto Xk en X de modo que
Algoritmos Esto demuestra que la sucesión lihklli está acotada. Puesto que todas las normas son
equivalentes en el espacio G de dimensión finita, la sucesión 11hk 11 está acotada Por
En lo que resta de esta sección examinaremos ciertos problemas numéricos re consiguiente, alguna subsucesión de las hk converge a un punto h*. Dada e > O, con
lacionados con la aproximación de Chebyshev y bosquejaremos algunos algoritmos sidérese una k tal que llhk - h*IJ < e. Tome una i > k tal que llh; - h*II < e. En tales
disponibles. Tomaremos como problema básico minimizar la expresión circunstancias tenemos:
dist u G) ;;; JI! - h* JI � 11! - hk 11 + llhk - h* 11
¿ c;g;f [ ¿ c;g¡(x)[.
n n
:::; d* -
11! - hk llk - mín 11! - h;IJ.
:::; 1:;¡;:;¡k
394 Capítulo 6 Aproximación de funciones *6.9 La mejor aproximación: teoría de Chebyshev 395
La cota inferior converge monótonamente por abajo hacia d*, mientras que la cota Es más, e;?; O ya que 9�+t = 9k > O y para i � n,
superior converge monótonamente por arriba hacia d*. La cota superior 11! - hk ll,
aunque también converge a d* y es más simple, no siempre lo hace monótonamente. 0;= e;ek("'k /0k - :i..;9;)?; o.
Ahora vamos a examinar una variante de este algoritmo, llamada método de in
tercambio. En éste, el crecimiento de los conjuntos Xk se restringe, eliminando un Si dividimos la ecuación I: 0;u;= O por¿ 0;, podemos ver que O se expresa como una
elemento viejo cada vez que se añade uno nuevo. Por lo general, se utiliza este método, combinación convexa de uo, ..., Un+! en la que Uk se ha omitido. 11
aunque su validez depende de suposiciones adicionales relativas a las funciones básicas
g¡, g2, ••• , gn. El proceso que desecha un elemento y añade otro se llama intercambio.
SERIE DE PROBLEMAS *6.9
Si el subconjunto inicial X1 contiene n + 1 elementos y si hay un intercambio en cada
paso del algoritmo, entonces cada Xk tendrá exactamente n + 1 elementos. l. Resuelva para c1, c2, li y I; en el ejemplo que se dio al comienzo de esta sección.
Basándonos en el teorema de caracterización de las mejores aproximaciones, sabe 2. Encuentre la mejor aproximación de ../i por medio de un polinomio de primer grado en el
mos que en el k-ésimo paso, el origen de JRn se hallará en la cáscara convexa de los n+ I intervalo [O, 1].
vectores: 3. Demuestre que los subespacios de C[O, 1] generados por los siguientes conjuntos son subes
(2) pacios de Haar:
ek(x) (g1 (x), gz(x), ..., gn (x)) X EXk,
(i) { l,x ,x3} (ii){l,e',e "} (iii){(x+2)- ,(x+3)- 1,(x+4)- 1}
2 2 1
donde ek(x)= f(x) - hk(X). Con hk disponible, se elige el punto al que previamente nos 4. Demuestre que los subespacios de C[-1, 1 J generados por los siguientes conjuntos no son
hemos referido como xk. Es decir, xk es un punto crítico de la función/ - hk . Ahora subespacios de Haar:
uno de los puntos de Xk se reemplaza por Xk, Este intercambio se hace de modo que el (i) {1. x2,x3} (ii){[xi, fx-1[} (iii){e',x+1}
origen de JRn permanezca en la cáscara convexa de los vectores descritos en (2). Así, 5. Considere en el espacio C[O, l] el subespacio IIo de los polinomios de gradoO (es decir, las
el vector funciones constantes). Utilizando las cantidades:
ek(Xk) (g1 (xk ), gz(xk), ..., gn (Xk))
M(f)= máxf(x) y m(f)= mín /(x)
0��1 0��1
reemplazará a uno de los n + 1 vectores del conjunto previo. A continuación presentamos
un teorema que rige el intercambio y nos indica cómo se lleva éste a cabo. describa la mejor aproximación de un elemento/ en C[O, l] por medio de un elemento de
IIo.
6. Sean U-O, u¡, ... , Un n+1 puntos en lRn tales que no es posible escribir O = I:;=O 0;u; con
TEOREMA 10 Sea {Uo, u1, ... , Un+I} un conjunto de n + 2 puntos en JRn. Si O se halla en la cáscara e � O, e ,eO y mín; 0; = O. Demuestre que cada conjunto den vectores que se escoja de
convexa de {Uo, u¡, ..., Un}, entonces para alguna k � n, la aseveración sig ue siendo { Uo, U¡, . . . , Un} es una base de lRn.
cierta cuando uk se sustituye por Un+I· 7. Sea A una matriz den x (n+2). Demuestre que si el sistema
Ax=O x�O x,eQ Xn+z=O xElRn+Z
Demostración EncasodequeseaposibleescribirO = I:;=O 9;u; con9;?; O, I:7=o 9; = 1 y mín; 9; = O,
hágalo y elija k de modo que 9k = O. Es obvio que podemos sustituir uk por Un+I en la es consistente entonces para alguna k < n+2, también lo es el sistema
ecuación O= I:7=o 9;u;.
Ahora suponga que no es posible escribir O= I:7=o 9;u; con 9;?; O, I:;=0 9;= 1, Ax=O x�O x,eQ Xk=O xElRn+z
y mín; 9; = O. Por el teorema de Carathéodory, los vectores Uo, u¡, ..., Un generan un 8. Demuestre que el polinomio cuadrático de la mejor aproximación a la función cosh x en el
espacio de dimensión n, que obviamente es JRn. Por consiguiente, podemos encontrar [ 1,1] es a+bx2, donde b = cosh1-1 y a se obtiene al resolver el siguiente par
intervalo -
lo, ..., A.n tales que Un+! = I:;=O l; u;. Además, existen 9; > O tales que O= I:;=O 9;u;. de ecuaciones para a y 1:
Elija k tal que lk /9k ?; 1¡ /9; para toda i. Para O � i � n, haga 0; = lk9; - l;0k. Así a= 1 +cosht-t b
2
mismo, sea e:.,_1 = ek. Observe que e�= O. Ahora tenemos que senht= 2th
9. Demuestre que la cáscara convexa de un conjunto es convexa y que es el menor conjunto
� n n
convexo que contiene el conjunto original.
¿ 0;u;= ¿9/u; + 9�+1 Un+! = ¿(lk ei- A.;0k)U¡ + 9kUn+l 10. Demuestre que toda bola cerrada {! : [[/ - gff � r} en un espacio lineal normado es
i=O i=O i=O convexa.
n n
11 . Dé un ejemplo de un conjunto convexo cuyo complemento esté acotado.
=A.k ¿9;U¡ - 9k ¿A.;U;+9k Un+!
i=O i=O 12. Dada una línea ax+f7y+e=O en el plano, con a2+ b2 > O, dé una descripción completa
del conjunto de puntos sobre la línea cuyas distancias al origen son un mínimo, utilizando
= A.k(-0k Uk)- 9k(Un+l - A.k Uk) + 9k Un+l = Ü la norma l00 para definir la distancia.
396 Capítulo 6 Aproximación de funciones *6.10 Interpolación en dimensiones m ás superiores 397
13. Seaf una función continua de (x,y) en el cuadrado O � x � I, O � y � I. Describa la Así, N es el conjunto de todas las parejas (x;, y¡) donde x; se elige del primer conjunto
mejor aproximación de f por medio de una función continua en la sola variable x.
y Y¡ del segundo. En otras palabras,
14. ¿Generan la funciones
- {(x,·,Y1
N- ·) .· 1 =
< . =< p, 1 =J
< . =< q}.
go(x, y) = 1 g1(x, y) = x gz(x. y) = y i
(2)
un subespacio de Haar en C(]R.2)? Observe que, en este caso, la notación en la ecuación (2) es más conveniente que la
15. Demuestre que el conjunto de funciones {I,x,x2, ... ,x',f} genera un subespacio de Haar notación en (1). En la figura 6.15 se muestra un ejemplo de la ecuación (2), en donde
sobre [a, b] si/">(x) > O en [a, b]. p = 4 y q= 3. Un arreglo tal de nodos se llama con frecuencia malla cartesiana. Por
conveniencia, hemos numerado los puntos sobre el eje x de izquierda a derecha, y los
16. seaf = aoTo +a1T1 +... +an+1T•.,.1, donde los Tk son polinomios de Chebyshev. Demuestre
que en el espacio rr. la mejor aproximación de f en la norma-sup sobre [-1, !] es aoTo + puntos sobre el eje y de abajo hacia arriba, aunque esto no es necesario.
a1T1 +... +a.T•. Suponga que tenemos un esquema de interpolación lineal para los nodos x 1, x2, ••.
Xp. Éste será un proceso univariado. Queremos pensar en él como un operador lineal P
de la forma
*6.10 Interpolación en dimensiones más superiores (Pf)(x) = ¿f(x;)u;(x), (3)
í= l
Tanto en el pasado como en el presente, el problema de encontrar interpolantes lisos para donde las funciones u; tienen la propiedad cardinal
funciones de varias variables ha sido una cuestión difícil que ha atraído mucha atención.
El caso multivariado muestra algunos rasgos inusuales que no están presentes en el caso U¡(X¡) = O¡¡ (1 � i,j �p). (4)
univariado, haciéndose éstos aparentes cuando el número de variables es tan sólo dos.
En consecuencia, al menos en un principio es muy poco lo que se pierde al restringir el Por ejemplo, en la interpolación polinomial ordinaria, estas funciones u; vienen dadas
análisis al caso bivariado (dos variables independientes). por la fórmula conocida de la sección 6.1:
j l
=
X - Xj
. (1 � i �p). (5)
El problema central que examinaremos es el siguiente: un conjunto de puntos de pi
interpolación (o nodos) nos es dado en el plano xy. Éstos se pueden denotar con
Note que el operador P se puede extender de manera trivial para que opere sobre funciones
(x¡ ,y¡) (xz,yz) .. . (xn, y.). (1) de dos o más variables. Así, si f es una función de (x, y), podemos escribir:
Suponemos que estos n puntos son diferentes entre sí. Con cada punto (x;, y;) se encuen
tra asociado un número real c;. Nuestro objetivo es encontrar una función fácilmente (Pf)(x,y) = ¿f(x;,y)u;(x), (6)
computable F que sea lisa, tal que i=l
Effi
computable sólo tienen un significado informal o intuitivo. Yi
Yz
Malla y producto cartesianos
y¡
El problema de interpolación que acabamos de describir se puede resolver en oca
siones por medio de un producto tensorial de métodos de interpolación univariados.
Dispongamos en primer lugar de este caso. El procedimiento se limita a una situación --+--<1>---.....--0-----.... X
X¡ Xz X¡ x,
en la que el conjunto de nodos, que denotamos con N, es un producto cartesiano:
N = {x¡,xz,... ,xp} x {Y1, Yz,... ,Yq }, Figura 6.15 Una malla cartesiana de nodos.
398 Capítulo 6 Aproximación de funciones
*6.10 Interpolación en dimensiones más superiores 399
Puede verse de inmediato que Pf es una función de dos variables que interpola af sobre
Se deja como problema demostrar que la función (P EB Q)f interpola af en todas las
las líneas verticales 0
donde las funciones v, son cualesquiera que convengan teniendo la propiedad cardinal
Respuesta Observe en primer lugar que los nodos forman una malla cartesiana, por lo que el método
V¡(yj) = Oij (1 � i,j � q). (9) del producto tensorial es aplicable. Las funciones u, y v, vienen dadas por la ecuación
(5). En este ejemplo son las siguientes:
Nuevamente, Q se puede extender para que opere sobre funciones bivariadas utilizando
la ecuación x-2 x-4 x-5 1
u1 (x) = - · - · - = --(x- 2)(x -4)(x- 5)
(Qf)(x,y) = ¿/(x,y;)v;(y), (10) l- 2 1-4 1- 5 12
'
i=l
u2(x) = (x . l)(x-4)(x- 5)
l
¿¿f(x;, Yj)u,(x)vj(y). Si la función F del ejemplo precedente se escribe como una suma de términos JyÍ ,
p q p q
=¿f(x;,y)u;(x)+¿f(x,Yj)vj(y)- aparecen los siguientes 12 términos:
i=l j=l i=l j=I
(14) 2
1, x, x2 , x3 , y, xy, x2y, x3 y.y , xy2, x2y2, x3y2 . (16)
1:,
400 Capítulo 6 Aproximación de funciones
*6.10 Interpolación en dimensiones más superiores 401
Así, estamos interpolando por medio de un subespacio de dimensión 12 de polinomios
exhibe una aparente dependencia lineal entre las funciones x H xi. En vista de que este
bivariados.La notación apropiada para este subespacio es II3 0 II2. Éste es el producto
conjunto de funciones es linealmente independiente, concluirnos que:
tensorial de dos espacios lineales, y se compone de todas las funciones de la forma
m
k-i
(x,y) H ¿a;(x)b;(y) ¿cijy5 = O (O� i�k).
i=l
i=O
en donde a; E II3 y b; E II2 • (La suma puede tener cualquier número de términos.) No En esta ecuación, Yo puede ser cualquier punto. A causa de la independencia lineal del
es difícil demostrar que una base para este espacio se compone de las funciones en (16). conjunto de funciones
Hay que enfatizar que la teoría recién bosquejada se aplica a funciones cualesquiera YHi (O�j� k)
u¡ y v¡, no sólo a polinomios. Todo lo que se necesita es la propiedad de cardinalidad. (En
concluimos que cij = O para toda i y j.
una teoría abstracta se trabaja directamente con los operadores P y Q, siendo irrelevante
el detalle de su estructura para el análisis.) 11
En el método del producto tensorial de la interpolación polinomial, el caso general
comprende polinomios bivariados del espacio IIp-1 0II q-1, donde p y q son los números
de puntos que aparecen en la ecuación (2). Una base para este espacio está dada por las COROLARIO La dimensión de ITk(lF.2) es i(k+ l)(k + 2).
funciones:
Demostración Podemos arreglar los elementos de la base de II (lF.2) que
(x,y) H xiyi (O� i�p-1,0 �j�q-1). (17) k se dieron en el teorema 1 como
sigue:
En este caso, un elemento genérico del espacio es de la forma: xk
k
x -1 xk-ly
xk-2 xk-2y x k-2y 2
¿ ¿ CijX y .
p-1 q-1
(X,y) H i i
i=Oj=O
xº xºy xºy2
· · · xºI
El grado del términox yi se define como i+j. Así, el espacio IIp-i ©IIq-l tendrá un
i
El número de elementos de la base es por consiguiente:
elemento base de grado p+ q- 2, a saber, x -11-1. Sin embargo, no contendrá todos
P
los términos de grado p+q- 2. Por ejemplo, un término como x t-2 no estará presente.
P
1
El grado de un polinomio en (x, y) se define como el mayor de los grados de los términos 1 + 2 + 3+ ...+ (k + l) = 2(k + l)(k + 2). 11111
que aparecen en él. Aquí denotaremos con IIk(lF.2) al espacio de todos los polinomios
bivariados de a lo más grado k. Un elemento típico de IIk(lF.2) es una función de la Recuerde que en el caso de una variable, IIk se puede utilizar para interpolar en
=
forma: cualquier conjunto dek+1 nodos en R Es natural que esperemos que para dos variables,
¿ ¿ c;/y = ¿
k k-i
II k(lF.2) se pueda utilizar para interpolar en cualquier conjunto den f (k + l)(k + 2)
(x,y) H i c;/yi. (18) nodos. No obstante, un simple ejemplo nos mostrará que esta espectativa no se cumple.
i=O j=O O�i+j�k
Suponga que k = 1, de modo quen = 3. Un elemento genérico de II 1 (JF.2) tiene la
forma:
TEOREMA 1 Una base de ITk(JF.2) es el conjunto de funciones:
Co + C¡X + Czy.
(x,y) H xiyj (O� i + j � k). Si intentamos resolver un problema de interpolación con tres nodos (x;, y¡), esto nos lleva
a un sistema lineal cuyo determinante es:
Demostración Está claro que este conjunto genera IIk(lF.2), por lo que sólo es necesario demostrar que
X
11 X2¡ Y2
es linealmente independiente. Suponga en consecuencia que la función en la ecuación 1 Yt 1 .
(18) es O. Si a y se le asigna un valor fijo, digamos y= Yo, entonces la ecuación
1 X3 Y3
(k-i )
¿
k
En vista de que este determinante representa el doble del área de un triángulo cuyos
¿cijY6 x;=0
i=O j=O
vértices son los tres nodos, el determinante será cero cuando los nodos sean colineales.
En este caso, el problema de interpolación será ( en general) irresoluble.
402 Capítulo 6 Aproximación de funciones *6.10 Interpolación en dimensiones más superiores 403
Geometría
Las consideraciones anteriores indican que la geometría del conjunto N de nodos
determinará si la interpolación por medio de fh(]R2) es posible para N. Por supuesto,
el número de nodos debería ser n = }(k+ l)(k+ 2). Aquí daremos algunos teoremas
relacionados con esta cuestión para aclarar lo que se conoce de este tema. El primero
de ellos se debe a Micchelli [1986a]. �
TEOREMA 2 La interpolación de datos arbitrarios por medio del subespacio I1k(]R2) es posible sobre Figura 6.16 Conjuntos de nodos para interpolación por II2 (JR.2 ).
un conjunto de !(k+ l)(k+2) nodos, si los nodos se hallan sobre líneas Lo, L 1, ••• , Lk
de tal modo que (para cada i) L; contiene exactamente i+1 nodos.
TEOREMA 3 Sean k y d dados, y haga n= (dt)· Sea Z¡, zz, ... , Z n un conjunto de n nodos dados en
JR.d . Si hay hiperplanos H ij de lR. , con 1 � i� n y 1 �j� k, tales que
Demostración Sea N el conjunto de nodos. Asumiendo las hipótesis del teorema, tenemos que #(N n
L¡) = i+1 , en donde el símbolo # se utiliza para significar el número de elementos en
U Hiv
k
un conjunto. Los conjuntos N n L; deben ser ajenos por pares, pues si no lo fuesen,
Zj E {=?- j ;é i (1 � i,j � n), (19)
tendría lugar la siguiente contradicción: v=l
k k
l entonces los datos arbitrarios en el conjunto de nodos se pueden interpolar con polino
#N < Í:#(NílL;) = L(i+1) = (k+l)(k+2). mios de II k(]Rd).
i=O i=O
2
En virtud de que el número de nodos es igual a la dimensión del espacio II k(JR.2), es su Demostración Cada hiperplano es el coojunto de ceros de una función lineal no nula, por lo que podemos
ficiente con demostrar que el problema de la interpolación homogénea tiene únicamente escribir:
la solución O. En conformidad, sea p E II k(]R2) y suponga que p(x, y) = O para cada H g = {z E JR. d : lij(z) =0},
punto (.x, y) de N. Para cada i, sea l; una función lineal que describe a L;:
donde l ij E I11(JR. d). Defina las funciones:
L; = {(.x,y) : l;(x,y) = O} (O� i � k)
II l;j(z)
k
q;(z ) = (1 � i� n).
Note que p2+4 tiene al menos k+1 ceros, a saber, los puntos de N n Lk. El teorema de j=I
Bézout (que citaremos en seguida) nos permite concluir que l k es un divisor de p. Este
argumento se puede repetir, pues (p/id+{i_ 1 tiene al menos k ceros, y lk- l debe de ser Debido a la condición (19), Z¡ no pertenece a ninguno de los hiperplanos H;¡, H;2 , ...,
un divisor de p /l k. Después de k pasos en este argumento se llega a la conclusión de
que pes divisible por l 1l2 · · ·lk. Así,p es un múltiplo escalar de l 1l2 · · ·lk pues pes a
*
H;k, por lo que l g(x;) O para 1 � j � k . Esto demuestra que q;(Z;) O. *
Nuevamente, por la condición (19), sij ;é i,entonces Zj E H;v para alguna v, y por
lo más de grado k. Dado que p se anula en N n Lo y l 1l2 ·· ·lk no, p debe ser O. 111 consiguiente l;v(Zj) y q¡(Zj) son cero. Ahora, si hacemos p¡(Z) = q;(z)/ q¡(Zi) tendremos la
propiedad cardinalp;(Zj) = 8;1. Dadoquep¡ E II k (lR."), tenemos unafórrnula lagrangiana
El teorema de Bézout dice que si p E Tik(lR.2), q E I1m(]R2) y p 2+q2 tiene más de para interpolar una función! en los nodos por medio de un polinomio de grado k:
km ceros, entonces p y q tienen un factor común que no es una constante. En vista de que
n
este teorema se limita a JR. 2, lo mismo ocurre con el teorema 2 . Más adelante veremos
una demostración algorítmica del teorema 2 que no requiere del teorema de Bézout. P(z) =Lf(z;)p;(z). 1
i=l
Ejemplo 2 El conjunto de nodos en la figura 6.16 es adecuado para su interpolación por el espacio En la figura 6.17 se muestra una configuración de nodos que satisface las hipótesis
II 2(lR.2). del teorema 3. Aquí la dimensión es d = 2, el grado es k = 2 y el número de nodos es
Para los espacios de dimensión superior JR. d, se puede dar un teorema íntimamente n=6.
relacionado con el teorema 2 . Recurrimos al problema 5, según el cual la dimensión de El siguiente es un resultado débil relativo a la interpolación polinomial en conjuntos
Tik(]Rd) es (d;k). El siguiente resultado se debe a Chung y Yao (1977]. arbitrarios de nodos.
404 Capítulo 6 Aproximación de funciones *6.10 Interpolación en dimensiones más superiores 405
TEOREMA 4 El espacio Ilk (JR2) es capaz de interpolar datos arbitrarios sobre cualquier conjunto de Está claro que Pi-1 aún interpolará af en los nodos de LkU Lk-! U ...U L¡, pues el
k + I nodos distintos en lR2. término que se ha añadido a p¡ se anula en este conjunto. A fin de que Pi-! interpole a
f en los nodos de L¡_ ¡, escribimos:
Demostración Si los nodos son (xi, Yi), con O � i � k, seleccionamos una función lineal
f(x) = p¡ (x) + r(x)(Mk-1 · ..l;)(x) X ENílLi-1,
l(x,y) = ax+ by+ c
de donde inferimos que r debería interpolar a (f - p¡)/( Mk-! ...l¡) en N n L¡_ 1. Por
con la propiedad de que los k + I números ti = l(xi, Yi) son diferentes entre sí. (Véase el teorema 4, hay una r E IT¡_ 1 (JR2) que cumple con esta tarea. Por último, observe que
el Prob. 17.) Sif es la función que vamos a interpolar, encontramos p E Ilk(JR) tal que PH E Ilk (JR2), pues r es de grado i - I y ( Mk-1 ...e¡) es de grado k - i + l . Este
p(t¡ ) = f(x¡, y¡). En tal caso p o e E Ilk (JR2 ) y
•
algoritmo fue descubierto por Micchelli [1986a].
Un hecho interesante es que ningún subespacio de C(JR2) de dimensión n sirve para
( p o l)(Xi, y¡) = p(l(Xi, y¡)) = p(ti) = f(X¡, y¡) interpolar en conjuntos arbitrarios den nodos (salvo el caso trivial en que n = 1). Esto
Se ha dado en llamar función cresta a toda función de laformaf al, con e E II1 (JR2). quizá fue advertido por primera vez por Haar en 1918, dando el siguiente argumento.
Su gráfica es una superficie reglada, pues f o e permanece constante sobre cada línea Suponga dadas n funciones u1, u2 , ... , un en C(JR2). Sean dados n nodos en JR2, digamos
e(x, y) = 11.. El teorema 4 tiene una extensión obvia a JRd. p¡ = (x;, y;). Si queremos interpolar en estos nodos utilizando las funciones base u¡,
tendremos que resolver un sistema lineal cuyo determinante es:
a veces cero, aun para nodos distintos. El hecho de que dos nodos se puedan mover El siguiente es un algoritmo para computar F(x,y) en el ejemplo anterior:
en JR2 intercambiando lugares sin jamás coincidir es una característica de JR2, JR3, .•• ,
pero no de lR1. Esto explica por qué la interpolación en JR2, JR.3, •.• , se debe abordar de inputn,x,y
un modo diferente que en lR 1• Lo que usualmente se hace es fijar primero los nodos y input (x;,y;,e¡) (1 � i � n)
después preguntar cuáles son los subespacios de funciones interpolantes más adecuados.
for i = 1,2,...,n do
d; = (x-x;)2 +( y-Y;)2
Interpolación de Shepard
forj = 1,2,...,n do
Existe un método sumamente general de este tipo (en el que el subespacio depende
dij = (x;-x¡)2 +(y¡-y¡)2
de los nodos), conocido como interpolación de Shepard, en honor a su creador, Shepard
[1968]. Hágase una lista: end
end
L II d /d .
n n
p; = (x,,y;) (1 � i � n), (20)
F(x,y) = C¡ j ij
de los (distintos) nodos. Vamos a utilizar a p y q para denotar elementos genéricos de JR.2, i=I i=I
fai
lo que hará la extensión a JR3 , JR.4, . • • , conceptualmente transparente. Después, elegimos
una función real$ sobre JR.2 x JR.2 sujeta a la condición única (No se ha hecho intento alguno para hacer eficiente este algoritmo. Contiene muchas
duplicaciones.)
$(p,q) = O si y sólo si p = q, (21) Otra versión del método de Shepard parte de la hipótesis adicional de que$ es una
función no negativa. Después, haga
Dos ejemplos que vienen a la memoria son $(p. q) = JJp - qJJ y $(p,q) = JJp -qjJ2.
n
II ¿ v;(p)
Después establecemos algunas funciones cardinales en exacta analogía con las fórmulas n
de Lagrange de la aproximación univariada. Esto se hace como sigue: v;( p) = $( p,pj) v(p) = w;(p) = v;(p)/v(p). (24)
i=I i=I
II $(p;,p
n fai
$(p,pj)
U¡(p) = (1 � i � n). (22)
j=I
j) Dadas nuestras hipótesis sobre$, tenemos que v;(pj) = O si i *j y v,(p) > O para todos
fai los puntos, con la excepción de p¡, ..., Pi-1, Pi+h ... , Pn· De esto se sigue que v( p) > O
y que w; está bien definida. Por su construcción, w,(p¡) = O ij y O � w;(p) � l. Es más,
Es fácil ver que estas funciones tienen la propiedad cardinal: I;;=l w;(p) = l. El proceso de interpolación está dado por la ecuación:
1
408 Capítulo 6 Aproximación de funciones
*6.10 Interpolación en dimensiones más superiores 409
punto cuestionable x = O. La derivada direccional de g en cero se obtiene diferenciando
la función G(t) = lltullµ , dondeµ es un vector unitario que determina la dirección. Dado
que G(t) = ltlµ, la derivada en t = O no existe cuando O< µ � 1, mas paraµ > 1,
G'(O)= O.
til
La fórmula para w; se puede dar de dos formas:
t
j,,k j;,k
La segunda ecuación se debe utilizar con cuidado, pues la parte derecha de la igualdad El tipo más fácil de interpolación sobre una triangulación es la función lineal por
adopta la forma indeterminada oo/oo en X¡. partes que interpola a una función f en todos los vértices de todos los triángulos. En
Un método local de interpolación multivariada de Franke y Little está concebido cualquier triángulo T; estará prescrita una función lineal:
para que los datos en un nodo influyan muy poco en la función de interpolación en
los puntos alejados de ese nodo. Dado un conjunto de nodos (x;, y¡), con 1 � i ;;i; n, f;(x, y) = a;x + b;y + C¡ (x, y) ET;.
introducimos las funciones:
Los coeficientes en f; están determinados en forma única por los valores prescritos de
g;(x,y) = (1 -r;-1J(x -x;)Z + (y -y;)2): . la función en los vértices T;. Esto puede verse como una aplicación del teorema 2, pues
L1 se puede tomar en dicho teorema como uno de los lados del triángulo, y Lo puede ser
El subíndice '+' indica que cuando la cantidad de dentro del paréntesis es negativa, una línea paralela a L1 que incide con el vértice que no está en L1 •
ésta se reemplaza por O. Esto ocurrirá cuando (x,y) esté alejado del nodo (x;, y¡). El Consideremos la situación que se muestra en la figura 6.19.
parámetroµ influye en la lisura de la función. El parámetro r; controla el soporte de g;. El segmento rectilíneo que une a (x2, y 2) con (x3, y3) es común a los dos triángulos.
Así, g;(x, y)= O, si (x, y) dista más de r unidades de (x;, y;). Este segmento rectilíneo se puede representar como
Sir; se escoge como la distancia de (x;, y¡) al nodo más cercano, entonces g;(x¡, y¡) =
Oij. En este caso, interpolamos una función arbitraria! por medio de la función {t(x2, Y2) + (1 - t)(x3, y3) : O � t � I }.
n
[f(x;, y;)g¡(x, y).
i=I (X¡, J¡)
Triangulación
Hay una estrategia de carácter general para interpolar funciones en JR.2 que comienza
con el establecimiento de una triangulación. Informalmente, esto significa que en (Xi,J¡) (X4, J4)
un principio los nodos se unen para formar triángulos. Al final, se tiene una familia
de triángulos T1 , Ti, ... , Tm . Esta colección de triángulos es lo que consideramos una
triangulación. Deben cumplirse las siguientes reglas:
l. Cada nodo de interpolación deberá ser el vértice de algún triángulo T;.
2. Cada vértice de un triángulo deberá ser un nodo.
3. Si un nodo pertenece a un triángulo, deberá ser uno de sus vértices. (Xi,Y1)
El propósito de la regla 3 es evitar construcciones como las que se muestran en la
figura 6.18. Figura 6.19.
410 Capítulo 6 Apro ximación de funciones *6.10 Interpolación en dimensiones más superiores 411
La variable t puede considerarse como una coordenada para los puntos sobre el seg Mínimos cuadrados móviles
mento. La función lineal l1, cuando se limita a este segmento, será una función lineal
con la sola variable t, es decir, Otro procedimiento muy versátil para alisar e interpolar funciones multivariadas es
el método de los mínimos cuadrados móviles. Primero lo vamos a explicar en su forma
a¡(txz + (1 - t)X3)+ b¡(lyz + (1 - t)y3) + C¡ general y después daremos algunos ejemplos específicos.
Comenzamos con un conjunto X que es el dominio de las funciones implicadas.
Por ejemplo, X puede ser IR, IR.2 , o alguno de sus subconjuntos. Después, se da un
o conjunto de nodos {x1,x2, ... , x.}. Éstos son los puntos en los que se han mostrado
(a¡Xz -a¡X3+ b1Y2 - b¡y3)t + (a¡X3 + b¡y3 + C¡) cierta función f. Así, se conocen los valoresf(x;) para1 � i � n. A fin de llevar a cabo
la aproximación, elegimos un conjunto de funciones u1, u2, • • • , um, Éstas son funciones
Esta función lineal está determinada por completo por las condiciones de interpolación reales definidas en X. Por lo general, el número m será pequeño comparado con n.
en (x2, y2) y (x3, y3). Lo mismo se puede decir de la función lineal lz. De este modo En el método de los mínimos cuadrados que nos es familiar, nos es dado un conjunto
l1 y f2 coinciden en este segmento rectilíneo, y la función lineal por partes definida en de pesos no negativos w; � O. Nosotros tratamos de encontrar coeficientes c 1, c2, ..• , cm
T1 U T2 es continua Esto demuestra el siguiente resultado. que minimicen la expresión
TEOREMA 5 Sea {Ti, T2, ..., Tm} una triangulación en el plano. La función lineal por partes que
toma valores prescritos en todos los vértices de todos los triángulos T; es continua. tt n
r
f <X¡) -
m
� CjUj(X¡)
]2
W¡.
Ahora considere el uso de funciones cuadráticas por partes sobre una triangulación. Ésta es la suma de los cuadrados de los residuos. Si escribimos
En cada triángulo T¡, se prescribirá un polinomio de segundo grado:
(f. g) = :EJ(x;)g(x¡)W; 11! 11 = /(jJi¡,
q¡(x, y) = a1x2 + azxy +a3y2 + a.ix + asy + il6- i=l
Serán necesarias seis condiciones para determinar los seis coeficientes. Uno de tales es aplicable la teoría de la aproximación en un espacio con producto interno, y la solución
conjuntos de condiciones consiste en los valores en los vértices y en los puntos medios al problema de la minimización está caracterizada por la condición de ortogonalidad:
de los lados del triángulo. Nuevamente, una aplicación del teorema 2 demuestra que esta m
interpolación es siempre posible en forma única. En realidad, en ese teorema, Lz puede
ser un lado del triángulo, L1 la línea que pasa por los puntos medios que no están en Lz y
f- L
j=I
CjUj l.U¡ (1 � i � m).
Lo una línea que contiene al vértice restante y a ningún otro nodo. (Yéase la Fig. 6.20.)
Mediante un razonamiento similar al del caso anterior podemos ver que la función global Esto nos lleva a las ecuaciones normales:
cuadrática por partes será continua, ya que los tres valores prescritos de la función en el
m
lado de un triángulo determinan a la función cuadrática de una variable en dicho lado.
¿ c¡(uj, u;) = (f. u;) (1 � i � m).
---- ----Lo
j=I
¿En qué difiere el método de los mínimos cuadrados móviles del procedimiento
----
recién descrito? En que ahora se permite que los pesos w; sean funciones dex. Se puede
conservar el formalismo del método de los mínimos cuadrados, aunque la siguiente
----
-
-
-L, (f. g). = ¿f(x;)g(x¡)w¡(x).
i=I
Demuestre que si U y V son de dimensión finita, entonces dim(U 0 V) = dim U · dim V. n fn(l/v'3)
.
2 0.519615
19. Demuestre que para todo operador L de la forma 3 0.523892
4 0.523577
Lf = ¿f(x¡)W¡ 5 0.523600
i=l 6 0.523599
las siguientes propiedades son equivalentes: 7 0.523599
(i) Para toda/, mín/(x¡) � Lf � má xf(x¡)
La tabla nos muestra que en el sexto convergente se ha alcanzado una precisión de seis
(Ü) W¡ ;;; Q y¿;;=! W¡ = l.
lugares decimales.
416 Capítulo 6 Aproximación de funciones *6.11 Fracciones continuas 417
Fórmulas recursivas TEOREMA 1 Sean {a.}�1 y {bn}�1 dos sucesiones dadas, Y {A.}�0 y {B.}�0 las
sucesiones
definidas por las fórmulas (9) y (10). Se tiene que
La tarea de evaluar una fracción continua no es tan sencilla como la de evaluar
una serie. En el caso de una serie infinita, digamos [:,1 ak, calculamos las sumas
parciales Sn=[;=! ak por medio de la fórmula Sn+I =Sn +an+I · Consideremos ahora A.
Cn = (n � 1). (11)
el problema análogo en el caso de una fracción continua: Bn
C=��2 ... (5) Demostración La validez de la ecuación (8) ya fue verificada para n = 1, 2 y 3. Ahora suponga que la
b ¡ b 2+b3+ ecuación (8) es verdadera para 1, 2, ..., n -l. En tal caso
Queremos descubrir un algoritmo recursivo para calcular los convergentes sucesivos:
ª
a¡ a2 a3 ª•-I ª• fn (X)=Ín -1
en.----· · ·---. ( 6) ( b. : X)
b ¡+ b z+ b3+ bn -1+ bn
_ An -1 +An -2a./(bn +x)
Para su uso temporal, introducimos las funciones - Bn -1 +Bn -za./(bn +x)
f.(x)=
a¡ a2 a3 ... ªn-1 . ª• (7)
_ An -1(bn +x) +An -zan
- Bn-1(b. +x) +Bn -2an
b¡+b2+b 3+ bn -i+bn +X
_ An -l bn +An-zan +An-!X
Es obvio que -
Bn -l bn +Bn -zan +Bn -!X
c.=fn(O).
_ An +An -!X
- 0
Para obtener f.( x) a partir de fn-I (x) observemos en primer lugar que Bn +Bn -!X
El patrón que aquí emerge sugiere que Muchas funciones especiales que surgen en las matemáticas aplicadas se pueden
desarrollar en fracciones continuas. Algunas fuentes de información son Abramowitz
An +An -IX y Stegun [1964] y los libros de texto Khovanskii [1963], Perron [1929] y Wall [1948].
fn (X) = (n � 1). (8) A continuación indicamos un procedimiento por medio del cual se puede obtener una
Bn +Bn-!X
fracción continua a partir de una serie.
donde
Ao=O, A¡ =a1 TEOREMA2
{An = bn An -1 +an An -2 (9) 00
( n � 2) 1 1 xr x? x;_¡
¿
k=I X
-
k X¡-X¡ + 2-X2 +x3-
x Xn -1 +x.- (12)
Bo = 1, B1 = br
{Bn = bnBn -1 +a.Bn -2 (10)
(n � 2) Demostración La demostración es por inducción, y se deja como un ejercicio al lector. 111
418 Capítulo 6 Aproximación de funciones *6.11 Fracciones continuas 419
Para ilustrar cómo se puede utilizar este teorema, construimos una fracción continua 2. Demuestre que
para la serie de Maclaurin de tan- 1 x: y'x=1+2 ( l+l+ ...
I+ ) '
y V V
1 x3 :r:5 x1
tan- x=x--+---+··· donde v= i(x - 1).
3 5 7
1 1
= -+--+-- +--+···
1 1 <3. Escriba un progama para calcular y'x por medio de la ecuación el problema 2. Calcule v'io,
x-1 -3x-3 5x-5 -7x-7 v'ioo, vTiifü y v!OOOO imprimiendo una tabla con los primeros 50 valores convergentes
en cada caso.
_ (x-1)2 (-3x-3)2 (5x-5)2
- 1 i - 3 3 5 )- (5x-s) +(-7x-7)- <4_ Escriba un programa para calcular tan-1 (1/v3) sin utilizar variables subindizadas, y com
x- - x- +(-3x )- (-3x- ) +(5x-
pare sus resultados con los que se dan en el texto.
x -x2 -9x2 -25x2
= 5. Demuestre que
l+x2 - 3+-3x2 +5+5x2 - 7-
vb 2 b ..!!:_..!!:_..!!:_ ___
0bserve que si tanto el numerador como el denominador de una de las fracciones que
+a=
2b+2b+2b+
+
componen una fracción continua se multiplican por la misma cantidad, el numerador de 6. Para la fracción continua del problema I , demuestre que
la siguiente fracción componente se verá afectado de la misma manera. (¿Por qué?)
Las ecuaciones (9), (10) y (11) se pueden utilizar para aproximar tan- 1 x para un A.
valor dado de x cuando .=
C A,..¡·
ª"= -(2n - 3)2x2 bn = (-1)"[(2n - 3)x2 - (2n - 1)]
y 7. Para la fracción continua del problema 2, demuestre que
para n ;;:; 2. No obstante, el algoritmo para calcular tan- 1 x a través de la fracción
continua es mucho más complicado que el que se basa en el cómputo de las sumas
parciales en la serie de Maclaurin, y produce la misma sucesión de números. Observe
e_ vA..-- A••1·
que la fracción continua de Lambert (1) para tan- 1 x no es la misma que la que se deriva
de la serie de Maclaurin. Para investigar con mayor amplitud esta cuestión, calculemos 8. Compare dos métodos para calcular los valores de la función
tan- 1 (1/y3), utilizando las sumas parciales en la serie:
f(x ) = [ e_¡i.dt,
n fn( l/v3)
0.577350
2 0.513200 a saber, la expansión en series de Taylor que se da en el problema 6 de la sección 6.7 y la
3 0.526030 fracción continua
4
5
0.522976
0.523767 f(x) = ./ir. - !e-x'
2 2
(..!._!_2.2_�.··).
x+2x x+2x+x
6 0.523551 + +
7 0.523612 9. Demuestre que todo número real en el intervalo O < x < 1 se puede expresar como una
8 0.523595 fracción continua (posiblemente limitada) en la forma:
9 0.523600
10 0.523598 I 1 1
11 0.523599 x= ---···
b¡ b2+bi+
+
12 0.523599
donde cada b, es un entero positivo.
Al comparar esta tabla con la que se produce a partir de la fracción continua (1), podemos
ver que la fracción continua converge más rápido que la serie de este ejemplo. 10. Demuestre que si
a¡ a2 a¡
X=---···
b1+ b2+ b1+
SERIE DE PROBLEMAS *6.11
con todos los a, y b, positivos, entonces los convergentes de la fracción son alternativamente
l. Demuestre que mayores y menores que x .
..!...!...!. 1
!+ !+ !+ ... = 2(V5 -1). 11. Demuestre que f,, es creciente si y sólo si B. > A. utilizando la notación de la ecuación (8).
420 Capítulo 6 Aproximación de funciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 421
12. Cuente el número de operaciones extensas comprendidas en el cómputo de c. a partir de 24. Suponiendo que la siguiente fracción continua converge, encuentre su valor :
A./Bn cuando se utilizan las fónnulas (9 ) y (10).
1 1 1 1 ...
13 . Demuestre que dos convergentes sucesivos cualesquiera de la fracción continua que aparece
en la ecuación (11 ) cumplen con la siguiente ecuación: 6+6+6+6+
g.(x) = p.(x)/q.(x),
X XQ X¡ Xz Xn
donde 1( )
y Yo y¡ Y2 Yn
po(x)= O, p¡(x)= 1
{
Pn+i (x) = xp.(x)+ (n+1 )Pn-i(x).
entonces hay un único polinomio p de grado ;;;; n que interpola los datos. En otras
y palabras,
qo(x) = !, q1(x) =x p(X)j = Yj 0
( ;;¡;j ;;¡; n). 2( )
{
qn+i(x) = xq.(x)+ (n+ l)qn-1(x).
Los puntosXo,x 1, ••• ,x. se supone que son todos diferentes entre sí, mientras que a los
'23. Escriba un programa de cómputo que evalúe la fracción continua para tan-1 x, tal como se datos Yj no se les impone restricción alguna. El polinomio p se elige del espacio lineal
indica en la ecuación (1 ). Utilice el siguiente enfoque elemental: dadan, compute la función
fn (x) de la ecuación (3 ) comenzando en la parte derecha y fonnando las fracciones adecuadas.
rr., que consta de todos los polinomios de grado ;;¡; n. Una base de rr. se da por medio
Ponga a prueba su programa computando it-1 tan-1(v3) paran= 5,10 ,15,20. de las funciones bk x
( ) =xk para O ;;;; k ;;;; n.
42 2 Capítulo 6 Aproximación de funciones *6.12 Interpolación trig onométrica y la transformada rápida de Fourier 423
Serie de Fourier TEOREMA 1 Dadas las sucesiones reales [ak]�0 y [bk]�1, defina
Cuando se trata de representar fenómenos periódicos el espacio polinomial alge 1
braico rr. no es lo apropiado. En ese caso son mucho más convenientes las funciones ba =0 ª-k = ªk b_k = -bk Ck = (ak- b
2
l k).
trigonométricas. No obstante, antes de elegir las funciones trigonométricas básicas de
bemos conocer el periodo de la función en cuestión. Por conveniencia, supongamos Entonces
que la función que se está interpolando es periódica con periodo 2it. En este caso, las
¿ cki .
n n
funciones 1, cosx, cos2x, ..., y senx, sen 2x, sen3x, ... , son las adecuadas. Uno de i+ ¿(akcoskx+bksenkx)= kx
(10)
los teoremas básicos del análisis de Fourier dice que si f es de periodo 2it y tiene una k=l k=-n
primera derivada continua, entonces su serie de Fourier
Demostración La serie de la derecha se puede escribir como
i+ ¿(akcoskx+bksenkx) (3)
k=I ¡ n
¿ (ak -ibk)( coskx+isenkx). (11)
2 k=-n
converge uniformemente a f. Los coeficientes de Fourier en la serie se calculan por
medio de las fórmulas:
¡
ªk=-
¡n f(t) cos ktdt (4)
Tal como se muestra en el siguiente cálculo, la parte imaginaria de esta serie es cero:
1t -n ¡ n
¡ ¡n ¿ [aksenkx-bkcoskx]
2 k=-n
bk= - f(t)senktdt (5)
1t -n
1" bo ¡"
El susodicho teorema nos asegura que es razonable aproximar funciones con periodo 2it = ¿[a-ksen(-kx)-b_kcos(-kx)J- + ¿[aksenkx-bkcoskx]
2 2 2 k=I
con los senos y co�enos enumerados más arriba. k=l
¡n ¡n
= 2)-aksenkx+bkcoskx] + ¿[aksenkx-bkcoskx] =O
Serie de Fourier compleja 2 k=l 2 k=l
Una extensa porción de esta teoría se puede expresar de manera mucho más elegante
utilizando exponenciales complejas. Recordemos la fórmula de Euler: La parte real de la serie en ( 11) es
/ =cose+isene
¿
l
(6) ¡ n
[akcoskx+bksenkx]
en dondei2 =- 1. La serie de Fourier viene dada por 2 k=-n
n n
f(x) "' ¿ f(k )eilo:
, (7)
1
2
k=I
1
= ¿[a-kcos(-kx)+b-ksen(-kx)J+ i+ ¿[akcoskx +bkcoskx]
2 k=I
k=-oo
donde
•
f(k )= -
1 ¡n f(t)e- dt.
iJct
(8)
= �+
2
Í)akcoskx+bksenkx].
k=l
1
2 1t -n
Sif es una función real, su serie de Fourier, tal como se expone en la ecuación (3 ), Producto interior, seudoproducto interior y seudonorma
es la parte real de la serie de Fourier compleja que se da en la ecuación (7). En realidad,
lo que tenemos a partir de las ecuaciones (4), (5), (6) y (8) es que Las funciones Ek definidas por Ek (x) = � ( con k = O,± I, ± 2, ... ) forman un
•
f(k ) = -
1 ¡n f(t)[coskt-isenkt] dt = -1 (ak- ib ) (k � 0). (9)
sistema ortonormal de funciones en el espacio de Hilbert complejo l,i[-1t, 1tJ siempre y
cuando definamos el producto interior como:
2it -n 2 k
1 ¡X f(x)g(x) dx.
Ahora apelamos al siguiente teorema. (f, g) = -
21t -n
42 4 Capítulo 6 Aproximación defunciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 425
Esto significa que (Eb En) = O cuando n "# k y que (Eb Ek) = l. El cálculo que apoya Polinomios exponenciales
esta aseveración cuando n * k es
Un polinomio exponencial de a lo más grado n es cualquier función de la forma
1 n - 1 n i/o; - .
(Ek, E.) = - Ek (x)E.(x) dx = - e e UIXdx
2 re ¡-n 2re ¡-n
¿ C e = ¿ c E (x)= ¿
n n n
P(x),;,, i/o;
C (if.
I ei(k-n)J: 1= k=O
k k k k
k=O k=O
=-I l e'.(k-n)J:dx= ---
n
=0
2re -n 2re i(k - n) x=-n
La última expresión de esta ecuación explica el origen de nuestra terminología, pues
Obviamente, (Eb Ek) = I y las funciones Ek forman una sucesión ortonormal. muestra que Pes un polinomio de grado � nen la variable i'. La interpolación por
Será conveniente utilizar la siguiente notación para el producto interior: medio de polinomios exponenciales se resume en los dos siguientes resultados.
TEOREMA 3 Sea Ek lafunción Ek (x) = �. Entonces {Eo, E1, ... , EN-i} es ortonormal respecto del
N-1
l
(f.g)N = ¿f(2rej/N)g(2rej/N).
---
(12)
N O producto interior (·, ·)N definido por la ecuación (12).
j=
En realidad, esta función no es un producto interior, pues la condición (j,J)N = O no COROLARIO 1 El polinomio exponencial que interpola a unafunción predeterminada! en nodos igual
implica quef = O. Ella implica tan sólo quef(x) toma el valor cero en cada nodo 2rej/N. mente espaciados Xj = 2rej/N está dado por las ecuaciones:
Las otras propiedades de un producto interior (complejo) sí son válidas. Éstas son:
N-l
(i) (f.J)N � Ü
P= ¿ c Ek k con ck = (j, Ek)N. (14)
(Ü) (f. g)N = (g,j)N k=O
(iii) (a.f+pg,h)N =a.(j,h)N+p(g,h)N
Junto a este seudoproducto interior hay una seudonorma definida por: Demostración Utilizando la fórmula para Ck, calculamos el valor del polinomio exponencial en un nodo
arbitrario, digamos Xv- El resultado es:
= V(J,f)N,
N-1 N-l
Tenemos que 11! IIN = O si y sólo sif(2rej/N) = O para O � j � N - l. L, C E (X ) = L, (J. Ek) Ek(X )
k k v N v
El siguiente teorema desempeña un papel crucial en la interpolación. k=O k=O
k=O j=O
v
1 Si k - m es divisible por N
(Ek, Em)N _
-{ (13)
O de lo contrario. N-l N-l
Demostración La expresión que nos ocupa se puede escribir como:
= ¿J(xj)� Ej(xk)Ev (xk)¿
j=O k=O
(2:) (21) = � I:
N-1
2ni(k-m)/N
� � Ek Em [e r = L,f(xj)(Ev , Ej) N
¡=O ¡=O
j=O
Si k - mes divisible por N, entonces (k - m)/N es un entero y e2ni(k-m)/N = l. En =J(xv), 11
consecuencia, cada sumando es 1 y su promedio es l. Por el contrario, si k -m no es
divisible por N, entonces e2ni(k-m)/N '# 1, y en este caso podemos aplicar la fórmula Ejemplo 1 Utilice el corolario 1 y obtenga una fórmula explícita para el interpolante cuando N= 2.
estándar para la suma de una serie geométrica:
Respuesta En este caso, P es el polinomio exponencial de grado 1 que interpola a f en los nodos O
N-1 .
A N -1 y re. La fórmula (14) nos da:
'\'¡,¡=-
� (11, * 1).
11,-l
P(x) =�[f(O)+J(re)J +�[J(O)+f(re )e-ilt] /'
j=O
El resultado es:
e2ni(k-m) - 1
'Ju = O. 111 =�[f(O)+f(re)] +�[J(O)-J(re)]i". 11
426 Capítulo 6 Aproximación de}unciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 427
COROLARIO 2 Si n < N, entonces el polinomio exponencial I:Z=0 ckEk que mejor aproxima en el La transformada rápida de Fourier hace que el costo del cómputo descienda a una
sentido de los mínimos cuadrados a f sobre el conjunto finito: cantidad mucho más razonable, a saber, N log2 N. La siguiente tabla nos muestra lo
que esto significa para los valores grandes de N, que por lo común aparecen en el
Xj = 21tj/N (O �j � N-1), procesamiento de señales ..
se obtiene para ck = (J, Ek)N· N N2 N log2 N
Demostración Por el teorema 3, las funciones x 1-+ ; constituyen un sistema ortonormal
1a
respecto del 1024 1048576 10240
producto interior definido en la ecuación (12). Para terminar la demostración, utilice el 4096 16777216 49152
teorema 3 de la sección 6. 8. 11 16384 268435456 229375
En el corolario 1, el manejo del lenguaje sugiere que el polinomio exponencial TEOREMA 4 Sean p y q polinomios exponenciales de grado � n - I tales que, par� los puntos
que ahí se describe es único. Para verificar lo anterior, suponga que I;f;:
0 akEk es un
1
Xj = rtj/n, satisfacen:
polinomio exponencial que interpola aj en:co,x 1, •.• ,XN-I (en donde xj = 21tj/N). En
tal caso, p(Xzj) = f(Xzj) q(X2j) = f(X2j+1) (O �j � n-1). (15)
N-1
"[, akEk(xj) = f(xj) (O �j �N-1). Entonces el polinomio exponencial de grado �2n-1 que interpola a f en los puntos
k=O Xo, X¡, ... , X2n-r viene dado por:
Si multiplicamos ambos lados de la ecuación por E.(-xj) y sumamos con respecto aj,
el resultado es: 1 . 1 .
N-l N-1 N-1 P(x) = (1 + e=) p(x) + (1-e=)q(x -1t/n). (16)
2
La L k Ek(xj)E.(-Xj) = "[,J(x¡)E.(-x¡).
2
k=O j=O j=O Demostración Como p y q son de grados � n - I y eúu es de grado n, está claro que P es de
Por la ecuación (12),esto implica que grado � 2n - l. Sólo nos resta demostrar que P interpola a/ en los nodos. Para
O �j � 2n-1 tenemos que:
N-1
L a (E , E )N = (J, En)N.
k k n 1 1
P(x¡) = (1 + E.(xj))p(xj) + (1-E.(xj))q( xj-rt/n).
2
k=O 2
En vista de que (Ek, En)N = 8kn, concluimos que Observe que:
· ·¡ ·· l 1·par
En(x·) en"'J n = e"'1 = {+
1 = ..
ª• = (J, En)N = Cn. -1 ; impar.
De este modo, cuandoj es par inferimos queP(xj) = p(xj) = f(xj), mientras que cuando
Transformada rápida de Fourier j es impar, tenemos que:
Dedicamos el resto de esta sección a los aspectos computacionales de la interpo
lación trigonométrica. En particular, desarrollamos un algoritmo muy eficiente para P(x¡) = q(xj -rt/n) = q(Xj-1) = f(x¡). 1111
De este modo, Ck resulta de evaluar un polinomio de grado N-1 en el punto )..k ; se puede 1 1 ..
calcular con un costo aproximado de N multiplicaciones y N adiciones. En vista de que
YJ. = + -e-'f1'/"Ar'Í
-(J..
(17)
2 � 2
el número de coeficientes Ck por calcular es N, según nuestros cálculos, el costo total de 1 1 ..
la construcción del polinomio exponencial de interpolación es de O(N2) operaciones. Y.j+n = 2ª1 - 2e-gn/n�j (18)
428 Capítulo 6 Aproximación defunciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 429
Demostración Utilizaremos la ecuación (16) y requeriremos una fórmula para q(x - 1t / n): requieren n multiplicaciones para calcular iªj para O � j;;; n-1, y otras n multiplica
n
ciones para calcular (fe-ij,t/ )pj para O;;;j;;; n-1. (En el último caso, hemos supuesto
n-1 n-1 n-1
n n que los factores f e-ij,t/n ya están disponibles). Dado que el costo de los coeficientes a0,
q (x- ;) = ¿Pj Ej (x- ;) = ¿Pij(x-1t/ )= ¿Pje-i1tj/ Ej(x).
O O a 1, .•. , ª•- l es de R(n) multiplicaciones, y lo mismo se puede decir de los coeficientes
j =O j= j=
Po , P1, ..., Pn-1, concluimos que para P se requiere un costo de a lo más 2R(n)+2n
Con base en la ecuación (16) tenemos que: multiplicaciones.
La desigualdad que figura en el teorema se demuestra por inducción. Considere el
1 1 caso m = O. Se pide interpolar aj en el punto x0 = O con un polinomio exponencial
P(x) = -(1 +E.(x)]p(x)+ -[l -E.(x)]q x--
2 2 ( n Jt) de grado O. La solución es la constante f(0) y no se requiere multiplicación. Por consi
n- 1 guiente, el enunciado del teorema es cierto para m= O. Procedamos ahora por inducción,
P= � ¿ { (1+E.)ajEj+(1- E.)pje-i1tj/nEj } utilizando la ecuación (19). El cálculo para el paso inductivo (de m a m+1) es
j=O
R(2m+I) = R(2 • 2m );;; 2R(2m)+2 • 2m
n-1
= � ¿ {(aj +Pj e-i:tj/n)Ej+(aj -Pj e-i:tj/n)En+j }. ;;; 2(m2m )+2m+l = (m+1)2m+l. 11111
j=O
Como consecuecia del teorema 6, podemos ver que si N es una potencia de 2, diga
Las fórmulas para los coeficientes Yj se pueden leer de esta última ecuación. 1111!
mos 2m , el costo de computar el polinomio de interpolación exponencial cumple con la
desigualdad R(N);;; N log2 N. El algoritmo que realiza repetidas veces el procedimiento
Ejemplo 2 Utilice el teorema 5 para encontrar P cuando n= I. que figura en el teorema 4 es la transformada rápida de Fourier.
Res puesta Con las fórmulas (17) y (18) obtenemos: El contenido del teorema 4 se puede interpretar en términos de dos operadores
lineales Ln y Th . Para toda f, sea L.J el polinomio exponencial de grado n- 1 que
1 1 interpola a f en los nodos 21tj/n con O ;;; j ;;; n- I. Sea Th el siguiente operador de
Yo = (ao+Po) Y1 = 2(ao- Po).
2 translación:
(Th f)(x) = f (x+h).
Por consiguiente, P viene dado por:
Con base en el corolario 1 sabemos que
1 1
P = YoEo+y¡E¡ = ( +Po)+ (ao- Po)E¡.
2 ao 2 n-1
Lnf = ¿(f, Ek)nEk,
Si ao y Po se sustituyen por sus valores, llegamos finalmente al resultado del ejemplo 1: k=O
P = Lznf P = L nf q = LnT,r¡nf
Análisis Lo que se concluye de los teoremas 4 y 5 es que Lznf se puede obtener eficientemente
a partir de L.J y LnT,r¡nf· Naturalmente, esto es cierto para n= 1, 2, ....
Para llevar a cabo un análisis más amplio, denotemos con R(n) el mínimo número La notación que acabamos de introducir nos permite expresar el teorema 4 en la
de multiplicaciones necesarias para calcular los coeficientes de un polinomio de inter agradable forma:
polación exponencial en el conjunto de puntos { 21tj/n : O;;;j;;; n- l}.
1 1
TEOREMA 6 R(2m );;; m2m . Lznf = 2(1+E.)L.J+ 2(1- E.)L,r¡nLnT,r¡nf
Demostración Comenzamos por implantar la siguiente desigualdad: Ahora nuestra meta es implantar una versión del algoritmo para la transformada rápida
de Fourier que calcule LNJ, en donde N= 2m .
R(2n);;; 2R(n)+2n. (19)
Definición Para una función! y un índice N= 2m fijos, definimos
Por el teorema 5, los coeficientes yj necesarios en el polinomio P se pueden obtener a
partir de los coeficientes de p y q con un costo de 2n multiplicaciones. En realidad, se Pk") = Lz.T2k1t/Nf (O;;; n;;; m, O;;; k;;; 2m -n-1). (20)
430 *6.12 Interpolación trigonométrica y la transformada rápida de Fourier
Capítulo 6 Aproximación de funciones 431
Una descripción alternativa de PÍ,n ) es la del polinomio exponencial de grado 2n -1 Dado que para cada n, O� k � zm -n -1 y O�j � 2" -1, el arregloA(n) requiere
que interpola a f de la manera siguiente: N localidades de almacenamiento en memoria. Una manera de llevar a cabo los cálculos
consiste en utilizar dos arreglos lineales de longitud N, uno para guardar a A (n) y el
2rcj 2rck 2rcj otro para guardar aA(•+1> . En el siguiente paso un arreglo contendrá aA(n+I) y el otro a
p(n) ( ) = f ( + n ) (0 �j � 2" -1). (21)
k 2• N 2 A(n+2> . Llamemos C y D a dichos arreglos. El arreglo bidimensional A(n) se guarda en
e mediante la regla
Por el problema 7, el conjunto de nodos (2rck/N)+ (2rcj/2") correspondiente a un valor
de k es ajeno al conjunto de nodos correpondiente a otro valor de k. Una aplicación C(2"k+ j) ,-At> (O� k � zm -n -1, O�j� 2" -1).
directa del teorema 4 nos muestra que
En forma análoga, el arregloA(n+I) se guarda en D mediante la regla
p(n+I) (x) = !(l + /1:'x)p(n) x + !(l _ /l"x )p(n) (x _ �) (22)
k 2 k ( ) 2 k+2•-•-1 2• D(2"+1 k+JJ,....At+l) (O� k � 2m -n-l -1, O�j� 2•+1 - 1).
Podemos ilustrar con un diagrama de árbol cómo se relacionan entre sí los po
Los factores Z(j) = e-211iiIN se calculan al comienzo y se guardan. Después, utilizamos
linomios exponenciales Ptl. Supongamos que nuestro objetivo es calcular p�3l. En
el hecho de que e-ijtt/z" = Z(j2m-n-1). He aquí el algoritmo para la transformada
conformidad con la ecuación (22), esta función se puede obtener fácilmente a partir de
rápida de Fourier:
P�2) y P\2). Cada uno de éstos, a su vez, se puede obtener a partir de cuatro polinomios
de orden inferior, y así sucesivamente. La figura 6.22 nos muestra las conexiones.
inputm
N ,...
. 2m
pjl) w,.... e-21ti/N
for k = O, 1, 2, ... , N -1 do
Z(k) ,.... ef
C(k ) ,.... f(2rck/N)
end
pjll
for n = O, 1, 2, ... , m -1 do
I'
for k = O, 1, 2, ..., 2m -n-l -1 do
pjºl pjºl P1ºJ p¿ºl pfOI pjº¡ pjºl P¡ºl for j = O, 1, 2, ... , 2•-1 do
u,.... C(2"k+j)
Figura 6.22. V,- Z(j2m -n-I) C(2"k+ 2m-l +j)
Aki(1;f"ll = ! ri�
Si examinamos el seudocódigo , podemos verificar que la cota m2m impuesta al
>+ e-ij11/2"Ak+
(n) -•-1,1]
2 L ki 2• · número de multiplicaciones se cumple, tal como lo establece el teorema 6. Observe que
en el ciclo anidado que aparece en el código, n toma m valores; después k adopta zm -n-r
(n+I)2• = ! rLA/cj(n) -e-ij1t/Z'Ak+2
Ak,¡+ (n) •-•-1,¡] valores y j asume 2" valores. En realidad, en esta parte del código sólo hay un comando
2
432 Capítulo 6 Aproximación de funciones *6.12 Interpolación tri gono métrica y la transformada rápida de Fourier 433
que incluye una multiplicación, a saber, aquel en el que se calcula v. Este comando se Seudonimación y frecuencia Nyquist
ejecutará un número de veces igual al producto
Cuando se intenta reconstruir una función/ a partir de muestras f(xj), surge la
m X 2 m-n-l X 2 " = m2 m-l
. pregunta acerca de las limitaciones que puede haber en el proceso. Obviamente, un
número finito de muestras no puede proporcionar toda la información contenida en una
Cerca del inicio del código, el cómputo del arreglo Z comprende 2m -1 multiplicaciones. función que puede ser un elemento arbitrario de un espacio lineal de dimensión infinita.
Sin embargo, en cualquier computadora binaria, no se necesitan contar las multiplica Así, puede haber dos funciones continuas diferentes que aparenten ser una sola a partir de
ciones por 1/2, pues éstas se logran substrayendo un 1 del exponente del número de la evidencia proporcionada por un número finito de muestras. Este fenómeno se conoce
punto flotante. como seudonimación. Para investigar esta cuestión supongamos quef está representada
por su serie de Fourier:
Ejemplo 3 Sea/ = ¿;;=0 (k + l)Ek. Reconstruya/ por medio de la transformada rápida de Fourier,
utilizando muestras def en ocho puntos igualmente espaciados.
f= ¿ (f,E ) k Ek. (23)
k=-oo
J"
Respuesta Podemos utilizar el algoritmo dado con m = 3. La siguiente es una subrutina o proce Aquí hemos utilizado la siguiente notación:
dimiento para calcular los valores de f directamente de la fórmula. 1
Ek (x) = eila: (f,g) = f(x)g(x) dx.
-
21t
inputx
-1t
C2 = -4.0000 - 4.0000i c6 = -4.oooo + 4.ooooi Por el teorema 2, (Ek, Em) N es cero excepto en aquellos casos en que k-m es un múltiplo
C1 = -4.0000 - l.6569i C1 = -4.0000 + 9.6569i. de N. Así, si tomamos k - m = vN, con v = O, ±1, ±2, ... , obtendremos
(1.0000, 2.0000, 3.0000, 4.0000, 5.0000, 6.0000, 7.0000, 8.0000). 11 Escribiendo estos términos en orden decreciente de importancia, tenemos que
El algoritmo precedente sólo presta un servicio didáctico. Los códigos que hay (f,Em) N = (f,Em) + (f,Em+N) + (/, Em-N) + · · ·.
que utilizar en la computación productiva deberían tener refinamientos adicionales. Por Esto nos muestra que el coeficiente de E en la función de interpolación (24) no sólo
m
ejemplo, podemos prescindir del arreglo D con algo de programación adicional. Es tiene el esperado término (J,Em) de (23), sino también los términos que propiamente
más, siempre que el factor Z(j) es +l o -1, el producto Z(j)C(k) se debe programar pertenecen a las frecuencias más altas, (/, Errr±vN) para v = 1, 2, 3, .... Estos términos
simplemente como C(k) o -C(k). Por último, se puede escribir un código más versátil son indeseables y crean distorsiones en la señal reconstruida. La primera de las compo
para hacer frente a los valores de N que no son potencias de 2. nentes indeseables es (J,EN), que pertenece a, EN en la serie de Fourier. Sin embargo,
Para las funciones f que sólo toman valores reales en los argumentos reales se EN no está presente en la función de interpolación del polinomio (24 ). El término EN
pueden escribir códigos especiales. También se pueden escribir otros códigos para representa a la componente de frecuencia más pequeña que está presente en la serie de
producir series de senos o series de cosenos nada más. Para las distintas ramificaciones Fourier, pero ausente en la función interpolante. Esta frecuencia más pequeña se conoce
de este tema se pueden consultar las referencias que mencionamos al final de esta sección. como la frecuencia Nyquist.
434 Capítulo 6 Aproximación de funciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 435
Cálculo de los valores de un polinomio exponencial 7. Demuestre que si k * r, entonces los conjuntos de nodos en la parte derecha de la ecuación
(21) son ajenos entre sí.
La transformada rápida de Fourier también se puede utilizar para evaluar un poli
8. Establezca la validez de la ecuación (22).
nomio exponencial en un conjunto de puntos distribuido a distancias iguales. Suponga
que dicho polinomio está dado en la forma: 9. La siguiente es una forma equivalente del teorema 5. Demuéstrela
n-1 (J. F.j)1,i = (u¡ +vj)/2
p(x) = L>iEj(x). (j, F.j.,.)2,r = (u¡-Vj)/2
j=O
Uj = (j, F.j) n Vj = e-iftt/n (Tn¡n Í, F.j) n ,
Para evaluar p en los puntos
aquí, T,¡. es el operador de translación definido por (T,¡.f)(x) = f(x +n/n).
21m
t - (O� k � n-1). 10. Este problema y los tres siguientes proporcionan una formulación de la transformada rápida
de Fourier en términos de matrices. Fije un índice n y una funciónf. Sean u y v los vectores
n
escribimos Xk = 2/m/n y columna que tienen como componentes a
= 1
11. (Continuación) Demuestre que la matriz A sólo tiene n elementos distintos. Demuestre
j=O que la matriz n112A es unitaria. Demuestre que A es simétrica.
donde g es una función tal que 12. (Continuación) Demuestre que !!vi! = n-1/2 !!ul! utilizando la norma euclidiana en C".
g(xj) = aié1 (O �j � n-1). 13. (Continuación) Conserve la notación de los tres problemas precedentes y escriba A = AC•>
De este modo, podemos aplicar la transformada rápida de Fourier a g, obteniendo los para mostrar su dependencia de n. Si u E cz. , haga u' = (uo, uz,..., u1,i-2) y u" =
(u¡,u3, ..., u1,i 1 ). Demuestre que para O � k � n - 1
coeficientes (g, Ek)n. Cuando estos se multiplican por n, tenemos los valores p(t -Xk). -
Algunas fuentes de información sobre la transformada rápida de Fourier son Davis y
(A
(ln)
u)k = f (AC•>u\ + fe-;1cn¡"(AC•> u")t
Rabinowitz (1984], Cooley, Lewis y Welch (1967], Bloomfield (1976], Brigham (1974],
Conte y de Boor (1980], Kahaner [1970, 1978], Lanczos [1966], Kahaner, Moler y Nash (A( )U)n+ k
Zn
= f(AC•>u1 - fe-;.,,1"(AC•)u '\
)1c
y el arreglo de puntos de desviación máxima e = [e¡, c2, ..., c.] compuesto por los
f(a.) -x) + -R!(�) -(x-a.).
f(f, a., �;x) = -R -$ .,-a.
puntos en los que se dan las desviaciones máximas. Aquí, d¡ es la desviación máxima en
.,-a. el intervalo [tH , t¡] y e¡ es un punto de dicho intervalo en el que ésta se da. En términos
Este algoritmo conúenza con sólo dos nudos, to = a yt1 = b. Lo primero que hace
es deternúnar la desviación máxima d 1 sobre el intervalo [to, t1 ]. Sí d1 es mayor que la En el algoritmo precedente para MAX, hemos almacenado primero f(a +ih) en z;.
Una vez que se han computado zo, z1, ... , Zk se llega a la siguiente ecuación:
tolerancia pernútida e, entonces el punto c1 donde tiene lugar la desviación máxima se
convierte en un nudo. El nudo t1 se reetiqueta t2, y c1 se convierte en t1. Acto seguido,
se calculan las desviaciones máximas sobre [to, t1] y [t1, t2]. Sí cualquiera de ellas excede l(f, a, P;x) = kh(f, -x) + kh(x -a)
Zo Zk
Si todos los subintervalos son satisfactorios, el objetivo se alcanza por medio de una
función global de aproximación G que está constituida por las funciones A(f, a.,�;x) en
.1 .2 los diversos subintervalos. (Observe que no hay nada que garantice que G será continua.)
Figura 6.23 Aproximación adaptativa de spline de grado l . Si un subintervalo [a.,� J no es satisfactorio, se subdivide de alguna manera estándar. Por
n
ejemplo, el punto medio� = !(a.+�) se puede añadir como nudo. Otra posibilidad
es tomar como nuevo nudo un punto� en el que se tenga el peor error en [a., En
cualquier caso, el intervalo (a., �J se sustituye por dos nuevos intervalos [a.,�] y �. �J.
Los diez nudos, los valores d ef y l a desviación máxima fueron Luego el proceso se repite.
Si se proporcionan los valores de una función f en ciertos puntos, digamos .to, x 1, ••• ,
x., ¿se puede usar esta información para obtener una estimación de cómo es su derivada
J:
f'(c) o una integral f(x)dx? La respuesta es un Sí rotundo.
Empecemos este análisis comentando que si se parte exclusivamente de los valores
f(Xo), f(x 1), ... , f(x.) es imposible decir mucho acerca de f, a menos que también
sepamos quefforma parte de una familia relativamente pequeña de funciones. Así, si se
permite quef sea una más en la familia de todas las funciones continuas de variable real,
conocer los valores f(x¡) resulta casi irrelevante. La figura 7.1 muestra varias funciones
continuas que tienen los mismos valores en seis puntos.
fz
Por otra parte, si sabemos quefes un polinomio de a lo más grado n, entonces los valores
en n + l puntos determinan completamente af, según vimos en la teoría de interpolación
presentada en la sección 6.1. En este caso recuperamos f exactamente, y podemos
443
444 Capítulo 7 Diferenciación e integración numérica 7.1 Diferenciación numérica y extrapolación de Richardson 445
J;
entonces calcular con absoluta certezaf'(c) o f(x)dx. Sin embargo, en la mayor parte El término de error en la ecuación (3) se puede estimar como sigue:
de las situaciones que se apegan a la realidad, la información que se tiene disponible
no determina completamente a f. y cualquier estimación numérica de su derivada o de /�f''(é,)/ = 0.005lcos�I;;; 0.005.
su integral deberá tomarse con escepticismo, a menos que venga acompañada de alguna
cota para los errores comprendidos. Podemos obtener una cota más precisa usando el hecho de que 1t/4 < � < 1t/4 + h, de
manera que I cos�I < 0.707107. Esto nos proporciona la cota superior 0.0035355. El
Diferenciación numérica error efectivo es
- sen¡+ 0.71063051 = 0.003523729. 11
Ilustramos estos asuntos analizando una fórmula para la diferenciación numérica
que surge de manera directa de la definición en términos de límite de f'(x): El término -(h/2')!"(�) que aparece en la ecuación (3) se llama error de trun
camiento. Es el error que aparece debido al truncamiento de la serie de Taylor que se
J'(x)
,:::; f(x+h)-f(x) (1) efectúa en alguna etapa del proceso de derivación. En este caso la aproximación que
h se hizo de la fórmula (1) se obtuvo truncando la serie
Para una función lineal,f(x) = ax+b, la aproximación que expresa la fórmula (1) resulta h2 h3
f(x+h) = f(x) + hj'(x) +
exacta; esto es, proporciona el valor correcto def'(x) para cualquier valor de h distinto z!"(x) + 3¡f"'(x) + · · ·,
de cero. También en otros casos la fórmula puede ser exacta, pero esto ocurre sólo de
manera fortuita. Procedemos por lo tanto a hacer una estimación del error asociado a dejando sólo
esta fórmula de diferenciación numérica. El punto de partida es el teorema de Taylor en f(x + h),:::; f(x) + hf'(x).
la forma: Como veremos en un momento, el error de truncamiento y el error de redondeo juegan
h2
f(x+h) = f(x) + hj'(x) + -:¡/'(é,). (2) papeles igualmente importantes en el uso de la fórmula (1) y de otras semejantes.
Un vistazo a la ecuación (3) nos muestra que para calcularf' (x) con precisión, el
En este caso � es un punto en el intervalo abierto entre x y x + h. Para que la ecuación tamaño del paso h debe ser pequeño. Con esto en mente llevemos a cabo un experimento
(2) sea válida, f y f' deberían ser continuas en el intervalo cerrado entre x y x + h, y f" en el que h converge a cero pasando por una sucesión de valores, y con dichos valores
debería existir en el intervalo abierto correspondiente. Un reacomodo de los términos se calculan las aproximaciones correspondientes af'(x). Elegimos f(x) = tan- 1 x y
de la ecuación (2) nos lleva a: tomamos el punto a= /i. El resultado debería serf'(x) = (x2 + 1)- 1 evaluada en /2,
lo cual es 1/3. He aquí un algoritmo para estos cálculos:
J( x + h) - f(x)
J'(x)= L -z:,� "(�)':,•
f (3)
f(x) := tan-! X
La ecuación (3) es más útil que la ecuación (1), debido a que para una clase amplia de input h +- I; a+- /i;M +- 26
funciones, como las mencionadas con anterioridad, se cuenta, además de con la fórmula F1 +-J(a)
numérica básica, con un término que cuantifica el error y que se conoce como término for k = O, I, .. . , M do
de error. Dése cuenta de que el término de error consta de dos partes: una potencia de h
y un factor que contiene cierta derivada de orden superior def Éste último constituye un F2 +- f(a+h)
indicador de la clase de funciones para la cual la estimación del error resulta válida. La d +- F2 +- F1
presencia de h en el término de error hace que toda la expresión converja a cero conforme r +- d/h
h tiende a cero. La rapidez de dicha convergencia depende de la potencia de h. Estas output k, h, Fz, F1, d, r
consideraciones también son válidas para muchas estimaciones de error que se llevan a
cabo en análisis numérico: usualmente siempre habrá una potencia de h y un factor que h +- h/2
nos diga qué suavidad debe tener la función para que la estimación del error se considere end.
válida.
A continuación se muestran los resultados obtenidos con una computadora de 32 bits:
Ejemplo 1 Si se utiliza la fórmula (1) para calcular la derivada def(x) = cosx en x = 1t/4 y con k h F2 F1 d r
h = 0.01, ¿cuál es la respuesta y cuál es su grado de precisión? 4 0.62 X 10-t 0.9755 5095 0.9553 1660 0.0202 3435 0.3237 4954
12 0.24 X 10-3 0.9553 9796 0.9553 1660 0.0000 8136 0.3332 5195
Respuesta Usando una calculadora encontramos que
20 0.95 X 10-6 0.9553 1690 0.9553 1660 0.0000 0030 0.3125 0000
0.70000047 707106781 _ _ 24 0.60 X 10-7 0.9553 1666 0.9553 1660 0.0000 0006 1.0000 0000
,J(x+h;-f(x)
= ��t = 0 71063051. 26 0.15 X 10-7 0.9553 1660
!'(x) 0.9553 1660 0.0000 0000 0.0000 0000
7.1 Diferenciación numérica y extrapolación de Richardson 447
446 Capítulo 7 Diferenciación e integración numérica
Cuando esta expresión se sustituye en la ecuación (7) el resultado es
En cada línea, d se calcula como la diferencia F2 - F¡, y r se calcula como el cociente d/ h.
Debido a la cancelación por sustracción, d tiene cada vez menos dígitos significativos,
hasta que finalmented = O y r = O. El mejor valor para r se obtiene cuando k = 12, J'(x)= f(
x+h)-f(x-h) _}_f_
"' i;). (8)
teniendo 4· dígitos correctos si se redondea a 4 sitios decimales. Para este valor de . 2h 6! (
k observamos que d posee 4 dígitos significativos. Conforme k aumenta, el número
de dígitos significativos en d decrece, y es evidente que r no puede tener más dígitos Una fórmula importante para calcular segundas derivadas se obtiene añadiendo
significativos que d. Así, resulta que el error de redondeo nos impide obtener valores un término más a las ecuaciones (5) y (6) y sumando los resultados. Después de un
precisos cuando h es pequeño. Para tener una mayor precisión en d necesitaríamos más reacomodo de términos y de utilizar el método anterior, obtenemos
precisión en F1 y en Pi, y ello requeriría una mayor precisión en los cálculos básicos.
Podemos utilizar precisión múltiple o llevar a cabo los cálculos en una máquina con f(x + h) - 2f(x) + f(x - h) _ h: (4l
f"(x) = f (I;), (9)
una longitud de palabra mayor. El paso para el cual empeoran las respuestas dependerá h2 12"'
de la longitud de palabra ( o para ser más exacto, el error de redondeo unitario) de la
máquina en particular que se esté utilizando. para alguna /; E (x - h, x + h). Esta fórmula se utiliza con frecuencia en la solución
Las fórmulas de diferenciación numérica tienen su aplicación más importante en la numérica de ecuaciones diferenciales de segundo orden.
solución numérica de ecuaciones diferenciales. Un estratagema común consiste en
reemplazar las derivadas por aproximaciones semejantes a la que se expresa mediante la Ejemplo 2 Tomandof(x) = tan- 1 x y x = /i, use la computadora para aproximarJ'(x). Utilice la
ecuación (1). Con frecuencia la precisión de dichas fórmulas de diferenciación numérica ecuación (8) con un tamaño de paso h que tienda a cero. Recuerde que el valor correcto
se juzga a partir de la potencia de h que aparece en el término de error. Cuanto mayor es 1/3.
sea la potencia de h mejor es la aproximación, ya que h siempre es un número pequeño. Respuesta El siguiente es un algoritmo adecuado:
En esta evaluación, y debido al término O(h), la fórmula (2) tiene un pobre desempeño.
Una fórmula más conveniente es:
f(x) := tan-! X
f(x + h) - f(x - h) (4) input a <- /i; h <- 1; M <- 26
f '(x) �
2h for k = O, 1 . . . , M do
Ésta se deduce de dos casos del teorema de Taylor, a saber: F2 <-J(a+h)
F1 <- f(a-h)
h2 h3 1
f(x+ h ) = f(x)+hf '(x) + 2
J"(x) + 7/ 1 (/;1) (5) d <-F2-F¡
r <-d/(2h)
output k, h, F2, F1, d, r
h2 1 h3 1
f(x - h) = f(x) - hf (x) + !1 (x) - 7/11 (/;2)
I (6) h <- h/2
2
end.
Restando una expresión de la otra, obtenemos:
2 A continuación se muestran algunos de los resultados que proporciona una máquina de
f(x + h) - f(x-h) - h f"'( 1 ) +!"'(/;2)]. (7) 32 bits.
/;
12 [
'
f (x) = "'·
k h F2 Fi d r
Debido al término h2 en el error, éste es un resultado más favorable. Sin embargo, hay 2 0.25 1.0297 2674 0.8611 2982 0.1685 9692 0.3371 9385
que considerar la presencia del término f111 en el error. Este término de error se puede 10 0.9765 X 10-3 0.9556 4199 0.9549 9092 0.0006 5106 0.3333 4351
usar si f111 existe. 18 0.3815 X 10-5 0.9553 1786 0.9553 1535 0.0000 0250 0.3281 2500
El término de error en la ecuación (7) se puede simplificar si hacemos la suposición 26 0.1490 X 10-7 0.9553 1660 0.9553 1660 0.0000 0000 0.0000 0000
adicional de que la funciónf111 es continua en [x - h, x + h]. Tomemos a M y a m como
Una vez más observamos que debido a una cancelación por sustracción se produce
=
los valores mayor y menor respectivamente def'" en [x - h,x + h]. Entoncesf111(/; 1 ),
J"'l/;2), y c [!'"� 1) +f111(/;2)]/2 se encuentran en el intervalo [m, M]. Ya quef es
111 un deterioro pronunciado en la precisión conforme h tiende a cero. Los datos de salida
continua, toma el valor c en algún punto /; en [x - h, x + h]. Por ende, comienzan a exhibir dicho comportamiento en k = 9. Los valores de F1 y de F2 están muy
cercanos uno al otro, y su diferenciad sufre una pérdida severa de dígitos significativos.
111 Eventualmente, conforme h -> O+ , los valores de F1 y de F2 serán idénticos en la
! (/;) = H!"'c1;1) +f"'c1;2)J.
448 Capítulo 7 Diferenciación e integración numérica 7.1 Diferenciación numérica y extrapolación de Richardson 449
máquina, y como valor de la derivada aparecerá un cero. Esto tiene lugar en k = 26. La fórmula de diferenciación final, incluido el término de error, queda como:
En computadoras con diferente longitud de palabra este tipo de comportamiento aparece
para distintos valores de k. 111
IIcx.x-x¡).
n n
!'(Xa.) =¡=Jex¡)ff<x.x) + (n+l /(n+l)<s,J
1 c11)
,=O J=O
La diferenciación numérica de funciones que sólo son conocidas empíricamente es j,;,,.
un procedimiento muy riesgoso, debido a que los errores en los datos serán magnificados Esta fórmula es particularmente adecuada para los casos en que los nodos no están
por el proceso. Esto se puede observar, por ejemplo, en la ecuación (8) . Si se determinan distribuidos uniformemente.
con precisión los puntos de muestra x ± h, mientras que los valores de las ordenadas
f (x ± h) permanecen inexactos, los errores en las ordenadas se multiplicarán por 1/(2h). Ejemplo 3 Muestre explícitamente la expresión que adopta la ecuación (11) en los casos en que
Dado que h será pequeño, la influencia que puedan tener los errores será grande. (Este n=2 ya.=l.
fenómeno no sucede en la integración numérica.) Así, la diferenciación numérica de Respuesta En este caso las tres funciones cardinales para la interpolación de Lagrange son:
datos empíricos debe evitarse o llevarse a cabo con el mayor de los cuidados.
lo (x-x¡) (x-x2)
(x) =
Diferenciación vía interpolación polinomial (xo-x¡)(xo-x2)
(x )
La interpolación polinomial puede utilizarse como punto de partida de un procedi Í¡(x) = -.xo (x-x2)
(x¡-Xo)(X¡-X2)
miento general para efectuar integraciones y diferenciaciones numéricas. Suponga que
contamos con n + 1 valores de una función! en los puntos Xo, x 1, .. . , Xn. Un polinomio (x-Xo)(x-X¡)
f2(x) = .
que interpole aj en los nodos x; puede representarse en la forma de Lagrange que co (X2 -Xo)(X2 - X¡)
rresponde a la ecuación (9) de la sección 6.1. Al incluir el término de error que aparece Sus derivadas son:
en el teorema 2 de la misma sección obtenemos: 2x-x¡-x2
f�(x) =
(xo-x1)(.xo-x2)
f (x) =tf(x¡)Í¡(x) + (n: 1 /(n+l)(sx)w(x). (10) 2x-XQ - X2
f�(x) =
,=O (X¡-Xo)(X¡-X2)
2x-XQ - X¡
IJ7
En este caso hemos tomado w(x) = =0(x-x;). Derivando los términos que aparecen f�(X) =
(x2-Xo)(xz-x¡)
en la ecuación (1O) llegamos a: Calculando su valor en x1 obtenemos:
º _ X¡ -X2
J'(x) =tf(x;)f((x) + ( : /(n+l\sx)w'(x) + : w(x)-ff¡n+l)(sx). t'o(X¡) -
n 1 (n 1)! (Xo -x¡)(xo-xz)
(xo-x¡)(xo-x2)
Si se calcula w' (Xa.) , esta ecuación puede a su vez ser objeto de una ulterior simplificación. 2x¡-Xo-X2
Para probarlo observemos que +f(X¡)
(x¡-Xo)(x¡-xz)
X¡-Xo
+ f(x2) (12)
¿ IT<x-xj)
n n
así que (x2-.xo)(x2-X¡)
w' (x) = w'(Xa.) = TI(Xa.-xi).
i=O j=O
fr'i
j=O
+ t1 111(Sx1)(X¡-Xo) X¡-Xz)
( 111
450 Capítulo 7 Diferenciación e integración numérica 7.1 Diferenciación numérica y extrapolación de Richardson 451
Ejemplo 4 Si en el ejemplo 3 se toman nodos uniformemente espaciados ¿cuál es la fórmula que se Escriba la ecuación (15) reemplazando a h por h/2:
obtiene?
L = q,(h/2)+a2 h2 /4 + �h4 / 16+a5h6 /64 + · · .. (16)
Respuesta Tome xa = x1 - h y x2 = x1 + h. De la ecuación (12) obtenemos (con x = x1):
El término principal a2 h2 en la serie correspondiente al error puede eliminarse recu
J'(x) = f(x-h) ( ;; ) + f(x+h) ( � )-if'"(�) h 2
• rriendo a las ecuaciones (15) y (16), multiplicando la última por 4 y restándole la primera
2 He aquí el resultado de este proceso:
Ésta es idéntica a la ecuación (8) que se dedujo antes. 11 L = q,(h) + a2 h2 + �h4 + a6 h6 + · · ·
4L = 4q,(h/2)+a2h2 + �h4/4 + �h6/ 16 + · ··
Extrapolación de Richardson
3L = 4q,(h/2)-q,(h)-3a 4 h4/4-15�h6/16-..·.
Mostraremos ahora cómo puede usarse, para obtener más exactitud en algunas
fórmulas numéricas, un procedimiento conocido como extrapolación de Richardson. Entonces,
Considere las ecuaciones (5) y (6), a las que se les han añadido términos de orden 4 1 4 6
superior. Suponemos que f(x) está representada por su serie de Taylor: L = q,(h/2)- q,(h)-a4h /4-5a6h /16 -.... (17)
3 3
La última ecuación incorpora el primer paso de la extrapolación de Richardson. Muestra,
001 además, que una simple combinación de q,(h) y de q,(h/2) proporciona una estimación
f(x+h) = "-hk¡(kl(x) (13)
L,k!
k=O de L con una precisión de O(h4).
donde L representa a f'(x) y q,(h) a la fórmula de diferenciación numérica (4). El A continuación se muestran algunas líneas de los resultados obtenidos:
procedimiento numérico está diseñado para calcular el valor de L. La función q, es tal
que q,(h) puede calcularse para h > O pero no para h = O. Por ello, en nuestro intento
k 4 �
2 0.337 1 9385 0.3333 3480
por determinar el valor de L, sólo podemos hacer que h tienda a cero. Para cada h > O,
4 0.3335 7477 0.3333 3364
el error es proporcionado por la serie de términos a2 h2 + a4 h4 + · · ·. Suponiendo que
8 0.3333 2 825 0.3333 257 1
a2 ;1: O, observamos que el primer término, a2 h2 , es mayor que los demás cuando h
16 0.3320 3125 0.3313 8022
es suficientemente pequeña. Debemos por lo tanto buscar una manera de eliminar el
26 0.0000 0000 0.0000 0000
término dominante a2h2 • Nuestro análisis depende exclusivamente de la ecuación (15)
y se puede utilizar en otros procedimientos numéricos;en particular, en la sección 7.4 Una comparación entre estos datos y los del ejemplo 2 muestra que se han obtenido dos
se utiliza conjuntamente con la regla del trapecio. dígitos más de precisión.
45 2 Capítulo 7 Diferenciación e integración numérica 7.1 Diferenciación numérica y extrapolación de Richardson 45 3
El ejemplo que se acaba de ofrecer resulta artificial, en tanto que ya conocemos 2. Calcule valores adicionales mediante la fórmula
el resultado correcto, y estamos utilizando este conocimiento para determinar qué valor
de la columna tres es el más exacto. En una situación real contaríamos el número de 4k 1
cifras significativas que se han perdido durante el cálculo de d k. Resulta obvio que rk D(n, k) = _ D(n, k-1)- k _ D(n-1, k -1). (19)
4k 1 4 1
no puede tener más cifras significativas que dk . La moraleja en este caso es que NO
se puede suponer que rk aumenta en precisión conforme k aumenta indefinidamente de En este caso k = 1, 2, ..., M y n = k, k + 1, ..., M.
valor. 1111 Observe que D(O, O)= $(h), D(l, O)= $(h/2), y D(I, 1)= 'l'(h). Las cantida
des D(n, 1) constituyen los elementos de la ecuación (17). De manera similar, D(n, 2)
Probablemente se le ha ocurrido al lector que lo que se hizo con la ecuación (15) corresponde a la ecuación (18), y así sucesivamente. A partir de nuestras hipótesis y
puede hacerse también (con las modificaciones adecuadas) con la ecuación (17). En cálculos es evidente que:
efecto, y en este caso el procedimiento es el siguiente. Tome D(n, 0) = L + O(h2)
CjJ(h) = (16/15)1j1(h/2)-(1/15)1j1(h).
D(n, k- 1) = L + ¿Aj k(h/2n)2Í. (20)
en la ecuación (18), de manera que j= k
L = CjJ(h) + c5h6 + cgh 8 + · · ·. Demostración En el caso en que k = 1, verificamos la ecuación (20) usando la definición de D(n , O) y
la ecuación (15):
De forma similar a la anterior encontramos que
D(n, O) = $(h/2n) = L - ¿ a ¡(h/2 ) i.
2
n 2
64 1 j =I
L= -CjJ(h/2)--CjJ(h) -3cah s/25 2 -· · ·.
63 63 Entonces podemos tomar A¡1 = -a2j.
De hecho, resulta que se puede efectuar cualquier número de pasos con el fin de A continuación utilizamos la inducción sobre k. Suponemos que la ecuación (20)
es correcta para algún k -1, y sobre esta base procedemos a demostrar que también es
obtener fórmulas con una precisión cada vez mayor. A continuación se muestra el
algoritmo completo que permite M pasos de la extrapolación de Richardson. correcta para el caso k. De las ecuaciones (19) y (20) tenemos que
l. Elija un valor conveniente de h (digamos h= 1) y calcule
h 2j - h 2j
00
4k 00
l
D(n,k) = - - [L+ '\"""' A - - -
k n ] 4k
( ) [L+ '\"""' A1· k (-) ] .
D(n, O) = $(h/2n) para n= O, 1, ..., M. 4 -1 ¿ ' 2n-l
k
¿ J, 2 -1
i= k j=k
454 Capítulo 7 Diferenciación e integración numérica Z J Diferenciación numérica y extrapolación de Richard.son 455
Esta expresión se puede simplificar y concluir que: Respuesta Se muestran a continuación algunos de los datos de salida que se obtienen al utilizar este
algoritmo en el ejemplo 2.
oo
D(n,k)=L+ ¿Aj,k[4k
4k -4i] h
_ (
)2j
. (21)
l iñ n D(n, O) D(n, 1) D(n, 2) D(n, 3) D(n, 4)
j=k
O 0.39 2 6 991
1 0.348 7 710 0.3341 28 3
Entonces Aj,k+l debería definirse como: 2 0.3371 9 38 0.3333 348 0.3332 819
3 0.334 2 981 0.3333 329 0.3333 328 0.3333 336
4k_4j 4 0.3335 7 48 0.3333 336 0.3333 337 0.3333 337 0.3333 337
A j,k+t = Aj,k[ k_ l ].
4
Observe que este algoritmo proporciona aproximadamente el mismo grado de precisión
Observe que A1:,k+l = O, y por lo tanto la ecuación (21) se puede escribir como: que se obtuvo en el ejemplo 5. Eventualmente también producirá resultados sin sentido
debido a la cancelación por sustracción. 11
D(n, k) = L + L Aj,k+l (h/2 l. n
il
j=k+l
SERIE DE PROBLEMAS 7.1
Las fórmulas correspondientes aD(n, 0) y D(n, k) nos permiten construir el siguiente l. Lleve a cabo con todo detalle la deducción de la ecuación (11).
arreglo triangular
<2. Con el fin de dar una estimación de J'(x), programe el algoritmo que aparece en el texto en
el que se usa repetidamente la extrapolación de Richardson. Ponga a prueba el programa
D(O,O) calculando (i) lnx enx = 3, (ii) tanx enx = sen-1(0.8), y (iii) sen(x2 + ix) enx =O.
D(l,O) D(l,1)
D(2,0) D(2, 1) D(2, 2) <3. Diseñe y ponga a prueba un algoritmo para calcular¡'' (x) utilizando la fórmula (9) junto con
repeticiones del proceso de extrapolación de Richardson.
D(M, O) D(M, 1) D(M, 2) D(M,M) 4. Sea f un polinomio de a lo más grado n. Si se conocen los valores de f en n puntos, ¿se
pueden dar estimaciones confiables de J'(e) o de J:f(x)dx? Sus respuestas dependerán de
Más abajo se presenta un algoritmo que genera este arreglo triangular. En él se e, ay b.
'
alude a una función$ que se debe poner a disposición del código por separado (es decir,
5. Suponga que un proceso numérico se describe como:
mediante un subprograma o procedimiento).
9. Deduzca las siguientes dos fórmulas para aproximar derivadas y además demuestre que 21. Deduzca una fórmula de la forma
ambas son O(h4) exhibiendo los términos de error.
t:' � [A/n+i + Bfn+2+ Cfn+1+ Df,,]/h2.
1
f (x)� [-f(x+ 2h)+ 8/(x+ h) -8/(x - h)+ f(x- 2h)]
I2h En este casofi = f(:xo+ ih).
" 1 22. Deduzca la aproximación
f (x) � [-f(x+ 2h)+ 16/(x+ h) - 30/(x) + 16/(x - h)-f(x-2h)].
12h2
10. Deduzca las siguientes dos fórmulas para aproximar la tercera derivada y sus términos de - 3/(x.) - 4/(Xn-l)+ J(xn-z)
f'(Xn) '""' '
error. ¿Cuál es más exacta? 3xn - 4X -l +Xn-2
n:
111
f (x)� �[f(x + 3h)- 3/(x+ 2h) + 3/(x+h)-f(x)] y demuestre que el término de error es O(h2) conforme h ..... O. En este caso/¡= f(Xo+ ih).
1// 1 c23. (Continuación) Usando esta aproximación genere una fórmula iterativa análoga al método
f (x)� l [f(x + 2h)- 2'f(x + h) + 2/(x-h)-f(x-2h)]. de la secante. Examine su comportamiento numérico en un problema de prueba, y compare
2h los resultados con el método de la secante.
1 l. Siga las instrucciones del problema 10 para las siguientes fórmulas para la cuarta derivada.
/
4l
� � [f(x+ 4h)- 4/(x+ 3h)+ 6/(x+ 2h)-4/(x+ h)+ f(x)]
7.2 Integración numérica basada en interpolación
4l
/ � �[f(x+ 2h)-4f(x + h)+ 6/(x) - 4/(x-h)+ f(x- 2h)].
La integración numérica es el proceso por medio del cual se genera un valor numérico
12. Demuestre que para el caso de la extrapolación de Richardson para la integración de una función sobre un conjunto. He aquí algunos ejemplos de
16 1 integrales que pueden calcularse mediante rutinas de computadoras adecuadas:
D(2, 2) = 'V(h/2)- 'V(h).
12
T5 T5
13. Muestre cómo utilizar la extrapolación de Richardson si se usan x. y x02 en el caso en que (i) e_¡. dx
L = Xn+a¡n-1+a2n-2+a3n-3 + ....
14. Demuestre que
(a) Six.-L = O(n-1), entonces 2x2n-x. -L = O(n-2).
(b) Si Xn - L = O(n- 1 ), entonces x.z -L = O(n-2).
(Ü)
ll sen(xyt!)dx dy
[ [ tan(xy2)dydx
(üi)
1"
(c) Discuta las consecuencias numéricas de las primeras dos partes de este problema. o .2
15. Muestre cómo utilizar la extrapolación de Richardson si
(iv) cos(3cos0)d0.
L = $(h)+ a¡h + aih3 + a5h5 + · · ·.
16. Suponga que L = Iímh-o/(h) y que L - f(h) = C6h6 + c9h9 + · · ·. ¿Qué combinación de Estos problemas de integración no son tratables con las técnicas aprendidas en los cursos
f(h) y f(h/2) proporcionaría la mejor estimación de L? básicos de cálculo. Estas técnicas dependen de encontrar la antiderivada. Por ello, para
e 17. Diseñe y ponga a prueba un algoritmo para aproximar f' y!" y utilice splines cúbicos. encontrar mediante el cálculo elemental el valor de
18. Usando series de Taylor deduzca el término de error para la aproximación
' -3f(x)+4f(x+h)-f(x+2h) [J(x)dx,
/ (X)� .
2h
19. Utilizando la extrapolación de Richardson deduzca una fórmula de diferenciación numérica
de orden h4 para debemos primero encontrar una función F con la propiedad de que F' = f. Entonces
resulta que
f(x+h) -J(x-h) _ 'i..¡m h
/(x) = (x)- �¡{Sl(x)- .... [f(x)dx = F(b)-F(a).
2h 6 120'
4
Diga cuál es el término de error de orden h •
Por ejemplo,
r4 x2dx = !x3ii = t4 -f = 21.
20. Usando desarrollos en serie de Taylor deduzca el término de error para la fórmula:
4
3
¡"(x) � ¡;i.1 íj(x) - 2/(x+ h)+ J(x+ 2h)]. }¡
458 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 459
La función F dada por F(x) = (l/3).x3 es una antiderivada de la función! dada por Ahora, como se mencionó con anterioridad, simplemente escribimos
r.
f(x) = Existen muchas funciones elementales que no poseen antiderivadas sencillas.
Un buen ejemplo de ellas es f(x) = ¡/. Una antiderivada de esta función es:
[f(x) dx � [ p(x) dx = '[,J(x;) [ l;(x) dx.
¿ -=-:-, ...
00 ?'+1 a , a i=O a
F(x) =
k=O De esta manera obtenemos una fórmula que se puede utilizar para cualquier f, y que
tiene la siguiente forma:
(Para saber algo sobre el origen de esta expresión vea la ecuación (3) de la sección 6.7.)
Una estrategia muy poderosa para calcular el valor numérico de la integral [f(x) dx � '[,AJ(x;), (3)
a i=O
1 1�
¡ l " 2k n
1
=
x
dx � dx Y como consecuencia de lo anterior,
¡- k! � (2k+ l)k!"
Sin embargo, es deseable tener procedimientos generales que sólo requieran evaluaciones Ao = [ lo(x) dx = !Cb-a) = [ l¡(x) dx = A¡.
del integrando. Los métodos basados en la interpolación satisfacen este deseo. También
se puede recurrir a los splines para interpolar af , y aprovechar que las integrales de éstos
son fácilmente calculables. La fórmula de cuadratura correspondiente es
entonces se puede aplicar la regla del trapecio a cada uno de los subintervalos. En este Método de los coeficientes indeterminados
caso los nodos no se encuentran necesariamente espaciados de manera uniforme. Es así
como se obtiene la regla del trapecio compuesta, A partir de la manera como se dedujo la fórmula (3) vemos de inmediato que es
exacta para todos los polinomios de grado � n. Por otra parte, suponga que se nos
rb f(x)dx = t' proporciona la fórmula (3) y se nos dice que es exacta para todos los polinomios de
n
(x)dx grado � n. ¿Es correcta la siguiente ecuación?
la � lx;_/
n
l A; = ¡\(x)dx.
::::: ¿(x; -x;-1)[f(xH)+f(x;)].
2 i=I
La respuesta es Sí, y lo constatamos a partir del hecho de que la fórmula (3) debe integrar
(Se genera una regla compuesta cuando se aplica una fórmula de integración sobre correctamente a cualquier fj. Por ende,
¡
un intervalo a cada uno de los subintervalos en que se ha dividido el intervalo.) Tam
bién aparece la regla del trapecio compuesta si se sustituye al integrando por un spline
¿ A;ej(x;) = A .
b n
ºif·
del trapecio compuesta adopta la forma: Obviamente, en este caso hemos utilizado dos propiedades esenciales de los polinomios
1 n-1
fundamentales: que fj es un polinomio de grado � n y que f;(xj) =
b
Las observaciones que acabamos de hacer nos permiten llegar a fórmulas como la
f(x)dx::,::; [!(a)+2 ¡=1ca + ih)+ f(b)],
a i=l
(3), mediante el llamado método de coeficientes indeterminados. Para ilustrarlo deduz
camos la ecuación (5) utilizando este procedimiento. Buscamos una expresión como la
1 n
siguiente:
b
f(x) dx::::: h; "f(a + ih), ( 4) [f(x)dx::::: Aof(O)+A¡f(f)+Azf(l),
donde la doble comilla en la sumatoria indica que el primer y el último término de la suma que será exacta para todos los polinomios de grado � 2. Usando como función de prueba
deben dividirse entre dos. El término de error para la regla del trapecio compuesta es: los polinomiosf(x) = 1, x, y x2, obtenemos, en ese orden:
i.
fórmula
i,
La solución de este sistema de tres ecuaciones simultáneas es Ao = t, A 1 = y A2 =
[!(x) dx::::: gf(O)+ if<f)+ t!O). (5) Ya que la fórmula es lineal, dará entonces lugar a valores exactos de las integrales para
cualquier polinomio cuadrático de la formaf(x) = c0 + c1 x+ c2x2•
Esta fórmula se puede obtener calculando primero los tres polinomios fundamentales
f,
para los nodos O, l. Éstos son:
. Regla deSimpson
f
lo(x) = 2(x - )(x - l) f1 (x) = -4x(x -1) fz(x) = 2x(x - !). Cálculos similares para un intervalo arbitrario [a, b] nos llevan a la conocida regla
deSimpson:
rb f(x) dx::::: b-ar
[
Entonces ª+b
- - (a)+ 4f ( - - ) + f(b)] .
Ao = fo(x)dx = i, la 6 { 2
(6)
A partir de la manera como se dedujo sabemos que la regla de Simpson es exacta para
y así sucesivamente. 11 todos los polinomios de grado � 2. También es, inesperadamente, exacta para todos los
462 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 463
polinomios de grado� 3. (Véase el Prob. 3.) El término de error asociado a la regla de Con el fin de evitar que los términos se repitan, deberemos efectuar los cálculos corres
Simpson es pondientes al lado derecho de la ecuación, según se indica a continuación:
- 0 (b - a)5¡{4J(1;) , n/2 n/2
9 h
para algún 1; E (a, b). El proceso de derivación de este término de error no se origina en (¡(�)+2 p(x2¡-2)+4 t?(xz;_¡)+ f(xn)]
3
una integración directa del término de error mencionado en el teorema 2 de la sección 6.1.
En lugar de ello procedemos como sigue. Si h = (b - a)/2, la fórmula de integración El término de error para esta fórmula es
numérica adopta la forma:
1
1
a
a+2h
f(x)dx;::;;
h
3 [J(a)+4f(a+h)+f(a+2h)].
para alguna 1; E (a, b).
- 180
(b - a)h4'f(4) (1;),
i=O
El teorema fundamental del cálculo nos indica que F' = f, y recurriendo al teorema de donde w puede sercualquierfanción de peso. La única modificación necesaria consiste
Taylor podemos escribir el lado izquierdo en la regla de Simpson, como F(a+ 2h) o en reemplazar la ecuación (3) por
32
2hf(a)+2h J'(a)+ �h J"(a)+ �h4j"'(a)+ h / l(a)+ ...
5
A¡ = [ l¡(x)w(x)dx.
3 4
2
3 3 5!
l
Combinando estos dos desarrollos obtenemos
a+2h h 1 5 4
f(x)dx = - [f(a)+4f(a + h)+ f(a+ 2h)] - -h
W
¡< l(a) - ·.·,
Esto se ilustra en el siguiente ejemplo.
I: 1
n/2 Xz,
= J(x)dx.
1-:
-
1 ª
b
f(x)dx;::;;
h
n/ 2
¿V(x2¡-2)+4f(x2¡-1)+J(xu)].
3 i=l l 4
_lt (x)cosxdx"" [-J(-!n)+ f(-±n)+ J(¡n) - J(!n)J
/ ;;
1111
464 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 465
i=O
l!
(n+ )
1
1ª
¡<n+l) (�z) II<x-x;)dx.
b n
i=O
(11)
será cierto para la segunda. Veamos cómo se lleva ésto a cabo.
Suponga que se cuenta con una fórmula de integración numérica:
t
Si lfn+ll(x)I � M en [a, b], entonces
[f(t) dt � A¡f(t¡).
e i=O
(7)
1
1 a
f(x)dx-Í:AJ(x;)
b n
i=O
I
� --
M
(n + 1).
1
1 ITlx-x;jdx.
b•
a i=O
(12)
todos los polinomios de grado � m. Si se necesita una fórmula para algún otro intervalo,
No nos importa el origen de esta fórmula. Sin embargo, supongamos que es exacta para
Se sabe que la elección de nodos que hace que el lado derecho de esta desigualdad sea
entonces A.(t) recorrerá [a, b]. La expresión explícita de la función A. es
digamos [a, b], definimos primero una función lineal A. de t, tal que si t recorre [e, d], tan pequeño como se quiera es:
X¡ = COS [
hacemos el cambio de variable x = A.(t). Entonces dx = A.1(t) dt = (b - a)(d - c)- 1 dt,
(i + l)rt
] (O� i � n).
(n + 2)
y por lo tanto tenemos:
b _ a (i.- (b)=d
Éstos son los ceros de la función:
f(A.(t)) dt
l f(x)dx =
1
d _ e Ji.-,(a)=c Un+1(x) =
b
sen[(n + 2)9]
(x = cose).
a
b•-a'°'
sene (13)
AJ(A.(t;)).
� d - e¿
n
La función Un+I se conoce como polinomio de Chebyshev de segundo tipo. Tal como se
definió en (13), Un+I (x) no es un polinomio mónico; es decir, su coeficiente principal no
í=O
l ª
b
(6) como consecuencia de utilizar A.(t) = (b - a)t + a en la ecuación (5). [ l(x - Xo)(x - X¡)··· (x - Xn)I dx = 2-n .
1
(15)
}_¡
(x)dx- AJ )
lizamos el término de error asociado con la interpolación polinomial. Recuerde, de la
11-> ta (x; I � , �"-
sección 6.1 (Ec. (13)), que si p es el polinomio de grado � n que interpola a f en
x0, :€¡, • . • , xn, y si¡<n+l) es continua, entonces:
. (16)
f(x) - p(x) = (n+l\�z) TI(x - X¡). TEOREMA Entre los polinomios mónicos p de grado n, aquel para el cual J� ¡ w(x)I dx adopta su
"
(n +
1
mínimo valor es 2-• u•.
1/ (10)
i=O
7.2 Integración numérica basada en interpolación 467
466 Capítulo 7 Diferenciación e integración numérica
¡,,
En este caso el numerador es
p = 2-n un+an 1Un 1 + · · ·+aoUo. En ambos ejemplos utilicen= 4, 8, 16. (Véase el Prob. 16 de la Sec. 6. 4.)
- -
Por lo tanto, si usamos la relación de ortogonalidad obtenemos: 10. Encuentre la fórmula
¡ 1 ¡ [t(x)dx � Aof(O) +A¡f(l),
{ IPldx� ¡ psgn[Un]dx=Z- { Unsgn[Un]dx
n
que sea exacta para cualquier función que tenga la forma lfn+1l(x)/ < M en [O, l]. Si no se conoce nada acerca de la posición de los nodos ¿qué cota
superior se puede dar para el error? ¿Puede e ncontrar la mejor cota superior?
f(x) =a+ bcosx. 19. Determine la regla de integración numérica compuesta que se apoya en la sencilla regla del
Demuestre que la fórmula resultante es exacta para cualquier función de la forma rectángulo del lado derecho
. [t(x)dx�f(l).
f(x) = ¿[ak cos(2k+ l) x + bk sen kx].
Suponga un espaciamie nto desigual dado por a = xo < x1 < ... < x. = b.
k=O
20. Deduzca la regla compuesta para J:f(x)dx que se apoya en la regla del punto medio:
1 2 . Utilice la interpolación polinomial de Lagrange para deducir la expresión de la forma:
Proporcione fórmulas tanto para un espaciamiento uniforme como para uno no uniforme de
Transforme la fórmula anterior en una que sirva para integrar sobre [a, b]. los nodos.
13. Usando el polinomio de grado mínimo que interpola af(x) en x1 y x2, deduzca una fórmula
de integración numérica para
3
( x)
dx.
¡
21. (Continuación) La regla del punto medio sobre el intervalo [x¡_¡,x¡¡.¡J se expresa como:
X/+I
f(x)dx = (Xi+I - X¡-¡)f(x¡).
[J -'i-1
No suponga una distribución uniforme entre los elementos de la partición. En este caso Determine la regla del punto medio compuesta sobre el intervalo [a, b], usando un espacia
X0 < X¡ < X2 < X¡. miento uniforme con h = (b - a)/n, tal que x¡ = a+ ih para i = O, 1, 2, ... , n (con n
14. Deduzca una fórmula para aproximar par).
2 2 . Determine la regla de integración para J:f(x)dx apoyándose en la regla de cuadratura
lf(x)dx, gaussiana
sea exacta para todos los polinomios de grado tan alto como sea posible. ¿ Cuál es el grado lf(x)dx� a.f(i)+M!J+r!C!J.
máximo?
¿ Cuál es la mejor?
16. Deduzca la fórmula de Newton-Cotes para
24. ¿Existe una expresión de la forma
[f(x)dx,
[f(x)� a.[f(xo)+f(x1)J.
usando polinomios de interpolación de Lagrange con nodos en -2, -1, O . Use este resultado
para evaluar la integral cuandof(x) = sen JtX. que integre correctamente todos los polinomios cuadráticos?
17. Usando una serie, calcule 25. Demuestre que si la fórmula
[º-' ce;x) dx.
Lf(x)dx� tA¡f(x¡) (conn par),
con una precisión de siete decimales.
1 es exacta para todos los polinomios de grado n y que si los nodos están distribuidos simétri
1
f
18. Nuestra intención es utilizar fo p(x)dx como una aproximación de 0 f(x)dx, donde p es camente alrededor del origen, entonces la fórmula resulta exacta para todos los polinomios
un polinomio de grado n que interpola aj en los nodos XO, X¡, .•• , x. en [O, l]. Suponga que de gradon+ l.
470 Capítulo 7 Diferenciación e integración numérica 7.3 Cuadratura gaussiana 471
26. Suponga que n es par. Muestre cómo se puede calcular, con un núnimo de trabajo adicional, donde
la regla de Simpson compuesta con 2n nodos igualmente espaciados, partiendo del caso en
que se cuenta con n nodos igualmente espaciados. ª = v<5+ v11)112 � o.83249 7487o oo9s2
27. En el ejemplo 2 se utilizó la simetría para simplificar los cálculos. Demuestre que Ao = A3
yA1 =A2. � = v(5 -v11);12 � o.37454 14095 53581.
28. Demuestre que los polinomios de Chebyshev de segunda clase se generan recursivamente
mediante Para obtener estos coeficientes se puede utilizar el método de los coeficientes inde
Uo(x) = 1 U1(x) = 2x terminados. Además es posible demostrar que la fórmula es exacta para polinomios de
{ U.+1 = 2xU. -U.-1 (n f: 1). grado � 5. También se pueden proporcionar fórmulas más complicadas con coeficientes
29. (Continuación) Demuestre la relación de ortogonalidad idénticos. Como ejemplo citamos la siguiente:
1
1 U.(x)U,,.(x)� dx = 6.,,.rr./2.
-1 1 -I1
•
n i=I
2' ¡ )
f(x)dx � � ¿F (cos ....:..:_re
2n (4)
30. (Continuación) Demuestre que se satisface la siguiente igualdad entre los polinomios de
Chebyshev de primer y de segundo tipo: T'n = nU.-1. en la que F(x) = f(x)../1 -x2• Esta expresión se conoce como fórmula de cuadratura
31. Señale cuál es el término de error para la regla del trapecio y cuál el de la regla del trapecio de Hermite. Resulta exacta para cierto espacio lineal de dimensión 2n, a saber
compuesta.
32. Llene los huecos que se dejaron cuando se realizó el cálculo de los términos de error para la G = {pw : p E l12n-1} w(x) = ( l -xz)-1/2.
regla de Simpson y la regla de Simpson compuesta.
No parece probable que de utilizar esta fórmula se derive un ahorro en el esfuerzo
computacional. (¿Por qué?) Por otra parte, con sólo n evaluaciones de f tenemos una
7.3 Cuadratura gaussiana fórmula que es exacta en un espacio lineal de dimensión 2n. El afán sistemático de
lograr esta meta nos lleva a las fórmulas de cuadratura gaussiana.
En la sección anterior vimos cómo generar fórmulas de cuadratura del tipo
l a
f(x) dx � t
i=O
A¡f(x¡), ( 1)
Cuadratura gaussiana
La teoría puede formularse teniendo en mente fórmulas de cuadratura ligeramente
más generales, a saber:
n
que dan el resultado exacto para polinomios de grado � n. En estas fórmulas la elección
de nodos Xo, x1, ••• , Xn se hizo a priori. Una vez que se fijaron los nodos, los coeficientes
se determinaron de manera unívoca a partir del requisito de que (1) debe ser una igualdad
lª
bf(x)w(x)dx � ¿A¡J(x¡),
i=O
(5a)
donde w es una función de peso positiva que permanece fija. Naturalmente, el caso
para todaf E 11n.
Es natural preguntarse si una elección de nodos para la fórmula (1) puede ser mejor w(x) =
1 tiene una importancia especial. Supongamos que la fórmula (5a) es exacta
que otra. Por ejemplo, puede haber un conjunto particular de nodos para el cual los paraf E rr•. Como aprendimos en la sección anterior, éste es el caso si y sólo si
coeficientes resultantesA; sean iguales unos a otros. SiA; = e para O � i � n, entonces
n
al usar la ecuación (1) se efectúa un menor número de operaciones aritméticas, ya que
ahora adopta una forma más sencilla:
A; =
1a
b w(x)
IT
X-X·
--1 dx.
X
j=O ¡ -Xj
(5b)
l a
f(x)dx � e ti
i=O
(x;). (2)
j•d
En vista de que se cuenta con n + 1 coeficientes A¡ y n + I nodos X¡, sin que exista nin
guna restricción a priori sobre ellos, sospechamos que se pueden descubrir fórmulas de
(El efecto es el de reducir el número de multiplicaciones de n+ 1 a l.) Las fórmulas del cuadratura como la que aparece en la ecuación (5a) que resulten exactas para polinomios
tipo (2) existen sólo para n = O, 1, 2, 3, 4, 5, 6, y 8. Se conocen como fórmulas de de grado � 2n + 1. Pasamos a demostrar que, en efecto, esto es cierto.
cuadratura de Chebyshev. He aquí la que corresponde a n = 4: Debemos esta idea a Car! Friedrich Gauss (1777-1855), y consiste en usar la posibi
lidad de poder variar los nodos para hacer que la fórmula de cuadratura (5a, b) sea exacta
para todos los polinomios de grado 2n+ l. A continuación presentamos el teorema que
1
J_1 J(x) dx � HJ(-a.) + !(-�) +f(O)+f( �) + f(a.)], (3)
nos indica dónde colocar los nodos.
472 Capítulo 7 Diferenciación e integración numérica 7.3 Cuadratura gaussiana 473
TEOREMA 1 Tomemos una función de peso positiva w y un polinomio q distinto de cero y de grado donde
n + 1, que es w-ortogonal a IIn en el sentido de que para cualquier p E IIn tenemos que a= 1/V'J,
l q(x)p(x)w(x)dx = O. (6)
y
l !(�)dx � Aof(Xo)+A¡f(x¡)+ · · ·+A4f(x4 ), (8)
Si Xo, x¡, ..., Xn son los ceros de q, entonces lafórmula de cuadratura (5a) será exacta 1
[ qn+I (x)p(x)w(x)dx = O parap E II•. Un notable teorema debido a Stieltjes asegura la convergencia de las fórmulas gaus
sianas cuando n --+ oo. Fijando w y [a, b] obtenemos una fórmula de cuadratura
gaussiana para cada n E {O, 1, 2, ...}. Podemos ahora escribirlas como:
Estos son los llamados polinomios ortogonales y son de mucha utilidad en varias
ramas de las matemáticas, razón por la que se sabe mucho acerca de ellos. Tal como se [f(x)w(x)dx � I:,A.¡f(x.;) (n � 0). (9)
dijo en la sección 6.8, pueden generarse mediante un algoritmo recursivo. ª i=O
1, y n =2. TEOREMA 3 Si f es continua en [a, b], entonces las aproximaciones proporcionadas por la ecuación
Ejemplo Encuentre la regla de cuadratura gaussiana cuando [a, b] =[-1, 1), w(x) = (9) convergen a la integral conforme n--+ oo.
Respuesta El teorema 5 de la sección 6.8 nos dice que los polinomios ortogona
les pueden deter
minarse de manera recursiva, tal como se hizo en el ejemplo 2 de dicha sección. Por lo Demostración Sea&> O. El teorema de aproximación de Weierstrass (teorema 8 de la Sec. 6.1) señala
tanto: que existe un polinomio p para el cual if(x)-p(x)I < e en [a, b]. La n-ésima fórmula
qo(x) =1 gaussiana permite integrar p correctamente para cualquier n tal que 2n excede el grado
de p. Usando desigualdades elementales y el lema anterior llegamos a:
q¡(X) =X
q2(x) =x2 - } l[f(x)w(x)dx-I:,A.¡f(x.;)I
ª
q3(X) =x3 - �X.
i=O
b b n n
� 11 f(x)w(x)dx-1 p(x)w(x)dxl +ILAn;P(Xn;) -LA.J(xm)I
Las raíces O y ± J31s de q 3 son los nodos de la fórmula de cuadratura a a i=O i=O
(-fs) /i).
b n
TEOREMA 4 Considere unafórmula gaussiana con su término de error: SERIE DE PROBLEMAS 7.3
l. Tome en la ecuación (2),n = 1, a = O, b= l. Encuentre todos los casos de la fónnula que
1a
b n-1
f(x)w(x)dx = ¿AJ(x;) +E.
i=O
resultan exactos para/ E Il3.
2. Resuelva el problema 1 conn = 2.
'3. Diseñe un programa de computadora para verificar si la fónnula de cuadratura de Hermite,
ecuación (4), conn = 4, es exacta para todas las funciones p(x)(l -x 2F 1 12, donde p E II9•
Para unaf E c ¡a, b] tenemos que Basta verificar la fónnula para las diez funciones de prueba Tk(x)(l- x2 )-112, donde Tk es
2n
donde
Demostración Según el proceso de interpolación de Hermite (Sec. 6.3) existe un polinomio p de a lo
más grado 2n - 1 tal que:
Ao = A2 = i (1 + ! fii) ¡;, 0.34785 48451 37454
(O ;;;í i ;;;í n - 1).
Ai =A3 = t(1- t/ii) ¡:, 0.65214 51548 62546
w- 4V03) ¡:, o.86113 6311594052
p(x;) = f(x;) p'(x;)=J'(x;)
-xo= x2= v
Para esta interpolación la fórmula de error es:
-X¡ = X3 = Vt(3 + 4V03) ¡:, 0.33998 10435 848456.
f(x) - p(x) = ¡( l(r,(x))q2(x)/(2n)!. (10) 5. Verifique si la ecuación (7) es una fórmula gaussiana correcta.
2n
1 b n-1
p(x)w(x)dx = ¿A;p(x;) = ¿AJ(x;).
n-1
8. (a) Encuentre una expresión de la forma
L
ª i=O i=O
xf(x)dx ¡;, tA¡f(x;),
Más aún, se puede utilizar el teorema del valor medio para integrales para mostrar que
¡¡ 2
f(x)dx�c ¿f(x,),
¡O
1
i=O
4
xf(x)dx = ¿A¡J(x¡),
-1 i=O es correcta para todaf E !19 (polinomios de grado 9), ¿qué propiedades tiene el polimonio
q de grado 5 del que x0, xi, ..., x.i son los ceros?
que sea exacta para todos los polinomios cuadráticos. 19. Sí la fórrnula
11. (a) Sí la fórrnula de integración [ (x4 - I)f(x)dx = A/(X-O)+ Bf(x1) +Cf(x2),
l f(x)dx�f(a.) +f(-a.), es correcta para todaf que sea un polinomio de grado ;;,; 5, ¿qué propiedades debe tener el
1 polinomio q cuyos ceros son X-O, xi, x2?
20. ¿Cuál de los siguientes polinomios es ortogonal a II2 en el intervalo [O, l], con función
va a ser exacta para todos los polinomios cuadráticos, ¿qué valor de a. deberá utilizarse? de peso w(x) = !? (í) 1 +x, (ii) x - (iii) x2 - 3x +1, (iv) 35x4 - 60x2 + 32x - 3,
!,
Responda la misma pregunta considerando el caso de los polinomios cúbicos y el de los
polinomios de las forrnas (v) x3 - 3x2+x- l .
21. Encuentre u n polinomio distinto d e cero que sea ortogonal a II2 en el intervalo[-1, l], con
(b)f(x) =a+bx+cx3+dx4 (c)f(x) = a+¿b,x2'-1 +cx2n respecto a la función de peso 1+x2.
i=l
22. Considere una regla de integración numérica de la forrna
12. ¿Para qué valores de a. resulta exacta en II3 la siguiente fórrnula?
[f(x)dx�J(a.)+J(2 - a.).
l/(x)dx�Af (-vi) +BJ(O)+Cf (vi).
(a) ¿Cuál es el sistema lineal que debe resolverse si se utiliza el método de coeficientes
indeterminados para encontrar A, B y C ? Calcule A, B, C
13. Demuestre que sí el intervalo es simétrico respecto del origen y que si w es una función par,
entonces los nodos gaussianos serán simétricos y A, = An-i para O ;;:; i ;;:; n. (b) ¿Cuáles son las tres integrales que deben calcularse para determinar A, B y C mediante
la fórmula de Newton-Cotes? Encuentre A, By C .
14. Demuestre que toda fórrnula de cuadratura del tipo 23. Muestre cómo la regla de cuadratura gaussiana
¡ f(x)dx�tA¡f(x,),
b
a i=O
[t(x)dx�it (-vi) +JJ(O)+if (vi),
es exacta en algún subespacio de C[a, b] de dimensión infinita. puede usarse para calcular J:f(x)dx. Utilice este resultado para determinar el valor de
l
[ xf(x)dx�AJ(- l )+Bf(O)+Cf(+l),
f(x)dx�Aof(O)+A 1f(l)+Aif(2),
sea exacta para todos los polinomios de grado máximo m. ¿Cuál es el valor de m?
26. Encuentre los valores de A, B, y C usando el método de coeficientes indeterminados en la
sea exacta para todos los polinomios de grado 3. siguiente regla, la cual deberá proporcionar resultados exactos para polinomios de grado 2.
f
17. Usando solamentef(O),f'(-1),f" (1), calcule una aproximación a J(x)dx que sea exacta
para todos los polinomios cuadráticos. ¿Es exacta esta aproximación para polinomios de
grado 3?, ¿por qué sí o por qué no?
¡h-3h
f(x)dx�h[Af(O) +Bf(-h) +Cf(-2h)].
7.4 Integración de Romberg
480 Capítulo 7 Diferenciación e integración numérica 481
27. (Continuación) lCómo puede utilizarse una regla de integración numérica como la que En este caso la doble comilla sobre la sumatoria significa que tanto el primer término
aparece en el problema anterior para obtener una regla que permita resolver una ecuación como el último deben dividirse entre dos.
diferencial ordinaria de la forma siguiente?
Ejemplo 1 Si se toma el intervalo [0, 1], ¿cuáles son las fórmulas explícitas para T(l), T(2), T(4) y
x' =f (t, x) x(to) = .xo. T(8)?
28. Encuentre los coeficientes y los nodos de una fórmula de cuadratura gaussiana que adopta Respuesta Usando la ecuación (2) obtenemos:
la siguiente forma:
T(l) = }f(O) + lf(l)
[ x4/(x) dx � Ao/(.xo ) +A¡f(x1).
T(2) = ±f(O) + }1/(f)J + ±f(l)
29. Demuestre que ninguna fórmula de cuadratura gaussiana con n nodos puede ser exacta en
Il2n.
T(4) = lf(O) +!1/(!)+f(1) + f(i)J+ lJ(l)
30. ¿Qué sucede en la teoría de la cuadratura gaussiana si la función w no es positiva? T(8) = fJ(O)+kl/(k)+f(!)+f(Í) +f(f) +f(Í)
31. Use la información proporcionada en la sección 7.2 para encontrar las fórmulas gaussianas +J(i) +1Gl1+ tJ(l) 11
asociadas al intervalo [-1, 1] con la función de peso w(x) = JI - x2. Los problemas 28 y
29 pueden resultar útiles para resolver esta cuestión. Es evidente que si queremos calcular el valor de T(2n), podemos beneficiarnos del
32. Determine los nodos y los pesos para la fórmula gaussiana que aparece a continuación: trabajo que ya se realizó para el cálculo de T(n). Sólo hace falta calcular los términos
que aparecen en T(2n) pero que no están incluidos entre los de T(n). Por ejemplo, de
las ecuaciones anteriores vemos que:
/ if(x)dx � Ao/(.xo ) +A¡f(x¡).
1
T(2) = !T(l) + !1/(!)J
33. Deduzca los valores exactos de los nodos y de los pesos para cada una de las siguientes
fórmulas. También determine el polinomio de mayor grado para el que la fórmula es exacta T(4 )= ! T(2) + !1/(!) +f(!)J
(a) Ecuación (3) (b) Ecuación (7) (c) Ecuación (8). T(8) = 1T(4)+tl/(t)+f(i)+J(j)+J(i)J.
I = tf(x)dx. (1) Demostrarnos la validez de la ecuación (3) escribiendo primero T(2n) en términos de
T(n):
A lo largo de esta presentación tanto la función! como el intervalo [a, b] permanecen T(2n) = !T(n) + [T(2n)- !T(n)].
fijos. Usando la ecuación (2) podemos presentar la expresión entre corchetes de la siguiente
forma:
Regla recursiva del trapecio m
= h ¿ ''J(a+ih) - h ¿ "J(a+2ih) = h ¿f(a+(2i - l)h).
n n
Denotemos con T(n) a la regla del trapecio para/ que usan subintervalos de anchura
T(2n) - T(n) !
h = (b-a)/n. Partiendo de la ecuación ( 4) de la sección 7.2 llegarnos a:
i=O i=O i=l
cursiva. Si se cuenta con 2n subintervalos uniformes, entonces la ecuación (3) suministra for m = 1, 2,...; M do
una regla del trapecio recursiva R(n, m) +- R(n, m -1)+ [R(n, m -1)-R(n-I,m -1)]/W -1)
la estimación correspondiente a la regla del trapecio con 2• subintervalos, tenemos que: procedimiento para detener automáticamente los cálculos una vez que cierto criterio de
error previamente establecido se satisface.
R(O, O)= !(b -a)[f(a)+ f(b)]
1
R(n,0)= !R(n -1,0)+ T �f(a+(2i- I)T)
zn-1
b-a b-a (4) Análisis
Para explicar el origen de la ecuación (5) iniciamos con la fórmula de Euler
Los valores R(O, O), R(l, O), R(2, 0), ... , R(M, O) se calculan para valores pequeños de M, Maclaurin:
y no hay evaluaciones repetidas de funciones. En lo que resta del algoritmo de Romberg
se deben calcular los valores de cantidades adicionales R(n, m). Todas ellas se pueden
interpretar como estimaciones del valor de la integral L Una vez que se ha calculado el
1 1f(t )dt= -[f(O)+ f(l)]+ ¿A21: [f(2k-ll(O) -¡<Zk-1)(1)]
1 m-1
valor del elemento R(M, O) ya no resultan necesarias más evaluaciones del integrando f.
2
-Az,,/2ml�o),
o � �
Las siguientes columnas del arreglo .R las que corresponden a n � 1 y m � ¡ se generan
utilizando la fórmula:
qonde �o es algún punto entre O y l. Se puede demostrar que la ecuación (6) es válida
R(n, m) = R(n, m -1)+ [R(n,m -1) -R(n-1,m -l)]. (5) para cualquier función! E c2m ¡o,l]. En la sección 7.7 se encuentra uµa demostración
4 1 de esta importante fórmula. Las constantes k!Ak se conocen como números de Bemoulli
1
m_
R(4, O) R(4, 1) R(4, 2) R(4, 3) R(4,4) A partir de la fórmula de origen (6) podemos obtener la siguiente en dos pasos: aplique
la ecuación (6) a la función g definida por g(t) = f(x;+ ht) con h = x;+i - x; y, en la
integral resultante, haga el cambio de variable t = (x -X;)/h.
R(M, O) R(M, 1) R(M, 2) R(M, 3) R(M, 4) · · · R(M, M).
A continuación se presenta el seudocódigo para el algoritmo de Romberg calculado por
1 f(x) dx = [f (x;)+ f(x;+1)]
renglones: x, 2
Xi+1
h
f
484 Capítulo 7 Diferenciación e integración numérica 7.4 Integración de Romberg 485
En la ecuación (7), en ambos lados de la igualdad, llevamos a cabo la operación que se converge a L Esto demuestra que lím.....00 R(n, O) = L En cuanto a la segunda columna,
indica en la sumatoria ¿7=/ Six¡ = a+ih para O � i � 2" yh = (b-a)/2", entonces: nos damos cuenta de que
¿A
m-1 (8) n->oo
+ 2kh
2k
[ (a) -f2k-11(b)]
¡(2k-Il Todas las columnas restantes se pueden analizar de la misma manera. 11
k=I
para alguna� E (a, b). Al deducir esta ecuación, el término de error se ha manejado l. Deduzca la ecuación ( 7) a partir de la (6).
tal como se describe en el problema 2. La ecuación (8) se interpreta como sigue. El 2. Deduzca la ecuación (8) a partir de la (7) y, en particular, justifique la transformación de
primer término a la derecha corresponde al cálculo de L ecuación (1), mediante la regla
del trapecio, usando subintervalos de tamaño h = (b -a)/2". La ecuación (8) nos dice
2n-l
'lm +
h I ¿J(2m\1;;) a (b -a)h'lm¡('lm l@.
entonces que:
i=O
I = R(n, O)+ c2 h2+ c4h4+ c6h6+ · · ·+ c2m-2 h2m-z+ c2m h2m¡(2ml@, (9) 3. Deduzca la siguiente ecuación, para la cual h = I /2"
4 h) I ¿ 4"3(4-1•) C2n+2h2n+2,
00
donde/ E c2m[a, b] y� E (a, b). La ecuación resulta válida para cualquier h, ylos l = :/ (/, z - T(f, h) -
coeficientes de c2, c4, ••• , c2m son independientes de h. Dado que la ecuación (9) es un 3 n=l
caso especial de la ecuación (15) de la sección 7.1, podemos obtener de inmediato la
ecuación (4) usando el análisis de extrapolación de Richardson de la sección 7.1. donde
2•
Para aprovechar plenamente el algoritmo de Romberg debemos pedir que la función I = [f(x)dx y T(f, h) = h ¿f(ih).
f sea de clase c2m[a, b], con un valor de m tan alto como sea posible. Esta hipótesis i=O
justifica el uso de la fórmula de Euler-Maclaurin e implica que las cantidades R(n, m)
4. Demuestre que la segunda columna en el arreglo de Romberg es el resultado de aplicar la
convergen a la integral def con un error del tipo O(h2m), donde h = (b - a)Z-". ¿Qué regla de Simpson af (Véase la Ec. ( 6), Sec. 7.2.)
sucede si se supone que f sólo es continua?
5. Demuestre por inducción que
TEOREMA Sif E C[a, b], entonces cada columna del arreglo de Romberg converge a la integral I -R(n, m -1) = ah'lm + bh1m+z+ ch'lm+4+ ....
de f Por consiguiente, para cada m,
6. Use el algoritmo de Romberg para calcular R(2, 2) para las siguientes integrales:
i
J�
&
lím R(n, m) = ¡ f(x) cb:. (a) (b)
f ! (x)z
n-oo Ja 1 X Ío ji dx (en términos de it).
Demostración Iniciamos el proceso de demostración en la columna uno, la cual contiene estimaciones 7. Suponga que S(f, h) es una regla de cuadratura para la integral/ en la ecuación (1) y que
trapezoidales de la integral L La regla del trapecio con k subintervalos se puede escribir la serie para el error es c4h4+ c6h6+ · · ·. Combine S(f, h) con S(/, h/3) para encontrar una
aproximación más precisa para L
en la forma:
8. En el algoritmo de Romberg, R(n, 0) es una estimación delf(x) dx en la que se ha usado
k-1
¿ "J(a+ ih) = !h ¿f(a+ ih)+ !h ¿f(a+ ih).
k k
la regla del trapecio con 2" subintervalos. ¿Cuántas evaluaciones def(x) se necesitan para
h calcular R(i,J) para O ;;;; i ;;;; N y O ;;;; j ;;¡; N?
i=O i=O i=l 9. Si la regla del trapecio satisface la ecuación
El lado derecho de esta ecuación representa el promedio de dos sumas de Riemann para
L En vista de que h = (b -a)/k, la máxima anchura de los subintervalos converge a ['f(x)dx = T(f, h)+ c1h+ czh2+ c¡h3+ · ..,
cero conforme k -. oo. Por lo tanto, como consecuencia de la teoría de la integral de
Riemann, ambas sumas de Riemann convergen a L Evidentemente su promedio también en lugar de la ecuación (9), ¿cómo deberíamos entonces modificar la fórmula (5)?
486 Capítulo 7 Diferenciaci6n e integraci6n numérica
7.5 Cuadratura adaptativa 487
10. En el algoritmo de Romberg los elementos en la segunda columna satisfacen para alguna � E (a, b). La idea principal es que si la regla de Simpson en un subintervalo
R(i,1 ) = I + C4ht + C6h� + · · ·, dado no es suficientemente precisa, entonces el intervalo se divide en dos partes iguales
y la regla se vuelve a utilizar en cada una de ellas. Este procedimiento se repite a fin
donde I = lª¡,f(x)dx y h; = (b- a)/2'. Deduzca la fórmula para calcular los elementos de
la tercera columna y el primer término en la serie correspondiente al error. de aproximar el valor de la integral con una misma precisión en todos los subintervalos
considerados. Al final, habremos calculado la integral con n aplicaciones de la regla de
11 . Exprese R(2, 2) en términos de los elementos de la primera columna del arreglo de Romberg.
[a,
Demuestre que R(3, 3) no es una fórmula de Newton-Cotes, pero que R(2,2) sí lo es. Simpson,
c12. Escriba un subprograma que efectúe los cálculos correspondientes al algoritmo de Romberg
para una función! definida sobre un intervalo arbitrario b]. El usuario querrá especificar
el número de filas que desea calcular en el arreglo, y ver el arreglo entero una vez que se
ha calculado. Escriba un programa principal y verifique su subprograma de Romberg en los
1 b n x; n
f(x)dx = ¿l f(x)dx = ¿(S;+e¡) = ¿S¡+¿ e;,
n n
1
(a)¡ �dx ( b) r
1 cosx - i'
f_1 senx
dx (c) l"°
(xe')-1 dx.
donde S¡ es una aproximación de la integral en el intervalo (x¡_ 1, x¡] y e; es el error local
correspondiente. Sí
Jed � e(x¡ -X;-1)/(b-a),
O X
Las rutinas para estas integrales deberán escribirse evitando pérdidas importantes de dígitos (3)
significativos debidas a sustracción. Además, es común definir una función f en cualquier
punto dudosoxo mediante la ecuación/(xo) = lím,-xt,J (x). Si el límite existe, este método entonces el error total estará acotado por
1 I
garantiza la continuidad de/ en xo. Para el tercer ejemplo haga un cambio adecuado de
variable, tal como lo seríax = 1 / t. Calcule siete renglones en el arreglo de Romberg. En
cada caso imprima el arreglo con un formato que permita observar la convergencia. n n n x; -x;_¡) = &.
�e¡ � � Je;J � � �(
13. Demuestre que la ecuación (3) se deduce de inmediato a partir de la siguiente igualdad: b a
/l f(x)dx-ts;/ � &.
b
Los métodos de la cuadratura adaptativa tienen como finalidad el cálculo de integrales Con base en la ecuación (2), la regla básica de Símpson para el intervalo [u, v] se
definidas tomando en consideración el comportamiento del integrando en forma auto describe por medio de:
mática. Idealmente, el usuario sólo tiene que proporcionar el integrando f, el intervalo
[a, b] y la precisión & con que se quiere calcular la integral v 1
1"
f(x)dx = S(u, v)- (v
90 - u)5j< l(�1 ),
4
(4)
lf�)dx.
El programa divide el intervalo en subíntervalos de longitud variable de modo que la
(1)
para alguna �1 E (u, v). Si el intervalo de integración se divide en su punto medio
w = (u+v)/2 en dos subintervalos iguales, se puede calcular un valor más preciso de la
integración numérica sobre los subintervalos produzca resultados de precisión aceptable. integral utilizando la regla de Simpson en cada uno de ellos. He aquí lo que resulta de
En esta sección vamos a desarrollar un método representativo de la cuadratura hacer tal cosa:
adaptativa. Este procedimiento usa en cada subintervalo la regla de Simpson junto con
una estimación del error correspondiente. La regla de Simpson está dada por la ecuación w
[f(x)dx =
( 6) de la sección 7.2: 1 f(x)dx+ [f(x)dx
1 1 1
l ab
f(x)dx = S(a, b)-
90
(b-a)5¡< J(�)
4 = S(u,w) - 90 (w- u)5j<4l(�2)+ S(w, v) - 90 (v-w)5¡<4J(�3 )
b-ar
f
S(a, b) = - - (a)+ 4J (- -) + f(b)]
ª+b ( 2) = s· + s ·· - _!__ (�) s ¡¡<4JC;2)++¡<4J(;3 )J
6 2 90 2
= s·+ s·· - _!__ .-!..(v- u)5j<4l(;)
16. 90 (5)
488 Capítulo 7 Diferenciación e integración numérica 7.5 Cuadratura adaptativa 489
En estos cálculos hemos puesto Observe que sólo se requieren dos nuevas evaluaciones f(y) y f(z) para calcular s• =
s• = S(u,w) S** = S(w,v) S(a, e) y S** = S(c, b) , ya que las cantidades restantes ya se han calculado con anterio
¡
16/15 y sustrayendo la ecuación (4) multiplicada por 1/15. El resultado es se toma de la pila. Éste tendrá las siguientes propiedades:
V
1 (7)
u f(x) dx � S*+ S**+ [S*+ S** - S(u,v)]. w=u+h v=u+Zh
15
ü=f(u) W=f(w) v=f(v)
Las bases del método de la cuadratura adaptativa han quedado fija. Suponga que
se quiere calcular numéricamente la integral (1) con una tolerancia prefijadas. Sij<4l S = (ü+4W+ v)h/3.
existe y exhibe variaciones pequeñas, la aproximación correspondiente a la ecuación
(7) será satisfactoria en intervalos pequeños. El algoritmo adaptativo comienza con Después, sustituimos h por h/2 y computamos
la consideración del intervalo [a, b]. Para éste (igual que para otros intervalos que se
considerarán posteriormente) se construye un vector que tiene seis componentes: y = u+ h z = u+ 3h
1
h = -(b-a). (8) Y = f(y) z = f(z)
[a, h,f(a),f(a+ h),f(a+ 2h), S]
2 ru
s· = + 4y+ w)h/3
Este vector contiene la estimación de Simpson S = S(a, b), así como los datos necesarios s•• = cw+ 4z+ v)h/3.
para calcularla por medio de la ecuación
h Queremos saber si S*+ S**, como estimación de J; f(x) dx, satisface el criterio de error,
S = [f(a)+ 4f(a+ h)+ f(a+ 2h)J. que es
3
Ahora calculamos e= a+ h, s• = S(a, e) y s•• = S(c, b). Como ya dijimos, S*+ s••
IS*+ s·· - s¡ � 30sh/(b - a). (10)
es una estimación más refinada de la integral. Para ver si ya es satisfactoria (es decir, Si el criterio (1O) lo satisface, entonces s•+ S**+ (S*+ s•• - S)/15 se añade a í:, y se
cumple con la tolerancias), utilizamos las ecuaciones (7) y (3). Para ello examinamos toma un nuevo vector de la pila para ser procesado. Si S* + S** no aprueba el examen,
la desigualdad dos nuevos vectores se añaden a la pila:
1 (9)
IS*+ s·· - SI <s(2h)/(b - a).
15 [u, h, ü,y, W, S*]
Si ésta se cumple, el número S*+ s••+ [S*+ s•• - SJ/15 se acepta como el valor de la
integral (1) en conformidad con la ecuación (7). Si la desigualdad (9) no se cumple, el z,
[u+2h,h,W, v, S**J.
intervalo se subdivide en dos subintervalos de longitudes iguales, a saber, [a, cJ y [c, bJ,
donde e= (a+b)/2. Para cada uno de dichos intervalos se construyen sendos vectores Acto seguido, se toma otro vector de la pila y se procesa de la misma manera No se
como se acaba de describir. El vector en (8) se descarta, y en su lugar tenemos dos permite que el tamaño de la pila exceda de n vectores, en donde n es un parámetro que
nuevos vectores: fija el usuario. Esto impide que el algoritmo se torne infinito.
A continuación ofrecemos un seudocódigo para este algoritmo. Éste se apega a la
[a, ;,f(a), f(y).f(c),s•] Y=a+h/2
descripción que acabamos de hacer. Se tiene la precaución de guardar cantidades que
pudiesen necesitar se más adelante. Los vectores de la pila de trabajo se denotan con
vO\ v(2) y así sucesivamente. Cada vector tiene seis componentes:
[e, �,f(c),f(z),f(b),s••] z = c+h/2.
v (k) -
- (k) (k)
[v 1 , v2 , • . . , v6(k)l.
490 Capítulo 7 Diferenciación e integración numérica 7.5 Cuadratura adaptativa 49 1
La primera componente, v¡k� siempre representa el punto a la extrema izquierda de un 2. El criterio (3) de error local se utilizó para obtener una cota de error absoluta. Trate de
k
intervalo; vf) es la mitad de la longitud de dicho intervalo; v� � vf� vfl son los valores obtener un criterio para el error local que nos lleve a una cota de error relativo
k
�
de f en el extremo izquierdo, el punto medio y el extremo derecho de este intervalo;v� l
es el valor que da la regla de Simpson para este intervalo. /[t(x)dx-ts,/ /[t(x)dx/e.
El siguiente es el algoritmo completo.
input a, b, e, n 3. Detennine una aproximación similar a (7) utilizando la regla del trapecio en la forma
ll +- b - a;í: +- O;h +- ll/2; e+- (a+ b)/2;k +- I
[f(x)dv = T(u, v)-i(v - u)3/'@,
a+-f(a); b +- f(b); e+-f(c)
s+-(a+4c+b)h/3
donde
v(ll +- [a, h, a, e, b, S]
f
T(u, v) = (v - u)[f(u)+f(v)].
while 1 � k � n
4. La regla del trapecio compuesta se puede escribir en la forma
h +- vt);z
y+-f(v¡k) + h) I = T,,. - i(v - u)h2J"(�),
s· +- (vt) +4y+v�k))h/3 donde
z +- f(v¡k) +3h) l=[t(x)dx
k
S** +- (vfl+4Hv� l)h/3
k
if [S*+S**-v� J¡ < 30eh/ll then T,,. = � �(u)+2 �f(u+ih)+J(v)].
:E+-:E+S*+S**+ t5[S*+S**-vtl]
k+-k-1 Muestre cómo se pueden combinar T,,. y T2m para obtener una mejor aproximación a L En
este caso m es el número de subintervalos en el intervalo [u, v].
if k � O then output :E; stop
5. La regla de Simpson compuesta se puede escribir en la forma
else
if k � n then output failure; stop I = S2m -
1
(v - u)h4/4'(�),
ISO
ii+-v5(k)
V(k) ,- [v(k) h v(k) - v (k) S*] donde
1 , ' 3 ' y' 4 '
k+-k+ l
l=[t(x)dx
v(k) +- ¡v<k-1) +2h h' v(k- l)• -z' ii' S**]
r ,,. ,,. ]
1 ' 5
En algunos lenguajes de programación y en algunas computadoras es importante guardar y h = (v - u)/(2m), x; = u+ ih (O � i � 2m). Aquí se tienen 2m subintervalos en
en la misma columna, las cantidades que se accesan con mayor frecuencia. En tal caso, el intervalo [u, v]. Muestre cómo se pueden combinar S2m y S4,,. para obtener una mejor
la pila de vectores de trabajo se puede almacenar en un arreglo bidimensional V(I, aproximación a L
k
K) +-v(' ). 6. En la sección 7.4 se derivó la siguiente relación entre la regla del trapezoide sobre [u, v] con
m subintervalos y la regla del trapezoide sobre [u, v] con 2m subintervalos:
"'
SERIE DE PROBLEMAS 7.5 1
T2m = 2.T,,.+h ¿f(Xz¡-1),
e 1. Programe el algoritmo adaptativo y póngalo a prueba con las integrales siguientes:
(b) ¡
i=l
(a) [ x 1 /2dx (1 -x/12 dx (c) [ (1 -x/14 dx. donde h = (v - u)/(2m) y x; =u+ih (O� i � 2m). ¿Podemos utilizar este resultado para
1
establecer un esquema adaptativo?
492 Capítulo 7 Diferenciación e integración numérica
*7.6 Teoría de Sard de aproximación de funcionales 493
*7.6 Teoría de Sard de aproximación de funcionales Teorema de Peano
TEOREMA 1 Si elfuncional de la ecuación (1) aniquila a IIm , entonces para toda/ E cm+1 [a,b]
Un funcional lineal en un espacio lineal es un mapeo lineal de dicho espacio en el campo
escalar (en este libro, lR por lo general). Por ejemplo, si el espacio lineal es C[a, b], un
funcional lineal$ muy importante se define por $(!) = [ K(t)/m+1 \t) dt,
i=O i=O
De lo anterior se sigue que
Podemos argumentar de manera convincente que en el trabajo numérico éste es el tipo
más general de funcional que se puede calcular directamente; otros funcionales (tales
$(r)= '
1 ¡b¡ <m+l)
(t)$x[(x - rm dt.
como la integración) deben reemplazarse por funcionales de aproximación como '1'· Es m. a
precisamente esto lo que se hace en las áreas de integración y diferenciación numéricas.
Este último paso requiere que el funcional$ se pase al interior del signo de integración,
En los años de 1940 a 1970, Arthur Sard desarrolló una teoría coherente de la
lo cual se justifica a partir de ciertos teoremas del cálculo que necesitan las hipótesis que
aproximación de funcionales. Esta teoría considera de una manera muy interesante los
hemos asumido respecto de$. 8
splines naturales. El tipo de funcional que aproximaremos está dado por la ecuación:
¡
{ b n }
Si$ y ljf son dos funcionales que coinciden en IIm, entonces su diferencia aniquilará a
m
a.¡(x')/ l (x)dx + ; � ef (Zij) .
i IIm. La diferencia tendrá un núcleo de Peano K, y por la desigualdad de Cauchy-Schwarz
$(!)= � (i)
(2)
<m+n
l$U) - '!'U)I � IIKll2IIJ 112. (4)
Los puntos Z¡¡ se hayan en [a,b] y las funciones a.¡ se supone que son continuas por La norma con subíndice 2 es la norma usual Lz sobre [a,b]. Si en ljf hay parámetros
pedazos sobre [a,b]. El funcional$ se puede aplicar a cualquier/ E cm ¡a,b]. que no están plenamente determinados por la exigencia de que $ - 'I' aniquile a IIm,
Diremos que un funcional$ aniquila a un espacio W si$(!)= O para todaf E W. éstos se pueden elegir de modo que el factor J: K(t)2 dt sea un mínimo. De esta manera,
El núcleo de Peano de un funcional$ tal como en la ecuación (2) es la función obtenemos un funcional 'I' que es una mejor aproximación de$ en el sentido de Sard.
Schoenberg descubrió que tales fórmulas mejores se pueden obtener de una manera más
1 bien simple. A continuación se presenta este importante teorema. En él, $ o L es la
K(t) = 1$x[(x - t):J,
m. composición de$ y L, de modo que($ o L)(J) = $(Lf).
Demostración Sea ,¡f(ie la forma 'I' =I:7=0 c;t; y suponga que para todap E IIm, 'lf(p)=$(p). En tal Ahora podemos establecer la ecuación (5)escribiendo:
caso $-'I' aniquila a IIm. Sea K1 su núcleo de Peano. Si fes un spline natural de grado
2m + 1 en los nudos proporcionados, entonces Lf = f. Dado que los polinomios de grado b
1
a ·
$- q> oL también aniquila a IIm . Sea K su núcleo de Peano.Vamos a demostrar que
a a
b b b
1 $(! )= 1->(x)dx
K2(t) = 10.r[(x -t):J. (6)
m.
'l'if)=c¡f(-1)+czf(0)+c3f(l).
Si {so, s¡ , ..., sn } es una base cardinal de nuestro espacio de splines naturales, entonces Tomando en cuenta sólo funcionales 'I' y que coincidan con 4> en II. encuentre la mejor
s; (t¡)= Oij y L tendrá la forma: aproximación de 4> en el sentido de Sard.
Respuesta En esta situación requerimos el operador de interpolación de splines naturales L. Se
Lf = ¿f(t;)s;. puede verificar que
i=O
K2(t) = 1
1
¿ y¡(t¡ - t):.
n
(7) La mejor fórmula está dada por
1-: (Lf)(x)dx
m. i=O
'lf(f)= q>(Lf)=
Elija una función g tal que g<m+l) = K2. En este caso g<2m+!) = Kt), y ésta es una
función peldaño o spline de grado O. Por consiguiente, g es una función spline de grado = 2ao +4bo+ ib1
2m + 1 con nudos to, t 1, ••• , t.. De hecho, g es un spline natural. Para verificar esto,
observe que por la ecuación (7), K2 (t) = O cuando t � b. Por lo tanto, g<m+ll(t) = O = if(-1)+ if(O)+ if(I). 111
para t � b. Con base en la ecuación 6( ), para t � a � x tenemos que
1 SERIE DE PROBLEMAS *7.6
K2(t) = 1 0.r[(x -trJ.
m. l. Buscamos una fórmula aproximada
Ya que 0aniquila a IIm, K2(t) = g<m+l\t) = O cuando -oo < t � a. !' (x) r::. cof(-I) + c¡f(O) + cz!(I),
Como ges un spline natural, Lg =g. En consecuencia,
donde x es un punto fijo de (-1, !). Encuentre las condiciones necesarias y suficientes que
[ KK2dt = [ Kg<m+lldt
debemos pedir a los coeficientes para que la fórmula sea correcta en II1. Encuentre la mejor
= ($-$oL)(g )=O. f
aproximación en el sentido de Sard. Calcule 1 K(t)2 dt cuando se alcanza el mínimo.
496 Capítulo 7 Diferenciación e integración numérica *7.7 Polinomios de Bemoulli y lafórmula de Euler-Maclaurin 497
2. Para el ejemplo que se da en el texto, encuentre la mejor constante en la fórmula para el error f.
de donde obtenemos B¡(t) = t - Dado que el coeficiente de Bn en la ecuación (1) es
n + 1, siempre podemos resolver para Bn en términos de Bo, B ¡ ,..., Bn-l· El siguiente
J (f) -ljl(/)J � c!!f''l!2.
$ teorema enumera las propiedades de los polinomios de Bemoulli que vamos a necesitar.
3. Encuentre la función de interpolaciónf(f(t;) =t.¡, O ;:¡; i ;:¡; n) que minimiza la integral TEOREMA 1 Los polinomios de Bemoulli tienen las siguientes propiedades:
J,,,'º (!")2 dt, suponiendo queJ" es continua por pedazos.
(i) E,,=nBn-1 (n � 1)
4. Utilice el teorema del núcleo de Peana con el funcional
(ii) Bn(t + 1)- Bn(t) = nf'-l (n � 2)
t
$(!) =J(x + h)-f(x)-(h/2)[3¡' (x)-J'(x-h)],
-k
(x, h fijas)y demuestre que$(!)=(5/12)h3/'11(�), x-h < � < x+ h. (iii) Bn(t) = (;)Bk(O)t "
5. Utilice el teorema de Peano y derive el siguiente resultado para la regla de Slmpson k=O
(iv) Bn(l -t) = (- ltBn(t).
[f(x) dx= i [f(O) + 4/(1 ) +/(2)]--Jo/4l�).
Demostración Vamos a demostrar la ecuación (i) por inducción. El caso n = 1 se verifica a partir del
6. Utilice el teorema de Schoenberg de esta sección para demostrar que !
hecho de que B¡(t) = t - y Bo(t)= l. Ahora suponga que B� = kBk-l para k= I,
2, ... , n- 1 Derivando en la ecuación (1) y utilizando de nueva cuenta la ecuación (1),
!f(2) + if(O) -U(l) - it(3)! ;:¡; #sllJ"!!2- obtenemos
; 1)
n
(n;
n-l
B�(t) = n(n + l)f'- 1 = (n + 1) � (); B k(t). (2)
*7.7 Polinomios de Bernoulli y la fórmula de Euler-Maclaurin
A través de la hipótesis de inducción, la ecuación (2) se puede escribir en la forma:
La validez del algoritmo de integración de Romberg depende de la fórmula de Euler
Maclaurin, o ecuación (6) de la sección 7.4. Después de establecer algunas propiedades
n-1 ¡) n-l
(n + l)B� +; (n; kBk-l =(n + 1) � (;) Bk.
de los polinomios de Bemoulli, derivaremos dicha fórmula.
t
Se definen por la ecuación:
t G)
O k=O
f(t)dt = 11
0
f(t)Bo(t)dt = B1 (t)f(t)l -
0
1 11 B (t)f'(t)dt.
0
1 (5)
(-l)"B n(t + 1) - Bn(-t) =(-l)"Bn(t) - Bn(l - t) = F(t), Dado que B 1 (1) =!y B 1 (0) =-!,la ecuación (5) se puede escribir en la forma:
reconocemos en ella una ecuación del tipo F(t + 1) = F(t), de donde se sigue que Fes [f(t)dt = i(f( l) +f(O)] - [ B1 (t)f'(t)dt.
periódica con periodo l. Dado que F es un polinomio, debe ser una constante. Por lo
tanto,
(-l)"Bn (t) - Bn (I - t) =Cn. (4) La integral en esta ecuación se puede resolver integrando por partes, siendo el resultado
Ahora suponga que G tiene un cero en (0, 1). Dado que G(O) = G(l) =O , por el
teorema de Rolle sabemos que CY tiene dos ceros en (O, 1). Como B2n-t es un múltiplo +
1 1 1
(t)¡{2n\t)dt.
de G', B2n -i tiene dos ceros en (O, 1). Sin embargo, B2n-i también se anula en O y l , así (Zn)! 0 B2n
que Bí,,_ 1 tiene tres ceros en (O, l). En consecuencia, B2n-2 tiene tres ceros en (0, 1).
Siguiendo la misma línea de razonamiento, llegamos a la conclusión de que Bk, para El último término de esta suma se puede expresar en la forma:
índices impares k< 2n, tiene al menos dos ceros en (0, 1). Por consiguiente, B3 debe
tener dos ceros en (O, 1) y otros dos ceros en O y l . Esto es claramente imposible, ya que b2n ¡¡<2n-n(I) (2n-tl(O) b2n 1 2nl(t)dt.
1
-¡ J=
B3 es un polinomio de tercer grado. 11 (2n)! ¡<
(2n)! o
Capítulo 8
500 Capítulo 7 Diferenciación e integración numérica
501
502 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.1 Existencia y unicidad de las soluciones 503
Nos gustaría determinar la función x en un intervalo que contenga el punto inicial t 0• Deseamos que se satisfaga mín(a.,�/ M) f: l. Para ello podemos tomara. = l . Entonces
La solución analítica de este problema de valor inicial es x(t) = sec(t + 3), como se M = 4 , y nuestro objetivo se alcanza si hacemos que� f: 4. El teorema de existencia
puede verificar fácilmente. Dado que el valor de sec t se vuelve infinito en t = :bt/2, asegura que existe una solución del problema de valor inicial en el intervalo ltl �
nuestra solución sólo será válida para-rc/2 < t+3 < rc/2. El ejemplo proporcionado mín(a.,MM) = 1. 111
por la ecuación (2) resulta excepcional en el sentido de que posee una solución analítica
sencilla, a partir de la cual se pueden calcular fácilmente valores numéricos. Sin embargo,
la situación típica para problemas del tipo que se presenta en (1) es que no se disponga Unicidad
de soluciones analíticas y que se deban emplear métodos numéricos para calcular sus Puede suceder, aun si/ es continua, que el problema de valor inicial ( l) no tenga
soluciones. una solución única. Un ejemplo sencillo de este fenómeno lo podemos apreciar en el
siguiente problema:
Existencia x' = x2/3
{
x(O) = O.
¿Tendrá solución todo problema de valor inicial que se pueda expresar en la forma
( l)? La respuesta es no, ya que para que tenga solución deben hacerse ciertas suposicio =
Resulta evidente que la función cero, x(t) O, es una solución de este problema. Otra
solución es la función:
nes acerca de/, y aun así sólo podemos esperar que la solución exista en una vecindad
l
de t = t0• Considere, como ejemplo de lo que pudiera suceder: x(t) = /.
2
2
x' = I+x Para demostrar que el problema de valor inicial ( l) tiene una solución única en una
{ (3)
x(O) = O. vecindad de t = to es necesario suponer algo más acerca de/. He aquí el teorema usual
que trata este caso.
La curva solución inicia en t = O con pendiente uno; es decir, x'(O) = l. Dado que
la pendiente es positiva, x(t) es creciente en una vecindad de t = O. Por consiguiente, la TEOREMA 2 Sif y a¡/ax son continuas en el rectángulo R definido por (4), entonces el problema de
expresión 1 + x2 también es creciente, y como consecuencia de ello x' es creciente. En valor inicial (1) tiene una solución única en el intervalo que incluye a las t que satisfacen
vista de que tanto x como x' son crecientes y están relacionadas mediante la ecuación it -tol < mín(a.,�/M).
x' = l+x 2, podemos esperar que para algún valor finito de t no exista solución; es decir,
que x (t) =+oo. De hecho esto sucede en t = rc/2, debido a que la solución analítica de En los teoremas I y 2, el intervalo sobre el eje t en el cual se asegura que existe la
(3) es x(t) = tan t. solución puede ser más pequeño que la base del rectángulo donde definimos f(t, x). El
teorema3 es un poco diferente, en el sentido de que nos permite inferir la existencia y la
TEOREMA 1 Sif es continua en un rectángulo R centrado en (to, xa), digamos: unicidad de una solución sobre un intervalo [a, b] dado. (Véase Henrici (1962, pág. 15].)
R = {(t,x): l t -tol �a., Jx -xal ��}. (4) TEOREMA 3 Sif es continua en la franja a � t � b, -oo < x < oo y satisface la desigualdad:
entonces el problema de valor inicial (1) tiene una solución x(t) para Jt - tol �
IJ(t, X¡) -f(t, xz)I �Llx1 -x2I, (5)
mín(a.,�/ M), donde Mes el máximo de IJ(t, x)J en el rectángulo R.
entonces el problema de valor inicial (1) tiene una solución única en el intervalo [a, b].
Ejemplo 1 Demuestre que el problema de valor inicial
La desigualdad (5) se llama condición de Lipschitz en la segunda variable. Para
x' = (t+ senx)2
{ una función de una variable, tal condición simplemente aseguraría que
x(O) = 3.
lg(x1)-g(x2)I �Llx1 -x2I- (6)
tiene una solución en el intervalo-1 �t � l.
Respuesta En este ejemplo tenemosf(t, x) = (t+ senx)2 y (to, xa) = (0,3). En el rectángulo Vemos de inmediato que esta condición es más fuerte que continuidad, dado que si x2
tiende a x1 , el lado derecho de la desigualdad (6) tiende a cero, y esto obliga a que g(x2)
R = {(t,x) : Jtl �a., Jx -3 J ��}. tienda a g(x1). La condición (6) es más débil que tener una derivada acotada. De hecho,
si g'(x) existe en todas partes y no excede a L en valor absoluto, entonces el teorema del
la magnitud def está acotada por valor medio nos permite asegurar que
if(t,x)I �(a.+ 1)2 = M. lg(x1)-g(x2)I = ll@llx1 -x2I �Llx1 -xzl .
Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.1 Existencia y unicidad de las soluciones 505
504
Ejemplo 2 Demuestre que la función g(x) = I:7=1 a;lx - wd satisface una condición de Lipschitz 7. Usando el teorema 1 demuestre que el problema de valor inicial
con la constante L = I:7= 1 lad. x' = tanx x(O) = O,
t t
Respuesta tie ne una solución en el intervalo JtJ < rr./4.
8. Sea/ una función continua de una variable, definida sobre todo JR. Tome M(r) como el valor
lg(x1)-g(x2)I = \ a;lx1 - wd - a;ixz - w;I \ máximo de Jf(x)J para JxJ � r. Si M(r) = o(r) conforme r .... oo, entonces el problema de
valor inicial
x' = f(x) x(O) = O,
= \ ta;{lx1 -wd-lx2-wd}I tie ne una solución sobre todo IR. Demuestre esta aseveración.
9. Demuestre que el problema de valor inicial
w
� ¿)d Jlx1 -wd-lx2- ;IJ x' = t2 + l x(O) = O,
i=l
n tie ne una solución única e n el intervalo JtJ � 0.351.
� ¿ iadlx1 -x2I = Llx1 -x2l-
i=l
11
10. Demuestre que si f(t,x) es una función continua y acotada en el dominio a � t � b,
-oo < x < oo, e ntonce s el problema de valor inicial
(b) Repita e l inciso anterior para el problema de valor inicial (2). x' = 1+x+x2cost x(O) = O,
3. Demuestre que x =-i1/4 y x = 1- t son soluciones d el proble ma de valor inicial:
tie ne una solución e n el intervalo-1/3 � t � I/3.
Zx' = Vt2+4x-t x(2) =-1. 13. Demuestre que el proble ma de valor inicial
4. Resuelva el problema de valor inicialx' = f(t,x),x(O) = O, en los siguie ntes casos esp eciales: tie ne dos soluciones. Explique por qué el teorema 2 no resulta válido e n e ste caso.
(a) f(t, x) = i3 14. D emuestre que el proble ma
(b)f(t,x) = (1- ?)-1/2 x' = tx2¡3 x(O) = J,
(c)/(t, x) = (1+?)-1 tie ne una solución e n el intervalo-2 � t � 2. ¿Hay más de una solución?
(d)/(t,x) = (t+1)-1 15. D emu estre que el proble ma de valor inicial
Use el
5. Resuelva el problema de valor inicial x' = f(t,x), x(O) = O, e n los siguie ntes casos. x' = 2te_, x(O) = O,
1 dx/dt ;é O.
hecho de que dt/dx = (dx/dt)- cuando
(a)f(t,x) =x-
2
tie ne una solución única e n el intervalo -oo < t < oo. ¿Existe n valor es de a. y P en e l
teorema de existencia y unicidad que permitan llegar a esta conclusión?
(b)f(t,x) = 1+x2
(c)f(t,x) = (senx+cosx)-1 16. Sea/(t, x) una función continua e n el rectángulo definido por JrJ � 3, lxl � 4, y suponga
que lf(t,x)I � 7 para todos los puntos e n este rectángulo. ¿Cuál es el intervalo más grande
6. Use e l primer teorema de es ta se cción para mostrar que el problema de valor inicial para el cual el proble ma de valor inicial
17. Encuentre un intervalo para el que podamos asegurar que el problema de valor inicial La serie de Taylor desempeña un papel central en el procedimiento, y la escribimos
de la siguiente forma:
x' = secx x(O) = O,
h2 h3 h4
tiene una solución única. x(t + h) = x(t) + h x'(t )+ 2!x"(t) + 31 x"'(t) + ¡/4l(t) + ... (4)
18. Use cada uno de los teoremas 1, 2 y 3 para señalar dónde tiene solución el siguiente problema,
y luego resuélvalo explícitamente para comparar la teoría con los hechos: Las derivadas que aparecen aquí se pueden calcular a partir de la ecuación diferencial
incluida en (3) . Se obtiene lo siguiente:
x' = x2 x(O) = l.
x" = - sen t- x' cosx + 2t
19. Demuestre que el problema de valor inicial x111 = - cos t -x" cosx + (x') 2 senx+2
x' = 1 + i x(O) = O, x(4l = sent-x'" cosx + 3x'x" senx+ (x') 3 cos.x.
tiene una solución en el intervalo [-1, l]. Demuestre que este ejemplo no satisface las En este punto nuestra paciencia se agota y decidimos usar sólo los términos hasta e
hipótesis del teorema 3. Explique por qué este ejemplo no contradice al teorema 3. incluyendo h4 en la fórmula (4) . Los términos que no hemos incluido inician con
un término en h5 y constituyen colectivamente el error de truncamiento inherente a
nuestro procedimiento. Se dice que el método numérico resultante es de orden 4 . (El
8.2 Método de la serie de Taylor orden del método de la serie de Taylor es n si se utilizan términos hasta e incluyendo el
denotado por h"x(•l(t)/n!.) Observe que al derivar con respecto a t términos tales como
senx, debemos pensar en dicha operación como d{sen[x(t)]}/dt y utilizar la regla de
Al calcular soluciones numéricas de ecuaciones diferenciales rara vez esperamos obtener la cadena para derivar. Esto explica la complejidad de las fórmulas para x", x'", . ..
directamente la solución en términos de una fórmula que haga explícita la dependencia Podríamos llevar a cabo varias sustituciones con el fin de obtener fórmulas para x'',
de x(t) como una función de t. En lugar de ello construimos usualmente una tabla con x'", .. . que no contengan derivadas de x en el lado derecho de la expresión. Esto no
valores de la función, tal como se ilustra a continuación: es necesario si las fórmulas se utilizan en el orden presentado. Por su propia naturaleza
to t1 t2 tm son recursivas.
I 1 1 t3 (1) En las líneas que siguen presentamos un algoritmo para resolver el problema de
XQ i X¡ i X2 i X3 1 • • • 1 Xm
valor inicial (3), comenzando en t = -1 y continuando con pasos de h = 0 .01 . Como
deseamos obtener una solución en el intervalo (-1,1] debemos tomar 200 pasos.
En este caso x; es el valor aproximado que se obtuvo para x(t;), que es como denotamos
el valor de la solución exacta en t;. Con una tabla como la que se muestra en (1) se
puede construir una función de spline, además de otras funciones de aproximación. Sin inputM ._ 200;h ._ O.Ol;t ._ -1.0;x .... 3 .0
embargo, la mayoría de los métodos numéricos para resolver ecuaciones diferenciales output O, t, x
generan primero dicha tabla. for k = 1, 2, ... , M do
Consideramos una vez más el problema de valor inicial x' .... cost- senx+t2
x' =f (t,x) x'' .... - sent -x' cosx + 2t
{ (2)
x(to) = Xo, x'" .... - cos t- x" cosx + (x') 2 senx+2
x(4l .... sen t + ( (x')3 - x"') cos x+3x' x'' sen x
donde f es una función dada de dos variables, y (t0, x0 ) es un punto a través del cual
x .... x + h(x' + �(x" + �(x'" + �(x(4l)))
debería pasar la curva solución. Una solución de (2) es una funciónx( t) tal que dx( t) / dt =
f (t, x(t)) para todaten alguna vecindad de to, y x(to) = xo. t .... t +h
output k, t, x
Ilustración end.
Para poder utilizar el método de la serie de Taylor es necesario suponer que existen ¿Qué se puede decir de los errores en la solución que hemos calculado? En cada
varias derivadas parciales def. Para ilustrar el funcionamiento del método tomamos un paso el error de truncamiento local es O(h5) debido a que no hemos tomado en cuenta
ejemplo concreto: los términos que incluyen h5, h6, • • • de la serie de Taylor. Con ello, conforme h --> O,
x' = cos t- senx+t2 (3) el comportamiento de los errores locales debería ser similar al de Ch5 • Desafortunada
{
x(-1) = 3 . mente no conocemos el valor de C. Pero comoh = 10-2, entoncesh5 es10- 10• Por esta
508 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.2 Método de la serie de Taylor 509
razón, con algo de buena suerte, el error en cada paso debería ser aproximadamente de Pros y contras
magnitud 10- 10. Después de algunos cientos de pasos, estos pequeños errores podrían ¿Cuáles son las ventajas y las desventajas del método de la serie de Taylor? Primero
acumularse y arruinar la solución numérica. En cada paso (excepto el primero) la aproxi el método depende de derivar repetidamente la ecuación diferencial dada (a menos qu;
maciónxk dex(tk) ya contiene errores, y cálculos posteriores no hacen sino aumentar su nuestra intención sea utilizar sólo el método de orden l ). Por consiguiente, la función
magnitud. Estas observaciones deberían hacemos tomar precauciones acerca de aceptar f(t, x) debe tener derivadas parciales en la región del plano tx por donde pasa la cur va
ciegamente todos los dígitos decimales que aparecen en la solución numérica de una solución. Naturalmente, tal suposición no es necesaria para asegurar la existencia de
ecuación diferencial. una solución. Además, la necesidad de llevar a cabo el trabajo de análisis preliminar es
Cuando se programó el algoritmo anterior y se llevó a cabo una ejecución de la un verdadero inconveniente. Por ejemplo, un error que se cometa en esta etapa puede
rutina, la solución en t = 1 fuex200 = 6.42194. He aquí una muestra de los resultados pasarse por alto y permanecer inadvertido. Por último, hace falta programar por separado
proporcionados por el programa de computadora: las diferentes derivadas.
k t X En cuanto a las ventajas, tenemos la sencillez conceptual del procedimiento y su
O -1.000000 3.00000 potencial para obtener una precisión muy alta en los resultados. Así, si podemos obtener
1 -0.990000 3.01400 fácilmente 20 derivadas dex(t), no hay nada que nos impida usar el método de orden 20
2 -0.980000 3.02803 (es decir, usarlos términos con potencias deh hasta h2º). Con un orden tan alto se puede
3 -0.970000 3.04209 obtener la misma precisión usando un paso de longitud más grande, digamos h = 0.2.
4 -0.960000 3.05617 Es evidente que para recorrer el intervalo dado hacen falta menos pasos y que con ello se
reduce el número de cálculos. Por otra parte, los cálculos en cada paso se vuelven más
engorrosos. Entre los problemas del final de la sección se encuentran algunos ejemplos
196 0.960000 6.36566 en los que se puede utilizar el método de la serie de Taylor de orden superior.
197 0.970000 6.37977 En los últimos años han aparecido algunos programas de manipulación simbólica,
198 0.980000 6.39386 que permiten efectuar varios tipos de cálculos matemáticos rutinarios de carácter no
199 0.990000 6.40791 numérico. Con ello el proceso de integrar o derivar expresiones muy complejas pasa a ser
200 1.000000 6.42194 trabajo de la computadora. Naturalmente, estos programas sólo sirven para usarse en una
En una ejecución posterior se integró la ecuación diferencial tomando este valor dexzoo clase muy restringida de funciones, aunque en la práctica esta clase es suficientemente
como la condición inicial y con h = -0.01. El resultado de esta segunda ejecución del amplia como para incluir todas las funciones que se encuentran en el texto típico de
programa fuex200 :::, 3.00000 en t = -0.999999. La concordancia entre este resultado cálculo. Usando estos programas, el método de la serie de Taylor de orden 20, por decir
y el valor inicial original nos lleva a pensar que la solución numérica tiene una precisión algún orden, puede manejarse sin dificultad.
de casi seis cifras significativas, dato que coincide con el número de dígitos mostrados.
En el ejemplo que hemos estudiado no es difícil calcular el error de truncamiento Errores
local en cada uno de los pasos de la solución numérica. Para hacerlo, recordemos que
el término de error en la serie de Taylor (4) tiene la forma Al resolver numéricamente una ecuación diferencial aparecen varios tipos de erro-
res. Éstos se pueden clasificar de manera conveniente como sigue:
1 0<0 <1. (i) error de truncamiento local
E = -- hn+l (n+l\t+0h)
(ii) error de redondeo local
x
n (n+l)!
(iii) error de truncamiento global
Éste es el error que se presenta cuando la última potencia de h incluida en la suma es h". (iv) error de redondeo global
En el ejemplo hemos tomado n = 4 y h = 0.01. Mediante una sencilla aproximación (v) error total
de diferencias finitas se puede calcularx<5l (t + 0h) y llegar a:
El error de truncamiento local es el que aparece en un paso cuando reemplazarnos
s .J4l(t + h) -.J4l(t) = �[x(4l(r + h) -x(4)(t)J. un proceso infinito por uno finito. En el método de la serie de Taylor reemplazarnos \a
E4:::, !._h [ 1
120 serie de Taylor infinita de x(t + h) por una suma parcial. El error de truncamiento
5!
local es inherente a cualquier algoritmo que podamos escoger, y en gran medida es
h
Haciendo un pequeño esfuerzo de programación, esta aproximación de E4 se puede independiente del error de redondeo. Por supuesto, el error de redondeo lo provoca
añadir al algoritmo y calcularse. No darnos más detalles sobre este punto en vista de la limitada precisión de nuestras máquinas de cómputo, y su magnitud depende de la
que éstos se sugieren como un ejercicio de programación (Prob. 27 .) Cuando se añade longitud de palabra de la computadora (o del número de bits en la mantisa de los números
esta característica al programa, los valores de salida muestran que nuestro cálculo de E4 de máquina de punto flotante).
nunca excede, en valor absoluto, de 3.42 x 10- 11• El programa se ejecutó usando doble Si en el método de la serie de Taylor retenemos términos hasta e incluyendo h"
precisión en una computadora similar a la MARC-32. en la serie, entonces el error de truncamiento local es la suma de todos los términos
510 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.2 Método de la serie de Taylor 511
restantes que no se han incluido. El teorema de Taylor nos indica que todos ellos pueden con t en el intervalo [O, 2]. Dé la solución a este problema usando el método de la serie de
comprimirse en un sólo término de la forma Taylor de orden 4. Al consultar una tabla de la función de error
de truncamiento global. Una vez más, este error estará presente aun si se realizan polinomios P. se determinan recursivamente mediante las fórmulas
todos los cálculos usando aritmética exacta. Éste es un error asociado con el método y
{Po= I
es independiente de la computadora con la que se realicen los cálculos. Si los errores de
truncamiento local son ow+1 ), entonces el error de truncamiento global debe ser OW). Pn+r(t) = P�(t) - 2tP.(t)
Esto se debe a que el número de pasos necesarios para alcanzar un punto arbitrario T, Demuestre por ejemplo, que,
habiendo iniciado en to, es (T - to)/h.
El error de redondeo global es la acumulación de los errores de redondeo local de P4(t) = 12 - 48t2 + 16t4
los pasos anteriores. El error total es la suma de los errores de truncamiento global y Ps(t) = -120t + 160t3 - 32l
del error de redondeo global. Si el error de truncamiento global es OW) decimos que
el procedimiento numérico es de orden n. '5. (Continuación) Sírvase del problema anterior para diseñar un programa de computadora que
calcule la integral del problema 3 utilizando el método de la serie de Taylor de orden 6.
Verifique el código conh = O.O I para ver si se obtiene el valor dex(2) dado en el problema
Método de Euler 3. Imprima una tabla de la función !Jii erf(t) con pasos de O.DI desde t = O hasta t = 2.
El método de la serie de Taylor con n = 1 se llama método de Euler. Su expresión <6. Resuelva el problemadevalorinicialx' = I+x2,x(O) = O en el intervalo [0, 1.56], utilizando
formal es la siguiente: el método de la serie de Taylor de orden 4 con h = O.DI. Use luego el valor calculado
x(t + h) = x(t) + hf(t, x). de x(l.56) como valor inicial para integrar en sentido inverso hasta t = O. Compare los
resultados y explique qué sucedió.
Esta fórmula tiene la obvia ventaja de que no necesita tomar ninguna derivada de f. Sin
embargo, dicha ventaja se neutraliza por la necesidad de tomar pequeños valores de h '7. La ecuación tan-1(x/t) = In v'x2 + t2 define ax de manera implícita como una función de
t. Verifique que esta función implícita es una solución del problema de valor inicial
para obtener una precisión aceptable. Aun así el método es un ejemplo útil y tiene una
gran importancia teórica, en vista de que algunos teoremas de existencia se sustentan en x' = (t + x)/(t -x) x(l) = O.
él. Con relación a dichos teoremas de existencia consulte a Henrici [1962. págs. 15-25].
Prepare una tabla de la función x(t) en el intervalo [O, 2] con pasos de ±0.01. Utilice el
método de la serie de Taylor de orden 4.
SERIE DE PROBLEMAS 8.2
' l. Diseñe y verifique un programa de computadora que resuelva la siguiente ecuación diferen
cial: x' = x +e'+ tx, con valor inicial x(l) = 2, en el intervalo (1, 3]. Utilice el método de
'8. La función
q,(t) = 1' sen s2 ds,
la serie de Taylor de orden 5 yh = 0.01.
se conoce como integral de Fresnel. Haga una tabla de esta función en el intervalo [O, 10].
'2. Diseñe y verifique un programa de computadora para resolver el siguiente problema de valor Utilice el método de la serie de Taylor de orden 5 con h = O. l. Si es posible, obtenga
inicial: x' = 1 + x 2 - t3, x(O) = - l. Utilice el método de la serie de Taylor de orden 4, mediante la computadora una gráfica de la función.
tomando ah como un número de máquina binario cercano a 0.01. Encuentre la solución en
el intervalo [O, 2]. Explique cualquier fenómeno peculiar que detecte en la solución. '9. (Continuación) Demuestre que las derivadas de la función/(t) = sen t2 son:
'3. Los métodos para resolver problemas de valor inicial también se pueden usar para calcular f•>(t) = P.(t) sen t2 +Q.(t) cos t2,
integrales, tanto definidas como indefinidas. Por ejemplo, podemos calcular
donde P• y Q. se calculan recursivamente mediante
[ e-? ds,
{Po= 1 Qo =0
{
Pn+I = P� - 2tQn Qn+r = Q� + 2t P•.
resolviendo el problema de valor inicial
Use esta información para generar una tabla de Pn y Q. desden = O hasta 6. Modifique
x' = e-<2 x(O) = O, el código en el problema 8 para convertirlo en uno de séptimo orden. Repita lo hecho en el
8.2 Método de la serie de Taylor 513
diferenciales ordinarias
512 Capítulo 8 Solución numérica de ecuaciones
17. Utilizando la ecuación diferencial
0.2. Compare el valor de cp(l 0) obtenido
problema 8, primero con h = 0.1 y luego con h =ma 8.
al usar h = 0.2 con el valor obtenido en el proble x' = x2 +xi x(O) = 1,
e10. La función
y un paso del método de la serie de Taylor de orden 3, calcule x(0.01).
2 9 112 d9
x(t) = L (1- k se n ) , 18. Considere la ecuación diferencial ordinaria
5tx' +x2 = 2 x(4) = l.
a de segundo tipo. Haga una tabla
donde k es un parámetro en [O, l], es una integral elíptic intervalo O ;;; t � ! . Para ello
de esta función para el caso en que k = !,
limitán dos e al Calcule x(4.1) usando un paso del método de la serie de Taylor de orde n 2.
h = 0.01.
utilice el método de la serie deTaylor de orde n 3 con el 9. Escriba un programa de computadora que resuelva el problema de valorinicial
e 11. R esuelva el problema de valor inicial r
x' = +x2+2tt x(O) = 7,
(3t x+x
x, = -- utilizando el método de la serie deTaylor. Se busca una so!u ción en elintervalo-2;;; t;;; 2.
2 2)
x(l ) = -2,
3 (2t + 3tx) Tome los términos hasta e incluyendo h3 • Use un paso de longitud O.O!.
el intervalo [O, 1] con pasos h = -O.O l . c20. Escriba un programa para calcular una tabla de valores para la función
mediante el método de la serie deTaylor de orde n 2 en
Utilice l a funciónimplíc i
Compruebe también la validez
ta i3 x2+
de
tx3
la
+4 =
soluci
O
ón
como
implí
una
cita.
verificación d e l a solu ción calculada.
1'
integral de Volterra):
c¡3, Los métodos del cálculo elemental no bastan para obte ner una función que permita calcular
x(t) =
./
los valores de J 1+x3 dx ( que es una integral elíptica). Calcule una tabla de la función cos(s+x(s))ds+e'.
Derivando esta ecuación integral obtenga un problema de valor inicial equivalente para la
f(x) = [ v'Í+t3 dt, función desconocida.
c22. (Continuación) Resuelva la ecuación integral del problema 21 usando el método de la serie
inicial adecuado. Use el método de Taylor de orden 3 en el problema de valor inicial equivalente. Obtenga la solución en el
· en el intervalo O� x;;; 5 resolviendo un proble ma de valor intervalo [O, 3] usando pasos de longitud 0.01.
de la serie deTaylor de orden 3 con h = 1/64.
23. Si se utiliza el método de la serie deTaylor para resolver un problema de valor inicial asociado
r/
14. Verifique que la función x(t) = 4 resuelve el probl
ema de valor inicial
con la ecuación diferencial
x' = cos(tx),
x' = ../x x(O) = O.
¿cuáles son las expresiones parax", i" y x'4>?
Aplique el método de la serie de Taylor de orden 1 y explique por qué la solu ción numérica 24. Seax' = f(t,x). A partir de esta ecuación determine x", x"' y x'4>.
difiere de la solución 12 /4.
c25. Con ayuda de un programa de manipulación simbólica, resuelva el problema de valor inicial
c¡5, Considere el problema de valor inicial i = 1 - xt- 1, x(2) = 2. De muestre que dado por la ecuación (3) en el texto, usando el método de la serie deTaylor de órdenes 4 y 20.
Compare estas soluciones con los resultados numéricos proporcionados en el texto. Haga
-1 una comparación entre estos dos métodos de series deTaylor utilizando diferentes longitudes
J' = (1 - 2x')t del paso h. Determine qué tan grande puede ser h en el método de orden 20 para obtener la
{
x(n) = -nx(n
-l) -1
t (n � 3). misma precisión que el método de orden 4 con h = O. O l.
c26. (Continuación) Repita lo anterior para el problema de valor inicial que aparece en el pro
a de valor inicial mediante el
Diseñe un programa de computadora que resuelva este problema usando h = 1 y el intervalo blema 7.
método de la serie de Taylor de orden 10. Pru b su program
rela con su solución numérica. c21. Reprograrne el eje mplo del texto e incluya la expresión dada para E4.
e e
h h
x' =f(t,x) x(t + h) = x(t) + zl(t, x) + zl(t + h,x + hf(t,x)),
{ (1)
x(to) = Xo,
o su equivalente:
deberemos derivar sucesivamente la expresión de (1) para determinar fórmulas para x'', x(t + h) = x(t) + f(F¡ + F2 ), (4 )
x'", xC4l . Una vez hecho esto, las funciones deberán programarse.
Los métodos de Runge-Kutta evaden esta dificultad, a pesar de que imitan a los mé donde
F¡ = hf(t, x)
todos de la serie de Taylor mediante una combinación ingeniosa de los valores def(t, x). {
Ejemplificamos lo anterior mostrando un procedimiento de Runge-Kutta de segundo F2 = hf(t+h,x+F1).
orden. Esta fórmula se puede utilizar repetidamente para avanzar paso a paso en el proceso. Este
procedimiento se conoce como método de Runge-Kutta de segundo orden. También
se llama método de Heun.
Método de Runge-Kutta de segundo orden
Generalmente las fórmulas de Runge-Kutta de segundo orden adoptan la forma
Comencemos con la serie de Taylor parax(t + h):
x(t + h) = x + w1hf + Wzhf(t + ah,x + Phf) + O(h3 ), (5)
2
h h3
.x(t + h) = x(t) + hx'(t) + 21 x"(t) + 31 x (t) + · · ·
"'
(2)
donde w1, w2, a, p, son parámetros a nuestra disposición. La ecuación (5) se puede
reescribir con la ayuda de la serie de Taylor de dos variables como:
A partir de la ecuación diferencial, tenemos:
x(t + h) = x + w¡hf + w2h[f + ahft + Phffx] + O(h3 ). (6)
x'(t) = f Al comparar (3) con (6) observamos que debemos imponer las siguientes condiciones:
x"(t) = Ít +fxx' = Ít +fxf
x"'(t) = !11 +frxf + (Ít +fxj)fx + f(fxr +fxxf) W¡+Wz = �
donde x significa x(t) y f representa f(t x), etcétera. Podemos eliminar las derivadas donde
parciales recurriendo a los primeros términos de la serie de Taylor de dos variables (como F¡ =hf(t,x)
se señaló en la sección 1.1) {
f
F1 = hf(t + h,X+ !F¡ ).
f(t + h,X+hj) = f + hft + hffx + O(h2). Compare esto con el método de Euler estándar descrito en la sección 8.2.
516 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.3 Métodos de Runge-Kutta 517
Método de Runge-Kutta de cuarto orden A continuación se muestran algunos de los valores de salida del programa de computadora
basado en este algoritmo:
Resulta muy tedioso deducir las fórmulas de Runge-Kutta de orden superior, y
por lo tanto no lo haremos. Sin embargo, las fórmulas son muy elegantes y se pueden
programar fácilmente una vez que se han deducido. A continuación se presentan las k t X e
expresiones para el método de Runge-Kutta de cuarto orden clásico: O 1.00000 2.00000
l 1.00781 1.98473 l.19E-07
x(t+h) = x(t)+ i(F1+2Fz+2F3+F4), (8) 2 1.01563 1.97016 o.
donde 3 1.02344 1.95623 o.
F1 = hf(t,x) 4 1.03125 1.94293 l.19E-07
F2 = hf(t + !h,x + !F1) 5 1.03906 1.93020 l.19E-07
{
F3 = hf(t+ ih,x+ !F2)
6 1.04688 1.91802 o.
7 1.05469 1.90637 l.19E-07
F4 = hf(t+h,x+F3), 8 1.06250 1.89521 l.19E-07
Esto se llama método de cuarto orden debido a que reproduce los términos en la serie 9 1.07031 1.88452 o.
de Taylor hasta e incluyendo el que incluye a h4• Por consiguiente el error es O(h5).
Además, expresiones exactas para este término de error son conocidas. 249 2.94531 1.86387 7.15E-07
250 2.95313 1.86569 5.96E-07
Ejemplo Proporcione un algoritmo que incorpore el método de Runge-Kutta de orden 4 para
251 2.96094 1.86750 7.15E-07
resolver el siguiente problema de valor inicial:
252 2.96875 1.86932 5.96E-07
x' = t-2(tx-x2) 253 2.97656 1.87115 4.77E-07
{ (9) 254 2.98438 1.87297 5.96E-07
x( l) = 2,
255 2.99219 1.87480 5.96E-07
en el intervalo [l, 3], usando pasos de longitud h = 1/128. 256 3.00000 1.87663 5.96E-07 11
Respuesta Dado que éste es un experimento numérico para medir la efectividad del procedimiento,
se ha elegido un problema con una solución analítica conocida. La solución de (9) se
!
expresa como x(t) = ( + Int)- 1 t. El programa de computadora imprime los valores del
Errores
error. Pasamos ahora a discutir el error de truncamiento en el procedimiento de Runge
Kutta Descrito burdamente, el error de truncamiento local es el error que surge en cada
input M <-- 256; t <-- 1.0; x <-- 2.0; h<--0.0078125 paso debido sencillamente a que nuestros métodos no pueden tomar en cuenta todos
definef(t, x) = (tx -x 2)/t2 los términos de una serie de Taylor. Este error es inevitable y estará presente aun si los
define u(t) = t/(! + lnt)
cálculos se ejecutan con precisión infinita. En el caso del método de Runge-Kutta de
cuarto orden ( estudiado previamente), las fórmulas incluyen un error de truncamiento
e<--[u(t)-x[ local de orden O(h5). Este orden de error corresponde exactamente al error en el método
output O, t, x, e de la serie de Taylor cuando se incluyen términos hasta h4 en la fórmula de Taylor.
for k = 1,2,... ,M do En el mismísimo primer paso del procedimiento de Runge-Kutta de cuarto orden
F1 <--hf(t,x) se calcula mediante el algoritmo un valor dex(to+h). Por otra parte, existe una solución
correctax*(to + h), que no conoceremos. En este paso el error de truncamiento local es,
F2 <-- hf(t+ ih,x+ iF1) por definición:
F3<--hf(t+fh,x+!Fz) x*(to + h) - x(to + h).
F4<--hf(t+h,x+F3)
x<--x+(F1+2Fz+2F3+F4)/6 La teoría del algoritmo de Runge-Kutta nos indica que este error de truncamiento se
t .... t+h
comporta como Ch5 para valores pequeños de h. En este caso C es un número indepen
diente de h pero que depende de to y de la funciónx•. Para calcular Ch5 suponemos que
e<-- [u(t)-xf C no cambia conforme t cambia de to a t0 + h. Sea v el valor de la solución aproximada
output k,t, x, e en to + h que se obtiene tomando un paso de longitud h partiendo de t0• Sea u la solución
end. aproximada en to+h que se obtiene tomando dos pasos de longitud h/2 partiendo de to.
518 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.3 Métodos de Runge-Kutta 519
Ambas soluciones se pueden obtener en la computadora. Debido a la suposición que se solución y las denotamos con x(t + h) y x(t + h):
hizo tenemos que
= x(t) + ¿ a;F¡
6
x*(to+h)=v+Ch5
x(t + h) (10)
x*(to + h)=u+2C(h/2)5. i=l
tolerancia previamente especificada. Si no lo hace, la longitud del paso puede disminuirse La fórmula (10) es de quinto orden, mientras que la (11) es de cuarto orden. Su diferencia,
(usualmente a la mitad) para mejorar el error de truncamiento local. Por otro lado; si e= x(t + h)-x(t + h), se puede interpretar como una estimación del error de truncamiento
el error de truncamiento local está muy por debajo de un umbral permitido, entonces la local que resulta de la menor precisión de la fórmula (11). Por consiguiente, e se puede
longitud del paso puede aumentarse al doble. utilizar para monitorear la longitud del paso. Como la fórmula (10) es la de mayor
Como ya vimos en la derivación del método de Runge-Kutta de orden 2, hay ciertos precisión, se utiliza para calcular el valor de salida del algoritmo. Observe que
parámetros que deben seleccionarse. Un proceso de selección similar ocurre al plantear
métodos de Runge-Kutta de orden superior. Como podemos ver, no hay sólo un método 6
de Runge-Kutta de cada orden, sino una familia de métodos. Tal como se muestra en la e= x(t + h) - x(t + h)= ¿(a; b;)F;. (13)
-
siguiente tabla, el número de evaluaciones requeridas aumenta más rápidamente que el i=l
que el error de truncamiento local es Ch5 cuando se calcula mediante x(t) -x(t), parece Los procedimientos de Runge-Kutta anidados se componen de un par de fórmulas
sensato duplicar la longitud del paso cuando esta duplicación conduce a C(2h)5 <6/ 4. de órdenes p y q (usualmente q = p + 1) que comparten los mismos puntos donde se
Por lo tanto duplicamos el valor de h cuando el error de truncamiento local aparente se evalúan las funciones. En general estos procedimientos ponen a nuestra disposición
encuentra por debajo de 6/128. una técnica eficiente para resolver problemas de valor inicial asociados con ecuaciones
Otra fórmula de uso común para controlar el error por paso es la siguiente: no rígidas. En los últimos años se ha generado un número considerable de fórmulas
que forman parte de los métodos de Runge-Kutta anidados de orden superior. Sobre
h +- 0.9h[6/lelJ 1 /(I+p), estos aspectos encontrará en los problemas algunos ejemplos. A pesar de que se cuenta
con algunos métodos de Runge-Kutta de orden superior con coeficientes complicados
donde p es el orden de la primera fórmula que aparece en el par de fórmulas de Runge la clásica fórmula de cuarto orden continúa siendo la más popular a excepción de los
Kutta. (Consulte, por ejemplo, Hull, Enright y Feller [1972] y a Shampine, Watt y esquemas adaptativos. Se puede encontrar información adicional acerca de los métodos
Davenport [1976].) Se utiliza la misma fórmula, tanto para aumentar como para dismi de Runge-Kutta en numerosas fuentes, por ejemplo, en Butcher (1987], Fehlberg [1969],
nuir la longitud del paso h. En un caso se vuelve a calcular la longitud de paso que ha Gear [1971], Jackson, Enright y Hull (1978], Prince y Dormand (1981], Shampine y
sido rechazada, en tanto que en el otro se establece una nueva longitud del paso. Gordon [1975], Thomas [1986] y Verner [1978].
En las siguientes líneas presentamos un algoritmo del método de Runge-Kutta
adaptativo: SERIE DE PROBLEMAS 8.3
input a, a, b, h, 6, M 'l. Diseñe un programa de computadora para resolver el problema de valor inicial x' =f(t, x),
t+-a;x +- a con x(to) = Xo, en el intervalo to � t ;;¡ tm o tm � t ;;¡ to. Utilice el método de Runge-Kutta
de cuarto orden. Póngalo a prueba con este ejemplo:
iflag +-1
fork = 1, 2, ... , M do (e'+ I)x' +xe' -x = O x(O) = 3.
d+-b-t
if ldl � lhl then Determine la solución ana/[tica y compárela con la solución calculada en el intervalo -2 ;;¡
t ;;¡ O. Use h = -0.01.
iflag+- O
h+-d 2. Escriba las fórmulas de Runge-Kutta de segundo orden en el caso en que a. = 2/3.
end if '3. Usando diferentes valores de A., tales como 5, -5 o -10, resuelva numéricamente el siguiente
s +-t problema de valor inicial con el método de Runge-Kutta de cuarto orden.
y +-X
compute F¡, Fz, ... , F5 [Ecuación (12)]
x' =A.X+ sent - A.cost x(O) = O.
computex [Ecuación (10)] Compare la solución numérica con la solución anaütica en el intervalo [O, 5]. Tome h = O.O l .
compute e [Ecuación (13)] ¿Cuál es el efecto d e A. sobre l a precisión numérica?
t+-t+h 4. Si se desea resolver mediante el método de Runge-Kutta un problema de valor inicial que
output k, t, x, e atañe a la ecuación diferencial x+ 2tx'+ x:x' = 3, ¿ cuál es la función que debe programarse?
if iflag = O then stop 5. Demuestre que la fórmula de Runge-Kutta (8) es de orden 4 en el caso especial en que/(t, x)
if lel ;;; 6 then es independiente de x. Demuestre que en este caso la fórmula de Runge-Kutta es equivalente
a la regla de Simpson. (Véase la Ec. (6) en la Sec. 7.2.)
h+-2h
t +- s 6. Deduzca el método de Euler modificado, cuya expresión es
h+-h/2
X +-y x(t + h) = x(t) + hf ((t + ;.x(t)+ ;f(t,x(t))).
k+-k-1
else llevando a cabo una extrapolación de Richardson en el método de Euler con pasos de longitud
if lel <6/128 then h+-2h h y h/2.
endif c7_ Programe y ponga a prueba el algoritmo de Runge-Kutta-Fehlberg que se describió en el
end. texto. Use como casos de prueba los ejemplos que aparecen en los problemas 8, 11 y 15 de
la sección 8.2.
522 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.3 Métodos de Runge-Kutta 523
cs. Diseñe y ejecute un programa que resuelva este problema de valor inicial: donde
F1 =hf(t,x)
x' = e"+cos(:c - t) x(l) = 3.
F2 = hf(t+ th. X+ }F1)
Utilice las fónnulas de Runge-Kutta de cuarto orden con h = 0.01. Detenga el cálculo justo F3 =: hf(t+ }h.x+ iF1 +iF2)
antes de que la solución provoque un desbordamiento por exceso.
f4 = hf(t+h,x- F2+2F3 )
9. Deduzca las fónnulas de Runge-Kutta de tercer orden
Fs = hf(t+ fh, x+ i-;F1 + �F2+ �F4)
x(t+h) = x(t)+ !(2F1 +3F2+4F3 ), F6 = hf(t+ ih.x+ �F1 - iFz+ �F3 + tgF4 - ffiFs).
donde
F1 = hf(t,x) <t6. Los coeficientes de la siguiente tabla corresponden al método de Runge-Kutta-Merson. Es
criba y someta a prueba una rutina adaptativa basada en este método.
{ = hf(t+ th,x+ tF1)
F2
F3 = hf(t+ ih.x+ Ífz). a¡ a;-b; C¡ dij
1 1
Demuestre que para la ecuación diferencial x' = x+t concuerda con el método de la serie 6 is o o
de Taylor de orden 3. 2 o o l
3 3
10. Demuestre que cuando el método de Runge-Kutta de cuarto orden se aplica al problema 3 o - iii3 1
3
1 1
6' 6
x' = :U, la fónnula para generar la solución es
4 lo, l
2 4 1
3 is í
2 3 5 1
x(t+h) = [1+h)..+ }h )...2+ !h ).. + �h t.. ]x(t).
3 4 4
1 f. o. -!,2
1
6 -30
e17. Escriba y pruebe una rutina adaptativa basada en el método de Runge-Kutta-Vemer de quinto
11. (Continuación) Demuestre que el error de truncamiento local en el problema 10 es O(h5).
orden dado por los coeficientes que aparecen en la siguiente tabla. (Vemer (1978]):
e12. Usando el procedimiento de Runge-Kutta adaptativo, resuelva el problema x' = x2, x(O) = 1
en el intervalo [O,2]. Demuestre que la verdadera solución esx(t) = 1/(1-t). ¿Qué sucede a¡ a,-b, C¡ dij
con el algoritmo cerca de la discontinuidad que aparece en t = 1?
so3 641i
33
o o
<¡3, Compare numéricamente el siguiente método, llamado de Runge-Kutta-Gil! de cuarto orden, 2 o o 1
con el método clásico de Runge-Kutta. is is
3 4
E -m
132 1 1
- 12, ;¡
l
i
x(t+h) = x(t) + [F1 - (2 - VZ)F2+(2+V2)F3 + F4], 4 243
1120
891
2240
6
2
9
4 8
- u, 27, 2
si
donde
F1 = hf(t,x)
5 77
160 -no33
3
2 40 4 S6S4
JJ,-TI,- TI, TI
6 73 _..n. 369 72 S380
-73, 12285 269S
F2 = hf(t+ }h.x+ !Fi)
7iiii 700 73' 2!9' - 584, 17S2
{ 7 o 891
8329 9
8
-m, m, 891• -u, v
8716 656 39S20 416 S2
F3 = hf(t+ }f.x+ t(V2 - l)F1 + !(2 - V2)F2)
8 o 2
is
301S 9 4219 S98S S39 693
256 ' - 4' - 78 ' 128 ' - 394' 3328
f4 = hf(t+h,x+ i(2 - V2)F2+ iF3+ i(2+V2)F4).
<¡4_ Considere el problema de valor inicial x' = -loe, x(O) = 1, en el interval0 [O, l], con c¡g_ Los coeficientes de la siguiente tabla corresponden a un par de fónnulas de Runge-Kutta de
diferentes valores para la constante de decaimiento k. Demuestre que la solución analítica orden 6 y 5. (Consulte aPrince y Donnand (1981].) Con ellos escriba y ponga a prueba una
es x(t) = e-1a. Usando k = 5 y varios valores de h, tales como 0.2, 0.4, 0.6, 0.8 y 1.0, rutina adaptativa.
compare el comportamiento del método de Euler con el de Runge-Kutta-Gill (presentado
en el problema anterior). Repita lo anterior usando k = 25. Para resolver este problema a¡ b¡ C¡ dij
correctamente en ·el caso del método de Euler es necesario que se satisfaga la condición 821
10800 864
61
o o
O ;;;; hk ;;¡; 2, en tanto que para el método de Runge-Kutta-Gill hace falta que O ;;;; hk ;;¡; 2.8. l
2 o o 1
iii iii
Éstas son las regiones de estabilidad para este problema cuando se utilizan dichos métodos.
Dado un problema particular y un método, podemos ajustar h para intentar mantenemos 3 19683
ñIB
9841S
321776
2
9 _].
81' 81
�
dentro de la región de estabilidad, o alternativamente recurrir a un método de orden superior 4 17S273 16807 61S 270 1053
1372' -343, 1372
3
con una región de estabilidad más grande. Tal como lo discutió Thomas [1986], es imposible 912600 'i46iii6 7
usar tales métodos con valores grandes de k. 5 39S
-:ss,
137S 3 3243 S4 S0949 4998
i67'i 7344 5 ssoo• ñsoii• 17875
e15. Recurra a un problema con una solución conocida para comparar numéricamente el método 6 18S 137S 4 26492 72 2808 24206 338
2704 5 - 37125' 55' 2337S' - 37125' 459
clásico de Runge-Kutta con el siguiente método de Runge-Kutta de quinto orden: S408
7 -mo ��¿. -;¡. -;i:, ��i, -¡:. !:
3 37
so
x(t+h) = x(t)+ �F1 + ;&F4+�Fs+ �F6, 8 o iii :�i· -i��. -?t�°i?!, ��11!1;t. -:��. !�:. 0
524 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.4 Métodos multipaso 525
8.4 Métodos multipaso Los coeficientes A, B, C, D, E, se determinan pidiendo que la ecuación (5) sea exacta
siempre que el in:tegrando sea un polinomio de grado � 4. El problema 8 nos indica
El método de la serie de Taylor y el de Runge-Kutta, utilizados para resolver el problema que no se pierde generalidad al suponer que tn = O y h = I, tal como se esboza en la
de valor inicial, son métodos de un solo paso. Se llaman así debido a que no recurren figura 8.1.
a valores previos de x(t) durante el avance de la solución de t, a t + h. Si to, t1, t2, ... ,
t¡ corresponden a los pasos que se toman a lo largo del eje t, entonces Xi+I (el valor
aproximado de x(t¡+¡)) depende sólo dex¡, y no se usan los valores aproximados de X¡_ 1,
X¡_z, .. .,xo.
Se pueden diseñar procedimientos más eficientes si en cada paso se utilizan algunos -4 -3 -2 -1 o
valores previos de la solución. El principio que nos guía se describe en las líneas
t,, _4 ln-J ln-2 ln-1 t, ln+I
siguientes. Deseamos resolver numéricamente el problema de valor inicial:
x1 = f (t,x)
{ (1) Figura 8.1.
x(to) = XQ.
Contamos con puntos o pasos preestablecidos to, t¡, t2, ... , tn sobre el eje t. (No siempre Tomamos como base de � los siguientes cinco polinomios:
estarán igualmente espaciados.) Si denotamos conx(t) a la solución verdadera, al integrar
la ecuación (1) obtenemos
po(t) = 1
p¡(t) = t
1.tn+t
x'( t) dt = x(tn+i) - x(tn),
t, pz(t) = t(t + 1)
y luego
x(t.+1) = x(t.) +
1.tn+t
f (t, x(t)) dt. (2)
p3(t) = t(t + I)(t + 2)
p4(t) = t(t + l)(t +2)(t + 3).
t,
La integral a la derecha se puede aproximar mediante un esquema de cuadratura numé Cuando éstos se sustituyen en la ecuación
rico, y el resultado será una fórmula que genera paso a paso la solución aproximada.
donde f¡ denota!(t¡, x¡). Una expresión de este tipo se conoce como fórmula de Adams A+B+C+D+E = 1
Bashforth. Pasamos a presentar la fórmula de Adams-Bashforth de orden 5, apoyada -B -2C - 3D - 4E=}
en los puntos t¡ = to + ih, para O � i � n, todos ellos igualmente espaciados:
2C + 6D + 12E = i (6)
Xn+I = Xn +
h
[1901fn -2774fn-l +2616.fn-2 -1274.fn-3 +25Ifn-4]• (4) -6D-24E = �
?20
24E = �01
¿Cómo se determinaron estos coeficientes? Empezamos con la intención de apro
1.
ximar la integral que aparece en (2) de la manera siguiente: Los coeficientes de la fórmula (4) se obtienen mediante sustitución hacia atrás.
t,,.¡ El procedimiento anterior se conoce como método de los coeficientes indetermi
f(t, x(t)) dt � h[A.fn +Bfn-1 + Cfn-2 +Dfn-3 +Efn-4]. (5) nados. En principio puede usarse para obtener fórmulas similares de orden superior y
,, en otros tipos de situaciones. (Véase Sec. 7.2.)
526 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.4 Métodos multipaso 527
De manera alternativa, podríamos obtener los valores de estos coeficientes desco convergerá a un punto fijo de $ bajo las hipótesis apropiadas. En particular, en esta
nocidos partiendo directamente de la ecuación (4), tomando x = Pn y utilizando f = rl,. , situación se puede utilizar el problema 31 de la sección 3.4. Si 1; es el punto fijo de� (y
debido a que ;,;! = f . El resultado es un sistema de ecuaciones similar al que aparece por lo tanto el valor de Xn+1 que buscamos), entonces deberíamos iniciar nuestra iteración
en (6). en un punto zo en un intervalo centrado en I; y en el cual W(z)I < I. Es necesario suponer
que $' es continua En el caso que nos ocupa se tiene que
Fórmula de Adams-Moulton "'( ) - 251 h 8f Ctn+l, z) .
'!'z no
Durante el trabajo numérico las fórmulas de Adams-Bashforth raramente se utilizan az
de manera aislada. Se usan en conjunción con otras fórmulas para aumentar la precisión. Este valor se puede hacer tan pequeño como se desee, disminuyendo la longitud del paso
Con el fin de observar cómo es posible esto, volvamos a la ecuación (2) y supongamos h. En la práctica sólo se necesitan uno o dos pasos de esta iteración para obtener el valor
que se emplea una fórmula de cuadratura numérica que comprende afn+l· La ecuación de xn+l·
(3) adoptará la forma:
Xn+l =x.+ afn+1 + bfn+ cfn-1+· .. (7) Análisis de los métodos multipaso lineales
En lo que resta de esta sección estudiaremos la teoría general de los métodos mul
El siguiente es un ejemplo de una expresión de este tipo, conodda como Fórmula de tipaso lineales. La estructura de cualquiera de estos métodos es:
Adams-Moulton de orden 5:
ak Xn + ªk-tXn-1 +' '· + lloXn-k = h[bkfn + bk-tÍn-1 +''· + bo.fn-Ú (9)
h
Xn+I = Xn+ [251Jn+l+646f,, - 264fn-l+ 106!,.-z - 19fn-3J. (8)
7ZQ Esto se llama método de k pasos. Deben proporcionarse los coeficientes a; y b;. Al
igual que antes, x; denota una aproximación a la solución en t;, con t; = to+ih. La letra
Esta fórmula también se puede deducir usando el método de los coeficientes indetermi f¡ representaf (t;,x;). Suponiendo que ya se conocen los valores de .:to, x 1, •.• , Xn-t, la
nados. Observe que no se puede utilizar directamente para avanzar en la solución, en fórmula (9) se usa para calcular x•. Podemos por consiguiente suponer que ak ;1: O. El
vista de que Xn+I aparece en ambos lados de la ecuación. Recuerde que f¡ representa coeficiente bk pµede ser cero. Si bk = O, se dice que el método es explícito. En este
f (t;, x;), y que por lo tanto los términos que incluyen a!,.+ 1 se pueden calcular sólo des caso x. se puede calcular directamente y de manera elemental a partir de la ecuación
pués de que se conozca el valor de Xn+t· Sin embargo, un algoritmo muy satisfactorio (9). Sin embargo, si bk ;1: O, entonces el término J. a la derecha de la igualdad incluye
llamado método predictor-corrector, emplea la fórmula de Adams-Bashforth (4) para la incógnita x., y la ecuación (9) determina el valor de x. en forma implícita Se dice
predecir un valor tentativo de Xn+t, llamémoslo x;+l • y luego recurre a la fórmula de entonces que el método es implícito.
Adams-Moulton (8) para calcular un valor corregido de Xn+t· Es así como en la fórmula La precisión de una solución numérica de una ecuación diferencial está en gran
(8) calculamos el valor de fn+I como f (t.+1, x:+i) usando el valor predicho x;+t que se medida determinada por el orden del algoritmo utilizado. El orden indica cuántos
obtuvo de la fórmula (4). términos de una solución expresada en serie de Taylor se están simulando mediante este
Debido a que inicialmente sólo se conoce el valor de x0, al usar el método predictor método. Por ejemplo, se dice que el método de Adams-Bashforth en la ecuación (4) es
corrector se debe emplear un procedimiento especial para dar inicio al proceso. Natu de orden 5, debido a que da lugar aproximadamente a la misma precisión que la que se
ralmente, un método de Runge-Kutta resulta ideal para obtener x1, x2, x3, x4. En general obtiene por el método de la serie de Taylor con los términos h, h2, h3 , h4, h5. Se espera
las fórmulas del mismo orden se usan conjuntamente. Por consiguiente, los métodos de entonces que en cada paso de una solución que utiliza la ecuación (4) el error sea O(h6).
Runge-Kutta de quinto orden, como los que aparecen en los problemas 15 a 17 de la En las siguientes líneas se precisará la idea intuitiva de orden.
sección 8.3, se pueden utilizar en combinación con la fórmula de Adams-Bashforth (4) En correspondencia con el método multipaso que se muestra en la ecuación (9),
y la fórmula de Adams-Moulton (8). definimos una funcional lineal L mediante
Se cuenta todavía con otro método que puede utilizarse para obtener el valor de
Xn+t en la ecuación (8). Después de todo, la ecuación señala que Xn+I es un punto fijo de k
cierta transformación; a saber, el que se define mediante Lx = ¿)a;x(ih) - hb;x(ih)]. (10)
i=O
$(z) = �ühfCtn+t, z)+C, En este caso tomamos k = n para simplificar la notación, y suponemos que el primer
valor en la ecuación (9) inicia en t = O en lugar de t =n - k. La operación Lx se puede
donde C comprende a todos los demás términos en la ecuación (8). Por ende, el método realizar en cualquier función x que sea diferenciable. Sin embargo, en el siguiente
de iteración funcional surge como un medio para calcular Xn+¡. La teoría de iteración análisis suponemos que x está representada por su serie de Taylor en t = O. Usando la
funcional, tal como se desarrolló en la sección 3.4, nos indica que la sucesión determinada serie de Taylor para x, L se puede expresar de la siguiente forma:
por la ecuación
Zk+I =$(Zk) (k � O), Lx = dox(O)+d1hx'(O)+d2h2x"(O)+· · ·. (11)
528 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.4 Métodos multipaso 529
Para calcular los coeficientes d; en la ecuación (11) escribimos las series de Taylor para Finalmente, suponga que (iii) es cierta. Entonces en la ecuación (11) se debe tomar
xyx': do = d¡ = · · · = dm= O. Por ende (iii) implica (i). 111
x(ih) = -.-1 JJ)(Q)
¿ (ih)Í
00
x'(ih) = I: (i�;
j=O J.
j
x U+l)(O).
tal que
do = d¡ = · · · = dm=O* dm+I·
Luego estas series se sustituyen en la ecuación (10). Al reacomodar el resultado en Ejemplo ¿Cuál es el orden del método descrito mediante la siguiente ecuación?
potencias de h obtenemos una ecuación que adopta la forma que aparece en (11), con
los valores siguientes de d;: Xn - Xn-2 = !h(fn +4J,,_¡ +fn-z).
k
do=¿a;
Respuesta El vector (a0, a1, a2) es (-1. O, 1), y el vector (bo, b1, b2) es (!,
las d; son:
f, i). Por consiguiente,
i=O
do = ao + a¡ + a2 = Ü
4. Use el método de los coeficientes indeterminados para deducir la fórmula de Adarns (c) Repita el problema integrando el polinomio de interpolación de Newton apoyado en
Bashforth de cuarto orden los nodos Xn y Xn-1-
12. (a) Use el método de coeficientes indeterminados para encontrar los valores de A y B en la
h fórmula de Adams-Moulton implícita de segundo orden
Xn+I = Xn+
24 [55f,, - 59fn-1 +37fn-2 - 9fn-J].
Xn+I = Xn +h[Af..1+Bf,,].
5. Deduzca la fórmula de Adarns-Moulton de cuarto orden
(b) Utilice una fórmula de integración numérica para deducir la expresión anterior.
h
Xn+I = Xn + [9fn+I+ 19fn - 5/.-1 +fn-2]. (c) Use una fórmula de interpolación para deducir la expresión del inciso (a).
24
13. (a) Utilice el método de coeficientes indeterminados para deducir una fórmula multipaso de
'6. Diseñe y ponga a prueba un subprograma o procedimiento para utilizar el método de la forma
Adams-Bashforth de quinto orden acoplado con un método de Runge-Kutta de quinto orden. Xn +I = Xn +h[A/.+I+Bf,, + Cf.-iJ.
(Probs. 15 a 17, sección 8.3.) Mantenga sólo los cinco valores más recientes de (t¡, x,). En (b) Repita lo anterior para
la rutina se debe incluir enunciados para la impresión.
'7. Diseñe un programa de computadora que recurra a la rutina del problema (6) y resuelva el Xn+I = Xn +h[Afn +Bf.-1+ Cf.-z].
problema de valor inicial
14. Deduzca una fórmula multipaso implícita basada en la regla de Simpson (que utilice puntos
- x(O) = O, uniformemente espaciados Xn-1, x., x..1) para resolver numéricamente la ecuación diferen
x' = (t - e ')/(x+e')
cial ordinaria x' =f.
en el intervalo [-1, l]. Use h = 1/238. Compruebe (analíticamente) que la verdadera 15. Se sabe que la fórmula
solución está dada de manera implícita por la ecuación x2 - t2+ 21!' - 2e-' = O. Emplee
esta ecuación en el programa diseñado con el fin de corroborar la validez de la solución h [(5 -A)X/ /
calculada Recurra al método de Runge-Kutta para dar inicio al proceso. Xn+I =(I -A)x.+Axn-1 + n+I+8(1 +A)x.+(5A - llxn/ -I.
J
u
8. Demuestre que si todo elemento de IIm se integra correctamente por la fórmula es exacta para todos los polinomios de grado m o menores, sin importar el valor de A.
[ f(x) dx ;::J
O
t
i=-n
A,f(i),
Determine A de manera que resulte exacta para todos los polinomios de grado m+l. Calcule
Aym.
'16. Encuentre un programa en su biblioteca de programas de cómputo que resulte adecuado para
resolver el problema de valor inicial correspondiente a un sistema de ecuaciones diferenciales
1
lo mismo resulta cierto para la fórmula ordinarias de primer orden. Utilice el programa para resolver este problema:
dx/ dt = sen x+cos(yt) x(-1) = 2.37
Í: A¡f(to+ih).
<o+h n
{ -
f(x) dx ;::J h dy/dt =e "'+ [ sen(yt)]/t y(-1) = -3.48.
to i=-n
Se desea obtener la solución con una precisión de ocho decimales en el intervalo [-1. 4]. La
9. Deduzca la fórmula de Adams-Bashforth de segundo orden, que se expresa como: solución se debe imprimir usando intervalos de longitud 0.1 en el eje t.
(a) Obtenga gráficas de las funciones x(t) y y(t) para -1 � t � 4. Ambas curvas deberán
Xn+I = Xn +h rnfn - ffn-il • aparecer sobre la misma gráfica. Los valores máximo y mínimo de las ordenadas serán 4 y
-4.
(b) Obtenga una gráfica de la curva definida paramétricamente como
'1O. Calcule la solución de
y'= -2x/ y(O) = l.
{(x(t),y(t)): -1 � t � 4}.
en x = 1.0 usando h = 0.25 y el método Adams-Bashforth-Moulton (Prob. 4 y 5) en
conjunción con el método de Runge-Kutta de cuarto orden. Muestre la solución calculada (Los valores de t no aparecerán en esta gráfica.) La curva que se obtiene se llama órbita del
usando cinco dígitos significativos en 0.25, 0.5, 0.75, LO. Compare sus resultados con la sistema de ecuaciones diferenciales original. (Para esta curva también se utiliza la palabra
solución exacta y= 1/(1 +x2). trayectoria.)
11. (a) Usando el método de los coeficientes indeterminados, calcule los valores de A y B en 17. Calcule los coeficientes en un método multipaso de la forma
la siguiente fórmula de Adams-Bashforth. (No haga el cambio a una forma de integración
numérica que le corresponda.) Xn+I = Xn +h[Af,, +Bfn-2+ Cf.-4].
Xn+I = Xn +h[Af,, +Bfn-il- Esta fórmula deberá integrar correctamente una ecuación de la forma x' = f (t, x) para el
caso en que la expresión del lado derecho es de la forma f(t, x) = a+bt+ct2.
(b) Repita el problema en términos de una fórmula de integración numérica correspon 18. Con k=2, encuentre un método de orden 4 que adopte la forma de la ecuación (9).
diente.
532 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.5 Errores locales y errores globales. Estabilidad 533
19. Demuestre que el método multipaso de la ecuación (9) esde ordenm siy sólo siLp; =O para Hay dos polinomios asociados con la ecuación (2):
O :;:; i :;:; m y LPm+i 1' O, donde p;(t) = ti y Les la misma que aparece en la ecuación (10).
20. Por medio del cálculo do, di, ... , determine el orden del siguiente método: p(z) = ªkZk +ak-1zk-1 + .. · + a0
{
q(z) = bkzk + bk-ri- 1 + · · · + bo. (4 )
Xn =Xn-3 + f h(/n +3!,,-1 + 3!,,-2 +[n-3),
21. Usando el procedimiento del problema 19, determine el orden del siguiente método: El análisis mostrará que ciertas propiedades deseables del método multipaso dependen
de la localización de las raíces de los polinomios p y q.
Xn = Xn-2 +Zh[n-1, Se dice que el método multipaso definido por la ecuación (2) es convergente cuando
concurren las siguientes circunstancias. Imagine que se calculan soluciones numéricas
22. Considere dados los valores de ao, a1, ...• am y suponga que I::=0 a; ':' O. ¿Existen ne del problema (1) usando distintos valores de la longitud de paso. Denotamos con x(h, t)
cesariamente valores de bo, b1, ..., bm que aseguren que el método multipaso que utiliza
estos valores como coeficientes sea de al menos de orden m? (Para responder se necesita un la solución aproximada que se obtiene usando un paso de longitud h. Como es usual, la
teorema o un ejemplo.) solución exacta se denota con x(t). La convergencia en este caso significa que
23. Demuestre que para el método de Euler sucede que do = di = O y di = 1/j! paraj;;; 2.
lím x(h, t) = x(t) (t fijo), (5)
h-.O
*8.5 Errores locales y errores globales. Estabilidad para toda t en un intervalo (to, tm], siempre y cuando los valores de arranque satisfagan
la misma ecuación, a saber,
Los métodos de Adams-Bashforth y de Adams-Moulton son sólo dos ejemplos del uso
de métodos multipaso para resolver un problema de valor inicial de la forma: límx(h,to+nh) =.xo (O� n < k), (6)
h-.O
{x' =f(t,x) (1) y que la función! satisfaga las hipótesis del teorema de existencia básico (Teorema 3 en
x(to) = xo. la Sec. 8.1 ).
El término multipaso se debe al hecho de que para calcular Xn hace falta utilizar los valores
de Xn-I, Xn-2, ... , que corresponden a términos previamente calculados. Pasamos ahora Estabilidad y consistencia
a revisar algunas cuestiones discutidas en la sección precedente.
Otros dos términos que se usan son estable y consistente. El método es estable si
Métodos convergentes implícitos y métodos convergentes explícitos todas las raíces de p se encuentran en el disco z[ � 1 y si cada raíz de módulo uno es
f
simple. El método es consistente si p(l) =O y p'(l) =q(l). Con esto se puede pasar a
Cualquier método multipaso se puede describir mediante una ecuación de la forma: presentar un teorema muy importante.
Ésta es una ecuación lineal en diferencias, siendo x. = h'J,.• una solución, donde ). es Dése cuenta de que los valores iniciales en esta solución numérica son consistentes con
una de las raíces de p. Si [).[ > 1, entonces para O� n < k tenemos: el valor inicial x(O) = O, lo que se debe a que límh....o (n + k)hy = O para n = O, I, ... ,
k - I. La condición de convergencia establece que lím.....oox. = t, si nh = t. Por lo
[x(h, nh)[ = h[). "[ < h[).[k ..... O (cuando h ..... O). tanto tenemos que lím..... (n + k)hy = t. Por consiguiente concluimos que y = 1, 0
00
Por otra parte, si [).J = 1 y p'().) = O, entonces x. = hn )..• es una solución de (8). La Método de Milne
condición (6) se satisface debido a que si O � n < k, entonces
Con el fin de ejemplificar el teorema anterior analizamos el método de Milne,
Jx(h, nh)J = hn[)..[" = hn < hk -t O (cuando h ..... 0). definido mediante
Xn -Xn-2 = h[tJn + Vn-1 + V,.-2]. (1 2)
La condición (5) no se satisface en vista de que Éste es un método implícito y se caracteriza por los dos polinomios:
1
Jx(h, t)[ = (tn- )n[).[" = t f+ O.
p(z) = z2 -1
Demostración (Necesidad de la consistencia) Suponga que el método definido mediante (2) es conver
q(z)= fz2+iz+f
gente. Considere el problema
x'=O Observe que las raíces de p son + 1 y -1. Son raíces simples. Además, p' (z) = 2z,
{ (9)
x(O) = l. p' (1) = 2, y q(l) = 2. Por consiguiente, se satisfacen las condiciones de consistencia y
La solución exacta es x = l. La ecuación (2) una vez más tiene la forma (8). Una estabilidad. El teorema nos indica, por lo tanto, que el método de Milne es convergente.
solución se obtiene tomando Xo = x1 = · · · = Xk-I = 1 y luego utilizando (8) para
generar los valores restantes, Xk, Xk+ I,.... Dado que el método es consistente, resulta Error de truncamiento local
que lím..... x. = I. Al usar este resultado en la ecuación (8) obtenemos que ak+ak-1 +
00
... + ao = I, o en otras palabras, p(l) = O. Nuestra siguiente tarea consiste en definir y analizar el error de truncamiento local
Considere ahora el problema de valor inicial que surge al usar el método multipaso (2). Suponga que se usa la ecuación (2) para
calcular Xn, suponiendo que todos los valores previos dexn-I, Xn-2, ... son correctos; es
x' = I decir, que x; = x(t;) para i < n. En esta situación x(t) denota la solución de la ecuación
{ (10) diferencial. Entonces el error de truncamiento local se define como x(t.) - x•. Este
x(O) = O,
error se debe únicamente a que se modeló la ecuación diferencial mediante una ecuación
cuya solución exacta es x = t. La ecuación (8) se convierte en en diferencias. En esta definición no se incluye el error de redondeo; suponemos quex.
se ha calculado con precisión total a partir de la ecuación en diferencias (2). Queremos
akXn +ak-JXn-1 + · · · + aoXn-k = h[bk + bk-1 + .. · + bo]. (11) demostrar que si el método tiene orden m (como se definió en la sección 8.4), entonces el
error de truncamiento local será O(h m+I). Esto no es cierto si no se satisfacen ciertas
Como el método es convergente, la demostración anterior nos indica que es estable. Por condiciones. Lo anterior se debe a que nuestro análisis presupone que f es una función
ende, p(l) = O y p'(l) ;é O. Una solución de la ecuación (11) es x. = (n + k)lr(, con lisa hasta cierto grado y que también lo es la función x(t) que se toma como solución
y= q(l)/p'(l). La sustitución de este dato en el lado izquierdo de (11) da lugar a ·exacta.
k
0 = ¿[a¡X¡ - hb¡ f(t¡, X¡)]. (15) tn ln+I ln+l ln+J ln+4
i=O
Figura8.2 El efecto de cambiar las condiciones iniciales.
En vista de que hemos supuesto que X¡ = x(t¡) para i < k, el resultado de restar la
ecuación (15) de la (14) será
palabras, necesitamos entender cuál es el efecto que se produ
(16) ce sobre los valores de las
Lx = ak [x(tk) - xk] - hbk (/(tk ,x(tk)) - f(tb Xk)]. ordenadas de una curva solución como resultado de un cambi
o en un valor inicial. La
figura 8.2 muestra lo que intentamos medir.
Aplicando el teorema del valor medio al último término de la ecuación (16) obtenemos: Considere el problema de valor inicial
óf x1 =f(t,x)
Lx = ak[x(tk) - Xk] - hbk (tk, l;)[x(tk) - xk] {
óx (17) x(O) =s. (19)
=[ak - hbkF] [x(tk) - Xk ].
Suponga que óf/óx, denotada en este caso por fx, es continua y satisface la condición
donde F = óf (tb 1;)/óx para alguna 1; entre x(tk) y Xk, Recordemos ahora que de acuerdo fx(t, x) � ).. en la región definida por O � t � T y -oo < x < oo. La solución de (19)
con la ecuación (13) de la sección 8.4, si el método que se usa es de orden m, entonces es una función de t, pero con el fin de mostrar su dependencia respecto del valor inicial
Lx tendrá la forma: s, la denotamos por x(t;s). Defina u(t) = óx(t;s)/ós. Podemos obtener una ecuación
Lx =dm+1hm+l x (m+l)(to) + O(hm+z). (18) diferencial-la ecuación variacional-para u, derivando respecto de s la ecuación (19).
El resultado es:
Al combinar las ecuaciones (17) y (18) obtenemos la ecuación (13). En esta situación u1(t) =fx(t,x)u
podemos ignorar el término hbkF en el denominador (Prob. 8). 1111 { (20)
u(O) = l.
Ejemplo Determine explícitamente la solución u en el caso del
siguiente problema de valor inicial:
Error de truncamiento global
Deseamos ahora establecer una cota para el error de truncamiento global asociado {x' =x2
al proceso de resolución numérica de una ecuación diferencial. En cualquier etapa x(O) =s. (21)
del proceso, digamos en tn, denotamos con Xn a la solución calculada en ese punto.
Supongamos que todos los cálculos se han efectuado con precisión absoluta; es decir, Respuesta En este caso f(t, x) =x2 y fx =2x. Por lo
tanto la ecuación variacional es:
no aparecen errores de redondeo. Por supuesto, la solución verdadera en tn, x(t.), difiere
de la solución calculada Xn, debido a que ésta última se ha generado usando fórmulas {U1 =2xu
que aproximan series de Taylor. La diferencia x(t.) - x. es el error de truncamiento u(O) = l. (22)
global. No es simplemente la suma de los errores de truncamiento locales que fueron
surgiendo en puntos anteriores. Para comprobarlo debemos darnos cuenta de que cada La solución de la ecuación (21) es x(t) =s(I - st)- 1 Por
• consiguiente la ecuación (22)
paso de la resolución numérica debe utilizar como valor inicial el valor aproximado se convierte en:
de la ordenada que se calculó en el paso previo. En vista de que dicha ordenada ya u'(t) =2s(I - str 1 u(t)
{
incluye un error, el proceso numérico lo que hace es tratar de seguir una curva solución u(O) =1,
equivocada. Debemos por consiguiente iniciar el análisis viendo qué tanto difieren dos cuya solución es:
curvas solución si se inicia el proceso con diferentes condiciones iniciales. En otras u(t) =(1 - st)-2. il
538 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.6 Sistemas y ecuaciones diferenciales ordinarias de orden superior 539
TEOREMA 3 Sifx � 11., entonces la solución de la ecuación variacional (20) satisface la desigualdad SERIE DE PROBLEMAS *8.5
Ju(t)J � ,!J, para t � O. 1. Tomando en cuenta el contenido del teorema 1 de esta sección estudie los siguientes métodos
multipaso:
Demostración De la ecuación (20) tenemos que (a) Xn -Xn-2 = 2hf.-1
,1 /u=fx =11. -a.(t), (23) {b) Xn -Xn-2 = h(jfn-1 - �f.-z + Vn-3
(c) Xn -Xn-1 = h(}fn + *f•-l -f;¡!,,-2 + Mn-3)
en la cual a.(t) � O. Al integrar la ecuación (23) obtenemos:
l
2. Se dice que un método es débilmenteinestab e l sip tiene un cero 11. tal que 11. ;,e !, 111.I = !, y
q(11.) < 11.p'(11.). Demuestre que el método de Milne, dado en la expresión (12), es débilmente
ln [uJ = 11.t - a.('t) d't = 11.t -A(t), inestable.
3. Demuestre que todo método multipaso en el que p(z) = t - 1- 1 y ¿k=o b; = 1, resulta
donde A(t) denota la integral indicada. Dado que t � O, A(t) � O y como consecuencia estable, consistente, convergente y débilmente estable.
ln [uJ � 11.t. Por lo tanto [uJ � r!"', ya que la función exponencial es creciente. 111 4. Determine las características numéricas del método multipaso cuya ecuación es:
TEOREMA 4 Si la ecuación (19) se resuelve tomando como valores iniciales a s y a s+ 8, las curvas Xn + 4.:Cn-1 -5Xn-2 = h[4fn-1 + 2fn-2].
solución en t difieren a lo más en [8[1!-1•
5. ¿Existe alguna razón para desconfiar del siguiente esquema numérico para resolver i =
Demostración Usando el teorema del valor medio, la definición de u y el teorema anterior, obtenemos: f(t,x)?
Xn -3Xn-1 + hn-2 = h[fn + 2!,,-1 + fn-2 -2fn-J).
a
Jx(t;s)-x(t;s+8)1 = l x(t,s+08)[ l8J Explique su respuesta
as
k=l
k
k
n-1
k=O
k)..h -1
= 8(f!WI - l)(i'h -1) . • La forma estándar de un sistema de ecuaciones diferenciales de primer orden es:
¡
sistema lineal en las funciones incógnitas x y y. Este sistema tiene la forma que presenta la ecuación (5).
En todo problema físico bien definido que tenga presumiblemente una solución Para resolver ecuaciones diferenciales con ayuda de un software fácilme
nte ase
única, el sistema de ecuaciones diferenciales vendrá acompañado de condiciones auxi quible, casi siempre es necesario convertir el problema en un sistema tal
como (5).
liares que sirven para determinar las constantes arbitrarias que figuran en la solución Ilustramos el proceso con dos ejemplos.
general. Así, si el sistema (2) estuviese acompañado por las condiciones iniciales
Ejemplo 1 Convierta el problema de valor inicial
x(O) = 4 y(O) = 5/4,
(sen t)y'"+ cos(ty)+ sen(t2+y")+ (y' )3 = log t
la solución sería y(2) = 7
x = 4e31+2e-1 -2e1
{ ( 4) y'(2) = 3 (6)
y 2e3t - e-1 + ié.
=
y"(2) = -4
El problema de valor inicial para el sistema general en (1) se compone de las n
ecuaciones diferenciales junto con un valor inicial prescrito para t, digamos t = to, y la en un sistema de ecuaciones diferenciales de primer orden de valores iniciales.
especificación del valor que tendrá cada función X¡ en t0•
Respuesta Introducimos nuevas variables X¡, x2, x3 como sigue: X¡ == y, x2 == y', x3 == y". El
sistema de ecuaciones que rige a X = (x1, x2, x3l es:
Notación vectorial
x; = X2
El sistema (1) se puede reescribir convenientemente en notación vectorial. Sea X el
vector columna cuyas componentes son x1, x2, • • • , x,,. Estas componentes son funciones {X�== X3
(7)
de t. Por consiguiente, X es un mapeo de IR (o un intervalo de IR) en IR". De igual manera, xi == [log t - Xi - sen(t2+ x3) - cos(tx1 )]/ sen t
sea F el vector columna que tiene como componentesf1 ,!2, . . . ,f•. Cada una de éstas es
una función cuyo dominio es 1R•+I (o algún subconjunto), de modo que Fes un mápeo Las condiciones iniciales en t == 2 son X= (7, 3, -4/.
de IR"+1 en IR". Ahora podemos reescribir el sistema (1) en la forma 11
Los sistemas de ecuaciones de orden superior se pueden tratar de manera semejan
X'= F(t,X). te,
(5) tal como se ilustra en el siguiente ejemplo.
Un problema de valor inicial para el sistema (5) también incluiría valores numéricos para Ejemplo 2 Convierta el siguiente en un sistema de ecuaciones de primer
orden:
el vector X(t0), donde to es el valor inicial de t.
Toda ecuación diferencial de orden superior se puede convertir en un sistema de (x'' )2+tt!+y' == x' - x
ecuaciones de primer orden. Suponga que se nos da una ecuación diferencial en la forma { (8)
y'y'' - cos(xy)+ sen(tx'y) == x
/•l = f(t, y, y'. y", ...'/•-ll). Las condiciones iniciales se omiten en este ejemplo.
542 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.6 Sistemas y ecuaciones diferenciales ordinari
as de orden superior 543
Respuesta Con la introducción de nuevas variables x1 =x, x2=:r!, X3=y, X4=y', el problema
inputt <-l;x <-3;y <-1; h <- ---0.I;M <-30
se puede reescribir de la siguiente manera:
output O, t, x, y
x\ =x2 for k=I, 2, ... ,M do
x' .:-x+J---t3
=(xz --- X¡ --- X,¡ --- ti'3) 1/l
{� (9) y' <-y+x3 +cost
X�= X4
x" <-x' +2yy' --- 3t2
X�=[x¡ --- sen(tx2X3)+cos(x¡X3)]/ X4
y" <-y' +3x2:r! --- sen t
x"' <- :r!'+2yy" + 2(y')2 --- 6t
11
y"' <-y" +6x(x')2+3x2 x" --- cos t
X <-x+h( :r! + fh(X11+fh(:r!")))
Método de la serie de Taylor para los sistemas de ecuaciones de primer orden y f- y+h( y'+ ih(y" + fh(y111)))
Es posible aplicar a los sistemas de ecuaciones de primer orden el método de la t <-t+h
serie de Taylor que se analizó en la sección 8.2. Para cada variable escribimos la serie output k, t, x,y
de Taylor truncada de la siguiente manera: end.
h2 h3 hn
X¡(t+h)=x;(t)+hx/(t)+ -¡xi'(t)+ -1 x;"(t)+ · · ·+1xl")(t),
2. 3. n.
x"=x'+2yy ' --- 3t2 La solución numérica correspondiente a la instrumentación de este algoritmo en
la computadora no la daremos aquí. Lo que sí mostramos en la figura 8.3 son las
y" =y'+3x 2x' ---sent gráficas de las funciones x(t) y y(t) hechas por una computadora. En virtud de que
las rutinas de graficación no se han estandarizado, no tiene caso mostrar el programa de
x"'=x" +2yy" + 2(y')2 --- 6t
cómputo con que se obtuvieron las gráficas. Baste advertir que por lo general hay que dar
y"'=y" +6x(x')2 +3x2 x" :.... cos t al graficador automático dos arreglos, digamos {t; : O � i � m} y {x; : O � i � m}, a
partir de los cuales debe graficar los puntos (t;, x¡) en una malla cartesiana. Por lo general
A continuación proporcionamos un algoritmo adecuado para llevar a cabo el cómputo. se pueden dar órdenes al graficador para que conecte dichos puntos con líneas rectas.
Por consiguiente, es importante que los puntos se ordenen teniendo esto en mente. Lo
544 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.6 Sistemas y ecuaciones diferenciales ordinarias de orden superior 545
usual es, por supuesto, to < t1 < · · · < tm. Si los puntos en la gráfica son suficientemente La programación de una rutina que lleve a cabo el procedimiento se deja como ejercicio de
cercanos entre sí, la curva se verá lisa, no como una sucesión de segmentos rectilíneos. cómputo para el lector. Se pueden proporcionar fórmulas similares para el método de
11 Runge-Kutta-Fehlberg que expusimos en la sección 8.3.
Los métodos multipasos también se pueden extender a los sistemas de ecuaciones.
Desde un punto de vista teórico, no hay pérdida de generalidad si se supone que A manera de ejemplo, proporcionamos la forma vectorial del método predictor-corrector
las ecuaciones que forman el sistema (1) no contienen explícitamente a la variable t. de Adams-Bashforth-Moulton (4) y (8) de la sección 8.4:
Introduciendo una nueva variable x0 =t, podemos escribir el sistema en la forma:
1
X*(t + h)=X(t) + 7 0 [190IF(X(t)) - 2774F(X(t - h))
xf = f;(xo, X¡, ... , Xn). + 26I6F(X(t - 2h))- 1274F(X(t - 3h)) + 251F(X(t - 4h))]
La ecuación diferencial para la nueva variable es xó = l. Por medio de este artificio, h
X(t + h) = X(t) + [251F(X*(t + h)) + 646F(X(t))
podemos escribir el sistema de ecuaciones (5) como 720
(12) - 264F(X(t - h)) + I06F(X(t - 2h)) - 19F(X(t - 3h))].
X'=F(X),
Como en el caso de una sola ecuación, se pueden utilizar procedimientos de un solo
sin que t figure explícitamente en la ecuación. Aquí X = (Xo, X¡, ..., xni. Se dice que paso, como el método de Runge-Kutta de quinto orden (problema 15 a 17 de la sección
¡
un sistema con la forma (12) es autónomo. 8.3) para suministrar los valores de arranque
Ejemplo 4 Convierta el problema de valor inicial del ejemplo 1 en un sistema en el que t no figure X(to + h) X(to + 2h) X(to + 3h) X(to +4h).
de manera explícita.
Respuesta Sean x1, x2, x3 como en el ejemplo l. Tome x0 = t. El nuevo sistema es SERIE DE PROBLEMAS 8.6
e I. Escriba un programa para la computadora que resuelva el siguiente problema de valor inicial
xb = 1 valiéndose del método de la serie de Taylor. Incluya términos en h, h2, h3 y continúe la
solución hasta t = l. Sea h = O.O!
x; =x2
(13) { x1 =t+x2 +x2
1 1 X¡(-1) = 0.43
X� =X3
x� = t2-x¡ +xf X2(-l) = -0.69.
xi = [logxa - � - sen(X5 + x3) - cos(xQX1)]/ sen xa
<2. (Un problema de desafío) Siga las instrucciones del problema 1 para el siguiente problema
y la condición inicial es X = (2, 7, 3, -4) 7. 11 de valor inicial:
{x; = senx1 +cos(tt2) x1 (-l) = 2.37
x� = 1- sen(tt1)
1 x2(-l) = -3.48.
Otros métodos para los sistemas de ecuaciones diferenciales de primer orden Dada la singularidad en t = O, la programación de xf, x!{ y xt se deberá hacer con mucho
El procedimiento de Runge-Kutta para sistemas de ecuaciones diferenciales de cuidado.
primer orden es más fácil de escribir cuando el sistema es autónomo, es decir, cuando 3. Encuentre la solución general del sistema:
¡
tiene la misma forma que la ecuación (12). En su forma vectorial, las fórmulas clásicas x' = 3x -4y +e'
de Runge-Kutta de cuarto orden son: { I
y =x-y-e.t
h
X(t + h)=X(t) + (F1 + 2F2 + 2F3 + F4), (14) 4. Escriba un sistema de ecuaciones diferenciales de primer orden autónomo que sea equiva-
6 lente a {
x -sen(x ) +ex
111 "
t r
+2tcosx=25
donde x(O) = 5 x'(O) = 3 x"(O) = 7.
F1 =F(X)
5. Escriba la ecuación diferencial ordinaria de tercer orden
F2 = F(X + f hF¡) xm +2x" -x' -2x=e'
{
F3 = F(X + !hF2) x(8) = 3 x'(8) = 2 x" (8) = l.
6. Convierta el sistema de ecuaciones diferenciales ordinarias de segundo orden 12. Escriba el siguiente sistema de ecuacio nes diferenciales ordinarias de orden superior como
un sistema de ecuaciones de primer orden:
x" -x'y = 3y'xlogt
{ y\"l = /t(t,Yt, y;,. .. 'y\•-t))
y" - 2x:y' = 5x'y sent
y�•l = /i(t,Y2,Y� · · · ,Yr-tl)
en un sis tema de ecuaciones de primer orden en el que t no figure explícitamente.
7. Escriba
y''+yz = O y(O) = l y'(O) =O yt¡ =J,,.(t,Ym,Y'.. ... ,yt-tl) .
{ con {
+
i 2yz = 4 z(O) = 3
13. Convierta el siguiente sistema de ecuaciones diferenciales de ord en superior e n un sistema
como un sistema de primer orden con condiciones iniciales . Haga uso de la notación vectorial. de ecuaciones diferenciales de primer ord en en el que t no figure explícitamente :
{
x" =xcost+e'x' +3r+7
x(l ) = 5 x'(l ) = 9.
{ x" = f(t, x, x')
x(a) = a x' (a) = p.
(1)
e11. Escriba un subprograma o procedimiento que dé un paso de longitudh en el procedimiento de se puede escribir en la forma de un sistema de ecuaciones diferenciales de primer orden
Runge-Kutta de cuarto orden. Hágalo con la capacidad suficiente para manejar un sis tema de haciendo x1 = x y x2 = x':
20 o menos ecuaciones diferenciales. Po nga a prueba el programa resolviendo el siguiente
sistema en el intervalo 1 � t � 2. Utilice h = -O.Ol.
X¡ = xz X¡ (a) = a
{
x' = x-2 +log y +t
2 � = f(t, X¡, xz) xz (a) = p.
(2)
{ y ' = e1 - cosx + (sent)x - (xy)-3 El sistema (2) se puede resolver paso a paso con alguno de los métodos que ya hemos
x(2) = -2 y(2) = l. descrito.
548 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8. 7 Problemas defrontera
549
No obstante, la situación sería muy diferente si el problema en (1) se cambiase por Este ejemplo es apenas distinto del problema en (4),
mas si
valores en la frontera a la solución general (5), obtenemos tratamos de imponer los
el par de ecuaciones contra
dictorias:
= a. =r
J'=f(t,x,x')
{ (3)
x(a) x(b) 3=B 7=-B. (9)
La diferencia estriba en que las condiciones que se especifican aluden a dos puntos Así, el problema (8) no tiene solución.
distintos, t = a y t = b. Los procedimientos paso a paso para el problema de valor Los teoremas de existencia de soluciones para el problema
inicial no son de utilidad en el caso del sistema (3), pues la solución numérica no puede en la frontera en dos puntos, tienden a ser más bien complicado (3), es decir, de valores
s. Remitimos al lector al
comenzar sin un complemento íntegro de valores iniciales. En (3) tenemos un típico libro de Stoer y Bulirsch [19 80] y al de Keller [1968]. El siguie
nte es un resultado muy
ejemplo de un problema de valores en la frontera en dos puntos. Tales problemas son elegante que se encuentra en Keller [1968, pág. 10 8].
por lo general más difíciles de resolver que los problemas de valor inicial.
He aquí un ejemplo de un problema de valores en la frontera en dos puntos que se TEOREMA 1 El problema de valores en lafrontera
puede resolver sin trabajo numérico:
= f(t,x)
=
J'
J' -x {
{ (4) x(O)= O x(l) = O.
x(O)= 3 x(D= 7.
3 =x(O)=A sen O+B cos O = B Respuesta Hagamos uso del teorema l. Tenemos
{ (6)
7=x(!)=A sen!+Ecos! =A.
t:0�=-; = 7.
(8) Advierta que s = O corresponde a t = a, y s = I a t = b. Por consiguiente, definimos
x(it) y(s) = x(a+ls) con A.= b- a. En tal caso y'(s) = A.X'(a+ls) y y"(s) = l2x"(a+ls).
550 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8. 7 Problemas de frontera 551
Además, y(O) = x(a) = a. y y(l) =x(b) = �- De este modo, si x es una solución de Para reduci r un problema de valores en la frontera en dos puntos:
(10), y es una solución del problema de valores en la frontera:
y"=g(t,y)
y11 (s) =12f(a+ 1s, y(s)) {
{ (11) y(O) = a. y(l) = �-
y(O)=a. y(l)=�-
recíprocamente, si y es una solución de (1 1), la función x(t) = y((t-a)/(b-a)) es una a un problema homogéneo, simplemente sustraemos de y una función li neal que toma
solución de (10). los valores a. y � en los puntos O y l. He aquí el teorema.
TEOREMA 2 Considere los siguientes problemas de valores en la frontera en dos puntos: TEOREMA 3 Considere los siguientes problemas de valores en la frontera en dos puntos:
x11=f(t, x) {y"--g(t,y)
(i) { (ii)
x (a)=a. x (b)=�
y(O) = a. y(l) = �
en donde
(ii)
f" =
g(t,y)
y(O)=a. y(l)=� (iiii) {
z" = h(t, z)
z(O) = O z(l) = O,
donde
g(p, q) = (b-a/f(a+ (b-a)p, q).
h(p, q) = g(p, q+a.+(�-a.)p).
Siy es una solución de (i i), entonces lafanción x definida por x(t) = y((t-a)/(b- a))
es una solución de (i). Es más, si x es una solución de (i), entonces y(a+ (b-a)t) es Si z es una solución de (i ii), entonces lafancióny(t) = z(t)+a.+(�-a.)t es una solución
una solución de (ii). de (ii). Es más, siy resuelve (ii), entonces z(t)=y(t)- [a.+$-a.)t] resuelve (iii).
Demostración Se trata de una simple verificación: Demostración Nuevamente se trata de una verificación di recta:
ª_ª
x (a)=y
(b - a ) =y(O)=a. y(O) = z(O)+a.+(�-a.) O = a.
y(l) =z(l)+a.+$-a.) l =�
b-a
x(b)=y =y(l)=�
(b-a) y"(t)=z"(t) = h(t, z(t)) = g(t, z(t)+a.+$-a.)t)
t-a 1 =g(t, y(t)). 11
x'(t) = y' (b-a) b-a
Ejemplo 3 Demuestre que el siguiente problema tiene una solución única:
t-a -- 1
)=
11 11
Tal como se muestra en el ejemplo 1, el problema de valores en la frontera para z tiene x"=f(t,x)
{ (15)
una solución única. Por consiguiente , el problema para x tiene también una solución x(O) = x(l) = O
única. 1111
tiene una solución única en C[O, l ].
Ejemplo 4 Convierta el siguiente problema de valores en la frontera en dos puntos en uno de valores
cero en la frontera, en el intervalo [O, 1]: Demostración (Bosquejo) Basándonos en el problema 10, sabemos que el problema que se plantea en
(15) es equivalente a la ecuación integral:
x"=x2 +3- t2 +xt
{ (12)
x(3) = 7 x(5) = 9. x(t) = [ G(t, s)f(s,x(s)) ds, (16)
Respuesta Por el teorema 2, un problema equivalente es:
en donde G es la función de Green del problema 6. La ecuación integral (16) tiene
y"=g(t,y) la forma x = F(x), donde F es la operación definida por la integral . Haciendo uso del
{ (13)
y(O) = 7 y(l ) = 9, teorema de la transformación de contracción de Banach en el espacio C[O, 1], concluimos
que F tiene un único punto fijo y que cada una de las ecuaciones (15) y (16) tiene solución
con única. 11
g(t, y) = 4J(3 + 2t,y) = 4[y2 + 3 - (3 + 2t)2 + y(3 + 2t)].
Ejemplo 6 Demuestre que el siguiente problema tiene una solución única:
Por el teorema 3, otro problema equivalente es
{ z" = h(t, z)
(14)
{
x" = 2exp(tcosx )
x(O) = x(I) = O
(17)
z(O) = O z(l) = O
Respuesta Aquí,f(t, s) = 2exp(tcoss). Por el teorema del valor medio ,
con h(t, z) = g(t, z + 7 + 2t). Al expresar h con detalle tenemos:
lf(t, s¡) -f(t,s2)I = 1 t(t,s3)[ ls1 -s2I
h(t, z) = 4[(z + 7 + 2t)2 + 3-(3 + 2t)2 + (z + 7 + 2t)(3 + 2t)].
Ahora podemos resolver (14) para z y obtener la solución de (13) de la ecuación La derivada que aquí necesitamos satisface la relación
en donde {x"=x2
s(t - 1) si O;;ís;;ít;;í1 x(O)=2/ 3 x(l) = 3/ 8 .
G(t, s)={
t(s - 1) si O;;ít;;ís;;íl.
1 4. (Continuación) Resuelva el problema (1 3) cuando las condiciones en la frontera se sim
La función G se conoce como función de Green para este problema. plifican a x(O) = O, x(l)=l. Consulte a Davis [1962].
7. Considere los siguientes problemas de valores en la frontera: 1 5. Resuelva el problema de valores en la frontera
x" = f(t, x, x') {x"=x'
(i) {
x(a)=a. x(b)=� x(O) = 1 x(l) = 2 - v'Í.
i'=irf(a+th,x,h-1i)
(ii) { 1 6. Demuestre que si x es una solución de la ecuación diferencial x" = f(x), también lo es y,
x(O) = a. x(l) = �. donde y(t)=x(t+e).
donde h =b - a. Demuestre que si x es una solución de (ii), entonces la función y(t) = 1 7. Demuestre que el siguiente problema tiene solución única:
x((t - a)/h) es una solución de (i).
8. Ejemplifique el teorema 2 con el problema de valores en la frontera {i'=! expG(t+l) cos(x+7 - 3 t)} (-1;;ít;;í1)
x(-1) = -10 x(l) = -4.
x"=t+x2 - 3 x'
{
x(3) = a. x(7)=�- 1 8. Encuentre un problema de valores en la frontera en dos puntos de la forma
Este problema es equivalente a este otro: z" = h(s, z) z(O) = z(l) = O
x" =48+6 4t+16x - 12 x' 2
que sea equivalente al siguiente problema:
{
x(O) = a. x(l) = �.
x" = cos(x2t2) x(3)=5 x(7)=12.
9. Utilice el teorema 1 para demostrar que el siguiente problema de dos puntos tiene solución
única: 19. Suponga que v y w son dos funciones de t con las siguientes propiedades:
x" = cos(tx)
{
x(O) = 1 x(l) = 4. v" = cos t+ve1+v't 2 v(l) = 5 v(3) = 42
10. Demuestre que el problema de valores en la frontera w"=cos t+we'+w't 2 w(l)=8 w(3) = 9.
x"=f(t,x) ¿ Qué función resuelve el siguiente problema de valores en la frontera en dos puntos?
{
x(O) = O x(l) = O.
x" = cos t+xe'+x't2 x(I) = 7 x(3) = 20
es equivalente a la ecuación integral
[
20. (Un problema de elección múltiple) (a) El problema de valores en la frontera en dos puntos
x(t) = G(t, s) f(s, x(s))ds, x"=-4x x(O) = 1 x(1t/2) = -1
en donde G es la función de Green del problema 6. es un ejemplo que: (i) no tiene solución; (ii) tiene exactamente dos soluciones; (iii) tiene
exactamente una solución; (iv) no tiene solución que se pueda expresar en términos de las
1 1. Demuestre que el siguiente problema de valores en la frontera en dos puntos tiene una funciones elementales; (v) tiene más de una solución. (b) Repita lo anterior para el problema
solución única: de valores en la frontera en dos puntos:
x" = (r+5) x+sen t
{
x(O)=x(l)=O . x" = -4x x(O)=1 x(1t/2)=2.
556 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.8 Problemas defrontera: métodos de disparo 557
21. Considere el problema de valores en la frontera en dos puntos: La solución de este problema de valor inicial la denotaremos con Xz. Nuestro propósito
x(O) = x(l) = O. es escogerz de modo que xz(b) = P. Escribimos
x" = f(t,x)
Este procedimiento se puede repetir para obtener una sucesión de valoresz1,z2, ..• , Zn
Función lineal figure explícitamente, definimos .to = t, x3 = X¡,� = �- De este modo el sistema de
ecuaciones diferenciales de valores iniciales es:
El método del disparo que acabamos de bosquejar puede resultar muy costoso
desde un punto de vista computacional, por lo que es importante considerar técnicas que r=l 'o(a)=,
resulten más económicas. Obviamente, toda información acerca del valor correcto x' (a) xí = x3 x¡(a) = a
se debe aprovechar. Asimismo, se pueden resolver los problemas de valor inicial con un � = x4 x2(a) = a
paso de longitud muy grande, pues la alta precisión se desperdicia esencialmente en las (8)
primeras etapas del método de disparo. Sólo cuando �(z) es próximo a cero se deben X3 =f(Xo, X¡, X3) X3(a) = Ü
utilizar incrementos pequeños. � = f(Xo, X2, X4) X4(a) = l .
Hay una clase de problemas ,en los que el método de la secante proporciona la
Con este sistema podemos alimentar el programa de la computadora para resolver el
solución exacta en un soio paso. Este es ei caso en que � es una función iineai. Esto problema del valor inicial. Los valores aproximados de las funciones discretas x 1 (t¡) y
ocurre cuando la ecuación diferencial es lineal. En dicho caso, el problema de valores xz(t¡)paraa = to;;;; t¡;;;; tm = bconviene almacenarlos en la memoria de la computadora
en la frontera en dos puntos tiene la forma: como arreglos unidimensionales. Después, el valor de A. se puede calcular por medio de
{ x'' = u(t) + v(t)x + w(t):i
(4)
la ecuación (7). Finalmente, la solución y se puede computar en cada valor de t que se
quiera con la ecuación (6).
x(a) = a x(b) = �-
TEOREMA 1 Si el problema lineal de valores en la frontera en dos puntos (4) tiene una solución,
A continuación vamos a suponer que las funciones u, v y w son continuas en el intervalo entonces, o x 1 es una solución, o x¡(b)-x2(b) "#- O (y en este caso y es una solución).
[a, b]. Suponga que ya hemos resuelto dos veces la ecuación diferencial en (4) con dos
condiciones iniciales diferentes, habiendo obtenido las soluciones x 1 y x2. Digamos Demostración Sean y0, y1 y y2 soluciones de los siguientes problemas de valor inicial:
donde A. es un parámetro. Se puede verificar fácilmente que y es una solución de la Yo + c¡y¡ + c2y2,
ecuación diferencial que satisface la primera de las dos condiciones en la frontera; es
decir, y(a) = a. Escogemos A. de modo que y(b) = �- Así, en donde c1 y c2 son constantes arbitrarias. Podemos ver de inmediato que las funciones
x¡ y x2 en (5) son casos especiales de la solución general dados por:
� = y(b) = h1(b) + (1-A.)xz(b) X¡ = Yo +Z1Y2 X2 = Yo +Z2Y2- (9)
y Como hemos supuesto que el problema en (4) tiene una solución, existen c y c tales que
1 2
A. = � -Xz(b) . (7)
X¡(b) -xz(b) a= Yo(a) + c¡ y¡(a) + c2 y2(a)
Al desarrollar en una computadora estas ideas para el problema lineal (4) podemos � = Yo(b) + c¡ Y1(b) +cz yz(b).
obtener x1 y x2 simultáneamente. Así, los dos problemas del valor inicial que debemos
resolver se pueden especificar de la siguiente manera: La primera de estas ecuaciones se reduce a c1 = O, de modo que inferimos la existencia
{
de una c2 tal que
x" =f(t, x. x')
� = Yo(b) + C2Y2(b). (10)
x" = f(t,x,x')
x(a) = a x'(a) = O
{
x(a) = a x'(a) = 1, *
Si x¡(b) -x2(b) O, entonces la función y definida por las ecuaciones (6) y (7) es una
solución de (4). Si x 1 (b) -x2(b) = O, entonces de las ecuaciones (9) deducimos que
Y2(b) = O. Entonces la ecuación (10) nos dice que y0(b) =�y la ecuación (9) que xi es
donde f(t, x, x') = u(t) + v(t)x + w(t)x'. La solución de la primera es x1 y la de la una solución. 1
segunda es x2. Para producir un sistema de ecuaciones de primer orden en el que t no
560 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.8 Problemas de frontera: métodos de disparo 561
Método de Newton En los dos subintervalos resolvemos dos problemas de valor inicial para obtener dos
la frontera en dos funciones x1 y x2:
Regresemos al problema más general (no lineal) de valores en
veamo s cómo se aplica el métod o de Newton.
puntos correspondiente a la ecuación (1), y i¡'=f(t,x¡,X¡) X¡(a)=a x;(a)=zr (a�t �c)
Recuerde que Xz es una sol u ción del proble ma
x!f.=f(t,xi,�) x2(b)=P �(b)=z2 (c�t �b)
{x1=f(t,Xz, X�)
(11)
xz(a) = a x�(a) = z. Advierta que z1 y z2 son parámetros a nuestra disposición. La función x1 sólo se necesita
en el intervalo [a, c] y x2 sólo en el intervalo [e, b]. La solución numérica de x2 seguirá
Queremos elegir z de modo que su curso en la dirección decreciente de t.
$(z) = xz(b) - P = O.
Los parámetros z1 y z2 ahora se deben ajustar hasta que la función definida por
pedazos
x1 (t) a5.t5.c
- -
La fórmula de Newton para la función $ es: x(t) = {
x2(t) e�t � b
$(z.) (12)
Zn+l = Zn - $ (znf se convierta en una solución del problema. De este modo, requerimos continuidad de x
'
y i en el punto c:x1 (c)-x2(c) = O y i¡(c)-�(c) = O. Estas dos condiciones se han de
a z todas las ecuaciones en (11): satisfacer con una hábil elección de z1 y zz. Normalmente esto se hace con el método
Para determinar$', derivamos parcialmente con respecto
de Newton en dimensión 2, como en la sección 3.5.
ax;= i}[_I!!_ a¡ ax�+ a¡ ax,_ El disparo múltiple con k subintervalos comprende k subfunciones, cada una de
+ las cuales se obtiene resolviendo numéricamente un problema de valor inicial. Los
az at az axz az ax� az (13)
{ valores iniciales de estas k subfunciones forman un conjunto de 2k parámetros. En cada
a ,
a
(a) = rzx,Ca) = l. uno de los k - I puntos de división interior del intervalo es obligatorio que la función
a?. o global y su primera derivada sean continuas. Esto trae consigo 2k - 2 condiciones. Hay
le v = axz/az, esto se con- dos condiciones adicionales para los extremos del intervalo, de modo que el número de
Con cierta simplificación.e introduciendo una nueva variab condiciones es igual al número de parámetros. El sistema de ecuaciones no lineales que
vierte en de ello resulta se resuelve iterativamente, por ejemplo, con el método de Newton para
v" = fx, (t, Xz, x�)v+fr. (t Xz, x�)v
1
ax,(b) donde X = (x1, x2, .•. , x.l y F = (!1,h, ... ,J,,f. Con mucha frecuencia se permite
v(b) = = $ '(z). que las condiciones en la frontera sean muy generales. Por ejemplo, algunos códigos
oz
permiten que las condiciones en la frontera sean de la forma
Esto nos permite utilizar el método de Newton -la ecuación (12)- para encontrar una
raíz de$. G(X(a), X(b)) = O,
Disparo múltiple donde G = (g1, g2, ... , g.l. Algunos programas requieren que el usuario suministre la
disparo múltiple. Aquí matriz jacobiana J de F, que es la matriz den x n con componentes lij = af¡/axj.
Una forma más elaborada del método del disparo se llama
el intervalo [a, b] en varios subintervalos para
la estrategia básica consiste en dividir bir lo que se haría Ejemplo Suponga que un programa del tipo recién descrito se utiliza con el problema
ma global por pedaz os. Tratem os de descri
tratar de resolver el proble
[e,
si el intervalo se subdividiera en sólo dos partes, [a, e] y
b].
{x" = tx + cos x'
El problema original es el mismo de antes, a saber;
x(3)+x'(5) = 7 x' (3)2x(5) = 10
{i' = J(t,x,x')
x(a) = a x(b) = P ¿Cómo son F, G y J?
562 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.8 Problemas de frontera: método
s de disparo 563
Respuesta Sean x1 = x y x2= x'. Ahora podemos expresar el problema en la forma 4. Muestre cómo se puede utilizar el método del
disparo para resolver un problema de
en la frontera en dos puntos del siguiente tipo, en
x; = x2 x¡(3)+x2(5) - 7= O el que las constantes et, � y cij estánvalores
dadas.
{
�= tx¡ + COSXz Xz(3)2 x¡ (5) - 10= O x"= u(t) +v(t)x +w(t)x'
{ cux(a) +c12x'(a)= a.
Se puede leer directamente las funciones F y G de las ecuaciones. La función jacobiana
c21x(b) +c22x'(b)=�-
está dada por
J(t, X)= 11 '5. Escriba un algoritmo para el método del dispa
ro. Resuelva con dicho método el siguie
[� -s;nx2] problema de valores en la frontera en dos puntos : nte
x"=-9x
:(o�:; x(I) =3. {x(O) =1 x (O) =
{ // ' z
2 Determine la solución verdadera y encuentre explícitamente la función$ en el siguiente caso: y después ajustando z de modo que x,,(it/6)= 5. Descri
{
x(it/3)= 5. ba cómo se alteraría el resultado si
x"= -(x')2x- 1 12. Encuentre explícitamente la función$ en el siguie
nte caso:
x(l)= 3 x(2)= 5.
x"= -2t(x')2
{
x(O) =1 x(l) =1 + ¡
Resuelva el problema de valor en la frontera sirviéndose de$.
3. Resuelva analíticamente el problema de valores en la frontera en tres puntos:
Utilizando$, resuelva el problema de valores en la frontera.
{X111= -e1 +4(t+ 1)-J
2 13. Si x, es la solución del problema de valor inicial x" = x, x(O) = O, x'(O) = z, ¿cuál es el
x(O)=-1 x(l)= 3-e+21n 2 x(2)= 6- e +21n3. valor de x,(1)?
564 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias
8. 9 Problemas defrontera: método
s de diferenc iasfinitas 565
1 4. Para el problema de valores en la frontera en dos puntosx'' =x, conx(O) = O y x(l) = 17, Divida el intervalo [a, b] en los puntos a
¿cuál es la función $(z)? = to, t , t2, ..., tn+I = b. Estos puntos
no necesitan estar igualmente espaciados, pero ¡
15. Si x, es la solución del problema de valor inicial x" = -x, x(O) = 5, x' (O) = z y si en la práctica usualmente lo están
realidad, si los puntos no están distribuid . En
$(z) = x,( ¡t/ 2)- 3, ¿cuál es $'(z)? os uniformemente, es necesario
versiones más complicadas de las fórmulas ( ) introducir
1 6. Cuando resolvemos el siguiente problema de valores en la frontera en dos puntos: 1 y (2). De este modo, por simplicid
suponemos que ad,
x" - 37t"x' = 95
{
x(6) = 1 x(12) = 2,
t¡ = a+i h o:;;i:;;n+l
(4)
h= (b-a)/(n+l).
sirviéndonos del método del disparo con base en el método de la secante, obtenemos dos Denotamos con y¡ el valor aproximado de x(t;
). La versión discreta de (3) es
pares de números (Zi,x,,(b)) para i = 1, 2, digamos (4, 5) y (2, 9). ¿Cuál problema de valor
inicial hay que resolver para la siguiente iteración de este procedimiento?
Yo = a
17. Con relación a la discusión del problema lineal de valores en la frontera en dos puntos, -2
demuestre que se debe dar a c1 y c2 los va lores e¡ = O y c2 = [J3-yo(b)]/n(b). { h (Yi-t- 2 y¡ + Y;+¡) = f(t¡, Y;, (2h)-1(Yi -
+I Yi-1)) (1 :;; i:;; n) (5)
1 8. (Continuación) Demuestre que si yz(b) = O, entonces el problema de valores en la frontera = p.
no es resoluble para cualquier par (a.,�). Yn+I
e 19. Escriba un algoritmo para resolver el problema lineal de dos puntos tal como se describe en
el texto. Remítase a las ecuaciones (4) a (8). Escriba un código de propósito general con El caso lineal
base en este algoritmo. Las funciones u, v y w deben ser sumínistradas por el usuario en En la ecuación (5) las incógnitas son y¡, 2, •.•
forma de subrutinas. Y , , y hay n ecuaciones por resolver.
Si f depende de y¡ de un modo no lineal, las ecuac Yn
c20. (Continuación) Ponga a prueba el código del problema 19 con el siguiente ejemplo: iones serán no lineales y, en general,
difíciles de resolver. Pese a todo, supongamo
u(t) = e,-¡, v(t) = t2+ 2, w(t) = sen t, a= 2.6, b = 5.1, a.= 7.0, � =-3. s que f es lineal en x y
x. En tal caso es
de la forma:
2 1. Demuestre que el siguiente procedimiento resuelve el problema (4) de valores en la frontera f(t, .x, x') = u(t)+ v(t)x + w(t)x'.
en dos puntos siempre que existe una solución. Resuelva dos problemas de valor inicial (6)
El sistema (5) es ahora un sistema lineal de ecuac
iones, que se puede escribir en la forma:
x;' = u+vx¡+wx; X¡(a) = e,. x; (a) = O
{
x.!/. = vx2+w� X2(a) = O x�(a) = l .
Yo=a
Entonces: ox1 e s l a solución, oxi+ c.x2 con e = [J3-x1(b)J/x2(b) e s l a solución. { (-1- hw¡)y¡_¡+ (2 + h 2v¡)y¡+
f (-1 + hw¡)Ji+I = -h2u ¡ ( 1 :;; i:;; n)
f
22. Demuestre que el problemax" =x, x(a) = a,x(b) =� siempre tiene una solución única. (7)
(Suponga que a ;t b.) Yn+t = p.
Hemos escrito u ¡ = u(t;), V¡ = v(t¡), etcétera.
Ahora introducimos las abreviaturas:
8.9 Problemas de frontera: métodos de diferencias finitas
a¡ =-1-fhwi+l
Otro enfoque del problema de valores en la frontera en dos puntos consiste en discretizar
el intervalo correspondiente a t, y después utilizar fórmulas de aproximación para las
d¡ = 2+h v¡
2
x"(t) = h-2 [x(t + h)- 2x(t)+x(t- h)]- (l/1 2)h x( l (t) de modo que el sistema de ecuaciones tiene el siguie
1 r ·fi 1
(2) nte aspecto:
2 4
{C¡¡X(a)+C¡zx'(a) = C¡3 4
ld;!11.�h llglloo + !cd11.+ la;-1'11.
c21x(b)+c22x'(b) = C23 4
11.( ldd - !cd - ! a¡_¡I)�h 1igllco
tiene sólo una solución en el intervalo [a,b] siempre que:
h2V¡A.�h4 llglloo
(i) f y sus primeras derivadas parciales fr, fx, fx, sean continuas en el dominio
D=[a,b]xlR.xlR. !le!loo �h2[ llglloo / ínf v(t)]
(ii) Ir> O, l!xl�M, lfx,I�M sobre D
Por la ecuación (14), !lglloo � !lx(4l¡¡ co /12+!lx111!!00 /6. La expresión entre paréntesis
(iii) len\+ lc12I > O, lc21I+ lc22I > O, len\+\c2¡\ > O, c¡¡c¡2 �O�c21c22
angulares es una cota independiente de h. Podemos ver de este modo que lie lloo es O(h2)
cuando h -+ O.
Denotamos con x(t) a la verdadera solución del problema, y con y¡ a la solución
discreta. Advierta que y¡ depende de h. Vamos a estimar el valor de lx;- y¡ 1 y a mostrar
que converge a cero cuando h __, O. Aquí, por supuesto, X¡ denota a x(t;). SERIE DE PROBLEMAS 8.9
Con la ayuda de las fórmulas (1) y (2) podemos ver que x(t) satisface el siguiente l. Resuelva el problema de valores en la frontera en dos puntos
sistema de ecuaciones para 1�i�n:
{x" +2x' + lOt = O
h -2(x¡ _¡- 2x¡+x¡+I)- (1/12)h2xf4l('t¡) x(O) = 1 x(l)=2
(11)
=U¡+V¡X¡+W¡[(2h) -1 (X - X¡_¡ ) - (1/6)h2x (�¡)].
111
¡+¡ parax(!), valiéndose del método de diferencias finitas con h = !-
568 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.10 Problemas de frontera: colocación 569
2. Muestre las modificaciones que hay que hacer a las ecuaciones lineales (7) para hacer frente de colocación, los vectores u, w y Vj son funciones con un dominio común. Lo que se
a condiciones en la frontera de la forma: precisa es que las funciones w y r;=l CjLVj coincidan en n puntos prescritos:
cux(a) +c12x' (a)+c¡3 = c21x(b)+C2zX (b)+c23 = O.
1
¿
j I
cj(Lvj)(t ) =w(t )
¡ ¡ (1 � i � n). (4)
3. Utilice el teorema de Keller para demostrar que el problema de valores en la frontera (10) =
tiene una solución única, a condición de que las funciones que figuran como coeficientes
sean continuas y v > O. Éste es un sistema de n ecuaciones lineales a partir del cual podemos calcular el valor de
e 4. Escriba un programa de propósito general para la computadora que resuelva problemas los n coeficientes 9. Desde luego, las funciones Vj y los puntos t¡ se deben escoger
lineales de valores en la frontera en dos puntos, por medio del método de diferencias finitas, de modo que la matriz con componentes (Lvj)(t¡) sea no singular.
con apego a su descripción en el texto. Permita que el usuario suministre a, a., b, � y n y las
funciones u, v y w como en las ecuaciones (3), (4) y (6).
Problemas de valores en la frontera de Sturm-Liouville
c5_ (Continuación) Ponga a prueba el programa del problema 4 con los siguientes ejemplos:
x" Veamos cómo trabaja este método con un problema de valores en la frontera de
(i) { =-X Sturm-Liouville:
x(O) = 3 x(1t/2) = 7
{ X11 = 2e1 -X
u"+pu'+qu=w
{
(ii) u(O) = O u(l) = O. (5)
x(O) = 2 x(l) = e+cos 1 Aquí las funciones p, q y w son conocidas y se supone que son continuas en el intervalo
Las soluciones son: (i) x(t) = 7 sen t+3 cos t (ii) x(t) = e'+cos t. [O, l ]. La función u es desconocida; también ella está definida en [O, l ], y esperamos
Calcule los errores correspondientes a las soluciones numéricas en estos dos casos. que sea dos veces continuamente diferenciable. Este problema se torna en un ejemplo
del esquema recién bosquejado si definimos el operador L como sigue:
A fin de que nuestras funciones básicas tengan dos derivadas continuas, sólo conside
En la figura 8.5 se muestra la gráfica de la función E. El lector debería verificar que B
ramos E-splines E} con k � 3. Para hacer más sencillas las cosas, tomemos k = 3. es en realidad unE-splines cúbico.
También, tomemos los nudos a distancias iguales: t;+1 - t¡ = h y usémoslos como pun
tos de colocación. Sea n el número de funciones básicas que utilizaremos (y el número
de coeficientes que hay que precisar). Para determinar n coeficientes debe haber un
total de n condiciones. En vista de que dos de estas condiciones corresponden a los
extremos del intervalo, a saber,
h = (b-a)/(n-3) (14) Al calcular (Lvj)(t¡) se necesitan la primera y la segunda derivadas de Vj. Estas
t¡ = a+(i- l)h (i = 0,±1,±2, ...) (15) derivadas se obtienen fácilmente de las ecuaciones (16) y (17). Un programa para la
computadora que lleve a la práctica el método de colocación haciendo uso de los E
Los nudos t¡ que están en [a, b] son a= t¡ , t2, ... , tn-2 = b (como se podrá comprobar). splines cúbicos deberá incluir algunos subprogramas para calcular B(t), B' (t) y B" (t).
Estos nudos son los puntos de colocación. Algunos nudos fuera del intervalo [a, b] son En tal caso, las componentes de la matriz (Lvj)(t;) se podrán calcular eficientemente.
necesarios para definir los E-splinesE]. La disposición de los nudos se muestra en la Esta matriz será en bandas, pues cada función Vj tiene un soporte pequeño. Cualquier
figura 8.4. rutina de propósito general que se destine para el uso productivo, deberá explotar la
dispersión de la matriz de los coeficientes.
a b
•
L¡
¡ ¡
L2 L¡
•
to
¡ ¡ 1
I¡ 11 /3
• •
ln-4 fn-3
¡ 1
ln-2 lit-{
•
tn
¡
t,, +i
• SERIE DE PROBLEMAS *8.10
<1. (a) Programe un código de propósito general para resolver con el método de colocación
problemas de valores en la frontera en dos puntos de la fonna:
Figura8.4.
u"(t) + p(t)u' + q(t)u(t) = w(t)
{
u(a) = a u(b) = �
¡
Los E-splines cúbicos de interés para nosotros son aquellos que no son idéntica El usuario deberá especificar: (i) las funciones p, q y w; (ii) los números reales a, a, b y �
mente cero en [a, b]. Éstos sonE:2, B:1 , B5, By, ... , B!_3 . En conformidad, definimos con a < b;, (iii) n, el número de funciones básicas que se van a utilizar; (iv) las funciones
Vj = BJ_3 para 1 ;;íj ;;í n. básicas v; y sus derivadas vf, v;'. El programa deberá generar los n -2 puntos de colocación
En vista de que los nudos están separados por distancias iguales, las funciones Vj t¡ para 1 � i � n - 2 con un espaciamiento uniforme en el intervalo [a, b], incluyendo
los extremos. Después, formará un sistema de ecuaciones lineales de n ecuaciones con n
se pueden obtener a partir de un soloE-spline que denotamos con B y definimos de la incógnitas c1, c2, ... , c. como sigue:
t
siguiente manera:
(t + 2)3 /6 en[-2,-1]
c¡(Lv¡)(t;) = w(t;)
. .
(1 � i � n - 2)
[1 + 3(t + 1) + 3(t + 1)2 - 3(t + 1)3]/6 en [-1,0]
B(t) = ¡ (16) ¡=!
B(-t) en [O, 2]
o en otra parte. ¿ c v¡(a) = a ¿ c¡v¡(b) = �-
1
1=! 1=!
Entonces, como se puede verificar fácilmente,
(t-z
vj(t) = B -- -j + 2
) (17)
En este punto, para calcular los coeficientes e¡ el programa podrá llamar a otro programa que
resuelva sistemas de ecuaciones lineales. Por último, la solución aproximada u = I:;=I c¡v¡
h
se pondrá a prueba evaluando u y el residuo Lu-w en 2n-5 puntos uniformemente espaciados
572 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuaciones diferenciales lineales 573
en [a, b]. Éstos últimos incluirán los puntos de colocación (en donde los residuos deben ser TEOREMA 2 Si una matriz de n x n tiene un conjunto de vectores propios V ¡ , V2 , ..• , v. linealmente
cero), así como los puntos medios entre los puntos de colocación consecutivos. independientes, con AV; = l;V;, entonces el espacio de soluciones de la ecuación
(b) Ponga a prueba el programa escrito en la parte (a) resolviendo X' = AX tiene una base X; = t-11 V; con 1 � i � n.
u"+ (sen t)u' + (r + 2)u = e'-
3
{
u(2.6) = 7 u(5.l) = -3. Demostración El conjunto {X1,X2, ...,X.} es linealmente independiente, pues de I;;=I c;X; = O se
infiere que I;;=I c;t-"Vi = O, c;i!-11 = O y c; = O para 1 � i � n.
Utilice E-splines cúbicos con nudos uniformemente espaciados. Los puntos de colocación Para demostrar que el conjunto considerado genera al espacio de soluciones de
deberían ser los nudos en [a, b].
X' = AX, considérese una solución arbitraria X. Como elemento de 1.n o en, el vector
de valores inicialesX(O) es una combinación lineal de V¡ , V2, • • • , Vn , digamos:
*8.11 Ecuaciones diferenciales lineales
X(O) = L= C¡ V¡,
{
Consideramos ahora sistemas de ecuaciones diferenciales lineales con coeficientes cons i l
(n )
tantes. Los sistemas se supone que son autónomos, lo cual significa que la variable inde Sea Y= I;;= I c;X¡. En tal caso:
pendiente t no está presente explícitamente. Tales sistemas tienen el siguiente aspecto:
n n n
x; = a11X1 + a12X2 + ... + a¡nXn Y'= ¿c;Xf = ¿c;l;l11 V¡ = ¿c;l¡1AV¡=A ¿c;X; =AY.
XÍ = az¡X¡ + a22x2 + ... + a2nxn i=l i=l i=l i=I
(1)
De esta manera, tanto X como Y son soluciones de la ecuación diferencial, y ambos
x� = a.¡x¡ + a.2x2 + ... + aMxn tienen el mismo valor inicial: Y(O) = X(O). (¿Por qué razón?) Por el teorema de
unicidad para el problema de valor inicial, concluimos que Y = X o, en otras palabras,
En notación vectorial y matricial esto simplemente es:
que X= I;;=l c;X;. 1111
X'=AX; (2)
Si A tiene la propiedad que se menciona en el teorema 2, entonces hay una matriz
donde X = (x1, Xz, ... , x.l y X' = (X¡, x�, ..., x�l. no singular P, cuyas columnas son los vectores V¡, V2, . • . , v•. Al traducir la ecuación
AV¡ = A¡ V¡ a la notación matricial obtenemos lo siguiente:
Valores y vectores propios AP=PA (4)
Tratemos de resolver este sistema con un vector de laformaX(t) = t-1 V, donde V
es un vector constante. Al sustituir esta solución tentativa en la ecuación (2), obtenemos: en donde A es la matriz diagonal con los valores 1 1 , 12, • . • , An sobre la diagonal.
Considere el cambio de variables (dependientes) descrito por X= PY. Como Pes no
'}..!1 V = ;tAV. (3) singular, podemos recuperar Y a partir de X. Ahora bien, el vector Y tiene las siguientes
propiedades:
Por consiguiente, si Y'= p- 1x' = p- 1 AX = p- 1APY = AY. (5)
AV=AV,
entonces la función vectorial t- V es en realidad una solución de la ecuación (2). Hemos
1 Por esto, la ecuación diferencial para Y es mucho más fácil de resolver que la que
corresponde a X, pues A es una matriz diagonal. Las ecuaciones individuales en el
demostrado lo siguiente:
sistema Y' = AY no están enlazadas, y se pueden resolver por separado.
TEOREMA 1 Si'}.. es un valor propio de la matriz Ay si V es el correspondiente vector propio, entonces
X(t) = t-1 V es una solución de la ecuación X' = AX. Ejemplo 1 Resuelva el problema de valor inicial X' = AX cuando
l l
[fl.
o
El teorema 1 indica que para resolver la ecuación diferencial X' = AX, debemos
tener algún conocimiento de los valores y vectores propios de A. Es más, la teoría acerca
A= O [ O O
O -1
] X(O) =
O
de las matrices similares nos mostrará cómo simplificar un sistema de ecuaciones dife
renciales lineales por medio de un cambio de variables. Nos ocuparemos de inmediato Respuesta La matriz A - U es
de estas cuestiones. 1-1 O 1
En el siguiente teorema se describe la mejor situación posible respecto de la ecuación [ o -/1, o ]'
X'=AX. O O -1-A
574 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuaciones diferenciales lineales 575
y su determinante es el polinomio característico de A: Para cerciorarnos de que la serie correspondiente a eA converge, tomemos cualquier
norma en en y utilicemos la norma matricial subordinada para matrices de n x n corres
(1 - 11,)(-11,)(-l - A.). pondiente. El resto de nuestra serie se puede estimar como sigue:
Las raíces del polinomio son los valores propios de A, y son 7,..1 = 1, 7,..2 = O y 7,..3 = -1.
Para cada uno de ellos podemos encontrar un vector propio resolviendo la ecuación 1/�fiA ll � �fiiiA ll � �fiiiAIJk (8)
k k
AV¡ = A.¡ V¡. Al tomar estos vectores como columnas de la matriz P obtenemos:
La última expresión es el resto de la serie exponencial ordinaria cuando z = IIA 11- Así,
[i
O 1]
= 1 O . el resto de la serie correspondiente a eA converge a O cuando m -+ oo. (Este argumento
P O -2 supone conocida la completitud del espacio de matrices den x n con la norma que se ha
especificado.)
Después encontramos que Si tes una variable real, entonces tA=At, y nuestra definición da como resultado:
l]6 . f
-1 =
[i
o
1 ¿11 = fAk. (9)
p o -! k=O
Si Y=( y1, y2, y3/, entonces el problema de valor inicial para Y es Y' = AY donde La derivación de la serie con respecto a t y la subsiguiente simplificación nos dan:
º]
[i :!_¿11 =A¿\t. (10)
o
A=P-1A = o o . dt
P O -1
TEOREMA 3 La solución del problema de valor inicial
Por consiguiente, tenemos que
X' =AX
Y =y
[J],
{
X(O) prescrita
Yi = o¡ Y(O)=P-1X(O)=
es X(t) = ¿\tX(O).
{Y3Í = -y3
y su solución es Demostración Con base en la fórmula X= eA1 W, con W = X(O), tenemos de inmediato que
Y1 = 8/ Y2 = 7 Y3 = -3e-t.
{X' =AeA1 W =AX
Como X=PY, la solución correspondiente para X=(xi, x2, x3l es 11
X(O)=eAº W = W.
8/ - 3e-1 X2= 7 X3 = 6e- •
1 11
Matrices diagonales y diagonalizables
X¡=
Exponencial de nna matriz Para que el resultado precedente sea práctico es necesario que el exponencial de la
Hay un método muy elegante para resolver sistemas de la forma X' =AX. Este matriz se pueda calcular de manera eficiente. Analicemos primero el caso en que la matriz
método hace innecesaria toda referencia a los valores propios de A hasta el momento de A es diagonal. Si A =diag(A. , A.2, ..., A.n), entonces Ak= diag(7,..f, :i..t ..., A.!), como se
calcular las soluciones numéricamente. Comenzamos por definir la exponencial de una ¡ consiguiente, para una A con tales características,
puede verificar fácilmente. Por
matriz.
At
e- ¿ k! di•ag(7,..k1 , �k, ••• , :i..k.)
= �f
Definición Si A es una matriz cuadrada, escribimos: k=O
¿\=I+A+ tiA2 + f!A3 +···. (6) = diag(e" 11, ?21, ••• , i•1). (11)
Esta definición se origina al sustituir la variable compleja z por una matriz en la serie En este caso especial, la solución de la ecuación diferencial X' = AX tiene como
estándar componentes:
e4= 1 +z+ + J¡ t + . ...
tiz2 (7) X¡(t) = e"1 X¡(Ü) (1 � i � n).
1
576 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuaciones diferenciales lineales 577
El análisis que acabamos de presentar es extensible sin más al caso en que A no Un bloque de Jordan se puede escribir en la forma:
es diagonal, sino diagonalizable. Esto último significa que A es semejante a una matriz
diagonal; es decir, que hay una matriz diagonal A y una matriz no singular P tales que J('J., k) = 'J.h +Hk, (13)
P- 1AP = A. Si esto es verdad, el cambio de variable X= PY transforma la ecuación
diferencial X' = AX en Y' = AY, tal como se muestra en la ecuación (5). La condición donde Ik denota a la matriz identidad de k x k , y Hk denota a una matriz de k x k de la
inicial X(O) se convierte en Y(O) = P- 1 X(O) y la solución es: forma:
O 1 O O O O
W'l
El resultado de multiplicar un vector por Hk es fácil de ver. Tenemos:
�2
A. O 1 O ··· 00
](A., 3) = [O "-1 O] Ü Ü �2 �3
](�2) = [� 1 . O O 1
o o A. Ü Ü �3 �4
�]
o o o
l
=
: ·
(15)
Ü iJ �k�I
Consideremos con detenimiento J(A., 3). Ya que la matriz es triangular superior, sus /
o o o J
�k
valores propios son los elementos sobre la diagonal. En consecuencia, su único valor �k
propio es A., y al escribir en forma completa la ecuación J(A., 3)X = U tenemos: o o o o o o
Es evidente que Hf V = O, pues cada aplicación de Hk a V elimina una componente. De
A.X¡ +X2 = A.X¡ esta manera Hk es nilpotente; en efecto, Hf = O. Este hecho es de utilidad al calcular
e41 cuando A es un bloque de Jordan. Tenemos:
{ A.X2+X3 = A.X2
A.X3 = A.X3. e()J,+H,)t = /!..l,�,t
( t ) (tH )j
Esto implica claramente que x2 = x3 = O y que la única solución es de la forma = � 'J. .lk j � . k
L., , j=O L., J.,
X=$, O, Oi. Esta solución forma un espacio unidimensional. En otras palabras, los j=O J.
vectores propios de ](A., 3) generan un espacio unidimensional en JR3 o en IC3• Para t2 ¡k-1
=i!1 [Ik +tHk + Hf+···+ - Ht 1] (16)
cada k � 2 hay matrices de la forma J(A., k), y todas ellas tienen la propiedad que hemos zi. (k l)!
observado en el caso de ](A., 3). Estas matrices se llaman bloques de Jordan. El teorema
más importante al respecto es el siguiente: La serie concluye como se muestra, debido a que la k-ésima potencia de H (al igual
k
que las potencias subsiguientes) son O. Observe que en el cálculo precedente hemos
utilizado un caso válido de la fórmula ¿\+B = e4 e9. (Véase el Prob. 13.)
TEOREMA 4 Toda matriz cuadrada es semejante a una matriz diagonal por bloques que tiene bloques
de lardan sobre la diagonal.
Resolvamos ahora la ecuación diferencial X' = AX cuando A es un bloque de
Jordan, digamos A = '}.Jk + Hk. La solución se obtiene aplicando el teorema 3 y la
ecuación (16); ésta es:
[
La forma especial que se menciona en el teorema se llama forma canónica de
Jordan de la matriz. He aquí algunos ejemplos de matrices de 3 x 3 en su forma 2 ¡k 1
X(t) = e'1tX(O) = it h +tHk + t Hk +· · ·+ _- Hk- X(O).
¡]
canónica de Jordan: zi. (17)
º] º]
l)! k
º] º]
(k
7 O
[O 5 O
5 1
[O 5 O
º] [5O 5O 1
o 1
[o o o [5O 51 1 . Ejemplo 2 Resuelva el problema de valor inicial X' =AX cuando
º ] �O) =
O O 3 O O 3 O O 5 o o o O O 5 3 1 o
O 3 1 O
A= [o o 3 1
La primera de estas matrices tiene tres bloques de Jordan, mientras que la segunda, la
tercera y la cuarta tienen dos. La quinta de ellas es en sí misma un bloque de Jordan. o o O 3 [!]
578 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuáciones diferenciales lineales 579
Respuesta La matriz A es de la forma 3I4 + H4. La solución, dada por la ecuación (17), es Ejemplo 3 Utilizando la anterior matriz C, resuelva el problema de valor inicial Y' = CY con las
1 l
condiciones iniciales Y(O) = (3, 2, 8, 4, ll.
X(t) = e31 (l + tH4 + !t2H¡ + it3H¡)X(O) Respuesta Los dos sistemas no enlazados son
º] [y¡]
=?[í]+.,[i]+wm+wm
7 +5t + I.5t2 +1.5t3
mi=¡¡
1
5 1
O 5
Y2
YJ
valor inicial [n
X = PY nos lleva a la ecuación diferencial Y' = CY. (En relación con esto vea la En la teoría de la ecuación diferencial X' =AX, la exponencial e41 se conoce como
ecuación (5) más arriba.) Esta ecuación diferencial, Y' = CY, se puede dividir en matriz fundamental de la ecuación. Hemos visto que dicha exponencial es la clave para
º]
bloques no empalmados. Para ver esto, considere un ejemplo como: resolver el problema de valor inicial asociado con la ecuación diferencial. Si contamos
[i
con la forma canónica de Jordan C de A y conocemos la transformación de semejanza
1 O O
5 1 O O
P- 1AP= C,
C= O 5 O O
O O 7 1
podemos entonces cambiar las variables por X = PY, resolver la ecuación Y' = CY y
O O O 7
regresar a X, obteniendo finalmente:
Las ecuaciones diferenciales son: X= PY = Pé1Y(O) = Pec1P- 1X(O). (18)
y¡= 5y¡ +Y2 Por otra parte, conocemos otra forma de la solución,a saber,X = e41 X(O). Al comparar
y�= 5yz +y3 esta solución con la ecuación (1 8), concluimos:
y�= 5y
3 ¿.1 = PeCtp-1.
y�= 7y4+y5
y�= 7y5 Esto se puede ver como una manera de calcular la matriz fundamental.
Está claro que el grupo formado por las tres primeras ecuaciones se puede resolver por
separado, al igual que el grupo formado por las dos últimas. El caso general es análogo a Problema no homogéneo
éste, pudiéndose ver que cada bloque de Jordan en C da lugar a un conjunto de ecuaciones Los principios que hemos establecido se pueden aplicar al problema no homogéneo
diferenciales que no se enlaza con las ecuaciones restantes. Con cada bloque de Jordan
se obtiene parte de la solución, como en la ecuación (17). X' =AX+W, (19)
580 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuaciones diferenciales lineales 581
donde W puede ser una función vectorial de t. Consideremos en primer lugar el caso en Respuesta Las ecuaciones individuales son
que A es diagonalizable. En esta situación una transformación de semejanza p- 1AP=A
produce una matriz diagonal A. El cambio de variable X=PY transforma la ecuación x; =5x1 +x2+t2
(19) en �=5x2+x3+t
Y'=AY+P- 1 W. (20)
x� =5x3 + sent
Éste es un conjunto de n ecuaciones no enlazadas, de las cuales un caso típico tendría la
forma: El procedimiento que aquí se recomienda para resol ver las ecuaciones es comenzar por
L
r¡\t)=1..r¡(t)+g(t). (21) abajo siguiendo un orden inverso. Esto da como resultado:
L
5
1 51 5
e-i.sg(s) ds]. = (9+ 1
r¡(t)= ¿., [ri(O)+ (22) - sent- cost
L
26 ) e 26 26
º] [fl
t2 1 10
= (7+ - ) e51+1 9+ 1 te51
A= [oO o1 O w- [ t ] X(O)= 25 262 3: ( 26)
O O 2 sent 2 1 -1
+-( 12 sent+t cost)- -t-
l
262 5 25
Respuesta El sistema comprende las siguientes ecuaciones individuales no enlazadas:
{
X¡ (t)= e51 5+ e- 5'[x2(s)+s2 ] ds}
x; =t2
� =x2+t = (5+-
74 51
263)
1
e + 7+ - - - (lQ ,1 1
25 262 )
te- + - 9+ - r
1 .2 51
2 ( 26)
e
Xj =2x3 +sent 2 1 1
- -( 55 sent+37 cost)- -t2- - t 11
263 5 25
Las soluciones, obtenidas con la ayuda de la ecuación (22), son
El cómputo de la exponencial de matriz e4 es una tarea que se debería abordar con
pleno conocimiento de los escollos posibles. Recomendamos al lector el artículo de Mo
X¡(t)=5+ ls2ds=5+ft3 ler y van Loan [1978]. Su investigación indica que el siguiente procedimiento de cuatro
pasos debe dar buenos resultados en la mayoría de los casos:
x2 (t)=e'[7+ Le-'sds] =8e'-t-l ( i) Sea j el primer entero positivo tal que IIA11 /'i � 1/2.
l
( ii) Si se da un margen de tolerancia e para el error relativo, elija como p al primer
entero positivo tal que 2P-3 ( p+1) � 1/ e.
x3 (t)= e21 [9 + !
e- 2s sens ds] = �e21 - � sen t - cos t 11111
( iii) Compute e-4/2; con base en la serie de Taylor truncada rf= ¿�=O l/k !.
( iv) Eleve al cuadradoj veces el valor ¿!/zi computado en el paso ( iii), hasta obtener
Si en la ecuación X'=AX+ W la matriz A no es diagonalizable, podemos utilizar e4 = (eAfzi/
la forma canónica de Jordan y un cambio de variables para dividir el problema en El valor calculado para e4 en el paso ( iv) es ¿\+E, donde E es una matriz que satisface la
subsistemas no enlazados. De este modo, basta con ejemplificar el procedimiento con desigualdad IIEII/IIAII � e. Esta conclusión es el corolario 1 de la referencia citada.
un único bloque de Jordan.
SERIE DE PROBLEMAS *8.11
Ejemplo 5 Resuelva la ecuación X'=AX+ W cuando
1. Encuentre la solución general del sistema X'=AX cuando
5 1
A= [O 5 1
O O 5
º] w- [ t2 ]
t
sent
X(O)= [;] A= [-i � -t].
3 O 1
582 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.12 Ecuaciones rígidas 583
2. (Continuación) Encuentre la solución de la ecuación en el problema I sujetándose a la 19. Haga una suposición en cuanto a la matriz inversa der! y entonces demuestre que usted está
condición inicial Xo = (-1, 4, 7/. en lo correcto. Advertencia: En general, ¡+a ;=r! e8.
· [ J"
3. Encuentre la solución general del sistema 20. Resuelva X'= AX cuando
A= -1 4O -33]
x\ = 3x1 -5x2 5
y X(O) = [ 51 .
xf = 2x1 +x2. 1 -2 1 3
4. Demuestre que para toda matriz A den x n,r! es no singular. Advertencia: No suponga que 21. Concluya el ejemplo 4.
/•0 =r!I para todas las matrices A y B den x n. (Véase el siguiente problema.)
+B
22. Demuestre que toda matriz que no es diagonalizable es el límite de una sucesión de matrices
5. Demuestre con un ejemplo que / = r!I no siempre es cierto. diagonalizables.
1
6. Demuestre que si A=p- BP, entoncesr! = p-1/P. 23. (Continuación) Considere un sistema lineal X' = AX, X(O) = V, en donde A no es
7. Demuestre con detalle cómo se utilizan la estimación en la ecuación (8) y un argumento de diagonalizable. Si B es una matriz diagonalizable próxima a A, ¿qué se puede decir acerca
completitud para determinar la convergencia en la ecuación (6). de la solución de Y' = BY, Y(O) = V?
8. Utilice inducción sobre k para demostrar que si V¡, V2, ... , Vk son vectores propios correspon 24. Demuestre que detr! = e"A, donde A es una matriz den x n y tr A es la traza de A, es decir,
dientes a k valores propios distintos de una matriz, entonces{Vi, V1, ..., Vk} es linealmente la suma de los elementos sobre la diagonal de A.
independiente. 25. Para una matriz A den x n, sea [Al = I;;=t I:;= 1 iaifl· Demuestre que [r![ ;i; n - I+e lAI .
9. Demuestre la ecuación (10) derivando la serie parar!'.
26. Aunque en general leª ;= /•0, lo que sí se cumple es quer!•0= Iim,_00 ¡/lkeB/kf
10. Utilice el resultado del problema 6 para demostrar directamente el resultado de la ecuación
(12), es decir, sin hacer un cambio de variable.
11. Sea B una matriz den x n y sean V¡, V2, ... , Vk vectores de lR" tales que V¡ ;= O, BV¡ = O,
BV2 = V¡, ...,BVk = Vk-1· Utilice inducción sobrekpara demostrar que{V1, V1, ..., Vk} 8.12 Ecuaciones rígidas
es linealmente independiente. ¿Qué tan gr-ande puede ser k?
12. Encuentre las condiciones exactas que debe cumplir una matriz de orden 2 a fin de que su En un sistema de ecuaciones diferenciales ordinarias la rigidez está relacionada con una
forma canónica de Jordan tenga sólo un bloque de Jordan.
fuerte disparidad entre las escalas temporales de las componentes del vector solución.
13. Demueste quer!•0 =r! e8 si y sólo si AB = BA. (Véase el Prob. 5.) Algunos procedimientos numéricos que en general funcionan satisfactoriamente, cuando
14. Demuestre que si A y B son diagonalizadas por la misma transformación de semejanza (es se usan para tratar ecuaciones rígidas, muestran una eficiencia muy raquítica. Esto sucede
decir, PAP- 1 y PBP- 1 son diagonales), entoncesAB = BA. cuando la estabilidad en la solución numérica se logra únicamente con una longitud de
paso muy pequeña.
15. Demuestre que la solución del sistema lineal
Las ecuaciones rígidas surgen en una amplia variedad de situaciones. Por ejemplo,
X'=AX+ V(t) X(O) = W al controlar un vehículo espacial se espera que la trayectoria no tenga alteraciones brus
cas, pero, en caso de que se detecten desviaciones respecto de la trayectoria de vuelo
l
está dada por programada, de inmediato se puede hacer las correcciones necesarias. Otro sitio donde
X(t)=i'W+i' e-AsV(s)dl- aparecen estos problemas es en el monitoreo de procesos químicos, donde puede ha
ber una gran diversidad de escalas de tiempo para los cambios físicos y químicos que
.t:lxplique qué se quiere significar con la integración indefinida que aquí aparece. tienen lugar. En la teoría de circuitos eléctricos los problemas rígidos surgen debido a
que, sobre el comportamiento generalmente suave del circuito, se pueden superponer
16. ¿Cuál es la solución del problema de valor inicial X'= AX cuando X se ha especificado en
un punto to diferente de O? transitorias con escalas de tiempo del orden de un microsegundo.
17. Demuestre que la matriz fundamental para el sistema
Método de Euler
X'=AX con A=[-� J] Usando el método de Euler en un sencillo problema modelo se pueden ejemplificar
las dificultades numéricas que comúnmente aparecen. El método de Euler es el método
es
1 2e-41+3e' -6e-41+6e' de Taylor de orden 1, y para el problema de valor inicial
5[ -e- 41+e' 3e-4t+2e'] ·
{x1 =J(t,x)
18. Demuestre que laj-ésima columna de la matriz fundamental es una solución del problema (1)
de valor inicial X' = AX, X(O) = [lj, donde U¡ es elj-ésimo vector unitario estándar. x(to) = xo
584 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.12 Ecuaciones rígidas 585
Las desigualdades que aparecen en (16) resultan equivalentes a la condición En este caso el decaimiento exponencial corresponde a µ < O. Para que el método
multipaso se comporte adecuadamente en dichos problemas, nos gustaría que las raíces
0 < h < -2/(<H �), de$ se encontraran en el interior del disco unitario, siempre que suceda que h > o y
'Re(').,) < O. Esta propiedad se llama A-estabilidad.
en vista de que a. < � < O. Para ver lo que puede suceder, suponga que a. =-20 y que El método de Euler implícito que aparece en la ecuación (7) es A-estable, tal como
� = -19. Nuestras soluciones resultarán entonces combinaciones de e -391 y e -1• La se muestra en la ecuación (11). El método del trapecio implícito, definido mediante
primera de éstas es una función transitoria, que después de un corto intervalo de tiempo
es despreciable si se compara con e -1• Aun así, es un hecho que la transitoria controlará Xn - Xn -1 = !h(fn +fn_¡) (23)
la longitud de paso permitible a lo largo de toda la solución numérica.
también es A-estable, debido a que el polinomio es
Métodos multipaso lineales. Caso general
$(z) = z - I - '},.,h(f z+f ),
Examinemos el método multipaso lineal de la sección 8.5 en el caso general. Nues
tro fin es averiguar qué propiedades adicionales debe tener para que funcione satisfac y su raíz es z = (2 +Ah)/(2 - Ah); fácilmente vemos que cuando h > O y 'Re('},.,) < O,
toriamente en el caso de nuestra ecuación de prueba (3). El método general adopta la esta raíz está dentro del disco unitario.
forma: Un teorema importante, demostrado por Dahlquist (1963], señala que un método
multipaso lineal A-estable debe ser un método implícito, y que su orden no puede ser
akXn+ak-!Xn -l + · · ·+ aoXn-k = h(bdn+bk-!Ín-1+ · · ·+ bofn-k). (17) mayor que dos. Este resultado impone una restricción severa sobre los métodos A
estables. Con frecuencia la regla del trapecio implícita se usa en los casos de ecuaciones
Cuando ésta se usa en el problema de prueba obtenemos: rígidas debido a que presenta el mínimo error de truncamiento entre todos los métodos
multipaso lineales y A-estables.
akXn+ªk-!Xn -1+ · · · +aoXn-k = hA.(bkXn +bk-!Xn -1+ · · · +boXn -k). (18)
Región de estabilidad absoluta
De este modo nuestra solución numérica resolverá la ecuación en diferencias lineal
homogénea: Todo método multipaso posee una región de estabilidad absoluta. Ésta es el con
junto de números complejos ro tales que las raíces de p - roq se encuentran en el interior
(ak - Mbk)xn + (ak-1 - h').,bk-l)xn-1 +...+ (ao - hA.bo) Xn -k = o. (19) del disco unitario. De las discusiones anteriores se concluye que un método funcionará
adecuadamente en un problema de prueba x = AX si ').,h se encuentra en la región de
Las soluciones de esta ecuación serán combinaciones de ciertas soluciones básicas del estabilidad absoluta. También nos damos cuenta de que un método es A-estable si y sólo
tipo Xn = r", donde r es una raíz del polinomio si su región de estabilidad absoluta incluye la mitad izquierda del plano.
$(z) = (ak - hA.bk)t +(ak-1 - hA.bk-1)/-1+ · · ·+ (ao - hAbo). (20) Ejemplo ¿Cuál es la región de estabilidad absoluta para el método de Euler?
Dése cuenta de que el polinomio definido en la ecuación (20) es de la forma$ = p- '},.,hq, Respuesta El método de Euler se define mediante la ecuación
donde p y q son los polinomios que resultaron útiles en la sección 8.5, a saber,
Xn - Xn -1 = hfn -1·
p(z)=akt+ªk-1!-1+ · · ·+a1z+ao (21)
Por lo tanto, p(z) = z - 1, q(z) = 1 y $(z)= z - I - ro, donde ro= Ah. Ahora la raíz
q(z) = bkt+bk-1!-1 + · · ·+b1z+bo (22) de$ es z = I +ro. Para que todas las raíces de$ queden en el interior del disco unitario
necesitamos que I +ro < 1. Éste es el disco de radio uno en el plano complejo con
f f
centro en -1. 11
A-Estabilidad
Si A < O en el problema de prueba (3), la solución decae exponencialmente. Para En vista de que la A-estabilidad es una restricción muy severa, aun cuando los
que la solución numérica obtenida a partir del método multipaso planteado en la ecuación métodos no posean esta propiedad, se siguen utilizando en problemas rígidos. Una
(17) refleje este comportamiento es necesario que todas las raíces del polinomio$ en la vez hecho esto tenemos la esperanza de que ro = ').,h se encuentre en la región de
ecuación (20) se encuentren en el disco Jz[ < l. Para valores complejos de A, digamos estabilidad absoluta correspondiente al método. La cantidad ').., está asociada con la
A=µ+iv, la solución del problema de prueba es: ecuación diferencial que se está resolviendo. Para el caso de una sola ecuación lineal, A
es el coeficiente de x en la ecuación. Para una sola ecuación no lineal, A puede ser una
x(t)= e M = e µ'e ivt= e µ'(cosvt+i senvt). constante que surge de aproximar localmente a la ecuación mediante una ecuación lineal.
588 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias
8.12 Ecuaciones rígidas 589
Para un sistema de ecuaciones lineales, digamos X' = AX, 11. puede ser cualquiera de '4. Ponga a prueba el método del punto medio implícito
los valores propios de A. Por ello la cantidad que consiste en h veces cada valor propio
de A deberá encontrarse en la región de estabilidad absoluta del método que se utiliza Xn - Xn-1 = hf(tn-1 + !h, !(xn+Xn-1)),
En el caso de sistemas de ecuaciones no lineales podemos considerar la posibilidad
de aproximar localmente el sistema dado mediante sistemas lineales y el uso de los aplicándolo a la ecuación x' = A.X, con 71. < O, a fin de determinar si su desempeño frente a
criterios anteriores. Usualmente esta idea es imposible de llevar a cabo, y por ende la problemas rígidos será el adecuado.
única estrategia confiable para el caso de problemas rígidos difíciles consiste en recurrir 5. Determine si el siguiente problema es rígido:
a la regla del trapecio. Algunos de los mejores códigos en uso para el problema de
valor inicial se esfuerzan por detectar la rigidez a lo largo de los pasos que conducen a {x" = -20x' - I9x
la solución, y procuran además emprender alguna acción adecuada cuando aparece la x(O) = 2 x'(O) = -20.
rigidez. Para tener más detalles, el lector puede consultar a Gear [1971], Shampine y
Allen [1973], y Shampine y Gordon (1975]. En general los métodos de orden superior 6. Considere el método multipaso
poseen regiones más pequeñas de estabilidad absoluta, y ante la presencia de la rigidez,
estos códigos adaptativos ceden ante métodos de orden inferior que poseen regiones de Xn+ClXn-1 - (1+a)Xn-2 = kh[-af,, +(4+3alfn -il,
estabilidad absoluta más favorables. Determine a de manera que el método sea estable, consistente, convergente, A-estable y de
segundo orden.
Ecuaciones no lineales 7. Verifique que las ecuaciones (15) generan la solución de las ecuaciones (14).
Con el fin de apreciar la relevancia de las consideraciones anteriores en lo que toca a 8. Encuentre la región de estabilidad absoluta de la regla del trapecio implícita que se define
los sistemas de ecuaciones no lineales, centremos nuestra atención en un sistema típico, en la ecuación (23).
que suponemos autónomo: 9. Cierta reacción química se describe mediante ei siguiente sistema rígido:
X'= F(X'). 2
( 4)
x; = -I000x1 +x2 X¡(O) = 1
En este caso X es una función vectorial de t que tiene n funciones componentes x1, {
x2, .•• , x•. En el lado derecho de la ecuación se tiene una función F: lR" -+ lR". Esta xf = lOOOx1 - 2x2 x2(0) = O.
función tiene funciones componentes, que denotamos conf¡. La matriz jacobiana de
Fes la matriz J = (lij) con lij = 8f¡/axj . En un punto Xo la forma linealizada de la
Demuestre que x1 decae rápidamente mientras que x2 decae lentamente. Dicho sistema es
difícil de resolver debido a que es necesario utilizar una longitud de paso muy pequeña.
ecuación ( 2 4)es: ro. Demuestre que las dos relaciones de desigualdad (16) son equivalentes aO < h < -2/(a+�)
X' = F(Xo)+ J(Xí;)(X - Xo), (25) en el caso en que a < � < O.
donde J(Xo) indica el valor de J en X0• La ecuación (25) es una ecuación diferencial
lineal y los valores propios de la matriz J(Xo) juegan un papel en la teoría. Si resulta
que la ecuación (24) es rígida en la vecindad de Xí;, estos valores propios satisfacen las
desigualdades:
'R.e(A.¡) � 'R..eA.( 2) � • • • � 'R.eA.( n) < O
y 'R..e(11.1 ) es mucho más pequeña que 'R.e(11..).
Si un método multipaso va a funcionar adecuadamente en dicho tipo de problema,
entonces h11.1 deberá estar en la región de estabilidad absoluta de dicho método. Si las
11.1 fueran conocidas, dicha información podría utilizarse para elegir apropiadamente el
valor de h.
SOLUCIÓN NUMÉRICA DE
ECUACIONES DIFERENCIALES PARCIALES
Ecuación de calor
Una ecuación de este tipo es la ecuación de calor, también conocida como ecuación
de difusión. Si se eligen adecuadamente las unidades para las cantidades físicas, la
ecuación de calor tendrá la siguiente forma:
U:a; + Uyy + Uzz = u,. (1)
591
592 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales
9.1 Ecuaciones parabólicas: Método
s expl ícitos 593
(x, y, z. t) lo denotamos con u(x, y, z, t). Por lo tanto u es una función real de cuatro Método de diferencias finitas
variables reales.
Al igual que en la teoría de ecuaciones diferenciales ordinarias, un problema físico Una de las estrategias más importantes para reso
lver numéricamente problemas
planteado adecuadamente nunca consta de sólo una ecuación diferencial parcial; debe como el que aparece en (2) es usar el método
de diferencias finitas. En su primera
etapa consiste en discretizar el dominio de la mane
{
haber además un número suficiente de condiciones en la frontera para poder determinar ra siguiente:
una solución única del problema. A continuación tomamos como problema modelo
la ecuación de calor (1) en su versión unidimensional, junto con algunas condiciones � =jk j � o
{
auxiliares: x; = ih O��
i n+l (3)
U = U1
,:x (t � Ü Ü $ X $ 1)
u(.x, O)= g(x) (O� x�1) Las variables t y x tienen diferentes longitudes de paso, denotadas por k y h, respecti
(2) vamente. En vista de que x recorre todo el intervalo [O, l ], sucede que h = 1/(n+1).
u(O, t) = a(t) (t � O)
Nuestro objetivo consiste en calcular soluciones aproximadas de la función solución u
u(l, t) = b(t) (t � 0). en los llamados puntos de la malla (xi,�).
El siguiente paso en este proceso es elegir algunas fórmulas sencillas para apro
El sistema (2) modela la distribución de temperatura en una barra de longitud uno, cuyos ximar las derivadas que aparecen en la ecuación diferencial. Algunas fórmulas básicas
extremos se mantienen a temperaturas a(t) y b(t) respectivamente (Véase la Fig. 9.1). familiares que se pueden utilizar son las siguientes:
Suponemos que las funciones g, a y b son datos del problema. Más aún, la función g
describe un perfil de temperatura inicial. La función u es una función de (.x, t); no existe 1
dependencia respecto de y o de z. La figura 9.2 muestra el dominio en el que se busca f/ (x) ¡:::: -¡/f(x+h) -f(x)]
(4)
conocer u(x, t); es un subconjunto del plano determinado por las variables x y t. 1
J'(x) ¡::,: Zh [f(x+h) -f(x -h)] (5)
-e )
1
J"(x) ¡:::: ¡;.[f(x+h) -2f(x)+f(x -h)] (6)
�X
Naturalmente, se cuenta con muchas otras fórmulas
como las anteriores, cada una de las
o cuales aporta diferente grado de precisión.
Acto seguido sustituimos el problema planteado en
2) por una versión discretizada
en la que se han utilizado las ecuaciones (4) y (6). En (
Figura 9.1 Barra de longitud uno. vista de que estos dos problemas
tendrán soluciones diferentes, usamos otra letra, para
v, el problema discreto:
1
¡;.[v(x+h, t) -2v(x, t)+v(x - h, t)] = 1k[v(.x, t+k) -v(x, t)].
(7)
Para simplificar la notación tomamosx = x; y t = t
j en la ecuación (7) y luego abreviamos
v(x;, tj) con Vif. El resultado es
a(t) b(t)
1 1
¡;.(V;+l,j - 2V¡j+V;-¡.j) = k(V4j+l -Vij). (8)
Cuando j = O en la ecuación (8), todos los términos que ahí aparecen son conocidos,
con excepción de V¡¡. De hecho, la distribución de la temperatura inicial, g, señala que
Vi,j+l inputn,k,M
h +- I/(n+ 1)
a(/) U;-t,j I U;,j V¡+t,j
b(I) S <- k/h 2
W¡ +- g(ih) (O� i � n+ 1)
t t- o
output O, t, (wo, W¡, ... , Wn+1)
forj = 1, 2, ... ,M do
X vo +- a(jk)
g(0
Vn+l +- b(jk)
Figura 9.3 Malla típica fori=1,2, ... ,ndo
V¡ <- SW;-¡ + (1-2s)w¡ + SW;+1
end
o usando la abreviatura s = k/h2, t t-jk
outputj, t, (vo, V¡, ... , Vn+i)
Vi.j+l = SVi-J,j + (1- 2s)vij + SVi+l,j (9) (w¡, w2, ..., Wn) <- (v¡, v2, ..., Vn)
end.
Mediante la ecuación (9) la solución numérica puede avanzar paso a paso en la
dirección t. En la figura 9.3 se presenta una muestra de un conjunto típico de cuatro puntos Por consiguiente,
de la malla que se incluyen en la ecuación (9). Dado que la ecuación (9) proporciona [Vtjl
explícitamente los nuevos valores vij+I en términos de los valores previos v;-t,j, Vij, Vzj
V;+1,j, el método basado en esta ecuación se llama método explícito. Yj = . . (10)
Es necesario enfatizar que aun si la computación de valores sucesivos de Vij se Vnj
lleva a cabo con absoluta precisión, la solución numérica diferirá de la solución analítica
La ecuación (9) se puede escribir como:
de la ecuación diferencial parcial. Esto se debe a que la función v es una solución de
un problema diferente, a saber, de la ecuación en diferencias análoga a la ecuación
diferencial. De hecho, debemos esperar una diferencia muy grande debido a la baja YJ+1 =A"Vj (11)
JJ
precisión de las fórmulas de aproximación que se utilizan en la diferenciación. en donde A es la matriz de n x n dada por
l-2s s o
Algoritmo s 1-2s s
El algoritmo para llevar a cabo los cómputos del método explícito anterior com A=I O s 1-2s (12)
prende dos etapas: inicio del proceso y solución. En este caso el número de puntos x; de
la malla en [O, 1 J es n+ 2, la longitud de paso en la variable t es k, y M es el número o o o
de pasos que se deben tomar en el eje t.
Se recomienda al lector que programe el algoritmo y que lleve a cabo los experi Observe que voj = Vn+I.j =O, ya que a(t) = b(t) =O. Por lo tanto cada línea horizontal
mentos numéricos descritos en el problema 1. Los experimentos de este tipo conducen a sólo incluye n valores desconocidos.
la conclusión de que no todos los pares de longitudes de paso (h, k) serán satisfactorios. Alcanzada esta etapa, el argumento puede continuar a lo largo de dos caminos
Un análisis posterior a la presentación del algoritmo mostrará porqué esto es cierto. diferentes. El primero depende del hecho físico de que la temperatura en la barra tenderá
Analizaremos el caso particular en que a(t) =b(t) = O. a cero conforme t -+ oo, debido a que los extremos se mantienen a temperatura cero.
596 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales
9.1 Ecuaciones parabólicas: Método
s explícitos 597
Debemos por lo tanto insistir en que la solución numérica también tienda a cero conforme donde B es la matriz de n x n
t--+ oo. Dado que V;+i =AV¡, resulta que:
Jj
[ 2 -1 O
V¡=AV;-1 =A2 V;-2=...=AÍVo
-1 2 -1
Según un teorema de la sección 4.6, las siguientes dos condiciones son equivalentes: B = O -1 2
(14)
(i) límj-co NV=O para todos los vectores V
(ii) p(A) < 1
o o o
Recuerde que p(A) es el radio espectral de la matriz A. Por lo tanto el parámetro s=k/h2 Los valores propios t...; de A se relacionan con los
valores propios µ; de B a través de la
deberá escogerse de manera que p(A) < l. ecuación
Se puede llegar a la misma conclusión sin recurrir al problema físico de la distribu
ción de temperatura. En su lugar se puede hacer el análisis de los errores de redondeo A.;=1 -sµ;.
que se producen durante el proceso de cómputo numérico. Suponga que en cierto paso Basta entonces con calcular los valores propios de B.
(podemos suponer que en el primero) se produce un error. Entonces, en lugar del vector
Vo tendremos una perturbación de dicho vector, llamémosla Yo. El método explícito
dará lugar a vectores V¡=Ai Yo, y el error en el j-és imo paso será: LEMA Sea x=(sen0, sen 02 , . .., sen 0n f. Si 0 =
jn/(n+1) , entonces x es un vector propio
de B que corresponde al valor propio 2- 2cos0.
V¡ -V¡=AÍVo -AiVo = AÍ(Vo -Yo)
Para asegurar que el error decaerá conforme j --+ oo debemos una vez más pedir que Demostración Sea Bg= 28ij -8;+1.j -8;-i,j, donde B = (Bg) y 8ij es la delta de Kronecker. Por lo
p(A) < l. tanto, si 2�i�n - 1, entonces
Más adelante se tocará el tema del cálculo de los va ol res propios. Por lo pronto
baste saber que los valores propios de A son n
A =l-sB
Bx=(2- 2cos0) x. 11
598 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.2 Ecuaciones parabólicas: Métodos implícitos 599
(Hemos usado j en lugar de i como el primer subíndice para que no se confunda con el s< l+cos;:;:¡
1t )-1 .
número complejo i =v-t.) Una vez que se ha hecho esto, mediante una elección ade
cuada de A., se examina el comportamiento de la solución conforme t -+ oo, o n -+ oo. Paran = 10, ¿qué valores de k resultan satisfactorios?
Obviamente, dicho comportamiento depende del factor rfnk = (t?-")n de la ecuación 3. Demuestre que la función
(15). Si lt?-" J > 1, esta solución no está acotada. Y como cualquier solución numé
¿
N
rica eventualmente se verá contaminada por todas las soluciones extrañas indeseables,
u(x, t) = Cn exp(-n2it2t) sen n1tX
esta solución no acotada terminará dominando a la solución verdadera, la cual decae
n=l
exponencialmente.
Procedemos ahora a analizar el método explícito dado por la ecuación (9). (Supo resuelve el problema de conducción de calor u"" = u, con las siguientes condiciones en la
nemos implícitamente que en este caso k > O.) Al sustituir la solución tentativa (15) en frontera:
{
la ecuación (9) obtenemos:
u(x, 0) = ¿ Cn sen n1tX
eiJJlh/n+l)U = se i(j-l)flhenU + (1 _ 2s) eiJJlhr+sei (j+l)flhenU.
u(O, t) = ��'. t) = O
Después de eliminar el factor e i1Jlhr, el resultado es: 4. Confirme que hacen falta aproximadamente 107 puntos de la malla para lograr la estabilidad
cuando h = 10-2 y O� t � I O. ¿Cuáles son los números correspondientes para el caso en
t?-" = se- i\lh+ 1- 2s+se i flh que h = 10-4 7
= 2scos �h+ 1- 2s
= 1- 2s(l - cos �h) 9.2 Ecuaciones parabólicas: Métodos implícitos
= 1-4s sen2 (�h/2) (16)
{
En esta sección continuamos nuestro estudio del problema modelo de la conducción de
Aquí hemos usado las muy conocidas igualdades: calor. Recuerde que
Dado que sen2 (�h/2) puede tomar valores cercanos a 1, para que se satisfaga la condición
¡;z[v(x h, t)- 2v(x, t) + v(x- h, t)] = ¡[v(x, t) - v(x, t - k)].
1 1
+ (2)
de estabilidad se necesita que s� 1/2.
600 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.2 Ecuaciones parabólicas: Métodos implícitos 601
Usando la notación planteada en la sección 9.1, la expresión anterior se transforma en: Dado que éstos evidentemente satisfacen la condición 1.; > 1, entonces los valores
propios de A-1 se encuentran en el intervalo (0, 1), y de ahí concluimos que el método
1 1
¡;z[v;+I.i -2 v¡¡ + v;- 1.¡] = k[vif - vi;¡-¡]. (3) propuesto es estable para todos los valores de h y de k. Este método en ocasiones se
llama método completamente implícito.
Esta ecuación parece diferir sólo superficialmente de la ecuación (7) de la sección 9.1,
pero de hecho requiere un tipo diferente de algoritmo para resolverse. Observe que tres Algoritmo
de los términos de la ecuación (3) hacen referencia a ven el nivelj(t) y sólo un término
hace referencia a v en el nivelj -1 (t -k). Si se conoce el valor de ven los puntos de Podemos ahora formular un seudocódigo que corresponda al método completa
la malla en el nivel j - 1, entonces los valores en el nivel} se pueden calcular a partir mente implícito. Este programa recurrirá a otras dos rutinas, una de las cuales propor
de la ecuación ( 3), pero sólo a través de resolver un sistema de ecuaciones. Por lo tanto ciona valores iniciales g(x). La otra rutina se llama TRI; su propósito es resolver un
reescribimos la ecuación (3) de la siguiente forma, usando s = k / h2: sistema tridiagonal de ecuaciones lineales. El seudocódigo proporcionado al final de la
sección 4.3 resulta adecuado en este caso. En dicha rutina los elementos diagonales se
-SVi-1,j+(1+2s)Vif - SVi+l,j = Vi,j-1 (1 � i � n). (4) etiquetan d¡, d2, ... , dn. Los elementos pertenecientes a la diagonal secundaria superior
son c1, c2, .•. , c._ 1, y los elementos de la diagonal secundaria inferior son a 1, a2, .•• ,
Al igual que antes, tome a Vj como el vector ª•-l. Los números del lado derecho son b1, b2, ... , bn, y X¡, x2, ... , x. representa la
solución. Por consiguiente:
Vz¡ TRI(n, a, d, e, b;x)
Vj = toma como entrada n, a, d, e, by da como salida el vector x. En este ejemplo se asignan
[VJjl
Vnj
valores constantes a los elementos a, d y c. En lugar de b usaremos los valores iniciales
v; = g(ih). La rutina TRI proporciona el siguiente valor del vector v, el cual sustituye
De este modo la ecuación (4) representa un sistema den ecuaciones que determinan el al valor previo. Las entradas diagonales d; sufren modificaciones durante el uso de la
vector Vj, suponiendo evidentemente que ya se conoce Y¡-1· Dicho sistema de ecuacio rutina TRI y deben por lo tanto reinicializarse en cada paso de tiempo.
nes adopta la forma:
AV¡=V¡-1 (5) inputn,k,M
en donde A es la matriz de n x n h ,- 1/(n+1)
1 +2s -s o o S <- k/h2
-s 1 +2s -s o for i = 1, 2, ..., n do
A= o -s 1+2 o (6)
V¡<-g(ih)
¡
end
o o o 1 +2s
t ,_ o
Formalmente la solución de la ecuación (5) está dada por output O, t, (v,, v2, .•. , v.)
. V¡=A-1V -1, ¡ for i = 1, 2, ..., n -1 do
C¡ <- -S
de donde obtenemos:
a;<- -s
Y¡ =r 1 (A-1 V¡-2)=A-'(A-1(A-1 Vj_3)) = "·=A-jVo, end
Se conoce el vector V0 en vista de que incluye los valores iniciales u(ih, O). Con el for j = 1, 2, ..., M do
mismo razonamiento que se usó en la sección 9.1, llegamos a que la condición para for i = l, 2, ..., n do
que el algoritmo sea estable es p(A-1) < l. Usando la matriz B de la ecuación (14) que
d;<-1+2s
aparece en la sección 9.1, resulta que
end
A= I+sB. call TRI (n, a, d, e, v; v)
El lema de la sección 9.1 nos indica que los valores propios de A son t ,_ jk
outputj, t, (v¡, Vz, ..., v.)
1.; = 1+2s(l -cos0;) 0; = � (1 �- i �-n) (7)
end.
n+l
602 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales
9.2 Ecuaciones parabólicas: Métodos implícitos 603
Método de Crank-Nicolson Análisis
Es posible combinar el método implícito con el explícito y obtener una fórmula Los errores en los puntos de la malla se definen mediante la ecuación:
más general que incluye un parámetro 9. Dicha fórmula viene a ser:
eij = u(x;, tj)-v(x;,lj) (13)
0 1-0
h2(V;+J.j- 2vij+V¡_¡.j) +-¡;r-(Yi+l,j-1- 2vi, j -1+Yi-l,j-1) A continuación usaremos las abreviaturas Uij y Vij para u(x;,tj) y v(x;, tj), respectivamente.
1
(8) Por lo tanto Y ij = U ij- eij. Pasemos al!ora a analizar el método explícito para la
= k(Vij- V;, j -1) ecuación de calor unidimensional (el usado en la sección anterior) en lo que respecta a
sus propiedades de convergencia. La ecuación que define este método es:
Vemos de inmediato que cuando 9 = O, esta fórmula proporciona el esquema explícito
que se discutió en la sección previa. (Véase la ecuación (8) de la sección 9.1.) Cuando Yi.j+l = s(v;-1, j-2vij+v;+i)+v;, j (14)
9 = 1, la expresión se reduce al esquema implícito ya discutido. El caso especial 9 = 4 Esta es la ecuación (9) de la sección 9.1, y como es usual, s = k/h2• En la ecuación (14)
conduce a un procedimiento numérico bautizado con el nombre de sus inventores, John sustituya v por ú- e, y obtenga:
Crank y Phyllis Nicolson.
En las siguientes líneas investigaremos con más detalle el método de Crank-Nicol U ;,j+l- e;,j+l = s(u;-1,j-2uij+u;+I.j)+Uif
son. La fórmula pertinente en este caso se escribe como sigue, donde como de costumbre
todos los puntos nuevos (que corresponden aj) se han colocado a la izquierda, mientras - s(e;-1, j-2eif+e;+i.j)- e;j
que los puntos viejos (que corresponden aj- 1) se han puesto a la derecha.
Esto se puede reacomodar en la forma:
-SVi-l, j+(2+2s)V;j- SVi+l,j = SVi-l, j -1+(2- 2s)Vi,j-1+SVi+l,j-l (9)
e;, j+I = se;-1,j+(1-2s)eij+se;+1, j
Una vez más se ha hecho la identificación s = k/h2• Al igual que antes, se usa el vector - s[ui-1.i-2uif+u;+i,¡]+[u;,¡+1- u;¡] (15)
V¡ con entradas Yij para 1 � i � n. La ecuación (9) adopta la forma vectorial
Para simplificar los términos (que en esta expresión están entre corchetes), recurrimos a
fórmulas previamente establecidas en el caso de la diferenciación numérica, a saber,
(21+sB) V¡ = (21-sB) V¡-1 (10)
1 h2
donde B es la misma de antes, a saber, la ecuación (14) de la sección 9.1. Usando un !" (x) = - [f(x+h)- 2f(x)+f(x-h)]- -¡(4l('é,) (16)
h2 1 2
razonamiento similar concluimos que la estabilidad del método queda asegurada si 1 k
g'(t) = -[g(t+k)-g(t)]- -g"(,) (17)
k 2
p[(2J+sB) -1(21-sB)] < l. (11)
Usando estas fórmulas obtenemos de la ecuación (15) lo siguiente:
Siµ¡,µ2, . .. ,µ. son los valores propios de B, la restricción (11) se convierte en: e;,¡+1 = se;-1,¡+(1-2 s)e;,j+se;+I, j
En vista de queµ; = 2(1- cos 9;), sucede que O <µ; < 4. Un poco de álgebra muestra
que la desigualdad (12) es correcta. Por consiguiente el método de Crank-Nicolson es + [kur(x;,lj)+�uu(X¡,t j)].
estable para todos los valores del cociente s = k/h2 •
Por supuesto, la estabilidad no es el único criterio que se usa para elegir la longitud Usemos ahora el hecho de que sh2 = k y un = u1• Con estas igualdades la ecuación
de paso h y k en estos métodos. En general, cuanto más pequeñas tomemos a h y a k, mejor (18) se puede expresar como:
será la concordancia en el comportamiento entre el sistema discretizado y la ecuación
diferencial original. Lo que se necesita es un teorema que garantice que la solución e;,j+l = se;-1, j +(1-2s)e;, j +se;+l.j
v(x, t) del problema discreto converja a la solución u(x, t) del problema original cuando
h -+ O y k -+ O. Dicho resultado es el contenido del siguiente teorema. -kh
2 [ 1 u=(�;,lj)- s urr(X¡,tj)] . (19)
12 2
604 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.2 Ecuaciones parabólicas: M étodos implícitos 605
Limitemos a (x, t) al conjunto compacto S = {(x, t) : O � x � 1 y O � t � T}. Se pueden usar fácilmente estos métodos con sólo recurrir a dos rutinas que manejen
Tomemos ahora: sistemas tridiagonales, es decir, que hagan lo siguiente:
M = � máx fu= (x, t)[ + máx fu,i(x, t)[i (20) (i) cálculo de y = Tx
1
donde los máximos se calculan sobre todo el conjunto S. Definimos también un vector (ii) despejar x de la ecuación Tx = b
de error:
e1¡
E¡= [ j
e2¡ SERIE DE PROBLEMAS 9.2
l. Demuestre que si r > O, entonces
e.¡
y tomamos
IJE¡JJ co = máx fegf• P [(I+rB)- (1-rB)j
1
= I1-q
+ q'
Finalmente, suponemos que 1-2s � O. Entonces, a partir de la ecuación (19), deducimos donde
lá,iá,n
que:
q = 4rsen ( 2n: 2)
[e�¡+1 I � sfei-1,¡[ + (1 - 2s)Je¡.¡[ +sfe¡+1,¡I + kh2M
2
2. Demuestre que la condición de estabilidad para el método definido por la ecuación (8) es la
� sJJE¡ffco + (1 - 2s)JJE¡[fco +s[JE¡Jf +kh M desigualdad s � (2 - 46i- 1 si O � 9 < ! , pero que si sucede que ! � 9 � 1, entonces no
(21) existe restricción para los valores de s.
2
= l[E¡[J 00 +kh2M.
00
Dado que el lado derecho de la ecuación (21) no incluye i, resulta lo siguiente: 3. Lleve a cabo un análisis de convergencia en el caso del método completamente implícito.
<4. Use el método completamente implícito para resolver el siguiente problema de conducción
� f[E¡fJ co +kh2M � fJE¡-if[ co +2kh2M � · · · de calor en el cuadrado unitario:
� ffEo[[ oo + (j + l)kh M.
2
En vista de que el proceso para obtener la solución v(x, t) principia con los valores
U:a = Ur
=
iniciales correctos, obtenemos E 0 = O, y por consiguiente:
{ u(x, O) (x - i1),t
u(O, t) = u(!, t) = O
fJE¡Jf �jkh M.
2 Valores que se sugieren: n = 20, M = 50, k = 0.05.
Tomemos ahorajk = t, de manera que IIE¡Jf 00 representa el error máximo en los puntos <5. Escriba y pruebe un programa que ejecute el procedimiento de Crank-Nicolson en el caso
00
Por ello, y conforme h -> O, los errores máximos en cualquier nivel t fijo convergen
u(x, O) g(x) W<x<Q
a cero con la rapidez de h2, siempre y cuando tomemos s = kjh2 � 1/2 y que las
u(O, t) = u(L, t) = O W<0
la solución numérica del problema de conducción de calor en una dimensión: condiciones en los extremos semejantes a las que aparecen en el problema.
de una serie infinita, en ocasiones puede ser preferible una solución numérica que incluya l -= Y,
una discretización del problema.
En el problema que presentamos la región es el cuadrado unitario abierto:
Yi 1---.--+--t----¡
Q= {(x,y):O<x<1, O<y< l}.
Por el momento la función en la frontera ges arbitraria. Sus valores deben proporcionarse Y2 L--.1---+---..p---
a través de una subrutina del programa de computadora.
Y1 f-----,1,..__
, _+--t--,..¡
Diferencias finitas
Un enfoque para encontrar la solución numérica del problema (2) recurre a las
O=h X
aproximaciones por diferencias finitas de las derivadas. Se puede usar una fórmula ya � X¡ X2 X3 x, = 1
familiar que aparece en la sección 9.2, a saber:
Figura 9.4 Malla sobre el cuadrado unitario.
J"(x)=h-2 [J(x +h) - 2f(x) +J(x - h)] + O(h2). (3)
608 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.3 Problemas sin dependencia temporal: Métodos de diferencias finitas 609
Las cantidades desconocidas en este problema se pueden ordenar de muchas maneras Algoritmo
(correspondiendo a los distintos ordenamientos de los puntos de la malla). Elegimos el El sistema de ecuaciones será ralo debido a que cada ecuación tendrá a lo más
conocido como ordenamiento natural: 5 incógnitas (hay a lo más 5n valores distintos de O de un total de n2 términos). Los
procedimientos iterativos .como los que se discutieron en la sección 4.6 pueden ser muy
V= [v11, V2 ¡, V3¡, V12, V22, V32 , V¡3, V23,V33]. eficaces en esta situación. Los valores en la frontera conocidos son:
Igualmente, las nueve ecuaciones lineales se pueden ordenar de muchas maneras. Deci Vij =g(x,, Yj) cuando i ó j son O ó n + l. ( 6)
dimos ordenarlas mediante la asociación de la ecuación (5) con su punto central (x¡, Yj) y
luego acomodando las ecuaciones de la misma manera en que ordenamos los puntos. Al Por consiguiente, en este algoritmo el conjunto total de elementos Vij como O � i,
haber colocado a la derecha todas las cantidades conocidas, el resultado es el siguiente: j � n + 1, consta de (n + 2)2 elementos. Para ilustrar lo anterior proponemos usar
el método iterativo de Gauss-Seidel. Para utilizar este procedimiento, la ecuación (5)
4vn - v2 1 - V12 =v¡o +vo1 asociada con el punto (x,, Yj) se escribe como:
4V2¡ - V11 - V3¡ - Vzz =vzo
V¡j =(Vi-1,j +V;+l,j +V4j-l +V4j+1)/4. (7)
4V3¡ - V2¡ - V32 =V30 +V4¡
- -
4v12 vu v22 v13 - =voz Esta ecuación se usa para actualizar el valor de Vij, Cuando se usa esta ecuación el valor
4v22 - Vz¡ - V¡z - V32 - V23 =0 que se obtiene en el lado derecho reemplaza el del viejo valor de vg, Si tenemos cuidado
4v32 - v31 - v2 2 - V33 =V4z de usar la ecuación (7) sólo cuando 1 � i,j � n, entonces en la actualización únicamente
participarán puntos interiores de la malla. Los puntos en la frontera de la malla sólo
4vu - v12 - v23 =VQ3 +V¡4
aparecerán en el lado derecho de la ecuación (7). El plan general para efectuar el cálculo
4V2 3 - Vzz - V13 - V33 =Vz4 es el siguiente:
4V33 - V32 - V23 =V43 +V34
l . Ponga los valores en la frontera en los Vij adecuados.
Este sistema tiene laformaAv =b, en donde la matrizA es de 9 x 9. De los 81 elementos 2. Asigne valores iniciales adecuados en los puntos interiores.
sólo 33 son diferentes de cero. A continuación presentamos la matriz de coeficientes: 3. Lleve a cabo M pasos de la iteración de Gauss-Seidel.
º]
[-i j]º [ �]º
o o Un fragmento de seudocódigo de la primera tarea es:
4 -1
o
º]
[ -1 4 -1 -1
] [-i ]
O -1 -4 o � o fori=0,1, ... ,n+ ldo
-1 O 4 -1 o ViQ =g(x¡, O)
A=
º º
1 [ O -1 O [-1 4 -1 -1 O
V/,n+l =g(x¡, 1)
O -1
] ]
O O -1 O -1 4
�]
o
[
-1 O 4 -1 vo; =g(O, y;)
o [ O -1 O [-1 4 -1 Vn+l,i =g(l, y¡)
� o O O -1 O -1 4
end.
En esta matriz se ilustra la estructura de bloque esencial. Podemos escribir, utilizando
una notación obvia: El seudocódigo para la tercera tarea es:
T -I O
A= [ -I T -I ] for k =1, 2, ..., Mdo
O -1 T forj =1, 2, ... , ndo
Tomando como modelo el caso especial anterior, pasemos ahora al caso general, donde fori=1, 2, ... , ndo
n puede ser cualquier entero. El número de puntos interiores de la malla es n2, y hemos Vij =(v,-1,j +Vi+l,j +V4j-l + v,,j+i)/4.0
asociado a cada uno de estos puntos un valor desconocido Uij = u(x;, Yj). Se supone end
que la función u será una solución de la ecuación (2). Después de la discretización
nos quedamos con un sistema lineal de ecuaciones que determinan los valores de las n2 end
cantidades desconocidas vu, donde 1 � i � n y 1 � j � n. end.
610 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 611
Observe que los ciclos en este algoritmo se hacen cargo de actualizar al vector v en el 5. En el problema modelo, con n2 puntos interiores de la malla, ¿cuántas ecuaciones serán ho
orden elegido (el orden natura[). mogéneas en general? ¿Cuántas ecuaciones tendrán en su lado izquierdo cinco coeficientes
Para tomar un caso concreto usamos la función g dada por la fórmula: distintos de cero? ¿Cuántas ecuaciones tendrán en su lado izquierdo cuatro coeficientes dis
tintos de cero? ¿Cuántas tendrán tres coeficientes distintos de cero? ¿Cuál es el número
preciso de coeficientes distintos de cero en la matriz?
g(x, y)= 10-4 senh(31t.t) sen(3ny).
6. Encuentre la solución analítica del problema de Dirichlet sobre el cuadrado unitario cuando
los valores en la frontera son cero, excepto para u(x. O) = sen 47tX. Use el método de
En el programa de computadora esta función se usa sólo para los puntos en la frontera separación de variables y las series de Fourier.
del cuadrado. Pero como g es armónica, entonces g es también la solución del problema.
Por ello es posible calcular la solución aproximada vij y compararla con la solución c7. Programe el ejemplo del texto y vea si su computadora genera resultados similares a los ya
citados.
verdadera u(x¡, yj)= g(x¡, yj). Tomamos n= 18, por lo que la matriz A es de 324 x 324.
Esta matriz no se almacena en la computadora en vista de que el método de Gauss-Seidel cs. Modifique los programas dados de manera que pueda emplear el método SOR (sobrerrela
no lo requiere así. En lugar de ello usamos la ecuación (7) y necesitamos sólo el vector jación sucesiva) en lugar del método de Gauss-Seidel.
v, el cual tiene 324 componentes Vij (O � i � 18 y O � j � 18). Después de 200
iteraciones se encontró que el error satisface la desigualdad:
*9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz
lvij - u(x¡, Yj)I < 0.0042.
Los métodos de Galerkin se utilizan profusamente en problemas en los que se requiere
SERIE DE PROBLEMAS 9.3 determinar una fanción que juega el papel de incógnita. Naturalmente, las ecuaciones
diferenciales y las ecuaciones integrales caen en esta categoría. Comenzamos con una
l . Sea Ti/2 el operador laplaciano: v'2u = u"" + Uyy . Demuestre que un problema de la forma
presentación abstracta de cómo los principios se aplican a cualquier problema lineal. A
continuación ilustramos su funcionamiento con un ejemplo numérico mediante el cual
{'1 u=f enn
2
resolvemos el problema de Dirichlet sobre un rectángulo.
u= o sobrean
puede resolverse mediante los siguientes tres pasos: (i) Encuentre una g tal que v'2g = f. Método de Galerkin
(ii) Usando -g para los valores en la frontera, resuelva el problema de Dirichlet enn. (iii)
Para obtener u añada g a la función obtenida en el paso (ii). Suponga que nos enfrentamos con un problema de la forma
2. (Continuación) Describa un problema de Dirichlet equivalente a
Lu=f, (1)
'v2 u = (6 - 3x2) seny-y cosx enn
{ en el cual L es un operador lineal, f es una función d�da, y u es una función que será
u= o sobrean
determinada a partir de la ecuación. En el método de Galerkin elegimos un conjunto
de fanciones básicas o fanciones de prueba u¡, u2, ... , u•. Acto seguido intentamos
3. Una manera de ordenar los puntos en el plano es mediante un ordenamiento lexicográfico.
Este tipo de orden es el que se usa en un diccionario, en el cual colocamos primero todas resolver la ecuación (1) usando una combinación lineal adecuada de dichas funciones
las palabras que comienzan con "a". Entre ellas se establece un orden según la segunda básicas. Tomando
n
letra. En los casos en que haya coincidencia en la segunda letra usamos la tercera, y así
sucesivamente. Por lo tanto, en el plano, el orden lexicográfico se define como: U= ¿cjUj
j =I
(x, y) � (u, v) si (x < u) o (x = u y y � v).
y usando la linealidad de L, obtenemos:
¿Cuál es la matriz que corresponde al problema modelo si los puntos de la malla y sus
ecuaciones se ordenan lexicográficamente? n
¿cjLUj=J (2).
e4. Programe el procedimiento que se delineó en el texto para resolver el problema de Dirichlet j =I
sobre un cuadrado. El número de puntos, el número de iteraciones y la frecuencia de la
impresión deberán controlarse por parámetros cuyos valores puedan cambiarse fácilmente.
Los valores en la frontera deberán ser proporcionados por un subprograma. Someta su En una situación típica esta ecuación es inconsistente, debido a quef en general no estará
programa a prueba usando: en el espacio vectorial generado por las funciones Luj. Por lo tanto resolvemos de manera
g(x,y) = 4.xy(x-y)(x+y).
aproximada la ecuación (2) y en consecuencia obtenemos una solución aproximada de
la ecuación (1). Se puede resolver aproximadamente la ecuación (2) siguiendo una
Compare las soluciones de los problemas continuos con las de los discretos. amplia variedad de criterios, dando lugar cada uno de ellos a una diferente solución
612 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 613
aproximada de u. El enfoque más natural es elegir c,, c , ..., c. de manera que alguna
2 Este problema se puede interpretar como uno de la forma Lu = f; simplemente definimos
norma se minimice: L y f mediante las ecuaciones:
¿
n
CjLUj - f 11 = mín (3) vzu
Lu= [
u\aQ]
j =I f(x, Y) = [ x 2 �y 2 ] (9)
Éste es un problema de mejor aproximación. Estamos aproximando a f con el elemento
más cercano en el subespacio generado por las funciones Lu¡. Gracias a que se cuenta La notación u¡ S denota la restricción de la función u al conjunto S. Representa una
con una técnica de proyección ortogonal, esto es relativamente sencillo de hacer en un operación lineal, ya que
espacio con producto interno.
Una forma muy general de obtener una solución aproximada de la ecuación (2) es (a.u+ �v) 1 S = a.(u IS)+ �(v IS).
seleccionar un conjunto de funcionales lineales $1, $2 ,... , $ne imponer la condición:
$¡ (t ¡=I
c¡Lu¡ - f) = O (1 � i � n) (4)
Para usar el método de Galerkin es necesario elegir un conjunto adecuado de fun
ciones básicas. En el problema que nos ocupa escogemos funciones ui, u2, ... , un
que satisfacen la parte homogénea del problema. Es decir, elegimos u; de manera que
v2 u¡ = O en Q. Se dice que tales funciones son armónicas en Q. Disponemos de
La linealidad de los funcionales nos permite transformar esta expresión en: una amplia variedad de funciones armónicas en virtud de que tanto la parte real como
la imaginaria de cualquier función analítica de una variable compleja son funciones ar
mónicas. Las primeras funciones que son potencias de la variable t nos proveen de un
¿ $;(Lu¡)c¡ = $;(!)
n
(1 � i � n) (5)
conjunto adecuado de polinomios armónicos.
j=l
En la sección 8.10 se usó el método de colocación para resolver problemas relacionados Dado que nuestro problema es simétrico respecto de los ejes coordenados y del origen,
con ecuaciones diferenciales y valores en la frontera en dos puntos. Procedemos ahora a elegimos las partes reales e imaginarias de t que posean las mismas simetrías. Esto nos
ilustrar el uso del método de Galerkin para el caso del problema de Dirichlet. El ejemplo limita a la parte real de t para k par. De esta manera, si tomamos n = 4, podríamos
que se ha seleccionado también se puede resolver usando separación de variables y series usar como funciones básicas:
de Fourier.
u¡(x,y)=l
Problema de Dirichlet u2(x, y)=x2 -y2
Considere un rectángulo abierto en el plano, definido como U3(x, y)=X4 - 6x2y2+ y4
Q = {(x,y): lxl < l. IYI < 2}. (7) u4(x, y) = x 6 - 15x 4y2+ 15x2y 4 -y6.
Buscamos una función u, definida en Q, tal que:
Con esta elección de funciones básicas resulta evidente que la función u = [J:1 c¡u¡
v2 u = Ü enn satisface automáticamente la igualdad v2 u = O, y que los coeficientes e¡ deberían
{ u(x, y) = x2+y2 sobre an
(8)
escogerse de manera que las condiciones en la frontera se satisfagan aproximadamente.
614 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 615
La ecuación que se debe resolver de manera aproximada es: Finalmente, se puede intentar minimizar la cantidad
Debido a las simetrías, basta considerar la parte de oQ que se encuentra en el primer Esto requiere utilizar la solución minimax de un sistema sobredeterrninado de m ecua
cuadrante. ciones lineales con 4 incógnitas. Para valores grandes de m este procedimiento simula
Con el fin de ilustrar el método de colocación elegimos cuatro puntos sobreoQ, a la minimización de la norma uniforme:
saber,(O, 2),(1, O),(1, 1) y(1, 2). Insistimos en que la ecuación(10) sea válida justo en
esos cuatro puntos. Esto nos lleva al siguiente sistema de ecuaciones lineales:
4
máx 1¿9uj(x,y)-(l- +I) (14)
1 -4 16 -64
1 J 1 1 Cz _ 1
4 [C¡l (x,y)Eíin j=l
e=(1.8261,-0.7870,-0.04348, 0.004348/. y la desviación máxima entre los 76 puntos es 0.033. El esfuerzo adicional invertido en
obtener la solución mediante este método difícilmente se justifica con la mejora marginal
Por lo tanto, la discrepancia más grande entre ¿J=1 CjUj y la función x2 +y2 sobre la en cuanto a precisión. En todo caso, sería mejor aumentar el número de funciones básicas.
frontera del rectángulo es aproximadamente 0.074.
En el ejemplo anterior, reteniendo el conjunto de funciones básicas, procedemos
ahora a "resolver" la ecuación(10) usando otro enfoque. Para ello elegimos un conjunto
Ecuación de Poisson
de m puntos(x;, y;) sobre la frontera deQ e intentamos minimizar la expresión Es frecuente encontrar problemas con valores en la frontera donde aparece la ecua
ción de Poisson. Un ejemplo típico sería el siguiente:
2
1 una vez que se han encontrado u y v, la solución del problema original es w = u+v. Estos
2
[tCjUj(x,y)-(;('+1)] dxdy. (12) dos problemas tienen la ventaja de que cada uno de ellos tiene una parte homogénea.
¡= ! Dicha característica se explota en el método de Galerkin. Por ello, al resolver el problema
donde aparece u, se puede elegir funciones básicas que valgan cero en la frontera den.
íiO
A modo de demostración práctica de este enfoque escogemos 76 puntos igualmente Si u1, u2, .•. , un poseen esta propiedad, lo mismo sucede para una combinación lineal
espaciados en la porción dean que corresponde al primer cuadrante. La minimización · arbitraria de ellas. Acto seguido tomamos u = ¿J= 1 CjUj y tratamos que la expresión
de la expresión(11) se convierte en un problema matricial de mínimos cuadrados que 'i72u = f resulte correcta mediante la elección adecuada de los coeficientes 9. Esto
consta de 76 ecuaciones y 4 incógnitas. El resultado de este cómputo es: conduce a la ecuación:
L Cj 'i7 Uj = f.
n
c =(1.8216,-0.7811,-0.04458, 0.004052/
2
(16)
j=I
La desviación máxima entre los 76 puntos es 0.049. Los 76 puntos utilizados fueron Como sucede en este tipo de casos, ninguna elección de coeficientes logrará que la
(1, i/25) para O ;;; i ;;; 50 e(i/25, 2) para O ;;; i ;;; 24. ecuación sea correcta, y por lo tanto se deberá buscar una solución aproximada.
616 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 617
v u =! enQ
2
(-v2 u, u) = J h(uxi + (uy)2]dxdy. (21)
{ (17)
u=o sobrean El valor de esta integral ciertamente es no negativo y lo único que queda por aclarar es
es el método de Rayleigh-Ritz, el cual se discutirá a continuación. Se mantiene fija si puede ser O para una función u que no sea la función cero. Sí el valor de la integral
la regiónQ, y trabajarnos en un espacio con producto interno V, cuyos elementos son es O, entonces Ux = uy = O en Q. Por lo tanto, u es al mismo tiempo una función de
funciones u tales que uxr y uyy son continuas enQ y satisfacen la igualdad u(x, y) = O en y exclusivamente y una función de x exclusivamente. Por consiguiente u debe ser una
la frontera deQ. Se supone que f es continua en n. Por ende la solución al problema constante en la regiónQ. Pero en cuanto el etemento de V, debe valer cero enan. De
deberá estar en el espacio V. El producto interno en V se define mediante la ecuación: esto se concluye que u = O. 11
TEOREMA El operador-'::12 es autoadjunto y definido positi vo en el espacio con producto interno V. [u,v]=(-v u,v) =
2
J L(UxVx+UyVy )dxdy. (22)
Demostración La propiedad de ser autoadjunto ( o simétrico) se expresa mediante la ecuación: Este nuevo producto interno induce una nonna en el espacio V vía la ecuación:
Para demostrar la ecuación (19) necesitaremos del teorema de Green en el plano, que Cuando usarnos el método de Rayleigh-Ritz lo que se hace es elegir funciones básicas
nos dice que para funciones decentes y regiones también decentes: u¡, u2, •.. , u. en el espacio V, y se intenta determinar c¡, Cz, .•. , c. de manera que
r;=l CjUj esté tan cercana como sea posible de la verdadera solución con la norma
j L(Px+Qy )dxdy = fan (P dy-Qdx).
Dado que se dispone de la herramienta propia de los espacios con producto
111 · 111-
interno sabemos que las ecuaciones normales determinan los valores de los coeficientes
Cj. Así, sí u es la verdadera solución, se debe satisfacer la condición de ortogonalidad
Usando el teorema de Green y el hecho de que u y v toman el valor cero enan, podemos siguiente:
llevar a cabo el siguiente cálculo:
u - ¿cjUj .Lu; (1 � i � n).
=
0
(uxv dy-uy vdx)- j L(uxvx+Uyvy )dxdy
j=l
j
Estas ecuaciones se pueden simplificar usando la definición (22) y la relación
L(UxVx+Uy Vy )dxdy
[u, u¡] = (-V u, U¡) = (-f. U¡).
=- 2
(1 � i � n)
En ia última expresión de este cálculo las funciones u y v aparecen de fonna simétrica, El resultado es el conjunto de ecuaciones normales:
y por lo tanto
(v2u, v) = (u, v2 v).
¿ Cj[Uj, U¡] = -(f. U¡)
(20)
(1 � i � n). (23)
Para comprobar que -v2 es definido positivo debemos demostrar que si u E V y u ,¡; O, j =I
entonces
(-v2u, u)> Ü Dése cuenta de que la función desconocida u no aparece en el sistema (23).
618 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.5 Ecuaciones diferenciales parciales de primer orden; curvas características 619
El método del elemento finito se ha convertido en un tema tan amplio que se aconseja
al lector que consulte la literatura especializada en el terna. Puede consultar, por ejemplo,
a Becker, Carey y Oden [1981], Mitchell y Wait [1977], Oden [1972], Oden y Reddy
[1976], Strang y Fix [1973], Vichnevetsky [1981], Wait y Mitchell [1986], y Zienkiewicz
y Morgan [1983].
d e
*9.5 Ecuaciones diferenciales parciales de primer orden; curvas características
Al igual que en la teoría de las ecuaciones diferenciales ordinarias, las ecuaciones dife
renciales parciales de orden superior se pueden reemplazar por sistemas de ecuaciones
a de primer orden. Los siguientes ejemplos mostrarán cómo se puede llevar a cabo esto.
b
Sistemas de primer orden
Figura 9.6 Una triangulación inadecuada.
Ejemplo 1 Transforme la ecuación de calor unidimensional considerada en la sección 9.1
La regla a la que se someten las triangulaciones adecuadas es que cualquier punto
que sea vértice de algún triángulo debe también ser vértice de cada triángulo al que U;o: =U1 (1)
pertenezca. En la figura 9.6 el punto e es uno de los vértices de 6.abe y pertenece
también a 6.dbc sin que sea vértice de éste último. en un sistema de ecuaciones de primer orden.
620 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.5 Ecuaciones diferenciales parciales de primer orden; curvas características 621
Respuesta Usando la variable v == u. obtenemo s un sistema equivalente En este ejemplo la ecuación (9) se puede simplificar usando la ecuación (7). El resul
{Vx - Ut == 0 (2) tado es:
dy
u.-v=O 11 ttt
=c (10)
Las soluciones de la ecuación (10) son líneas rectas con pendiente
c en el plano xy. A
Ejemplo 2 Muestre que la ecuación de calor tridimensional través de cualquier punto dado (x0, y0) en el plano pasa exactamente una
de estas líneas
características, y su ecuación es:
U;a + Uyy + Uzz = U1 (3)
Y - Yo = c(x - xo). (11)
se puede tratar de la misma forma.
¿Cuál es la utilidad de las curvas características? Suponga que el pr
Respuesta Usando las variables u(l) = u, i2l = u., u(3l = Uy, u(4l = Uz, la ecuación de este ejemplo oblema que se
quiere resolver no es la ecuación diferencial que aparece en (7), sino
se transforma en el siguiente sistema equivalente de ecuacio nes diferenciales de primer un problema con
una condición auxiliar. Un ejemplo de lo anterior es:
orden:
u(%2l + u(3y l + u(z4l - ut(ll = O u. + cuy =O
uill = ui2l { (12)
(4) u(x, 0)= f(x),
{ (
uyll = u(3l
donde! es una función dada. Para calcular la solución en cualquier punto (Xo, y0) primero
uin == u(4) 11 deterruinamos la curva característica que pasa por dicho punto , y luego seguimo s la
curva hasta un punto de la forma (x, 0). En dicho punto se cono ce la solución, a saber,
Ejemplo 3 Repita lo anterior para la ecuación diferencial parcial de segundo orden general con dos u(x, 0) = J(x), y a lo largo de la curva la solución no cambia de valor, pues es una
variables independientes, que se expresa como: constante. Por lo tanto, u(xo, yo) toma el mismo val or quef(x) en tanto que (x, O) esté
F(x, y, u, u., Uy, U;a, U.y, Uyy) = o (5) sobre la curva característica que pasa por (Xo, y0). En nuestro ejemplo estas curvas so n
líneas rectas. La figura 9.7 ilustra esta situación.
{
Respuesta Esta ecuación es equivalente al siguiente sistema de ecuaciones de primer orden:
F(x, y, u, V, w, v., Vy, Wy)
Ux =V
=o
(6) (Xo, Yo)
Uy =W.
1
curva característica
Curvas características Y - Yo = c(x - Xo)
Ejemplo 4 Resuelva el siguiente problema mediante el método de características: Para generar una tabla de x(s), y(s), u(s) iniciando en s = O, se puede integrar numéri
camente el sistema. No resulta difícil verificar que esta tabla aportará puntos solución
u,,+y11y= O
{ (15) de la ecuación diferencial parcial (20). De hecho,
u(O , y)= f(y).
a(x(s), y(s), u(s))ux(x(s), y(s)) +b(x(s), y(s), u(s))uy (x(s), y(s))
Respuesta Ésta es una ecuación diferencial parcial cuya solución se busca en todos los puntos del
plano xy, con la condición de que los valores que la función solución toma en el eje = x' (s)u,,(x(s), y(s)) + y'(s)11y(x(s), y(s))
y están dados. Si seguimos el mismo procedimiento que antes, la ecuación diferencial d
ordinaria que describe las curvas características será: = dsu(x(s), y(s)) = c(x(s), y(s), u(s)).
U (En este cálculo las comillas indican diferenciación respecto de s.)
dy =--=y.
- x
dx
(16) Si los valores de u(x, y) han sido dados a lo largo de alguna curvar (¡que no sea
Uy una curva característica!), entonces en principio se puede comenzar en cualquier punto
La solución que pasa por (x0, Yo) es: der, integrar el sistema (21), y obtener valores adicionales de u(x, y) a lo largo de los
arcos. (A modo de ayuda para entender estas ideas vea la figura 9.8.) Los arcos que se
Y =Yoi'-xo. (17) obtienen con este proceso son curvas características de la ecuación (20).
La intersección de esta curva característica con el eje y tiene lugar en y = y0e-xo. Por
lo tanto incluimos que
u(xo, Yo) = f(yoe-xo) (18)
curva característica
es la solución. Naturalmente, esta expresión se puede escribir como:
Se verifica directa y fácilmente que ésta es la solución del problema planteado por la
ecuación (15). 11
Se invita al lector a que intente resolver algunos de los problemas, por ejemplo, los
problemas l(a) hasta l (c), que son de un nivel elemental..
r
Teoría general de las curvas características Figura9.8.
La teoría general de las curvas características debería abarcar ecuaciones más ge
f
Ejemplo 5 Determine las ecuaciones diferenciales ordinarias que definen las curvas características
nerales y no tratar a las variables x y y de manera asimétrica. Más aún, no esperamos
asociadas con la siguiente ecuación:
que la solución sea constante a lo largo de una curva característica; sólo pedimos que
satisfaga alguna ecuación diferencial ordinaria a lo largo de una característica. sen(x2 + r)u,, + (3x + r)uy = i'"l
Considere la ecuación:
Respuesta Según la teoría general, el sistema debería ser
au,,+bUy = c, (20)
en la que permitimos que a, b y c sean funciones de x, y y u. Suponga que se conoce x' = sen(x2 + r) y'= 3x+1 u'= i'"l (22)
el valor de la función en un punto (xo, yo). Este podría ser el resultado de cálculos an Dado que a y b no involucran a u en este ejemplo, las curvas características (en el plano
teriores o de un valor en la frontera que se ha asignado. Indicaremos a continuación xy) pueden obtenerse integrando solamente las primeras dos ecuaciones que aparecen
cómo se pueden obtener valores adicionales de la solución de (20) a través de la integra m� m
ción de algunas ecuaciones diferenciales. Considere el siguiente sistema de ecuaciones
diferenciales ordinarias con condiciones iniciales: Ejemplo 6 Considere la ecuación diferencial parcial
{t'�
du 6u,, + xuy = y
�=b =c
ds ds (21) Dado que u(3, 3) = 4, ¿qué valor de u(15, 21) se obtiene al seguir una curva caracterís
y(O) = Yo u(O) = UQ = u(xo, Yo) tica?
624 Capítulo 9 Solución numérica de ecuaciones diferen *9.5 Ecuaciones diferenciales parciales de primer orden; curvas características
ciales parciales 625
Respuesta La curva característica que pasa a través del punto inicial está determinada por el pro Respuesta Las ecuaciones de las características son:
blema de valor inicial:
x1=x u' =xy
uy
y' =x u' =y
{y'=
x' =6 {
{x(O) =Xo y(O) =3/.xo u(O) =6
{x(O) =3 y(O) =3 u(O) =4
Al integrar estas ecuaciones obtenemos Dado que
: (xy)' = x'y+xy' = xy+x =xy(l +u)= u'( l + u),
uy
x=6s+3 se puede integrar respecto de s y obtener
y=3s 2+3s+3
xy = u+!u2+c. (25)
u =s3+ !s + 3s+4.
•
2
Tomando s =2 concluimos que x =15 , y=21, u=24. Utilizando las condiciones iniciales encontramos que e = -21. De la ecuación(25) se
puede despejar u y obtener:
Ejemplo 7 Use el método de características para encontrar una solución del problema de valor inicial u = -1+ J43+2x y 1111
6u, +xuy = y Existe otra forma de interpretar nuestro trabajo en los ejemplos anteriores. Tomemos a
r como un parámetro que describe puntos sobre la curva de datos r. Al igual que antes,
{ u(x, y) =4 cuando x = y s es el parámetro que describe puntos sobre cualquiera de las curvas características.
Respuesta Procedemos a encontrar
las curvas características que pasan por el punto (x, Y) =(,; r), Suponemos ques =O para los puntos sobre r. (Véase la figura 9.9.)
r ;; 6 . Resolviendo el sistema
r =6 - ,/(x- 6) 2+ 12(x - y)
{
s =(x-r)/6
Figura9.9.
Con los valores de r y des disponibles se puede calcular el valor de u en (x,y) usando la
tercera ecuación en(23). Así, por ejemplo,
si (x, y) =(15,21) , entonces(,; s) =(3,2) Y El punto marcado con 0 corresponde a r =4 y s =2.
u = 24, tal como sucedió en el ejemp •
lo 6.
En la misma forma se pueden describir otros puntos en el plano usando coordenadas
Ejemplo 8 Resuelva el problema
de valor en la frontera: (,;s). No es necesariamente cierto que se pueda asignar valores de r y de s a todo
punto en el plano. Además, puede suceder que se toquen las curvas características
xu,+ yuuy =xy correspondientes a dos valores distintos de r. En ese caso el punto de intersección no
{ u(x (24) tendrá una descripción única en términos de (r,s). Si la curva de datos r no es una curva
, y) =2xy cuando xy =3
característica, y si las funciones coeficiente a, b, y e son lisas, los puntos cercanos ar
usando el m étodo de características. tendrán coordenadas únicas(,;s).
Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.6 Ecuaciones cuasilineales de segundo orden; características 627
626
Usando r y s de la manera que se acaba de esbozar, podemos describir nuestro trabajo 7. Resuelva, usando el método de características, el siguiente problema:
de la siguiente forma Las funciones (,; s) H x(,; s), y(,; s), y u(r, s) están determinadas u,+uy=u 2
por las ecuaciones diferenciales: {
u(x, y)=y sobre la rectax +y= O
{ax
-=a
oy
=b
ou
-=c
8. Resuelva el siguiente. problema de valores en la frontera mediante el método de caracterís
as os as ticas. Explique las dificultades que pueden aparecer.
x(,; O)= f(r) y(,; O)= g(r) u(,; O) = h(r). u,+2Uy=U
{
u= 1 cuandoy=2x
Suponemos que r está dada paramétricamente por:
9. Resuelva el siguiente problema usando el método de características:
X=f(r) y= g(r).
uu,+uy= l
{
u= r sobre la curvax= ,:Z y=2r
La integración de las tres ecuaciones diferenciales genera tres funciones que representan
en forma paramétrica a una superficie: 10. Con el método de características resuelva:
u,+2uy=y
x =x(,;s) y= y(r, s) u= u(r, s). {
u = ,:Z sobre la circunferencia x = cos r y = sen r
Obviamente, esta superficie contiene a la curva espacial: 1 1. Considere la ecuación diferencial parcial au, + bu y = O, donde a y b son funciones de x
exclusivamente. Encuentre la ecuación de la curva que pasa por (xo, yo) y sobre la cual los
valores de u permanecen constantes.
r·: x=f(r) y= g(r) u= h(r).
Por consiguiente, hemos encontrado una superficie que resuelve la ecuación diferencial
parcial original y que contiene una curva espacial dada, f*. Observe que r es una *9.6 Ecuaciones cuasilineales de segundo orden; características
proyección de f* sobre el plano xy.
Vamos a analizar en esta sección la ecuación
(a)
u,+xuy=0
{u(O, y) = f(y) (b)
u,+2uuy=0
{u(O, y) = f(y) (c)
{ xu, + 2yuy= O
u(I,y)=f(y)
se dice que es cuasilineal. Al igual que en el estudio de las curvas características de las
ecuaciones de primer orden, nos preguntamos acerca del comportamiento de la función
solución a lo largo de una curva en el plano xy.
Con base en la ecuación (2), podemos resolver para uxx: Esta clasificación de las ecuaciones se ilustra muy bien con tres de ellas, las cuales
son bien conocidas y nos servirán como model o:
d dp ds dyds dp dy li
u = ( p -uxyy') /x' = -u = -u ( 4)
:a: ds dsdx xy ds dx dx xydx· Nombre Forma ó.
a b
Tipo c
a
• dy (dq
dx
( -uxydx) +buxy + c dy-uxydy) +e =O
dx
(6) Solu ci ón El discriminante de la ecuación es:
En virtud de que la ecuació n (9) es una ecuació n cuadrática en dy/dx, la naturaleza dy _ b±/&_ ( x+y2)±1x-/l
de las curvas características está determina da por el discriminante: -;¡;-z;-- 2y (12)
y tiene como solución a la familia de curvas exponenciales y = pe<. Cuando x < y2 La versión simplificada de la ecuación (13), escrita para ambas curvas características, es:
estos dos casos se invierten. Cuando x = y2, la ecuación (10) es parabólica y la curva
característica es de nuevo la solución de la ecuación diferencial ordinaria dy/dx= y. 11
+v1 = -e/a cuando�= v2
dp dq
{ dx dx dx
(17)
-+v2- = -e/a cuando - = v1
Algoritmo dp dq dy
característica. La pendiente dy/dxcumple sobre C con la ecuación (9), de modo que la Para resolver las ecuaciones (17) se puede utilizar un método de diferencias finitas. Las
ecuación (8) se reduce a: ecuaciones que hay que resolver son versiones discretizadas de las ecuaciones (15):
a--+c -+e- = O
dp dy
(13)
dq dy
dy = Uz
dx Ésta es la diferencia finita análoga a la ecuación:
du = u.dx+uy dy = pdx+qdy,
ya que p =u.y q = uy. Observe que en las ecuaciones (18) a (22) se utilizan en forma
sistemática los valores promedio de las funciones a lo largo de diversos arcos.
Ahora suponga que conocemos los valores de x, y, u, p y q en los puntos B1 y B2.
En tal caso las ecuaciones (18) a (22) nos permiten determinar los nuevos valores x(A),
Figura 9.10 Curvas características AB1 y AB2• y(A), u(A), p(A) y q(A). Esto en sí puede ser una fuente de dificultades, en virtud de que
632 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.6 Ecuaciones cuasilineales de segundo orden; características 633
las ecuaciones son no lineales. En la práctica, esto se resolvería por lo general aplicando
y
algún método iterativo. He aquí el perfil de un procedimiento de esa naturaleza:
l . Comience haciendo una conjetura acerca de los valores correctos dex(A), y(A),
u(A), p(A) y q(A). Dichas suposiciones pueden ser simples perturbaciones de
valores recientes de estas funciones, digamos en B 1 .
2. Calcule v1 (A), v2(A) y (e/a)(A) apoyándose en los más recientes valores de
x(A), y(A), p(A), q(A) y u(A).
3. Vuelva a calcularx(A) y y(A) con las ecuaciones ( 18) a (19). Después calcule
de nuevo p(A) y q(A) con las ecuaciones (20) a (21). Por último vuelva a
calcular u(A) con la ecuación (22). Repita el paso 2 en caso de que los nuevos
valores difieran radicalmente de los valores previos. 08 v v v v v v • ... x
Los valores estimados de las cantidadesx(A), y(A), etc., en el paso 1, se pueden obtener
fácilmente por medio de ciertas formas no tan precisas de las ecuaciones (18) a (21). Por Figura 9.11.
ejemplo, podemos reemplazar los valores promedio que figuran en dichas ecuaciones
por los valores en B 1 y B2. Hecho lo anterior, las ecuaciones (18) a (19) son lineales y
se pueden resolver fácilmente para producir los valores iniciales de esta iteración. Esta
tarea tiene como resultado las siguientes fórmulas:
A
y(B2) - y(B 1 )+x(B¡)v¡ (B¡) - x(B2)v2(B2)
( =:....c....cc..-.:.....;....�������
xA)
V¡ (B¡) - V2(B2)
y(A) = y(B ¡ ) + v 1(B 1 )[x(A) -x(B ¡ )]
R = p(B2) - p(B ¡ )+ V¡(B2)q(B2) - v2(B ¡ )q(B 1 )
�
S = (e/a)(B2)[x(A) - x(B2)l - (e/a)(B 1 )[x(A) - x(B 1 )] B1 B2
1
Figura 9.12.
p(A) = p(B2) - (e/a)(B2)(x(A) - x(B2)] - v1(B2)[q(A) - q(B2)]
La solución de este par de ecuaciones lineales es: en la ecuación diferencial (1). Suponga que las nuevas variables se introducen a través
de las ecuaciones:
I; = l;(x, y) T\ = TJ(X, y).
p(A) = �[p(B1)+p(B2)]+ (1 - �) [q(B2) - q(B1)] (23)
El efecto de este cambio·en la ecuación diferencial
q(A) = {p(B2) -p(B1)+ (2 - �) [q(B2)+q(B1)]} / (4+ �)
auxx+buxy+ cuyy+e = O. (24)
La fórmula (22), convenientemente simplificada, reza: se puede determinar después de calcular
h
Ux = U¡;/;x+ �TJx
h
u(A) = u(B1 )+ [p(A)+p(B1)]+ [q(A) +q(B1)]
4 2
Uy = U¡;/;y+ �T]y
El siguiente es un algoritmo para este procedimiento:
U;r;x = U¡;/;;r;x+u1;1;/;;+Zls T],/;x+ �TJ:r:x+ �1;/;xTJx+� TJ;
11 11
h +- 1/(n - 1)
Uyy = u1;/;yy+lle1;/;;+Ui;11 T\y/;y+ �T]yy+ �l;/;yT]y+�11 TJ;
forj = 1, 2, .. ., n do
Xj +- (j - l )h Al sustituir estas expresiones en (24), obtenemos:
Yj +- O
Uj +-j(Xj) u1;1;[al;;+bl;,l;y+el;;]+u1;11[2a/;,TJ,+b/;x TJy+b/;yT\x+2c/;7T]y]
(25)
Pj +-f'(xj) +�11 [alJ;+bl]yT]x+CTJ;J+f = O
(Jj +- g(Xj)
En a, b, e y e también hay que hacer las sustituciones apropiadas. Se muestran todos los
output Xj, Yj, Pj, (Jj, Uj términos en los que figuran segundas derivadas, conteniendo f los términos restantes.
end (Véase el Prob. 8.) Ya que nuestro interés por ahora se centra en el caso hiperbólico,
for i = 1, 2, .. . , n do supondremos que la ecuación cuadrática:
y¡+- ih
a)..2 +b1..+c = O
for j = 1, n - ido
Xj +- Xj+h/2 tiene dos raíces reales, a saber, (-b±/E.)/(2a), en donde el discriminante t:J. = b2 -4ac
p +- [pj+Pj+il/2+(1 - h/8)[qj+l - qj] es positivo. Si elegimos una transformación de coordenadas de modo que
q +- [Pj+l -Pj+(2 - h/4)(qj+l +(Jj)] /(4+h/2)
Uj +- Uj+h(p+pj)/4+h(q+(Jj)/2 1;,/l;y = (-b +.fi.)/(2a)
Pj +-p TJ,/TJy = (-b - .fi.)/(2a),
qj +- q
output Xj, Yj, Pj, (Jj, Uj entonces la ecuación diferencial (25) se simplifica como sigue:
end U¡;11 [2a/;x T]x+b(/;xT]y +/;yT]x )+2c/;yTJy ]+f = O. (26)
end.
1
Ésta es la forma canónica de la ecuación hiperbólica. Las curvas descritas al hacer
Un enfoque alternativo de las características l;(x, y)= constante TJ(X, y) = constante, (27)
Hay otro enfoque de la teoría de las características, el cual parte de la cuestión de si son las curvas características. Estas curvas resuelven las mismas ecuaciones diferen
un cambio de variables, digamos de (x, y) a (I;, r¡), puede conducir a una simplificación ciales que se obtuvieron en la ecuación (9), como se puede comprobar fácilmente.
636 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9. 7 Otros métodos para los problemas hiperbólicos 637
Ejemplo 4 Encuentre la región en la que la ecuación donde J es el jacobiano de la transformación:
dondes = (a.k)/(2h). El método que engloba la ecuación (4) es el método de Lax Sistemas de ecuaciones
Wendroff. Hemos cambiado a la letra ven virtud de que la solución de la ecuación (4)
no siempre es una sólución de la ecuación (3). Ahora considere un sistema hiperbólico de ecuaciones y suponga que tiene la forma:
Obviamente, no hay ningún obstáculo para deducir métodos de orden superior a
partir de la ecuación (3). En el problema2 se pide que se infiera un método de tercer U,=AUx. (8)
orden utilizando estos principios.
Aquí U es un vector de funciones, digamos u(l), u(Z), • . • , u(m). Cada una de las com
ponentes es una función de (x, t). La matriz A es de m x m, y para que el problema
Análisis de la estabilidad sea en realidad hiperbólico, A debe tener m valores propios reales y distintos. La forma
En el problema modelo que se da en la ecuación 1( ), la solución se puede escribir vectorial del método de Lax-Wendroff es el análogo de la ecuación (4):
inmediatamente. Ésta es:
u(x,t) = f(x + a.t). V(x,t+k) = V(x,t) + (!) A[V(x+h, t)- V(x -h,t)]
(9)
Cuando se introducen puntos malla (jh,nk) y se define Vjn = v(jh,nk), la ecuación (4) + ( ;:2 ) A2[V(x + h,t)-2V(x,t) + V(x -h,t)]
adopta la siguiente forma:
de modo que:
Vj,n+I = (2s2+ s)Vj+l.n + (1- 4s2)Vjn + (U - s)Vj-1.n, (5)
=
para las que sólo se han suministrado valores iniciales. Si la variable x está limitada a O(h2 +k 2 ). El significado preciso de esta afirmación requiere una explicación. Nuestra
un cierto intervalo, que podemos considerar que es el [O, 1], entonces un problema ecuación diferencial es de la forma Lu = O, con L definida como Lu u, - a.ux. Por
debidamente planteado asignará valores a todos los puntos de la frontera de la región la ecuación (10), el operador de diferencias finitas que reemplaza a L en el proceso
descrita por las condiciones O � x � l, t ;:;; O. En este caso, se pueden utilizar métodos numérico es de la forma:
numéricos implícitos con la ecuación diferencial en (1). Como es de esperar después 1 a.
(A+B) - (C+D),
de los desarrollos vistos en la sección 9.2, de los métodos implícitos se pueden obtener 2 2
mejores propiedades de estabilidad. Uno de ellos lleva el nombre de su autor, Wendroff.
donde A, B, C y D están dados por:
Primero lo escribiremos en una forma que sugiere su origen:
\1 + ei�h +r(e11lh - 1)[ � \1 + e'Jlh - r(e1llh- 1)\. LEMA El error por discretización en el mét odo de Wendroff es O(h2 +k2).
(13)
Al recurrir al problema 6, encontramos que una condición equivalente es: Demostración Por el teorema de Taylor y la ecuación diferencial, tenemos:
Al sustituir x por x + h en la última ecuación obtenemos: (16) en términos de las funciones Wj que se seleccionaron. En el método de Galerkin (al
igual que en otros métodos semejantes), lo que se busca es una solución aproximada de
B = a.ux(x + h, t) + ia.2 kuxx(x + h, t) + O(k2) la ecuación (17). Al mismo tiempo, se deben tomar en cuenta las condiciones iniciales
y en la frontera en (15). Para simplificar, supongamos que cada función básica wj se
= a.u,(x, t) + a.huxx(x, t) + O(h2) + !a.2kuxx(x, t) + O(hk) + O(k2) anula en O y en l. En tal caso las condiciones homogéneas en la frontera se satisfarán
automáticamente con la solución tentativa (16). Después, tomamos el producto interior
Análogamente, para C y D tenemos: de w; con ambos lados de la ecuación (17) para 1 � i � n. El resultado es:
{
orden acompañada por condiciones tanto iniciales como en la frontera:
¿ Vj(O)wj(X) = g(x)
n
Ut = UUx (20)
u(x, 0) = g(x) (O� x � 1) (15) j=l
u(O, t) = u(l, t) = O (t > O) Quizá esto sea de nuevo imposible de satisfacer de manera exacta, en cuyo caso podemos
Comenzamos por seleccionar algunas funciones básicas de x, digamos W¡, w2, ... , w•. escoger Vj(O) de modo que la ecuación (20) se satisfaga en la medida de lo posible,
Queremos resolver el problema con una función de la forma: digamos en la norma L2. En vista de que las funciones w,, forman un sistema ortonormal
(según lo acabamos de suponer), esto significa que:
¿ vj(t)wj(x).
n
u(x, t) = (16) vj(O) = (g, wj). (21)
j =l
La ecuación (20) nos proporciona las condiciones iniciales para la solución del sistema
Las funciones v1, v2, ••• , Yn se encuentran a nuestra disposición para asistirnos en (19). Como ya vimos en la sección 8.11, la solución del sistema es:
la solución de este problema. Cuando la función propuesta en (16) se sustituye en la
ecuación diferencial, el resultado es:
V(t) = /
A
V(O).
¿[v1(t)wj(x) - a.vj(t)w1(x)] = O. (17) Un sistema ortonormal adecuado que consta de funciones que se anulan en O y en 1 es:
j =l
Como usualmente sucede cuando se sigue esta estrategia, no esperamos que la ecuación wj(x) = r 1 !2 sen rcjx.
(17) sea consistente. En otras palabras, no esperamos encontrar funciones Vj que ha
gan verdadera la ecuación. La razón subyacente, por supuesto, es que la solución del Se puede construir un segundo sistema aplicando el procedimiento de Gram-Schrnidt a
problema con valores en la frontera quizá no se pueda expresar al formar la ecuación la sucesión de funciones x H (x2 - x)xj , en donde j = l. 2, ..., n.
644 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.8 Método de mallas múltiples 645
/¡l
Infiera la ecuación (14) a partir de lo anterior.
escrito con un incremento h muy grande. Este sistema tendrá menos ecuaciones, pero
7. Demuestre que en el método de Wendroff el ténnino principal en el error de truncamiento es: éstas tendrán la misma estructura El sistema de ecuaciones tiene la forma:
1 '
12
' (X, t)
-(a.h- - Cl.3 k-)ux:cr
[ 2 -1 Q .. ·
-1 2 -1 . . · O
ºJ [V¡JVz ¡-h2
-h2fz
Ü -1 2 Ü V3 = -h2ÍJ
cs. Programe el método de Lax-Wendroff correspondiente a la ecuación (4). Suponga que la ... . . .. .. ..
solución numérica se va a calcular en el segmento rectilíneo definido por ·a ;;; x ;;; b y . . .
t = T, en donde a, b y T son valores prescritos. Evidentemente,/ y a. son también valores Ü Ü Ü 2 Vn -h2!,.
prescritos. El usuario querrá asignar un valor a los incrementos.
'9. (Continuación) Ponga a prueba el programa que escribió en el problema 8 con el siguiente En consecuencia, este sistema también se puede resolver con la iteración de Gauss-Seidel.
problema: u, = 2u,, con u(x, O) = (1 - x)2 . Tome h = 0.02, k = 0.01, a = 1, b = 2 y Si decidimos hacerlo por este camino, vamos a querer comenzar con un buen vector,
T = l. Compare la solución numérica con la solución exacta. que podremos obtener recurriendo a una malla aún más burda, y así sucesivamente. Por
consiguiente, el lugar privilegiado para comenzar es la más burda de todas las mallas,
que es el caso más simple del sistema (2), a saber, n = I. En este caso, h = 1/2 y hay
sólo una ecuación en el sistema. La solución de esta última es:
9.8 Método de mallas múltiples
VQ = Ü V¡ = -if(l/2) V2 = Q.
El método de mallas múltiples para resolver numéricamente una ecuación diferencial
tiene como base la discretización y aproximación de derivadas por medio de fórmulas de Ahora estamos preparados para pasar a una malla más fina. Para ello dividimos h por 2,
diferencias finitas. El rasgo distintivo de este método es que utiliza diversas mallas sobre sustituimos n por 2n+ l y erigimos el nuevo sistema de ecuaciones. De este modo, n = 3
el dominio, las cuales varían de burdas afinas. Una solución numérica sobre una malla y h = I/4. Denotemos temporalmente con w al vector implicado en este nuevo sistema.
burda se puede calcular rápidamente, pero tendrá una precisión moderada. No obstante, Utilizaremos a v para asignar valores iniciales adecuados a las componentes w0, w1, w2,
puede servir como punto de partida de una solución iterativa sobre una malla más fina w3, w4. En la figura 9.13 mostramos la relación entre v y w. La asignación de valores
Aunque éste es sólo un aspecto de la estrategia de las mallas múltiples, comenzamos al vector w, con base en la información que trae consigo el vector v, se puede llevar a
mostrando cómo opera con un ejemplo muy simple. cabo de diversas maneras. Lo usual es utilizar un simple esquema de interpolación. Para
646 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.8 Método de mallas múltiples 647
ilustrar este aspecto, copiaremos algunos valores de v en w en donde sea conveniente, iteraciones de Gauss-Seidel que se llevarán a cabo con cada malla. La transferencia
y utilizaremos promedios para las componentes restantes. Se utilizarán las siguientes de información de v a w se llama fase de interpolación. Para el paso general del
cinco ecuaciones: algoritmo, utilizamos las fórmulas:
Wo = Vo Wz = V¡ W4 = Vz
W¡ = (vo +v¡)/2 w3 = (v¡ +vz)/2 Wz¡ = Vj w2¡-1 = (v¡-t +vj)/2. (3)
Hecho lo anterior, descartamos al viejo vector v, y lo reemplazamos por w. Después,
con el vector inicial v recien construido, llevamos a cabo algunas iteraciones del método En el seudocódigo, el ciclo que comienza en "for p = 1, 2, ... , k do" ejecuta k pasos de
de Gauss-Seidel. Formamos en este caso una nueva malla reduciendo a h a la mitad y la iteración de Gauss-Seidel. Así, la ecuación (2) se resuelve para la j-ésima incógnita,
cambiando a n como corresponde. Después de ello, se repite el proceso. llegándose a lo si guiente:
• • • • •
Wo W¡ Wz W3 W4
VJ = (vJ-l + VJ+t - h2fJ)/2. (4)
•
V¡
• •
VQ Vz
Esta fórmula se utiliza para actualizar cada v¡, y todo el proceso iterativo se lleva a cabo
o 1 1
2 ;¡ k veces.
Tal como se sugiere en el problema 1, es posible simplificar el proceso de interpo
Figura 9.13. lación que genera a w a partir de v y después reemplaza a v por w. El código se escribió
sólo para fines didácticos, pero se puede utilizar para realizar experimentos, especial
mente con problemas para los que la solución es conocida, pues en tales casos se puede
inputm, k
examinar la diferencia entre la solución real y la solución numérica. Esto se llevó a cabo
h +- I/2; n +- I en el caso f(x) = cosx, para el que la solución del problema con valores en la frontera
va+- O; vz +- O; v1 +- -(I/8)f(h) en dos puntos es:
for i = 2,3 ... ,mdo u(x) = - cos x+x(cos 1- 1)+ l. (5)
h +- h/2; n +- 2n+ I
Haciendo m (el número de refinamientos de la malla) igual a 6 y k (el número de
forj = O,I,... ,(n+ 1)/2do iteraciones de Gauss-Seidel) igual a 3, encontramos una discrepancia próxima a 10-3
Wzj +- Vj entre el valor calculado y la solución real. El valor de h en la última malla es 1/64, y
end h2 � 2 X 10-4•
forj = 1,2,...,(n+ 1)/2do
WzJ-1 +- (11¡-1 +V¡)/2
Amortiguamiento de errores
end
forj = O,I,...,n+Ido Otra componente mayor del método de las mallas múltiples es el tránsito progresivo
y sistemático de mallas finas a burdas. Esta dirección es justamente la contraria de la
Vj +- W¡ que acabamos de explicar, en la que la información de una malla burda se pasaba hacia
end arriba, proporcionando de este modo una base para las iteraciones sobre una malla más
for p = I,2,... ,kdo fina La razón para introducir posteriormente mallas más burdas en el cálculo es que los
forj = I,2,... ,ndo errores de baja frecuencia tienden a ser amortiguados eficientemente en las iteraciones
2
asociadas con una malla burda. E inversamente, los errores de alta frecuencia tienden
Vj +- [Vj-1 +Vj+I - h f(jh)]/2 a ser amortiguados de manera eficiente en las iteraciones sobre una malla fina. La
end estrategia de las mallas múltiples aprovecha esta importante característica, pudiéndose
end decir que éste es el por qué del éxito del método.
output (v¡) Un simple experimento numérico con la ecuación diferencial ( 1) nos mostrará
el amortiguamiento de los errores con diferentes frecuencias. Considere el problema
end. homogéneo;
En el seudocódigo, f es la función que figura en el problema original (1). El {u"= O
(6)
número de mallas que se utilizan (incluyendo la primera) es m, y k es el número de u(O) = u(I) = O,
1�
648 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.8 Método de mallas múltiples 649
=
cuya solución es obviamente u(x) O. Resolvamos este problema con la iteración de
Gauss-Seidel descrita por la ecuación (4) haciendof = O en esta ecuación y comenzando
con una función sinusoidal:
.8
vj = sen(!: ) (O�j�n+I)
1
Aquí n ( al igual que en los casos anteriores) es el número de nodos interiores en el .6
=
intervalo (0, 1). Este número controla la fineza de la malla. En este experimento, ;,.,
o
el vector v se puede considerar como el error, pues la solución del problema es u O.
El parámetro p controla la frecuencia del error inicial. A continuación proporcionamos .4
un seudocódigo que ejecuta k iteraciones utilizando cuatro frecuencias predeterminadas.
La norma del vector se calcula al final de cada iteración de Gauss-Seidel. .2
_(
Acudamos al método de Jacobi para analizar el efecto reductor de las iteraciones
sobre los errores. Cuando se utiliza la iteración de Jacobi con un sistema Ax = b, la jrc jrc 2 jrc n
fórmula de iteración es v(¡)- sen-- ,sen-- , ...,sen-- ) , ( 10)
n+1 n+1 n+1
x(k+I)= ([ -D- 1A)ikJ +D- 1 b, (7)
Por la ecuación (8), los valores propios Aj de la matriz de iteración G son:
donde D es la diagonal de A. En el ejemplo de esta sección, la matriz A correspondiente
a la ecuación (2) es: tv1 = l-!µ·1 = cos jrc. ( I:::;j:::;n)
--
2 -1 O O 2 n+l
-1 2 -1 O
Por consiguiente, el radio espectral de la matriz de iteración es:
A=I0 -1 2 0
7t
1 7t ) 2 = 2
o o o p(G) = cos - 1- - ( -
7t �
2, 1- - h2.
n+l 2 n+l 2
650 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.8 Método de mallas múltiples 651
Ahora podemos extraer algunas conclusiones. Primero, dado que p(G) < 1, la Después de algunas iteraciones del método de Gauss-Seidel sobre la ecuación ( 12),
iteración de Jacobi será convergente, de acuerdo con el teorema 5 de la sección 4.6. tendremos un vector ei-1. Por medio de un proceso de interpolación, que ya hemos
Segundo, notamos que para valores pequeños de h, el radio espectral es casi 1, lo cual analizado, obtenemos un vector e;. Con este último actualizamos vi por medio de la
implica que en las mallas más finas la convergencia será muy lenta. Tercero, podemos operación:
utilizar los vectores propios de A en la ecuación (10) para entender por qué se amortiguan vi +-vi +l
los errores. Los vectores vU) son también vectores propios de G y constituyen una base
para IR". En consecuencia, cualquier error que esté presente en la solución numérica debe Este procedimiento se llama esquema de corrección por medio de la malla burda.
(l) (2l
de ser una combinación lineal de v , v , ... , y(•). Para los fines que aquí perseguimos,
será suficiente considerar una sola componente del error, digamos v U> . Obviamente la
k-ésima iteración sobre v(j) con G dará como resultado 1,.JvW , y como jAj j < 1, esto Algoritmo del V-ciclo
convergerá a O cuando k -+ oo. Pero la fuerza del efecto de reducción será mayor en Nuestro objetivo final es describir lo que se conoce en el algoritmo de mallas
cuanto jAj I sea menor. Los valores pequeños de jAj I están asociados con j en la parte de múltiples como un ciclo V (al que en adelante llamaremos V-ciclo). Este ciclo recibe su
enrnedio del dominio 1 � j � n, mientras que paraj � 1 o j � n tenemos: jAj j � l. nombre del diagrama en la figura 9.15, el cual describe el curso de los cómputos:
En la ecuación (5) se encuentra la solución de este problema. Por ejemplo, hacemos Recnento de operaciones
m = 7, lo que corresponde a h = I / 128 en la malla más fina. Se utilizaron varios
valores de k para determinar el efecto de este parámetro en el error. Aquí con error nos Examinemos el V-ciclo tal como está expuesto en el código para hacer una es
referimos a: timación del costo computacional en el algoritmo de mallas múltiples. Contemos las
operaciones aritméticas que hay en él.
máx lu(xj) -vjl,
O;;éj;;én+I En la parte descendente del proceso se utilizan m mallas diferentes. En la malla gi
hay 2¡ puntos, zi incógnitas y zi ecuaciones. En el método de Gauss-Seidel se necesitan
en donde u es la solución exacta, Xj = jh y vm es la solución aproximada sobre la malla más cuatro operaciones para actualizar una variable. Por lo tanto, en cada malla utilizaremos
fina que produce el algoritmo cuando h = 2-m. Cada vez que el número de iteraciones 4k2; operaciones en la iteración. El cálculo del residuo ocupa 5 · zi operaciones, mientras
de Gauss-Seidel se incrementó en una unidad el nuevo error fue aproximadamente igual que el operador de restricción ninguna. Así, en la i-ésima malla se realizan (4k+ 5)zi
a dos quintas partes del error anterior. Esto fue cierto para 3�k�8. Los subsiguientes operaciones. El total para las m mallas es:
incrementos de k produjeron reducciones menos dramáticas del error, con factores de m
reducción aproximadamente iguales a 0.6, 0.7, ... , 0.9.
¿(4k+5)ZÍ � (4k+5)2m+l = (8k+10)2m .
i=l
inputm, k Un recuento similar para la parte ascendente del V-ciclo arroja un total de aproximada
n ,- 2m -1 mente (8k+4)2m operaciones. Por consiguiente, el ciclo completo comprende cerca de
h <-1/(n+1) l 6(k+1)2m operaciones.
¿Cuáles serán los correspondientes números para un problema bidimensional como,
vj<-O;J/<-0 (l�i�m.O�j�n+l)
por ejemplo, v2u = f(x, y) en el cuadrado unitario? Cada ecuación en la discretización
JT ,_ !Uhl (1�j�nl que nos es familiar incluye cinco incógnitas, y la actualización de cada una de ellas con el
for i = m, m -I, ..., 2 do procedimiento de Gauss-Seidel ocupa cerca de seis operaciones. El número de variables
for p = 1, 2, ... , k do en la i-ésima malla es igual a (zi)2 , pues ahora son dos las variables. De este modo,
2 podemos ver que la consecuencia más importante en nuestro recuento es el cambio de
vj <- [vj_ 1 +vJ+I - h f/]/2 (1�j�n) 2m a 4m _ El factor que multiplica a 4m será un poco mayor que 16(k +1), pero seguirá
end siendo lineal en k.
654 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.9 Métodos rápidos para la ecuación de Poisson 65 5
Las observaciones precedentes nos muestran que el esfuerzo computacional es una Problema modelo
función exponencial de m (el número de mallas) y una función lineal de k (el número
El problema modelo se describe como sigue:
de iteraciones predeterminadas). Esta conclusión es válida para cualquier número de
dimensiones. Q = {(x, y): 0 < x < 1, 0 <y< l}
{ uxx +Uyy=J(x,y) enQ ( 2)
SERIE DE PROBLEMAS 9.8 u(x,y)=Oenan
l. En la fase de interpolación se computa w a partir de v y después se reémplaza v por w. Emprendemos una discretización haciendo:
Encuentre un código eficiente para hacer esto, utilizando sólo el arreglo v.
h=l/(n+l) X¡=ih Yj =Jh (O� i, J � n+1).
'2. En el texto se menciona un experimento numérico diseñado para poner de manifiesto la
reducción de errores de diferentes frecuencias. Repita el experimento.
Después, una manera de tratar el problema (2) que nos es familiar introduce
'3. En el texto se expone un experimento numérico para resolver el problema modelo sobre una
sucesión de mallas más finas. Repita el experimento. Vij ::,; u(x¡, Yj) Íif = f(x¡, Yj).
'4. Repita el experimento numérico que se expone en el texto utilizando el algoritmo del V-ciclo.
Una versión discretizada de nuestro problema es la siguiente:
'5. Programe el algoritmo del V-ciclo para el siguiente problema bidimensional:
h-2(v¡+J,j -2 vij+vi-1)+h-2(v;,j+I -2 vif+vi.j-1) = A (3)
Ux, + U y = f(X, y) Q<X< J Ü<y< l
{ u(x, y) y O En la ecuación (3), el dominio de las variables i yj es { 1, 2, ... , n}. La mayoría de los
= en la frontera.
términos de la ecuación (3) son desconocidos, pero por las condiciones en la frontera
Ponga a prueba su programa paraf(x, y) = 2x(x - 1)+2y(y - !). La solución exacta es necesitamos:
u(x, y)= xy(l - x)(l - y). VOj =Vn+I,j =V¡Q=V;,n+I =Ü. (4)
'6. En el primer código de esta sección, ajuste los ciclos de modo que vo yvn+I (que se mantienen La forma tradicional de proceder en esta coyuntura es resolver el sistema (3) con un mé
constantes) no se estén copiando de un lado al otro. todo iterativo. Aquí hay n2 ecuaciones y n2 incógnitas. El esfuerzo computacional para
'7. Realice algunos experimentos numéricos con el primer código de esta sección a fin de resolver este sistema utilizando, digamos, sobrerrelajamiento sucesivo, es O(n3 log n).
determinar si hay un valor óptimo para k, el número de iteraciones de Gauss-Seidel. La propuesta alternativa que incluye transformaciones rápidas reducirá este esfuerzo a
O(n 2 logn).
'8. Generalice los códigos de esta sección de modo que se les pueda aplicar al problema u"(x) =
f(x), u(a) =ay u(b) = �-
Transformada sinusoidal rápida de Fourier
Se buscará una solución del sistema (3) con la siguiente forma:
9.9 Métodos rápidos para la ecuación de Poisson
Vif=2)kj sen ik$ (O� i,j � n+l), (5)
k=l
La ecuación de Poisson en dos variables es:
donde$=rc/(n+1). En este caso los números Vkj son incógnitas cuyo valor queremos
U;o:+Uyy = j(x, y). (1) determinar. Ellos representan la transformada senoidal de Fourier de la función v. Una
vez determinados los números Vkj, la transformada senoidal rápida de Fourier sirve para
En un problema característico de la física que incluya a esta ecuación, buscaríamos una calcular vij eficientemente.
función u que satisficiera a la ecuación (1) en una región abierta Q y que cumpliese Cuando las Vij de la ecuación (5) se sustituyen en la ecuación (3), el resultado es:
algunas condiciones predeterminadas en la frontera den (que denotamos con BQ). La
función f está definida enn. Í:)kj [sen(i+l)k$-2 sen ik$+sen(i-l)k$]
Recientemente se han resuelto problemas de esta índole con algoritmos muy rápidos, k=I
aplicando el análisis de Fourier. Estos novedosos métodos se valen de la transformada (6)
rápida de Fourier. Aquí expondremos un ejemplo ideal para ilustrar las innovaciones +¿senik$[vk.j+l -2vkj +vk.j-1] = h2fu.
que condujeron a estos nuevos algoritmos. k=I
656 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.9 Métodos rápidos para la ecuación de Poisson 657
Para simplificar la primera sumatoria utilizamos la identidad trigonométrica que se ex no se satisfarán a menos que agreguemos dos ecuaciones:
pone en el lema 2 (más adelante). Al mismo tiempo, introducimos la transformada
senoidal defg :
¿ vk senik$ = ¿ vk.n+l senik$= O
n n
(O�i�n + 1) (9)
f¡¡ = ¿Jk} senik$. k=l
o
k=l
k=l
k=l
(7) deben ser ortogonales a las filas de una matriz que es (por el lema 1) no singular. Por
consiguiente, tenemos que definir:
¿ senik$(v1<,¡+1 -
n n
+ 2vkj + vk.¡-1) = h2 ¿Jk} senik$
Vko = vk.n+t =O
k=l k=l
(1 � k � n).
Por el lema 1 (más adelante), la matriz con componentes sen ij$ es no singular. Por
consiguiente, podemos deducir de la ecuación (7) que: LEMA 1 La matriz A de (n -1) x (n -1) y componentes
• (- 4sen2 k$ ) + Vk,j+l
• · • 2+: 1 2
- 2V + Vk,j-1 = h Jkj· (8) ªki = (2/n) / sen n (1� k � n -1, l �j� n -1)
kjrc
Vkj 2 kj
Todo parece indicar a primera vista que la ecuación (8) es un sistema de n2 ecuaciones con es simétrica y ortogonal. En consecuencia, A2 = l.
n2 incógnitas ligeramente distinto del original. No obstante, una inspección minuciosa
revela que en la ecuación (8) k se puede mantener fija, y el sistema resultante de n Demostración Calculemos un elemento arbitrario de A2.
ecuaciones se puede resolver directamente con suma facilidad, pues es tridiagonal. Por
consiguiente, para una k fija, las incógnitas en (8) forman un vector kvrc ·v
"""" akvav¡ = (2/n) """"
n-l n-l
A2kj = L., L., sen - sen L!:.
(vki, vk2, ... , vkn)
n n
=! v�
( -) j)rc
= (1/n) � [cos v k n j rc -cos v k + ]
(
en lR". El procedimiento que acabamos de utilizar separa el sistema original que consta de n
n2 ecuaciones, enn sistemas con n ecuaciones cada uno de ellos. Un sistema tridiagonal v=l
den ecuaciones se puede resolver con O(n) operaciones (de hecho, se requieren menos de
= (ljn)Re ;(eiv$ _ eive )_
[n-l l
10n operaciones). De este modo, podemos resolver n sistemas tridiagonales a un costo (10 )
de 10n2 operaciones. La transformada senoidal rápida de Fourier utiliza O(n2 log n)
operaciones cuando se aplica a un vector con n componentes. Por consiguiente, la carga
computacional completa en el método rápido de Poisson es O(n2 log n). donde$= (k -j)rc/n y 8 = (k +J)rcjn.
Si k = j, entonces$ = O y 8 = 2k rc/n. Además, 8 no es un múltiplo de 2rc, ya que
1�k � n -l . debido a ello, en este caso:
Detalles adicionales
Aún debemos comentar algunos detalles en el análisis precedente. En primer lugar, , einíl -1
Akk = (ljn)Re [n - -.- -] =1
observe que a partir de la ecuación (5), las condiciones en la frontera 8 e' -I
V¡Q = Vi,n+l = Ü
Capítulo 10
658 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales
1 cos$-1 cos$-1 1
Re[ $ ] = = =- °
ei-1 (cos$-1)2+sen2$ 2-2cos$ 2
Esto es cierto en particular para$ = 8, de modo que los dos términos en la parte izquierda *10.1 Convexidad y desigualdades lineales
de la ecuación (11) son idénticos. 1B
LEMA 2 sen(A +B) -2sen A+ sen(A -B) = -4 sen A sen2 ! La teoría de las desigualdades lineales mantiene un estrecho paralelismo con la más
conocida teoría de las ecuaciones lineales. En este capítulo desarrollaremos los conoci
mientos básicos en este tema e indicaremos algunas de sus aplicaciones.
Demostración Utilice las siguientes identidades trigonométricas:
1 -cos 2A = 2sen2 A Todos los vectoresy las matrices que se utilizan en este tema son reales (no com
plejo), pues la teoría hace un uso esencial de la estructura de orden de la recta real. Si x
11 yy son dos puntos (vectores) en R", escribimos:
A¡x� b¡,
659
*10.1 Convexidad y desigualdades lineales 661
660 Capítulo 10 Programación lineal y temas relacionados
l relativa a esta Con base en la figura 10.l se puede ver que si se invierten las desigualdades en el sistema
donde A¡ es i-ésimo vector fila de la matriz A. Una pregunta esencia (2), el sistema que resulta de ello es inconsistente. Asimismo, haciendo algunos cambios
de su consist encia. La pregun ta es: ¿hay un vector x tal que
clase de sistemas es la algorit mo para muy simples a la matriz de coeficientes, podemos exhibir un sistema con un conjunto
mos dispon er de un
Ax ;:;; b? Si el sistema es consistente, nosotros querre solución no acotado. (Por ejemplo, al sustituir -3 con -1 en la tercera desigualdad.) La
¡
desigu aldade s lineale s con sistema s más
encontrar sus soluciones. Es posible considerar gráfica también nos muestra que el conjunto solución es convexo, un hecho que vamos
generales: a fundamentar de inmediato. (La teoría básica de los conjuntos convexos se puede
¿a,jX¡;:;; b¡ (1 � i � m1) consultar en la sección 6.9.)
He aquí algunos teoremas relativos a los conjuntos solución.
t
¡=1
1111
y nos encontramos ante un semiespacio que no contiene a p. c = sup{ (v,x):x E K}.
y cerrado y Y un conjunto
TEOREMA4 (Teorema de separación II) Sean X un conjunto convexo
convexo y compacto (en lR" ). Si X y Y no se intersec an, entonce s hay un vector v E JR" Como O E K, tenemos que c � O, y como K es compacto, este supremo se alcanza en
algún punto. Esto significa que el conjunto
tal que:
ínf (v,x) > sup(v, y) K' = {x E K: (v,x) = c}
xEX yEY
LJ:1
dimensión finita no es necesario tomar la cerradura. Vea, por ejemplo, Holmes [1972, conjunto de todos los puntos que se pueden escribir como 2...,� 1 8;x;, con 8; i;; O, }:;=1 8;=
pág. 82]. 1 y x;EX. Demuestre que Hn es convexo, y que éste conjunto es co (X).
23. Denotemos con xy al segmento rectilíneo que une a los puntos x y y en JR". Dado un conjunto
SERIE DE PROBLEMAS *10.1 Xo, defina X1, X2, ..., Xk con la igualdad Xk+I = U{xy: x EXk, y E Xk}. Demuestre que
X2•+1 = co (Xo).
1. Demuestre que todo conjunto convexo y cerrado es la intersección de todos los semiespacios
abiertos que lo contienen. Un semiespacio abierto es un conjunto de la forma {x : (a, x) > "'}.
2. Demuestre que pEco(X) si y sólo si OEco(X - p). *10.2 Desigualdades lineales
3. Demuestre que si S y T son conjuntos convexos. entonces 1,,S, S + T y S - T son convexos.
(El conjunto S + T se define como el conjunto de todas las sumas s+I, dondesES y tE T.)
Sea X un espacio vectorial sobre el campo de los números reales. Un funcional lineal
4. Demuestre que si L es un mapeo lineal y K un conjunto convexo, entonces L(K) es convexo.
(El conjunto L(K) se define como el conjunto de todos los puntos L(x), donde xEK.) es un mapeo lineal de X en R Una desigualdad lineal es un enunciado de la forma
f(x) � a, en donde f es un funcional lineal. Una sola desigualdad de este tipo tiene
5. Demuestre que
CO(A.S) = A.CO(S) co(S + T) = co(S) + co(T). como conjunto de soluciones un semiespacio {x:f(x) � a}. Aún más interesantes son
los sistemas de desigualdades lineales, f¡(x) � CL; (i E !), donde I es un conjunto de
6. Sea X un conjunto convexo y cerrado en un espacio de Hilbert. Demuestre que si p rf. X, índices no necesariamente finito.
�EX y ¡¡p- �11 = dist(p, X), entonces (p - �. x - �) � O para todaxEX.
7. Sea U un coajunto compacto en lRn. Demuestre que si el sistema de desigualdades linea
les (u,x) > O, con u en U, es inconsistente, entonces el sistema contiene un subsistema Sistemas de ecuaciones homogéneas
inconsistente de a lo sumo n + 1 desigualdades.
Comenzamos con un conocido teorema del álgebra lineal que atañe a los siste
8. Demuestre que si K es un conjunto convexo y cerrado de un espacio de Hilbert, entonces mas de ecuaciones lineales homogéneas, y después pasamos a uno análogo relativo a las
para cada punto p rf. K hay un único punto kEK lo más cercano a p. desigualdades. Denotamos con!° al espacio nulo de un funcional!:
9. Demuestre que el mapeo p >-> k definido en el problema 8 es no expansivo. De esta manera,
si (p i , k1) y (p2. k2) son dos parejas de mapeos, entonces llk1 - k2II � IIP1 - P2ll- f° = {x E X:f(x) = O}
10. ¿Puede un conjunto acotado tener un complemento convexo?
Así mismo, l(f1,f2, •.• Jm) representa al espacio generado por el conjunto
11. Demuestre que si los conjuntos X; son convexos, entonces co(X1 U · · · U Xk) es el conjunto {!1 .f2 , .•. ,
fm},
de todas las combinaciones convexas =l 8;X; en que X;E X;.
r:
12. Demuestre que la cerradura de un coajunto convexo es convexa. TEOREMA 1 (Dependencia lineal) Para todo conjunto defuncionales lineales, las siguientes
propie
13. Sean K un conjunto convexo, p un punto interior de K y q cualquier punto de K. Demuestre dades son equivalentes:
que si O< 8< 1, entonces 8p + (1 - 8)q es un punto interior de K. (iJ f :J n¡=i f?
º
14. Demuestre que si el sistema de desigualdades (u,x) > O para u E U es consistente, también (ii) f E l(f¡, h, ...,Ím)
lo es el sistema (u, x) > O para u Eco( U).
15. Demuestre que si S y T son compactos y convexos, también lo es co(S U T). Demostración La implicación (ii) =} (i) es muy fácil de demostrar. Sif =
¿�=l A¡f¡ y x E íl1:i ffl,
16. Demuestre que si X es un conjunto de JR• acotado, entonces para toda p entoncesf¡(x) = O para toda i y por endef(x) = O.
Para la recíproca, procedemos por inducción sobre m. Sea m = 1 y suponga que
sup{IIP -xll:xE X}= sup{IIP -xll:xEco(X)}.
f :) fi. Sif1 = O, entonces Ji°= X. En consecuencia,!º = X y f = O. En este caso
º
17. Demuestre que si U es un conjunto convexo y compacto y el sistema (u. x) > O es inconsis concluimos quef E l(f1 ). Sif1 ,t:: O, tome un punto y tal quefi(y) = 1 y un punto
tente (u E U), entonces lo mismo es cierto para el sistema (u, x) > O, con u en el conjunto arbitrario x de X. Tenemos quef1[x - f¡(x)y] = f¡(x) - f¡(x)f¡(y) = O, de modo que
de puntos extremos de U. x - f1(x)yEfi°, Por hipótesis, x - f1(x)y Ef. Por consiguiente,f(x) -f¡(x)f(y) =
O
18. Demuestre que todo conjunto convexo en el plano es la unión de todos los triángulos que of = f(y)f¡, de modo quef E l(f¡).
tienen sus vértices en él. Para el paso inductivo, suponga que el teorema ya se demostró para un entero
19. Sea X un subconjunto finito de JR• con al menos n + 2 puntos. Demuestre que X se puede my que
escribir en la forma X1 U X2 teniendo co(X 1) n co(X2) = O. !° :J n¡;tJ;°.
temas relacion ados *10.2 Desiguald ades lineales 667
666 Capítulo JO P rogr amación line al y
o e X. Si denotamos la restricci ón a Y con l a Como O E C, tenemos que k ;;;; O. Si k < O, elija una u E C tal q ue k ;;;; (v, u) < O.
Sea Y == fm+i· Se trata de un sub espaci d
Para toda t positiva tene mos tu E C. Si t es sufici entemente grande , tendre mos que
notación f\Y, tendre mos:
(f\Y) º :J nf=1 ( .fi\Y) (v, tu) < k, lo que constituye una contradicción. Por consigui ente, k = O y
P or hipótesis de inducción, m
(v,f) < O ;;;; (v, u)
f\Y == 2)-¡.fi\Y, para u E C. Se sigue que f(v) < O ;;;;f¡(v), y (i) es falso. 11
i=l El teorema de Farkas tiene la siguiente formulación en términos de vectores y
las '/e . Ah r tenemos dos ecuaciones eq uivalentes, (f - matrices.
eligiendo convenientemente
o a
a,
· Utilizando el caso m == l de este teorem
¡
I:;=1 t..;f¡)\Y == O y (f -I:;=1 1..;f¡)° :) fm+i TEOREMA 3 !.As siguientes propiedades son equivalentes par a toda matriz A y todo vector c:
concluimos q ue:
(i) P ara toda x, si Ax � O, entonces crx � O.
m
f - I>¡f¡ == A.m+tÍm+l•
i=l
(ii) Par a alguna y, y� O y c=Ary.
11
para alguna A.m+l · Sistemas consistentes y sistemas inconsistentes
Desigualdades lineales
A continuación p resentamos un análogo no homogéneo del teorema anterior. E n
es lineales. En él hacemos uso de la siguiente terminología: un sistema de desigualdades f¡(x) � a.;
e teorem a p ara desigualdad
Pasemos ahora al análogo exacto de est acios: se dice que es consecuencia de otro sistema g;(x) ��¡, si cada solución del segundo
vez de los espacios nulos de es
tos funcionales, utilizamos los semiesp también lo es del primero. De este modo:
¡+ == {x E X:f(x) � O}. {x: g;(x) �� ¡ para toda i} e {x:f¡(x) � a.; para toda i}
do
fz, . . . , fm, consideramos el cono genera
En vez del espacio lineal generado por f1 , TEOREMA 4 (Teorema no homogéneo de Farkas) Si una desigualdad lineal f (x) �a. es consecuen
{t
por ellos: cia de un sistema consistente de desigualdades lineales
C{f¡,f2, ....fm}=
�o}.
t..;f¡: t..; g;(x) � �¡ (1 ;;;; i;;;; n),
,=l
lentes p ara los funcionales li entonces, p ara un a colección 8; �O adecuada, tendremos que
son propied ades equiva
TEOREMA2 (Farkas, 1902) Las siguientes n n
neales f, f¡:
Ci)r :) nf=,K
f = ¿8;g; y ¿8;�¡ �a.
i=l i=l
(ii) f E C(f1.f2, ... .fm)
Demostración Considere el sistema
suponga q ue
Demostración Si (ii) es verdad, entonces (i)
se sigue con facilidad. Ciertamente , g¡(X) - A.�¡� 0 (t..> 0). (1)
m Si un par (x, 1..) resuel ve el sistema (1), ento nces g¡(x) � A.�¡ y g;(x/1..) � �¡. Según
f = 'Et..¡f¡ nuestra hipótesis,f(x/1..) � a.. Por consiguiente,
i=l
O. f (x) - 1..a. � O. (2)
para toda i, y es ob vio tambiénf(x) �
con t..;� O. Si x E n7=¡Jt, entonces f¡(x) �O mostración b ajo la hipótesi s de que
una de
Para la implicación inversa, daremos da. Esto nos muestra que la desi gualdad (2) es una consecuenci a del sistema (1). Ahora
li al d l forma f(x) == (v, x) para una v apropia considere el sistema
X == iR". Todo funcion al ne es e a
p ,
, ....fm ). Por el teorema de se aración
Suponga que f r/:. C, donde C es el cono C(f1,f2
g;(x) - A.�¡ �O (t.. �O). (3)
hay un vector v tal que: Si (2) es una consecuen cia de (3), la forma homogénea del teorem a de Farkas es aplicable,
(v,f) < ínf (v, u) concluyéndose que :
uEC
[:]�O.
/b � a.
[A I] =b (9)
es consistente.
(Nota: éste es conocido como el teorema de Ville, 1938.) Recordamos al lector que si x=(x 1, x 2, •.. , x.)7 , entonces la desigualdad vectorial
3. Sea P.= {x E IR":x f: Oy :z::;;=1 x1=l}. Demuestrequepara toda matrizA dem x n, o x O significa X¡ O para cada iE{1, 2, ... , n}. De la misma manera, la desigualdad
Ax f: Oparaalguna x E P. oATy;; Opara alguna y E Pm.
4. Con la notación delproblema 3, demuestrequepara toda matrizA de m x n, Ax�b
-
15. Demuestreque alguno de los signientes sistemas es consistente, mas no ambos: ( v)Si la función objetivo incluye una constante aditiva, ésta no tiene ningún efecto
(i) Ax=b sobre la solución. De este modo, el máximo de crx + � se logra en el mismo
(ii) AT y=O bT y=1 punto que el máximo de crx.
(vi) Si un problema no requiere que una variable Xj sea no negativa, podemos
[ - ;;;
reemplazar Xj por una diferencia entre dos variables que se requiere que sean
103 Programación lineal no negativas, digamos, Xj=Uj vj.
Ejemplo Convierta el siguiente en un problema de programación lineal en forma estándar:
El término programación lineal no se refiere a la programación de una computadora
sino a la planeación de un negocio o de un proyecto económico. Se ha asignado a este Minimizar: 7x1-x 2 +x 3 -4
término un significado técnico específico: quiere decir encontrar el valor máximo de
X¡ +Xz X3 2
una función lineal de n variables reales sobre un conjunto poliédrico convexo en JR" .
Elegimos la siguiente forma estándar del problema: 3x¡ +4x2 +x3=6
Restricciones:
Problema (Problema de la programación lineal) Sea e EIR", b EIR y A E IRmx •. Encuentre el
m lx1 -2t2 +3x3 J � 5
valor máximo de crx sujeto a las restricciones x EIR", Ax�by x;;; O. X¡;;; Ü, Xz�Ü
67 2 Capítulo JO Programación lineal y temas relacionados 10.3 Programación lineal 673
Respuesta Sean u1 = x¡, u2 = -x2 y u3 - u4 =x3. Ahora tenemos: Si la igualdad se cumple en este caso, entonces x y y son soluciones de sus respectivos
problemas.
Maximizar: -7u1 -u2 -u3 + u4
-U¡ + U2 + U3 - U4 ;:¡; -2 Demostración Los puntos x y y satisfacen
3u¡ -4u2 +u3 -u4;:¡; 6
x;;;o Ax;:¡; b yfO -Ary;:¡; -c.
-3u¡ +4u2 -u3 +u4;:¡; -6
Restricciones:
u¡ + 2u2 + 3u3 - 3u4;:¡;5 De ahí que
CT ;:¡; (ATylx =lAx;:¡;/b = bTy
X
-u¡ - 2u2 - 3u3 + 3u4;:¡;5
Los valores v¡ y v2 de los dos problemas deben por consiguiente satisfacer
u¡ f O, u2 f O, u3 f O, u4 f O
11 CT ;:¡;V¡;:¡; bT
X y
Un problema (A, b, e) de programación lineal puede o no tener solución. Para -bTy;:¡; Vz;:¡; -CT . X
comenzar, el conjunto factibleK puede que sea el conjunto vacío, en cuyo caso no hay
solución alguna. Si el conjunto factible no es ni vacío ni acotado, puede suceder que la Si CTX= bT , está claro que CT = V¡ = bT y = -Vz.
X ill
función objetivo no tenga cota superior enK. En este caso v = + oo y no hay solución y
enK.
!
TEOREMA 2 Si un problema de programación lineal ysu dual tienen puntosfactibles, entonces ambos
Problema dual problemas tienen solución, siendo el valor de una solución el negativo de la otra.
Podemos asociar a cualquier problema (A, b, c) de programación lineal otro pro
blema (-Ar , -e, -b). Este problema se llama problema dual del original. Por ejemplo, Demostración De acuerdo con el teorema 1, es suficiente con demostrar que hay unax y una y tales que
el problema
XfÜ Ax;:¡; b yfO - AT ;:¡; -c
y CT f br .
X
Maximizar: 3x1 - 2x2 y
7x1 +x2;:¡; 18 Ciertamente, un par (x, y) de este tipo nos proporciona una solución x para el problema
-3x 1 +5x2;:¡; 25 original, y una solución y para su dual. Nuestra tarea es demostrar que el siguiente
Restricciones: sistema de desigualdades lineales es consistente:
6x1 -x2 ;:¡; 13
Maximizar: - 18y1 - 25y2 - 13y3 Supongamos que el sistema es inconsistente y tratemos de deducir una contradicción.
-7y¡ + 3y2 - 6y3;:¡; -3 Por el teorema7 de la sección 10.2, el siguiente sistema es consistente:
Restricciones: { -y¡ -5y2 +y 3;:¡; 2
Y1 f O, Y2 f O, Y3 f O
AT O
[ O -A
-cJ
b
u
[ ]>
� = O
[º]
La relación entre un problema de programación lineal y su dual es el tema de la teoría
de la dualidad. A continuación desarrollamos algunos de sus resultados sobresalientes. [bI' -cT 0] [�] < 0
TEOREMA 1 Si x es un puntofactible del problema de programación lineal (A, b, c), y si y es un punto
factible del problema dual (-Ar , -c, -b), entonces
CrX;:¡;lAx;:¡; bry.
[�] fo.
674 Capítulo 10 Programación lineal y temas relacionados 10.4 El algoritmo símplex 615
En las fórmulas anteriores u y v son vectores y¡,., una constante. Supongamos que (u, v, A) Demostración Si x y y son soluciones, entonces por los teoremas 1 y 2,
satisface a este sistema. En tal caso
lb=bTY=lAx=CTX=XTC.
Aru-A.e�O - Av+A.b�O brU- CrV < Ü
u�O v�O A,� o. Esto nos da la ecuación l(b -Ax)= O. Como y � O y b -Ax � O, concluimos que
y¡(b¡ - (Ax);)= O para cada i. De este modo, (Ax); = b; siempre que y; > O. La otra
1
Si A > O, entonces A-1 v es factible para el problema (A, b, e) y A.- u lo es para condición se alcanza con un argumento de simetría.
el problema dual, (-A r, -e, -b ). En consecuencia, por el teorema 1 tenemos que A la inversa, suponga que y¡(b; - (Ax);) = O y x;(c; - (Ary);) = O para toda i.
cr(";..- 1 v);; br (";..- 1 u) y br u - crv � O, lo que constituye una contradicción. Tenemos que:
bry=lb=lAx=xTATy=XTC=CTX.
Si";.. = O, entonces Aru � O � Av. Tomando un punto factible x del primer
problema y un punto factibley del problema dual, contradecimos una desigualdad previa: Por el teorema 1, x y y son soluciones de sus respectivos problemas. 11111
es inconsistente. El sistema que se obtiene al omitir la tercera desigualdad es, por razones
obvias, consistente. Escribamos el sistema inconsistente en la forma: 10.4 El algoritmo símplex
[�r]Y� [�] bry;;brYo· A través de distintas técnicas estandarizadas todo problema de programación lineal puede
transformarse en uno de la forma siguiente:
Aplicando el teorema no homogéneo de Farkas de la sección 10.2, concluimos que el
sistema Forma estándar (Segundaforma estándar) Maximice cr x sujeto a las restriccionesAx=by x�O, en
donde X E in, e E in , b E im y A E imxn .
[A I] [:] = b [xr ur ] [�] �b yo
r
[:] [�]
� Conceptos básicos
es consistente. Por consiguiente, Recuerde que la expresión crx define a la función objetivo. Queremos notar que
si un problema de programación lineal tiene restricciones de la forma
Ax + u=b xr e�brYo x�O u�o.
Ax�b,
Se sigue que
Ax;;b CT X�bryo X� 0. entonces, con la introducción de un vector u�O ( cuyas componentes se llaman variables
de holgura), podemos escribir:
Por el teorema 1, x es una solución del problema original. 11111
Ax+u= b,
TEOREMA 4 Sean x y y, respectivamente, puntos factibles de un problema de programación lineal obteniéndose de esta manera la segunda forma estándar que acabarnos de ver.
y su dual. Estos puntos son soluciones de sus correspondientes problemas si y sólo si Para un problema en la segunda forma estándar, el conjunto factible es
(Ax);= b; para cada índice i tal que y¡> O y (Ary)¡= e¡ para cada índice i tal que
X¡ >Ü. K = {x E in:Ax = b, x � O}.
s 10.4 El algoritmo símplex 677
676 Capítulo JO Programación lineal y temas relacionado
Demostración Sea E el conjunto de puntos extremos de K. Para cada x E E, l(x) C {1, 2, ... , n}, de
Para cada x E K, definimos el conjunto de índices para los que las componentes de x
modo que I: E -+ 2 { I,2.....n}. (La expresión 2s denota a la familia formada por todos los
son positivas como sigue:
subconjuntos del conjunto S.) La transformación I definido de esta manera (sobre E) es
uno a uno. Para convencernos de esto tomemos x, y E E con x * y. En tal caso:
l(x) = {i: 1 � i � n, y X¡ > O}.
Las columnas de la matriz A se denotan con A1, A2, ... , A•. La ecuación b = Ax = ¿x;A; = L x;A;
i=l iEl(x)
L y;A¡.
Ax = b
b =Ay = ¿y;A¡ =
i=I iEl(y)
se convierte en n
¿x;A; = b. Sil(x) = l(y) fuese cierto, el conjunto {A;: i E l(x)} no sería linealmente independiente.
i=l La posibilidad de mapear inyectivamente al conjunto E en 2 { I,2.....n} nos demuestra
Ahora podemos enunciar un importante teorema. que el número de elementos de E no puede ser mayor que 2". 1111
El algoritmo símplex de Dantzig [1948] consta de dos partes. En la primera, se
TEOREMA 1 Sea x E K. Las siguientes propiedades de x son equivalentes: determina un punto extremo inicial xOl de K. En la segunda, a partir de xOl , se genera
(i) x es un punto extremo de K. una sucesión de puntos extremos de modo que la función objetivo se incremente con
(ii) {A;: i E l(x)} es linealmente independiente. cada punto generado. Denotemos la sucesión con Jll, x(2l, .... Se sigue que cTJI) <
cT}2l< .... Si el problema no tiene solución, esto se descubre durante el desarrollo del
Demostración Suponga que (ii) es cierto. Vamos a demostrar que (i) también es cierto. Sea x = algoritmo. Si el problema de programación lineal tiene solución, el algoritmo produce
eu +(1-8)v, donde u E K, v E K y O< e< l. Para cada i rf. l(x) tenemos que: un punto extremo x(kl que lo resuelve; es decir, maximiza a la función objetivo.
Si recordamos que u; ;;; O y v; ;;; O, llegamos a la conclusión de que u¡ = v; = O para Vamos a describir en su forma abstracta la segunda parte del algoritmo. Asumimos
i rf. l(x). Tenemos en consecuencia que: la siguiente hipótesis:
Suposición (Suposición de no degeneración) Cada punto extremo del conjunto factible K tiene
O= Au -Av = ¿(u; - v;)A; = ¿ (u¡ - V¡)A;. exactamente m componentes positivas.
i=l iEl(x)
Suponga que x es un punto extremo de K. Por el teorema anterior, el conjunto
de K.
por (ii), concluimos que u; = v;. Por consiguiente, x es un punto extremo {A;: i E l(x)} es linealmente independiente. En consecuencia, por la hipótesis de no
Ahora suponga que (i) es cierto. Si degeneración, se trata de una base de Rm . (Es por esto que en la literatura se refieren a
L W¡A;
x como puntofactible básico.) Debe haber coeficientes Dij tales que:
L D;jAi
= O,
iEl(x) Aj = (1 �j � n).
iEl(x)
para toda i rf. l(x), haga w; = O. Obviamente,
Si i rf. I(x), simplemente hacemos Dij = O. Por consiguiente:
L (X¡± A.W¡)A¡ = b. n
iEl(x)
Aj= ¿DgA;
i=l
Dado que x; > O para cada i E l(x), podemos elegir una A i: O suficientemente pequeña
para que x; +1cw; > O y x; - A.W¡ > O para i E I(x). En tal caso u = x+lw y v = x - lw
son dos puntos factibles. Como x = �(u+v) y x es un punto extremo de K, concluimos A = ADT.
que u= v y que w = O, con lo cual qÜeda demostrado (ii). 111
Defina
d = Dr c,
COROLARIO El conjunto factible K sólo tiene un número finito de puntos extremos.
678 Capítulo 1O Programación lineal y temas relacionados 10.4 El algoritmo símplex 679
donde e es el vector que aparece en la función objetivo. Observe que D y d dependen Por el teorema 1, es suficiente con demostrar que el conjunto
de x, y que cambiarán a lo largo del algoritmo.
Para todo índice q i I(x) y toda A. E lR {A;: i E l(x)U {q} \ {p}}
n n
es linealmente independiente. Suponga que
b = Ax = ¿x;A;+A.Aq-11. ¿D;q A;
i=l í=l L p¡A¡+P A = o conpp = O.
L (X¡- A.D +A.O; )A¡
q q
n
iE/(x)
= iq q
i=l Si P q = O, entonces la ecuación se reduce a
=¿Y;A; ¿M; = ü.
i=l iEI(,:)
Por lo tanto, La independencia de {A;: i E /(x)} implica quep; = O para i E l(x). Por consiguiente,
Ay = b,
todas lasp¡ son cero en este caso. Podemos pasar en consecuencia al caso en quepq ;:: O.
donde y = x- 11.Dq + 11.dq . En este caso Dq denota a la q-ésima columna de D. Nuestro Por homogeneidad, podemos suponer quepq = -1. Nuestra ecuación ahora se lee:
propósito es por ahora elegir q y A. de modo que y sea un punto extremo de K (es decir,
y � O) y CTy > CTX. Aq = ¿ p¡A; con PP=O
En vista de que q i l(x), Dqq = O y Xq = O. En consecuencia, Yq = A.. Como y iEl(x)
tiene que ser un punto factible, necesitamos que A. � O. Ahora calcule:
También tenemos:
L C¡X¡- A. L C¡D; +A. L C¡O¡ ¿ D; Aí = L D; A;.
n n n n
C y=
T
q q
Aq = q q
i=l i=l i=l i=l iEl(x)
=c x-11.cT Dq +A.cq
T
De la independencia lineal de {A;: i E /(x)} inferimos quep¡ = D;q , No obstante, esto
=CT X+A.(Cq- dq) no puede ser cierto, puespP = O y Dpq > O, como ya lo habíamos señalado. Por lo tanto,
pq debe de ser cero. Hemos demostrado que y E K y es un punto extremo.
Para incrementar el valor de la función objetivo debemos elegir q de modo que cq > dq . Nos resta un detalle por demostrar; a saber, que si e ;;;; d, entonces x es una solución.
Si e � d, no hay q alguna que satisfaga esta condición y el cálculo termina: x es una Sea u un punto factible. Entonces Ax = b = Au = A(DTu). Se sigue que x = Dru,
solución. De lo contrario, lo usual es elegir q de modo que cq - dq sea lo más grande pues Ax y ADTu son combinaciones lineales de {A;: i E l(x)}. En este caso tenemos la
posible. De ahora en adelante, q representa un valor fijo. condición cT u � dr u=cTDu=cr x, que queríamos demostrar.
Debemos elegir A. de modo que A. > O e !(y) tenga a lo sumo m elementos. Por
definición, sabemos que !(y) C l(x) U {q}. Como l(x) tiene exactamente m elementos, Ejemplo Vamos a mostrar cómo trabaja el algoritmo símplex en un caso concreto. El problema
{
seleccionamos A. de modo que uno de los términos x; - 11.D;q sea cero y los demás que se va a considerar es el siguiente:
mayores o iguales a cero. Observe primero que si D;q � O para 1 � i � n, entonces
y E K para toda A.> O. Por la fórmula precedente (para cTy), podemos ver que en este Maximizar: F(x) = X¡ +2x2+X3
caso lími.-oo cTy = +oo. En consecuencia, no hay solución y la función objetivo no X¡ +Xz+X5 = 1
está acotada en K. Si D;q > O para uno o más valores de i, podemos considerar que A. se Restricciones: x1 +x3 +X4+ xs =1
incrementa a partir del valor cero. Al principio, x;-11.D;q > O para i E l(x). Algunos de
estos términos son decrecientes, y cuando alguno de ellos se vuelve cero, tomamos la A. X¡ � O, (1 � i � 5)
correspondiente. Formalmente,
Solución Los datos son:
A. = mín { �;/ X¡ > 0, D;q > O}
A= [
1 1 O O 1
1 O 1 1 1]
b=
[ i] CT = (1, 2, l , O, 0).
Habiendo determinado plenamente a y de esta manera, queremos verificar que se trata
de un punto extremo. Sea, en primer lugar, A.= xp /Dpq , donde pes tal que Xp > O y Comenzamos con x = (O, 1, O,!, Of e l(x)={2, 4}. Observe que {A2,�} es una base
Dpq > O. En tal caso, de JR2 • En consecuencia, por el teorema 1, x es un punto extremo del conjunto factible,
I(y) e l(x)U {q} \ {p}. o un punto factible básico.
680 Capítulo JO Programación lineal y temas relacionados
10.4 E l algoritmo símplex 681
º]
Cada columna de A es una combinación lineal de A2 y A4. De hecho tenemos que Por consiguiente tenemos:
A1 = A2 + A4, A2 = A2, A3 = A4, A4 = A4 y As = A2 + A4. Por consiguiente, la
º]
matriz D es
o o o o Maximizar: F(x) = (6, 14,O,O, o/ x
1 1 O O 1 2 1 1 O 12
D= [O O O O O . [
2 3 Ü 1 0 X= 15
[21]
Restricciones:
1 O 1 1 1 {
o o o o o x � (:,x:x3�x4,�d � 0
El vectordT es una combinación lineal de las filas D; de D:
Nuestro primer vector será x = (O,O,12,15,2 ll. Todos estos datos se compendian en
dr = ,rD = ¿ c;D; = D1 +2D2 +D3 = (2,2,O,O, 2f la primera tabla.
i=l 6 14 o o o o
El vector e - d viene dado por: 2 1 1 o o 12
c-d= (-1,O, 1,O,-2/; 2 3 o 1 o 15
q = 3 y sólo una componente es positiva. El vector x = ')..,Dq ( en donde Dq denota la
q-ésima columna de D) es:
7 o o 1 21
o o 12 15 21
x - ')..,Dq = (O,1,O, l, o/ - ')..,(0,O,O,1, o/ = (O,1, O,1 - "'· o/.
Cada paso del algoritmo símplex comienza con una tabla. El primer renglón contiene
Tomamos').., = 1; el vector y es: coeficientes que corresponden a la función objetivo F. El valor en curso de F(x) = cTx
y = x - Wq+ 1cd3 = (O, l,1,O,O/. se despliega en la esquina superior derecha. Los m renglones siguientes de la tabla repre
sentan un sistema de ecuaciones que engloban las restricciones de igualdad. Recuerde
Ahora repetimos el proceso con y en el lugar de x. Sin entrar en detalles, diremos que que se puede efectuar operaciones elementales con los renglones en este sistema sin
en el siguiente paso d = (3,2, l, l. 3f. Como e � d, y es una solución y F(y) = 3. fl alterar el conjunto de soluciones. El último renglón de la tabla contiene al vector x en
¡
curso. Observe que F(x) = cTx se calcula fácilmente utilizando el primero y el último
Método tabular renglón. La tabla precendente es de la siguiente forma general:
En la práctica el método símplex se suele llevar a cabo con una tabla en la que se
exhiben los datos. La tabla se va modificando en los pasos sucesivos conforme a ciertas CT o F(x)
reglas. Ilustramos esta forma de organizar el algoritmo con un pequeño ejemplo: A I b
Maximizar: F(x) = 6x¡ +14x2 x ( no básico) x ( básico)
2x¡ +Xz � 12
2x¡ +3x2 � 15 Reglas para las tablas
Restricciones:
¡
X¡ +7Xz � 21 Las tablas que se utilizan en el método símplex deben satisfacer cinco reglas, a
saber:
x1 � O, x2 � O
1. El vector x debe satisfacer la restricción impuesta por la igualdad Ax = b.
Al preparar el algoritmo símplex introducimos variables de holgura y reescribimos el 2. El vector x debe satisfacer la desigualdad x � O .
problema como sigue:
3 . Hay n componentes de x ( denominadas variables no básicas) que son cero. Las
Maximizar: F(x) = 6x1 +14x2 +Ox3 +Ox4 +Oxs m componentes restantes son por lo general distintas de cero y se denominan
2x1 +x2 +x3 = 12 variables básicas. (Aquí n y m corresponden a los valores asociados con el
problema original, antes de la introducción de las variables de holgura.)
2x¡ +3Xz +X4 = 15
Restricciones: 4. Cada una dejas variables básicas figura en un solo renglón de la matriz que
x¡+7xz +xs = 21 define las restricciones.
X¡ � O, X2 � O, X3 � O, X4 � O, X5 � O , 5. La función objetivo F se debe expresar sólo en términos de las variables no
básicas.
682 Capítulo 1O Programación lineal y temas relacionados 10.4 El algoritmo símplex 683
Ilustración reanudada ahora x 1 es la variable que se convertirá en básica. Por consiguiente, mantenemos fijo
En la primera tabla del ejemplo anterior las variables básicas son x 3, x4 y x5• Las en cero el valor de X5 y dejamos quex 1 se incremente tanto como sea posible. Se aplican
variables no básicas son x1 y x2. Podemos ver en el acto que la tabla cumple con las las siguientes restricciones:
cinco reglas. 0 � X3 = 9 - (13/7)X¡
En cada paso examinamos la tabla en curso para ver si el valor de F(x) se puede
0 � X4 = 6 - ( l l/7)X¡
incrementar convirtiendo una varible no básica en básica. Podemos ver en el ejemplo
que si x 1 o x2 se incrementan ( ajustando x3, x4 yx s en compensación), el valor de F(x) 0 �7X2 = 21 - X¡.
también se incrementa. En vista de que el coeficiente de x2 es mayor que el coeficiente Éstas nos llevan a
de x 1 en F, los incrementos unitarios de x2 acrecentarán a F(x) más rápido que los
incrementos unitarios de x 1• Por consiguiente, mantenemos fijo en cero el valor de x 1 X¡� 63/13 X¡� 42/11 X¡� 21,
y permitimos que x2 se incremente tanto como sea posible. Se aplican las siguientes La nueva variable básicax 1 puede crecer hasta42/11 , y los nuevos valores dex3, x4 yx 2
restricciones: se calculan con base en la tabla o a partir de las ecuaciones restrictivas recién expuestas.
0 �X3 = 12- Xz
El nuevo vector x es:
0 �X4 = 15- 3x2 · x = (42/11. 27;11, 21;2, o, of
0 �X5 = 21 - 7Xz Ahora las variables no básicas son X4 y xs. Para satisfacer la regla 5 utilizamos la
Éstas nos dicen que sustituciónx1 = (7/11)(6 - x4). En tal caso,
X1 � 12 X2 � 5 X1 � 3 . F(x) = 6x1 -2xs +42
La más restrictiva d e ellas e s la desigualdad x2 � 3 , que sólo nos permite aumentar el = (42/11)(6 - x4)- 2xs +42
valor de x2 hasta 3 . Los valores de x3, x4 y xs se obtienen con las tres desigualdades =- (42/1 l)x4- 2xs +714/11
restantes. En consecuencia, el nuevo vector x es
No es necesario terminar la tercera tabla, ya que los coeficientes de F son negativos.
X = (0, 3, 9,6, 0/. Esto significa que lax en curso es una solución, pues ninguna de las variables no básicas
x4 yxs se puede convertir en básica sin disminuir el valor de F(x). Por consiguiente, en
Las nuevas variables básicas sonx 2,x3 yx4. Ahora debemos determinar la siguiente tabla el problema original el valor de máximo es F(42/11, 27/11) = 630/11 .
en conformidad con las cinco reglas anteriores. Para satisfacer la regla 5, advertimos
que x2 = (21-x5)/7. Cuando se hace la sustitución en F, encontramos una nueva forma Resumen
para la función objetivo:
Basándonos en este ejemplo y en las explicaciones dadas, podemos resumir el
F(x) = 6x¡ +14x2 trabajo que hay que desarrollar con cada tabla como sigue:
= 6x 1 +14 (21 - xs)/7 = 6x 1 - 2xs +42 1 . Si todos los coeficientes de F ( es decir, el primer renglón de la tabla) son �O,
entonces el vector x en curso es la solución.
Para satisfacer la regla4 , se aplican algunos pasos de la eliminación gaussiana ( opera 2 . Elija la variable no básica que tenga el coeficiente positivo más grande. Esta
ciones elementales con los renglones), utilizando a7 como el elemento pivote; todo esto variable se convierte en una nueva variable básica. Llámela Xj.
con el propósito de eliminar a x2 de todas menos de una de las ecuaciones. Al terminar 3 . Divida cada b¡ por el coeficiente aij que tiene la nueva variable básica en ese
este trabajo, el paso ! llega a su fin. El paso 2 comienza con la segunda tabla, que es: renglón. El valor que se asigna a la nueva variable básica es igual a el menor
de dichos cocientes. Por ejemplo, si bk/ akj es el menor, hacemos Xj = bk / akj,
6 O O O -2 42 4 . Utilizando a akj como elemento pivote, engendre ceros en la columna j de A
aplicando algunos pasos de la eliminación gaussiana.
13/7 O O -1/7 9
11/7 O O -3/7 6 Estimación del costo
7 O O 21 En las aplicaciones prácticas del algoritmo símplex hay un enorme abismo entre
O 3 9 6 o los límites teóricos de su costo y el costo real. La cota superior para el número de pasos
en el algoritmo símplex es el coeficiente binomial
(;).
La situación que se presenta es similar a la que había en un principio. Las variables no
básicas sonx1 y x5• Cualquier incremento de xs disminuirá el valor de F(x), por lo que
684 Capítulo 10 Programación lineal y temas relacionados
10.4 El algoritmo símplex 685
pero en la práctica lo usual es que dicho número de pasos no sea mayor que 2m. Aun en
un problema de modestas dimensiones, digamos cuando n = 300 y m = 100, el valor 6. Resuelva el siguiente problema utilizando el méto
do de las tablas:
del coeficiente binomial es astronómico. De hecho, si utilizamos la fórmula de Stirling
(Prob. 1), tenemos que Maximizar: F(x) = 6x1 + 14x2
X¡+Xz � 12
00
(3100) = � ::,; 4x 10s1_ Restricciones:
2x1 +3x2 � 15
200!100!
X¡+ 7x2 :<,; 21
Otros algoritmos {X¡ S Ü Xz S Ü X¡ ?,; Ü
En 1984 Karmarkar anunció un nuevo algoritmo para la programación lineal (Kar
Cambie la segunda desigualdad por 2x1 +3x2 15 y
s
repita la solución.
markar (1984]). Se afirma que este nuevo algoritmo es superior al algoritmo símplex
cuando el número de variables es superior a 15,000.
El costo del algoritmo de Karmarkar es una función polinomial del tamaño del
problema, mientras que el costo del algoritmo símplex es una función exponencial de
dicho tamaño. Esto en sí mismo no significa que el nuevo algoritmo sea mejor, pero es
un signo alentador. Un algoritmo previo, debido a Khachian, también tiene una función
de costo de tamaño polinomial, pero el algoritmo nunca ha competido con el método
símplex en virtud de que los pasos sucesivos requieren una precisión cada vez mayor.
n! �[ n ]"[n-m]m
V�
(n) =
m m!(n - m)! � ;=-;¡:; -;;¡- ·
2. Utilice el problema 1 para verificar que
3. Resuelva el siguiente problema utilizando el método súnplex recién delineado y unas tablas
como las presentadas en esta sección:
Maximizar: F(x) = 2x1 - 3x2
2x1 +5x2 � 10
Restricciones: { x1 + 8x2 ;:; 24
xi s Ox2 s O
4. Considere la descripción que se hace del algoritmo súnplex en esta sección. Demuestre que
si x es una solución, entonces e � d.
5. (a) Vuelva a resolver el primer ejemplo de esta sección utilizando una tabla
(b) Vuelva a resolver el segundo ejemplo de esta sección utilizando el algoritmo súnplex.
RESPUESTAS Y SUGERENCIAS
Problemas 1.1
2. Tome 5 = ie 4. s =2 6. 1/1001 8. Tome 8 =a 10. Continua 12.f(O) = !
16. Sugerencia: Usen veces el teorema de Rolle 20. Jxl < 0.0144 24. n > 2m -1 26. n =12
29. Sugerencia: dr /dx =x'(I +Inx) 30. [1 + !(x -1t) 2]/e 32(a). (sen ! )/48 � 0.009988
34. n =21
Problemas 1.2
l. Sugerencia: (i) Si Inf(x) es creciente, también lo esf(x). (ii) Sif'(x) > O, entonces! es creciente. (iii)
lnx se define como J; t- 1 dt 8. k =4 17. Sugerencia: Use el teorema del valor medio y suponga que F
es una función continuamente diferenciable. 19(a). o(x1) 20. 8 < n 23. eh =1 + O(h) 25. O(X"+1 )
30. [-(� -1)± ,j(x3 -1) 2 -4e'(cosx -1)]/(2e") 32. Sugerencia: Escribax =y-&sen yy considere
el comportamiento de y -a sen y cuando y -+ +oo y cuando y -+ -oo. Use el teorema de la función implícita
para la segunda parte de este problema. 33. dy/dx =I/(x +y -I)
Problemas 1.3
l. 2[1, 1, 1, 1, . ..] - !(2, 4, 8, 16,.. .] ll(a). [-1, 1, -1, 1, ...], [2, 4, 8, 16, ...], [1, 4, 12, 32, . . .]
ll(b). Un = (1 +./2i)", Vn =(I -./2i)" 13(a). Xn+I =n!x¡
Problemas 2.1
3. 5x10- 1 2 6. (n-1)2-24 12.error relativo =8x2-29 14. Sí 17. 232 -29 20.errorabsoluto =2-22
28(b). l/(1 +224) 32. Sí
Problemas 2.2
l. 5 bits 5. -2 sen2(�x) lO(a). l/(vx2 +1 + x) lOG). Sugerencia: Ésta es la función sen h- 1x.
21. Jxl ;?; v7/3 25. -!x2(3 + !x(7 + ix(15 + �x))) 26(a). Sugerencia: Vea el problema 19 de la
sección 1.2 26(b). !
Problemas 2.3
l. Xn =A(9/10)" +B(l l/10)" donde A = 1 y B = O 3. Sugerencia: A partir de la definición deberá ser
capaz de demostrar que Jln(x)J � l. 4. Sugerencia: Determine si En (x) es creciente o decreciente como
función den. 6(a). a.x/(x -1) 6(c). x cotx 6(d). x 15. Sugerencia: Los números IYn(l)I deberán
crecer rápidamente. Tal vez sea usted capaz de demostrar una desigualdad semejante a IYn O)/Yn-1 (l)I > n.
Problemas 3.1
3. Sugerencia: Considere primero el caso [ao, bo] = [O, 1] y piense acerca de la representación binaria de
00
la raíz. Respuesta: r = a0 +(bo -a0) ¿)n 2-n 7. No necesariamente 8. n > 1 + [1og(bo -ao) -
n=I
loga]/(log 2) 10. 1.9 ll(a). 2-n+2 ll(b). z-n+l
Problemas 3.2
2. l.39174520027 3. Xn+I = !(xn +q/xn) 5. Sugerencia: Considere la serie de Taylor paraf(r +en)-
7. 1/y 13. Xn+I = i(2xn +R/x;) 16. 33 pasos 19. C =1 -f'(sn )/f'(Xo), S =1
Problemas 3.3
7. 5 8(a). l.391745200271
688 Respuestas y sugerencias Respuestas y sugerencias 689
Problemas4.6
Problemas4.2 10. La desigualdad del triángulo es falsa. 1 4. Sugerencia: Considere (x, Ax) y (Ax, x).
9. Algoritmo (2): !n(n + 1) mult./div., !n(n- 1) suma/resta. 12. L= [ ::
�
e�J
for i = 1, 2, ..., n do
Problemas5.1
[o a/l11 6. m(n2 + 1) 1 5. Sugerencia: Considere las matrices de la forma [ � �]
17. xq, = (bp, - :z=;:( ap,q1 x'1i ) / ap,q,
U=
O (b- al2i/l11)/l22}
1
º]
29. L = [ 3 1O O , D= [ O -1 O
2
end
o º] 32.L=[! �} 1 U= [
·
0.8944i
Problemas5.2
0.4472
_0_4472 _0_8944¡]
. El
5. Sugerencza: teorema de Gerschgonn . 27. No mvertible.
. .
-2 5 1 O
31. Sugerencia: La matriz unitaria en el ejemplo 1 de esta sección debe servir.
O -3
35. =
L u �}, U= [ �
;}
[º º] [_
1 5 _2
[' 00] [" º]
Problemas5.3
51. L= O 2 1 O O Problemas5.4
O 4 2 1 O l(b). P= [5], D= [5 O], Q= 25
[2 1]
l 2
1
4 0 0a.l
Problemas4.3
1
-1
O
1
O
0 0
º]-1 1 O
0 1 3 -2
-3] 8. Sugerencia: Calcule la seudoinversa de la matriz A= [ i �]
l [
l(c). x = [1. 2, O, l] ' A= [ O 1 1 O ¡ O O -4 1
T
Problemas 5.5
3
o o o 1
3 2 1 O O -8 -3
1 o o
O O 1 O , = O 1 O O , = [ O 1 -1 -1
º] 3 o 1
2]
3. Sugerencia: Use inducción para mostrar que det(A - U)= (- lhn (1.). Para reducir el determinante de
A - U, desarróllelo alrededor de los elementos de sun-ésima columna. 4. Sugerencia: Es posible dar una
demostración directa, o puede uno usar el problema 3 de esta sección y el teorema de Cayley-Hamilton. 6.
PA= LU donde p= [ O 1 O O L O 1 O U
l O O i ! 4, -2 ± 4i 19. 5n3 /6
1 O O O -t
1 1
! O O O -!
3(a). (PA)¡i = apJ 3(c). (P- ¡
1) i = B; i 10. 1
[
2 -4 -2
1 -1] 17. PA = LU donde P =[º º]
O
1
O 1 ,
1 O O
Problemas6.1
l(a). 5-1.5 (x-3) l(c). 10+34(x-3)+5(x-3)(x- 7) 18. p(x)+2x(x+ l)(x- l)(x-2) 20.Sugerencia:
3 -1 6 Imite la demostración del teorema 3 de esta sección. 22.-i(x + 2)( 5x - 3)
P
1 o o 3 2 -l
L= [ 2 1 O] , U= [ O 4 3 1 20. Si e= O entonces x 1= 1, xz= 2 . Problemas6.3
-3 i1 O O � 2. Sugerencia: Añada un término adecuado al polinomio del problema I de esta sección.
for i= 1, 2, ..., n do for i= 1, 2, ... , n do
23. x; ;- bp,/ap,i 29. det( A )= 12 36. 40. in(n2 - 1) Problemas6.4
6. Sí 8. a=c = d= 7, b= 2, e=-3 13. a=-5, b=-26, c=-27, d= 9 30. a=b= 3, c= 1
xq, <- bp,/ ap,q,
end end
Respuestas y sugerencias 691
690 Respuestas y sugerencias
Problemas 8.6
1. X(l.O)=[0.30213,0.39052f 3. Sugerencia: Intente con funciones de la forma e1, te1, y t2e1. Respuesta:
Problemas 6.6
lemas 2, 4 y 5 de esta sección. la solución general es de la forma x=Ae' + Bte' + Ct2 et , y=De' +Ete' +Ft2 e'
6. Sugerencia: Resulta útil consultar los prob
5. X= [x2,X3, -2x3 +x2 +2x1 +e'4f,X(8)=[3,2, 1, 8f.
Problemas 6.7
15. radio = 1
4. O 6. (2/ fa) I:aC-l ix2" /[k!(2k + 1)]
+1
Problemas 8.7
: Tome z=1 - cos x. 36. - I;':':0(-xi +1
/(k + 1)! l. Solución general de la formax=Ae' +Be-' 3. Todos los pares (a.,�) para los cuales a.=-�.
19. Sugerencia: Hay varios errores. 35. Suger
encia
39. -hf"'(�) 40. A= -1, B = 4, C = -5, D = 2.
5. Sugerencia: Considere el problema 3 de esta sección.
Problemas 8.8
Problemas 6.8 � en
función sen t - 'M deberá tener un máximo en un punto l. �(z)= z - 3 4. Sugerencia: Tome x 1 de manera que resuelva la ecuación diferencial con condiciones
1. Sugerencia: Haga un esbozo de la gráfica. La condiciones deberán determinar a�
magnitud en rc/2. Estas iniciales tales que c ¡ ¡X¡ (a)+c12x1 (a)=a.. Tomex2 como una solución de la ecuación diferencial que satisface
(O, rc/2) y deberá tener un mínimo de la misma las condiciones iniciales x1(a) = -C¡z y Xi(a) = c ¡ ¡. Considere xr + lx2 . 11. z = 15 13. Sugerencia:
(e) resulta muy eficiente.
y a 1. 18. Sugerencia: El orden (a),(d),(c),(b), Multiplique por x la ecuación diferencial e integre.
Problemas 6.11 ción.
considere el punto 1/x. 19. Sugerencia: Use induc Problemas 8.9
1. Sugerencia: Tome x igual a la fracción continua y l.x(l /2)=19/8=2.375
n. 24. -3 + víO 26. v's 30. -x + v'x + 1
2
21. Sugerencia: Use el problema 20 de esta secció
35. Tome z=1 - cosx. Problemas 8.11
5. Sugerencia: Considere e'-', e8' y éA+B)t_
Problemas 7.2
8. 1.4626514 12(a). A= B=1/2
2. f01 f(x) dx = t(J(O) +3f(l/3) + 3f(l/3) +
f(l)] Problemas 8.12
14. A= C =1/12,B=22/12 9. Solución analítica: x1 (t)=(IOOOe- 10011 + e-1)/1001, x2(t) = (-l OOOe- 10011 + IOOOe-1)/1001
Problemas 9.2
Problemas 7.3
+ 1//3)/2. 9(b). Ao = A2 = 7/25, A1 = 8/25, 3. Sugerencia: En alguna etapa de su análisis deberá tener una ecuación vectorial (J +sB)Ej = Ej-I - q,
1. f0 f(x)dx = Hf(s) + f(l - s)] dondes = (1
1
tJ(x)dx=2f(O) + V"(l) donde Cj es un vector que incluye componentes de la forma f k2uu(x;, 'tj) + tzsh4u:r.w:C�,, lj).
Xo = -x2 = -jffj, X¡ = O 12. a.=1 ± 1//3 17.
26. A= C = 8/3, B = -4/3. Problemas 9.4
l. Sugerencia: Use las ecuaciones de Cauchy-Riemann.
Problemas 7.4
1. I=[81S(f, h/3) - S(f, h)J/80 - (l/90)c6h
6
+... 10. J=R(i, 2) + (1/20)c6h? +. . . Problemas 9.5
2. Sugerencia: El ejemplo del texto resultará útil. 6. Sugerencia: Al calcular (r, s) cuando (x, y) está dado,
Problemas 8.1
l. Sugerencia: Intente con x = et'", o dése cuenta
de que la ecuación es separable. 2. !ti � ! 4(a). aparecen dos soluciones de la ecuación cuadrática.
Problemas 8.3 t)
F =hf(t+ ih, x+ iF1 ) 4.f(t, x) =(3 -x)/(x+2
2. x(t+h)=x(t) + !(F¡ +3F2),donde F1=hf(t, h) y 2 2
6. Sugerencia: Suponga que el término de error es Ch •
Problemas 8.4
= -1/12 15. A= l ,m=3
11.A =3/2,B= -1/2 13.A =5/12,B=8/12, C
T
BIBLIOGRAFÍA
Abreviaturas
Abramowitz, M.• y I. A. Stegun, "Abscissas and weights for Gaussian quadratures of high order'', Joumal Research
National Bureau of Standards 56, 35-37, 1956.
Abramowitz, M., y I. A. Stegun (eds.), Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical
Tables, National Bureau of Standards, (reimpreso en Nueva York: Dover, 1965.), 1964.
Ahlfors, L. V., Complex Analysis, Nueva York, McGraw-Hi!l, 1966.
Aiken, R. C. (ed.), StijJComputation, Nueva York, Oxford University Press, 1985.
Alexander, J. C., y J. A. Yorke, "Toe homotopy continuation method: Numerically implemented topological procedures",
Transactions AMS 242, 271-284, 1978.
Allgower, E., y K. Georg, "Simplicial and continuation methods for approxirnating fixed points and solutions to systems
of equations", SIAMREV 22, 28-85, 1980.
Allgower, E., y K. Georg, Numerical Continua/ion Methods, Nueva York, Springer-Verlag, 1990.
Allgower, E. L., K. Glasshoff y H.-0. Peitgen (eds.), Numerical Solution of Nonlinear Equations: Lecture Notes in
Mathematics 878, Nueva York, Springer-Verlag, 1981.
ANSI/IEEE, "IEEE standard for binary floating-point arithmetic", IEEE Std. 754-1985, Nueva York, IEEE, 1985.
ANSI/IEEE, "A radix independent standard for floating-point arithmetic", IEEE Std. 854-1987, Nueva York, IEEE, 1987.
Ames, W. F., Numerical Methods for Partía/Dijferential Equations, Nueva York, Acaderrúc Press, 1977.
Atkinson, K., Elementary Numerical Analysis, Nueva York, Wtley, 1985.
Axelsson, O., "A generaiized conjugate direction method and its application on a singular perturbation problem", En
Numerical Analysis: Lecture Notes in Mathematics 773, Nueva York, Springer-Verlag, 1980.
Ayoub, R., "Euler and the zeta function", AMM 81, 1067-1086, 1974.
Aziz, A. K. (ed.), Numerical Solution ofDijJerential Equations, Nueva York, Van Nostrand, 1969.
Aziz, A. K. (ed.), Numerical Solutions of Boundary Value Problems for OrdinaryDijferential Equations, Nueva York,
Academic Press, 1974.
Babuska, I., M. Prager y E. Vitasék, Numerical Processes in Dijferential Equations, Nueva York, Wiley-Interscience,
1966.
694 Bibliografía Bibliografía 695
Bailey, P. B., L. F. Shampine y P. E. Waltman, Nonlinear Two-Point Boundary-Value Problems, Nueva York, Academic Brigham, E. O., The Fast Fourier Transform, Englewood Cliffs, N.J., Prentice-Hall, 1974.
Press, 1968.
Brophy, J. F., y P. W. Smith., "Prototyping Karmarkar's algorithm using MATH/PRDTAN'', Directions 5, 2-3, Houston,
Bale, J., y D. J. Newman, Complex Analysis,Nueva York, Springer-Verlag, 1982. IMSL Corp.• 1988.
Bames, E. R., "A variation on Karmarkar algorithm for solving linear programming problems", Mathematical Program- Bunch, J. R., y D. J. Rose (eds.), Sparse Matrix Computations. Nueva York, Academic Press, 1976.
ming 36, 174-182, 1986.
Bamhill, R., y A. Riesenfeld, Computer Aided Geometric Design, Nueva York, Academic Press, 1974. Burden, R. L., y J. D. Faires, Numerical Analysis, 4!! ed., Boston, PWS-Kent, 1989.
Barnhill, R., R. P. Dube y F. F. Little, "Properties of Shepard's surfaces", Rocky Mtn. J. Math. 13, 365-382, 1983. Burrage, K., A specialfamily of Runge-Kutta methods for solving stiffdifferential equations, BIT 18, 22-41, 1978.
Bamsley, M., Fractals Everywhere,Nueva York, Academic Press, 1988. Butcher, J. C., The Numerical Analysis of Ordinary Differential Equations: Runge-Kutta and General Linear Methods,
Barrodale, I., y C. Phillips, "Solution of an overdetermined system of linear equations in the Cbebyshev norm", ACMTOMS Nueva York, Wtley, 1987.
1, 264-270, 1975.
Byrne, G. D., y C. A. Hall (eds.),Numerical Solutionof Systems ofNonlinear Algebraic Equations,Nueva York, Academic
Barrodale, L, y F. D. K. Roberts, "Solution of an overdetermined system of equations in the l1 norm", ACMCOM 17, Press, 1973.
319-320, 1974. Byrne, G., y A. Hindmarsh, "Stiff ODE solvers: A review of current and coming attractions", Joumal Computational
Barrodale, I., F. D. K. Roberts y B. L. Ehle, Elementary Computer Applications, Nueva York, "Wiley, 1971. Physics 70, 1-62, 1987.
Bartels, R. H., "A stabilization of the simplex method", NM 16, 414-434, 1971. Cash, J. R., Stable Recursions, Nueva York, Academic Press, 1979.
Bartels, R., J. Beatty y B. Barsky, An Jntroduction to Splines for Use in Computer Graphics and Geometric Modeling,
Los Altos, Calif., Morgan Kaufmann, 1987. Ceschino, F., y J. Kuntzmann, Numerical Solution of Jnitial-Value Problems, Englewood Cliffs, N.J., Prentice-Hall, 1966.
Bartle, R. G., The Elements of Real Analysis, 2!!. ed., Nueva York, Wiley, 1976. Cheney, E. W., Introduction to Approximation Theory,McGraw-Hill, (reimpreso en Nueva York, Chelsea, 1982), 1966.
Becker, E. B., G. F. Carey y J. T. Oden, Finite Elements: An Introduction, vol. 1, Englewood Cliffs, N.J., Prentice-Hall, Cheney, W., y D. K.incaid, Numerical Mathematics and Computing, 2!!. ed., Pacific Grove, Calif., Brooks/Cole, 1985.
1981.
Cherkasova, M. P., Collected Problems in Numerical Analysis, Nueva York, Walters-Noordhoff, 1972.
Bell, E. T., Men of Mathematics,Nueva York, Simon & Schuster, 1975.
Birkhoff, G., y R. E. Lynch, Numerical Solution of Elliptic Problems,Filadelfia, SIAM, 1984. Childs, B., M. Scott, J. W. Daniel, E. Denman, y P. Nelson (eds.), Codes for Boundary Value Problems in Ordinary
Dijferential Equations: lecture Notes in Computer Science 76, Nueva York, Springer-Verlag, 1979.
Bloomfield, P., Fourier Analysis o/Tune Series: An Introduction,Nueva York, Wtley-Interscience, 1976.
Chow, S. N., J. Mallet-Paret y J. A. Yorke. "Finding zeros of maps: Homotopy methods that are constructive with
Blum, E. K., "Numerical Analysis and Computation: Theory and Practice,Read.ing, Mass., Add.ison-Wesley, 1972. probability one", MOC32, 887-899, 1978.
Bodewig, E., "Sur la méthod de Laguerre pour 1' approximation des racines de certaines équations algébriques et sur la Chui, C. K., "Multivariate splines", SJAM Regional Conference Series in Mathematics 54, 1988.
critique d'Hermite", Nederl. Acad. Wetensch. Proc. 49, 911-921, 1946.
Boisvert, R. F., S. E. Howe, D. K. Kahaner y J. L. Springmann, "Guide to available mathematical software", Center for Chung, K. C., y T. H. Yao, "On lattices admitting unique Lagrange interpolations", SIAMNA 14, 735-743, 1977.
Computing and Applied Mathematics. Gaithersburg, Md, National Institute of Standards and Technology, 1990.
Cline, A. K., " Scalar and planar valued curve-fitting using splines under tension",ACMCOM 17, 218-220, 1974a.
Boisvert, R. F., y R. A. Sweet, "Sources and development of mathematical software for elliptic boundary value problems",
En Sources and Development of Mathematical Software (J{. Cowell, ed.), Englewood Cliffs, N.J., Prentice-Hall, Cline, A. K., "Six subprcgrams for curve-fitting using splines under tension", ACMCOM 17, 220-223, 1974b.
1982.
Cline, A. K., C. B. Moler, G. W. Stewart y J. H. Wtlkinson, " An estímate for the condition number of a matrix", SIAMNA
Borwein, J. M., y P. B. Borwein, "Toe arithmetic-geometric mean and fast computation of elementary functions", SIAM 16, 368-375, 1979.
REV 26, 351-366, 1984.
Coddington, E. A., y N. Levinson, Theory of Ordinary Differential Equations, Nueva York, McGraw-Hill, 1955.
Botha, J. F., y G. F. Pinder, Fundamental Concepts in the Numerical Solution of Differential Equations, Nueva York,
"Wiley, 1983. Cody, W. J., "Toe construction of numerical subroutine librarles", SIAMREV 16, 36-46, 1974.
Boyce, W. E., y R. C. DiPrima, Elementary Differential Equations and Boundary Value Problems, Nueva York, Wiley, Cody, W. J., "Floating-point standards-theory and practice", En Reliability in Computing,99-107, Nueva York, Academic
1977. Press, 1988.
Braess, D., Nonlinear Approximation Theory, Nueva York, Springer-Verlag, 1984.
Cody, W. J., J. T. Coonen, D.M. Gay, K. Hanson, D. Hough, W. Kahan, R. Karpiski, J. Pa!mer, F. N. Ris y D. Stevenson, "A
Bramble, J. H. (ed.), Numerical Solution of Partial Differential Equations, Nueva York, Academic Press, 1966. proposed radix-and wordlength-independent standard for floating-point arithmetic", IEEE Micro, 4, 86-100, 1984.
Brenan, K. E., S. L. Campbell y L. R. Petzold, Numerical Solution of Jnitial-Value Problems in Differential-Algebraic Cody, W. J., y W. Waite, Software Manual for the Elementary Functions, Englewood Cliffs, N.J., Prentice-HalL 1980.
Equations, Nueva York, Elsevier Science Publisbing Co., 1989.
Brent, R. P., "Fast multiple precision evaluation of elementary functions", ACM], 23, 242-251, 1976. Coleman, T. F., y C. van Loan, Handbookfor Matrix Computations, Filadelfia, SIAM, 1988.
Briggs, W. L., A Multigrid Tutorial,Filadelfia: SIAM, 1987. Collatz, L., Functional Analysis and Numerical Mathematics, 3!!. ed., Nueva York. Academic Press, I 966a.
696 Bibliografía Bibliografía 697
1966b.
Collatz, L., The Numerical Trea tment ofDifferential Equations, Nueva York, Springer-Verlag, Delves, L. M., y J. Mohamed, Compu tational Methods far Integral Equatio ns, Nueva York, Cambridge University Press,
1985.
numerical solution ofelliptical
Concus, P., G. H. Golub y D. P. O'Leary, "A generalized conjugate gradient method forythe Rose, eds.), Nueva York,
partial differential equations", En Sparse Ma trix Co mputations (J. R. Bunch D. J., Dennis, J. E., Jr. y R. B. Schnabel, Numerical Methods for Unconstrained Optimization and Nonlinear Equat ions,
Englewood Cliffs, N.J., Prentice-Hall, 1983.
Academic Press, 1976.
1966. Dewdney, A. K., "Computer recreations: Random ·walks that lead to fractal crowds", Scientific Amer
Conte, S. D., ''Toe numerical solution oflinear boundary value problems", SIAMREV 8, 309-321, 1988.
ican, Diciembre,
ill,
Conte, S. D., y C. de Boor, Elementary Numerical Analysis, � ed., Nueva York, McGraw-H 1980 Dieudonné, J., Fou ndations ofMo dem Analysis, Nueva York, Academic Press, 1960.
IEEE 55,
Cooley, J. W., P. A. Lewis y P. P. Welch, "Historical notes on the fast Fourier transform", Proceed
ings o f the
1675-1677, 1967. Dongarra, J. J., C. B. Moler, J. R. Bunch y G. W. Stewart, LINPACK Users Guide, Filadelfia, SIAM, 1979.
Coonen, J. T., "Underflow and the denormalized numbers", Co mpu ter14, 75-87, 1981. Duff, L S., A. M. Erisman y J. K. Reid, Direct Methods for Sparse Matrices, Nueva York, Oxford University Press, 1986.
Cooper, L., y D. Steinberg, Metho ds and Applications ofLinear Programming, Filadelfia, Saunders, 1974. Durand, E., "Solutions Numériques des Équations Algébriques", (2 vols.) París, Mason, 1960.
Cullum, J., y R. A. Willoughby (eds.), Large Sea/e Eigenvalue Problems, Amsterdam, Elsevier, 1986. Eaves, B. C., "A short course in solving equations with PL homotopies", SIAM-AMS Proceedings
9, 73-144, 1976.
Curry, J. H., L. Garnett y D. Sullivan, "On the iteration of a rational function: Computer experiments with Newton's Eaves, B. C., F. J. Gould, H.-0. Peitgen y M. J. Todd (eds.), Homotopy Methods and Glo bal Convergen
ce, Nueva York,
method", Communica tions in Mathematical Physics 91, 267-277, 1983. Plenum, 1983.
Dahlquist, G., "Convergence and stability in the numerical integration ofordinary differential equations", Ma th. Scand. Eggermont, P. P. B., "Noncentral difference quotients and the derivative", AMM95, 551-553, 1988.
4, 33-35, 1956. Elliott, D. F., y K. R. Rao, Fast Transforms: Algorithms, Analyses, Applicatio ns, Nueva York, Acadernic Press, 1982.
Dahlquist, G., "A special stability problem for linear multistep methods", BIT3, 27-43, 1963.
Engels, H., Numerical Quadrature and Cubature, Nueva York, Academic Press, 1980.
Dahlquist, G., y A. Bjorck, Numerical Met hods, Englewood Cliffs, N.J., Prentice-Hall, 1974. Epperson, J. F., "On the Runge example", AMM4, 329-341, 1987.
Daniel, J. W., "The conjugate gradient method for linear and nonlinear operator equations", SIAM.NA 4, 10-26, (véase Evans, D. J. (ed.), Software fo r Numerical Lvfathematics, Nueva York, Acadernic Press, 1974.
también S!AlñNA 1 (1970) 277-280), 1967.
Daniel, J. W., y R. E. Moore, Compu tation and Theory in Ordinary Differential Equatio ns, San Francisco, Freeman, 1970. Fadeev, D. K., y V. N. Fadeeva, Computatio nal Methods ofLinear Algebra, San Francisco, Freeman, 1963.
Dantzig, G. B., "Programming in a linear structure", Washington, D. C., U. S. Air Force, Comptroller's Office, 1948. Farwig, R., "Rate ofconvergence ofShepard's global interpolation formula", MOC 46, 577-590, 1986.
Dantzig, G. B., Linear Programming and Extensions, Princeton, N.J., Princeton University Press, 1963. Fatun!a, S. O., Numerical Methods for Initial Value Problems in Ordinary Differential Equations, Nueva York, Acadernic
Press, 1988.
Davis, H. T., Introductio n to No nlinear Differential and Integral Equations, Nueva York, Dover, 1962.
Fehlberg, E., "Klassische Runge-Kutta Formeln fünfter und siebenter Ordnung rnit Schrittweitenkontrolle", Co mputing
Davis, P. J., Interpola tio n and Approximation, Nueva York, Dover, 1982. 4, 93-106, 1969.
Davis, P. J., y P. Rabinowitz, "Abscissas and weights for Gaussian quadratures ofhigh order", Joumal Research Natio nal Feldstein, A., y P. Tumer, "Overflow, underflow, and severe loss of significance in floating-point addition and subtraction",
Bureau Standards 56, 35-37, 1956. IMAJNA 6, 241-251, 1986.
Davis, P. J., y P. Rabinowitz, Metho ds ofNumerical lntegration, z<!. ed., Nuev-a York, Academic Press, 1984. Ficken, F. A., ''The continuation method for functional equations", Communications P ure & Applied Mathematics 4,
435-456, 1951.
de Boor, C., "CADRE: An algorithm for numerical quadrature", En Mathematical Software (J. R. Rice, ed.), Nueva York,
Acadernic Press, 1971. Flehinger, B. J., "On the probability that a random integer has initial digit A",AMM13, 1056-1061, 1966.
de Boor, C., ''Total positivity ofthe spline collocation matrix", Indiana University Jo umal ofMathema tics 25, 541-551, Forsythe, G. E., "Generation and use oforthogonal polynornials for data-fitting with a digital computer", SIAM Joumal
1976. 5, 74-88, 1957.
de Boor, C., A Practica/ Gu ide to Splines, 2'!. ed., Nueva York, Springer-Verlag, 1984. Forsythe, G. E., M. A. Malcolm y C. B. Moler, Computer Met hods for Mathematical Co mputations, Englewood
Cliffs.
N.J., Prentice Hall, 1977.
de Boor, C., y G. H. Golub (eds.), Recen/ Advances in Numerical Analysis, Nueva York, Acadernic Press, 1978.
Forsythe, G. E., y C. B. Moler, Co mputer Solution ofLinear Algebraic Systems, Englewood Cliffs, N J., Prentice-Hal
1967. l,
de Doncker, E., e I. Robinson, "An algorithm for automatic integration over a triangle using nonlinear extrapolation",
ACMTOMS 10, 1-16, 1984.
Forsythe, G. E., y W. R. Wasow, Finite-Dif.ference Met ho ds for Panial Differential Equations, Nueva York, Wi!ey, 1960.
Dejon, B., y P. Henrici (eds.), Constructive Aspects ofthe F undamental Theory ofAlgebra, Nueva York, Wiley, 1969.
Foster, L. V., "Generalizations ofLaguerre's method: Higher order methods", S!AMNA 18, 1004-1018, 1981.
Dekker, K., y J. G. Verwer, Stability of Runge-Kutta Methods far Stiff Nonlinear Different ia/ Equations, Amsterdam,
Elsevier Science, 1984. Fox, L., The Numerical Solu tio n ofTwo-Point Boundary-Value Problems in Ordinary Dif.ferential Equatio ns, Nueva York,
Oxford University Press, 1957.
Dekker, T. J., "Finding a zero by means ofsuccessive linear interpolation". En Constructive Aspects ofthe Fundamental
Theo rem o fAlgebra (B. Dejon y P. Henrici, eds.), Nueva York, Wtley-Interscience, 1969. Fox, L., Numerical Solu tio n ofOrdinary and Partía/ Differential Equatio ns, London, Pergamon, 1962.
698 Bibliografía
Bibliografía 699
Fox, L., An [ntroduction toNumerical Linear Algebra, Nueva York, Oxford University Press, 1964. Gill, P. E., G. H. Golub, W. Murray y M. A. Saunders, "Methods for modifying matrix factorizations", MOC 28, 505-535,
Fox, L., Biographical M emoirs of Fellows of the Royal Society: James Hardy Wilkinson 1919-1986, vol. 33, Londres, 1974.
Royal Society, 1987. G!adwell, J., y R. Wait, A Survey of Numerical Methods for Partial Differential Equations, Nueva York, Oxford University
Fox, P. A., A. D. Hall y N. L. Schryer, "Framework for a portable library", ACMTOMS 4, 177-188, 1978. Press, 1979.
Francis, J. G. F., "Toe QR transformation: A unitary analogue to the LR transformation", Partes 1 y 2, Computing Joumal Glatz, G., "Stabile Deflationsalgorithmen bei der numerischen Berechnung von Polynomnullstellen", Zeitschrift far
A ngewandte Mathematik und Mechanik 58, T416-T418, 1978.
4, 1961.
Glieck, J., Chaos, Nueva York, Vtldng Press, 1987.
Franke, R., "Scattered data interpolation: Tests of sorne methods", MOC 38, 181-200, 1982.
Goldstine, H. H., A History ofNumerical Analysisfrom the 16th Through the 19th Century, Nueva York, Springer-Verlag,
Fritsch, F. N., y R. E. Carlson, "Monotone piecewise cubic interpolation", SIAMNA 17, 238-246, 1980. 1977.
Fr6berg, C. E., lntroduction toNumerical Analysis, 2� ed., Reading, Mass., Addison-Wesley, 1969. Golub, G. H. (ed.), Studies inNumerical Analysis, Washington, D. C., MAA, 1984.
Gaffney, P., "When things go wrong . . . ", Report BSC87/l, Bergen, Noruega: IBM Bergen Scientific Centre, 1987. Golub, G. H., y D. P. O'Leary, "Sorne history of the conjugate gradient and Lanczos methods",
SIAMREV 31, 50-102,
1989.
Galeone, L., "Generalizzazione del methodo di Lagnerre", Calco/o 14, 121-131, 1977.
Golub, G. H., y C. F. van Loan, Matrix Computations, 2�. ed., Baltimore, Johns Hopkins University
Garbow, B. S., J. M. Boyle, J. J. Dongarra, y C. B. Moler, Matrix Eigensystem Routines, EISPACK Guide Extension, Press, 1989.
Nueva York, Springer-Verlag, 1972. Gordon, W. J., y J. A. Wixom, "Shepard's i;nethod of 'metric interpolation' to bivariate and multivariat
e interpolation",
Math. Comp. 32, 253-264, 1978.
García, C. B., y F. J. Gould, "Relations between several path-following algorithms and local and global Newton methods",
S1AMREV22 , 263-274, 1980. Gourlay, A. R., y G. A. Watson, Computational Methods for Matrix Eigenvalues, Nueva York, Wiley, 1973.
García, C. B. y W. L Zangwill, "Finding ali solutions to polynornial systems and other systems of equations", Mathematical Greenspan, D., lntroductoryNumerical Analysis of Elliptic Boundary Value Problems, Nueva York, Harper & Row, 1965.
Programming 16, 159-176, 1979a.
Gregory, J. A. (ed.)., The Mathematics ofSurfaces, Nueva York, Oxford University Press, 1986.
García, C. B., y W. L Zangwill, "An approach to homotopy and degree theory", Mathematical Operations Research 4, Gregory, R. T., Error-Free Computation, Huntington, Nueva York, Krieger, 1980.
390-405, 1979b.
Gregory, R. T., y D. Karney, A Collection of Matrices for Testing Computational Algorithms, Nueva
García, C. B., y W . L Zangwi!l, Pathways to Solutions, Fixed Points, and Equilibria, Englewood Cliffs, N.J., Prentice-Hall, York, Wiley, 1969.
Haar, A., "Die rninkowskische Geometrie und die Anniiherung an stetige Funktionen",
1981.
294-311, 1918.
Mathematische Annalen 78,
Gardner, M., Mathematical Puzzles and Diversions, Nueva York, Simon & Schuster, 1961.
Haber, S., "Numerical Evaluation of Multiple Integrals", SIAMREV 12, 481-526, 1970.
Gautschi, W., "Recursive computation of certain integrals", ACMJ 8, 21-40, 1961. Hackbusch, W., y U. Trottenberg (eds.), Multigrid Methods: LectureNotes in Mathematics 960, Nueva
York, Springer-
Gautschi, W., "Computational aspects of three-term recurrence relations", SIAMREV 9, 24-82, 1967. Verlag, 1982.
Gautschi, W., "Computational methods in special functions", En Theory and A pplications of Special Functions (R. Askey, Hageman, L. A., y D. M. Young, A pplied Jterative Methods, Nueva York, Acadernic Press, 1981.
ed.), Nueva York, Acadernic Press, 1-98, 1975. Hammerlin, G., (ed.),Numerical lntégration, Nueva York, Birkhliuser-Verlag, 1982.
Gautschi, W., "Families of algebraic test equations", Calco/o 16, 383-398, 1979. Harnming, R. W.,Numerical Methods for Scientists and Engineers, Nueva York, McGraw-Hill, ·¡973.
Gautschi, W., "How and how not to check Gaussian quadrature formulae", BIT 23, 209-216, 1983. Hardy, R. L., "Multiquadric equations of topography and other irregular surfaces", Joumal Geophysica
l Research 76,
1905-1915, 1971.
Gautschi, W., "Questions of numerical condition related to polynomials", En Studies inNumerica! Analysis (G. H. Golub,
ed.), 140-177, Washington, D. C., MAA, 1984. Hartley, P. H., "Tensor product approximations to data defined or rectangle meshes in n-space", Computer
Joumal 19,
348-352, 1976.
Gear, C. W.,Numerical lnitial Value Problems in Ordinary Differential Equations, Englewood Cliffs, N.J., Prentice-Hall,
1971. Heller, D., "A survey of parallel algorithms in numerical linear algebra",S1AMREV20, 740-777, 1978.
Gekeler, E., Discretization Methods for Stable lnitial Value Problems: LectureNotes in Mathematical 1044, Nueva York, HennJ!I, M. A., y L. M. De!ves (eds.), Production and Assessment ofNumerical Software, Nueva York,
1980. Acadernic-Press,
Springer-Verlag, 1984.
Gentleman, W. M., "Implementing Clenshaw-Curtis quadrature", ACM] 15, 337-342, 1972. Henrici, P., Discrete Variable Methods in Ordinary Differential Equations, Nueva York, Wiley, 1962.
George, A., y J. W. Liu, Computer Solution of Large Sparse Positive Definite Systems, Englewood Cliffs, N.J., Prentice Henrici, P., Error Propagation for Difference Methods, Nueva York, Wtley, 1963.
Hall, 1981.
Henrici, P., Elements ofNumerical Analysis, Nueva York, Wiley, 1964.
George, A., J. W. Liu y E. Ng., "User guide forSPARSPACK: Waterloo sparse linear equations package", Computer Science Henrici, P., A pplied and Computational Complex Analysis, (3 volúmenes) Nueva York, Wtley, 1974.
Dept. Report CS-78-30 (revisado en 1980), Waterloo, Canadá, University of Waterloo, 1980.
Hestenes, M. R., Conjugate Direction M ethods in Optimization, Nueva York, Springer-Verlag, 1980.
Gerald, C. F., y P. O. Wheatley, A ppliedNumerical Analysis, � ed., Reading, Mass., Addison-Wesley, 1989.
Hestenes, M. R., y E. Stiefel, "Methods of conjugate gradient for solving linear systems", Joumal ResearchNational
Ghizetti, A., y A. Ossiccini, Quadrature Formulce, Nueva York, Acadernic Press, 1970. Bureau ofStandards 45, 409-436, 1952
700 Bibliografía Bibliografía 701
Keller, H. B., "Global homotopies and Newton methods", En Recent Advances in Numerical Analysis
Hetzel, W. C., (ed.), ProgramTest Methods, Englewood Cliffs, N.J., Prentice-Hall, 1973. H. Golub, eds.), 73-94, Nueva York, Academic Press, 1978. (C. de Boor y G.
Hildebrand, F. B., lntroduction to Numerical Analysis, 21 ed., Nueva York, McGraw-Hill, 1974.
Kernighan, B. W., y P. J. Plauger, The Elements of Programming Style, Nueva York,McGraw-Hill, 1974.
Hindmarsh, A., "LSODE y LSODEI: Two initial value ordinary differential equations solvers", ACM Special Interest Group
in Numerical Methods Newsletter 15, 10-11, 1980. Khovanskii, A. N., The Application of Continued Fractions and their Generalizations to Pivblems in Approximation
Hirsch, M. W., y S. Smale, "On algorithms for solvingf(x) = O" , Communications of Pure and Applied Mathematics Theory, Groningen, Noordhoff, 1963.
32, 281-312, 1979. Kincaid, D. R., y T. C.Oppe, "A parallel algorithm for the general LU factorization", Communications Applied Numerical
Holmes, R. B., A Course on Optimiza/ion and Best Approximation, Nueva York,Springer-Verlag, 1972. Methods 4, 349-359, 1988.
Horn, R. A., y C. R. Johnson, Matrix Analysis, Nueva York, Cambridge University Press, 1986. Kincaid, D. R., yT. C.Oppe, D.M. Young, "ITPACKV 2D user's guide", Center for Numerical Analysis Report CNA-232,
Hough, D., "Applications of the proposed IEEE 754 standard for floating-point arithmetic", Computer14, 70-74; 1981. Austin, Tex., University ofTexas en Austin, 1989.
Householder, A. S., The Theory of Matrices in Numerical Analysis, Nueva York,Blaisdell. ( Reimpreso en Nueva York, Kincaid, D. R., J. R. Respess, D.M. Young y R. G. Grimes, "ITPACK 2C: A Fortran package for solving large sparse
Dover, 1974.), 1964. linear systems by adaptive accelerated iterative methods", ACMTOMS 8, 302-322, 1982.
Householder, A. S., The NumericalTreatment of a Single Nonlinear Equation, Nueva York, McGraw-Hill, 1970. Kincaid, D. R., y D,. M. Young, "Survey of iterative methods", En Encyclopedia of Computer Science
Belzer, A. G. Holzman y A. Kent, eds.), 354-391, Nueva York, Dekker, 1979. andTechnology (J.
Hull, T. E., W. H. Enright, B. M. Fellen, y A. E. Sedgwick, " Comparing numerical methods for ordinary defferential
equations", SIAMNA 9, 603-637, 1972. Kline, M., Mathematical Thought from Ancient to Modem Times, Nueva York, Oxford University
Press, 1972.
IMSL, IMSL Library Reference Manual, Houston, IMSL, Inc., 1990. Knuth, D. E., The Art of Computer Programming: Seminumerical Algorithms, vol. 2, Reading,
Mass., Addison-Wesley,
Isaacson, E., y H. B. Keller, Analysis of Numerical Methods, Nueva York, Wtley, 1966. 1969.
Jackson, K. R., W. H. Enright, y T. E. Hull, "A theoretical criterion for comparing Runge-Kutta formulas", SIAMNA 15, / Knuth, D. E., "Mathematical typography", Bulletin AMS 2, 337-372, 1979.
618-641, 1978.
Jacobs, D. (ed.), Numerical Software-Needs and Availability, Nueva York, Academic Press, 1978. Koopmans, T. C. ( ed.), Activity Analysis of Production and Allocation, Nueva York, Wiley, 1951.
Jain, M. K., Numerical Solution of Differential Equations, 21 ed., Nueva York, Wiley, 1984. Krogh, F., "VODQ/SVDQ/DVDQ: Variable order integrators for the numerical solution of ordinary differential equations",
Jet Propulsion LaboratoryTechnicalBrief NP0-11643, Pasadena, Calif., California Institute of Technology, 1970.
Jenkins, M. A., y J. F.Traub, "A three-stage algorithm for real polynomials using quadratic iteration", SIAMNA 7, 545-566,
1970a. Krylov, V. I., Approximate Calculation of lntegrals, (Traductor al inglés, A. Stroud) Nueva York,Macmillan, 1962.
Jenkins, M. A., y J. F. Traub, "A three-stage variable-shift iteration for polynomial zeros", NM 14, 252-263, 1970b.
Kuhn, H. W. y A. W.Tucker ( eds.), " Linear inequalities and related systems", Annals of Mathematical Studies, Princeton,
Jennings, A., Matrix Computations for Engineers and Scientists, Nueva York, Wtley, 1977. N.J., Princeton University Press, 1956.
Jerome, J. W., "Approximate Newton methods and homotopy far stationary operator equations", Constructive Approxi- Lakshmikantham, V., y D. Trigiante, Theory of Difference Equations, Numerical Methods and Examples,
Nueva York,
mation 1, 271-285, 1985. Academic Press, 1988.
Johnson, L. W., y R. D. Riess, Numerical Analysis, 21. ed., Reading, Mass., Addison-Wesley, 1982. Lambert, J., Computational Methods in Ordinary Dijferential Equations, Nueva York, Wiley, 1973.
Joyce, D., "Survey of extrapolation processes in numerical analysis", SIAiv!REV 13, 435-490, 1971.
Lancaster, P., "Error analysis for the Newton-Raphson method", NM 9, 55-68, 1966.
Kahan, W., " Laguerre's method and a circle which contains at least one zero of a polynomial", SIAMNA 4, 474-482, 1967.
Lancaster, P., y K. Salkauskas, Curve and Surface Fitting, Nueva York, Academic Press, 1986.
Kahaner, D., "Matrix description of the fast Fourier transform", IEEETransactions Audio and Electroacoustics AU-18,
422-450, 1970. Lancaster, P., y M. Tismenetsky,Theory aj Matrices, 21 ed., Nueva York, Academic Press, 1985.
Kahaner, D., "Toe fast Fourier transform by polynomial eva!uation", ZAMP 29, 387-394, 1978. Lanczos, C., Discourse on Fourier Series, Edimburgo: Oliver and Boyd, ! 966.
Kahaner, D., C. Moler y S. Nash, Numerical Methods and Software, Englewood Cliffs, N.J., Prentice-Hall, 1989.
Lapidus, L., y W. E. Schiesser, Numerical Methods far Differential Equations, Nueva York, Academic
Kaps, P., y P. Rentrop, " Generalized Runge-Kutta methods of order four with step size control for stiff orclinary clifferential Press, 1976.
equations", NM 33, 55-68, 1979. Lapidus, L., y J. Seinfield, Numerical Solution of Ordinary Differential Equati�ns, Nueva York, Academic
Press, 1971.
Karmarkar, N., "A new polynomial-time algorithm for linear programming", Combinatorica 4, 373-395, 1984. Laurie, D., "Automatic numerical integration over a triangle", Technical Report, Pretoria, Sudáfrica,
Center forMathematical Sciences, 1978. National Research
Karon, J. M., " Computing improved Chebyshev approximations by the continuation method", SIAMNA 15, 1269-1288,
1978.
Lawson, C. L., y R. J. Hanson, Solving Least Squares Problems, Englewood Cliffs, N.J., Prentice-Hall, 1979.
Keller, H. B., Numerical Methods forTwo-Point Boundary-Value Problems. Waltham, Mass., Blaisdel, 1968.
Lawson, C. L., R. J. Hanson, D. R. Kincaid y F. T. Krogh, "Basic linear algebra subprograrns for Fortran usage",
Keller, H. B., Numerical Solution ofTwo-Point Boundary Value Problems, Filadelfia, SIAM, 1976. ACMTOMS 5, 308-323, 1979.
Keller, H. B., " Numerical solution of bifurcation and nonlinear eigenvalue problems", En Applications of Bifurcation
Theory (P. Rabinowitz, ed.), 359-384, Nueva York, Academic Press, 1977. Levin, M., "An iterative method for the solution of systems of nonlinear equations", Analysis 2, 305-313, 1982.
702 Bibliografía Bibliografía 703
Li, T. -Y., "Solving polynomial systems", Mathematics Intelligen cer 9, 33-39, 1987. Nashed, M. Z., ( ed.), Generalized lnverses and A pplication s, Nueva York, Academic Press, 1976.
Lieberstein, H. M., A Course in Numerical Analj,sis, Nueva York. Harper & Row, 1968. Nazareth, L., "Homotopy techniques in linear programming", A lgorithmica, 1989.
Linear, P., Theore tical Nu merical A nalysis, Nueva York. Wiley, 1979. Nerinckx, D., y A. Haegemans, "A comparison of nonlinear equation solvers", Joumal Computing and Applied M athe
. matics 2, 145-148, 1976.
Longley, J. W., Least Squares Computations Using Orthogonalization M ethods, Nueva York. Dekker, 1984
olatio n , Reading, Mass., Addison-We sley, 1983. Newman, D. J., y T. J. Rivlin, "Optima! universally stable interpolation", Analysis 3, 355-367, 1983.
Lorentz, G. G., K. Jetter y S. D. Riemenschneider, Birkhofflnterp
Luenberger, D. G., Introduction to Linear and Nonlinear Programming, Reading, Mass., Addison-Wesley, 1973. Nielson, G. M., "Sorne piecewise polynomial alternatives to splines under tension". En Compute, Aided Geometric
Design (R. E. Barnhill y R. F. Riesenfeld, eds.), 209-235, Nueva York. Academic Press, 1974.
Lyness, J., "AUG2 Integration over a triangle", Mathematics and Computer Science Report ANUMCS-TM-13, Argonne, Nievergelt, J., J. G. Farrar y E. M. Reingold, Computer Approaches to Mathematical Problems, Englewood Cliffs, N.J.,
m., Argonne National Laboratory, 1983. Prentice-Hall, 1974.
Lyness, J. N., y J. J. Kaganove, "Comments on the nature of automatic quadrature routines", ACMTOMS 2, 6 5-81. 1976. Noble, B., y J. W. Daniel, Applied Linear Algebra, 3!!. ed., Englewood Cliffs, N.J., Prentice-Hall, 1988.
Machura, M., y R. Sweet, "Survey of softwarefor partial differential equations", ACMTOMS 6, 461-488, 1980. Nussbaumer, H. J., Fast Fourier Transform and Convolution Algorithms, Nueva York, Springer, 1982.
MacLeod, M. A., "Improved computation of cubic natural splines with equi-spaced knots", MOC 27, 107-109, 1973.
Oden, J. T., Finite Elements of Nonlin ear Continua, Nueva York, McGraw-Hill, 1972.
Mandelbrot, B., The Fractal Geometry of Nature, Nueva York. Freeman, 1982.
Oden, J. T., y J. N. Reddy, An Introduction to the Mathematical Theory of Finite Elements, Nueva York, Wiley, 1976.
Marden, M., Toe Geometry of the Zeros of a Polynomial in a Complex Variable, Providence, RJ., AMS, 1949.
Oppe, T. C., y D. R. Kincaid, "Parallel LU-factorization algorithms for dense matrices", En Supercomputing, (E. N.
Marden, M., Geometry of Polynomials, Providence, R.I., AMS, 1966. Houstis, T. S. Papatheodorou, y C. D. Polychronopoulos, eds.), Lecture Notes in Computer Science 297, 576 -594,
Nueva York, Springer-Verlag, 1988.
Marsden, M. J., "An identity for spline functions with applications to variation-dimi.nishing spline approximation", AT3,
7-49, 1970. Oppe, T. C., W. D. Joubert y D. R. Kincaid, "NSPCG User's guide, version LO, packagefor solving large sparse linear
McCormick, S. F., Multigrid Methods, Filadelfia, SIAM, 1987. systems by various iterative methods", Centerfor Numerical Analysis Report CNA-216, Austin, Tex., University of
Texas en Austin, 1988.
McKeenman, W. M., "Algorithm 145: Adaptive numerical integration by Simpson's rule", ACMCOM 5, 604, 1962. Orchard-Hays, W., A dvanced Linear Programming Computing Techniques, Nueva York. McGraw-Hill, 1968
McNamee, J. M., "Numerical differentiation of tabulated functions with automatic choice of step-size", lntemational Ortega, J. M., Numerical Analysis: A Second Course, Nueva York, Academic Press, (reimpreso en Filadelfia, SIAM,
Joum al Numerical M ethods Enginnering 21, 1171-1185, 1985.
1990 ), 1972.
Meinguet, J., "Refined error analysis of Cholesky factorization", SIAMNA 20, 1243-1250, 1983.
Ortega, J.M., Introductio n to Parallel and Vector So/ution of Linear Systems, Nueva York, Plenum, 1988.
Meyer, G. H., "On solving nonlinear equations with a one-parameter operator embedding", SIAMNA 5, 739-752, 1968.
Ortega, J. M., y W. C. Poole, An Introduction to Numerical M ethods for Differential Equations, Marchfield, Mass., Pitman,
Micchelli, C. A., "Algebraic aspects of interpolation", En Approximation Theory (C. de Boor, ed.), Proceedings of 1981.
Symposia in Applied Mathematics 36, 81-102, Providence, R.I., AMS, 1986a
Ortega, J. y W. C. Rheinboldt, Iterative Solution of Nonlinear Equations in Severa/ Variables, Nueva York, Academic
Micchelli, C. A., "Interpolation of scattered data: Distance matrices and conditionally positive definite functions", Press, 1970 .
Constructive Approximation 2, 11-22, 1986b.
Osborne, M. R., "On Nordsieck's method for the numerical solution of ordinary differential equations", BIT 6, 51-57,
Micchelli, C. A. y T. J. Rivlin (eds.), Optima/ estimation in approximation theory, Nueva York, Plenum, 1977. 1966.
Mickens, R. E., Dijfere nce Equa tions, Nueva York. Van Nostrand-Reinhold, 1987. Ostrowski, A. M., Solution of Equations and Systems of Equations, 2!!. ed., Nueva York, Academic Press, 1966.
Miranker, W. L., Numerical M ethods for Stiff Equations and Sing ular Perturbation Problems, Boston, Reidel, 1980. Paddon, D. J., y H. Holstein, Multigrid Methods for Integral and Differential Equations, Nueva York, Oxford University
Press, 1985.
Mitchell, A., Computat ional Methods in Partía/ Differential Equations, Nueva York, Wtley, 1969.
Parlett, B. N., "Laguerre's method applied to the matrix eigenvalue problem", M ath. Comp. 18, 464-485, 1964.
Mitchell, A. R., y R. Wait, The Finite Element M ethod in Partial Differential Equations, Nueva York. Wtley, 1977.
Parlett, B. N., The Symmetric Eigenvalue Problem, Englewood Cliffs, N.J.• Prentice Hall, 1981.
Moler, C. B., y C. F. Van Loan, "Nineteen dubious ways to compute the exponential of a matrix", SIAMREV20, 801-836,
1978. Parter, S. (ed.), y Large Sea/e Scientific Computation, Nueva York. Academic Press, 1985.
Moore, R. E., M ethods and Application s of lnterval Analysis, Filadelfia, SIAM, 1979. PCGPAK, "PCGPACK User's guide, version 1.2", New Haven: Scientific Computing Associates, Inc., 1984.
Moore, R. E., Computational F unctional Analysis, Nueva York, Wtley, 1985. Peitgen, H., y P. Richter, The Beauty of Fractals, Nueva York, Springer-Verlag, 1986.
Morgan, A., "A homotopyfor solving polynomial systems", Applied Mathematical and Computation 18, 87-92, 1986. Peitgen, H.-0., D. Saupe y F. V. Haeseler, "Cayley's problem and Julia sets", Mathematics lntelligencer 6, 11-20, 1984.
Morgan, A., Solvin g Polynomial Systems Using Co ntinuation for Engineering and Scientijic Problems, Englewood Cliffs, Pentose, R., "A generalized inversefor matrices", Proceedi ngs Cambridge Phi/. Society 51, 406-413, 1955.
N.J., Prentice-Hall, 1987.
Pereyra V., "Finite difference solution of boundary value problems in ordinary differential equations", En Studies in
Moses, J., "Symbolic integration: Toe stormy decade", ACMCOM 14, 548-560, 1971. Numerical Analysis (G. H. Golub, ed.), 243-269, Washington, D. C., MAA, 1984.
NAG, NAG Fortran Library Manual, Downers Grove, Ill., NAG, Inc., 1990. Perron, O., Die Lehre von Kettenbrüche n, Leipzig, Teubner, reimpreso en Nueva York, Chelsea, 1929.
704 Bibliografía Bibliografía 705
Rivlin, T. J., The Chebyshev Polynomials, Nueva York, Wtley, segunda edición, 1990, 1974.
Pete rs, G.. y J. H. Wilkinson, "Practical problems arising in the solution of polynomial equations", IMAJNA 8, 16-35,
1971. Roache , P., Computational Fluid Dynamics, Albuque rque, He rmosa, 1972.
Phillips, G. M., y P. J. Taylor, Theory and Applications of Numerical Analysis, Nue va York, Academic Press, 1973. Roberts, S., y J. Shipman, Two-Point Boundary Value Problems: Shooting Methods, Nue va York, Else vier, 1972.
Pickering, M., An lntroduction to Fast Fourier Transform Methods far Partía/ Differential Equations, With Applications, Rockafellar, R. T., Convex Analysis, Prince ton, N.J., Princeton University Press, 1970.
Nue va York, Wiley, 1986.
Rose , D. J., "A simple proof for partial pivoting", AMM 82, 919-921, 1975.
Pickove r, C. A., "A note on chaos and Halley's methods", ACMCOM (11) 31, 1988.
Rose, D. J., y R. A. Wtlloughby (eds.), Sparse Matrices and Their Applications, Nueva York, Plenum, 1972.
Piessens, R., E. deDoncker-Kapenga, C. W. Übe rhube r, y D. H. Kahaner, QUADPACK: A Subroutine Package for Automatic
Jntegration, Nue va York, Springer-Ve rlag, 1983. Rosenbloom, P. C., ''Toe method of steepest desee n!", En Numerical Analysis (J. H. Curtiss, ed.), "Symposia in Applied
Mathe matics", VI, 127-176, 19.56.
Powers, D., Boundary Value Problems, Nue va York, Academic Pre ss, 1972.
Roy, M. R., A History of Computing Technology, Englewood Cliffs, N.J., Prentice-Hall, 1985.
Prage r. W. H., Applied NumericalLinear Algebra, Englewood Cliffs, N.J., Prentice-Hall, 1988.
Royden, H. L., Real Analysis, 2�. ed., Nueva York, Macmillan, 1968.
Prenter, P., Splines and Variational Methods, Nueva York, Wiley, 1975.
Rozema, E. R., "Romberg integration by Taylor se ries", AMM 94, 284-288, 1987.
Prince , P. J., y J. R. Dormand, "High order embedded Runge -Kutta formulre", J. Comp. Appl. Math. 1, 67-75, 1981.
Saaty, T. L., Modem Nonlinear Equations, Nueva York, Dove r, 1981.
Pruess, S., "Properties of splines in tension", AT 17, 86-96, 1976.
Salamin, E., "Computation of 1t using arithmetic-geome tric mean", MOC 30, 565-570, 1976.
Pruess, S., "An algorithm for computing smoothing splines in tension", Computing 19, 365-373, 1978.
San der, L. M., "Fractal growth", Scientific American, (1) 256, 94-100, 1987.
Rabinowitz, P., "Applications of linear programming to numerical analysis", SIAMREVlO, 121-159, 1968.
Schechter, M., "Summation of divergen! series by compute r", AMM 91, 629-632, 1984.
Rabinowitz, P. (ed.)., Numerical Methods for Nonlinear Algebraic Equations, Londres, Gordon and Breach, 1970.
Scheid, F., Numerical Analysis, Nue va York, McGraw-Hill, 1988.
Raimi, R. A., "On the distribution of first significant figure s", AlvIM16, 342-347, 1969.
Schendel, U., Introduction to Numerical Methods far Para/le/ Computers, Nueva York, Wiley, 1984.
Rall, L. B. (ed.), Error in Digital Computation, Nueva York, Wiley, 1965.
Schnabel, R. B., y P. D. Frank, "Tensor methods for nonlinear equations", SIAMNA 21, 815-843, 1984.
Ralston, A., A First Course in Numerical Analysis, Nueva York, McGraw-Hill, 1965.
Schoenbe rg, I. J., "Contributions to the problem of approximation of equidistant data by analytic functions", Quarterly
Ralston, A., y C. L. Meek (e ds.), Encyclopedia of Computer Science, Nueva York, Pe trocelli/Charte r, 1976. Applied Mathematics 4, 45-99 y 112-133, 1946.
Ralston, A., y P. Rabinowitz,A First Course in Numerical Analysis, Nue va York, McGraw-Hill, 1978. Schoe nbe rg, I. J., "On spline functions", En Inequalities (0. Shisha, ed.), 255-291, Nue va York, Academic Press, 1967.
Rand, R., Computer Algebra in Applied Mathematics: An lntroduction to MACSYMA, Boston, Pitrnan, 1984. Schoenberg, I. J., Mathematical Time Exposures, MAA, 1982.
Redish, K. A., "On Laguerre 's method", lnt. J. Math. Educ. Sci. Technol. 5, 91-102, 1974. Schultz, M. H., Spline Analysis, Englewood Cliffs, N.J., Prentice-Hall, 1973.
Reíd, J. K. (e d.),Large Sparse Sets ofLinear Equations, Nueva York, Academic Press, 1971. Schumaker, L. L., "Fitting surfaces to scatte red data", En Approximation Theory JI (G. G. Lorentz, C. K. Chui y L. L.
Rheinboldt, W. C., Methods for Solving Systems of Nonlinear Equations, CBMS Serie s in Applied Mathe matics 14, Schumake r, eds.), 203-268, Nue va York, Academic Press, 1976.
Filadelfia, SIAM, 1974. Schumaker, L. L., Spline Functions, Nueva York, Wiley-Interscie nce, 1981.
Rheinboldt, W. C., "Solution fie lds of nonlinear equations and continuation methods", SIAMNA 17, 221-237, 1980.
Schweikert, D. G., "An interpolation curve using splines in tension", Joumal Mathematics & Physics 45, 312-317, 1966.
Rheinboldt, W. C., Numerical Analysis of Parameterized Nonlinear Equations, Nueva York, Wiley, 1986.
Scott N. R., Computer Number Systems and Arithmetic, Englewood Cliffs, N.J., Prentice-Hall, 1985.
Rice, J. R., Approximation of Functions, vals. 1 y 2, Reading, Mass., Addison-Wesley, 1964, 1969. Shampine , L. F., y R. C. Allen, Numerical Computing: An lntroduction, Filadelfia, Saunders, 1973.
Rice, J. R., "Expe riments on Gram-Schmidt orthogonalization", MOC 20, 325-328, 1966.
Shampine, L. F., y C. Baca, "Error estimators for stiff differential equations", Joumal Computing & Applied Mathematics
Rice, J. R., "SQRARS: An algorithm for least squares approximation", En Mathematical Software (J. R. Rice, ed.), Nue va II, 197-208, 1984.
York, Academic Pre ss, 1971a.
Shampine, L. F., y C. W. Gear, "A use r's view of solving stiff ordinary differential equations", SIAMREV 21, 1-17, 1979.
Rice, J. R. (ed.), Mathematical Software, Nue va York, Academic Press, 1971b.
Shampine, L. F., y M. K. Gordon, Computer Solution of Ordinary Differential Equations: The lnitial Value Problem, San
Rice, J. R., "Software for numerical computation", En Research Directions in Software Technology 16 (P. Wegner, ed.), Francisco, Freeman, 1975.
688-708, Cambridge, Mass., MIT Press, 1979.
Shampine, L. F., H. A. Watts y S. M. Davenport, "Solving nonstiff ordinary differential equations-The state of the art'',
Rice, J. R., Matrix Computations and Mathematical Software, Nueva York, McGraw-Hill, 1981. SL4MREV18, 376-411, 1976.
Rice, J. R., Numerical Methods, Software, and Analysis, Nue va York, McGraw-Hill, 1983. Shepard, D., "A two-dimensional interpolation function for irregularly spaced data", Proceedings 23rd, National Confe
rence ACM, 517-524, 1968.
Rice, J. R., y R. F. Boisvert, Elliptic Problem Solving Using ELLPACK, Nueva York, Springe r-Verlag, 1985.
Skeel, R. D., "Equivalent forms of multistep formulas", MOC 33, 1229-1250, 1979.
Rice, J. R., y J. S. White, "Norrn_s for smoothing and e stimation", SIAMREV 6, 243-256, 1964.
Skee l, R. D., "Effect of equilibration on residual size far partía! pivoting", SIAMNA 18, 449-454, 1981.
Richtmey e r, R. D., y K. W. Morton, Difference Methods for lnitial Value Problems, Nue va York, Wiley, 1967.
Bibliografía 707
706 Bibliografía
Bul/etin AJJ1S 4, 1-36, 1981. Traub, J. F., Iterative Methods for the Solution of Equations, Englewood Cliffs, N.J., Prentice-Hall, 1964.
Smale, S., "Toe funda mental theorem of algebra and complexity theory",
Moler, Matrix Eigensystem Routines-EISPACK Traub, J. F., 'Toe calculation of zeros o f polyno mials and analytic functions", En Mathematical Aspects of Computer
Smith, B. T.. J. M. Bo yle, B. S. Garbow, Y. Ikebe, V. C. Klema y oC.rk,B.Springer Science, Proceedings Symposium Applied Mathematics 19, 138-152, Providence, R.I., AMS, 1967.
Guide, 2� ed., Lecture Notes in Compute r Science 6, Nu eva Y -Verlag, 1976.
N u eva York, Oxford University Press, 1965. Trustrum, K., Linear Programming, Lo ndres, Routledge and Kegan Paul, 1971.
s,
Smith, G. D., Numerical Solution of Partía/ Dijferential Equation
(también, Nueva York, Springer-Verlag), Tumer, P. R., 'Toe distribution of leading significant digits", IMANA 2, 407-412, 1982.
Smith, K. T., Primer of ModemAnalysis, Belmont, Calif., Bogden and Quigley,
1971. van der Corput, J. G., "Sur l' appro ximation de Lagnerre des racines d' une équa tion qui a toutes ses racines réelles",
ation", IEEE Transactions Computing 34, 274-278,
Heder/. Acad. Wetensch, Proc. 49, 922-929, 1946.
Sorenson, D. C., "Analy sis of pairwise pivoting in Gaussian e!imin
1985. Vandergraft, J. S., lntroduction to Numerical Computations, Nueva York, Academic Press, 1978.
1975.
Steinberg, D. L, Computational MatrixAlgebra, Nueva York, McGraw-Hill, Varga, R. S., Matrix Iterative Analysis, Englewood Cliffs, N.J., Prentice-Hall, 1962.
Hall, 1974.
Stembenz, P. H., Floating-Point Computations, Englewood C!iffs, N.J., Prentice- Vemuri, V., y W. J. Karplus, Digital Computer Treatment of Partial Dijferential Equations, Englewood C!iffs, N.J.,
Different ial Equation s, Nueva York, Springer-Verlag, 1973. Prentice-Hall, 1981.
Stetter, H. J.,Analysis of Discretization Methods for Ordinary
ss, 1973.
Vemer, J. H., "Explicit Runge-Kutta methods with estirnates of the local truncation error", SIAMNA 15, 772-790, 1978.
Stewart, G. W., Introduction to Matrix Computations, Nueva York, Academic Pre
ev Y o rk, Springer- Verlag, 1980. Vichnevetsky, R., Computer Methods for Partía/ Dijferential Equations, vol. 1, Elliptic Equations and the Finite Element
Stoer, J., y R. Bulirsch, Introduction to NumericalAnalysis , N u a
Method, vol. 2, Initial Value Problems, Englewood Cliffs, N.J., Prentice-Hall, 1981, 1982.
ridge Press, 1986.
Stra ng, G., Introduction toApplied Mathematics, Wellesley, Mass., Wellesley-Camb Vo n Rosenberg, D. U., Methods far the Numerical Solution of Partial Dijferential Equations, Nuerva York, American
s, N.J., Prentice Hall, 1973. Elsevier, 1969.
Strang, G., y G. Fix, AnAnalysis of the Finite Element Method, Englewood Cliff
Grave, Calif., Brooks/Cole, 1973. W achspress, E. L., Iterative Solution of Elliptic Systems, Englewood Cliffs, N.J., Prentice-Hal!, 1966.
Street, R. L., The Analysis and Solution of Partía/ Dijferential Equations, Pacific
Wacker, H. G.(ed.), Continuation Methods, Nueva York, Academic Press, 1978.
Stroud, A. H., "Error estirnates for Romberg quadrature", SIAMNA 2, 480-488, 1965.
N.J., Prentice-Hall, 1971. Wait, R., y A. R. Mitchell, Finite ElementAnalysis andApplications, Nueva York, Wiley, 1986.
Stroud, A. H., Approximate Calculation of Mu/tiple Integrals, Englewood C!iffs,
Equations, Nueva York, Springer-Verla g, Wall, H. S., Analytic Theory of Continued Fractions, Princeton, van Nostra nd, 1948.
Stroud, A. H., Numerical Quadrature and Solution of Ordinary Differential
1974. Waser, S., y M. J. Flynn, Introduction toArithmetic far Digital Systems Designers, Nueva York, Holt, Reinhart, & Winston,
, N.J., Prentice-Hall, 1966. 1982.
Stroud, A. H., y D. Secrest, Gaussian Quadrature Formulas, Englewood Cliffs
Subbotin, Y. N., "On piecewise-polynomial approximation", Mat. Zametcki 63-70, 1, (traducción, 1967, Mathematical Wasserstrom, E., "Numerical solutions by the continuation method", SIAMREV 15, 89-119, 1973.
Notes l, 41-46), 1967. Watkins, D. S., "Understanding the QR algorithm", SIAMREV24, 427-440, 1982.
al equations", Report TN/LA-109,
Swarztrauber, P. N., "Efficient subprograms for the solution of elliptic partial differenti Watso n, L. T., "A globally convergen! algorithm for computing fixed points of C2 maps", Applications in Mathematical
Boulder, Colo., National Center for Atrnospheric Research, 1975. Computing 5, 297-311, 1979.
Computations (G. Rodrigue, ed.), Nueva
Swarztrauber, P. N., "Vectorizing the FFT's parallel computations", En Parallel Watson, L. T., "Numerical linear algebra aspects of globa lly co nvergent ho motopy methods", SIAMREV 28, 529-545,
York, Academic Press, 1982. 1986.
H. Golub, ed.), 319-370, Washington,
Swarztrauber, P. N., "Fast Poisson solvers", En Studies in NumericalAnalysis (G. Watson, L. T., S. C. Billups y A.·P. Margan, "HOMPACK: A suite of codes for globally convergent homotopy algorithms",
D. C., MAA, 1984. ACMTOMS 13, 281-310, 1987.
Hilbert matrix", Oxford Quarterly
Taussky, O., "A remark concerning the characteristic roots of finite segments o f the Weaver, H. J., Applications of Discrete and Continuous Fourier Analysis, Nueva York, Wiley, 1983.
Joumal Mathematics 20, 82-83, 1949.
Taussky, O., "How I became a to rchbearer for matrix theory",AMM 95, 801-812, 1988. Wedin, P. A., "Perturbation bounds in connectio n with the singular value decomposition", BIT 12, 99-111, 1972a.
Taylor, J. R., An Introduction to Error Analysis, Nueva York, University Science Boo ks, 1982. Wedin, P. A., "Perturbation theory for pseudoinverses", BIT13, 217-232, 1972b.
Tewarson, R. P., Sparse Matrices, Nueva York, Academic Press, 1973. Wendroff, B., Theoretical NumericalAnalysis, Nueva York, Academic Press, 1966.
Werner, W., "Polynomial interpolatio n: L agrange versus Newton", MOC 43, 205-217, 1984.
Tho mas, B., 'Toe Runge-Kutta metho ds", Byte, Abril, 191-210, 1986.
National Bureau Standards 65, Westfall, R. S., Never at Rest: A Biography of Isaac Newton, Nueva York, Cambridge University Press, 1980.
Todd, J., "Computational problems concerning the Hilbert matrix", Joumal Research
19-22, 1961. Whitehead, G. W., Homotopy Theory, Cambridge, Mass., MIT Press, 1966.
Todd, J., Survey of Numerical Analysis, Nu eva York, McGraw-Hill, 1962. Whittaker, E., y G. Robinson, The Calculus of Observations, �- ed., Londres: Blackie and Son, (reimpreso en Nu eva
York, Dover, 1967), 1924.
Todd, J., Basic Numerical Mathematics, vol 2, Nueva York, Academic Press, 1978.
sy stems of equations", En Tapies in Wilkinson, J. H., Rounding Errors inAlgebraic Processes, Englewood Cliffs, N.J., Prentice-Hall, 1963.
Todd, M. J., "An introduction to piecewise linear homotopy algorithms for solving
Numerical Analysis (P. R. Tumer, ed.), Lecture Notes in Mathematics 965, 147-202, Nueva York, Springer-Verla g, Wtlkinson, J. H., The Algebraic Eigenvalue Problem, Oxford: Clarendon Press, 1965.
1982.
ÍNDICE DE MATERIAS
708 Bibliografía
Chebyshev, solución a las ecuaciones cuadratura gaussiana, 47O, 471 ecuación variacional, 537 escala, 149
lineales, 387 cuasi-interpolación, operadores de, 359 ecuaciones de segundo orden cuasi espacio lineal normado, 175
Chebyshev, teorema de la alternancia de, cuenca de atracción, 108 lineales, 627 espacio nulo, 22
296, 391 curvas características, 614, 620, 627, 635 ecuaciones diferenciales de segundo orden, espectro (sp), 246
Chebyshev, teoría de, 381 curvas de nivel, 212 564 esquema newtoniano, 404
Cholesky, factorización de, 129, 136, 158 curvatura, 330 ecuaciones diferenciales lineales, 572 estabilidad, 532, 533, 598
algoritmo de, 137 ecuaciones diferenciales ordinarias de estable, 533, 596
coeficiente binomial, 297 D orden superior, 539 estado estacionario, 584
colocación, 569, 612 definida no negativa, 142 ecuaciones diferenciales parciales, 591 estructura diagonal, 129
columna unitaria diagonalmente domi- definida positiva, 125, 197 ecuaciones diferenciales parciales, clasifi estructura triangular inferior, 130
nante, 207 deflación (reducción), 95, 244, 280 cación de, 628 estructura triangular superior, 130
combinaciones convexas, 385 dependencia lineal, 665 ecuaciones diferenciales parciales de Euler, fórmula de, 422
condicionamiento, 52 derivada, 2 primer grado, 619 Euler-Maclaurin, fórmula de, 496, 499
conjugado, 99, 196, 231 derivadas de los E-splines, 346 ecuaciones diferenciales parciales elípticas, Euler, método de, 117, 510, 583
conjunto crítico, crít(f), 383 desbordamiento por defecto, 33 628 Euler modificado, método de, 515, 521,
conjunto factible, 116, 671, 675 desbordamiento por exceso, 33 ecuaciones diferenciales parciales hiperbó- 583
consistente, 533, 660, 673 descenso más rápido, 209, 212 licas, 628 evaluación de funciones, 46
continua, 2 descomposición en valores singulares, 264, ecuaciones en diferencias, 20, 22, 51 evaluaciones numéricas en puntos, 492
contracción iterada, 90 265 ecuaciones en diferencias estables, 25 exceso en la fila i, 164
convergencia, 566 descomposición LU (factorización), 132 ecuaciones lineales de segundo orden, 562 exponencial de una matriz, 574, 581
cuadrática, 12, 69 desigualdades lineales, 659, 665, 666 ecuaciones no lineales, 72, 588 exponente, 30
lineal, 12 desplazamiento del origen, 279 ecuaciones rígidas, 583 extrapolación, 199
orden de, 87 desviación, 369 elemento pivote, 143
diferencia dividida, propiedades de la, 309 eliminación gaussiana básica, 143 F
sucesiones, 9-12
superlineal, 12 diferenciable, 2 eliminación gaussiana: factor, teorema del, 92
convergencia de polinomios de interpola- diferenciación vía interpolación polino- con pivoteo de fila escalada, 149 factorización QR, 257, 275
ción, 295 mial, 448 en sistemas permutados, 148 Francis, algoritmo de, 275
convergencia lineal, 12 diferenciación numérica, 443, 444 eliminación hacia adelante, 149 factorización QR con desplazamiento, 279
convergencia superlineal, 12 diferencias divididas, 303, 305 épsilon de la máquina, 37 algoritmo, 280
convexidad, 384, 659 diferencias divididas con repeticiones, 319 equilibración, 180 factorizaciones LU, 129, 132
convexo, 384 diferencias divididas de orden superior, equilibración de columnas, 160, 181 factorizaciones ortogonales, 250
corrección de la malla, 650 306 equilibración de filas, 181 factorizaciones PA = LU, 152
cota inferior, máxima (mci), 14-15 distancia de una función a un espacio equivalencia unitaria, 274 Farkas, teorema de, 667
cota superior, mínima (mes), 14 splines, 362 error absoluto, 42 Farkas no homogéneo, teorema de, 667
cotas a posteriori, 224 división sintética, 14, 93 error de redondeo global, 510 fase de factorización, 149
cotas inferiores, 14 Doolittle, factorización de, 133 error de redondeo local, 510 algoritmo de, 151
cotas superiores, 14 algoritmo de, 134 error de redondeo unitario, 34-36 fase de solución, 149
Cramer, regla de, 311 dualidad, teoría de la 672 error de truncamiento, 445, 507, 517 algoritmo de, 152
Crank-Nicolson, método de, 602 error de truncamiento local, 509, 517, 535 Fibonacci, sucesión de, 19, 56
Cresta, función de, 404 E error en la interpolación polinomial, 291 fila unitario diagonalmente dominante, 207
criterios para concluir, 60 ecuación característica, 191, 233 error de truncamiento global, 510, 536 .fi(x), 34-36
Crout, factorización de, 133 ecuación de difusión, 591 error relativo, 42 fi(x 0 y), 35, 224
mínimos cuadrados, móviles, 411 ecuación de la primera variación, 560 error relativo, análisis del, 38 forma canónica, 635
cuadrados, mínimos, problemas de los, ecuación de onda, 619 error total, 510 forma cuadrática, 125
256 ecuación de calor, 591, 620 errores, 509, 517, 603 forma estándar, 671
cuadrados, mínimos, teoría de los, 369 ecuación integral, 513 errores de redondeo, 29, 509 forma estándar, segunda, 672
cuadratura, fórmulas de, 471 ecuación normal, 257, 372, 378, 411, 617 errores globales, 532 fórmulas recursivas para las fracciones
cuadratura adaptativa, 486 ecuación parabólica, 591, 599, 628 errores locales, 532 continuas, 416
712 Índice de materias Índice de materias 713
Fourier,método de, 598 Halley,método de,76 interpolación,método de,local multiva- esquema de corrección de,651
Fourier,series de,422 Herrnite, interpolación de, 313 riado, 408 malla cartesiana, 397
Fourier,series de,complejas, 422 Herrnite, fórmula de cuadratura de, 471 interpolación, problemas de,396 mallas múltiples, ciclo V para,651
Fourier, transformada rápida de,421,426 herrnitiano,197,243 interpolar, 285 mallas múltiples,ejemplo de,645
algoritmo de, 431 Hessenberg, matriz de, 276 inversa,122 mallas múltiples,ejemplo de amortigua-
Fourier sinusoidal, transformada rápida de, Hessenberg, forma superior de, 276 inverso aproximado,179 miento de errores, 647
655 Hessenberg superior,reducción a la forma invertible,123 mantisa,30
fracciones continuas, 415 de, 276 involución, 261 MARC-32,30
fractal, 109 Heun, método de,515 inyectivo, 26 Marsden,identidad de,351
Fresnel, integral de,367, 511 Hilbert,matriz de, 54,380 iteración funcional, 82,526 matrices diagonalizables, 575
Frobenius, norma de,173 homotopía,111 matrices diagonalmente dominantes
función/aplicación contractiva,83 Homer, algoritmo completo de,96 J (predominio diagonal), 156
función de error, erf(x), 15, 366,511 Horner,método de, 14 Jacobi, método de, iteración de,186, 189, matrices de iteración:
función de interpolación, la más suave algoritmo de, 41,93,287 198 de Gauss-Seidel,198,208
posible, 329 Householder, factorización QR de, 257, Jordan, bloques de,576 de Jacobi,198, 208
función de peso,463,471 259 Jordan, forma canónica de, 576 de Richardson,198, 208
función dilogarítmica, 367,512 Householder, transformaciones de,257 Julia, conjunto de, 108 de SOR, 199, 208
función entera, 295 de SSOR, 199, 208
función inversa,557 I K matrices particionadas subdivididas,125
función lineal,492, 558,665 idempotente,273 matrices semejantes, 191,242
Karmarkar,algoritmo de, 116,684
función objetivo,116,671,675 matriz asociada,282
inconsistente, 611, 661,673 Kepler,ecuación de, 59, 88
función de potencia truncada, 492 matriz de descomposición,187
indeterminación, 33 Kolmogorov, teorema de la caracterización
funciones básicas, 569 matriz defectuosa, 240
inestabilidad numérica,50, 52 de, 383
funciones cardinales,289, 449 matriz desplazada A - l, 238
inestable, 26, 50 matriz elemental, 123
funciones continuas,13 ínfimo (ínf), 14 L
funciones explícitas,15 matriz fundamental,579
integración mediante interpolación polino Lagrange,fórmula de interpolación de, matriz jacobiana,72, 561,588
funciones implícitas, 15, 71 mial, 458 289,317 matriz identidad, 222
funciones multicuádricas, 412 integración numérica basada en interpola Lagrange,interpolación de,289,313, 449 matriz monomial, 127
funciones trascendentales superiores,365 ción, 457 Lagrange, polinomio de,289 matriz normal,248
integral coseno, 367 Lagrange, polinomios de interpolación de, matriz simétrica,120
G integral elíptica,512 289 matriz unitaria,242,261
Galerkin,método de, 611, 642 de segundo tipo,512 Laguerre,iteración de,102 Maclaurin,series de, 364,418
Gauss-Jordan,método de, 165 integral seno, 365 algoritmo de, 102 mejoramiento (refinamiento) iterativo,178
Gauss-Seidel,método de, 186, 194, 511, integrales exponenciales,55 Laplace, 606 menor principal,136
646,650 intercambio,394 Lax-Wendroff, método de, 637 método completamente implícito, 601
Gerschgorin,teorema de, 245 interpolación baricéntrica, fórmula de,303 Legendre,polinomios de,376 método convergente, 532
gradiente conjugado precondicionado,218 interpolación de splines,323 Leibniz,fórmula de,311 método de bipartición,60
algoritmo de, 216, 220 interpolación en dimensiones superiores, ley pitagórica generalizada,374 método de bisección, 59
Gram, matriz de,378 396 límite, 1 algoritmo de, 61
Gram-Schrnidt modificado, algoritmo de, interpolación en la forma de Newton, linealmente independiente sobre un método de intercambio,394
254 polinomios de, 287 conjunto, 349 método de diferencias finitas,564,593,
Grarn-Schmidt,proceso de, 251, 375 interpolación por medio de multicuádricas, linealización, 67 606
algoritmo de,252 412 Lipschitz,condición de, 503 método de la potencia,231,234
Green,función de, 554 interpolación polinominal, 285 método de la potencia inversa, 237
interpolación trigonométrica, 421 M método de la potencia inversa con despla-
H interpolación,fase de, 647 mal condicionado, 52,54,171 zamiento, 238
Haar, subespacio de,389 interpolación,matriz de, 354 malla burda, 645 método de la secante, 77, 557
714 Índice de materias Índice de materias 715
algoritmo de, 78 Newton, método de diferencias divididas ordenamiento natural, 608 problemas hiperbólicos, 637
método de la secante, orden de convergen de, 316 órdenes de convergencia, 87 problemas mal condicionados, 49, 52
cia, 80 Newton, forma de, del polinomio de cuadrática, 12 problemas sin dependencia temporal, 606,
método de los coeficientes indeterminados, interpolación, 286 lineal, 12 611
461, 524 Newton, fórmula de interpolación de, 320 orden a, 12 proceso univ�ado, 397
método de mallas múltiples, 644 Newton, iteración de, para polinomios, 96 superlineal, 12 producto Jt, 13
método de predicción-corrección, 526 Newton, método de, 65, 107, 115, 560, ortogonal, 211, 250, 373 producto cartesiano, 396
método del elemento finito, 618 algoritmo, 66, 309, 311 ortogonalidad, condición de, 617 producto escalar, 195, 214, 232, 616
método del gradiente conjugado, 209, 215 Newton-Cotes, fórmula de, 459 ortonormal, 250, 373 producto escalar, espacio con, 251, 371
algoritmo, 215 Newton-Raphson, iteración de, 65 producto PQ, 398
nilpotente, 577 p producto tensorial, 399
método directo para el cálculo de valores
propios, 232 no singular, 123 Parseval, identidad de, 379 producto tensorial, notación P ® Q para el,
método explícito, 527, 532, 591, 594 nodos, selección de, 294 Peano, núcleo de, 492 398
método implícito, 527, 532, 599 nodos, geometría del conjunto de, 402 Peano, teorema de, 493 programación lineal, 116, 659, 670
método matricial, 598 norma ponderada, 173 Penrose, propiedades de, 270 propiedad cardinal, 397
norma f1, 166, 172 pérdida de dígitos significativos, 43 propiedades de las matrices, 122
método multipaso de k-pasos, 527
norma 22 2, 166 permutación, 163, 309 punto de atracción, 108
método multipaso lineal, 527, 586
norma oo, 166, 172 permutación, matriz de, 148 punto extremo, 662
método SOR, 196
norma euclidiana, 166, 196, 232 permut�r,ión, vector de, 131 punto factible, 116, 671
métodos de aproximación no interpolato-
norma matricial asociada, 167 pivote, 143 punto factible básico, 677
rios, 359
norma matricial subordinada, 168 pivoteo, 146 punto factible óptimo (solución), 671
métodos de continuación, 111
normas, 165 pivoteo de la fila proporcionado, 150 punto fijo, 83
métodos de la dirección conjugada, 213 punto flotante, aritmética de, 31
normas matriciales, 166 pivoteo por filas, 143, 148
métodos de disparo, 556 punto flotante, análisis del error de, 35
normas vectoriales, 165 pivoteo por filas escalados, 151
métodos de un solo paso, 524 punto flotante, números de, 29
notación científica normalizada, 30 pivoteo total, 160
métodos directos, 185 Poisson, ecuación de, 615 punto flotante normalizado, 31
notación O, 10, 12
métodos iterativos, 185 polinomio característico, 21, 233, 574 puntos de desviación máxima, 437
notación o, 10, 12
métodos multipaso, 524, 529 polinomio mónico, 293, 465, 474
notación vectorial para las ecuaciones
métodos numéricos implícitos, 640 polinomio pérfido, 56 R
diferenciales, 540
métodos rápidos para la ecuación de polinomios exponenciales, 425, 434 radio de convergencia, 364
número de condición, 52, 54, 168
Poisson, 654 número de condición de la matriz, 169 polinomios fundamentales de interpola- radio espectral, 191
Milne, método de, 535 número de máquina, 31 ción, 458 raíces cuadradas, cálculo de, 70, 89
módulo, 231 números de máquina próximos, 32 polinomios ortogonales, 474 raíces cúbicas de la unidad, 108
módulo de continuidad, 360 Nyquist, frecuencia de, 433 precisión de la máquina, 36, 37 raíces de las ecuaciones, 59
módulo (de un número complejo), 196 precisión, doble, 31 ramas, 16
muestras, 433 o precisión extendida, 31 Rayleigh-Ritz, método de, 616
multi-índice, 413
O mayúscula, fúnciones y sucesiones, 10 precondición, 218 recuento de operaciones (ops), 154, 653
multinomio, 413 primera ecuación variacional, 560 redondeo, 6
o minúscula, funciones y sucesiones, 10,
multiplicación anidada, 13, 14, 93, 287 problema de valores en la frontera en dos redondeo, análisis del error por:
12
multiplicadores, 143, 151 operaciones elementales, 121 puntos, 548 Gauss, algoritmo de, 225
multiplicidad de un cero, 92 operaciones elementales con filas y problema de Dirichlet, 606, 612 redondeo a n cifras decimales, 6
columnas, 281 problema extremal, 399 redondeo hacia arriba (por exceso), 6, 33
N operaciones extensas, 154 problema discreto, 607 reducción de dominio, 46
n-ésimo convergente, 415 operador de desplazamiento, 21 problema dual, 672 reflexiones, 257
Neumann, serie de, 176 operador de diferencia lineal, 21 problema modelo, 569, 655 región de estabilidad absoluta, 587
1
Neville, algoritmo de, 312 operador de traslación, 429 problema no homogéneo, 579 regla compuesta, 460
: regla de la cadena, 507
Newton, método para polinomios de, 96 optimización, 663 problemas bien condicionados, 49, 54
Newton, método complejo de, 107 orden del método multipaso, 529 problemas de frontera, 547, 556, 564, 568 regla del punto medio, 469
716 Índice de materias Índice de materias 717
regla del rectángulo del lado derecho, 469 serie de potencias,364 multimallas, ciclo para, 652, 653 sistemas indeterminados. 268
regla del trapecio, 459 series armónicas, 49 multimallas, ejemplo de, 646 sistemas lineales, 119
compuesta, 460 seudoproducto interno,423 multiplicación anidada, 14 sistemas ortogonales, 373
recursiva, 480 seudocódigo: Newton, algoritmo de, 66 sistemas ralos (dispersos), 185
regla pitagórica, 251, 371 algoritmo de la secante, 78 Newton, algoritmo de, función implícita, sistemas triangulares, 132
regla recursiva del trapecio, 480 algoritmo QR desplazado, 280 71 sobrerrelajación sucesiva, 196
Remez, primer algoritmo de,392 aproximación adaptativa 436 Newton, método polinominal de, 96 solución mínima, 268, 269
representación de los enteros, 31 aproximación derivada: problemas con valor en la frontera: solución numérica de ecuaciones diferen-
residuo, 2 diferencia central, 434 método explícito, 595 ciales ordinarias, 501
restricción, 349,650 diferencia hacia adelante, 432 método implícito, 601 soporte, 342
restricción de f a K, 349 Richardson extrapolación, 437 método de las características, 634 SOR hacia adelante, 199
Riccati, transformación de, 588 Bairstow, algoritmo de, 101 Richardson, extrapolación de, 189 SOR hacia atrás, 199
Richardson, extrapolación de,443,-450 bisección, algoritmo de, 61 Richardson, iteración de, 189 spline cúbico natural,327
algoritmo de, 452 Chebyshev, aceleración de, 206 Romberg, extrapolación de, 482, 483 spline de grado k,323
Richardson, método de iteración de, 188, Cholesky, factorización de 137 Runge-Kutta, método de, 514 splines de primer grado, 436
198 cuadratura ajustable, 490 Runge-Kutta-Fehlberg, método de, 520 spline natural de grado superior, 333
Richardson, teorema de extrapolación de, cuadratura gaussiana de cinco puntos, solución de Ax = b dado PA = LV, 153, spline tenso, 330
450 473 154 splines cúbicos, 325
algoritmo de, 451 descenso más inclinado, 212 solución de yTA = el dado PA = LU, splines de tensión (rígidos), 330, 333
Ritz, método de, 611 diferencias divididas, 288, 308, 316 154 splines naturales, teoría de grado superior,
Romberg, integración de, 480 eliminación gaussiana básica, 146 solución del sistema tridiagonal, 159 333
algoritmo de, 482 en sistemas permutados, 148 sustitución progresiva, 131 Steffensen, método de, 74, 75, 82
Runge, función de, 296 eliminación gaussiana mediante pivoteo sustitución progresiva en sistemas Stirling, fórmula de, 684
Runge-Kutta, métodos de, 514 por filas escaladas (fase de factoriza permutados, 131 Sturrn-Liouville, problema con valor en la
adaptativo, 518 ción), 151,152 sustitución regresiva, 130 frontera de, 569
anidado,521 eliminación gaussiana mediante pivoteo Taylor, método de la serie de, 507 sucesión acotada, 25
de cuarto orden, 516 por filas escaladas (fase de solución), Taylor, método de la serie de, para suma booleana (?-r:fJ Q),398
de quinto orden, 519 152 sistemas, 543 suposición de no degeneración, 677
Runge-Kutta, procedimiento de, para extrapolación, 206 seudoinversa. 267 suprayectivo, 26
sistemas,544 factorización de Doolittle, 134, 135 seudonimación, 433 supremo (sup), 14
Runge-Kutta, procedimientos anidados de, factorización general LV, 134 seudonorma, 423 sustitución progresiva, 131
521 Furier, transformada rápida de, 431 Shepard,interpolación de, 406 en sistemas permutados, 131
Runge-Kutta-Fehlberg, método de, 518 Gauss-Seidel, iteración de 194 simétrico y definido positivo, 137, 209 sustitución hacia atrás, 131, 149
Runge-Kutta-Gill, método de, 522 gradiente conjugado precondicionado, Simpson, regla de, 485, 461 sustitución regresiva para sistemas permu
Runge-Kutta-Merson, método de, 523 221, 222 sistema binario, 30 tados, 131
Runge-Kutta-Verner, método de, 523 Gram-Schmidt, algoritmo de, 253 sistema decimal, 30 sustracción de cantidades casi iguales, 43
Gram-Schmidt modificado, algoritmo sistema ortonormal, 373
s de, 254,255 sistemas tridiagonales, 158 T
Sard, teoría de,de aproximación de Horner, algoritmo de,94, 288 sistemas consistentes, 667 traspuesta, 120
funcionales, 492 Horner completo, algoritmo de, 96 sistemas de ecuaciones, 119,639 Taylor, fórmula de, de la forma f(a+ h, b +
Schoenberg, teorema de, 493 iteración del gradiente conjugado,215, sistemas de ecuaciones diferenciales, 585 k), 5
Schoenberg-Whitney, teorema de, 355 216 sistemas de ecuaciones diferenciales de Taylor, fórmula de, de la forma f(x + h),5
Schur,factorización de, 242 Jacobi, iteración de, 190 primer orden, 539 Taylor, método de la serie de,506
Schur, teorema de, 242 Laguerre, algoritmo de, 105 sistemas de ecuaciones homogéneas,665 Taylor, método de la serie de, para siste-
Schwarz, desigualdad de, 371 método de la potencia, 235 sistemas de ecuaciones no lineales, 72 mas, 542
selección de nodos, 294 método iterativo,escalamiento,190 sistemas de primer orden,619 Taylor,polinomio de, 322, 364
semiespacio, 661 multimallas, ejemplo de errores dismi- sistemas equivalentes, 144 Taylor, series de, 364
senx, aproximación, 49 nuidos,648 sistemas inconsistentes, 268, 667 Taylor, teorema de: