Está en la página 1de 366

Análisis

. ..-.----
. ifR·, ,,
1 • 1
\• 1
1 :-
1

' ['.

.
' ).' '·'
. '\¡
1.• _ Kincaid\
l
[,1 'I . ,¡

numer1co
· ·. '. Cheneffl
>¡.1'
I .iu ;'
!'11··
• ¡,
1 '

=
Esta obra se diseñó para los estudiantes de ingeniería, ciencias y computación que cursan
el segundo año de la licenciatura.
'1 ,
.J
Se presentan algoritmos y métodos comúnmente utilizados en las ciencias de la compu-
1:
.f l.
il
. tación, con base en temas especiales del análisis numérico, como son la solución numérica
a ecuaciones diferenciales, álgebt:Í Íineal numérica y teoría de la aproximación. El enfoque
1

·\ � l1 �
',1
Las matemátjcas ·del. cálculo científico
. �

·.·
I
matemático del libro ofrece una amplia gama de teoremas, demostraciones e ideas .r/l I'
�\
interesantes que a su vez inspiran múchos procedimientos de computación y estimulantes ;:, ¡1
rnestionamientos de las ciencias de la computación.
g� .i!
11m' r,: l
David Kincaid Ward Cheney
Los problemas son de dos tipos: analíticos'y de computación, lo que permite al estudiante ; 1
familiarizarse con dos tipos de programación y le ayuda a tener una visión más profunda
de los algoritmos.
9 71\ ::i ,,

�\B '00
\lfJ. ·'..', '.')
\i 1' �.�l:\.i¡
I! OTRAS OBRAS DE INTERÉS PUBLICADAS POR
r/l
ADDISON-WESLEY IBEROAMERICANA:
j f

=
� Q.

/
ATKINSON y HARLEY: Introducción a los métodos numéricos con Pascal (64041)
(
GRIMALDI: Matemática discreta y combinatoria. Introduccióny aplicaciones (64406) f¡,.\ � ¡.al
l.• �
LANG: Introducción al análisis matemático (62907) �\
MEYER: Probabilidad y aplicaciones estadísticas, edición revisada (51877)
i
'

9
I¡ , -

/ NAGLE y SAFF:.F11Í1damentos de eC11aciones diferenciales (51836) '·' o


11!l. ,; �
r ,r e.
i\,¡ �· .\,
� - t /l
1
\i
-
"""
�,
' ::? �\'.
':l
,, �
l o

l
'

',-------......1,' 1
\'
·I ¡:.
• ,. 1 I
/

1
.:1 1
1

\ v:-
.,/
\
1,
1\
9;000H
(

\'i: 1
)
1,,
'

TT
ADDISON
WESLEY
.,

9 ''78DZW601305
I
A
TT ADDISON-WESLEY IBEROAMERICANA ,.
Argentina • Brasil • Chile • Colombia • Ecuador • España
·,\, Estados Unidos • México • Perú • Puerto Rico � Venezuela ISBN D-201-60130-3 601SO • 'I

,, , :,l"f ADDISON-WESLEY IBEROAMERICANA


".: .-"'-,,e
1\ :1
\
_¡_¡, .::,
=- ··· -�- - \
ANÁLISIS NUMÉRICO

Las matemáticas del cálculo científico


ANÁLISIS NUMÉRICO
LAS MATEMÁTICAS DEL CÁLCULO CIENTÍFICO

David Kincaid y Ward Cheney

The University of Texas en Austin

Versión en español de
Rafael Martínez Enríquez
y
Carlos Torres Alcaraz
Universidad Nacional Autónoma de México

Con la colaboración de
Hans Luis Fetter Nathanksy
Universidad Autónoma Metropolitana
Unidad lztapalapa, México

.,,\ ADDISON-WESLEY IBEROAMERICANA


Argentina • Brasil • Chile • Colombia • Ecuador • España
Estados Unidos • México • Perú • Puerto Rico • Venezuela
Versión en español de la obra Numerical Analysis: Mathematics ofScientific Computing, de David Kincaid y
Ward Cheney, publicada originalmente en inglés por Brooks/Cole Publishing Company, E.U.A.© 1991 por
Wadsworth, Inc., Belmont, California 94002.
PREFACIO
Esta edición en español es la única autorizada.
Este libro ha sido objeto de una larga evolución desde su origen como notas de clase que
servían de apoyo a los cursos de matemáticas y de informática, ofrecidos por la división
La ilustración de la portada muestra los fractales que corresponden a las cuencas de atracción para las raíces de estudios superiores de nuestra universidad. Estos cursos ponen a los estudiantes en
cúbicas de la unidad. Al final de la sección 3.5 se puede encontrar más información sobre las cuencas de contacto con los algoritmos y métodos de uso común entre quienes se dedican al cálculo
atracción. científico. En ellos se enfatizan tanto la fundamentación matemática como los aspectos
algorítmicos. Los estudiantes han sido de diferentes tipos: en el nivel de licenciatura
han provenido de las carreras de matemáticas, ingeniería, ciencias e informática. Por
otra parte, también los del posgrado de diversas disciplinas se han interesado por estos
cursos. Algunas partes de este libro se han utilizado para sentar las bases de cursos
ADDISON-WESLEY IBEROAMERICANA avanzados sobre ciertos ternas de análisis numérico, como la solución numérica de
Malabia 2363-2,0, Buenos Aires 1425, Argentina ecuaciones diferenciales, álgebra lineal numérica y teoría de la aproximación. Nuestro
Ave. Brigadeíro Luis Antonio 2344, Conjunto 114,
Sio Paulo 01402, Sio Paulo, Brasil enfoque siempre ha sido el de estudiar el tema desde el punto de vista matemático,
Casilla 70060, Santiago 7, Chile prestando atención a toda la riqueza encerrada en los teoremas, las demostraciones
Apartado Aé= 241-943, Santa Fé de Bogotá, Colombia
Espalter 3 bajo, Madrid 28014, España y las ideas interesantes implicadas en esta actividad. A partir de lo anterior surgen
7 Iaeob Way, R<ading, Massachusetts 01867, E.U.A. muchos procedimientos de cálculo y temas de discusión de la informática. Resulta
Apartado Postal 22-012, México, D.F. 14000, México
Apartado Postal 29853, Río Piedras, Puerto Rico 00929 evidente que nuestras motivaciones provienen del mundo práctico del cálculo científico,
Apartado Pos�! 51454, Caracas 1050-A, Venezuela el cual determina nuestra selección de temas de estudio y la manera de enfocarlos. Por
ejemplo, para algunos temas es más útil discutir los fundamentos teóricos en lugar de
intentar el análisis detallado de los algoritmos. En otros casos sucede lo opuesto, y los
estudiantes se benefician más de programar por sí mismos algunos algoritmos sencillos
y experimentar con ellos. Sin embargo, esto no impide que les aconsejemos utilizar
programas probados, como los que pueden encontrar en las bibliotecas de programas,
para trabajar los problemas que surgen en las aplicaciones.
Este libro se traslapa en parte con un texto nuestro más elementaL Numerical
Mathematics and Computing, Second Edition (Brooks/Cole). Dicho libro está dirigido
a estudiantes con una preparación matemática más modesta (y posiblemente con menor
entusiasmo por los aspectos teóricos del tema). Cuenta con un menú diferente de temas,
y ninguno de ellos se estudia con profundidad. Por el contrario, el libro aquí presente está
destinado a un curso que pretende un tratamiento más completo de los temas, muchos de
los cuales se presentan exhaustivamente. En ocasiones se llegan a tocar temas que hasta el
momento no suelen tratarse en los libros de este nivel. En esta categoría se encuentran
© 1994 por Addis1m-Wesley Iberoamericana, S.A. el método de mallas múltiples, los procedimientos de interpolación multivariante y los
Wilmington, Delaware, E.U.A métodos de homotopía (o de continuación).
En el libro los algoritmos se presentan en un seudocódigo que contiene detalles adi­
cionales a las fórmulas matemáticas. El lector podrá fácilmente escribir rutinas de cálculo
basadas en este seudocódigo en cualquier lenguaje de programación estándar. Estamos
Impreso en Estados Unidos. Printed in U.S.A.
convencidos de que los estudiantes aprenden y entienden mejor los métodos numéricos a
través de la observación de cómo se desarrollan los algoritmos a partir de la teoría mate­
mática, y luego intentando por sí mismos formular y someter a prueba los programas de
ISBN 0-201-60130-3 computadora que resulten de ellos. Es evidente que dichos programas de computadora
12 3 45 67 8 910-CRS-97 96 95 94 no estarán dotados de todos los complicados procedimientos de verificación que poseen

V
vi Prefacio Prefacio vii

las rutinas disponibles en las bibliotecas científicas. Dos ejemplos recomendables de Analysis, Computer Sciences Department, Mathematics Department,Texas Institute of
bibliotecas matemáticas de uso general son IMSL (1990] y NAG [1990]. Computational Mechanics y Computation Center ofThe University ofTexas en Austin.
Un elemento importante de este libro (y esencial en cuanto a sus propósitos peda­ Los editores y el equipo técnico de la Brooks/Cole Publishing Company nos han
gógicos) es la gran cantidad de problemas que se incluyen para que el estudiante los re­ apoyado durante el desarrollo de este proyecto. En particular expresamos nuestro reco­
suelva. Los hay de dos tipos: problemas analíticos y problemas de computadora. Los nocimiento a la labor de Jeremy Hayhurst y de MarleneThom.
problemas de computadora se identifican mediante un superíndice "e" antes del número Agradeceremos cualquier comentario, sugerencia, pregunta, crítica o corrección
del problema, tal como se indica: c5_ En la mayor parte de los casos se necesita disponer que los lectores se tomen la molestia de hacemos llegar.
de una computadora que tenga al menos 32 bits de longitud de palabra. A su vez, los
problemas de computadora son de dos tipos: aquellos para los cuales los estudiantes David Kincaid
diseñan su propio código, y aquellos en los que se utiliza el software ya existente. Cre­ WardCheney
emos que ambos tipos de prácticas son necesarias. No siempre es sencillo utilizar el
software desarrollado por otra persona, aun si está suficientemente documentado, como
suele suceder en los casos de las bibliotecas mencionadas anteriormente. Por otra parte,
los estudiantes en general adquieren un mayor entendimiento de un algoritmo después
de codificarlo y probarlo por sí mismos, que cuando utilizan un paquete de software.
Al final del libro se ha incluido una sección con sugerencias y con algunos problemas
resueltos.
Puede llevarse a cabo un curso normal de un semestre apoyándose en las secciones
sin asterisco de los capítulos 1 a 4 y 6 a 8. Un curso de dos semestres puede abarcar
todas las secciones sin asterisco de los capítulos 1 a 9 y además agregar algunos temas de
interés. Debido a lo ambicioso que resulta el libro, algunas secciones requieren mayor
preparación por parte del lector. Dichas secciones en general están en la parte final de
los capítulos, de manera que el lector no se sienta presionado, indebidamente, desde el
principio. Tales secciones aparecen marcadas con un asterisco.
Agradecimiento. Nos complace expresar nuestro reconocimiento a todas las per­
sonas que nos han ayudado en la preparación de este libro. El apoyo administrativo vino
de Sheri Brice, Margaret Combs, Jan Duffy, Katherine Mueller, y Jenny Tsao de Toe
University of Texas, en Austin. Muy en especial agradecemos a Margaret Combs, del
Departamento de Matemáticas, quien transcribió a TJ3X innumerables versiones de cada
sección y preparó las nuevas conforme eran requeridas como notas de clase a lo largo
de los años. Ningún problema de tipografía le resultó difícil mientras avanzaba en el
dominio del arcano arte de la disección y reacomodo de las macros de TJ3X, con el fin de
cumplir con tareas inusuales. Sobre este punto resulta apropiado expresar públicamente
nuestro agradecimiento a Donald Knuth por su excelente contribución a la comunidad
científica, la cual se concretó a través del sistema de tipografía TJ3X.
Debemos también dar las gracias, por su ayuda de carácter técnico o por haber leído
y comentado versiones previas del manuscrito, a las siguientes personas: Thomas A.
Atchison, Frederick J. Carter, Philip Crooke, J. D' Archangelo, J. R. Hubbard, Victoria
Hunter, Carole Kincaid, Patrick Lang, Tadeusz Liszka, Giles Wilson Maloof, A. K.
Rigler, Rio Hirowati Shariffudin, Laurette Tuckerman, Charles Votaw y A. J. Worsey.
Por otra parte, David Young siempre se mostró generoso con sugerencias y consejos.
También ayudaron ciertos estudiantes avanzados que participaban como asistentes de
nuestros cursos; en particular damos las gracias a David Bruce, Nai-ching Chen, Ashok
Hattangady, Ru Huang, Wayne Joubert, Irina Mukherjee, Bill Nanry,Tom Oppe, Marcos
Raydan, Malathi Ramdas, John Respess, Phien Tran, Linda Tweedy y Baba Vemuri.
Nuestro agradecimiento se extiende a las siguientes instituciones por los apoyos
de carácter técnico y por permitirnos el uso de sus instalaciones: Center for Numerical
ÍNDICE GENERAL
Capítulo l. PRELIMINARES MATEMÁTICOS 1
1.1 Conceptos básicos y teorema de Taylor 1
1.2 Órdenes de convergencia y conceptos básicos adicionales 9
*1.3 Ecuaciones en diferencias 20
Capítulo 2. ARITMÉTICA DE LA COMPUTADORA 29
2.1 Números de punto flotante y errores de redondeo 29
2.2 Errores absolutos y errores relativos; pérdida de dígitos significativos 42
2.3 Cálculos estables y cálculos inestables; condicionamiento 49
Capítulo 3. SOLUCIÓN DE ECUACIONES NO LINEALES 59
3.1 Método de la bisección 59
3.2 Método de Newton 65
3.3 Método de la secante 77
*3.4 Puntos fijos e iteración funcional 82
*3.5 Cálculo de ceros de polinomios 91
*3.6 Homotopía y métodos de continuación 111
Capítulo 4. RESOLUCIÓN DE SISTEMAS DE ECUACIONES LINEALES 119
4.1 Álgebra de matrices 120
4.2 La factorización LU y la factorización de Cholesk:y 129
4.3 Pivoteo y construcción de un algoritmo 143
4.4 Normas y análisis de errores 165
4.5 Series de Neumann y refinamiento iterativo 175
*4.6 Solución de ecuaciones con métodos iterativos 185
*4.7 Métodos del descenso más rápido y del gradiente conjugado 209
*4.8 Análisis de errores de redondeo en el método de Gauss 224
Capítulo 5. TEMÁS SELECTOS DEL ÁLGEBRA LINEAL NUMÉRICA 231
5.1 Problema de valores propios de una matriz: Método de la potencia 231
5.2 Teoremas de Schur y Gershgorin 242
*5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 250
*5.4 Descomposición en valores singulares y seudoinversas 264
*5.5 Algoritmo QR de Francis para el problema de valores propios 275
Capítulo 6. APROXIMACIÓN DE FUNCIONES 285
6,1 Interpolación polinomial 285
6.2 Diferencias divididas 303
6.3 Interpolación de Hermite 313
6.4 Interpolación por splines 323
*6.5 B-splines: Teoría básica 342
*6.6 B-splines: Aplicaciones 353
6.7 Series de Taylor 364
*6.8 Mejor aproximación: Teoría de mínimos cuadrados 369
*6.9 Mejor aproximación: Teoría de Chebyshev 381
*Las secciones marcadas con asterisco pueden onútirse si el instructor lo cree conveniente.

ix
x Índice general Capítulo 1

*6.1O Interpolación en dimensiones superiores 396


*6.11 Fracciones continuas 415 PRELIMINARES MATEMÁTICOS
*6.12 Interpolación trigonométrica y la transformada rápida de Fourier 421
6.13 Aproximación adaptativa 436
1.1 Conceptos básicos y el teorema de Taylor
Capítulo 7. DIFERENCIACIÓN E INTEGRACIÓN NUMÉRICA 443
1.2 Órdenes de convergencia y conceptos básicos adicionales
7.1 Diferenciación numérica y extrapolación de Richardson 443 *1.3 Ecuaciones en diferencias
7.2 Integración numérica basada en interpolación 457
7.3 Cuadratura gaussiana 470
7.4 Integración de Romberg 480
7.5 Cuadratura adaptativa 486
*7.6 Teoría de Sard de aproximación de funcionales 492
*7.7 Polinomios de Bemoulli y la fórmula de Euler-Maclaurin 496 Comenzamos el capítulo con un repaso de algunos temas importantes del Cálculo que
Capítulo 8. SOLUCIÓN NUMÉRICA DE ECUACIONES DIFERENCIALES ORDINARIAS 501 serán necesarios más adelante. El lector hará bien en pasar por alto aquel material con
el que se encuentre familiarizado.
8.1 Existencia y unicidad de soluciones 501
8.2 Método de la serie de Taylor 506
8.3 Métodos de Runge-Kutta 514
8.4 Métodos multipaso 524 1.1 Conceptos básicos y el teorema de Taylor
*8.5 Errores locales y errores globales; estabilidad 532
8.6 Sistemas y ecuaciones diferenciales ordinarias de orden superior 539 Comenzamos con la revisión de algunos conceptos básicos del Cálculo.
*8.7 Problemas de frontera 547
8.8 Problemas de frontera: Métodos de tiro 556 Límite, continuidad y derivada
8.9 Problemas de frontera: Métodos de diferencias finitas 564
*8.10 Problemas de frontera: Colocación 568 Si f es una función real de variable real, entonces el límite de f en e (si es que
*8.11 Ecuaciones diferenciales lineales 572 existe) se define como sigue. La ecuación
8.12 Ecuaciones rígidas 583
Iímf(x) =L,
Capítulo 9. SOLUCIÓN NUMÉRICA DE ECUACIONES EN DERIVADAS PARCIALES 591 x.....c

9.1 Ecuaciones parabólicas: Métodos explícitos 591 significa que a cada número a positivo le corresponde un número 8 también positivo tal
9.2 Ecuaciones parabólicas: Métodos implícitos 599 que IJ(x) -LI es menor que a, siempre que O< jx- el < 8. Si no hay un número L con
9.3 Problemas sin dependencia temporal: Métodos de diferencias finitas 606 esta propiedad, el límite de f en e no existe.
*9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 611 Por ejemplo, la ecuación
*9.5 Ecuaciones en derivadas parciales de primer orden; curvas características 619 lím x2 = 4,
*9.6 Ecuaciones de segundo orden cuasilineales; características 627 x....2
2
*9.7 Otros métodos para problemas hiperbólicos 637 es verdadera ya que jx -41 < a siempre que O< jx-21 < a(5+a)-1• (Véase el Prob. l.)
9.8 Método de mallas múltiples 644 Como ejemplo adicional, nótese que la ecuación
*9.9 Métodos rápidos para la ecuación de Poisson 654
lxl
Capítulo 10. PROGRAMACIÓN LINEAL Y TEMAS RELACIONADOS 659 lím = L.
x-0 X
*10.1 Convexidad y desigualdades lineales 659
*10.2 Desigualdades lineales 665 no es verdadera para cualquier número L. Para entender esto, sea s = 1 y supongamos
10.3 Programación lineal 670 que llxl/x-LI < 1 siempre que O< !xi< 8. En tal caso tenemos que lxl/x = 1 cuando
10.4 Método del símplex 675 x = f8 y lxl/x = -1 cuando x = -!8. Como no hay un número L que satisface
11-LI < 1 y 1- 1-LI < 1, decimos que el límite no existe.
RESPUESTAS Y SUGERENCIAS 687
Sif está definida sólo en un subconjunto específico X de la recta real, la definición
BIBLIOGRAFÍA 693 de límite se modifica de manera que lf(x)-LI < a, siempre que x E X y O< lx- el < 8.
ÍNDICE DE MATERIAS 709
2 Capítulo 1 Preliminares matemáticos 1.1 Conceptos básicos y el teorema de Taylor 3

Se dice que la función! es continua en c si Ilustramos el teorema de Taylor con la función

Iímf(x) = J(c). f(x) = lnx,


X-+C

tomando los valores a = 1, b = 2 y c = 1. La fórmula requiere varias de las derivadas de


Así, la funciónf(x) = x?- es continua en el punto 2, mientras que la función lxl/x no
f, las cuales sonf' = x-1 ,¡11 = -x-2 ,J'" = 2x-3 ,¡<4l = -6x-4, y así sucesivamente.
es continua en O, sin importar como se defina ahí. Estas afirmaciones se siguen de los
Parak � 1,
comentarios anteriores.
¡(kl(x) = (-ll-1 (k -l)!X-k
La derivada de f en c ( si es que existe) se define mediante la ecuación:
y
J' (c) = lím f(x) -f(c) ¡Ck)( l) = (-1l-1 (k -l)!.
X-+C X -C •
Por supuesto quej<ºl ( l) = 1n 1 = O. Al poner todo esto en lafórmula deTaylor tenemos:
Puesto que este límite no necesariamente existe para una función y una c particulares,
es posible que la derivada no exista para tal función. 1
Por ejemplo, si lnx = �
L, (-1/- !
1
(x -l l +(-1)" - -é,-(n+ll(x - 1r1 ( 1 �X�2),
k n+ 1
f(x) = lxl, k=l

entoncesf'(O) no existe. Sif es una función para la quef'(c) existe, decimos quef es en donde 1 < é, < x. La sumatoria I: a la derecha del signo de igualdad produce una
diferenciable en c. Si J es diferenciable en c, entoncesf es continua en c. (Véase el función polinomial enx. Ésta puede considerarse como una función simple que aproxima
Prob. 18.) a la más compleja función 1n x. El último término a la derecha puede considerarse como
El conjunto de todas las funciones continuas sobre la recta real lR. se denota con un término de error. Éste nos dice qué tanto difiere el polinomio de lnx. Nótese que este
C(JR.). El conjunto de funciones para las que J' es continua en todas partes se denota término no es un polinomio en virtud de queé, depende de x de un modo no polinomial.
con C 1 (JR.). En consecuencia, la aseveración del párrafo anterior se puede escribir en Podemos reescribir la ecuación como:
forma sucinta como C 1 (lR.) e C(JR.). Esta inclusión es propia, puesto que son muchas
las funciones continuas cuyas derivadas no existen. La función!(x) = lxl es un ejemplo. lnx = (x - 1) -Jcx - 1)2+i(x - 1)3 - · · ·+(-1)"-1 �(x - 1)" +En(x),
Denotamos con C2(JR.) al conjunto de todas las funciones para las queJ" es continua
en todas partes. De manera semejante se define C"(lR.) para cada número natural n. Por
último, C00 (JR.) es el conjunto de funciones que tienen la propiedad de que todas sus donde
1 1
derivadas sean continuas en toda la recta real. Ahora tenemos que: IEnCx)j = - -é,-(n+l)(x - 1r 1 � - - (x - 1r1•
n+l n+l
C00 (JR.) e ... e c2(JR.) e C 1 (JR.) e C(]R). Hay que observar en esta estimación que 1 < é, y que E,-Cn+ 1l < l .
Ahora suponga que vamos a utilizar l a serie para calcular 1n2. Tendremos en este
Una función conocida de C00 (lR.) esf(x) = eX. caso:
De la misma manera, definimos C"[a, b] como el conjunto de funciones! para las
que ¡en) existe y es continua en el intervalo [a, b]. 1 1 1 1 1
ln2 = 1 - + - +. ..+(-1) - 1 ; +E.(2) = �
n
¿,(-1) -1 k +E.(2)
k
Un teorema importante relativo a las funciones de C"[a, b] es el teorema de Taylor. 2 3 4
k=l

El teorema de Taylor y la fórmula de Lagrange para el residuo con IE.(2)j < 1/(n + 1). Calcular In2 con una precisión de uno a 10 8 requiere que n
se elija de modo que E.(2) � 10-8• Esto significa que 1/(n+ 1) � 10-s o bien que
TEOREMA 1 Sif E C"[a, b] y si¡<n+l) existe sobre el intervalo (a, b), entonces para puntos cuales­ n + 1 � 10 8. Un cálculo de tal precisión requeriría un polinomio con cien millones de
quiera c y x en [a, b] hay un punto é, entre c y x tal que: términos. En cambio, un cálculo semejante para In 1 .5 se puede realizar con la misma
precisión con tan sólo ¡veintidós términos! (Véase el Prob. 19.)
f(x) = ¿n 7¡¡/1 Ckl(c)(x -d +E.(x), ( 1)
Con frecuencia en los argumentos matemáticos se utiliza el caso especial n = 1 del
teorema de Taylor. Se conoce como el teorema del valor medio. Éste indica que sif
k=O
donde es una función de C[a, b] y sif' existe sobre (a, b), entonces parax y c en [a, b]
En (x) = -1 -¡C"+1l(é,)(x -ct+ 1 .
(n+l)! J(x) = J(c)+J'(é,)(x -c),
4 Capítulo 1 Preliminares matemáticos J.J Conceptos básicos y el teorema de Taylor 5

en donde I; se encuentra entre c y x. Tomando x = b y c = a, y reordenando, se llega a Otras formas para la fórmula de Taylor
la importante ecuación: Se puede obtener aún otra forma para la serie y el término de error en la fórmula
f(b) - f(a) = J'(i;)(b - a) donde a</;<b. de Taylor si se reemplazan x por x+h y c por x en el teorema 1. El resultado es
Un caso particular del teorema del valor medio es el Teorema de Rolle. En él
se establece que si f es una función continua sobre [a, b], J' existe sobre (a, b) y
¿ k'¡<kl(x)h
n
1
f(x+h) = +E (h)
k
f(a) = f(b) = O, entonces¡'@ = O para algún 1; en (a, b). Ésta es una consecuencia
n
k=O (3)
inmediata de la ecuación precedente. (En realidad, en un desarrollo formal el teorema de
Rolle se demuestra primero, derivándose después el teorema de Taylor como una de sus En (h) = _l_ ¡(n+l)(/;)hn +I '
consecuencias.) Tanto en el teorema de Rolle como en el del valor medio puede haber (n+l)!
más de un punto 1; en el intervalo [a, b] que satisfaga la ecuación dada.
En el capítulo 6 necesitaremos una forma distinta del teorema de Taylor. en donde el punto 1; se encuentra entre x y x+h.
Para las funciones con valores y argumentos vectoriales también se tienen fórmulas
El teorema de Taylor con la forma integral para el residuo y series de Taylor. Así, sif es un mapeo de JRn en JRm, hay fórmulas que expresan!(x+h)
en términos def(x),f' (x),f" (x), etc. En estos casos la mayor dificultad radica en definir
TEOREMA 2 Si f E cn+l ¡a, b] entonces para cualesquiera puntos x y c en [a, b] las derivadas apropiadas. Estas cuestiones se consideran en detalle en muchos libros de

Ln k.-/kl(c)(x
1 texto, tales como Bartle [1976], K. T. Smith [1971] y Dieudonné [1960]. Aquí tan sólo
f(x)= -el+ R (X), n (2) mencionaremos algunos casos especiales que necesitaremos más adelante.
k=O Para una función!: JR2 -> R la expresión más sencilla de la fórmula de Taylor se
donde
Rn (X) = 1
1 ¡x¡ +l\t)(x - t) dt.
<n n
escribe así:

n. e n 1 8 8 )i
f(a+ h, b+k) =; i! ( h +k y f(a, b)+En (h.k)
Demostración Recordemos la fórmula para la integración por partes 8x 8
(4)
ju dv=uv-jv du, 1 8 8 n+l
En(h,k) = ( h k ) f(a+9h, b+9k),
(n+l)! 8x 8y
+
y apliquémosla a la integral Rn tomando
(x - t)n
dv = ¡<n +l\t) dt.
en donde 9 es un número entre O y 1. El significado de estos términos tan misteriosos es
u= el siguiente:
n.,
El resultado es
1 l r-x ¡x
Rn = 1 �¡<nl(t)(x - t)" = + n ¡< l (t)(x - tr dt
1
] ( 8
h +k y
8 ) º f(a, )=f(a, )
8x 8
n b b
n. t-c e
8 8 1 8f a¡)
=-�¡<nl (c)(x - c)"+Rn-1· h
( 8 +k ) f(a, b) = (h +k y (a, b)
n. x 8 y ox 8
8 8 2
Si iteramos este proceso de integración por partes, eventualmente llegaremos a
28 ¡ 82¡ 28 ¡
2 2
n 1 (h8 +k8y ) f(a, b) = (h ox2 +2hk y +k 2 ) (a, b)
8x8
Rn = - ¿ -/kl(c)(x- d+Ro.
k
x 8y
k=I
y así sucesivamente. El teorema que rige la aplicabilidad de la fórmula (4) es el siguiente.
Como
Ro = [J'(t) dt = f(x) - f(c),
TEOREMA 3 Si todas las derivadas parciales de orden n+1 de f son continuas en el rectángulo
tenemos que definido por lx - al � lhl y IY- bl � lkl, entonces hay un número 9 en el intervalo
n 1 abierto (O, 1) para el que la fórmula (4) es válida.
¿
f(x) = f(c)+ k!¡(kl(c)(x - e/+Rn,
k=I
lo que completa nuestra demostración. 111 Ejemplo ¿Cuáles son los primeros términos en la fórmula de Taylor paraf(x, y) = cos(xy)?
6 Capítulo 1 Preliminares matemáticos 1.1 Conceptos básicos y el teorema de Taylor 7

Respuesta Para esta función tenemos que Si x es un número decimal, su aproximación por truncamiento a n dígitos es el
número :X que se obtiene al descartar todos sus dígitos más allá del n-ésimo. Tenemos
af = -y sen(xy)
- af = -x sen(xy)
lx- x\ < 10-n. (6)
ax ay
a 2f ? a 2f a 2f _ 2 x x
La relación entre x y es tal que x - arroja O en las primeras n posiciones y x =
fü2 = -y- cos(xy) axa y = -xy cos(xy)- sen(xy) ayz - -x cos(xy). x + 8 x 10-n con O � 6 < l. Así, tenemos que \x - il = \6\ x 10-• < 10-• y la
desigualdad (6) se cumple.
Así, si tomamos n = I en la fórmula de Taylor (4), el resultado es
SERIE DE PROBLEMAS 1.1
cos[(a+ h)(b + k)] = cos(ab)- hbsen(ab)- kasen(ab)+ E1 (h, k).
l. Demuestre que lx2 - 41 < g cuando O< lx-21 < o(5 +e)- y pruebe que lím,-2x = 4.
1 2

El residuo E1 es la suma de tres términos, a saber, 2. Demuestre que lím,-1(4x+ 2) = 6 por medio de una prueba tipo o-&.
3. Demuestre que lím,-2(1/x) = f por medio de una prueba tipo o-&.
-ih2(b + ek)2 cos [(a+ 9h)(b +9k)]
4 . Encuentre el número 1; que se menciona en el teorema del valor medio en el caso de lafunción
-hk { (a +9h)(b +9k) cos[(a +9h)(b +9k)] + sen[(a +9h)(b +9k)]} f(x) = 3- 2x +x2 y el intervalo [a, b] = [ l. 3].
5. Encuentre la serie de Taylor para la funciónf(x) = coshx alrededor del punto e = O.
-!k\a +9h)2 cos[(a+ 9h)(b +9k)]. 11111

6. Si la serie para lnx se corta después del término que comprende a (x- 1 )1000 y después se
utiliza para calcular In 2, ¿qué cota se puede imponer al error?
Redondeo 7 . Encuentre la serie de Taylor paraf(x) = i! alrededor del punto e= 3. Después simplifique
El redondeo es un concepto muy importante en los cálculos científicos. Considere la serie y demuestre cómo se podria haber obtenido directamente a partir de la serie para J
alrededor de e = O.
un número decimal positivo x de la forma O.___ ... ___ con m dígitos a la derecha del
punto decimal. Se redondea x a n cifras decimales (n < m) de una manera que depende 8. Demuestre que lafunciónf(x) = x sen( l/x), conf(O) = O, es continua, mas no diferenciable
en O.
del valor del dígito (n + 1). Si este dígito es O, 1, 2, 3 o 4, entonces el n-ésimo dígito
no se cambia y los que le siguen se eliminan (redondeo por defecto). En cambio, si el 9. Determine si la siguiente función es continua, una vez diferenciable o dos veces diferenciable:
n-ésimo primer dígito es 5, 6, 7, 8 o 9, entonces el n-ésimo dígito se incrementa en una
unidad y los que le siguen se eliminan (redondeo por exceso). (La situación en que 5 es f(x) = {x3 + X - 1 X;;; Ü
x3-x-1 x>O.
el n-ésimo primer dígito se puede manejar de varias maneras. Por ejemplo, hay quienes
prefieren redondear por exceso sólo cuando el dígito anterior es par, en el supuesto 10. Responda la pregunta del problema 9 para la función
de que esto sucede aproximadamente la mitad de las veces. En aras de la simplicidad
nosotros hemos decidido siempre redondear por exceso en tal circunstacia.)
j(X)
= {X2 X;;;¡

He aquí algunos ejemplos de redondeo correcto a cuatro dígitos de números con x x> l .
siete dígitos: 11. Repita e l problema 4 para la funciónj(;c) = x6 +x4 - 1 en e l intervalo [O, 1 ].
. 1735499 ...., .1735 12. Seaj(x) = x-3(x - senx), para x '# O. ¿Cómo debería definirse f(O) para que f fuese
.9999500...., 1.000 continua en O? ¿Sería también diferenciable?
13. Sea k un entero positivo y sea O< a.< l. ¿A qué clase C"(lR) pertenece la función i+« ?
. 4321609 ... ., .4322
14 . Demuestre que: si f E C"(lR), entonces J' E c"-1(lR) y J:f(t) dt pertenece a la clase
Si x se redondea de modo que x es su aproximación con n dígitos, entonces c•+1 (1R).
!
lx- xi � x 10-•. (5)
15. Demuestre directamente el teorema de Rolle ( y no como un caso particular del teorema del
valor medio).
Para ver por qué es cierto esto último, razonemos de la manera siguiente: si el n-ésimo 16. Demuestre que: sif E C"(IR) y f(xo) = f(x1 ) = · · · = f(x.) = O para xo< xi < · · · < x.,
entonces/"l(I;) = O para algún 1; E (Xo, x.).
!
primer dígito dex esO, l , 2, 3 o 4 entoncesx = x+s cons < x 10-• y (5) se cumple. En
x x
cambio, si es 5, 6, 7, 8 o 9, entonces x = + 10-n donde es un número con los mismos 17. Demuestre que la funciónf(x) = x2 es continua en todas partes.
primeros n dígitos que x y todos los restantes iguales a O. Ahora, x = x+ 8 x 1o-• con 18. Demuestre que una función es necesariamente continua en cualquier punto en el que es
i
6 � y x- x = (I - 6) x 10-n. Como 1- 6 � !, la desigualdad (5) se satisface. diferenciable.
8 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 9

19. (a) Obtenga la serie de Taylor en O para la funciónf(x)=ln(x +1). Escriba la serie usando 34. ¿Cuántos términos se requieren en la serie
la notación de sumatorias. Dé dos expresiones para el residuo cuando la serie se trunca.
00 1
(b) Determine el menor número de términos que deberán incluirse en la serie para aproximar e='°'
i...J-¡
n.
In 1.5 con un margen de error menor que 1o-s. n=O
(c) Determine el número de términos necesarios para aproximar In l .6 con un error no mayor
para aproximar al número e con un error inferior a 6/10 de unidad en el vigésimo lugar
que 10-10• decimal?
20. Muchas veces se utiliza la aproximación sen x � x para valores pequeños de x. Con la
ayuda del teorema de Taylor estime el error en esta aproximación. ¿Para qué valores de x es 35. Encuentre los dos primeros términos del desarrollo de Taylor para x1l5 alrededor del punto
correcta esta aproximación hasta la sexta cifra decimal? x = 32. Aproxime la raíz quinta de 31.999999 recurriendo a estos dos términos de la serie.
¿Qué tan precisa es la solución?
21. Para valores pequeños de x ¿qué tan correcta es la aproximación cosx � I -!x2 ? ¿Para
qué valores de x es correcta esta aproximación hasta la tercera cifra decimal? 36. Demuestre o refute la siguiente afirmación: Sif es diferenciable en x, entonces para a. ;e 1
22. Haga una crítica del siguiente razonamiento: La función! definida ';=omo J'(x) = h-+0
lím[f(x +h) - f(x +a.h)]/(h - a.h).
x3+x x�O
f(x) = { 37. Encuentre el polinomio de Taylor de grado dos para la funciónf(x) = e1:,; sen x desarrollado
x3-x x � O en torno al punto it/2.
tiene las siguientes propiedades:
38. Determine la forma de Lagrange para el residuo al aplicar el teorema de Taylor a la función
lím J"(x) = lím 6x = O f(x) = cos x, tomando n = 2 y e=rt/2. ¿Qué tan pequeño se debe hacer !x -rt/21 para
x-o+ x-o+
!
que el residuo no sea mayor que x 10-4 en valor absoluto?
lím J"(x)= lím 6x = O. 39. En el ejemplo que ilustra la fórmula de Taylor se obtuvo un error de la forma (-l )"(n +
Por lo tanto,!" es continua.
x-o- x-o-
n- r
1 � -•-1(x -1 1 • Compare este error con el que surge en la forma integral del residuo.
23. Use el teorema de Taylor con n=2 para probar que la desigualdad 1 +x < i! es válida para
todos los números reales, excepto para x = O.
24. Derive la serie de Taylor con residuo para ln(l +x) alrededor de l . Deduzca una desigualdad 1.2 Órdenes de convergencia y conceptos básicos adicionales
que proporcione el número de términos que deben tomarse para aproximar In 4 con un error
menor que z-m. En los cálculos numéricos, especialmente con las máquinas computadoras de alto rendi­
25. ¿Cuál es el tercer término de la serie de Taylor para x2 +x -2 alrededor del punto 3? miento, sucede con frecuencia que la respuesta a un problema no se obtiene de inmediato.
26. Con la serie de Taylor para 11 ¿cuántos términos es necesario considerar para aproximar e2 Más bien, lo que se genera es una sucesión de respuestas aproximadas cada vez más pre­
con una precisión de cuatro cifras decimales (por redondeo)? cisas.
27. Pruebe que sif es diferenciable en x, entonces
lím(2h)-1[f(x +h) -f(x -h)] =J'(x). Sucesiones convergentes
h-+O
Demuestre que para algunas funciones que no son diferenciables en x el límite anterior existe. Pensemos en una situación ideal en la que se busca un solo número real como
(Véase Eggermont [ 1988] o el problema 36.) respuesta a un problema. Puede ser, por ejemplo, un cero de una ecuación complicada
28. Desarrolle la serie de Taylor paraf(x) = ln x en tomo a e; escriba el resultado en notación de o el valor numérico de una integral definida difícil de trabajar. En tal caso, un programa
sumatorias y dé el término para el residuo. Supongamos que lx -el < 1 y que se quiere una de computación quizá produzca una sucesión de números reales x1, x2, x3, ... que se
precisión menor que Í x 10-1 ¿cuál es el mínimo número de términos que deben considerarse estén aproximando a la solución correcta.
en la serie para alcanZl!f tal precisión?
29. Determine los dos primeros términos de la serie de Taylor para r alrededor de 1 y .el
Escribimos:
lím X =L,
residuo E1. n-+oo n
30. Determine el polinomio de Taylor de segundo grado para si a cada números positivo le corresponde un número real r tal que jx. -LI <s siempre
cosx)
f(x) = / que n > r. (En este casones un entero.)
al desarrollar en tomo al punto it.. Por ejemplo:
, n+ 1
31. Desarrolle la función fi en series de potencias de (x -1) y aproxime /0.9999999995 hasta hm --=1
el décimo lugar decimal. n-+oo n
ya que
32. Suponga que lxl < f y determine por medio del teorema de Taylor la mejor cota superior n 1
para ¡ : - 1 ,<s
(a) 1 cos x -( l -x2/2)1 (b) 1 sen x -x(l -x2/6)1.
33. Determine una función que pueda llamarse linealización de x3-2x en 2. siempre quen> ¡¡-1.
10 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 11

Como un ejemplo más, recordemos la ecuación Estas nociones nos proporcionan un método para comparar dos sucesiones, siendo
más frecuente su uso cuando ambas sucesiones convergen a cero. Si Xn _, O, Un _, O,
lím (1+ !)",
e= n-..oo y Xn = O(un ), entonces Xn converge a cero al menos tan rápidamente como Un, Si
n Xn = o(un ), entonces Xn converge a O más rápido que Un,

por medio de la cual se puede definir el importante número irracional e. Si calculamos He aquí algunos ejemplos:

�=o
la sucesiónx,, = (1+ 1/n)", encontramos que algunos de sus elementos son

X¡= 2000000 n1 (!n) (1)

n!n =o(D
X¡o = 2.593742 (2)
X30 = 2.674319
xso = 2.691588 �=o(rL) (3)

G)
X¡ooo = 2.716924.
�+e-n = O (4)
El anterior es un ejemplo de una sucesión que converge más bien en forma lenta, ya que
el límite es e= 2.71828 18 . . . y en el milésimo término aún hay un error de 0.00135 8.
Como ejemplo de sucesión que converge rápidamente, considérese la que se define e-n=o(� (5)
recursivamente como sigue:

Tomando un ejemplo de la sección 1.1 podemos escribir:
X¡ =2
{

n -l
Xn+l = �Xn (n f: 1). In2-¿(-li-1k
1 =O � .
k=I
( ¡) (6)

Los elementos de esta sucesión son:


Esto último nos da un ejemplo de una convergencia muy lenta. Por el contrario,
X¡= 2000000
X1 = 1.500000 n-l 1
e' - '\'-:!=o - (JxJ ;; 1) (7)
X3 = 1.416667 �k!
k=O
(n!¡ )
X4 = 1.414216.
nos da un ejemplo de una convergencia muy rápida.
El límite es vi = l .41421 3562 . . . y la sucesión converge a su límite con gran rapidez. La notación que acabamos de introducir se utiliza también para otras funciones
además de las sucesiones. Por ejemplo, podemos escribir:
Notación de O mayúscula y de o minúscula
x3
senx = x - + O(x5 ) (x-> 0). (8)
Consideraremos ahora varias formas de comparar dos sucesiones o dos funciones. 6
Comenzamos con las sucesiones.
Sean [xn] y [un l dos sucesiones distintas. Escribimos: Esto último significa que hay una vecindad de O y una constante C tales que en esa
vecindad
Xn = O(un), 5
\senx -x+ � \ ;; C Jx 1.
en caso de que haya constantes C y r tales que JxnJ ;; C Jun cuando n f; r. Si Un ,;; O para
toda n, esto significa que la razón Jxn/unl permanece acotada (por C) conformen -> co. La verdad de esta afirmación se puede comprobar a través del teorema de Taylor, tomando
La ecuación n = 4 y f(x) = senx.
Xn = O(U ),
n Una ecuación de la forma
significa que Iímn-oo(xn/un) = O. En el primer caso decimos que Xn es O mayúscula
de Un y en el segundo caso que Xn es o minúscula de Un. f(x) = O(g(x )) (x _, co)
12 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 13

significa que hay constantes r y C tales que lf(x)I ;;;; Clg(x)I siempre que x � r. Así, Demostración Sean A y B respectivamente el menor y el mayor valor de u(x) en [a, b]. En tal caso
por ejemplo,
Vx2 + 1 = O(x) (x-+ oo), A;;;; u(x);;;; B (a;;;; X;;;; b).

pues Vx2 + 1;;;; 2x cuando x � 1. Como v(x) � O, tenemos que.


En general escribimos:
Av(x) ;;;; u(x)v(x) ;;;; Bv(x).
f(x) = O(g(x)) (x-+ xo)
Si ahora integramos cada uno de los términos de esta desigualdad y escribimos I =
cuando hay una constante C y una vecindad de xa tales que IJ(x)I ;;;; Clg(x)I en esa J: v(x) dx, resulta que
vecindad. De manera semejante,
Al;;;; [ u(x)v(x)d.x;;;; BI.
(x-+ xa)
f(x) = o(g(x))

significa que Iímx_,,,J(x)/g(x) = O.


Si I = O, se concluye que v(x)
I es distinto de cero, tenemos:
= O, y el resultado que queremos demostrar es trivial. Si
Órdenes de convergencia A;;;; r 1 [ u(x)v(x)d.x;;;; B.
Hay una terminología especial que se utiliza para describir la rapidez con la que una
sucesión converge. Sea [x.J una sucesión de números reales que tienden a un límite x•. Por el teorema del valor intermedio para funciones continuas, hay un punto s en [a, b]
Decimos que la razón de convergencia es por lo menos lineal si existe una constante para el cual
c < 1 y un entero N tales que
u(s) = r 1 [ u(x)v(x)d.x.
!xn+l -x*I;;;; clxn -x*I (n�N).
El teorema del valor intermedio dice que sif es continua en [a, b] y r es un número real
Decimos que la razón de convergencia es superlineal si hay una sucesión En tendiente comprendido entre el valor máximo y el valor mínimo de f en [a, b], entonces hay un
a O y un entero N tales que punto c en [a, bJ dondef(c) = r. 11

lxn+l -x*I;;;; En[Xn -x*I (n�N). Multiplicación anidada


La convergencia es al menos cuadrática si hay una constante C (no necesariamente El polinomío

.p(x) = a.x" +an-!Xn-l + · · · +a2x2+a¡x+ao


menor que 1) y un entero N tales que

lxn+l -x*I;;;; Clxn-x*¡ (n � N).


2

se puede escribir, con la notación matemática para sumas y productos ¿; y TI, como
En general, si hay dos constantes C y a. y un entero N tales que sigue:
n n ( k )

lxn+I -x*I ;;;; Clxn-x*I


ª
(n�N), p(x) = �ak� = � akgX .

decimos que la razón de convergencia es por lo menos de orden a..


Recordemos que si n;;;; m, entonces

¿
m m
El teorema del valor medio para integrales
Sk = Sn + Sn+I + · · · + Sm Y II Yk = YnY +I · · · Ym
n
Otro teorema del valor medio de uso frecuente en el análisis numérico es el siguiente: k= n k=n
TEOREMA 1 Sean u y v dosfunciones reales y continuas sobre el intervalo [a, b] con v � O. Entonces
s
existe un punto en [a, b] tal que
y, debido a lo anterior,

X = x(m-n+l) II
m m

[ u(x)v(x) dx = u(s) [ v(x) dx. ¿r=(m-n+l)r y


k=n k=n
14 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 15

Por convención, si m < n, entonces El concepto correspondiente relativo a la máxima cota inferior o ínfimo se define
como sigue. Escribimos u = mci S o u = ínf S si:

I> II
m m

=o y Yk = l. l . u es una cota inferior de S.


k=n k=n 2. Ningún número real mayor que u es una cota inferior de S.
Para evaluar el polinomio con eficiencia, podemos agrupar sus términos valiéndonos de En este caso el resultado básico es que, si un conjunto no vacío de números reales tiene
la multiplicación anidada: una cota inferior, posee una máxima cota inferior. Esto se sigue del axioma cuando se
aplica al conjunto -S = {-x:x ES}.
p(x) = ao+x(a¡ +x(a2 + · · ·+x(an-1 +x(a.)) · · ·)).
Funciones explícitas e implícitas
Esto corresponde al siguiente algoritmo simple que sólo comprenden multiplicaciones
y n adiciones: En general una función se define a través de una fórmula explícita, a partir de la cual
p +-a. el valor de la función se puede calcular para cada uno de sus argumentos. Por ejemplo,
for k = n - 1, n - 2, ... , O do podemos definir una función! por medio de la fórmula:
p +-xp+ak
f(x) = V7x3 - 2x.
end.
Este procedimiento también se conoce como el método de Horner o división sintética. Cuando el repertorio de funciones que nos son familiares aumenta, podemos definir
funciones cada vez más complicadas como, por ejemplo,
Cotas superiores e inferiores f(x) = ln(tan- 1 x)+cos(é).
Dos conceptos importantes que surgen con frecuencia en el análisis numérico son
los de supremo (mínima cota superior) e ínfimo (máxima cota inferior). Sea S un No obstante, hay otros caminos para definir funciones, como puede ser a través de una
conjunto de números reales no vacío y acotado. El acotamiento es la propiedad por la ecuación diferencial o de una integral. Por ejemplo, una función y = f(x) queda definida
cual para números reales apropiados a y b por medio de la siguiente ecuación diferencial con una condición inicial:

a�x�b (x ES).
y'= l+sen y y(O) = O.

En esta situación se dice que b es una cota superior de S y a una cota inferior. Por Una función importante, llamada función error y denotada con erf(x), se define por
supuesto, S tiene muchas cotas superiores: si e � b, entonces c también es una cota
superior de S. Es obvio que no hay una máxima cota superior. Sin embargo, hay una
medio de la integral:
2 r
erf(x) = a J e-1 dt.
2

mínima cota superior para S. f o


En esta sección vamos a considerar funciones que se definen implícitamente. Esto
AXIOMA Cualquier conjunto no vacío de números reales que tenga una cota superior tiene una significa que daremos una función G de dos variables y una ecuación G(x, y) = O, con la
mínima cota superior. esperanza de recuperar a y como una función de x. En algunos casos es posible despejar
la ecuación G(x, y) = O y obtener y = f(x). Por ejemplo, en la ecuación
El axioma expresa una característica que es distintiva del sistema de los números
reales. (Por ejemplo, el sistema de los números racionales no posee esta propiedad.) La y2+3.xy - 7 = O,
mínima cota superior de un conjunto S (si es que la hay) se denota con mci S. La palabra
supremo es un sinónimo y se abrevia sup S. Así, podemos escribir v = sup S cuando podemos despejar a y y obtener
l . v es una cota superior de S
y= �(-3x±v'9x2+28),
2. Ningún número real más pequeño que ves cota superior de S.

Ejemplo 1 ¿Qué número es el sup S si S = {x: x2 < 2}? recuperando de esta manera dos funciones explícitas. Del mismo modo, de la ecuación

Respuesta Dado que S = {x: -vz< x < VZ}, la mínima cota superior es vz. 111 sen(y+7) = x3 - 2
Si f es una función, la notación sup,eAf(x) significa sup{f(x) : x E A}. Por
ejemplo, podemos recuperar una función explícita resolviendo para y:
sup sen x = !­ y= sen- 1 (x3 - 2) - 7.
O<x<rt/6
16 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 17

Aquí también se cuenta con múltiples funciones, puesto que son varias las ramas de la Respuesta Para contestar esta pregunta tomemos (xo, Yo)=(-1, 1) y definamos
función inversa del seno que se pueden escoger.
En general, si G es una función prescrita, y si (xo,yo) es un punto particular en G(x,y)=X1 + 2y8 -l
donde G(x0,y0) = O, esperamos que haya puntos cercanos que satisfagan la ecuación
G(x,y)=O, es decir, esperamos que cuando x sufra una pequeña alteración, un cambio En tal caso G(xo, Yo)=O Y
apropiado para y haga que siga siendo válida la ecuación G(x,y) = O. Por lo tanto, y aG 7
32
-= 16y-y.
debería ser una función de x en una vecindad de xo. La figura 1. 1 nos muestra un caso ay
típico.
En consecuencia, aG(xo, Yo)/ay *' O. Por el teorema de la función implícita, y es una
función de x continuamente diferenciable cerca de xo =-1. 11
z
Si f es una función definida implícitamente por G(x,y) = O, entonces, para x en
algún intervalo, G(x,f (x))=O. Si queremos calcular!' (x) podemos recurrir a una técnica
familiar del cálculo. Derivamos la ecuación G(x,y) = O con respecto a x, recordando
que y se interpreta como una función de x. El resultado es:
z = G(x,y)
aa aar1y -_ 0
ax+ ay dx

de donde obtenemos
= ªª ªª
-! y
dx
dy ax / ay

!'(x) = �� /��-
Xo
La derivada que así se obtiene es probablemente una función de x y y.

X Ejemplo 3 ¿Cuál es el valor de dy/dx en el punto (2, 1), siy(x) se define implícitamente por medio
de la ecuación x3 -y1 + 4x2+y4 - 24 =O?
Respuesta La derivación total de la ecuación con respecto a x nos da

Figura 1.1 La superficie G intersecta al plano xy mostrando la curva G(x,y)=O. 3x2 -7y6 : +8x+4y3 : =0.

Sustituyendo x=2 y y= 1 tenemos que


El teorema de la función implícita
dy dy
El siguiente teorema rige en esta situación. 12 -7-+ 16+4- = O'
dx dx
TEOREMA 2 Sea G unafunción de dos variables reales definida y continuamente diferenciable en una
vecindad de (xo,yo). Si G(xo, Yo) =O y aG/ay t:- O en (xo,yo), entonces hay un número de donde dy/dx = 28/3.
positivo 8 y una funciónf continuamente diferenciable definida para \x - xo \ < 8 tales En la sección 3.2 se analizan algunos problemas numéricos que comprenden fun­
quef(xo) = Yo y G(x,f(x)) = O para lx -xo\ < 8. ciones implícitas.

Ejemplo 2 ¿Define la ecuación SERIE DE PROBLEMAS 1.2


x7 + 2y8 -y3 = O
l. El cálculo de la sucesiónx. = (1 + 1/n)" todo parece indicar que se trata de una sucesión
a y como una función de x continuamente diferenciable en alguna vecindad de x = -1? monótona creciente. Demuestre que así es.
18 Capítulo 1 Preliminares matemáticos 1.2 Órdenes de convergencia y conceptos básicos adicionales 19

2. Demuestre que los elementos de la sucesión del problema 1 son menores que 3. 23. Las cuatro expresiones eh, (1- h4)-1 , cos(h), y 1+ sen(h3 ) tienen el mismo límite cuando
3. Demuestre que Xn = x+o(l ) si y sólo si lúnn-oo Xn = x. h-+ O. Expréselas en la siguiente forma con los valores enteros óptimos de a. y�.

4. Verifique la validez de las ecuaciones (1) a (8) del texto. f(h) = e+ O(h") = e+ o(l,h
5. Para una n fija, demuestre que :E;=o i = 1/(1- x)+o(x") cuando x-+ O.
24. ¿Cuál es el límite y cuál la razón de convergencia de la siguiente expresión cuando h -+ O?
6. Demuestre que si Xn = O(a.n ), entonces CXn = O(a.n).
7. Demuestre que si xn = O(a.n ), entonces Xn/ ln n = o(a.n ). (1 +h)-i
8. Encuentre el valor óptimo para k en la afirmación cos x-1+x /2 =O(i) cuando x -+ O. 2 h2
9. Demuestre que si Xn = o(a.n ), entonces Xn = O(a.n ). Demuestre que el recíproco de este Exprésela en las formas dadas en el problema 23.
enunciado no es cierto.
25. Encuetre el valor óptimo para� tal que para n fija
10. Demuestre que si Xn= O(a.n) y y. = O(a..), entonces Xn+Yn = O(a..).
1
11. Demuestre que si Xn = o(a.n ) y Yn = o(a..), entonces Xn +Y• = o(a..). --
1-x
= l +x+x2+···+xn+O(r)B (Ü<x< !)
12. Demuestre que para cualquier r > O, x! = O(e') cuando x-+ oo:
13. Demuestre que para toda r > O, ln x = O(x') cuando x -+ oo. cuando x -+ O. Repita el problema para o(x1'). ¿Existe un valor óptimo en este caso?
14. Demuestre que si a.. -+ O, Xn = O(a.n ) y Yn = O(a..), entonces XnYn =o(a..). Explique su respuesta.

15. Demuestre que si x. = O(a..), entonces a.;;- 1 = O(x;;- 1 . Demuestre que lo mismo sucede 26. Demuestre que las siguientes afirmaciones son falsas:
(a) t! - I = O(x2 ) cuando x-+ O
)

para o minúscula. (c) cot x=o(x- 1 ) cuando x-+ O


16. Determine el valor óptimo para k en la ecuación tan-1 x = x+O(i) cuando x-+ O. (b) x-2 =O(cot x) cuando x-+ O.

17. Definimos inductivamente la sucesión Xn por medio de la ecuación Xn+I = F(x.). Suponga­ 27. Supongamos que [a.] -+ O y que A. > l. Demuestre que :E:=o akA.k = o(A.") cuando
mos que xn -+ x cuando n-+ oo y que F'(x) = O. Demuestre que x.+2-x..1 = o(Xn+l-x.). n -t OO.
18. Demuestre que toda función suficientemente lisa se puede aproximar en un intervalo de <28. Considere la relación recursiva
longitud h por medio de un polinomio de grado n con un error que es 1) cuando h
-+ O. ow•
xo = l xi=c
19. (a) Considere la serie {

�D.
Xn+l = Xn +Xn-l (n;?; 1).
x2 3x3 9x4
e
tmx
= l+x+-+-+-+···
2! 3! 4! (lx1 (a) Se puede demostrar que cuando e=(1+../5)/2, se obtiene la fórmula cerrada
Conserve tres de sus términos y estime el resto de la misma valiéndose de la notación o con
el valor optimo cuando x-+ O.
(b) Repita el problema con la notación O y la serie
Xn = (1 \ ../5
)"

x2 7x4 62x6
ln tan x=ln x+-+-+-+· ··
3 90 2835
(o< lx\ <D. (b) De manera similar, cuando e=(1 - ../5)/2,

20. Determine el conjunto de valores para y y 8 para los que la parte +· ·· de la serie

k=l
n-l
1 ;r!
ln(l+x) = ¿(-l/- +·· ·
k
(c) Si e= I, entonces
c-2../sr
Xn =

se puede sustituir por O(x7) o por o(i) cuando x-+ O.


21. ¿Para cuáles de las siguientes parejas (x., a..) se cumple que x. = O(a..) cuando x -+ oo?
3
(a) Xn = 5n2 +9n +1, a.. = n2 (d) Xn =
2
5n +9n +1, 3
a.. = n 3
x, = � e +/5rl - � c-2../srl
Para todos los valores de n desde 1 hasta 30, calcule en cada caso x., tanto con la relación
(b) Xn = 5n1+9n3 +1, a.. = 1 (e) Xn = v'n+3, a.. = 1/n
recursiva como con la fórmula correspondiente. Explique los resultados. Esta recursión
(c) Xn = v'n+3, a.. = l. define la famosa sucesión de Fibonacci.
22. Elija las afirmaciones correctas (en cada caso n-+ oo) 29. Explique por qué el axioma de la mínima cota superior no se aplica al conjunto vacío.
(a) (n+ l )/n2 = o( l /n) (d) 1/(n ln n) = o(l /n)
(b) (n+ 1)/v'ñ = o(l ) (e) e"/n5 = 0(1/n).
30. Encuentre dos funciones en forma explícita que estén definidas implícitamente por la ecua­
ción
=
(c) 1/ In n 0(1/n) (x 3 - l)y +ly2 +cos x - 1 = O.
20 Capítulo 1 Preliminares matemáticos *1.3 Ecuaciones en diferencias 21

31. Cuando se resuelven ecuaciones diferenciales, a menudo se obtienen soluciones en forma Una sucesión es, formalmente, una función compleja definida en el conjunto de los
implícita. Demuestre que la ecuación enteros positivos N= { 1,2,3,...} . Es sólo cuestión de conveniencia el que escribamos
Xn en vez de x(n) para denotar el valor de la función x en el argumento n.
2x3y1+x2y+l =e En el conjunto V definimos dos operaciones:
define una solución de la ecuación diferencial

t=
x +y= [x¡ +y¡,x2 +Y2,x3 +Y3,...]
-(6x2/+2xy+l)/(4x3y+x2 ). /\.X= (A..X¡ ,A..X2,A..X3 ,••.J.
Una forma compacta de escribir estas ecuaciones es:
32 . La ecuación de Kepler usada en astronomía esx-y+e seny = O, en donde e es un parámetro
en el intervalo [O, !]. Pruebe que para cada número real x hay un número real y que satisface (x+y)n = Xn +Yn Y (A..X)n = A..Xn-
la ecuación. Demuestre que si O � e < l, entonces dy/dx es continua en todas partes.
33. Encuentre los puntos x en los que la ecuación Hay en V un elemento cero, a saber, O = [O,O,O,...]. Con estas definiciones V se
convierte en un espacio vectorial. La verificación de los postulados de los espacios
y-ln(x+y) = O
vectoriales es tediosa y poco edificante. El espacio vectorial V es de dimensión infinita;
define implícitamente a y como una función de x. Calcule dy/dx. en efecto, el siguiente conjunto de vectores es linealmente independiente:
34 . Dé un ejemplo que muestre por qué el axioma de la mínima cota superior no se cumple para /ll =
el sistema de los números racionales. [l. O, O, O, ... ]
35. ¿Se cumple el axioma de la mínima cota superior para el sistema de los números enteros? /2l = [O,1,O,O,...]
36 . ¿Cuáles son los valores de las siguientes expresiones? /3l = [O ,O,1,O,...]
(a) sup,Elll tan-1 x (c) sup,¡:;0 e-x
(d) sup,Ell. (x2 + 1)-1
etcétera.
(b) ínf,E11 e-x
37. Use el teorema del valor medio para integrales para demostrar que Nuestro interés se limitará a los operadores lineales L: V -> V. De estos, uno de
los más importantes es el operador de desplazamiento, que se denota E y se define por
/6 lcosxdx=! medio de la ecuación:
[0
Ex= [xz,X3, X4,...] donde x = [x¡ ,Xz,x3, ... ]
para alguna y en el intervalo (0, it/2 ). Así, (Ex)n = Xn+l · Está claro que E se puede aplicar varias veces en forma consecutiva
38. Dé un ejemplo que muestre por qué en el teorema 2 la hipótesis sobre la continuidad de u no para producir, por ejemplo, (EEx). = Xn+2 o (Ek x)n = Xn+k· En lo que resta de esta
se puede suprimir. sección nos ocuparemos sólo de aquellos operadores que se pueden expresar como
combinaciones lineales de potencias de E. Estos operadores se llaman operadores en
diferencias lineales (con coeficientes constantes y rango finito). Su forma general es:
*1.3 Ecuaciones en diferencias m
L= ¿c;fÍ . (1)
A menudo, los algoritmos para cálculos numéricos se diseña para generar sucesiones i=O
de números. Por consiguiente, nos será de utilidad desarrollar un fragmento de la teoría de Por supuesto, Eº se define como el operador identidad, (E°x)n = (lx). = x•. En la
los espacios de sucesiones lineales. Esta teoría la necesitaremos en el capítulo 8 para ecuación (1) podemos ver que los operadores lineales en diferencias de la forma ( 1)
analizar los métodos lineales de pasos múltiples. constituyen un subespacio lineal en el conjunto de los operadores lineales de V en V.
Las potencias de E proporcionan una base para dicho subespacio.
Conceptos básicos Observe que Len la ecuación (1) es un polinomio en E, es decir, una combinación
lineal de potencias de E. De este modo, podemos escribir L = p(E), donde p es
A continuación, V designará al conjunto de sucesiones infinitas de números com­ un polinomio llamado polinomio característico de L y que se define de la siguiente
plejos, como por ejemplo: manera:
X= (x¡,Xz, X3,, ..]
p(A) = L C¡A. . i

Y = [y¡,Y2,Y3,· · .J. i=O


22 Capítulo 1 Preliminares matemáticos *1.3 Ecuaciones en diferencias 23

El problema que se estudiará aquí es el de encontrar todas las soluciones de una inducción que Xn = a.u. + Pvn para toda n. En realidad, si esta igualdad se cumple para
ecuación de la forma Lx = O, donde L es un operador del tipo (1). De la linealidad de L índices menores que n, también lo hace paran, pues
resulta que el conjunto {x: Lx = O} es un subespacio lineal de V. Este último se llama
espacio nulo de L. Podemos considerar que la ecuación Lx = O está resuelta cuando se X11 = -3Xn-l - 2xn -2
ha encontrado una base para el espacio nulo de L.
A fin de saber en términos generales qué se puede esperar, consideremos un ejemplo
= 3(a.un-l +Pvn-1) - 2(a.un-2 +Pvn-2)
concreto de L, digamos co = 2, c1 = -3, c2 = 1 y las restantes c; = O. La ecuación = a.(3un-l - 2un-2) +�(3vn-l - 2vn-2)
que resulta de ello, conocida como ecuación en diferencias, se puede escribir de tres
=O.Un+ �v•.
maneras:
(E2 - 3E1 +2E°)x = O Este ejemplo ilustra el caso de un polinomio característico con ceros simples.

Xn+2 - 3Xn+I +2xn = Ü (n = 1, 2, 3, ...) (2)


Ceros simples
p(E)x = O p(A.) = A.2
- 3A. +2
TEOREMA 1 Si p es un polinomio y A. es un cero de p, entonces una solución de la ecuación en
Es muy sencillo generar sucesiones que resuelvan las ecuaciones (2). En realidad, diferencias p(E)x = O es [A, A.2 , 1.3 , • .. ]. Si todos los ceros de p son simples y no
podemos elegir libremente a x 1 y x2 y determinar x3 , x4, ..• por medio de (2). Por nulos, cada solución de la ecuación en diferencias es una combinación lineal de dichas
ejemplo, podemos obtener de esta manera las soluciones distintas soluciones especiales.

[l, O, -2, -6, -14, -30, ...] Demostración En primer lugar, si A. es un número complejo y u = [A., 1.2, 1.3, .•.] entonces Eu = A.u
ya que (Eu)n = Un+! = A.n+I = A.(A.") = A.un. Volviendo a aplicar el operador E
[!, ], 1, !, ...] obtendremos, en general, E1 u = 1.i u. Puesto que E0 se ha definido como el operador
[2, 4, 8, 16, ...]. identidad, tenemos que Eºu = 1.0 u. Así, si pes un polinomio definido por p(A.) =
¿;;:0 c;A. i, entonces
De éstas, la primera solución es más misteriosa que las otras dos, pues no es obvio cuál ( m ) m m
es su término general. En cambio, las otras dos soluciones son de la forma x. = A.", p(E)u= ;c;E i u= ;c;(Ei u)= ;c¡A.;u = p(A.)u.
donde A. = 1 o 2. Resulta natural la pregunta acerca de la existencia de otras soluciones.
Si hacemos Xn = A." en (2) obtenemos: Si p(A.) = O, entonces p(E)ú = O, como se afirmó.
Seapun polinomio cuyos ceros A.1, 1.2, •.• , Am , son simples y distintos de cero. Hay
A.n+2 _ 3A.n+I +2A.n = O una solución de la ecuación en diferencias p(E)x = O; a saber, u<kl = [1.k, 1.r A.�, ...J
que corresponde a cualquier cero A. k , Sea x cualquier solución de la ecuación en dife­
A.n (A.2 - 3A. +2) = Ü
rencias. Queremos expresar a x en la formax = ¿;;= 1 aku (kl _ Tomando las primeras m
A."(A. - l )(A. - 2) = O componentes de las sucesiones en esta ecuación, tenemos:

Este simple análisis nos muestra que sólo hay otra solución del tipo que se busca, a X¡ = ¿akA.t (i = l,2, ... , m). (4)
saber, [O, O, O, ...]. Ésta se llama solución trivial. Por otra parte, las soluciones u y v k=I
definidas por un = I y v" = 2" constituyen una base del espacio de soluciones de (2).
Para verificar esto, consideremos una solución arbitraria de (2), digamos x. Buscamos La matriz de m x m que tiene como componentes a las A.� es no singular, pues de lo
constantes a. y � tales que x = a.u+ �v. Esta ecuación significa que x11 = a.u11 +� v11 para contrario tendríamos la ecuación no trivial:
toda n. En particular, paran= 1 y 2, tenemos que:
¿ b;1.f = O, ¿ b;1.�-1 = O.
m
o
i=I i=I
X¡= U +2�
{ (3) (Esta última ecuación muestra un polinomio de grado m - l que tiene m ceros.) Así, la
X2 = U +4�. ecuación (4) determina a a 1, a2, ..• , am de manera única. Sólo nos resta demostrar que
la ecuación (4) es válida para todos los valores de i. Seaz = x- ¿;;=I aku( k¡. Entonces
La ecuación (3) determina unívocamente a a y � en virtud de que el determinante p(E)z = O o, lo que es lo mismo, ¿;;:0 C;Zn+i = O para toda n. En otras palabras,
de la matriz [; ¡] es distinto de cero. (Se trata del determinante de una matri: de
Vandermonde tal como se define en la sección 6.1.) Ahora podemos demostrar por Zn+m = -c,; 1 (CoZn +C¡Zn+I + · · · + Cm-!Zn+m-1) (n = 1,2.... ). (5)
24 Capítulo 1 Preliminares matemáticos *1.3 Ecuaciones en diferencias 25

Adviértase que Cm ;t O en virtud de que el polinomio p tiene m ceros diferentes y es, Respuesta La ecuación es de la forma p(E)x= O, donde p(l)= 413 + 7A.2 + 21 - l . Los factores
por consiguiente, de grado m. Como Z; = O para i = 1, 2, ... , m, la ecuación (5) nos de p son (1 + 1)2 y (41 - 1). Como se ve, p tiene un cero de multiplicidad dos en -1 y
demuestra, al utilizarla repetidas veces, que un cero simple en 1 /4. Las soluciones básicas son:

Zm+l = Zm+2 = · · ·= O. 11 x(-1)= [-1, 1,-1, 1,...J


x'(-1)= [1, -2,3, -4,...]
Ceros múltiples x(i)= [i, 16• i,¡, · · .].
Aún nos falta el problema de resolver una ecuación en diferencias p(E)x= O cuando La solución general es
p tiene ceros múltiples. Definimos x(l) = [l,12,13 ,...]. Hemos visto que si p es un x= a.x(-1) +�x'(-1) +yx(!)
polinomio:
o
p(E)x(l)= p(l)x(l) (6)
Xn = 0.(-1)" +�n(-l )
n
-l +y(i )" 11
Derivando con respecto a 1 resulta que:
Ecuaciones en diferencias estables
p(E)x'(1)= p'(1)x(l) +p(l)x'(1) (7) Se dice que un elemento x= [x1, x2, ...] de V está acotado si existe una constante c
tal que [xn [ � c para toda n. En otras palabras, sup fxn [ < oo. Se dice que una ecuación
Si 1 es un cero múltiple de p, entonces, p(l)= p'(l)= O, y las ecuaciones (6) y (7) nos en diferencias de la forma p(E)x = O decimos que " es estable si todas sus soluciones
muestran que x(l) y x'(1) son soluciones de la ecuación en diferencias. En consecuencia, están acotadas. Por ejemplo, la ecuación en diferencias (2) no es estable en virtud de que
una solución es la sucesión x'(l) = [1, 21,312 ,...]. Si 1 ;t O, resulta independiente de una de sus soluciones esta dada por Xn = 2". Ahora nos preguntamos si hay un método
la solución x(l), ya que sencillo para identificar una ecuación en diferencias estable.
l 12
det [ ;t O
1 21 ] TEOREMA 3 Para aquellos polinomios p que satisfacen p(O) ;t O, las siguientes condiciones son
equivalentes:
y en consecuencia, si las sucesiones se truncan después del segundo término, el par de (i) La ecuación en diferencias p(E)x= O es estable.
vectores que resulta en JR2 es linealmente independiente.
Al extender este razonamiento podemos demostrar que si 1 es un cero de p de (ii) Todos los ceros de p satisfacen fzl � 1 y todos los ceros múltiples satisfacen lzl < l.
multiplicidad k, entonces las siguientes sucesiones son soluciones de la ecuación en
diferencias p(E)x= O: Demostración Supongamos que la condición (ii) es cierta para p. Sea 1 un cero de p. La solución
correspondiente de la ecuación en diferencias es x(l)= [A.,12, 13, ...]. Como 111 � 1,
x(l)= [l,1 ,1 ,...]
2 3
esta sucesión está acotada Si 1 es un cero múltiple, entonces al menos una entre x'(1),
x'(l)= [1, 21,312 ,...] x"(l), ... será también una solución de la ecuación en diferencias. En este caso 111 < 1
por (ii). Además, por la regla de L'Hopital del cálculo elemental
x" (1)= [O,2, 61, ...]
lím il" = o (k= O,1,...)
n-oo

podemos ver que cada sucesión x'(1), x" (1), ... está acotada. 01éanse los problemas 22
d(k-1) y 23.)
X
(A)= dlk-1 ['/\., ,,
k-1,
/\.-,
13' ...]
Para demostrar el recíproco, supongamos que la condición (ii) es falsa. Si p tiene
un cero 1 que satisface 111 > 1, entonces la sucesión x(l) no está acotada. Si p tiene un
TEOREMA 2 Sea p un polinomio que satisface p(O) ;t O. Se puede obtener una base para el espacio cero múltiple 1 que satisface 111 � 1, entonces x'(1) no está acotada, ya que su término
nulo de p(E) de la manera siguiente: asóciese a cada cero 1 de p de multiplicidad k las general satisface la desigualdad
k soluciones básicas x(l), x'(l), ... , xlk -ll(l), donde x(l)= [l,12, 13 , ...].
lxnl= ln l"- 1 1= nlll"- 1 � n. 11111

Ejemplo 1 Determine la solución general de la ecuación en diferencias Ejemplo 2 Determine si la siguiente ecuación en diferencias es estable:

4 Xn + 7xn-l + 2xn-2 - Xn-3 = O. 4Xn + 7Xn-l + 2xn-2 -Xn-3 = O.


26 Capítulo 1 Preliminares matemáticos *1.3 Ecuaciones en diferencias 27

Respuesta La ecuación es de la forma p(E)x = O, con p('J,.) = 4')..3 + 7')..2 + 2').. - l. Por el ejemplo 9. Demuestre que si L1 y Lz son combinaciones lineales de potencias de E, y L1 x = O, entonces
anterior, p tiene un cero doble en -1 y un cero simple en 1/4. En consecuencia, la Lilzx = O.
ecuación es inestable. 11 10. Desarrolle una teorí a completa para la ecuación en diferencias E'x = O.
1 1. Dé bases que consten de sucesiones reales para el espacio de soluciones de
Un ejemplo de ecuación en diferencias con coeficientes no constantes aparece en
(a) (4E° - 3E2 + E3 )x = O (c) (2E6 - 9E5 + 12E4 - 4E3)x = O

¡�
la teoría de las funciones de Bessel. Estas funciones In de Bessel se definen por medio
(b) (3E - 2E + E )x = O
º 2
(d) (1tE2 - V2E + log2 · E°)x = O.
de la fórmula:
J.(x) = -1 cos(x sen e - n9) de
=
12. Demuestre que si p es un polinomio con coeficientes reales y si z [z 1, z2, ...] es una
solución compleja de p(E)z = O, entonces el conjugado de z, la parte real de z y la parte
1t o imaginaria de z, también son soluciones.
Es obvio, a partir de la definición, que JJ.(x)J � l. No tan obvia, pero no por ello menos 13. Resuelva
cierta, es la fórmula recurrente: (a) Xn+l - nxn = O (b) Xn+l - Xn = n (c) Xn+I - Xn = 2
1 14. Defina un operador ti mediante
ln(X) = 2(n - l )x- ln-l (x) - ln-2(x)
f1x = [X2 - X¡, X¡ - X2,X4 - X¡,•.•].
Si (para cierto argumento x) conocemos J0(x) y 11 (x), la relación recurrente se puede
utilizar para calcular ]z(x), h(x), ..., J.(x). Este procedimiento deviene inestable y Demuestre que E = I + ti, y que si p es un polinomio,
de poca utilidad cuando 2n > Jxl porque los errores de redondeo, que inevitablemente
p(E) = p(l) + p' ([)ti+ !p'' (/)ti2 + ....
ocurren, se multiplicarán por el factor 2nx- 1, que a la larga llega a ser muy grande.
(Véase el problema 25.) 15. (Continuación) Demuestre que six = 1)..),.2)..3, ...] y p es un polinomio, entoncesp(!:i)x =
Para obtener mayor información acerca de las funciones calculables por medio de p(7c- 1 )x. Describa como se resuelve una ecuación en diferencias que se escribe en la forma
relaciones recurrentes, vea Abramowitz y Stegun [1964, p.xiii], Cash [1979], Gautschi p(ti)x=O.
[1961, 1967, 1975] y Wunp [1984]. 16. (Continuación) Demuestre que

ti"= (-t)"[E° - nE + !n(n - l )E2 - !n(n- l)(n - 2)E3 + · · ·].


SERIE DE PROBLEMAS *1.3
el7. Considere la ecuación en diferencias
l. De las sucesiones que siguen a la ecuación (2), exprese la primera de ellas como combinación
lineal de las otras dos. Xn+2 - 2xn+1 - 2xn = O.
2. Sea p un polinomio de grado m. ¿Es el espacio de soluciones de p(E)x = O necesariamente
Una de sus soluciones es x. = (1 - )3)"- . Esta solución alterna sus signos y converge a
1
de dimensión m?
cero. Calcule e imprima los 100 primeros términos de esta sucesión por medio de la ecuación
3. Sea p un polinomio de grado m con p(O) ;e O. Si una sucesiónx contiene m ceros consecutivos Xn+2 = 2(xn+1 + x.), tomando como punto de partida x1 = 1 y x2 = 1 - ,/3. Explique el
y p(E)x = O, entonces x = O. curioso fenómeno que sucede.
4. ¿Es inyectivo (uno a uno) el operador E? ¿Tiene inverso derecho o inverso izquierdo? ¿Es 18. Haga una demostración completa del teorema 2.
suprayectivo (sobre)? Defina un operador F mediante (Fx) . = Xn 1 y (Fx)1 = O y responda
- que V se ha definido
las mismas preguntas para F. Explore la relación entre E y F. Suponga 19. Sea p un polinomio tal que p(O) = O. Describa el espacio nulo de p(E).
como el espacio de todas las funciones complejas que tienen como dominio al conjunto
{..., -3, -2, -1, O, 1, 2,3, ...} y que F se ha definido simplemente por (Fx)n = Xn-1· ¿En 20. Para cada 7c E C se define x(1c) = [1c, 7c 2, 7c3, ••. ]. Demuestre que si 7c1, 7c2, ... , 1cm son
qué forma se verían afectadas las respuestas a las preguntas anteriores con estos cambios? números complejos no nulos y diferentes entre sí, entonces {x(1c1),x(1c2 ),... ,x(1cm )} es un
conjunto linealmente independiente en V.
5. ¿ Cuáles son los valores y los vectores propios del operador E?
21. Si 7c es una raíz de p distinta de cero y de multiplicidad k, entonces la ecuación p(E)x = O
6. ¿Qué puede usted decir acerca de la convergencia de la siguiente serie infinita? tiene como soluciones u<!), u(2l, ••. , u(kl en donde u�) = ni-\•.
00
22. Demuestre que siµ E (0, oc) y l"-1 < 1, entonces lím.-00 nµ1cn = O.
¿x./•l.
23. Demuestre con todo detalle que una sucesión convergente está acotada.
n=l

I::1 x./•l, en un sentido puntual.


24. Demuestre el teorema 3 sin la hipótesis de que p(O) ;e O.
Demuestre que x =
c25. A partir de Jo(!) = 0.765Í976866 y 11(1 ) = 0.4400505857 y utilizando la fórmula de
7. Si { /1l, v(2l, ...} se toma como la base de V, demuestre que ¿�=O c,E' se puede representar recurrencia que aparece en el texto, calcule h(l), h(l ), ... , ho(l). ¿Qué evidencia se tiene
por medio de una matriz infinita. del alto grado de error de los valores obtenidos?
8. Demuestre que dos operadores cualesquiera con la forma descrita en el problema 7 conmutan 26. Defina inductivamente una sucesión por medio de la ecuación Xn+I = x. + x; 1, con Xo > O.
entre sí. Determine el comportamiento de x. cuando n -+ oo.
28 Capítulo 1 Preliminares matemáticos Capítulo 2

'27. Considere la ecuación en diferencias 4xn+2 - 8xn+I + 3x. = O. Detennine si es estable.


Encuentre la solución general. Suponiendo que xo = O y X¡ = -2, calcule x100 recurriendo ARITMÉTICA DE LA COMPUTADORA
al método más eficiente.
28. Considere la relación recurrente Xn = 2(Xn-l + Xn-2). Demuestre que la solución general es
z. = a(l +v'3)" +�(1-\/'3)". Demuestre que la solución que tiene valores inicialesx1 = 1 2.1 Números de punto flotante y errores de redondeo
yx2 = 1 - v'3 corresponde aa = O y�= (1- \/'3)-1. 2.2 Errores absolutos y relativos; pérdida de dígitos significativos
'29. (Continuación) En el problema anterior, calcule la solución particular en las tres formas 2.3 Cálculos estables y cálculos inestables; condicionamiento
que a continuación se indican. Calcule estas soluciones para 1 � n � 100 y compárelas
entre sí.
(i) x. a partir de la relación recurrente
(ii) Yn = �(I -v'3)"
(iii) Zn = a(l + v'3)" +�(l - \/'3)", donde ll se elige como la unidad del error de redondeo
para su computadora.
30 . Determine si la ecuación en diferencias Xn = Xn-1 +x.-2 es estable.
2.1 Números de punto flotante y errores de redondeo
'31 . Resuelva numéricamente la ecuación en diferencias
1
Xn+2 - (1t + 1t- )Xn+I + Xn = 0 La mayor parte de las computadoras de alta velocidad trabajan con números reales en
el sistema binario, en contraste con el sistema decimal que normalmente se utiliza. El
con x0 = 1 y x1 = ir. Calcule 49 de sus términos y determine el error relativo en xso. Haga sistema binario utiliza el 2 como base, de la misma manera que el sistema decimal utiliza
lo mismo cambiando x1 por n-1 y explique la diferencia en los errores relativos de los dos el 1O. Con el propósito de hacer una comparación recuérdese primero cómo funciona el
casos.
sistema de representación que nos es familiar. Cuando un número real como el 427.325
se escribe de una forma más explícita tenemos lo siguiente:

427.325 = 4 X 102 +2 X 10 1 +7 X 10º +3 X 10-l


+2 X 10-2 +5 X 10-3.
La expresión del segundo miembro utiliza potencias de 1O junto con los dígitos O, 1, 2, 3,
4, 5, 6, 7, 8, 9. Si se admite la posibilidad de tener un número infinito de dígitos colocados
a la derecha del punto decimal, entonces cualquier número real puede expresarse de la
manera ya mostrada, con un signo (+o -) a su lado. Así, -it se escribe
-lt = -3. l 4159265358979323846264338 . . . .
El último 8 en esta expresión representa 8x 10-26•
En el sistema binario sólo se utilizan los dígitos O y l . Un número típico en el
sistema binario también puede representarse en detalle como se ilustra a continuación:

1001.11101 = 1 X 23 +0 X 22 +0 X 21 +1 X 2º
+1xZ- 1 +1xZ-2 +1xr3 +0xZ-4 +1xZ-5.
Este número real se representa como 9.90625 en notación decimal. (Verifíquese.)
En general cualquier entero � > 1 puede utilizarse como base para un sistema
numérico. Los números representados en base � incluirán los dígitos O, 1, 2, 3, 4, . . . ,
� - l. Si el contexto no aclara cuál es la base numérica que se utiliza para el número N,
se puede utilizar la notación (N)�. Así tenemos que, de lo anterior,
(1001.11101)2 = (9.90625)10.

29
30 Capítulo 2 Aritmética de la computadora 2.1 Números de punto flotante y errores de redondeo 31

Ya que la computadora típica se comunica con el usuario humano utilizando el sis­ bit en q sea 1, y que por lo tanto no requiera almacenamiento. Los 23 bits que se reservan
tema decimal, aun cuando internamente utiliza el sistema binario, debe efectuar procesos en la palabra para la mantisa pueden utilizarse para almacenar el 2° , 3er, ..., 24° bits en
de conversión. Estos procesos ocurren durante la entrada o salida de la información. Nor­ q. En efecto, la máquina tiene una mantisa de 24 bits para sus números de punto flotante.
malmente el usuario no tiene que preocuparse de dichas conversiones, pero debe tener Se dice que un número real expresado como aparece en la ecuación 2 tiene la forma
conciencia de que implican pequeños errores de redondeo, como se verá más adelante. de punto flotante normalizádo. Si puede representarse con 1ml ocupando 7 bits, y q
Las computadoras no son capaces de trabajar con números reales expresados con ocupando 24 bits, entonces es un número de máquina en la MARC-32 . * Cuando este
más de un número fijo de dígitos. La longitud de palabra de la computadora impone una número se utiliza como un dato de entrada, o como el resultado de un cálculo, surge
restricción sobre la precisión con que pueden representarse los números reales. inevitablemente un error al representarlo de la manera más precisa posible mediante un
número de máquina.
La restricción de que 1ml no requiera más de 7 bits significa que
Notación científica normalizada
En el sistema decimal cualquier número real puede expresarse mediante la nota­ 1ml � (1111111)2 = 27 - 1 = 127.
ción cientifica normalizada. Esto significa que se desplaza el punto decimal y que las
potencias de 10 adecuadas se suministran de tal manera que todos los dígitos aparecen a En tanto que 2 127 ::::; 1038 , la MARC-32 puede manejar números tan pequeños como
la derecha del punto decimal y que el primer dígito que aparece es distinto de cero. Por 10-38 y tan grandes como 1038 • Éste no es un intervalo de magnitudes suficientemente
ejemplo generoso para algunos cálculos científicos y, por ésta y otras razones, debemos escribir
732.5051 = .7325051 X 103 ocasionalmente un programa en aritmética de doble precisión o de precisión extendida.
Un número de punto flotante en doble precisión se representa mediante dos palabras de
-0.005612 = -.5612 X 10-2. computadora, y usualmente la mantisa tiene al menos el doble de bits. Por esta razón
En general, un número real x distinto de cero puede representarse en la forma resulta que la precisión se extiende, aproximadamente, al doble de posiciones decimales
que en el caso de la precisión sencilla Además, los cálculos en doble precisión son más
x=±rxlOn (1)
lentos que en precisión sencilla, a menudo en un factor de 2 o más.
donde r es un número tal que to � r < I y n es un entero (positivo, negativo, o cero). La restricción de que q requiere no más de 24 bits significa que nuestros números de
Resulta evidente que si x = O, entonces r = O; en los casos restantes podemos ajustar n máquina tienen una precisión limitada cercana a las siete cifras decimales, ya que el bit
de tal manera que r se encuentre en el intervalo dado. menos significativo en la mantisa representa unidades de 2-24 (aproximadamente 10-7).
Exactamente de la misma manera podemos utilizar la notación científica en el Por lo tanto, los números expresados mediante más de siete dígitos decimales serán objeto
sistema binario. En este caso tenemos que de una aproximación cuando se den como datos de entrada a la computadora. Por otra
parte, algunos números decimales sencillos, como 1/10, no son números de máquina en
x=±qx2m (2) una computadora binaria. (Véase la ecuación (9) más adelante en esta sección.)
donde ! � q < I (si x * O) y m es un entero. El número q se llama mantisa y el entero En una computadora binaria los números de punto flotante están distribuidos de
manera algo irregular, concentrándose más o menos cerca del cero. En la máquina sólo
m exponente. En una computadora binaria tanto q como m estarán representados como
números en base 2. se tiene un número finito de números de punto flotante, y entre potencias adyacentes de 2
siempre existe el mismo número de números de máquina Dado que los espacios entre
las potencias de 2 son más pequeños cerca del cero y más grandes lejos de él, se obtiene
Computadora hipotética MARC-32 una distribución desigual de números de punto flotante, con una densidad mayor cerca
En una computadora típica los números se representan de la manera ya descrita, del origen.
pero con ciertas restricciones sobre q y m impuestas por la longitud de palabra disponible. Un entero puede utilizar para su representación todos los bits de una palabra de com­
Para ilustrar esto consideremos una computadora hipotética a la cual llamaremosMARC- putadora, con la salvedad de que se debe reservar un bit para el signo. Por consiguiente,
32. Tiene una longitud de palabra de 32 bits (dígitos binarios) y por lo tanto es similar en laMARC-32 los enteros están comprendidos entre -(231 -1) y 231- I = 2147483647.
a muchas computadoras personales modernas. Supongamos que los bits que componen En los cálculos científicos no es común trabajar exclusivamente con números enteros.
una palabra están acomodados de la siguiente manera cuando-representan números reales: La representación de punto flotante para un número real de precisión sencilla en la
1 bit computadora hipotética MARC-32 de 32 bits se divide en 3 campos, tal como se muestra
signo del número real x
1 bit en la figura 2.1. En este caso S es el bit que representa el signo de x, s es el bit que
signo del exponente m
7 bits representa el signo de m, E es el exponente de 7 bits, y F es la fracción de 23 bits del
exponente (entero 1ml)
23 bits número real x que junto con un 1 inicial implícito da como resultado el campo de dígitos
mantisa (número real lql)
Dado que un número real distinto de cero x = ±q x 2m puede normalizarse de tal manera *(Nota del R.T.) Esto es, puede ser representado exactamente en esta computadora particular. La mayoría de
los números reales no pueden ser representado de manera exacta en la MARC-32.
que su mantisa se encuentre en el rango 1/2 � q < 1, se puede suponer que el primer
32 Capítulo 2 Aritmética de la computadora 2.1 Números de punto flotante y errores de redondeo 33

significativos (.L __ ...___ ) 2 . Por consiguiente, los números máquina normalizados en donde cada a; es O o 1 y el bit principal es a1 = l. Un número máquina próximo
no nulos son cadenas de bits cuyos valores se decodifican como sigue: se obtiene al descartar los bits excedentes a2sa 26.... Este procedimiento suele llamarse
truncamiento. El número resultante es:
x=(-I)5xqx2m
x' = (.a¡a2.., a24)z X 2m. (3)
donde
q = (0.lF)z y m = (-1)' x E Obsérvese que x' se encuentra a la izquierda de x en la recta real. Otro número de
máquina próximo queda a la derecha dex , y se obtiene mediante el proceso de redondeo
en la que el principal bit significativo en q se sabe que es 1 y que no se almacena de
por exceso. Esto significa que eliminamos el exceso de bits como se hizo anteriormente,
manera explícita.
pero en esta ocasión aumentamos en una unidad el último bit remanente a 2 4. El número
La representación que utiliza la MARC-32 para los números reales sigue el patrón de
la representación usual de punto flotante en máquinas de 32 bits, excepto que se ha omi­ que resulta es:
x" = ((.a¡a2,,. a24)2 + T24) X 2m. (4)
tido por simplicidad la caracterización o el seso, del exponente m. Hemos optado por dar
sólo una breve descripción, dado que estas cuestiones dependen significativamente de la Tal como lo muestra la figura 2.2, se presentan dos situaciones. El más cercano entrex'
máquina. Por ejemplo, las computadoras que recurren a la aritmética de punto flotante y x" se selecciona para representar ax en la computadora.
siguiendo la norma oficial vigente utilizan 80 bits para sus cálculos internos. Existen
conceptos adicionales -como bit de protección, exponentes con signo, bit de redondeo,
bit de adhesión, números desnormalizados, números sin normalizar e indeterminacio­
nes- que participan en cualquier análisis detallado de este tema. Como información x' x'
X x" X x"
adicional pueden consultarse los siguientes textos: Standard far Binary Floating-Point
Arithmetic ANSI/IEEE [1985] y A Radix-lndependent Standardfor Floating-Point Arit­ Figura 2.2 Dos posiciones representativas parax
hmetic ANSI/IEEE [1987]. Entre los artículos de interés sobre este tema se encuentran:
Cody [1988], Cody et al. [1984], Coonen [1981], Hough [1981], Raimi [1969], y Scott Six' representa mejor ax, entonces resulta que
[1985].
lx-x'I � �lx"-x'I =�X z-2 4 X 2m = 2m-25. (5)
signo del exponente (s)
En este caso el error relativo está acotado como sigue:

.
signo de la mantisa (S) Exponente(E) Mantisa nonnalizada ( F) 2m-25 2-25 2-25
<��=�<�=z-M
= q X 2m q = ! (6)
Bits: 1 7

1
Punto
radical
23
En el segundo casox está más cercana ax" que ax', y se concluye que:

implícito
lx-x"I � �lx"-x'I =2m-2S

Figura 2.1 El campo de precisión sencilla de la MARC-32 . El mismo análisis muestra que el error relativo no excede de 2-24. Para el proceso de
truncamiento se utiliza una cota diferente. (Véase el Prob. 2.)
En ocasiones, durante el transcurso de un cálculo, se genera un número de la forma
Números máquina próximos
±q x 2m , donde m queda.fuera del rango permitido por la computadora. Si mes dema­
Deseamos ahora estimar el error en que se incurre al aproximar un número real siado grande se dice que ha ocurrido un desbordamiento por exceso. Si mes demasiado
positivox mediante un número máquina próximo en la MARC-32. En este caso supone- pequeño decimos que tuvo lugar un desbordamiento por defecto. En la MARC-32 esto
mos que significa que m > 127 o que m<-127, respectivamente. En el primer caso (desborda­
x=q X 2m !s.q<l 1ml � 127 miento por exceso) se tiene una condición de error fatal. En muchas computadoras la
2- ejecución del programa se interrumpirá de manera automática cuando se use en algún
Formulamos la siguiente pregunta: ¿Cuál es el número máquina más cercano a x?. cálculo la variable que contiene la indeterminación. En el segundo caso ( desborda­
Escribimos: miento por defecto) muchas computadoras simplemente asignan a la variable el valor O
X= (.a¡az.,. a24 a25a 26,,,) 2 X 2
m y el cálculo continúa.
34 Capítulo 2 Aritmética de la computadora 2.1 Números de punto flotante y errores de redondeo 35

Todo lo anterior acerca de la MARC-32 se resume diciendo que, si x es un número En este caso x' se obtuvo por truncamiento y x" mediante redondeo por exceso. Para
real distinto de O dentro del intervalo de la máquina, entonces el número de máquina x• determinar cuál de los dos está más cercano a x, calculamos x -x y x" - x, y con
más cercano a x satisface la desigualdad: ello decidimos cuál de los números debe tomarse comojl(x):

1
x• � z-2 4 2
X
� ¡ (7) X -X = (.101010 ...)2 X 2-24 = X 2-24
1

3
· 2
Si se toma 8 = (x* -x)/x, podemos escribir esta desigualdad de la siguiente forma: 1
X 1 - X= (X - X ) - (x-X ) = 2-24- 24 1 X 2-2 4
- X 2- = -
1 11 1

3 3
x* = x(l+8) 181 � z-2 4 (8) Por consiguiente tomamos jl(x) = x", y el error de redondeo absoluto es:
Con frecuencia se utiliza la notaciónjl(x) para representar el número de máquina de 1 z-24
lfi(x)-xl = x
punto flotante x* más cercano a x. El número 2-24 que aparece en las desigualdades 3
anteriores se llama error de redondeo unitario para la MARC-32. Nuestro análisis muestra Por lo tanto el error de redondeo relativo es:
que el número de bits asignados a la mantisa está directamente relacionado con el error
1 2-24
de redondeo unitario de la máquina y determina la exactitud de la aritmética de la lfl(x)-X 1 -
_ 1..2__ = z-25 < z-24
2 11
computadora. lxl 3
Deben esperarse errores de redondeo siempre que se introduzcan datos en la com­
putadora. Ni siquiera un número sencillo, como 1/10, puede almacenarse de manera Análisis del error de punto flotante
exacta en la MARC-32 (o en cualquier otra máquina binaria), a pesar de que se representa
de manera exacta en una máquina decimal. De hecho A continuación utilizaremos la MARC-32 como modelo para estudiar los errores que
surgen al hacer cálculos con la máquina y que se originan en los límites impuestos a
1 la longitud de palabra. Suponemos que el diseño de la máquina es de tal manera que
= (0.0001 1001 1001 1001 ...)z (9)
10 siempre que se deban combinar aritméticamente dos números primero se forma correc­
Ejemplo 1 ¿Cuál es la forma binaria del número x = 2/3? ¿Cuáles son los dos números de máquina tamente la combinación, luego se normaliza, a continuación se redondea y, finalmente,
x' y x" próximos en la MARC-32? ¿Cuál de éstos se escogerá comojl(x)? ¿Cuál es el se almacena en la memoria en la forma de una palabra de máquina. Para aclarar esta
error de redondeo absoluto y cuál el relativo al representar x como jl(x)? cuestión tomaremos el símbolo 8 como indicador de cualquiera de las cuatro operacio­
nes aritméticas básicas+,-, x o+. Si x y y son números de máquina y si x 8 y debe
Respuesta Para determinar la representación binaria escribimos calcularse y almacenarse, entonces lo más cercano que podemos aproximar a x 8 y me­
2 diante una palabra de máquina sencilla es redondeando mediante jl(x 8 y) y almacenado
= (.a1a2 a3 ...)2 dicho número.
3 Para ilustrar este proceso tomaremos una máquina decimal que opera con cinco
Multiplicamos por 2 para obtener dígitos decimales en su sistema numérico de punto flotante y consideremos dos números
de máquina
4
= (a¡.a2a3 .. .)z X= .31426 X 103 Y= .92577 X 105
3
Al utilizar un acumulador de longitud doble para ios resultados intermedios obtenemos:
Por lo tanto, al tomar la parte entera de ambos lados obtenemos a1 = l . Si restamos 1
tenemos que XX y = .2909324802 X 108
5
= (.a2a3a4 . ..)z x+y= .9289126 X 10
3 X - y= -.92262740 X 10
5
Repitiendo el paso previo concluirnos que
X+ y :,:: .3394579647 X 10-Z
2
X= = (.101010...)2 La computadora con cinco decimales los almacenará en la forma redondeada siguiente:
3
Los dos números de máquina próximos, cada uno con 24 bits, son: jl(xy) = .29093 X !08
jl(x+ y)= .92891 X 105
x'= (.101010 ... 10IO)z jl(X-y)= -.92263 X 105
x" = (.101010 ... 1011)2. jl(X + y) = .33946 X 10-Z
36 Capítulo 2 Aritmética de la computadora 2.1 Números de puntoflotante y errores de redondeo 37

En estos resultados los errores relativos son 8.5 x 10-6, 2.3 x 10-6, 2.8 x 10-6, y operaciones aritméticas en registros especiales que tienen más bits que los números de
6.0 x 10-6, respectivamente, todos ellos menores que 10-� máquina usuales. Estos bits extra se llaman bits de protección y permiten que los números
Cuando se trabaja con computadora conviene saber que las cuatro operaciones existan temporalmente con una precisión adicional. Después está claro que, se utiliza
aritméticas satisfacen ecuaciones como la siguiente: un procedimiento de redondeo para un número en este registro especial con el fin de
crear un número de máquina. Tanto el número de bits de protección como otros detalles
fi(x0y) = [x0y](l +8) JoJ � e difieren de una máquina a otra, y en ocasiones es difícil aprender exactamente cómo una
máquina específica maneja estas cuestiones. El terna puede estudiarse más ampliamente
Al hablar de computadoras en general, suponemos que esta ecuación es válida y que se en el texto de Stembenz [1974] y en muchos otros artículos de la bibliografía sobre
puede tomar e como el redondeo unitario para dicha máquina. En cualquier computadora computación. Vea también Feldstein y Tumer [1986], Gregory [1980], Rall [1965],
bien diseñada esta suposición será literalmente válida, o estará tan próxima a serlo que Scott [1985] y Waser y Flynn [1982].
las discrepancias pueden ignorarse en un análisis de redondeo.
Anteriormente habíamos establecido que para la MARC-32 Épsilon de la máquina
fi(x) = x(l +8) Jol �r24 Los resultados que hemos descrito para la MARC-32 son válidos para otras máquinas
si se hacen las modificaciones adecuadas. Si una máquina funciona con una base � y
para cualquier número real x dentro del rango de la MARC-32. Por ende utiliza n posiciones en la mantisa de sus números de punto flotante, entonces

fi(x0y) = (x0y)(l +8) Jol �r24 fi(x) = x(I + o) loJ �e,


!�
donde e = l-n en el caso de redondeo correcto, y e = � l-n en el caso de truncamiento.
si x y y son números de máquina. Así, el redondeo unitario 2-24 da una cota para el error El número (e) es el error de redondeo unitario y es una característica de la computadora,
relativo en cualquier operación aritmética básica. Un examen de los ejemplos numéricos de su sistema operativo y de la manera en que efectúa los cálculos (con precisión sencilla
anteriores mostrará por qué cabe esperar la presencia de un error de redondeo en toda o múltiple).
operación aritmética. Si x y y no son necesariamente números de máquina, el resultado El error de redondeo unitario (e) varía ampliamente entre las computadoras moder­
correspondiente es nas, debido a las diferencias en las longitudes de palabra de las máquinas, diferencias
en las bases utilizadas para la aritmética, el tipo de redondeo utilizado, etcétera. Las
fi(jl(x) Gfi(y)) = (x(I +81)0 y(l +82))(1 +03 ) Jo;I �r24. longitudes de palabra varían desde 64 y 60 para las grandes computadoras científicas,
hasta 32 y 36 para máquinas de tamaño mediano, e incluso 16 bits para algunas computa­
Utilizando el resultado básico que acabamos de dar podemos analizar operaciones
doras personales. Las calculadoras programables puede tener una precisión aún menor.
aritméticas compuestas. Con el objeto de ilustrar lo anterior, supongamos que x, y, y z
Muchas computadoras utilizan aritmética binaria, aunque también se utilizan la hexade­
son números de máquina en la MARC-32 y que deseamos calcular x(y+z). Tenemos que
cimal o la octal. Los diferentes tipos de redondeo utilizados son el redondeo perfecto,
el seudorredondeo y el truncamiento; algunos compiladores permiten al usuario utilizar
fi[x(y+ z)] = [xfi(y+z)](l +81) l81J �2-24 un conmutador (switch) para seleccionar el tipo de redondeo que se va en los cálculos.
= [x(y +z)(l +82 )](1 +81) 102 1 �r 24 Para calcular un valor aproximado de e en cualquier máquina se puede usar el
siguiente código, ya sea que se utilice precisión sencilla o doble. Este código determina
= x(y +z)(I +82 +81 +8281) el menor número positivo posible e de la forma 2-k, de modo que LO+ e ,t. LO en la
�x(y+z)(l+81 +82) máquina.
input s ,.... LO
=x(y+z)(l +0 3 ) 183 1 �T23, for k = 1, 2, . . . , 100 do
s,.... 0.5s
puesto que 828 1 es despreciable si se compara con 2-23.
Dado que la MARC-32 es una computadora hipotética, podemos hacer cualquier t ;-s+ LO
suposición acerca de la forma en que realiza los cálculos y almacena los números de punto if t � 1.0 then
flotante. Para una computadora real la suposición que hemos hecho acerca de fi(x0 y) s,.... 2.0s
está muy cerca de la verdad, y puede utilizarse para estimaciones confiables del error. output k - 1, s
Sin embargo, un poco de reflexión revelará que una computadora no podrá formar todas
las combinaciones de x0y con suficiente exactitud antes de redondearlas con el fin de stop
obtener números de máquina. Ya vimos en el ejemplo 1 que 2/3 no puede calcularse con end if
precisión en notación de punto flotante. En la práctica muchas computadoras realizarán end.
38 Capítulo 2 Aritmética de la computadora 2.1 Números de punto flotante y errores de redondeo 39

La siguiente tabla muestra los resultados de la ejecución de este algoritmo en varias obtenemos
computadoras. Los valores que se presentan deberán estar dentro de un factor de 2 Sk*+l -Sk+I
respecto de la precisión real de la máquina. Pk+l =
Sk+I
_ (S¡ +xk+1)(l +Ok) -(Sk+xk+I)
-
longitud Sk+l
Computadora de palabra precisión sencilla s precisión doble s l
[Sk( +Pk) Xk+dO +Ok) -(Sk +Xk+1)
+
=
CrayX-MP 64 r47 ::::l 0.71 X 10-I4 r95 ::::l 0.25 X 10-23 Sk+l
CDC Cyber 205
CDC Cyber 170n50
64
60
r46 ::::l 0.14 X 10-I3
r48 ::::: 0.36 X 10-14
r93 ::::: o.10 x
r 95 ::::: 0.25 X
10-21
10-23
=&k +Pk (s�:J (1+8 ) k

DEC 2060 36 r27 ::::l 0.75 X 10-3 T62 ::::l 0.2 1 X 10-18 Puesto que Sk < Sk+l y l&kl � s, podemos concluir que
DEC VAX 1 1nso 32 T24 ::::l 0.60 X 10-7 T56 ,::; 0.14 X 10-16
SUN 32 T23 ::::l 0.12 X 10-6 r 52 ::::l 0.22 X 10-IS IPk+II � s +IPki(l +e)=g +91Pkl.
IBMRISC Systern/6000 32 T23 ::::l 0.12 X 10-6 z-52,::; 0.22 X 10-IS donde e=1 +s. De esta manera se obtienen las desigualdades sucesivas:
IBM3081 32 z-ZO ::::l 0.95 X 10-6 2-52 ::::: 0.22 X 10-IS
!Poi=O
IP1I � S
Análisis del error relativo IP2I � e+Ss
IP31 � e+S(e+Ss ) =e+9e+92 e
A continuación presentamos un teorema que ilustra cómo puede analizarse el error
de redondeo relativo que se da en cálculos muy grandes. El teorema señala aproxima­
damente que al sumar n +1 números máquina positivos, el error de redondeo relativo
no debe exceder de ne, donde s es el error de redondeo unitario de la máquina utili­ El resultado general es
zada. (Este resultado deberá ser fácil de recordar, ya que n es el número de adiciones
implicadas.) IPn l � e +es +92 s +93 s +···+en-l e
=e(l +e+...+en-!)
TEOREMA Sean Xo, x1, .•• , Xn números máquina positivos en una computadora cuyo error de·re­
dondeo unitario es s. Entonces el error de redondeo relativo al calcular ¿7=0 X¡ de la =s(�)
manera usual es a lo sumo (1 +st -l. Esta cantidad es aproximadamente igual a ne. 9-1

= s el +et- 1)
Demostración Sea Sk =Xo +x1 +· · ·+Xk , y seas; la cantidad que la computadora calcula en lugar de
Sk . Las fórmulas recursivas para estas cantidades son: =(1 +et-1
Utilizando el teorema del binomio tenemos que
So=xo S =xo
{ { 0 (1 +sr -1 =1 +(�) e+(�) e2 +(;) s3 +· · · -1 ::::: ns 11
sk +i = sk +xk+i Sk+l =jl(Sk +Xk+I)
Ejemplo 2 Suponga que se define un número x mediante la serie infinita
A efectos del análisis definimos

s• -Sk S -(Sk +xk+1)


X= I>k,
=l
= .k._ 0k = k+l
k
Pk
Sk S k +X k+I donde las Sk son números reales dados. Intentamos aproximar x siguiendo un proceso
de dos etapas. Primero calculamos la suma parcial
Así, IPki es el error relativo que surge al aproximar la k-ésima suma parcial Sk mediante
la suma parcials; calculada, y l&kl es el error relativo obtenido de aproximar s; +X k+I Xn = ¿sk
mediante la cantidadjl(Si' +Xk+1). Utilizando las ecuaciones que definen a Pk y a Ok, k=l
40 Capítulo 2 .Aritmética de la computadora 2.1 Números de punto flotante y errores de redondeo 41

para un valor grande de n, y a continuación redondeamos Xn, reteniendo una cierta 8. Demuestre que, según las suposiciones hechas acerca de la MARC-32 se obtiene fl(x) =
cantidad de dígitos después del punto decimal. Digamos que se han retenido m dígitos. x/(1 +15), donde joj:;; T .
24

¿Se puede asegurar que el último dígito (el m-ésimo después del punto decimal) es 9. Demuestre que fi(}) = x'(l + o/-1, donde jllj :;; s, en el caso en que x es un número
correcto? máquina de punto flotante en una computadora con redondeo unitario s.
10. Demuestre mediante ejemplos que a menudofl[fi(xy)z] a= fl[xjl(yz)] para números máquina
Respuesta Sea in el valor redondeado de x•. Deseamos que x, y, y z. Con frecuencia este fenómeno se describre de manera informal diciendo que la
1
multiplicaci6n de máquina no es asociativa.
lin -xi� X 10-m. 11. Demuestre que si x y y son números máquina en laMARC-32 y si jyj :;; jxjT25 , entonces
2
fl(x+y)=x.
Si Xn se ha redondeado correctamente para obtener in, entonces 12. Si 1/1O se ha redondeado correctamente a un número binario normalizado (.a¡ a2 ••• a24 )z x 2"',
¿cuál es el error de redondeo?, ¿cuál es el error de redondeo relativo?
lin -x.l ��X 10-m 13. (a) Si 3/5 ha sido redondeado correctamente al número binario normalizado (.a1a2 ... a24)2 ,
-2 ¿cuál es el error de redondeo? (b) Responda la misma pregunta,pero ahora para 2/7.
Pero 14. ¿Es to - T24) un número máquina en laMARC-32? Fundamente su respuesta.
lin -xi� lin -x.l + lxn -xi� X 10-m + lxn -xj.
1 15. Sean xi, x2, ..., Xn números máqnina positivos en la MARC-32. Tómese s. como la suma
2 x1 +x2+...+xn y as; como la correspondiente suma en la computadora. (Suponga que
Esta desigualdad no se puede mejorar, y demuestra que, a menos que x. = x, no podemos la suma se efectúa en el orden dado.) Demuestre lo siguiente: Si x;+1 � T24 S; para cada i
entonces
lograr que li n - xi� X 10-m.
! ¡s; -s.J/Sn:;; (n -1)2-24
Es más realista pedir que lin -xi < fo x 10-m. Esto nos lleva a requerir que Xn
satisfaga lo siguiente: 16. Demuestre el sensible aumento de precisión de la desigualdad (7)
x-x· ¡ 1
X 10-m + lxn -xi < X 10-m, (10) l--<--
X = 1+224
1 6
2 !O
para la representación de números en laMARC-32.
o que lxn - xi < 10-m-l. De este requisito se puede calcular n. La desigualdad es
equivalente a 17. ¿Cuántos números máquina normalizados existen en la MARC-32? (No tome en cuenta el

1 f>k\ < 10-m-l.


k=n+I
• cero.)
18. Demuestre que cada número máquina en laMARC-32 tiene una única representación norma­
lizada, pero que esto no sería cierto si no se supone la normalización.
19. Sea x = (0.111 . ..111000 ...)z x 2'7, en donde la parte fraccionaria tiene 26 unos seguidos
de ceros. Determine, para laMARC-32,x', x",fl(x), x -x'. x" -x, x" -x', y jx -fl(x)j/x.
20. Sea x = 23 + T 19 + 2-22 . Encuentre los números máquina en la MARC-32 que se sitúan
SERIE DE PROBLEMAS 2.1
l. En una máquina binaria,¿cuál es el error de redondeo unitario para mantisas de 48 bits? justo a la derecha y justo a la izquierda de x. Determinefl(x), el error absoluto jx -jl(x)/, y
2. Si unaMARC-32 no redondea correctamente los números sino que simplemente elimina los el error relativo jx -fl(x)j/jxj. Verifique que en este caso el error relativo no excede a 2-24 .
bits excedentes, ¿cuál sería la unidad de redondeo? 21. Encuentre el número máquina que está justo a la derecha de 1/9 en una computadora binaria
3. ¿Cuál es el error de redondeo unitario para una máquina decimal que asigna doce posiciones con una mantisa normalizada de 43 dígitos.
decimales a la mantisa? Dicha máquina almacena números en la forma x = ±r x 10" con 22. Si x = I:!:1 T" y x* es el número máquina más cercano en laMARC-32 ¿cúal es el valor
1/10:;; r< l . más exacto de x* -x?
4 . Demuestre que 4/5 n o se puede representar de manera exacta en l aMARC-32. ¿Cuál es el 23. Seas. = x1 +x2 +...+Xn, donde cada x; es un número máquina. Seas; el número que la
número de máquina más cercano? ¿Cuál es el error de redondeo relativo que se produce máqnina calcula. Entoncess; =fl(S;_1 +x.). Demuestre que en laMARC-32
cuando se almacena este número en laMARC-32?
5. ¿Qué números se pueden representar por medio de una expresión finita en el sistema binario s; ::, Sn+S282+· · ·+s.on. JokJ ;; 2-24.
y no se pueden representar de manera finita en el sistema decimal?
24. ¿Cúales de las siguientes relaciones no son necesariamente ciertas en laMARC-32? (En este
6. ¿Qué se puede decir acerca del error de redondeo relativo cuando se suman n números caso x, y, z, son números máquina y joj :;; Z-24 .)
máquina? (No baga ninguna suposición acerca de tomar números positivos, ya que este caso
se contempla en un teorema del texto.) (a) fl(xy) = xy(l +8) (d) lfi(xy) -xyj:;; jxy¡2-24
(b) fl(x+y) = (x+y)(l +o) (e) fl(x+y+z) = (x+y+z)(l +o)
7. Encuentre un número real x en el rango de laMARC-32 que satisfagajl(x) = x(l +15), con
j6j tan grande como sea posible. ¿Puede joj alcanzar la cota T24? (c) fl(xy) =xy/(1+o)
42 Capítulo 2 Aritmética de la computadora 2.2 Errores absolutos y errores relativos; pérdida de dígitos significativos 43

25. En este problema utilice laMARC-32. Detennine una cota para el error relativo que surge al entre la Tierra y Júpiter sería algo asombroso, ¡pero no sería aceptable que un cirujano
calcular (a+ b)/(c +d) para números máquina a, b, e, d. cometiera un error de esa magnitud al efectuar una incisión!)
26. ¿Cuáles de los siguientes son números máquina en la MARC-32? (i) 1040 (ii) Z- 1 + Z-26 Ya hemos considerado errores relativos en nuestro análisis de los errores de redon­
(iii) 1/5 (iv) 1/3 (v) 1/256 deo. La desigualdad
(
¡x-f x) �e
I
27. Seax = 2 16 +Z- 8 +Z-9 +Z- 10• Seax• el número máquina más cercano ax en laMARC-32.
¿Cúal es el valor de lx -x· ¡?
28. Critique el siguiente argumento: al combinar aritméticamente dos números máquina en la es una declaración acerca del error relativo implicado en la representación de un número
MARC-32, el error de redondeo relativo no puede exceder Z-24• Por lo tanto, al combinar n real x mediante un número máquina de punto flotante cercano.
de dichos números, el error de redondeo relativo no puede exceder (n - l )Z- 24•
29. Seax=2 12 +Z- 12. Pérdida de dígitos significativos
(a) Calcule en laMARC-32 los números máquinax' yx" que se encuentran justo a la derecha
y a la izquierda dex, respectivamente. A pesar de que los errores de redondeo son inevitables y difíciles de controlar, se
(b) Para este número, pruebe que el error relativo entre x yft(x) no es mayor que el error de da otro tipo de errores que sí podemos someter a nuestro control Una de las grandes
redondeo unitario en laMARC-32. preocupaciones del análisis numérico consiste en entender y controlar varios tipos de
30. ¿ Que error de redondeo relativo puede surgir al calcular el producto den números máquina en errores. A continuación nos ocuparemos de un tipo de error que con frecuencia aparece
laMARC-32? ¿Cómo cambia su respuesta si los n números no son necesariamente números como consecuencia de descuidos durante el proceso de programación.
máquina (pero se encuentran dentro del rango de la máquina)? A fin de ver el tipo de situación en que puede producirse un error relativo de gran
31. Dé ejemplos de números reales x y y para los cuales ft(x 0 y) ,t. ft(fl(x) 0 ft(y)). Ilustre las magnitud, vamos a considerar una resta entre dos números cercanos entre sí. Por ejemplo,
cuatro operaciones aritméticas utilizando una máquina con cinco decimales.
32. Si escribimos IT=1(1 +o;) = 1 +e, donde lo,! � Z-24. ¿cúal es el rango de valores posibles X= .3721478693
para e? ¿Es !el � n2�24 una cota acorde con la realidad? y = .3720230572
33. Suponga que los números Z1, z2 •... se calculan a partir de los datosx, a1, a2,... mediante el X - y= .0001248121
algoritmo z1 = a1, Zn = xz._1 +a. paran f 2. (Éste es el algoritmo de Homer.) Suponga
que los datos son números máquina. Demuestre que los Zn obtenidos en la computadora son
los números que resultarían al aplicar una aritmética exacta a los datos perturbados. Acote Si los cálculos se llevaran a cabo en una computadora decimal con mantisa de cinco
la perturbación en términos del error de redondeo unitario de la máquina dígitos, veríamos que
34. La cantidad (1 + el"- 1 se presenta en el teorema de esta sección. Pruebe que si ne< .01, jl(x) = .37215
entonces (1 +e)"- 1 < .01006.
jl(y) = .37202
35. Demuestre la ecuación (1O) utilizando las hipótesis dadas en el texto.
jl(x)- jl(y) = .00013
36. ¿Cúantos números de punto flotante hay entre potencias de 2 sucesivas en laMARC-32?
37. ¿Qué otros números, además de los enteros positivos, pueden utilizarse como base de un Por lo tanto, el error relativo es muy grande:
sistema numérico? Por ejemplo, ¿podemos utilizar 11?
x -y- (fi(x)-jl(y)] = \.0001248121- .000131 � 4%
I
l X- y . .0001248121
2.2 Errores absolutos y errores relativos; pérdida de dígitos significativos Siempre que la computadora deba desplazar dígitos en la mantisa para lograr un número
de punto flotante normalizado, se añadirán ceros en el lado derecho. Estos ceros ca­
Cuando se aproxima un número real x mediante otro número x*, el error que resulta es recen de sentido y no representan una exactitud adicional. Por lo tanto jl(x)- jl(y) se
x-x•. El error absoluto es representa en la computadora como .13000 x 10-3, aunque los ceros en la mantisa sólo
lx-x•¡ sirven para denotar el lugar decimal.
y el error relativo es
¡x �x· ¡. Sustracción de cantidades casi iguales
Como regla, deberemos evitar situaciones en las que la exactitud se pueda ver
En las mediciones científicas es usualmente el error relativo el que resulta relevante. La comprometida por restar cantidades casi iguales. Un programador precavido estará
información acerca del error absoluto suele ser poco útil si no se conoce la magnitud de alerta para evitar este tipo de situaciones. Consideremos el siguiente ejemplo con el fin
la cantidad que se está midiendo. (Un error de sólo un metro al determinar la distancia de ilustrar lo que se puede lograr al volver a programar.
44 Capítulo 2 Aritmética de la computadora 2.2 Errores absolutos y errores relativos; pérdida de dígitos significativos 45

Ejemplo 1 El enunciado de asignación Ejemplo 2 Considere el enunciado de asignación


y+-vx2+1-1
y+-x- senx
implica una cancelación por sustracción y pérdida de dígitos significativos para valores
pequeños de x. ¿Cómo se puede evitar este problema? Ya que sen x ::::: x para valores pequeños de x, este cálculo entrañará una pérdida de
dígitos significativos. ¿Cómo puede evitarse?
Respuesta Si la función se presenta bajo la siguiente forma:

y = (Vx2 +1-1) ( v'?+1


Jx2 +1+1
=
) x 2 Respuesta Encontremos una forma alternativa para la función y = x- sen x. En este caso resulta
útil la serie de Taylor para senx. Así:
+1 Vx2 + l.+ ¡'
y =x- senx
entonces la dificultad se evita volviendo a programar con un enunciado de asignación
distinto
=x-(x-�+�-fi+···)
y+-x2/cvx2+1+1). 1111

x3 x5 x
- ---+--···
1
Teorema sobre la pérdida de precisión
3! 5! 7!
La siguiente es una pregunta interesante: ¿cuántos bits significativos se pierden al Si x está cerca del cero, entonces se puede utilizar una serie truncada, tal como se hace
efectuar la sustracción x- y cuando x es cercano a y? Una respuesta precisa depende en este enunciado de asignación:
de los valores particulares de x y y. Sin embargo, podemos obtener cotas en términos de
la cantidad J1- y/xi, la cual resulta una medida conveniente de la cercanía entre x y y. y+- (x3 /6)(1- (x2/20)(1- (x2/42)(1-x2/72)))
El siguiente teorema proporciona cotas superiores e inferiores de mucha utilidad. (El
teorema es válido para todo tipo de máquina.) Si se necesitaran valores de y para un rango amplio de valores dex en esta función, sería
mejor emplear ambos enunciados de asignación, cada uno en su propio rango intervalo.
TEOREMA Si x y y son números de máquina binarios normalizados de puntoflotante, positivos, y En este ejemplo se necesita ampliar el análisis con el fin de determinar el rango
tales que x > y con intervalo apropiado de los valores dex para cada uno de estos enunciados de asignación.
Z-q -
:S 1- � :S 2-P, Utilizando el teorema sobre pérdida de precisión, observamos que la pérdida de bits en la
x-
entonces en la resta x- y se pierden a lo más q, y al menos p bits significativos.
sustracción del primer enunciado de asignación puede limitarse a un bit cuando mucho
si se restringe x, de tal forma que
Demostración Demostraremos el caso de la cota superior y dejaremos el de la cota inferior como
ejercicio para el lector. Las formas de punto flotante binarias normalizadas para x y y 1-�>�
=2
X
son:
(Aquí estamos considerando sólo el caso en que senx > 0.) Con una calculadora resulta
x = rx2" (! � r<1) sencillo determinar que x debe ser por lo menos 1.9. Así, para Jxl � 1.9, deberemos
y = sx2m (!�s<l). utilizar el primer enunciado de asignación que implica x - senx, y para lxl <1.9
Dado que x es mayor que y, la computadora quizá tenga que desplazar y de manera que deberemos utilizar una serie truncada. Podemos verificar que, en el peor de los casos,
su exponente sea el mismo que el de, x antes de restarle y. Por consiguiente, debemos (x = 1.9) con siete términos de la serie se obtiene y con un error máximo de 10- 9.
escribir y como: (Véase el problema 33.)
Si se quiere construir un subprograma para y = x - senx utilizando un cierto

{
y = (s X 2m-n) X 2",
número de términos de la serie anterior, observe que cada término puede obtenerse del
y entonces tendremos que anterior mediante las fórmulas:
X -y = (r - S X 2m-n) X 2".
La mantisa de este número satisface t¡ ={
sx2 m
r - s X zm -n = r ( ¡ - -- ) = r (1- - <z-P.
y) -tnX2
T X zn X tn+l = ---------::;-
(2n+2)(2n+ 3)
(n � 1)

A fin de normalizar la representación de la computadora para x - y, se requiere un Las sumas parciales


desplazamiento de p bits hacia la izquierda. Por lo tanto se añaden al menos p ceros n
carentes de significado en el extremo derecho de la mantisa, lo que representa una pérdida Sn = ¿tk
de por lo menos p bits de precisión. 11 k=l
46 Capítulo 2 Aritmética de la computadora 2.2 Errores absolutos y errores relativos; pérdida de dígitos significativos 47

{
se pueden obtener inductivamente mediante: SERIE DE PROBLEMAS 2.2
1. ¿Cuántos bits de precisión se pierden en una computadora cuando efectuamos la sustracción
S¡ = t¡ x -senx parax = !?
Sn+l = Sn + tn+l (n � 1). 11 2. ¿Cuántos bits de precisión se pierden en la sustracción 1 -cosx cuando x = i?
En algunos casos la pérdida de dígitos significativos puede evitarse o mejorarse '3. Escriba y ensaye un programa para calcular
recurriendo a la doble precisión. En esta forma de cálculo a cada número real le corres­
f(x) = ,/x2 +1 -1
ponden dos palabras de almacenamiento. Esto duplica, por lo menos, el número de bits
en la mantisa. Algunas partes cruciales del cálculo se pueden llevar a cabo en el modo de g(x) =i/(Vx2+ l+ 1)
doble precisión, a la vez que las partes restantes se efectúan en precisión sencilla. Esto
para una sucesión de valores dex, como: s- 1, 3-2, s-1, .... Aunque/= g, la computadora
resulta más económico que ejecutar el problema completo en el modo de doble precisión, dará resultados diferentes. ¿Cuáles de los resultados son de fiar y cuáles no?
en tanto que este modo aumenta el tiempo de cálculo ( y por ende el costo) por un factor
'4. Escriba y verifique una subrutina que ¡¡cepte un número máquina x y que proporcione el
que oscila entre dos y cuatro. Esto ocurre porque la aritmética de doble precisión suele
ejecutarse por medio del software, mientras que la aritmética de precisión sencilla se
=
valor y x -senx con casi toda la precisión de la máquina.

lleva a cabo mediante el hardware. 5. Encuentre una identidad trigonométrica adecuada para que 1 -cosx pueda calcularse con
precisión para valores pequeños de x. La identidad deberá llamar a las funciones del sistema
para senx o cosx. (Existen dos respuestas correctas.)
Evaluación de funciones 6. Encuentre, para la función del problema 5, una serie de Tay lar adecuada que se pueda calcular
con precisión.
Se presenta otra situación en la que tiene lugar una pérdida drástica de dígitos
significativos. Esto sucede para ciertas funciones cuando se evalúan en argumentos muy 7. Encuentre una forma de calcular,/x.4 +4 -2 sin que haya una pérdida inecesaria de dígitos
significativos.
=
grandes. Ejemplifiquemos esta situación con la función coseno, que tiene la propiedad
de la periodicidad: 8. Analice el problema de calcular senhx a partir de su definición: senhx f (e" -e-').
cos(x + 2mt) = cosx. 9. Al resolver la ecuación cuadrática ax + bx+e = O mediante la fórmula
2

Mediante el uso de esta propiedad la evaluación de cosx para cualquier argumento puede
efectuarse mediante el cálculo en un argumento reducido en el intervalo [O, 2it]. Las x = (-b± )b 2 -4ac)/(2a)
subrutinas de bibliotecas disponibles en las computadoras recurren a esta propiedad habrá una pérdida de dígitos significativos cuando 4ac sea pequeño comparado con b 2, ya
mediante un proceso llamado reducción de dominio. También se pueden utilizar otras que
propiedades, como: Vb 2 -4ac :.:e Jbl
cos(-x) = cosx = - cos(it - x).
Sugiera un método para soslayar esta dificultad.
Por ejemplo, la evaluación de cosx enx = 33278.21 se efectúa encontrando el argumento 1O. Sugiera cómo se podría evitar la pérdida de dígitos significativos en los siguientes cálculos:
reducido
(a) ,/x2 +1 -x (f) logx -1
y= 33278.21 - 5296 X 2it.
(b) logx -logy (g) (cosx -e-')/ senx
Aquí conservamos dos decimales en vista de que en el argumento original la exacti­ (c) X-'(senx - x) (h) senx -tanx
tud se limitaba a sólo dos lugares decimales. El argumento reducido posee tres cifras (i) senhx -tanhx
(d) vx+2 - .fi
significativas, aun a pesar de que el argumento original pueda haber tenido siete cifras sig­
nificativas. Por lo tanto, el coseno tendrá a lo sumo tres cifras significativas. No debemos (e) e" - e U) ln(x +Vx2 +1) (Ésta es la función senh-1 x.)
caer en el error de pensar que la precisión infinita disponible para 5296 x 2it = 2.46 11. Para cualquier xo > -1, la sucesión definida recursivamente mediante
se transfiere al argumento reducido y. Tampoco debemos equivocarnos por la aparente 1
precisión en el resultado impreso de una subrutina. Si en la subrutina coseno se propor­ Xn+I = 2"+ [Vl +2-nx, -1]
ciona un argumento y con tres dígitos significativos, entonces el valor cos y no tendrá converge a ln(xo+1). (Véase Henrici (1962, p. 243].) Modifique esta fórmula de tal manera
más de tres cifras significativas, aun cuando aparezca como que no haya pérdida de dígitos significativos.
12. Ordene las siguientes fórmulas para calcular tanx - senx cuando x es próximo a O, de
cos(2.46) = -0.7765702835. acuerdo con su precisión
(La razón de ello es que la subrutina considera al argumento como si tuviera tanta (a) senx[(l / cosx) -!] (d) (x2/2)(1 -x2/12) tanx
exactitud como la que corresponde a la precisión de la máquina, lo cual, por supuesto, (b) fxl (e) fx2 tanx
no sucede.) (c) (senx)/(cosx) -senx (f) tanxsen2x/(cosx+1)
48 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 49

13. Encuentre maneras de calcular las siguientes funciones sin que haya una pérdida de dígitos 24. La serie I::1 k-1 se conoce como serie armónica. Es una serie divergente. Las sumas
significativos seria: parciales s. = I:;= 1 k-1, pueden calcularse recursivamente al establecer S1 = 1 y utilizar
(a) (l-x)/(I+x)-I/(3x+I) (c) é- cosx- senx s. = s.-1 + n-1. Si este cálculo se efectuase en su computadora, ¿cuál sería la mayor s.
que se obtendría? (No intente hacerlo experimentalmente en su computadora; es demasiado
(b) )x+l/x-)x-I/x costoso. Vea Schechter [1984].)
c¡4_ Use su computadora para imprimir los valores de las funciones 25. Encuentre una forma de calcular con precisión/(x) = x+ e' - e3' para valores pequeños
dex.
- -
f(x) = x8 - 8x1 + 2sx6 56.x5 + 1oi 56.x3 + 28x - 8x+ 1
2
26. (a) Encuentre una manera de calcular con precisión para valores cercanos al cero la función
g(x) = (((((((x - 8)x+ 28)x - 56)x+ 70)x - 56)x+ 28)x - 8)x+ 1
8
f(x) = (e""'' - e')/x3
h(x) = (x - 1)
(b) Determine lím,-o/(x).
en 101 puntos igualmente espaciados y que cubran el intervalo [0.99, 1.01]. Calcule cada 27. Explique por qué no hay una pérdida seria de dígitos significativos debida a la sustracción
función en fonna directa sin que tenga que agrupar o factorizar. Observe que las tres funciones si se emplea la aproximación
son idénticas. Explique por qué no todos los valores impresos son positivos, como debiera
suceder. Si dispone de una graficadora, utilícela para hacer el gráfico de estas funciones X- Senx::::,: (x3 /6)(J - (i/20)(1 - :i2 /42) )
cerca de 1.0, empleando una escala que agrande los valores de la función de manera que se
observen las variaciones implicadas. (Véase Rice [1983].) 28. Al calcular la suma de una serie infinita I:: 1 x., suponga que se desea una respuesta que
15. Discuta el cálculo de e-' para x > O a partir de la serie tenga un error absoluto menor que e. ¿Causa problemas detener la suma de ténninos cuando
la magnitud de éstos es menor que e? Ejemplifique esto con la serie I:: 1 (0.99)".
2
-, =I-x+ x x3 29. Repita el problema 28 con las suposiciones adicionales de que los términos x. toman valores
e -3!+··· positivos y negativos de manera alternada, y que fx.f converge monótonamente a O. (Utilice
21
un teorema del cálculo referente a las series alternadas.)
Sugiera una mejor forma de efectuar el cálculo, suponiendo que no se dispone de la función
del sistema para e'. 30. Muestre que si x es un número máquina en la MARC-32 y si x > 1t. 225 , entonces cosx se
calculará sin dígitos significativos.
'16. Escriba y verifique uncódigo que proporcione valores precisosde 1-cosxpara-¡¡ � x � 1t. c31. Un experimento numérico interesante consiste en calcular el producto escalar de los siguien­
Cerca del cero utilice una serie de Taylor y en otro caso el subprograma para el coseno. tes dos vectores:
Determine con cuidado el dominio donde deberá utilizarse cada método, de tal manera que
se pierda a lo sumo un bit. X= [2.718281828, -3.141592654, J.414213562, Ü.5772156649, 0.3010299957]
'17. Escriba y verifique un subprograma función para/(x) = X-2 (1 - cosx). Evite la pérdida y= [1486.2497, 878366.9879, -2237492, 4773714.647, 0.000185049]
de dígitos significativos en la sustracción para todos los argumentos de x, y (por supuesto) Calcule el sumatorio de las cuatro fonnas siguientes:
tenga cuidado con la dificultad que representa x = O.
(i) en orden ascendente I;;=1x,y,
18. Para algunos valores de x habrá una cancelación por sustracción al calcularf(x) = 1+cos x.
¿Cuáles son estos valores de x y cómo puede evitarse la pérdida de precisión? (ii) en orden descendente I:'.=•x,y,
(iii) en orden del mayor al menor (sume los números positivos, de mayor a menor, luego
19. Considere la función/(x) = ..- 1 (1 - cosx) . sume los números negativos de menor a mayor, y luego sume ambos resultados parciales) .
(a) ¿Cuál es la definición correcta de/(0) ?, lo que es lo mismo: ¿cuál.es el valor que hace (iv) de menor a mayor (inversamente a como �e realizó la suma en el método anterior).
continua a/?
Utilice tanto la doble precisión como la precisión sencilla para un total de ocho respuestas.
(b) Si se emplea la fónnula dada, ¿en la vecindad de qué puntos ocurre una pérdida de dígitos
significativos? Compare los resultados con el valor correcto con siete decimales 1.006571 x 10-9 . Justifique
sus resultados.
(c) ¿Cómo se puede evitar la dificultad que aparece en (b)? Encuentre un método que no use
la serie de Taylor. '32. (Continuación) Repita el problema anterior, pero elimine el 9 final de X4 y el 7 final de x5•
(d) Si la nueva fórmula que proporcionó en (c) comprende una cancelación por sustracción ¿Qué efectos provoca este pequeño cambio en los resultados?
en algún otro punto, describa cómo evitar dicha dificultad. 33. Demuestre, utilizando el ténnino de error del teorema de Taylor, que se requieren al menos
siete términos en la serie del ejemplo 2 si se desea que el error no exceda 10-9•
20. Sea/(x) = -e-2x +i!. ¿Cuál de estas fónnulas para/ es más exacta para valores pequeños
dex? (i) x (ii) 3x (iii) 3x( l-x/2) (iv) 2-3x
(v) lf( l - e3')
2.3 Cálculos estables e inestables; condicionamiento
21. Si en el cálculo de y = .¡x2 + 1-1 se pierden a lo sumo 2 bits de precisión, ¿qué restricción
se debe imponer ax?
22. ¿Para qué rango de valores de 9 aporta la aproximación sen 9 :::::: 9 resultados correctos hasta En esta sección presentarnos otro tema que aparece con frecuencia en el análisis numé­
tres posiciones decimales (redondeadas) ? rico: la distinción entre los procesos numéricos que son estables y los que no lo son. Dos
23. ¿Cuán buena resulta la aproximación cosx:::::: 1 para valores pequeños dex? ¿Cuán pequeño conceptos estrechamente relacionados con ellos son los de problema bien condicionado
debe ser x para una precisión de 4 x 10-8 ? y problema mal condicionado.
50 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 51

Inestabilidad numérica Por lo tanto, este algoritmo es inestable. Cualquier error que se presente en Xn se
multiplica por 13/3 al calcular Xn+l· Existe por ende una posibilidad de que el error
De manera informal decimos que un proceso numérico es inestable cuando los pe­ enx1 se propague ax15, aumentado en un factor de (13/3) 14 • Ya que el error absoluto en
queños errores que se producen en alguna de sus etapas se agrandan en etapas posteriores x1 es aproximadamente 10-s y que (13/3) 14 es casi igual a 109 , el error en x15, debido
y degradan seriamente la exactitud del cálculo en su conjunto. exclusivamente al error eilx1, podría alcanzar el valor de 10. De hecho, los errores de
Un ejemplo nos permitirá explicar este concepto. Considere la sucesión de números redondeo adicionales surgen al calcular cada uno de losx2,x3, .•• y estos errores quizá
reales definida inductivamente mediante también se propaguen hastax1s con varios factores de la forma (13/3f

1
Otra manera de explicar este fenómeno es observando que la ecuación (1) es una

Gr
Xo = , X¡ ecuación en diferencias cuya solución general es
3
=

(1)
Xn+I = �Xn - ixn-1 (n � 1). Xn =A +B(4)".
{

or
Es fácil observar que esta relación de recurrencia genera la sucesión Tanto A como B son constantes determinadas por los valores iniciales x0 yx1. (El lector
debería consultar la sección 1.3 para conocer la teoría de las ecuaciones en diferencias
Xn = (2) lineales.) Aunque sólo deseamos calcular la solución de (2) correspondiente a A = I y
B = O, resulta imposible evitar la contaminación debida a la componente no deseada 4".
Esta última dominará eventualmente a la solución deseada.
De hecho, es obvio que la ecuación (2) se cumple paran = O y 1. Admitiendo su validez El que un proceso sea numéricamente estable o inestable debería decidirse con base
para n ;;; m, entonces su validez para n = m + 1 se comprueba escribiendo en los errores relativos. Así, si hay errores grandes en un cálculo, la situación puede ser
del todo aceptable si los resultados son grandes. En el ejemplo anterior iniciamos con
13 4 13 l m 4 l m-l valores xo= 1 y X¡ = 4. La relación de recurrencia (1) se mantiene intacta y entonces
Xm+I =
3xm - 3xm-1 = 3 (3) - 3 (3) los errores continuarán propagándose y creciendo como antes. Sin embargo, ahora la

1 +l
or-l [ �J or
solución correcta es Xn = 4'" y los resultados del cálculo son correctos hasta la séptima
cifra significativa. A continuación presentamos algunos de ellos:
= =
:-
X1 = 4.000006
Si la definición inductiva (1) se utiliza para generar numéricamente la sucesión, por
ejemplo en la MARC-32, entonces algunos de los términos calculados tendrán una gran X10 = J.048576 X 106
falta de precisión. A continuación presentamos algunos de ellos, calculados en una Xzo = 1.099512 X ]012
computadora de 32 bits similar a la MARC-32.
En este caso los valores correctos son suficientemente grandes como para opacar los
Xo = l. 0000000
errores. Los errores absolutos sin duda son grandes (como antes) pero son relativamente
X¡ = 0.3333333 (7 dígitos significativos correctamente redondeados)
despreciables.
Xz = 0.1111112 (6 dígitos significativos correctamente redondeados)
Otro ejemplo de inestabilidad numérica lo proporciona el cálculo de los números
X3 = 0.037Q373 (5 dígitos significativos correctamente redondeados)
X4 = 0.0123466
X5 = 0.0041187
X6 = 0.0013.857
(4 dígitos significativos correctamente redondeados)
(3 dígitos significativos correctamente redondeados)
(2 dígitos significativos correctamente redondeados)
Yn = [x"i!dx (n � 0). (3)
X7 = 0.0005131 (1 dígitos significativos correctamente redondeados)
Xg :::: 0.0003757 (O dígitos significativos correctamente redondeados) Si aplicamos la integración por partes en la integral que define a Yn+I se obtiene la
X9 = 0.0009437
siguiente relación de recurrencia:
XlQ = 0.0035887
X¡¡ = 0.0142927 Yn+I = e - (n + l)Yn· (4)
X¡z = 0.0571502
X13 = 0.2285939 De lo anterior y del hecho evidente de que y0 = e - 1 obtenemos y1 :
X¡4 = 0.9143735
x15 = 3.657493 ((2) incorrecto con error relativo de 108) YI = e - Y o= e - (e - 1) = 1
52 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 53

Utilizando la relación (4) e iniciando con y¡ = 1 generemos Y2, y3, ... , y1s en una Respuesta Seaf(x)=sen- 1 x. Entonces
computadora similar a la MARC-32. Algunos de los resultados son:
xf'(x) X
=
Y2=.7182817 f(x) v'l-x 2 sen- 1 x
Yll = 1.422453
Para x próxima a 1, sen- 1 x � 1t/2, y el número de condición se vuelve infinito conforme
y¡5 = 39 711.43
x se acerca a !, ya que se aproxima mediante 2x/(itv'l-x2 ). Por lo tanto, pequeños
errores relativos en x pueden conducir a grandes errores relativos en sen- 1 x cerca de
Estos no pueden ser correctos. De hecho es obvio, como se deduce de (3), que la sucesión x=l. •
y satisface y¡ > yz > ... > O y que el límn-oo Yn = O. (Ciertamente, para O < x < 1,
la expresión x. decrece monótonamente hacia cero.) Una vez sabido esto, a partir de la Consideremos ahora el problema de localizar un cero (o raíz) de una función! (En
ecuación (4) vemos que lím._ (n +l)y. = e. el capítulo 3 este problema se estudia desde el punto de vista algorítmico.) Sean f y g
dos funciones de clase C2 en una vecindad de r, donde r es una raíz de f
00

En este ejemplo, cuando se calcula y3, un error de 8 unidades en yz se multiplica


por 3. Este error de 38 se multiplica por 4 al calcular y4• El error resultante de 128 se
multiplica por 5 al calcular Ys. El proceso continúa de tal manera que al calcular y 10 el =
Supongamos que r es una raíz simple, tal quef' (r) ,t. O. Si perturbamos la función!
y obtenemos F f +eg, ¿dónde se localiza la nueva raíz? Supongamos que la nueva raíz
es r +h; a continuación deduciremos una fórmula aproximada para h. La perturbación
error puede ser tan grande como!10!8 � 2 x 10 68. Para y20 la cantidad correspondiente
es 10 18 8. Dado que 8 � Z-24 en la MARC-32, entonces 10 18 8 � 10 10 • Resulta pues que h satisface la ecuación F(r +h)=O, o
los errores trastornan completamente los valores correctos de Yn· Los valores correctos
f(r +h)+eg(r +h)=.O
tienden rápidamente a O.
Dado que f y g son de clase C2 , podemos utilizar el teorema de Taylor para expresar
Condicionamiento F(r+h):

Las palabras condición y condicionamiento se usan de manera informal para indicar l


(f(r) +h f'(r) +-h 2 f"(�)] + e[g(r) +h g'(r) +-1 h1 g"(r¡)] = O
cuán sensible es la solución de un problema respecto de pequeños cambios relativos en los 2 2
datos de entrada. Un problema está mal condicionado si pequeños cambios en los datos
pueden dar lugar a grandes cambios en las respuestas. Para ciertos tipos de problemas Al descartar los términos en h2 , y utilizar el hecho de quef(r)=O obtenemos
se puede definir un número de condición. Si el número es grande significa que se tiene
g(r) g(r)
un problema mal condicionado. Más adelante veremos ejemplos de esto, y aquí sólo h �-e �-e
presentaremos un ejemplo elemental. f'(r)+eg'(r) f'(r)
Suponga que nuestro problema consiste simplemente en evaluar una función! en
el punto x. Nos preguntamos: si se perturba lig eramente a x, ¿cuál es el efecto sobre Para ilustrar este análisis consideremos un ejemplo clásico de Wilkinson. Sea
f (x)? Si la pregunta se refiere a los errores absolutos, podemos recurrir al teorema del 20
valor medio y escribir: f(x)=IT(x-k)=(x- l)(x-2) ... (x-20)
k=l
f(x +h) -f(x) = f'@h � hf'(x) g(x) = x2º

Así, sif'(x) no es muy grande, el efecto de la perturbación sobref(x) es pequeño. Sin Obviamente las raíces def son los enteros 1, 2,... 20. ¿Cómo se altera la raíz r = 20
embargo, usualmente en estas cuestiones es el error relativo el que resulta significativo. cuandof se perturba af +i:g? La respuesta es
Al perturbar x en una cantidad h tenemos que h/ x es el tamaño relativo de la perturbación.
Igualmente, cuando se perturba a f(x) y se obtiene f(x +h), el tamaño relativo de la g(20) 20 20
perturbación es h � -i:-- = -i:- �-elO9
!'(20) 19!
f(x+ h)- f(x) � hf'(x) = [xf'(x)] (�)
f(x) f(x) f(x) x Por tanto, un cambio de magnitud e en el coeficiente de x20 de f(x) puede provocar
una perturbación de la raíz 20 del orden de 109 e. Por consiguiente las raíces de este
por consiguiente, el factor xf'(x)/f(x) sirve como un número de condición para el polinomio son sensibles en grado sumo a las perturbaciones en los coeficientes. (Véase
problema. el problema 15.)
Otro tipo de número de condición aparece asociado c�n la solución de sistemas
Ejemplo ¿Cúal es el número de condición para la evaluación ·de la función arco seno? lineales de la forma Ax=b; esto se discutirá con detalle en la sección 4.4. De manera
54 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 55

breve, el número de condición de la matriz A se denota con K(A) y se define como el SERIE DE PROBLEMAS 2.3
producto de las magnitudes de A y su inversa; es decir, l. Encuentre la solución analítica de esta ecuación en diferencias con los valores iniciales dados:

K(A) = IIAll · IIA- 1 11. XQ = 1 X¡ = 0.9 Xn+I = -0.2xn+0. 99Xn-1·


Sin calcular recursivamente la solución, prediga si el cálculo será estable o inestable.
donde 11 · II es una norma matricial. Si la solución de Ax = bes poco sensible a cambios <2 . Las sucesiones [A.] y [B.] se generan de la siguiente fonna:
pequeños en el lado derecho b, entonces pequeñas perturbaciones en b sólo ocasionarán
leves perturbaciones en los cálculos de las soluciones de x. En este caso se dice que .Ao = O A1 = 1 An = nAn-1+An-2
A está bien condicionada. Esta situación corresponde al caso en que la magnitud del Bo = 1 B1 = 1 Bn = n Bn- 1+Bn-2·
número de condición (A) es muy modesta. Por otra parte, si el número de condición
es grande, entonces A está mal condicionada y cualquier solución numérica de Ax =b ¿Cuál es el lím.- ( A./B.)?
00

debe considerarse con un alto grado de escepticismo. <3_ Las funciones de Bessel Y. satisfacen la misma fónnula de recurrencia que las funciones J•.
La matriz de Hilbert de orden n, Hn = (hij ), se define por hij =1/(i+j - 1) , (Véase la Sec. 1.3.) Sin embargo, utilizan distintos valores iniciales. Parax = 1 éstos son:
donde 1 � i � n y 1 � j � n. Esta matriz se utiliza con frecuencia para llevar a cabo
Yo = O.08825 69642 f¡(l) = -0. 78121 2 821 3
comprobaciones, debido a su naturaleza mal condicionada. De hecho, K(Hn ) aumenta
rápidamente con n, como puede apreciarse en la fórmula K(Hn ) = ce35". Este número Calcule Y2(l), Yi(l), ... , Y20(1) usando la fónnula de recurrencia. Trate de decidir si los
de condición se ha calculado utilizando la norma IIAII = máx.i,j lal Un problema de resultados son o no confiables.
prueba interesante consiste en resolver el sistema linealHnx = ben una computadora con 4 . Las integrales exponenciales son las funciones E n definidas por
valores crecientes den y con b; = I::7=1 hij· La solución deberá ser x = (1, 1, ... , 1)7:
Para valores pequeños den la solución calculada es muy exacta, pero conformen aumenta
la precisión se deteriora rápidamente. De hecho, cuando n es aproximadamente igual
E,(x) = j00(l't")- 1
dt (n � O,x> O).

al número de lugares decimales que maneja la computadora, probablemente la solución


numérica no incluya cifras significativas. Estas cuestiones se estudiarán con mayor Estas funciones satisfacen la ecuación
detalle en el capítulo 4. nEn+1(x) = e-x - xE.(x).
La matriz de Hilbert surge en la aproximación de mínimos cuadrados cuando in­
tentamos minimizar la expresión Si se conoce E1(x), ¿puede utilizarse esta ecuación para calcular con exactitud E2(x),
Ei(x), ... ?
¡1 [ n 2 5. El número de condición de la funciónf(x) = x� es independiente de x. ¿Cuál es?
(x)] d:x
Jo �aj.,/ -f 6. ¿Cuáles son los números de condición de las siguientes funciones? ¿Dónde alcanzan un
valor grande?
(a) (x - Il ( c) senx (e) x-ie'
Al derivar esta expresión respecto de a; e igualar el resultado a cero , obtenemos las ( b) lnx (f) cos- 1 x
(d) e'
ecuaciones normales,
7. Considere el ejemplo del texto para el cual Yn+I = e - (n + l)y•. 1.Cuántos decimales de

t
j=O
aj [ xiJ d:x =[ xi¡'(x) d:x
O O
(O� i � n).
precisión deberán emplearse al calcular y¡, y2, ... , y20, si deseamos que y20 sea exacta hasta
5 decimales?
8 . Existe una función! de la forma

Ya que la integral de la izquierda es f(x) = ax 12+px ll


para la cual f(O. l) = 6.06 x 10- 13 y f(0.9) = 0.03577. Determine a. y p, y evalúe la
x +j+I 1
i 1 sensibilidad de estos parámetros respecto de pequeños cambios en los valores def.
1=
i+j+l 0 i+j+l 9. Demuestre que la relación de recurrencia

la matriz de coeficientes en las ecuaciones normales es la matriz de Hilbert de orden Xn = 2xn-1 + Xn-2
n+ l. Las funciones x -,. xi forman una base muy mal condicionada del espacio de tiene una solución general de la forma
polinomios de grado n. Una buena base para este problema puede ser proporcionada por
un conjunto ortogonal de polinomios. Esto se estudiará en la sección 6.8. Xn= A7'."+Bµ"
56 Capítulo 2 Aritmética de la computadora 2.3 Cálculos estables e inestables; condicionamiento 57

¿Es esta relación de recurrencia una buena forma de calcular x. a partir de cualesquiera Use una rutina que sea capaz de calcular raíces complejas con doble precisión. La expresión
valores iniciales xo y xi? dada para P es la forma desarrollada del polinomio de Wilkinson discutido en el texto:
10. La sucesión de Fibonacci se genera mediante las fórmulas
p(x) = (x - 20)(.x - 19)(.x - 18)(.x - 17)(.x - 16)(.x - 15)(.x - 14)
ro= J r¡ = J Tn+I = Tn+rn-1,
x (x - 13)(x - 12)(.x - l l)(x - IO)(x - 9)(x - 8)(x - 7)
de modo que la sucesión inicia como 1, 1, 2, 3, 5, 8, 13, 21, 34, .... Demuestre que la x (x - 6)(x - 5)(x - 4)(x - 3)(x - 2)(x - 1).
sucesión [2rn /rn-i] converge a 1 + Js. ¿La convergencia es lineal, superlineal, cuadrática?
11. (Continuación) Si la relación de recurrencia en el problema anterior se usa con valores Verifique las raíces calculadas Zk, con k = 1, 2, ... , 20, mediante el cálculo de fP(Z1c)f,
iniciales ro = I y r1 = (1 - Js)/2, ¿cuál es en teoría el valor correcto de rn (n f; fp(Z1c)f, Y IZic - kf. Explique su respuesta.
2)? ¿Proporcionará dicha relación de recurrencia una manera estable de calcular r. en este (b) Repita el apartado (a) ocho veces después de cambiar el coeficiente de x2º de P(x) por
caso? 1 + e, donde e = 10-21< para k = 8, 7, ... , l. ¿Coinciden sus resultados de computadora
'12. (Dahlquist) Se define con el análisis presentado en el texto? Explique la respuesta.
¡
Xn = ¡ t"(t+5)-I dt. (c) Wtlkinson demostró que al cambiar el coeficiente -210 por -210 - Z-23 las raíces 16
y 17 se transforman en el par complejo 16.73 ...± i2.8I2 .... Reproduzca este experimento
numérico.
Demuestre que xo = In 1.2 y que Xn = n-1 - 5xn-I paran= 1, 2, .... Calcule xo, X¡, ... ,
x10 utilizando esta fórmula de recurrencia y dé una estimación de la precisión de x10. Nota Cultural A finales de la década de los cuarenta, Jim Wilkinson era un joven científico
'13. (Continuación) Encuentre una manera de calcular con exactitud xzo, quizá reemplazando el que trabajaba con Alan Turing y otros en el National Physical Laboratory en Inglaterra.
integrando por una serie de Taylor truncada. Después de calcular xzo con toda la precisión El proyecto que interesaba a este grupo era una nueva máquina llamada la computadora
Pilot ACE. Con el fin de hacer una prueba de rutina en la máquina, escribió un programa
que puede aportar la máquina, use la recursión hacia atrás para obtener X19, x1s, ... , xo. ¿Es
correcto el valor de xo? ¿Qué se puede decir respecto de las otras Xn ? ¿Se comporta de sirviéndose del método de Newton para calcular las raíces de este polinomio. Sin esperar
manera distinta la relación recursiva cuando se emplea en forma regresiva? Si así sucede, que apareciera algún tipo de dificultades, inició la iteración de Newton conxo = 21 y supuso
explique por qué. que habría una convergencia rápida hacia la raíz más grande, en este caso 20. Al suceder que
los resultados numéricos no eran los esperados, se dedicó a investigar un poco más este
'14. Si se usa unan descendente las funciones de Bessello(x), 11 (x), ... pueden calcularse usando asunto. A la larga, éste y otros experimentos numéricos lo llevaron a desarrollar un área
la relación de recurrencia de la sección 1.3. Así, iniciamos con n = N y procedemos completamente nueva de la matemática numérica: el análisis regresivo del error. Para más
regresivamente con la fórmula detalles sobre el trabajo de James Hardy Wilkinson se puede consultar la obra Biographical
2n Memoirs of Fellows of the Royal Society, de L. Fox (1987].
ln-1 (x) = -Jn(x) -ln+I (x) (n = N, N - 1, ... , 1)
Para empezar establecemos lN+I (x) = O y lN (x) = l . Éstos son valores aproximados.
Después de calcular IN-1 (x), lN-z(x), ... , lo(;c), los multiplicamos por un factor (es decir,
reemplazamos In por V.) usando la identidad

¿ I.(x) = l .
00

lo(x)2 + 2 2

n=l
Obviamente N debe ser suficientemente grande como para que el valor supuesto para
lN+i(x) = O sea razonable para la precisión esperada. Esta técnica la desarrolló J. C. P.
Miller. Tomando N = 51 en el proceso descrito anteriormente calcule 10(1), 11 (1), ...,
lso(I).
'15. (El Polinomio Pérfido, Wilkinson (1984])
(a) Usando una subrutina para encontrar raíces, tomada de la biblioteca de programas de su
centro de cálculo, calcule las 20 raíces del polinomio P, donde:
19 18 17 16
P(x) = x2° - 210x + 20615x - !256850x + 53327946x
15 14 13
- 1672280820x + 40171771630x - 756111184500x
12
+ 11310276995381x - 135585182899530x 11

+ 1307535010540395x 10 - 10142299865511450x9
+ 63030812099294896x8 - 311333643161390640x7
+ 1206647803780373360x6 - 3599979517947607200.x5
4
+ 803781182264505!776x - 12870931245150988800x3
+ 13803759753640704000x2 - 8752948036761600000x
+ 2432902008176640000.
Capítulo 3

SOLUCIÓN DE ECUACIONES NO LINEALES

3.1 Método de la bisección ·


3.2 Método de Newton
3.3 Método de la secante
*3.4 Puntos fijos e iteración funcional
*3.5 Cálculo de ceros de polinomios
*3.6 Homotopía y métodos de continuación

Este capítulo se ocupa del problema de determinar raíces de ecuaciones ( o ceros de


funciones). Es un problema que aparece con frecuencia en el trabajo científico. Por
ejemplo, en la teoría de la difracción de la luz necesitamos las raíces de la ecuación

x-tanx = O

En el cálculo de las órbitas planetarias necesitamos las raíces de la ecuación de Kepler

x-asenx=b

para varios valores de a y b.


El problema general, planteado en el caso más sencillo de una función definida
en los números reales y cuya imagen está en el conjunto de los reales, es el siguiente:
dada una función f: IR --> IR, encontrar los valores de x para los cuales f (x) = O. A
continuación consideraremos varios de los procedimientos estándar para resolver este
problema.

3.1 Método de bisección

Sif es una función continua sobre el intervalo [a, b] y sif(a)f(b) < O, entonces! debe
( , b). Dado que f(a)f(b) < O, la función f cambia de signo en el
tener un cero en a
intervalo [a, b] y, por lo tanto, tiene por lo menos un cero en el intervalo. Ésta es una
consecuencia del teorema del valor intermedio para funciones continuas, que establece
que sif es continua en [a, b], y se satisface la desigualdadf(a) < y < f(b), entonces
f(x) = y para algún x E (a, b).
El método de bisección explota esta idea de la siguiente manera: síf(a)f(b) < O,
entonces calculamos e = !(a+ b) y averiguamos sif(a)f(c) < O. Si lo es, entonces f
tiene un cero en [a, e]. A continuación rebautizamos a e como by comenzamos una vez
más con el nuevo intervalo [a, b], cuya longitud es igual a la mitad del intervalo original.

59
3.1 Método de bisección 61
60 Capítulo 3 Solución de ecuaciones no lineales

Sif(a)f(c) > O entoncesf(c)f(b) < O, y en este caso rebautizamos a c como a. En ambos Cuando se usó el algoritmo de la bisección en una computadora similar a la MARC-32 se
casos se ha generado un nuevo intervalo que contiene un cero de f, y el proceso puede obtuvo la siguiente lista de datos de salida, empezando con el intervalo [-4, -3]:
repetirse. Claro está que sif(a)/(c) = O, entoncesf(c) = O y con ello se ha encontrado k c f(c)
un cero. Sin embargo, debido a los errores de redondeo, es poco factible que en la 1 -3.5000 -0.321
computadoraf(c) sea cero. Así, el criterio para concluir no deberá depender de que 2 -3.2500 -0.694 X 10-l
f(c) = O. Se debe permitir una tolerancia razonable, tal como \f(c)\ < 10-s en la MARC- 3 -3.1250 0.605 X 10-l
32. (Para una descripción de la computadora hipotética MARC-32 puede consultarse
la sección 2.1.) La figura 3.1 muestra los dos casos, suponiendo queJ(a) > O > J(b). La
ilustración hace patente por qué el método de bisección encuentra un cero, mas no todos, 14 -3.1830 0.193 X 10-4
en el intervalo [a, b]. El método de la bisección también se conoce como método de la 15 -3.1831 -0.124 X 10-4
bipartición. 16 -3.1831 0.345 X 10-5 11111

Algoritmo de la bisec ción


El algoritmo de la bisección se puede escribir de la manera siguiente:
b
1 input a, b, M, o, e
Í '\, , /1\ 11/\
I\ 1 I\ 1 •x
u+-f(a)
a
V+-f(b)
C+-b-a
<O output a, b, u, v
f(a)f(c)
if signo (u) = signo (v) then stop
f(x) for k = 1, 2, . . . , M do
f(b)
e+-e/2
c+-a +e
Figura 3.l(a) El método de la bisección elige el subintervalo izquierdo. w +- f(c)
output k, c, w, e
if Jel < o or \wl < e then stop
if signo ( w) ;1: signo (u) then
f(a) b +- e
V+-W
else
----&---------+--..,..,--+-'<c-r--t--<�----x a+-c
a e b U+-W
endif
end.
f(c)f(b) < O

Varias de las partes de este seudocódigo necesitan una explicación adicional. En pri­
f(b)
f(x) mer lugar, el punto medio c se calcula comoc <- a+(b-a)/2, en lugar de c +- (a+b)/2.
Al hacerlo así se sigue la estrategia general de que, al efectuar cálculos numéricos, es
mejor calcular una cantidad añadiendo un pequeño término de corrección a una apro­
Figura 3.l(b) El método de la bisección elige el subintervalo derecho. ximación obtenida previamente. Forsythe, Malcolm y Moler [1977, pág. 162] dan un
ejemplo en el que el punto medio c, calculado mediante (a+ b)/2 en una computadora
con precisión limitada ¡se sale def intervalo [a, b]! En segundo lugar, es mejor determi­
Ejemplo 1 Use el método de la bisección para encontrar la raíz más cercana a O de la ecuación nar si la función cambia de signo en el intervalo recurriendo a que signo(w) ;1: signo(u),
i' = senx en lugar de utilizar que wu < O, ya que esta última requiere de una multiplicación in­
Respuesta Si se esbozan las gráficas de i' y sen x, resulta evidente que no existen raíces positivas de necesaria. Por otra parte, e corresponde al cálculo de la cota del error que se establece
f(x) = i' - senx y que la primera raíz a la izquierda del O está en el intervalo [-4, -3]. en el teorema que se verá más adelante. Finalmente hay que darse cuenta de que en el
62 Capítulo 3 Solución de ecuaciones no lineales 3.1 Método de bisección 63

satisfaga. Por ejemplo, considere las dos curvas de la figura 3.2. En el caso (a) la gráfica
f es casi horizontal cerca del cero, lo cual corresponde a una raíz múltiple, y el método de
bisección puede presentar dificultades al determinar este cero con una precisión alta. La
curva (b) obviamente no es continua, pero la continuidad de una función puede resultar
difícil de verificar previami:me. A pesar de que éstos son ejemplos patológicos, optemos
por detener la ejecución del algoritmo cuando cualquiera de los tres criterios se satisfaga.
Esto con el fin de tener un código robusto.
�l':I - l> X

Análisis de errores
Con el objeto de analizar el método de la bisección denotemos con [ao, b0], [a1, b ¡ ],
y así sucesivamente, a los intervalos que surgen en el proceso. Se puede hacer las
\f(c)\ <Epero\b-a\ >li siguientes observaciones sobre estos números:
f
ao � a¡ � a2 � · · · � bo (1)
bo � b1 ;:;; b2 ;:;; · · · ;:;; ao (2)
Figura 3.2(a) Fallo del criterio Jb - aJ < 6. 1
bn+I - ª•+l = (bn - a.) (n � 0).
2
(3)

La sucesión [a.] converge debido a que es creciente y está acotada superiormente.


La sucesión [b.] también converge por razones análogas. Si utilizamos (3) repetidamente
1
encontramos que
f ,¡
1
bn - ª• = r"(bo - ao).
1 Así
1 lím Z-"(bo - ao) = O.
lím bn - lím ª• = n-oo
1 n-oo n-oo
1
Si escribimos
1
- E, 1i ----
1
L::-¿-c tJ/-
__
-- I> X
r = lím ª• = lím bn
n-+oo n-+co

a \b entonces, tomando el límite en la desigualdad O � f(a.)f(b.), obtenemos que O �


1
1 [f(r)]2, y por lo tanto, que f(r) = O.
1 Supóngase que en cierta etapa del proceso se ha definido el intervalo [a., b.]. Si se
1
1 detiene el proceso en ese momento, la raíz se encontrará ciertamente en este intervalo.
1 En esta etapa la mejor estimación para la raíz no es niª• ni bn , sino el punto medio del
1
1
\b - a\ < lipero\f(c)\ > E intervalo:
1 Cn = (an + bn)/2
1
El error se acota de la siguiente forma:
Figura 3.2(b) Fallo del criterio [f(c)[ < e.
[r - c. [ � �lbn - a. [ � r<n+l)(bo - ao).

algoritmo participan tres criterios para detener la ejecución del algoritmo. Primero, M Resumiendo lo anterior tenemos el siguiente teorema acerca del método de la bisección.
señala el máximo número de pasos que permitirá el usuario. Siempre se debe contar con
este tipo de resguardo para reducir la posibilidad de que el proceso de cálculo caiga en TEOREMA Si [ao, bo], [a¡, b ¡ ], ... , [an , bn], ... , denotan los intervalos en el método de la bisección,
un ciclo (loop, en inglés), infinito. Por otra parte, la ejecución del programa se puede entonces los límites lím....... ª• y lím....... bn existen, son iguales y representan un cero
00 00

detener, ya sea cuando el error es suficientemente pequeño o cuando lo es el valor de def Si r= lím....... Cn y Cn = !(an + bn ), entonces
00

f(c). Los parámetros 6 y e controlan esta situación. Se puede dar ejemplos en los que
se satisface uno de los dos criterios que detienen la ejecución del cálculo sin que el otro se [r - c.[ ;;;; r<n+l)(bo - ao).
64 Capítulo 3 Solución de ecuaciones no lineales 3.2 Método de Newton 65

Ejemplo 2 Supongamos que el método de bisección se inicia con el intervalo [50, 63]. ¿Cuántos 10. Encuentre una raíz positiva de
pasos deben darse para calcular una raíz con una precisión relativa de una parte en 10-12?
x2 - 4x senx+(2 senx)2 = O
Respuesta El requerimiento sobre la precisión relativa significa que
que sea exacta hasta la segunda cifra significativa. Use una calculadora.
Ir - c.1/lrl � 10-12•
I l. Considere el método de bisección y a [1.5, 3.5] como intervalo inicial
Sabemos que r � 50 y por lo tanto basta que se satisfaga la desigualdad (a) ¿Cuál es la longitud del intervalo en el paso n-ésimo?
(b) ¿Cuál es la máxima distancia posible entre la raíz r y el punto medio de este intervalo?
Ir - c.l/50 � 10-12• 12. Aplique el método de la bisección a una función continua para obtener intervalos [a0, bo],
[a1, bt ], y así sucesivamente. Sea r = límn-oo ª•· ¿Cuáles de los siguientes enunciados son
Por el teorema anterior inferimos que la siguiente condición es suficiente: falsos?
(a) ao � a1 � a2 � · · ·
r(n+l) X (13/50) � 10- 12.
(b) Ir- Z- 1(a.+b.)I � T"(bo -ao), (n?; 0)

Despejando n concluimos que n � 37. 111!1


(c) Ir- Z-1(an+t +b.+1)1 � Ir- Z-1 (a.+b.)I, (n?; O)
(d) [a.+1, bn +il e [a•• b.], (n?; 0)
(e) Ir- a.¡= O(Z-") cuando n-+ oo
SERIE DE PROBLEMAS 3.1 (f) Ir- Cnl < Ir- Cn-d, (n?; 1)
l. Sea Cn = !(an +bn ), r = límn-oo c., y e. = r-c•. En este caso [a., b.], con n;;; O, denota
los intervalos sucesivos que genera el método de la bisección cuando se aplica a una función 13. Dé una fórmula que incluya a ao, bo, y a s, y que sirva para calcular el número de pasos
continuaf. que deben tomarse en el método de bisección para asegurar que la raíz está determinada con
precisión relativa � s. Suponga que ao > O.
(a) Demuestre que len ! � Z-"(b1 - a1).
14. ¿Qué sucede en el problema 13 si ao < O < bo?
(b) Demuestre que e. = O(Z-") conforme n --> oo.
(c) ¿Es cierto que leo! ;;; le11 ;;; .. .? Explique su respuesta. 15. Si el método de la bisección se usa (con precisión sencilla) en la MARC-32 iniciando con el
intervalo [128, 129], ¿podemos calcular Jaraíz con una precisión absoluta< 10-6? Responda
(d) Demuestre que len - Cn+1I = z-"- 2 (bo - ao). la misma pregunta pero con respecto a la precisión relativa.
(e) Demuestre que para toda n y m resulta que am � b•.
(f) Demuestre que res el único elemento en n:.i[a., b.J. '16 . Encuentre en su computadora números a y b de manera que los cálculos e +- (a+b)/2 y
e<- a+0.5(b-a) produzcan resultados distintos. En este caso a< b. No escoja un ejemplo
(g) Demuestre que para toda n, [a., b.] :::l [a.+1, b.+tl- en el que haya desbordamiento por exceso o por defecto.
'2. Escriba y someta a prueba el subprograma o procedimiento que ejecuta el algoritmo de la I7. Demuestre que el punto e calculado mediante el método de la bisección es el punto donde
bisección. la línea que pasa por (a, signo(f(a))) y (b, signo(f(b))) interseca el eje de !ax.
3. En el método de la bisección, un intervalo [ª•- h b.-1] se divide por la mitad y se escoge una
de estas mitades para el siguiente intervalo. Defina d. = O si [a., b.] es la mitad izquierda 18. Suponga que la. - bnl � A.n lª•-l - bn -d para toda n con A.n < l. Encuentre una cota
del intervalo [an-t, b. -tl, y d. = 1 si sucede lo contrario. Exprese la raíz determinada por superior para la. - bn l en términos de lao - bol y A.= máx ¡ ;¡;;¡.{A.;}.
el algoritmo en términos de la sucesión d1 , d2, ... . '19. Encuentre una raíz def(x) = x - tanx en el intervalo [I. 2].
4. Utilizando la notación de los problemas 1 y 3 encuentre las fórmulas que relacionan a., b. '20. Encuentre una raíz de
y c., con d•.
5. Dé un ejemplo (o muestre que no existe ninguno) en el que ao < a1 < a2 < · · ·. x8 - 36x7+546x6 - 4 536x5+22449x4 - 67284x3
6 . Dé un ejemplo para el cual ao = a1 < a = a3 < a4 = as < a6 = · · ·. +118124x2 - 109 584x+4 0320 = O
2
7. Utilizando el método de la bisección, ¿existe el límn-oo Ir - c.+tl/lr - c.¡? Explique su
respuesta. en el intervalo [5.5, 6.5]. Cambie -36 por -36.001 y repita el ejercicio.
8. Dé una fórmula que involucre a bo - ao y e para calcular el número de pasos que deben
tomarse en el método de bisección y que garantice que Ir - c.¡< s.
'9 . Verifique el programa del problema 2 con estas funciones e intervalos: 3.2 Método de Newton
(a) x-1 - tanx en [O, 1t/2]
1
(b)x- - 2' en [O, l] El método de Newton es un procedimiento general que se puede aplicar en muy diversas
(c) Z-'+e'+2cosx - 6 en [I. 3] situaciones. Cuando se emplea para localizar los ceros de una función real de variable
(d) (x3+4x2+3x+5)/(2x3 - 9x2+18x - 2) en [O, 4 ]. real, se suele llamar iteración de Newton-Raphson.
Capítulo 3 Solución de ecuaciones no lineales
3.2 Método de Newton 67
66

Al igual que en la sección 3.1, nos encontramos frente a una función! cuyos ceros Solución El algoritmo precedente se ejecutó en una máquina con una mantisa de 48 bits en precisión
se han de determinar numéricamente. Sea r un cero def y sea x una aproximación ar. simple. (Los números de máquina de doble precisión tienen 96 bits, lo que corresponde
Sif" existe y es continua, por el teorema de Taylor sabemos que: aproximadamente a 28 cifras decimales.) La funciónf'(x) = e' - (1 +x2)-1, al igual
quef debieron programarse. Se eligió como punto inicial x0 = -7. Los resultados del
programa de cómputo son los siguientes:
O= f(r)= f(x +h)= f(x) +hf'(x) + O(h2),
k X f(x)
donde h= r - x. Si hes pequeña (es decir, x es próximo ar), es razonable ignorar el o - 7.00000000000000000000000000 -.702 X 10-l
término O(h2) y resolver el resto de la ecuación para h . En consecuencia, el resultado es 1 -10.67709617664001399296984386 -.226 X 10-l
h= -f(x)/f'(x). Si x es próximo ar, x-f(x)/f'(x) debería estar aún más próximo ar. 2 -13.27916737563271290859786319 -.437 X 10-2
El método de Newton comienza con una estimación Xo de r a partir de la cual se define 3 -14.05365585426923873474831753 -.239 X 10-3
inductivamente una sucesión de aproximaciones 4 -14.10110995686641347616312706 -.800 X 10-6
5 -14.10126977093941594621579506 -.901 X 10-ll
Xn+l = Xn -
f(Xn)
(n � 0). (1) 6 -14.10126977273996842508300314 -.114 X 10-2o
f'(Xn) 7 -14.10126977273996842531155122 -.000
8 -14.10126977273996842531155122 -.000
Algoritmo de Newton
Los resultados muestran una rápida convergencia de las iteraciones. De hecho, en cada
El siguiente es un algoritmo muy simple que realizaM pasos del método de Newton paso el número de dígitos correctos parece duplicarse. Nuestro análisis revelará por qué
a partir de un valor inicial x: sucede esto. 1!11

inputx, M
Interpretación gráfica
Y,._ f(x)
output O, x, y Antes de someter a examen las bases teóricas del método de Newton, consideremos
for k= 1, 2, . . . , M do su interpretación gráfica. Si tomamos como base su descripción, podemos decir que el
X,._ X - yjf'(X) método de Newton consiste en la linealización de la función. Es decir,! se reemplaza
y,._ f(x) por una función lineal. La manera usual de hacerlo es reemplazarf por los dos primeros
output k, x, y términos de su serie de Taylor. De este modo si
end.
f(x)= f(c) +!'(c)(x - c) + �!"(c)(x - c)2 + · · ·
Un seudocódigo más detallado, que incluye criterios de suspensión de la ejecución, es
el siguiente:
entonces la linealización ( en c) produce la función lineal
inputxo, M, 8, E
v <--- f(xo )
f(x)= f(c) +f'(c)(x - c).
output O, xo, v
if lvl < s then stop
Obsérvese que fes una buena aproximación def en una vecindad de c; de hecho, tenemos
for k= I, 2, . . . , M do
que f(c)= f(c) y f'(c)= f'(c). Así, la función lineal tiene el mismo valor y la misma
X¡,._ xo - v/f'(xo)
V,._ j(X¡) pendiente que la función! en el punto c. De este modo, lo que hacemos en el método
outputk,x1, v de Newton es construir la tangente a la gráfica def en un punto cercano ar, y observar
if x
l 1 -xol < 8 or lvl < s then stop en qué lugar interseca esta línea al eje x. (Véase la Fig. 3.3.)
xo ,._ x1 end. Con esta interpretación gráfica en mente, podemos imaginar con facilidad funcio­
nes y puntos iniciales para los que la iteración de Newton fracasa. En la figura 3.4
Cualquier programa para computadora que se base en alguno de estos algoritmos reque­ mostramos una de estas funciones. En este ejemplo la forma de la curva es tal que
rirá subprogramas o procedimientos para calcularf(x) y f'(x). para ciertos valores iniciales la sucesión [x.] diverge. Lo que todo esto significa es que
cualquier enunciado formal acerca del método de Newton debe contemplar la suposición
Ejemplo 1 Realizando los cálculos con doble precisión, aplique el método de Newton y encuentre
de que xo está suficientemente próximo a un cero, o que la gráfica de f tiene una forma
el cero negativo de la funciónf(x) = e' - 1.5 - tan- 1 x. especial.
68 Capítulo 3 Solución de ecuaciones no lineales 3.2 Método de Newton 69

f(x)
Por el teorema de Taylor sabemos que
1
Línea tangente o= f(r) = f(x.- e.)=f(x.)- e.f'(x.) + ze�f"(�n ),
i(x) = f(x,) + f'(x,) (x - x,) donde �. es un número entre Xn y r. De esta ecuación resulta que

e.J'(x.)-f(x.) = 1"(�.)e�.
Poniendo esto en la ecuación (2) obtenemos el resultado
/1 "(r) 2
en+! = 21/"(�.) en2 ;::; 2 e = Ce•2.
f'(x.) f'(r) . (3)

Esta ecuación nos dice que en+! es aproximadamente e� multiplicado por una constante.
----�-+-----4-------------X Este envidiable estado de cosas se llama convergencia cuadrática. En muchas aplica­
x, ciones la convergencia cuadrática explica la aparente duplicación de la precisión que se
obtiene con cada iteración del método de Newton.
Aún debemos establecer la convergencia del método. Desde la perspectiva de la
ecuación (3), la idea de la demostración es simple: si en es pequeño y si el factor
Figura 3.3 Interpretación geométrica del método de Newton.
f!"(�.)/f'(x.) no es muy grande, entonces en+! será más pequeño que e•. Definase una
cantidad c(o) que depende de 8 mediante la igualdad
1
c(o) = - máx l!"(x)I/ mín IJ'(x)I (8> O). (4)
-----------=-...-------/(x) 2 lx-r!;;áo !x-r!;;á6

Seleccionemos una 8 suficientemente pequeña para asegurar que el denominador de la


ecuación (4) sea positivo, y disminuyamos 8 en caso de que sea necesario, de modo que
---------�-+-------;¡;,é--------X oc(o) < l. Esto es posible en virtud de que cuando 8 converge a cero, c(o) converge a
flf"(r)l/lf'(r)I, de modo que oc(o) converge a cero. Habiendo precisado 8, hagamos
p = oc(o). Supongamos que comenzamos la iteración de Newton en un puntó x0 que
satisface lxo- rl ;;; o. En tal caso leo 1 ;;; 8 y l�o- rl ;;; o. En consecuencia, por la
definición de c(o), tenemos
/(x)--------

�I!"(�o)/!'(xo)I;;; c(o).
Figura 3.4 Un ejemplo de no convergencia del método de Newton.
De este modo de la ecuación (3) resulta:
lx1- rl = led � e5c(o) = leolleolc(o) � leoloc(o) = leolP < leol � o.
Análisis de errores Esto nos muestra que el siguiente punto, X¡, también está a menos de 8 unidad�s de r.
El argumento se puede repetir, obteniéndose los siguientes resultados:
Vamos ahora a analizar los errores en el método de Newton. Por errores queremos
decir las cantidades le1I;;; pleol
en=Xn- r
le2I;;; Pled ;;; P leol
2

(No tomamos en cuenta errores de redondeo.) Supongamos que/" es continua y que r le3I;;; Piezl;;; P3 leol
es un cero simple def, tal quef(r) =O* J'(r). A partir de la definición del método de
iteración de Newton tenemos que

f(x.) f(x.) enf'(x.)-f(x.) Tenemos, en general,


en+! = Xn+l - r = Xn- f (x.) - r = en- f'(x.) = (2)
' f'(xn ) lenl ;;; P"ieol-
70 Capítulo 3 Solución de ecuaciones no lineales 3.2 Método de Newton 71

Puesto que O ;;; p < 1, tenemos que límn...... pn = O, de modo que lím._,.00 en = O. En
00
Funciones implícitas
resumen, lo que obtenemos es el siguiente teorema acerca del método de Newton. Una aplicación interesante del método de Newton se tiene en la evaluación de
TEOREMA! Sea f" continua y sea r un cero simple de f. Hay una vecindad de r y una constante funciones que se encuentran definidas implícitamente. En la sección 1.2 se examinó
C tales que si el método de Newton se inicia en esa vecindad, los puntos sucesivos se el teorema de la función implícita Éste señala que en ciertas condiciones más bien
hacen cada vez mds cercanos a r y satisfacen generales, una ecuación de la forma G(x, y) = O define a y como una función de x. Si x
ha sido prescrita, la ecuación G(x, y) = O puede resolverse para y recurriendo al método
de Newton. A partir de un punto inicial apropiado yo definimos y1, y2, ..• mediante
\xn+I -r[ ;;; C(xn -r)2 (n � O).
aG
Yn+l = Yn -G(x, Yn)/ (x, Yn).
Hay situaciones en las que se tiene la seguridad de que la iteración de Newton ay
converge a partir de cualquier punto inicial que se elija. Como muestra ofrecemos el
siguiente teorema. Podemos utilizar el método para construiruna tabla de la función y(x). Si la tabla contiene
un registro (X m Yn), y lo que queremos es calcular otro registro cercano (X n+l,Yn+il,
TEOREMA 2 Si f pertenece a la clase C2 (]R), es creciente, convexa y tiene Ún cero, entonces el cero comenzamos la iteración de Newton con (xn+I, Yn). El resultado de la iteración será el
es único y la iteración de Newton convergerá a él a partir de cualquier punto inicial. valor correctoYn+l que satisface la ecuación G(xn+l,Yn+1l = O. Dado que G(xn, Yn) = O y
que X n+l está cercano a X n, es de esperar que G(xn+i, y.) sea pequeño y que unos cuantos
pasos del método de Newton nos darán la corrección pertinente a y. para alcanzar de ese
Demostración Recordemos que una función es convexa si f"(x) > O, para toda x. Puesto que f es modo la igualdad exacta G(xn+l, Yn+1) = O.
creciente, f' > O sobre l., debido a la ecuación ( 3), en+! > O. Así, X n > r para n � l .
Como f e s creciente,f(xn) > f(r) = O. En consecuencia por la ecuación ( 2), en+I < en. Ejemplo 3 Haga una tabla de x versus y, donde y se define como una función implícita de x. Utilice
Así, las sucesiones [en] y [xn l son decrecientes y están acotadas inferiormente ( por O G(x, y) = 3x1 + 2y5 - x3 +y3-3, comenzando en x = O y proceda por incrementos de
y r respectivamente). Por lo tanto, los límites e* = límn......00 e. y x* = lím.......00 X n 0.1 hasta llegar ax = 10.
existen. De la ecuación ( 2) tenemos que e•= e* -f(x*)/f'(x*), de dondef(x*) = O y
x* = r. 1111 Solución Seax = O y y = l. Suponemos que serán suficientes cuatro pasos del método de Newton
para alcanzar la máxima precisión de la máquina. He aquí un posible algoritmo:
Ejemplo 2 Encuentre un método eficiente para calcular raíces cuadradas basándose en el método inputx <-O;y <-1; h <-0.l;M <- IOO;N <-4;
de Newton. output O, x, y, G(x,y)
for i 7 l. 2,...,M do
Solución SeaR > O y x = /R.En este casox es una raíz de la ecuaciónx 2 -R = O. Si aplicamos
<-x+h
el método de Newton (1) a la funciónf(x) = x2 - R, la fórmula de iteración se puede
X
for j = 1, 2,... ,N do
escribir aG
X n+I = 1(x.+R/xn), y ..... y -G(x. y)/ /x, y)
a
end
(Esta fórmula es muy antigua y se atribuye a Heron, un ingeniero y arquitecto griego, output i, x, y, G(x,y)
quien vivió en el periodo que abarca los años 100 a. C. a 100 d.C.) Si por ejemplo end.
queremos calcular vTI e iniciamos con Xo = 4, las aproximaciones sucesivas son las
siguientes, ( dadas en forma redondeada para mostrar sólo los dígitos que son correctos): Tenemos M pasos para la variablex, y en cada uno de ellos hay N iteraciones en el método
de Newton. Un programa que se base en este algoritmo necesitará dos subprogramas o
X¡= 4.12 procedimientos, uno para calcular G(x,y) y el otro para calcular 11 G/ay. (Este último
X2 = 4.123 106 resulta ser independiente de x en este caso.) Dichas funciones son:
X3= 4.123 1056 256 1 77
X4 = 4.123 1056 256 1 7660 5498 2 140 9856. G(x,y) = 3x 7 +2y5 -x 3 +y3-3
8G
y) = i0y4 +3y2.
El valor correspondiente a x4 es correcto hasta la vigésimo octava cifra decimal, pudién­ ay ex.
dose observar la esperada duplicación de los dígitos significativos en estos resultados.
Este método, combinado con una reducción del dominio, se utiliza con frecuencia en las A cóntinuación mostramos algunos valores de la función implícita calculados por medio
subrutinas con que se calculan raíces cuadradas. 11 de este algoritmo:
72 Capítulo 3 Solución de ecuaciones no lineales 3.2 Método de Newton 73

y G( x,y) donde el sistema lineal


[h\k) ]-- _ íf1(x[ ,xr)
X

1.000000 0.00 J ]
kl
o.o
0.1 1.000077 0.00 hik) l/2(x \kl ,Xik))
0.2 1.000612 0.89 X 10-IS
se resuelve por medio de la eliminación gaussiana, un tema que examinaremos en el
capítulo 4. Resolver el sistema jacobiano puede resultar difícil cuando J es casi singular.
2.0 -2.810639 -0.82 X 10-IO Para examinar sistemas más grandes y con más variables no se necesitan ideas nove­
dosas. No obstante, en estas situaciones es muy conveniente disponer de un formalismo
8.0 -19.92635 Ü.56 X 10-9 de matrices y vectores. El sistema de ecuaciones

f;(x¡,Xz ,... ,x. ) = O


9.9 -26.85618 0.12x 10-7 (1 � i � n) (7)
10.0 -27.23685 -0.15 X 10-S
puede expresarse simplemente como
111

Sistemas de ecuaciones no lineales F(X) = O (8)


El método de Newton para sistemas de ecuaciones no lineales sigue la misma
estrategia que se empleó en el caso de una sola ecuación: linealiz.ar y resolver, repitiendo al hacer X= (X¡ ,x2, ... ,x.l y F = lf1,J2 ,. ..J.l. El análogo de la ecuación (6) es
los pasos con la frecuencia que sea necesaria . Ilustremos el caso con un par de ecuaciones
con dos variables: O = F( X +H) � F( X) +F'(X)H,
ÍI(X¡ ,Xz) = Ü
(9)

{ donde H = (h¡ ,h2,... ,hnl y F'(X) es la matriz jacobiana de orden n x n con compo­
fz(x¡ ,X2) = Ü.
(5)
nentes rtf¡/r¡xj. El vector de corrección H se obtiene al resolver el sistema de ecuaciones
En el supuesto de que (x1, x2) es una solución aproximada de (5), calculemos sendas lineales en (9). Teóricamente esto significa que
correcciones h1 y h2 , de modo que (x1 + h1, x2 + h2) sea una mejor aproximación a la
solución. Utilizando sólo términos lineales en el desarrollo de Taylor en dos variables H = -F'(X)-1 F(X), (10)
(véase la Sec. 1.1), tenemos que
aunque en la práctica H se suele determinar a partir de (9) mediante eliminación gaus­
Ü = f¡(X¡ +h1 ,X2 +h2) �J¡(X¡,X2) +h¡- +h2 - siana, soslayando de este modo el costoso cálculo de la matriz inversa en (10). En

{
Bf¡ Bf¡
a X¡ consecuencia de esto, el método de Newton paran ecuaciones no lineales con n varia­
8
aX2
!2
Ü = fz(x¡ +h¡ ,X 2 +hz) � fz(x¡ ,X 2) +h¡ B!z
- +hz-.
bles viene dado por
(6)

X¡ 8 8X z x(k+1) = x(k) H(kl,


+
Las derivadas parciales que aparecen en (6) han de evaluarse en (x1, x 2). La ecuación donde el sistema jacobiano es
(6) está constituida por una pareja de ecuaciones lineales con las que se determinan h1
y h2 . La matriz de coeficientes es la matriz jacobiana de f 1 y fz: F'( X(kl)H(kl = -F(X(kl) ,

x
1 = [ªMax1 of1/a 2]. Con mucha frecuencia resolver sistemas como el que se presenta en (8) es una tarea
8h/ox¡ f)fz/8x2 difícil. La referencia usual en la materia es Ortega y Rheinboldt [1970]. Vea también
Rheinboldt [1974], Ostrowski (1966], Byrne y Hall (1973], Schnabel y Frank (1984],
Para resolver (6) es necesario que J sea no singular. Si esta condición se satisface, la Eaves, Gould, Peitgen y Todd (1983] y Allgower, Glasshoffy Peitgen (1981].
solución es
(X ,X )
= _¡-1 [f ¡ ¡ z ].
[h¡]
hz fz(x¡,xz) SERIE DE PROBLEMAS 3.2
En consecuencia, el método de Newton para dos ecuaciones no lineales en dos variables es 'l. Escriba un programa para máquina computadora que resuelva la ecuación x = tan x por
medio de método de Newton. Encuentre las raíces más cercanas a 4.5 y 7.7.
x(k) h(k)
J = +
J, 2. Encuentre el punto inicial positivo más pequeño para el cual el método de Newton diverge,
(k+ll

[:¡k+l) Ltk) J [�k) usando/(x) = tan- 1 x.


74 Capítulo 3 Solución de ecuaciones no lineales 3.2 Método de Newton 75

3. Aplique el método de Newton af(x) = x2 -q (donde q > O). Demuestre que si x. tiene '17. La ecuación
después del punto decimal k dígitos correctos, entonces x.+1 tendrá después del punto decimal 2x4 +24x3 +61x2-16x+1=O
al menos 2k-1 dígitos correctos, con tal de que q > 0.006 y k � l.
4. Demuestre que si el método de Newton se aplica a una función! para la cualf" es continua tiene dos raíces cerca de O. l. Encuéntrelas por medio del método de Newton.
y f(r) =O"# J'(r), entonces lím._00 e.+ie;;-2 existe y es igual af"(r)/[2J'(r)]. ¿Cómo se 18. Suponga que r es un cero de multiplicidad dos de la función!, de modo quef(r)=f' (r) =
puede utilizar este hecho en un programa para verificar si la convergencia es cuadrática? O "# J"(r). Demuestre que si f" es continua, con el método de Newton debemos tener
5. Encuentre el punto positivo donde la función f(x) = x -2 tan x alcanza su valor mínimo en+1 :::; fe. (convergencia lineal).
calculando los ceros de J' con el método de Newton. 19. Considere una variante del método de Newton, en la que sólo se necesita una derivada, es
6. Método de Steffensen. Considere la fórmula de iteración decir,
Xn +l = Xn -
f(x.)
Xn+l = Xn-f(xn)/g(xn ), f'(xoJ"

donde Encuentre C y s tales que


g(x) = [f(x+f(x))-f(x)]/f(x). en+l = Ce�.
Muestre, bajo hipótesis adecuadas, que converge cuadráticamente. '20. Investigue la sensibilidad de la raíz a las perturbaciones en el término constante en el primer
7. ¿Cuál es el propósito de la siguiente fórmula de iteración? ejemplo de esta sección.
2 l. Demuestre que la iteración de Newton diverge para las siguientes funciones, no importa cuál
Xn+l = 2xn -_x,;y. sea el punto inicial (en los números reales) que se elija:
(a)f(x)=x2+ 1 (b)f(x)=7x4 +3x2+Jt.
Identifíquela como la iteración de Newton para cierta función.
8. Para calcular inversos multiplicativos sin efectuar divisiones, podemos resolver x = I/R en­ 22. ¿Cuáles de las siguientes sucesiones convergen cuadráticamente?
contrando un cero de la función f(x) = x-1 - R. Escriba un pequeño algoritmo para (a) 1/n2 (b) 1;22• (c) 1//ñ (d) 1/e" (e) 1/n".
encontrar 1/R aplicando el método de Newton af, sin recurrir a las operaciones de división
y exponenciación. Para una R positiva, ¿cuáles son los puntos iniciales adecuados? '23. Aplique el método de Newton complejo a la funciónf(z) = z4-l , tomando como puntos
iniciales los puntos de la malla con espaciamiento uniforme de 0.1 que se encuentren en el
9. Defina Xo = O y Xn+t = x.-[(tan x.-1)/ sec x.]. En este caso, ¿cuál es el límn-oo x.?
2
interior del círculo lzl < 2 en el plano complejo. Asigne un mismo color a los puntos de la
Relacione lo anterior con el método de Newton. malla que generen sucesiones convergentes a un mismo cero. Dibuje la malla que resulte de
'10. Escriba un pequeño programa que resuelva la ecuación ello en una terminal de color de una máquina computadora o en un plotter de color.
'24 Programe el algoritmo de Newton en la aritmética de los complejos, y ponga a prueba el
x3 +3x=5x2 +7 programa con las siguientes funciones y puntos iniciales:
(a)f(z)=z2+ 1, z= 3+i
por el método de Newton. Efectúe diez iteraciones comenzando en Xo =5.
(b)f(z)=z+sen z-3, z=2-i
1 l. Efectúe cuatro iteraciones del método de Newton para el polinomio
(c)f(z)=z4+z2 +2+3i, z=L
3 2
p(x)=4x -2x +3 '25. Escriba y ensaye un programa para calcular las diez primeras raíces de la ecuación tanx=x.
(Esto es mucho más difícil que el problema l.) Nota cultural: Si 1.. 1 , 1.. , .. . son todas las
empezando en Xo =-l. Use una calculadora 2
raíces positivas de esta ecuación, entonces I;i..;;-2 = 1/10. (Véase Amer. Math. Monthly,
12. Si el método de Newton se aplica af(x) =x3 -2 comenzando en xo = !, ¿cuál es el valor Oct. 1986, p. 660.)
de x2? '26. Programe y ensaye el método de Steffensen (Prob. 6) utilizando las funciones de los proble­
13. Diseñe una fórmula de iteración de Newton para calcular {/R., donde R > O. Realice un mas 1 y 10.
análisis gráfico de la funciónf(x) para determinar cuáles son los puntos iniciales para los
que la iteración converge. 27. Encuentre las condiciones que debemos exigir a a. para asegurar que la iteración
14. Diseñe un algoritmo de Newton para calcular la raíz quinta de cualquier número real positivo. Xn+l = Xn -a.f(x.)
15. La funciónf(x) =x + 1 tiene ceros en el plano complejo en x = ± i. ¿Hay algún punto
2

inicial real a partir del cual la iteración del método de Newton complejo converja a alguno convergerá linealmente a un cero def si el punto inicial está próximo a dicho cero.
de estos ceros? Responda la misma pregunta respecto de los puntos iniciales complejos.
28. Demuestre que si r es un cero de multiplicidad k de la función f. la convergecia cuadrática
16. Si el método de Newton se aplica a la funciónf(x) = x2-I y xo = 10 10 , ¿cuántos pasos de la iteración de Newton se restablece con la siguiente modificación:
se requerirán para obtener una raíz con una precisión de 10-8? (Encuentre la respuesta
analíticamente, no experimentalmente.) Xn+l = Xn -kf(xn)/J' (x.).
76 Capítulo 3 Solución de ecuaciones no lineales 3.3 Método de la secante 77

29. (Continuación) Cuando se está utilizando el método de Newton, ¿cómo pueden detectarse 3.3 Método de la secante
los ceros múltiples al examinar el comportamiento de los puntos (x.,f(x.))?
'30. El polinomio p(x)=x3+94x2- 389x+294 tiene ceros 1, 3 y -98. El punto.ro= 2 debería Recordemos que la iteración de Newton se define mediante la expresión
ser en este caso un buen punto inicial para calcular cualquiera de los ceros pequeños por
medio de la iteración de Newton. Haga los cálculos y explique lo que sucede. Xn+I = Xn - f(xn ) . (1)
f'(xn)
'31. Desarrolle cinco iteraciones del método de Newton complejo aplicándolo a la función com­
plejaf(z)= l +z2+e', tomando como valor inicial zo=-1 +4i. Una de las desventajas del método de Newton es que utiliza la derivada de la función
cuyo cero se busca. Para superar esta dificultad se han propuesto una serie de métodos.
'32. Encuentre los cuatro primeros ceros de la funciónf(z) = 1 +i +e' ordenados en forma Por ejemplo, la iteración de Steffensen (Prob. 6 de la Sec. 3.2)
creciente de acuerdo a sus módulos. ¿Cómo sabe el lector que se trata de los cuatro primeros
ceros y que no ha omitido alguno? [f(x.)]2
Xn+I = Xn - __..c.____
'33. Efectúe cinco iteraciones del método de Newton (para dos funciones no lineales con dos f(x. +f(x.))-f(x.)
variables) para el sistema siguiente: nos da una manera de atacar el problema. Otra medida consiste en reemplazar f' (x) en
la ecuación (1) por un cociente de diferencias como el siguiente:
f1 (x,y)=1+i - l+e' cosy
{h(x,y)= 2xy+l seny. f(x.)-f(Xn-1)
!' (xn ) � . (2)
Xn - Xn-1
Utilice como valores iniciales xo = -1 y yo = 4. ¿Está relacionado este problema con el La aproximación dada por (2) tiene su origen en la definición de f' en ténninos de un
problema 31 y tienen ambos un comportamiento numérico similar? Explique.
límite, a saber:
' ím f(x)-f(u)_
J (x) = l
'34. Use el método de Newton para encontrar una raíz del sistema no lineal
U-+X X -U

4/+4y+52x=19 Cuando se ha llevado a cabo tal sustitución, el algoritmo resultante se conoce como
método de la secante. Su expresión es
r_
{ 169x2+3/+ l l lx- lOy=10.
Xn - Xn-1
Xn+I = Xn -f(xn ) ] (n � 1) (3)
35. El método de Halley para resolver la ecuaciónf(x)=O hace uso de la fórmula de iteración l](x.)-f(Xn-1

Xn+I
u:
= Xn - if;)2 -jJ;'
Ya que el cálculo de Xn+I requiere conocer x. y Xn-1 , se debe dar al principio los valores
de dos puntos iniciales. Sin embargo, cada Xn+I requiere sólo una nueva evaluación de
/2
f (El algoritmo de Steffensen necesita dos evaluaciones def para cada nueva Xn+I ·)
dondefn=f(x.) y así sucesivamente. Demuestre que esta fórmula es el resultado de aplicar La interpretación gráfica del método de la secante es similar a la del método de
la iteración de Newton a la función!//f. Newton. La línea tangente a la curva se reemplaza por una línea secante. (Véase la
Fig. 3.5.)
36. Comenzando en (0, O, 1), efectúe una iteración del método de Newton para sistemas no
lineales con el sistema Ejemplo Utilice el método de la secante para encontrar un cero de la función
xy- z2=1
f(x) = x3 - senh x + 4x + 6x + 9.
2
{ xyz- i +l=2
e'-e!+z=3. Respuesta Una gráfica aproximada sugiere que hay un cero entre 7 y 8. Tomamos estos puntos
como xo y x1 en el algoritmo. Cuando se ejecutó este código en una máquina similar a
Explique los resultados. la MARC-32, se obtuvieron los siguientes resultados.
37. Efectúe dos iteraciones del método de Newton con los siguientes sistemas: rt Xn f(x.)
(a) Comenzando en (0, 1)
{
4xf-xi=O
O . 7.00000 0.417 X 102
l 8.00000 -0.665 X 103
4x1xi-x1 = l. 2 7.05895 0.208 X 102
3 7.11764 -0.183 X 10 1
(b) Comenzando en (l. 1) 4 7.11289 0.710 X 10-l
xy2+iy+x4 = 3 5 7.11306 0.244 X 10-3
{
x2=-2. 0.610 X 10-4•
3 5 S
x y -2xy- 6 7.11306 11111
78 Capítulo 3 Solución de ecuaciones no lineales 3.3 Método de la secante 79

válido que lf(Xn+i)I ;;; IJ(x.)!. Con esto se tiene plena seguridad de que el valor absoluto
de la función es no-creciente.
f(x)

Análisis de errores
Procedemos ahora a presentar el análisis de errores asociado al método de la secante.
A partir de la definición del método de la secante (3) , tenemos que, con n = Xn-r: e

f(x.)Xn-1-f(xn_ ¡)xn
en+! = Xn+l-r= f(xn )-f(Xn-1)
-r

_ f(xn )en-1-f(Xn-1)
- f )-f
e
n
____...,�----f----4>-----+-----__.,.x (xn (Xn-1)
Factorizando el término enen-1 e insertando (xn-Xn-1)/(xn-Xn-1) obtenemos:

Xn-Xn-1 f(xn )/en-f(Xn-1)/en-1


n+] = b(Xn)-f(Xn-1)] [ ] nen-1•
Figura 3.5 Interpretación geométrica del método de la secante. Xn-Xn-1
(4)
e e

Por el Teorema de Taylor,


1
Algoritmo de la secante
f(xn ) = f(r + en )= f(r) + e,J'(r) + e�"(r) + O( �).
Un algoritmo para el método de la secante puede escribirse como sigue: 2
e

input a, b, M, i5, e Dado quef(r)= O sucede que


u.-f(a)
V+-f(b) f(x.)/ n = J'(r) + �e,J"(r) + O( ;).
e e

output O, a, u
Cambiando el índice a n- 1 se obtiene:
output 1, b, v
for k= 2, 3, ..., M do f(xn_¡)/en-1= J '(r) + �en-tf"(r) + O(e�_1).
if lul < lvl then
a+-+b Haciendo una sustracción entre estas expresiones incluimos que:
U+-+V
f(xn ) /en-j(Xn-1) /en-1= ( n- n-1)!"(r) + O( 2n _1).
1
endif 2
e e e

s+- (b - a)/(v - u) Dado que x.-Xn-1= en- n-1, resulta que


e

a+-b
f(xn )/en-J(Xn-1)/ en-l
U+-V � �2f"(r).
b+-b-vs Xn-Xn-1
V+-f(b) La primera expresión entre paréntesis en la ecuación (4) se puede escribir como
Xn-Xn-1
output k, b, v
if !vi < e o lb-al < i5 then stop �f
f (xn )-f(Xn-1) '(r)'
end.
Por ende hemos demostrado que
Dese cuenta de que en el seudocódigo los puntos extremos de [a, b] pueden inter­
cambiarse para lograr que lf(b)I ;;; IJ(a)I se satisfaga. Así, para el intervalo [xn , Xn -il n+l
If"(r)
en n-1= Cen n-!·

se satisface que lf(x.)I ;;; lf(Xn-i)I, y para el siguiente intervalo [Xn+l• x.] también es 2. f'(r)
e e e (5)
3.3 Método de la secante 81
80 Capítulo 3 Solución de ecuaciones no lineales

Esta ecuación es similar a la que apareció en el análisis del método de Newton, velocidad se enc uentra directamente relacionada con los costos. Para algunos problemas
es decir, la ecuación (3) de la sección 3.2. Para encontrar el orden de convergencia del de cálc ulo intensivo (tales como la solución numérica de ecuaciones en derivadas par­
método de la secante postulamos la sig uiente relación asintótica: ciales),la ve locidad es la consideració n más importante. En cambio, en lo que se refiere
al software de propósito general que se utilizará por una amplia gama de usuarios, la
ª confiabilidad y la robustez son las características deseadas. Se dice que un algoritmo o
len+ d "'Alenl . (6)
subprograma es robusto si es capaz de enfrentarse a una amplia variedad de situacio nes
en--+ co e implica una numéricas distintas sin la intervenció n del usuario. A lo largo de m uchos años se ha n
Esto significa que el cociente len+1l/(Alen J ) tiende a 1 conform
ª
hecho esfuerzos extraordinarios para generar paquetes matemáticos de uso general que
convergencia de orden a.. Por lo tanto
posean ambos atributos. Dos buenos ejemplos de tales paquetes son las colecciones
1 1ª
len l "'Ale n-11 Y len-11 "'(A - len l) / . IMSL [1990] y NAG [1990].
ª (7)
En todas las labores de cálculo científico se recomienda el uso de los paquetes de
muestran en las relaciones
Sustituimos en la ecuación (5) los valores asintóticos que se software existentes en el mercado, en lugar de los programas que uno mismo elabora,
(6) y (7). El resultado es excepto en algunas aplicaciones especiales. Para el problema de encontrar raíces el mejor
1ª 1ª software disponible resulta complicado, ya que debe incluir varios procedimientos que
ª
Alenl "'CJenW / lenl 1 . permitan asegurar tanto la convergencia global como la convergencia local rápida. Estos
objetivos en ocasiones entra n en conflicto, como ya se mencionó anteriormente.
Esto se p uede escribir como
1 1 i l-a+l/ll.
A1+ /ac- ,.., e (8)
SERIE DE PROBLEMAS 3.3
Dado que el lado izquierdo de esta relación es una co nstante distinta de cero mientras l. Deduzca la ecuación (4).
que en --+ O, concluimos que 1 - a.+ 1/a. = O, o que a. = ( l + v'S)/2 � 1.62. Por lo 2. En el método de la secante demuestre que si Xn -> q conforme n -> oo y si f (q) 1' O,
tanto, la razó n de convergencia del método de la secante es superlineal (es decir, mejor entonces q es un cero def
que li neal). Podemos ahora determinar A, dado que el lado derecho de la relación (8) es
c3_ Escriba un subprograma que ejecute el método de la secante en una función!, suponiendo
l. Así, usando la ecuación 1+ 1/a. = a., obtenemos que los dos puntos iniciales están dados. Verifique la rutina con estas funciones:
[!"( ) 10.62 (a) sen(x/2) - 1 (b) e' - tanx (c) x3 - I2x2 +3x + l.
1 1 al el a = ca-1= co.62= _,_
A= c /0+ / = / 2f'(r) 4. Usando los desarrollos de Taylor para f(x+h) y f(x +k) deduzca la siguiente aproximación
def(x):
ente, que
Con dicho valor para A el método de la secante nos dice, finalm J' (X) ;:; k f(x +h)- h f(x +k) +(h - k )f(x)
2 2 2 2

(k-h)kh
len+ d � Alen l(l vS)/2.
+
c5_ Programe y verifique un refinamiento del método de la secante que utilice el valor aproximado
Ya que (1+v'S)/2 � 1.62 < 2, la rapidez de convergencia del método de la secante no es def (x) dado en el problema anterior. Esto es, use esta aproximación para/ (x) en la fórmula
para el método de Newton. Se necesitan tres puntos iniciales. Los dos primeros pueden ser
tan buena como la del método de Newton, pero sí mejor que la del método de bisección . arbitrarios, y el tercero se puede obtener mediante el método de la secante.
Sin embargo, cada paso del método de la secante requiere sólo una nueva evaluación de
fu nció n, en tanto que cada paso del método de Newton necesita dos evaluaciones, las 6. Si se utiliza el mét<>do de la secante en la funciónf(x)=x2- 2, c�n xo=O y xi = 1,¿cuál
es el valor de x2?
de f(x) y f'(x). Ya que para estos algoritmos la evaluación de fu ncio nes constituye la
principal carga computacional, un par de pasos en el método de la secante es comparable 7. ¿Cuánto vale x2 si.xo= l,x1 =2,f(xo) = 2,yf(xi)= 1.5 en una aplicación del método de
a un paso en el método de Newton. Para dos pasos en el método de la secante tenemos que la secante?·
<s. Escriba subprogramas para ejecutar el método de la bisección, el método de Newton y el
ª2
ª 1+1X
len+2I "'Alen+1I "'A len l = A1+1llei3+v5)/Z. método de la secante. Deberán funcionar con una función arbitraria F. En cada caso, la se­
cuencia de llamada que se utiliza debe incluir un parámetro M que indique el máximo número
a del método de Newton, de pasos que permitirá el usuario. Éste deberá ser capaz de establecer la precisión deseada
Esto es co nsiderablemente mejor que la convergencia cuadrátic (e y i5 como en el seudocódigo de esta sección). Estos códigos estarán en precisión sencilla.
o de la se cante requerirán
ya que (3+ v'S)/2 � 2.62. Claro está que dos pasos del métod
más.trabajo por iteración. (a) Verifique sus subprogramas con la función
Newton, de la se-
Los tres métodos discutidos hasta este momento (bisección, de
o omú e el análisi s méri o y p articularmente e n el 2x
cante) ilustran un fenóme f(x)=tan -1 x-
n nu c
I+xi·
n c n
y la confiabilidad. La
cálculo científico; ésta es la interdependencia entre la velocidad
82 Capítulo 3 Solución de ecuaciones no lineales *3.4 Puntos fijos e iteración funcional 83

Intente obtener el cero positivo con la precisión total de la máquina. El algoritmo definido de esta manera se llama iteración funcional. Para el caso del
(b) Utilice el cero enc ontrado en el inciso anterior como punto de partida para el método de método de Newton la función F se expresa mediante
Newton con la función
g(x) = tan-1 x. f(x)
F(x) = x -
c9_ Selec cione una rutina de la biblioteca de programas disponible en su computadora con el f'(x)'
fin de resolver una ecuación!(x) = O sin utilizar derivadas. Verifique el c ódigo sobre estas
funciones en los intervalos dados: en tanto que para el método de Steffensen resulta que
(a) x20 - 1 en[O,10] (e) x 19 + 10-4 en (-0.7 5,0.5]
(b) tan x - 30x en[l,l.57] (t) x5en[-l, 10] (x) 2
F(x) = x - (f ]
(c ) J - (1 - x) 1° en[O,1] (g) x9 en[-1, 10] f(x +f(x)) - f(x)
(d) x3 + 10-4 en[-0.7 5,0.5] (h) xe_¡. en (-1, 4] Se podrían citar muchos más ejemplos de casos de iteración funcional, pero nos limita­
(Véase Nerinckx y Haegemans[197 6].) remos a estudiar brevemente la teoría general.
1O. La relación llamada igualdad asintótica entre dos sucesiones se escribe Xn "' Yn, y significa La fórmula (1) puede utilizarse para generar sucesiones que no convergen, como
que límn-oo(Xn /Yn ) = l. Demuestre que si Xn "'Yn, Un "' Vn, y e 1' O, entonces sucede, por ejemplo, con la sucesión 1, 3, 9, 27, ... , que se obtiene six0 = 1 y F(x) = 3x.
(a) CXn "'cyn (c) Xn Un "'YnVn (e) Yn "'Xn Sin embargo, nuestro interés recae principalmente sobre los casos para los cuales existe
(b) x� "' y� (d) si Yn "' Un entonces Xn "'Vn lím.....00 x•. Suponga entonces que
11. Demuestre que la fórmula para el método de la secante se pue de escribir en la forma Üm X =S.
n->oo n
f(xn)xn-1 - x,J(xn-1)
Xn+l = ¿Cuál es la relación entres y F? Si F es continua, entonces
f( xn) -f(Xn-1)
Explique por qué en la práctica esta fórmula resulta inferior a la que aparece en la ecuación F(s) = F( lím x.) = Iím F(x.) = Iím Xn+I = s.
n-+oo n-+oo n-+oo
(3).
'12. Programe y verifique el algoritmo de la secante usando el mismo ejemplo que aparece en el Así, F(s) = s y llamamos as punto fijo de la función F. Podemos considerar al punto
texto. A continuación repita el cálculo utilizando como puntos iniciale s 3 y 10. Explique lo fijo como un valor al que se fija la función durante el proceso iterativo.
que sucede. Con frecuencia un problema matemático puede reducirse al problema de encontrar
13. (Un polinomio de muy alto grado.) Una anualidad es un depósito de dinero sobre el cual un punto fijo de una función. Aplicaciones muy interesantes de esto aparecen en la
se hacen pagos (no nece sariamente iguales) a intervalos regulares de tie mpo. En una forma teoría de ecuaciones diferenciales, en teoría de optimización y en muchas otras áreas.
de anualidad el fondo se invierte con un interés constante, r, por intervalos. Al finalizar cada La función F, cuyos puntos fijos se buscan, será usualmente una transformación entre un
intervalo se toma el interés compuesto. Suponga que los pagos están represe ntados por las
cantidades a1, az, . . . y que V; denota el valor acumulado de la anualidad, calculado justo espacio vectorial y otro. Nuestro fin es analizar el caso más sencillo en que F envía en
de spués de que se ha hecho el pago a;. Entonces Vi = a1 y sí mismo algún conjunto cerrado C e R El teorema que se demuestra a continuación
se ocupa de las aplicaciones contractivas. Se dice que una transformación (o función)
V;= Vi-1(1 + r) + a; (i = 2,3, .. . ). F es contractiva si existe un número 11, menor que 1 que satisfaga
El factor (1 + r) representa el interés rV;-1 producido por Vi-1 durante el intervalo corres­
pondiente. Demuestre que Vn = I:;=1 a;xn-1, donde x = 1 + r. IF(x ) - F(y)I i 11,lx - YI (2)
e 14. (Continuación) Se hacen 60 pagos mensuales en una anualidad. De l primer al quinto años para todos los puntos x y y en el dominio de F. Tal como se ilustra en la figura 3.6, la
los pagos son, re spe ctivamente, $200, $27 5, $312, $380 y $400. Justo después de que se ha distancia entrex y y se transforma en una distancia menor entre F(x) y F(y) por la acción
hecho el último pago, el valor acumulado de la anualidad es $24,738. ¿Cuál e ra la tasa de
interés mensual? Use el método de la secante para encontrar el cero del polinomio que se de la función contractiva F.
obtiene.
Teorema de la aplicación contractiva
TEOREMA Sea F una aplicación contractiva que va de un conjunto cerrado C e lR a C. Entonces
*3.4 Puntos fijos e iteración funcional F tiene un puntofijo único. Más aún, este punto fijo es el límite de toda sucesión que se
obtenga a partir de la ecuación (1) con cualquier punto inicial xo E C.
El método de Newton y el de Steffensen son ejemplos de procedimientos mediante los
cuales se calcula una sucesión de puntos con una fórmula como la siguiente: Demostración Usamos la propiedad contractiva (2) junto con la ecuación (1) para escribir

Xn+I = F(x.) (n � O). (1) lxn -Xn-1 I = IF(xn-1) - FCx.-2)1 i AIXn-1 - Xn-zl. (3)
.
84 Capítulo 3 Solución de ecuaciones no lineales *3.4 Puntosfijos e iteraciónfu.ncional 85

F(x) Ya que A. < 1, entonces lx -YI = O. Finalmente, tome nota de que el puntos que
se obtiene pertenece a C, ya ques es el límite de una sucesión cuyos elementos están
��
Este teorema puede demostrarse para una aplicación contractiva de cualquier espa­
F(b) cio métrico completo en sí mismo.
F(y)
Ejemplo 1 Demuestre que la sucesión [xn l en el teorema de la aplicación contractiva satisface el
F(x) criterio de Cauchy de convergencia.
F(a)
¡._,:::::_+-___...,_______..,_-t-------+-X Respuesta Recuerde el criterio de Cauchy para la sucesión [xn J: dado cualquier e, existe un entero
a b N, tal que lxn -Xml < s, siempre que n, m ;;; N. Si n ;;; m ;;; N, entonces por la
desigualdad triangular y la ecuación que se sigue de (3) tenemos:

lxn-xml �/xn-Xn-il+ lxn-1-Xn-2 1+· · ·+lxm+l-xml


Figura 3.6 Ejemplo gráfico de una transformación contractiva.
-2
�11."-1lx1-xol+11." lx1-xol+···+A. lx1-.xol
m

Este argumento puede repetirse para obtener =A.m¡x¡ _ .xol(l +A.+A.2 +...+A.n-1-m)

lxn-Xn-1I �AIXn-1-Xn-2 1 �A. 1Xn-2-Xn-31 �· ·· �A.n-I¡x¡-.xol.


2 �A.Nlx1-xo 1( 1 +A. +A.2 + · ··)
=11.Nlx1-xol(l-11.) - 1•
Dado que Xn puede escribirse en la forma
Para cualquier s > O, existe N, tal que lxn-Xm 1 < s, siempre que n, m ;;; N. Sólo tenemos
Xn =XQ + (X¡-XQ) + (xz-X¡) +··· + (Xn-Xn-J), que aumentar N hasta que 11.Nlx1-x0l(l-A)- 1 < s. 111

veamos que la sucesión [xn l converge si y sólo si la serie Ejemplo 2 Demuestre que la sucesión [xn ] definida recursivamente como se muestra a continuación
es convergente.
co
{XO =-15
¿( xn-Xn -1)
n=l Xn+l = 3-�lxnl (n;;; 0).
converge. Para demostrar que la serie converge basta con demostrar que la serie f
Respuesta La función F(x) = 3- lxl es una contracción ya que
co
¿lxn-Xn-il 1 1 1 1
IF( x)-F( y)I = 13-zlxl-3 + zlYII = 2IIYI- �zly-xl
n=l
converge. Esto resulta sencillo pues podemos utilizar el criterio de comparación y lo por la desigualdad triangular. Como resultado de apelar al teorema de la aplicación
hecho previamente para obtener contractiva ocurre que la sucesión debe converger al único punto fijo de F, el cual es 2
como se ve de inmediato. En el teorema podemos tomar C en JR. 11
co co
¿ lx -X -1I �¿=l A."-1lxi-xol = l _l A.lx1-xol-
n n Ejemplo 3 Utilice el teorema de la aplicación contractiva para calcular un punto fijo de la función
n=l n
1
Ya que la sucesión converge, tómese s =límn-co Xn . Por lo tanto F(s) = s, tal como F(x) =4+ sen2 x
3
se había dicho anteriormente. (Observe que la propiedad contractiva hace que F sea
continua.) Respuesta Por el teorema del valor medio sabemos que
Respecto de la unicidad del punto fijo, tenemos que si x y y son puntos fijos, entonces
1 · 2 2
¡F(x)-F(y)I = 1 sen2x-sen2yl = 1 cos2sllx-yl � /x-yl
lx-YI =IF(x)-F(y)I �11.lx-y¡. 3 3 3
86 Capítulo 3 Solución de ecuaciones no lineales *3.4 Puntos fijos e iteración fu.ncional 87

para alguna i; entre x y y. Esto muestra que Fes contractiva, con').. = 2/3. Por el Utilizando la serie de Taylor para F(x.) desarrollada alrededor de s tenemos que:
teorema de la aplicación contractiva resulta que Ftiene un punto fijo. Un programa de
computadora que calcule este punto fijo puede inspirarse en el siguiente algoritmo, el
en+I = Xn+l - s = F(xn) -F(s)
cual lleva a cabo 20 iteraciones iniciando con un valor de 4.
= F(s+e.)� F(s)
·]
input x +- 4; M+-20
for k = 1, 2, .. . , M do
= [F(s)+enF'(s)+ Je;F"(s)+. . - F(s)
x+-4+fsen 2x
outputk,x 1 1
n (s)+ .. · + --é-lp
= enF'(s)+ -e2F" 1 qp r
end. n q( -l)(s) + -en q( )(":,n )
2 (q _ l )! q!
El programa genera 20 líneas de salida, algunas de las cuales se muestran aquí: y por lo tanto
k X en+! - ..!_,e qp
. q( )(r":,n ) . (4)
q.
1 4.3297861
2 4.2308951 Sabiendo que lírn .....00 Xn = s, deducirnos de la ecuación (4) que:
3 4.2736338
\en+I\
l ím
n-+oo \en\q
= q..!_Fq
! ( )(s). (5)
14 4.2614830
15 4.2614840 Recuérdese que en la sección 1.2 se estableció que para cualquier sucesión [x.J que
16 4.2614836 converge a un punto s (sea que provenga o no de una iteración funcional), definimos el
orden de convergencia como el mayor número real q, tal que el límite
20 4.2614837
\Xn+I - s\
lím
El punto fijo aparece en la última línea con una precisión de siete dígitos decimales. 11 n-+oo \xn - s\q

existe y es diferente de cero. No es necesario que tal q exista, y cuando sucede, no


Análisis de errores
necesariamente es un entero.
Analicemos ahora los errores que surgen durante el proceso de iteración funcional. Por ejemplo, si F'(s) = O y F"(s) * O, entonces q = 2 y además
Supongamos que Ftiene un punto fijo, s, y que la sucesión [x.] se ha definido mediante
la fórmula Xn+I = F(x.). Sea 1
en+I = e2.F/1(1;.).
en =Xn -S. 2
Si F' existe y es continua, entonces por el teorema del valor medio Esto trae a nuestra memoria el método de Newton, la ecuación (3) de la sección 3.2. De
hecho el método de Newton recurre a
Xn+l - s = F(x.) -F(s) = F' (l;n)(Xn - s)
f(x)
F(x) = x -
¡ '(x)
en+l = F'(1;.)en,
y de ahí obtenemos
donde i;. es un punto entre Xn y s. La condición \F' (x)\ < 1 para toda x permite asegurar
que los errores disminuyen en magnitud. Si en es pequeño, entonces i;. está próximo a , J'(x)f'(x) - f(x')f"(x) f(x)f"(x)
s y F'(l;n) l'::i F'(s). Se esperaría convergencia rápida si F'(s) es pequeña. Una situación F (x) = 1 - = .
[f'(x)]2 [f'(x)]2
ideal sería que F'(s) = O. En este caso un término adicional en la serie de Taylor resulta
de gran utilidad. Para manejar varios casos simultáneamente supongamos que q es un Ya que un punto fijo de Fes un cero de/, tenemos F'(s) = O. Además
entero, tal que
{[f'(x)J2 [f(x)J"'(x) +f"(x)f'(x)]-[f(x)f"(x)][2f'(x)f" (x)l}
pk( \s) = O para 1 � k < q pero pq( )(s) '* O F (x) =
11

[F(x)J4
88 Capítulo 3 Solución de ecuaciones no lineales *3.4 Puntos fijos e iteración funcional 89

y por lo tanto tendremos en general que Dése cuenta de que esto puede interpretarse como x = lúnn-oo Xn , donde x1 = ,.¡p, x2 =
,/p + /p. y así sucesivamente.
f"(s)
F "(s) = ' * O. 13. Sea p > l. ¿Cuál es el valor de la siguiente fracción continua?
f (s)
Si se representa a F en el entorno de un punto fijo s mediante una serie de Taylor x=---,---.
p+
l
00 1 p+-­
"-F(k)(s)(x -d p+···
L., k!
k=O Utilice las ideas del problema anterior para resolver éste. Usando el teorema de la aplicación
y si Xn+I = F(xn), entonces el orden de convergencia es el primer entero q, tal que contractiva demuestre que la sucesión de valores converge.
F(ql(s) * O. El problema 16 pide una demostración de esta afirmación. 14. (Continuación) Encuentre las raíces de la ecuación cuadrática x2 + px + q = O usando un
método iterativo.
15. SeaFuna aplicación contractiva de un intervalo [a, b] en sí mi�mo, y seas el punto fijo de F.
SERIE DE PROBLEMAS *3.4 Sia � x � by IF(x)-xl < e, ¿es cierto que jx-sl < e? Demuestre que jx-sl < e(l-";..)-1,
l. SiF es contractiva de[a, b] a ( a, b] y si xn+l = F(x.), conxo E [a, b], entonces lx.-si �C";.." donde ";.. es la constante de la ecuación (2).
para una C apropiada. Demuestre lo anterior y dé una cota superior para C. Aquí s es un 16. Demuestre el enunciado que hace referencia en el libro al orden de convergencia en el método
punto fijo de F. de iteración funcional.
2. Demuestre que si F: [a, b] -> lR, con F' continua y si IF'(x)I < 1 en [a, b], entonces Fes 17. La mayoría de los procesos iterativos no son tan sencillos como el que se expresa mediante
una contracción. ¿Sucede por necesidad que F tiene un punto fijo? Xn+l = F(x.), con F: lR -+ R Por ejemplo, podríamos tener una transformación F: JR2 -,.
3. Demuestre que si Fes una aplicación continua de [a, b] en [a, b], entonces F debe tener un JR2• Demuestre que el método de bisección y el método de la secante son de este tipo. En
punto fijo. A continuación determine si esto resulta cierto para funciones de lR en JR. cada caso defina explícitamente a F.
4. Demuestre que las siguientes funciones son contractivas en los intervalos indicados. Deter­ 18. DemuestrequesiF' es continua y si IF'(x)j < 1 en el intervalo [a, b], entoncesFes contractiva
mine los valores óptimos de";.. en la ecuación (2). en [a, b]. Demuestre que para un intervalo abierto esto no necesariamente resulta cierto.
(a) (1 + x2)-1 sobre un intervalo arbitrario 19. Si el método de iteración funcional se aplica a la función F(x) = 2 + (x - 2)4, empezando
CbHx sobre l �x�5 por x = 2.5, ¿cuál es el orden de convergencia? Encuentre el intervalo de valores iniciales
para el cual converge esta iteración funcional. Dése cuenta de que 2 es un punto fijo.
(c) tan-1 x sobre un intervalo cerrado arbitrario que excluya al O
20. Demuestre que las siguientes funciones son contractivas en los dominios dados, y sin em­
(d) !xi i sobre !xi� ! bargo, no tienen punto fijo en estos dominios. ¿Por qué esto no contradice al teorema de la
5. En astronomía se conoce como ecuación de Kepler a la siguiente expresión: x = y-e sen y, aplicación contractiva?
con O < e < I. Demuestre que para cada x E (O, 7t] existe una y que satisface la ecuación. (a) F(x) = 3 - x2 en[-!, ll (b) F(x) = -x/2 en (-2, -1] U[l, 2].
Interprete este problema como uno de punto fijo.
21. Demuestre que sif es continua en [a, b] y satisface a �f(a) y f(b)�b, entonces/ tiene un
6. Considere una función de iteración de la forma F(x) = x + f(x)g(x), donde f(r) = O y punto fijo en el intervalo [a, b]. Observe que no suponemos que a �f(x) � b para toda x
f' (r) * O. Encuentre las condiciones precisas sobre la función g que aseguren que el método en [a,b].
de iteración funcional tendrá una convergencia cúbica a r si inicia cerca de r.
22. ¿Cuál es la condición más débil que podemos imponer al intervalo [e, d] para que resulte
7. Si en una calculadora de mano se introduce un número y se presiona repetidamente la tecla que cada aplicación continua de [a, b] en [e, d] tenga un punto fijo?
que corresponde al coseno, ¿qué número aparecerá eventualmente? Demuéstrelo.
23. Encuentre el orden de convergencia de las siguientes sucesiones:
8. Demuestre que la sucesión generada por la iteración Xn+l = F(x.) convergerá si jF'(x)i �
";.. < l en el intervalo[xo - p,xo + p], donde p = jF(xo) -xoj/(1 - ";..). (a) Xn = (1/n)i (c) Xn = (1 + 1/n)Í
9. ¿Qué propiedades especiales debe tener/ si el método de Newton aplicado af converge (b) Xn = yÍi (d) Xn+l = tan-l Xn.
cúbicamente a un cero de/? 24. Para encontrar un cero de la función! podemos buscar un punto fijo de la función F(x) =
10. Si intentamos encontrar un punto fijo de Futilizando el método de Newton en la ecuación x - f(x)/!'(x). Con el fin de localizar un punto fijo de F podemos resolver la ecuación
F(x) - x = O, ¿qué fórmula de iteración resulta? F(x) - x = O usando el método de Newton. Una vez hecho esto ¿cuál es la fórmula para
generar la sucesión Xn?
11. Si¡' es continua y positiva en [a, b] y sif(a')f(b) < O, entonces! tiene exactamente un cero
en (a, b). Demuestre lo anterior y muestre también que con un parámetro adecuado ";.., se 25. Demuestre que la función F definida como F(x) = 4x(l -x) envía el intervalo[O, l ] sobre sí
puede obtener el cero, utilizando el método de iteración funcional con F(x) = x + ";..f(x). mismo y no es una contracción. Demuestre que tiene un punto fijo. ¿Por qué no contradice
este resultado al teorema de la aplicación contractiva?
12. Seap un número positivo. ¿Cuál es el valor de la siguiente expresión?
26. Si el método de iteración funcional se utiliza en la función/(x) = !Cl + x2)-1, con punto
inicial xo = 7, ¿converge la sucesión resultante? Si así resulta, ¿cuál es el límite? Justifique
x=Jp+Jp+�. rigurosamente sus respuestas.
90 Capítulo 3 Solución de ecuaciones no lineales
*3.5 Cálculo de ceros de polinomios 91
27. Demuestre o refute el enunciado: si f: lR -,. [a, b] y si Fes contractiva en [a, b], entonces
f tiene un punto fijo único que puede calcularse mediante el método de iteración funcional, 41. Considere un método iterativo de laforrnax.+1 = x. -f(x.)/g(x.). Suponga que converge a
iniciando el cálculo en cualquier valor real. un punto 1; que es un cero simple de la función!, mas no un cero de la función g. Establezca
la relación entre f y g de tal manera que el orden de convergencia del método sea tres o
28. Dé ejemplos de funciones que no tienen puntos fijos pero que sí poseen las siguientes mayor que tres.
características:
(a)f: [O, 1] -+ [O, l]
(JJ)f:(0, 1)-,. (0, l ) yes continua *3.5 Cálculo de ceros de polinomios
(c)f:A-+ A y es continua, conA= [O, l ] U [2, 3]
(d)f: lR-+ lR y es continua. Los métodos desarrollados en las secciones anteriores, en particular el método de New­
29. Demuestre que la funciónf(x) = 2 + x-tan -I x tiene la propiedad lf'(x)\ < 1. Pruebe quef ton, pueden utilizarse en el caso en el que las funciones sean polinomios. Sin embargo,
no tiene punto fijo. Explique por qué este resultado no contradice el teorema de la aplicación y cuando sea posible, al encontrar los ceros de los polinomios explotaremos las carac­
contractiva. terísticas especiales de este tipo de funciones. Más aún, en el caso de los polinomios el
30. Este problema se ocupa de la función F(x) = 10 - 2x. Demuestre que f tiene un punto problema se complica frecuentemente debido a que deseamos calcular los ceros com­
fijo. Tómese un xo arbitrario y defina Xn+l = F(xn), paran ;;; O. Encuentre una fórmula no plejos (aun cuando el polinomio tenga coeficientes reales) o porque buscamos todos los
recursiva para x•. Demuestre que el método de iteración funcional no da lugar a una sucesión ceros de un polinomio dado. Por ello, la cuestión de encontrar los ceros de un polinomio
convergente, a menos que xo tenga un valor particular. ¿Cúal es este valor especial de Xo? merece un tratamiento especial, tratamiento que ha recibido durante un periodo de casi
¿Por qué este resultado no contradice al teorema de la aplicación contractiva?
400 años.
31. Sea F continuamente diferenciable en un intervalo abierto, y suponga que F tiene un punto Iniciamos con algunos de los más importantes resultados teóricos, muchos de los
fijo s en este intervalo abierto. Demuestre que si \F' (s)\ < 1, entonces la sucesión definida cuales probablemente resultarán conocidos para el lector. Un polinomio se escribe de la
mediante iteración funcional converge as si empezó suficientemente próxima a s.
siguiente manera:
32. Sea!� q � l ydefinaf(x) = 2x-qx2. Si se utilizaF,¿sobre qué intervalo se puede garan­
tizar que el método de iteración converge a un punto fijo? (Este problema está relacionado p(z) = anz" + an-!Zn-l + .. · + a2z2 +a¡Z + ao, (1)
con el problema 7 de la sección 3.2.)
33. Escriba dos procedimientos de punto fijo diferentes para encontrar ceros de la funciónf(x) = en la que los coeficientes ak y la variable z pueden ser números complejos. Si O, ª" :;,
zx2 + 6e-z - 4. entonces p tiene grado n. Nos interesa encontrar los ceros de p, y entonces surge la
pregunta: ¿los hay? El siguiente teorema (demostrado primeramente por Gauss en
34. ¿Sobre cuáles de los siguientes intervalos es contractiva? la funciónf(x) = Jx 1799) responde a esta pregunta.
(i) [1/2, oo] (ii) [1/8, 1] ( iii) [l/4, 2] (iv) [O, l ] (v) [1/5, 3/2].
35. Una función f recibe el nombre de contracción iterada si Teorema fundamental del álgebra
\F(F(x)) - F(x)\ � :\.\F(x) - x[ (:\. < 1). TEOREMA 1 Todo polinomio no constante tiene al menos un cero en el campo de los números com­
plejos.
Pruebe que toda contracción es una contracción iterada. Demuestre que una contracción
iterada no necesita ser una contracción ni tampoco ser continua.
La historia de este teorema y de los intentos por demostrarlo se pueden leer en el
36. Si al utilizar el método de iteración funcional en F(x) = x2 + x -2 se obtiene una sucesión libro de Kline (1972, págs. 597-606]. La demostración moderna usual es un corolario
convergente de números positivos, ¿cuál es el límite de esta sucesión y cuál fue el punto
inicial? del teorema de Liouville. Vea, por ejemplo, Bak y Newman [1982], Henrici (1974],
Ahlfors [1966], y otros textos de análisis complejo.
37. Considere una función de iteración de la forma f(x) = x -f(x)f'(x), dondef(r) = O y El teorema fundamental no afirma la existencia de ceros reales, y los ejemplos más
J' (r) ;o O. Encuentre las condiciones precisas que debe satisfacer la función!, de modo que
el método de iteración funcional converja al menos cúbicamente a r si empezó cerca de r. sencillos, como sucede con z2 + 1, prueban que un polinomio no necesita tener ceros
reales aun cuando sus coeficientes sean todos reales.
38. Analice el método de Steffensen (Prob. 6, Sec. 3.2) como un ejemplo de iteración funcional. Si el polinomio p, con grado n no menor que uno, se divide por un factor lineal
Determine su orden de convergencia.
z - c, el resultado es un cociente q y un residuo r. El último es un número complejo, y
39. Un estudiante recuerda de manera incorrecta el método de Newton y escribe Xn+I = el primero es un polinomio de grado n - l. Podemos representar este proceso mediante
f(xn)/J'(x.). ¿Se encontrará con este método un cero def? ¿Cuál es el orden de con­
vergencia? la ecuación
p(z) = (z - c )q(z) + r.
40. Demuestre que el siguiente método tiene una convergencia de tercer orden al calcular ../R.:
De aquí vemos (al dejar que z = c) que p(c) = r. Este resultado se conoce como el
x.(x; + 3R) teorema del residuo. Si c es un cero de p, entonces r = O, y tenemos entonces que
Xn+l =
3x�+R . p(z) = (z - c)q(z).
92 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 93

Así, z- c es un factor de p(z). Esta última observación se conoce como teorema del Ejemplo 1 Encuentre un disco centrado en el origen que contenga todos los ceros del polinomio
Factor.
Escribamos ahora p(z) = (z - r1)q1 (z), donde r 1 es cualquier cero de p. Por el p(z) = z4- 4z3 + 7z2- 5z- 2.
teorema fundamental q 1 tiene un cero, llamémoslo r2 (a menos que q 1 sea de grado cero).
Por lo tanto, q 1 (z) tiene un factor z- r2, y podemos escribir p(z) = (z- r 1 )(z- r2)q2(z). Respuesta Por el teorema anterior, tal disco tiene un radio
Siguiendo este proceso, llegamos eventualmente a un punto donde el proceso se detiene
debido a que los grados de los qk decrecen en uno a cada paso. Por ende, qn será una p = 1 + !a4¡-r máx l akl = 8. 111
O�k<4
constante y la última ecuación es
Otra idea útil para el análisis de polinomios es la siguiente: Tome el polinomio p
p(z) = (z- r1)(z- r2) · · · (z- rn)qn. de la ecuación (1) y considere la función s(z) = z" p(l/z). Entonces:

Esto muestra que un polinomio de grado n se puede factorizar como producto de n


factores lineales, cada uno correspondiendo a un cero de p. Resulta evidente que p no
puede tener otros ceros, ya que si z es cualquier número complejo distinto de r1, r2, •..
s(z) = z· [ª· G) · +a._¡ Gr-l + ...+ao]

rn , entonces el producto ffi=1 (z- rk) no puede ser cero. En vista de que algunos de
los ceros rk pueden ser iguales unos a otros, entonces un polinomio de grado n puede
= ª" + ªn-IZ + ª•-2z2 + · · · + aoz".
tener a lo sumo n ceros. La multiplicidad de un cero es el número de veces que el factor Esto prueba que s es un polinomio cuyo grado es n a lo sumo. Sus coeficientes se pueden
que le corresponde aparece en la factorización de p. Si combinamos las afirmaciones escribir de inmediato dado que son los mismos coeficientes de p, excepto que aparecen
anteriores con el teorema fundamental obtenemos lo siguiente: en el orden inverso. Por otra parte, resulta obvio que para un número complejo zo distinto
TEOREMA 2 Un polinomio de grado n tiene exactamente n ceros en el plano complejo, conviniendo de cero, la condición p(zo) = O es equivalente a la condición s(l/zo) = O. Por lo tanto,
que cada cero debe contarse un número de veces igual a su multiplicidad. tenemos el siguiente resultado:

TEOREMA 4 Si todos los ceros de s están en el disco {z : lzl � p }, entonces todos los ceros no nulos
Con frecuencia es deseable tener cierta idea sobre el lugar en el que se localizan
de p se encuentranfuera del disco {z : lzl < p- 1 }.
los ceros de un polinomio en el plano complejo. Muchos resultados, como la regla de los
signos de Descartes, se pueden encontrar en la bibliografía que se ocupa del problema
de localizar los ceros. Véase, por ejemplo, la sección 5.5 de Young y Gregory [1972], Ejemplo 2 Encuentre un disco centrado en el origen, en el cual no haya ceros de p, siendo p el
la sección 5.5 de Stoer y Bulirsch [1980], el tratado de Marden [1966], o el volumen polinomio del ejemplo anterior.
l del tratado en tres volúmenes de Henrici [1974]. El siguiente teorema, tomado del Respuesta El polinomio s al que hace referencia el teorema anterior es
libro de texto de Conte y de Boor [1980], nos proporciona una cota superior fácilmente
calculable para los módulos de los ceros. s(z) = -2z4 - 5z3 + 7z2- 4z + l.
TEOREMA 3 Todos los ceros del polinomio de la ecuación (1) se hallan en el disco cerrado cuyo Por el teorema 3 sabemos que todos los ceros de s se encuentran en un disco centrado
centro está en el origen del plano complejo y cuyo radio es en el origen y con radio
p = 1 + lanl-1 máx l akl·
p = 1 + !a4¡-i máx lakl =
O�k<4
l
O�k<n
Por lo tanto, basándonos en el teorema anterior, concluimos que los ceros de p se en­
cuentran fuera del disco de radio 2/9. Por ende todos los ceros de p están en el anillo
Demostración Elija c = máx lakl de manera que clan ¡-1 = p- l. Si lzl > p, entonces
O�k<n 2/9 < lzl < 8 en el plano complejo. ti

lp(z)I;;,; lan z"l- lan-lZn-l + ..· + aol Algoritmo de Homer


n-1

L
;;,; l anz"I - c lzl
k=O
k Para un cálculo más eficiente de los valores de un polinomio se hará uso del al­
goritmo de Homer. Este algoritmo también se conoce como multiplicación anidada y
\:Omo división sintética. Veremos que también es útil para otros propósitos. Si se tiene
= lanz"I - c!z l"(lzl- 1r 1 un polinomio p y un número complejo zo, el algoritmo de Horner proporciona el número
= la.z"l{ l - c1a.1-1 clzl-1)- 1 } p(zo) y el polinomio
p(z)- p( zo)
q(z) =
> !a. z"l{ l - c!a.1-1 cp-1)- 1 } = o. 11 z- zo
(2)
*3.5 Cálculo de ceros de polinomios 95
94 Capítulo 3 Solución de ecuaciones no lineales
El algoritmo de Homer también se usa para realizar una deflación, que es el proceso
El grado del polinomio q es uno menos que el grado de p. De esta ecuación resulta que
mediante el cual se cancela un factor lineal del polinomio. Sizo es un cero del polinomio
p, entonces z-zo es un factor de p, e inversamente. Los ceros restantes de p son los
p(z= ( -zo)q(z) + p(zo)-
) z (3)
n- 1 ceros de p(z)/(z - za).
Representemos el polinomio desconocido q por Ejemplo 4 Efectúe una deflación sobre el polinomio del ejemplo anterior, utilizando el hecho de
n-l que 2 es uno de sus ceros.
q(z=
) bo + b¡Z +···+ bn-lZ _
Respuesta Usamos la misma regla de cálculo que se presentó con anterioridad:
Cuando esta forma para q(z) y la forma análoga para p(z) se sustituyen en la ecuación (3), -4 7 -5 -2
los coeficientes de las potencias correspondientes dez de ambos lados de la ecuación 2 2 -4 6 2
pueden igualarse término a término. Las ecuaciones que se obtienen de esta acción son: -2 3 1 O.

bn-1= an Por ende


z - 4z3 + 7z2 - 5z- 2= (z - 2)(z - 2z2 + 3z + 1).
3
4
11
bn-2= ª•-1 +zobn-1
Un tercer uso del algoritmo de Homer es expresar el desarrollo de Taylor de un
polinomio alrededor de cualquier punto. Tome p(z) tal como se presenta en la ecuación
(1), y suponga que buscamos los coeficientesCk de la ecuación
ba= a¡ +zob1
p(z)= a.z" + ªn- lZn-I +···+ aa
p(zo)= ao +zoba.
=Cn(Z- zo)" +Cn-t(Z- za)"-!+···+CQ.
El algoritmo de Homer se puede escribir en forma compacta como se indica a continua-
ción: Es obvio por el teorema de Taylor de que Ck= pCkl(zo)/k!, pero es nuestra intención
inputn, (a;: O� i� n),za buscar un algoritmo más eficiente. Dese cuenta de que p(zo)= ca, de modo que este
bn-1 +- an coeficiente se obtiene aplicando el algoritmo de Homer al polinomio p con el puntozo.
for k= n- 1, n- 2, .. ., O do El algoritmo también genera el polinomio:
bk-1 +- ak +zobk p(z)- p(zo) n 1
end ( )
qz= =Cn(Z-ZO ) - +Cn-1Z-Zo
( )n-2 +···+C¡.
z -za
output(b;: -1� i� n- 1).
Esto demuestra que el segundo coeficiente, c1, puede obtenerse aplicando el algoritmo
Dese cuenta de que en este seudocódigo b_1= p(zo). Al efectuar el cálculo con el de Homer al polinomio q con el punto zo, ya que c1= q(zo). (Dese cuenta de que la
algoritmo de Homer utilizando papel y lápiz, se recurre con frecuencia la siguiente primera aplicación del algoritmo de Homer no genera q en la forma que se muestra, sino
regla:
ª• ª•-1 ª•-2 ªª como una suma de potencias de z.) El proceso se repite hasta que se encuentran todos
los coeficientesCk-
za zabn-1 zabn-2 zaba
bn-1 bn-2 bn-3 b_ ¡ . Ejemplo 5 Para el polinomio usado en los ejemplos anteriores encuentre el desarrollo de Taylor
alrededor del puntozo= 3.
Ejemplo 3 Use el algoritmo de Homer para calcular p(3), donde p es el polinomio Respuesta El trabajo se puede arreglar de la manera siguiente:
3
) z - 4z + 7z2 - 5z- 2.
p(z= 4
-4 7 -5 -2
3 3 -3 12 21
Respuesta Usamos la regla que se sugirió líneas arriba. -1 4 7 19
-4 7 -5 -2 3 3 6 30
3 3 -3 12 21 2 10 37
1 -1 4 7 19. 3 3 15
5 25
Por lo tanto p(3)= 19, y podemos escribir: 3 3

( - 3)(z3 - z2 + 4z + 7) + 19.
p(z)= z 11
96 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 97

El cálculo muestra que Ejemplo 6 Lleve a cabo la iteración de Newton con el polinomio utilizado en todos los ejemplos
anteriores, empezando por zo= O.
p(z) = (z- 3) + 8(z- 3) + 25(z- 3) + 37(z- 3)+ 19.
4 3 2 11

El algoritmo que acabamos de describir se conoce como algoritmo de Horner


Respuesta En el primer paso usamos Zo = O, y calculamos los valores p(O) = -2 y p'(O) = -5
mediante los algoritmos ya explicados. El nuevo valor dez es
completo. El seudocódigo para ejecutarlo se arregla de manera que los coeficientes ck
se sobreimponen a los coeficientes ak que se dan como entrada. -2
z1 = zo- p(zo)/p'(zo) = O- _ = -0.4
inputn, (a;: O� i� n),zo 5
for k = O, 1, ...,n - I do
for j = n- I,n- 2, ..., k do Al ejecutare! algoritmo con una computadora con la precisión de laMARC-32 se producen
aj <- aj+ zobj+I los siguientes resultados:
end
end k p(Zk-1) p' (Zk-1) Zk
output (a; : O� i � n). 1 -2.00000 -5.00000 -0.40000
2 1.40160 -12.77600 -0.29029
Contamos con todos los elementos necesarios para mostrar cómo la iteración de 3 1. 46322 -10.17322 -0.27591
Newton se puede llevar a cabo para el caso de un polinomio. Recuérdese que esta 4 0.00226 -9.86030 -0.27568
iteración se define mediante la ecuación 5 0.00000 -9.85537 -0.27568
f(Zk)
Zk+l = Zk Observe que Zk converge rápidamente al cero-0.27568.
f'(Zk).
- 111

Si esto se aplica a un polinomio p, puede utilizarse un método eficiente que incorpore al A continuación tenemos una demostración formal de la validez del algoritmo de
algoritmo de Horner para calcular p(z) y p'(z). Ya habíamos observado que si se utilizan Horner.
sólo dos pasos del algoritmo de Horner completo, obtenemos c0= p(zo) y c1 = p'(zo). TEOREMA 5 Sea p(x) = a.x" + · · · + a¡x +ao. Defina los pares (aj,�j ) paraj = n, n- I, ..., O a
Ambos pasos se pueden combinar en el seudocódigo. Por otra parte, desistimos de través del algoritmo
sobreimponer valores a los coeficientes de entrada debido, a que éstos se utilizaran en
pasos posteriores de la iteración. Presentamos a continuación un seudocódigo que genera { (Cln, Pn) = (an, 0)
a= p(zo) y p= p'(zo), suponiendo que pes de la forma dada en la ecuación (1) y que
(aj, Pj) = (aj+ XClj+I, Clj+I +xPj+!) (j = n- I, n- 2, ...,O )
se proporcionazo:
inputn, (a;: O� i � n),zo
(l <- ª• Entonces no = p(x) y �o= p' (x).
p <-O
for k = n- I, n- 2, ...,O do Demostración Sin= O, entonces p(x)= a0 y
P <-a+zoP
a <- ak +zoa (no, Po) = (ao,O).
end
output a,�- Es obvio que a0 = p(x) y Po = p'(x). En consecuencia, el teorema es cierto paran=O.
Si nos referimos a este seudocódigo como HORNER (n, (a; : O � i � n),zo,a, �), Sin= I, entonces p(x) = a 1 x + ao y
entonces un seudocódigo para tomar M pasos con el método de Newton para un polinomio
dado, iniciando en zo, será de la siguiente manera: (no,Po) = (ao + xa¡, Cl¡+xP1) = (ao+ xa¡, a¡) = (p(x), p' (x)).
input n, (a;: O� i� n), zo, M, s
forj= 1,2,...,Mdo De modo que el teorema es cierto para n = I.
call HDRNER (n,(a;: O� i� n), Zo, a, P) Suponga que el teorema es cierto para todos los índices n menores que m. Sea
Z; <-Zo-a/P
output a,p,z1 p(x)= Cmx!" + · · · + C¡X+ co = co+ x(cmx!"- 1 + · · · + c2x + e¡) = co + xq(x).
ü iz;-zol < s then stop
ZO <- Z¡ En consecuencia,
end. p'(x) = xq 1(x) + q(x).
98 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 99

Sean n = m - 1, an = Cm, ªn-1 = Cm-1, ... ' a2 = C3, a¡ = C2 y ao = C¡. Como el Método de Bairstow
teorema es cierto para q, aplique el algoritmo a q(x) = anx n + ...+a 1 x+a0. Por hipótesis Si un polinomio sólo tiene coeficientes reales, aun así sus ceros pueden ser com­
de inducción, lo que se obtiene es a.0 = q(x) y �o = q'(x). Si se aplica el algoritmo a plejos. En este caso es posible calcular los ceros complejos, dos de ellos en cada paso,
p obtenemos el mismo conjunto de pares (a.n , �n), ... , (a. 1,�¡), (a.o,�o) (debido a que usando exclusivamente la aritmética de los reales. El procedimiento para hacer esto se
(cm,..., c2, c 1)= (an ,... ,a 1, ao)), pero al final queda un par más por calcular, a saber conoce como método de Báirstow, el cual se considerará a continuación.
Dado un número complejo z = x + iy, su número conjugado es z = x -iy. Un
(a.-1,�-1)= (a_¡ +xa.o,a.o +x�o) resultado básico que se utilizará más adelante nos dice lo siguiente:
= (co +xq(x),q(x) +xq'(x)) TEOREMA 7 Si p es un polinomio cuyos coeficientes son números reales, y si w es un cero complejo de
= (p(x),p '(x)) 11111
p, entonces w también es cero de p, y (z -w)(z -w) es un factor cuadrático real de p.

-
Observe que podríamos definir nuestra sucesión mediante Demostración Sea p(z)= anzn +ªn-1 z" 1 + · · · +a¡z +ao, donde todos los coeficientes ak, son números
reales. Ya que w es un cero de p, tenemos
(a.n-1 , �n-1 ) = (an-1 +xa ., an) Ü= an w" +an-JW-l + · · · +a¡W +ao.
{
(0.j,�j )= (aj +XO.j+J,0.j+I + X�j+I) (j= n -2, n - 3, ..., O)
Tome el conjugado en ambos lados, usando repetidamente las reglas z1 + z2 = z1 + z2 y
z 1 z2 = z1zi. Dado que las ak son reales, el resultado es
o como
O= anw" +an-1 w•-1 + · · · +a¡w +ao.
(a.n,�n) = (an-1 + xan,an)
{ Por lo tanto, W es un cero de p. Como w no es real, w y W son ceros distintos de p. En
(0.j,�j )= (aj-1 +XO.j+I ,0.j+ I +�j+J) (j= n- l,n-2, ..., 1)
consecuencia, p contiene el factor cuadrático:

Éstas son inferiores ya que no se ocupan den= O. (z -w)(z -W)= z2 -(w + w)z + wW.

TEOREMA 6 Sean Xk, y Xk+I dos iteraciones sucesivas que resultan de la aplicación del método de Este factor es real ya que w + W y wW son reales. 11
Newton a un polinomio p de grado n. Entonces existe un cero de p en una vecindad de Los ceros complejos del polinomio real p aparecen en pares conjugados y estos
Xk de radio nlxk -Xk+1 I en el plano complejo. pares inducen factores cuadráticos reales de p. Por ello resulta razonable buscar factores
cuadráticos, lo cual puede hacerse con la ayuda de la iteración de Newton.
Demostración Sean r¡, r2, ... , rn los ceros de p. Entonces p(z) = C rr;=¡(Z - rj). El término de TEOREMA 8 Si el polinomio p(z) = a.z" +a._ 1 z•-I +· · · +a0 se divide entre el polinomio cuadrático
corrección en la iteración de Newton es -p(z)/p'(z). La derivada de p es z1 - uz -v, entonces el cociente y el residuo

q(z) = bnt-2 + bn -1t-3 + · · · + b3z + b2


¿ TI(z -r¡)= ¿_ p(z)/(z -rk) = p(z) ¿(z -rk)-1.
n n n n
p'(z) = c
k
=I i=I k =I k =I r(z) = b¡ (z -u) + bo.
i"k
pueden calcularse de manera recursiva, estableciendo que bn+I = bn+l = O y luego
Queremos mostrar que para cualquier z (que juegue el papel de xk) existe un índice j utilizando
para el cual lz -ryJ � nJp(z)/p'(z)I. Si ningún índice} satisface la desigualdad deseada, bk = ak + ubk+l + vbk+2 (k = n, n - 1, ... , O)
entonces, para toda}, lz -rjl > n\p(z)/p'(z)I. De aquí resulta que
Demostración La relación entre p, q, y r se expresa mediante
-1
lz - r j¡-1 < !¡p'(z)/p(z)I= !j I)z -rkr j ! t lz -rk1 . p(z)= q(z)(z2 -uz -v) + r(z).
1
n n k n k=I

=I
En detalle esta ecuación nos dice que
Pero esto es imposible, dado que el promedio de n números no puede ser mayor que
cada uno de ellos.
Este teorema lo demostró Bodewig [1946).
11 takl=
k=O k=2
(t
bkl-2) (z2 -uz -v) + b1(z -u) +bo.
100 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 101

Si igualamos los coeficientes de i' de ambos lados de la ecuación,el resultado es: La solución de este sistema queda de la siguiente forma:

ak = bk - ubk+l - vbk+2 (O� k � n-2) J = coc2 -CT


ª•- 1 = bn - 1 - ubn 8u = (cib1 - c2bo )/J
ª• = b•. 8v = (cibo - cob 1 )/J
Dese cuenta de que J es el determinante jacobiano del par de funciones no lineales
Si hacemos que por definición bn+t y bn+2 valgan cero,la primera de estas tres ecuaciones
bo(u, v) y b ¡ (u, v).
incluye a las dos últimas. 11 A continuación se presenta un seudocódigo para ejecutar M pasos del método de
A continuación vamos a enfocar nuestro análisis sobre el caso en que todos los coefi­ Bairstow,empezando por un punto (u, v) prescrito. Sigue muy de cerca a la descripción
anterior.
cientes ak de p son reales. Buscaremos un factor cuadrático real del tipo considerado en input n, (a¡ : O � í � n), u, v, M
el teorema,y por lo tanto u y v serán reales. En el proceso de división mencionado líneas bn +- ª•
arriba, bo y b 1 son funciones de u y v,y por ello escribimos bo = bo(u, v) y b 1 = b ¡ (u, v). Cn <-O
Para que q sea un factor de p es necesario que el residuo r valga cero; esto nos lleva a Cn-1 <- an
las ecuaciones: for k = I, 2, . .., M do
bo(u, v) = O bn- 1 <-ª•-1 +ubn
b1 (u, v) = O. for k = n - 2,n - 3, ... , O do
bk <- ak + ubk+I + vbk+2
En el esquema del método de Bairstow este par de ecuaciones simultáneas no lineales Ck <-bk+I + UCk+I + VCk+2
se resuelven mediante el método de Newton. También es necesario usar las derivadas end
parciales: J<-coc 2 - cy
Bbk Bbk-t
Ck = 8u dk = av (k = O, I, .. ., n). u<-u+(c 1 b1 - c2bo)/J
v<-v + (c1bo - co bi)/J
Éstas se obtienen derivando la relación de recurrencia ya generada para bk en el teorema 8. outputj,u,v,bo,b1
El resultado es el siguiente par de relaciones de recurrencia: end.

(en+! = C n = 0) Ejemplo 7 Utilizando el método de Bairstow e iniciando con el punto (u, v) = (3, -4), encuentre
Ck = bk+I + UCk+I + VCk+2
(4) un factor cuadrático real del polinomio usado en los ejemplos anteriores.
dk = bk +I + udk+I + vdk+2 (dn+I = d,, = Ü). Respuesta Se escribió en doble precisión un programa de computadora que se apoya en el seudo­
Dado que estas relaciones de recurrencia obviamente dan lugar a la misma sucesión, código presentado líneas arriba. En la séptima iteración se obtuvo:
11ecesitamos sólo la primera de ellas. El esbozo del proceso es de la manera siguiente: u = 2.2756822036510
se les asignan valores iniciales a u y a v,se buscan correcciones, denotadas por 8u y 8v,
V = -3.6273650847118
de modo que las ecuaciones
bo = 0.2 X 10-t4
bo(u+8u, v+8v) = b ¡ (u+8u, v+8v) = O b ¡ = o.o.
sean correctas. Al igual que en la sección 3.2, se linealizan estas ecuaciones escribiendo Ya que b0 y b1 son prácticamente cero, podemos aceptar a u y a v como los valores
aproximados de los coeficientes en el factor cuadrático -? - uz - v. Combinando los
Bbo Bbo resultados de éste y de otros ejemplos anteriores podemos mostrar la factorización del
bo(u, v) + Bu8u + 8v8v = O polinomio p. (Se muestran sólo tres dígitos de precisión en la presentación.)
8b 1 &b¡
b¡ (u, v) + }u + Bv8v = o. z4 - 4z3 + 7z2 - 5z - 2 = (z - 2)(z + 0.276)(z2 - 2.28z + 3.63).
a
Los valores de los coeficientes se han dado previamente con mayor exactitud. A partir del
En vista de las observaciones anteriores,el sistema se convierte en: factor cuadrático se pueden calcular dos ceros complejos de p (usando sus coeficientes
más precisos),que son:
co c
2
8u
[cr c1] [8v] = _ [bbo(u,
(u, v)
v)
].
1.1378411018255 ± í(l.5273122508866). 1111
1
102 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 103

Para completar el análisis del método de Bairstow necesitamos establecer ( con una En este caso p es un polinomio de grado n. En la definición de C el signo se escoge de
hipótesis razonable) que el jacobiano J no es igual a cero en el punto solución. manera que I C I sea lo más grande posible. 11
TEOREMA 9 Sea (uo,va) un punto tal que los ceros de z 2 - uaz-va son ceros simples de p. Entonces Para este algoritmo el siguiente teorema de Kahan [1967] juega un papel análogo
eljacobiano en el método de Bairstow novale cero en (uo, va). al teorema 6 .
TEOREMA 10 Si p es un polinomio, si z es cualquier número complejo, y si C se calcula con el algoritmo
Demostración En cada paso del proceso tenemos: de Laguerre, entonces p tiene un cero en el plano complejo dentro de una vecindad de
z con radio ,/ñ/C.
p(z)= (z2 -uz -v)q(z) + b1 (z - u)+ba.
La derivación parcial respecto de u y dev nos proporciona estas dos ecuaciones: Demostración Al igual que en el teorema 6, denotamos los ceros de nuestro polinomio con r1, r2, ... ,
rn. Podemos suponer que p(x) = rr;=l (x - rj), con el coeficiente principal igual a
T] T] T] uno, ya que las fórmulas para A, B, y C no se ven afectadas por cualquier factor escalar
O= -zq(z)+(z2- uz-v)-q - b1 +-(z-
b1 bo
u)+-
T]U T]U T]U vinculado a p. Derivando p y haciendo Uj= (rj -z)- 1 obtenemos:
T]q T]b1 T]bo
O= -q(z)+(z2 - uz-v)-+-(z- u)+-. n n n n
T]V T]V T]V

A partir de las hipótesis sabemos que z 2 - u0z -va tiene dos ceros, llamémoslos z 1 y
p'(z) =¿TI (z- rk)= ¿p(z)/(z -rj)= -p(z) ¿ Uj.
j=l k=l j=l j=l
zz. Resulta entonces que p(z1 ) = O, p (z2 ) = O, b1 = O y ba = O. En las ecuaciones k-,j

anteriores tómense u= u0, v = va y además z = z1 o z= zz. De esto resultan cuatro


ecuaciones, a saber: Por ende

O= -Zjq(z,¡)+c¡(Zj - ua) + ca (j= 1,2)


A= -p'(z)/p(z)= ¿uj.
j=l
Ü= -q(Zj) + C2 (Zj - ua) + C¡ (j= 1, 2).
Derivando esta fórmula obtenemos:
Aquí usamos la notación y el análisis que aparece justo después de la demostración del
teorema 8. En forma matricial estas ecuaciones se expresan de la manera siguiente:
¿ uJ.
n n
-p(z)p (z) + [p/(z)]2
B= " 2 = ¿(rj -z)-2 =
Ca C¡ 1 1 Z¡q(Z¡) Z2q(z2) [p(z)] j=I j=l
[ C¡ Cz] [ Z¡ - U0 Z2 -ua] = [ q(z¡) q(z2 ) ] .
De la definición de C tenemos:
Para ver que la matriz jacobiana es no singular basta con demostrar que la matriz que
está a la derecha de la ecuación anterior es no singular. El determinante de esta matriz
es (z1 -z2 )q(z1 )q(z2 ). Ya que z1 y z2 son ceros simples de p, no pueden ser ceros de q . (nC - A)2= (n - l)(nB- A2). (5)
Por otra parte, z 1 * z 2, y por lo tanto este determinante no es cero.
La discusión que hemos presentado sobre el método de Bairstow es semejante a la Se define D= (A -C)/(n - 1) de manera que
presentación de Henrici [1964].
A= (n- l)D+ C. (6)
Iteración de Laguerre De la ecuación (5) se deduce que
Nos ocupamos ahora del método de Laguerre para encontrar los ceros de un poli­
nomio p. Este método se emplea en varios paquetes modernos de software debido a que n 2C 2 - 2nCA+A2 = (n - l)nB- nA2 +A2
tiene propiedades de convergencia muy favorables, y a que es bastante robusto. Muestra (n - l)B= nC2 -2CA + A2. (7)
una convergencia de tercer orden en la vecindad de cada cero simple. El algoritmo es
iterativo y pasa de una aproximación z de un cero a la siguiente, mediante el cálculo: En la ecuación 7 se reemplaza A por (n- 1)D+ C y se obtiene:
A= -p'(z)/p(z) 2
(n - l)B= nC 2 -2C[(n - l)D+ C] + [(n - l)D+ C]
B= A -p"(z)/p(z)
2
(n- l)B= nC2 - 2(n - !)CD- 2C 2 + (n- 1) 2D2 + 2(n - l)CD+ C 2
C = n- [A± 1
�l)(nB-A2)] (n - l)B= (n- l)C 2 + (n- 1) 2D2
Znueva= z+1/C. B= C 2 + (n - l)d. (8)
104 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 105

A partir de (7) yutilizando luego (6) y(8), llegamos a: ya


nB-A 2 = nC2-2CA+B rryn fz- rjf � /ñ/VfCf +(n- l)fDf . 2 2 (10)
=nC2-2C[(n- l)D+C] +C2+(n- l)D2 Esta desigualdad es más fuerte que la que aparece en el enunciado del teorema. La
demostración se debe a Kahan [1967]. 11111
= (n- l)C 2 - (n-1)2CD+ (n - l)D 2
= (n- l)(C-D)2. (9) A continuación se presenta un seudocódigo sencillo para ejecutar el método de
Laguerre en un polinomio dado con un punto inicial zo prescrito:
A partir de la ecuación (9) y utilizando las fórmulas para A yB obtenemos:
inputn, (a¡: O� i � n), zo,M, a
(n- l)f C-Df2 =fnB-A2f for k == 1, 2, ..., M do
=n-1 fn2B-2nA2+nA2f a. +- a(n)
� +-O
= n-1[ I)n2 uJ-2nAuj+A2)1 y+-0
forj =n-1, n-2, ... ,O do
Y+-ZoY+�
¡=l

= n-11 t(nuj-A/1 �+- zo�+a.


a. +- zoa.+ a(j)
¡=l
end
A+--�/a.
� n-1 ¿ fnuj-Af 2
B+-A2-2y/a.
C +-[A± J(n---l-)(n_B _ _ -
A2)]./n
j=l ;- -=-

Z¡ +-zo+ 1/C
n

=n-1 ¿ {n2fui- 2nRe(Áuj)+fA[2 } outputk, z


j=I if fz¡-zof < E then stop
ZO +-Z¡
L fui-2ÁA+fAf
n

=n 2
end.
j=I

� n máxfui-fAf2
2 En este algoritmo, a. es p(zo), � es p'(zo) yy es !p''(zo).
J LEMA 1 Sean v1, v2, ... , Vn números reales cualesquiera. Tómese a. = I:7=1 V¡ y� = I;;=I v¡.
=n2 máxfui-f(n- l)D+Cf2 Entonces los números v1 se encuentran en el intervalo cerrado cuyos extremos son:
J

=n máxfui-f(C-D)+nDf2
2 n-1[a.± ,/(n- l)(n�-a.2)]. (11)
J

=n 2 máxfui-f C-Df2 - 2nRe[D(C-D)]-n 2fDf2 Demostración Basta con demostrar que v1 se encuentra en el intervalo descrito. Recurriendo a la
J
desigualdad de Cauchy-Schwarz:
ypor lo tanto

(f (tx¡) (tyJ) ,
2

nf C-Df 2 � n 2 máxfu¡f2-n 2fDf 2- 2nRe(DC)+2nfDf 2 x,y,) �


J 1=! 1=! ¡=!
f C-Df 2 � n máxf u¡f 2-nfDf 2- 2Re(DC)+2fDf2
J al utilizarla tenemos que
fC[ 2 -2Re(CD)fDf 2 � n máxfu¡f2-nfDf - 2Re(DC)+2fDf2 2
a. 2-2a.v1 +vf =(a.-v¡) 2 =(v2+v3+ · · ·+v.)2
J

fCf2+ (n- l)fDf2 � n máxf u¡f2 = n/ mín lz- r¡f2. � (12+1 2+ .. ·+ i2)(v�+v�+ · · ·+v�)
J J
Esto lleva a == (n- l)(v�+v5+ · · ·+v�)
mfn fz- rj[ 1
� n/ {fC[ +(n- l)fDf }
2 2
= (n-1)(�-vf) = (n-1)�- nvf+ vf
J
106 Cap(tulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 107

Reordenando la desigualdad nos da: de donde se deduce que


nv?'- 2a.v¡ +a. 2
- (n-1)� � O.
rj �x-
1
< x<x-
1
� rj+I·
u(x) v(x)
Esto demuestra que la función cuadrática q(x) = nx2-2a.x +a.2 - (n
-1)� satisface la
propiedad q(v1 ) � O. Para valores grandes de lxl es obvio que q(x) > O. Por lo tanto v1 Por lo tanto, si iniciamos con x en (r;,rj+I) y calculamos x-1/u(x) y x-1/v(x),
se encuentra entre los dos ceros de q y estos son los extremos en la fórmula (11). 111 como en la iteración de Laguerre, entonces estos dos nuevos puntos se encontrarán en
[rj, rj+il- Claro está que si cualquiera de estos dos puntos es un extremo del intervalo,
LEMA 2 Sea p un polinomio real de grado n cuyos ceros r¡, r2, ..., rn, son reales. Para cualquier entonces se habrá calculado un cero de p. En el caso contrario, los dos nuevos puntos
número real x distinto de todos los rj, los números (x-rj)- 1 se encuentran en el inter valo están en (rj, rj+I), y el proceso puede repetirse. Para formalizar el proceso se definen dos
cuyos extremos son sucesiones [yd y [zd como se indica a continuación:

Yk+I = Yk- 1/u(yk) (k f: 1)


[np(x)r {p'(x) ± v[(n- l)p'(x)J - n( n- l)p(x)p"(x) }· (12)
1 2 Yo =x
ZO =x Zk+l = Zk-1/v(Zk) (k f: 1).

Demostración El polinomio p es de la forma p(x) = c IJJ=I (x- rj), Ya que la afirmación que se Nuestro análisis anterior muestra que
quiere demostrar es independiente de c, podemos suponer que c = l. Al igual que en
la demostración del teorema 10, con Vj = (x- rj)-1 , a. = ¿J=I Vj, y � = ¿J=I vJ, rj � Yk+I <Yk<.. ·<X<Z¡< · ..<Zk<Zk+l <l"j+I·
tenemos:
Ya que la sucesión [yk] decrece y está acotada inferiormente por rj, debe converger.
n Digamos que Y k 1 y. De las fórmulas de iteración se desprende que:
p'(x)/p(x) = :Z::::>j = a. (13)
j=l 1/u(yk ) = Yk-Yk+I -> O.
n
[(p'(x)) -p(x)p"(x)j/(p(z)) 2 =
2
¿ vJ = �.
j=l
(14) Por lo tanto u(y k) -> oo. Ahora, la fórmula para u indica que p(yk) -> O. De donde
p(y) = O y y = rj, De manera similar concluimos que Zk i rj+l ·
En el caso restante, el punto inicial no se encuentra entre dos ceros de p. Digamos
Del lema 1 se deduce que todos los números Vj se encuentran en el intervalo cuyos que x > r •. Suponga también que p(y) > O en(r n, oo). Procediendo como antes tenemos:
extremos están dados por la fórmula (11). Cuando los valores de a. y de � en las
ecuaciones (13) y(14) se sustituyen en esta fórmula, el resultado es la fórmula (12). il O< (x- r n)- 1 � u(x).

TEOREMA 11 Sea p un polinomio real cuyas raíces son todas reales. La sucesión producida por el De aquí se concluye que rn �x- 1/u(x) < x. Usando el mismo razonamiento vemos
algoritmo de Laguerre con un punto inicial arbitrario converge monótonamente a un que la sucesión [yn], tal como se definió anteriormente, decrece y converge a r.. 111
cero de p.
Se pueden encontrar estudios acerca del método de Laguerre en Bodewig [1946],
van der Corput [1946], Durand [1960], Foster [1981], Galeone [1977], Householder
Demostración Tomemos los ceros de p ordenados como r1 � r2 � • · • � r n. Suponga que x no es
[1970], Kahan [1967], Ostrowski [1966], Parlett [1964], Redish [1974], y Wtlkinson
un cero. Entonces, según el lema 2, todos los números (x-r¡)-1 se encuentran en el [1965].
intervalo cuyos extremos son:

u(x) = [p'(x)+w(x)]/np(x) y v(x) = [p'(x)-w(x)]/np(x), Método de Newton complejo


Para un polinomio que tenga coeficientes complejos, el método de Newton deberá
donde programarse en aritmética compleja. Una vez que se haya encontrado una raíz se de­
w(x) = V[(n- l)p'(x)]
2
- n(n- l)p''(x)p(x). berá utilizar el proceso de deflación (también programado en aritmética compleja). A
continuación el método de Newton puede aplicarse al polinomio reducido. Este proceso
Primero consideremos el caso en que 'J < x < l"j+I para alguna j. Suponga que se puede repetir hasta encontrar todos los ceros. Un análisis posterior y la experiencia
p(y) > O en (rj, rj+1); el otro caso es similar. Tenemos entonces: indican que el procedimiento en general será satisfactorio con tal de que se tomen dos
tipos de precauciones:
v(x) � (x-rj+J)- 1 <O< (x-rj)- 1 � u(x), l. Los ceros deberán calcularse en orden de magnitud creciente.
108 Capítulo 3 Solución de ecuaciones no lineales *3.5 Cálculo de ceros de polinomios 109

2. Cualquier cero que se obtenga mediante el uso del método de Newton en un una estación de trabajo, y a partir de ella se generó una gráfica coloreada. Los conjuntos
polinomio reducido deberá refinarse inmediatamente aplicando el método de de tres colores se acomodaron en una forma increíble que exhibía una aparienciafractal.
Newton al polinomio original, tomando como valor inicial la mejor estimación Esto significa que, al agrandar una parte del plano donde se unen dos conjuntos, obser­
que se tenga del cero. Sólo se podrá continuar con el siguiente paso de defleción vamos que se repite el mismo patrón general. Esta propiedad se mantiene si se repite el
una vez que se haya realizado esto. proceso de magnificación. Más aún, ¡todo punto frontera del primer conjunto es punto
Recomendamos que el lector consulte a Wtlkinson [1984] y a Peters y Wilkinson frontera del segundo conjunto, y también es punto frontera del tercer conjunto!
[1971] para profundizar en el tema. Se podrían estudiar muchos otros métodos para Recientemente se han publicado varios artículos y libros sobre fractales y caos.
encontrar las raíces de polinomios. En particular el método de Laguerre resulta muy Se puede encontrar información adicional en, por ejemplo: Barnsley [1988], Curry,
atractivo, debido a su favorable comportamiento global de convergencia Jenkins y Garnet y Sullivan [1983], Dewdney [1988], Glieck [1987], Mandelbrot [1982], Peitgen
Traub desarrollaron un método robusto muy adecuado para una amplia gama de software y Richter [1986], Peitgen, Saupe y Haeseler [1984], Pickover [1988], y Sander [1987].
[1970a]. Otras referencias que no se han mencionado son Allgower, Glasshoff y Peitgen
[1981], Gautschi [1979, 1984], Henrici [1974], Householder [1970], Ostrowski [1966], SERIE DE PROBLEMAS *3.5
Jenkins yTraub [1970b], Marden [1966], Smale [1981], Stoer y Bulirsch [1980], Ralston
y Rabinowitz [1978], y Traub [1964]. 1. Use el algoritmo de Homer para encontrar p( 4) si
A continuación se presenta una breve descripción de cómo se obtuvo la ilustración
p(z) = 3z 5
7 - 5z3 + z2 - Bz + 2
- z4
de la portada de este libro. Involucra el uso del método de Newton en el plano complejo.
Sea p un polinomio de al menos grado dos, y sea� uno de sus ceros. Si el método 2. Tomando el polinomio del problema 1, encuentre su desarrollo en serie de Taylor alrededor
de Newton se inicia en un punto z en el plano complejo, generará una sucesión definida del punto zo = 4.
por las ecuaciones: 3. Con el polinomio del problema 1, use el método de Newton empezando en el punto zo = 4.
¿Cuál es z1?
zo =z Zn+I = Zn - p(Zn)/p1(Zn) (n � 0). 4. Tomando el polinomio del problema 1, aplique el método de Bairstow con (u, v) = (3, 1)
como punto inicial. Calcule las correcciones ou y ov.
Si lím...... Zn = �, decimos que z ( el punto inicial) es atraído hacia �. El conjunto
00

de puntos z que son atraídos hacia � es conocido como la cuenca de atracción que 5. Encuentre para el polinomio del problema 1 un disco centrado en el origen que contenga
todos los ceros.
corresponde a �- Cada cero de p tiene una cuenca de atracción, y estos conjuntos son
ajenos entre sí, ya que una sucesión que converge a un cero de p no puede converger 6. Encuentre para el polinomio del problema 1 un disco centrado en el origen que no contenga
ningún cero.
a otro. Algunos números complejos no pertenecen a cuenca de atracción alguno; éstos
son los puntos iniciales para los que la iteración de Newton no converge. Dichos puntos 7. ¿Sucede alguna vez que el teorema 3 proporcione el radio del círculo más pequeño centrado
en el origen que contiene todos los ceros de un polinomio dado?
excepcionales constituyen el conjunto de Julia de p, así llamado en honor de G. Julia,
un matemático francés que publicó en 1918 una importante memoria sobre el terna. Si <g. Escriba un programa que tome como entrada los coeficientes de un polinomio p y un punto
todos los ceros de p son simples, las cuencas de atracción son conjuntos abiertos en el específico zo. y que como salida proporcione los valores de p(zo), p' (zo). y p"(zo). E�criba el
seudocódigo con sólo un ciclo. Póngalo a prueba con el polinomio del problema 1, tomando
plano complejo, y el conjunto de Julia es la frontera de cada cuenca de atracción. zo = 4.
En la portada de este libro se muestran las cuencas de atracción para el polinomio
p(z) = z3 - l . Las tres raíces de p son las raíces cúbicas de la unidad
<9, Escriba un programa que implemente el método de Newton complejo para un polinomio
que tenga coeficientes complejos, con un punto inicial en el plano complejo y un número
dado de iteraciones. Verifique su programa en el polinomio del problema 1, empezando por
O)¡= 1 0>2 = (-1 +v3i)/2 0)3 = (-l -v3i)/2. zo=3-2i.
10. Demuestre que todo polinomio que tiene coeficientes realespuede factorizarse en un producto
Tomamos una región cuadrada en el plano complejo y generamos un número grande de de factores lineales y cuadráticos que tienen coeficientes reales.
puntos de la malla en este cuadrado. Para cada punto de la malla se realizó una verifi­ 11. Verifique las relaciones de recurrencia y los valores iniciales dados para Ck y dk en la discusión
cación aproximada para determinar a qué cuenca de atracción pertenecía Esta verifica­ acerca del método de Bairstow.
ción consistió en seguir las primeras 20 iteraciones de Newton y constatar si alguna de
12. En el caso del polinomio p(z) = 9z4 7z3 + z2 - 2z + 5, calcule p(6), p1 (6), y el siguiente
punto en la iteración de Newton que empieza por z = 6.
-
ellas estaba a una distancia menor de 0.25 de una raíz. Si éste era el caso, las iteraciones
posteriores darían lugar a una convergencia cuadrática hacia dicha raíz. Este hecho se
estableció utilizando la teoría de convergencia normal del método de Newton en el plano 13. Usando la definición de multiplicidad que se adoptó en el texto, demuestre que si z es una
raíz de multiplicidad m de un polinomio p, entonces p(z) = p'(z) =· ·, =/m-l)(z) =O y
complejo. Así se generó un listado de puntos de la malla que pertenecían a cada cuenca /m>(z) a= O.
de atracción. Se asiguó un color a la cuenca de atracción de la raíz ro 1, y otros dos colores
a las cuencas correspondientes a las raíces 0>2 y m3• Estos tres conjuntos (de hecho sólo 14. Demuestre el enunciado inverso de la afirmación hecha en el problema anterior.
los puntos de la malla que les correspondían) se mostraron en la pantalla de colores de 15. ¿Genera el método de Bairstow una sucesión (uk, vk) que converja en forma cuadrática?
110 Capítulo 3 Solución de ecuaciones no lineales *3.6 Homotopía y métodos de continuación 111

16. Escriba un algoritmo que produzca una deflación en p(z) cuando se conoce una raíz Zo, <27. Diseñe un programa de computadora que utilice el método de Newton complejo para calcular
pero que calcule los coeficientes del polinomio reducido en orden ascendente, es decir, de las cuencas de atracción de las raíces cúbicas de la unidad, tal como se estudió en esta sección.
manera que el término constante aparezca primero. Muestre sus resultados en la terminal de gráficas de la computadora o estación de trabajo.
e 17. Experimente con el método de Laguerre codificado en aritmética compleja Encuentre las
cuatro raíces del polinomio utilizado en los ejemplos de esta sección.
<18. Usando el método de Newton y el polinomio p(z) = i3 - 1, encuentre tres puntos iniciales
cercanos(a no más de 0.01 uno del otro) de manera que las sucesiones resultantes converjan *3.6 Homotopía y métodos de continuación
a raíces distintas. Usando un graficador conecte puntos sucesivos con segmentos de línea, y
muestre las trayectorias de estas sucesiones de puntos dentro de un cuadrado que contenga
las raíces. En esta sección consideramos el problema de encontrar las raíces de una ecuación
e19. Escriba una rutina de computadora que utilice el método de Newton y la deflación para
encontrar todas las raíces de un polinomio. Verifique la rutina utilizando el polinomio f(x) = O.
pérfido de Wtlkinson, presentado en el problema 15 de la sección 2.3. (1)
20. Deduzca la ecuación(4).
Aquíf es una aplicación de un espacio lineal en otro, digamosj: X ...... Y. Este problema
21. Demuestre el siguiente resultado refiriéndolo al polinomio p(x) = ao + a¡x + · · · + an x". Para es suficientemente general para incluir sistemas de ecuaciones algebraicas, ecuaciones
una x dada hacemos (a.n, �n, Yn ) = (an, O , O) y definimos inductivamente: integrales, ecuaciones diferenciales, y otros más. Los métodos que se consideran a
(a.j, �j, yj) =(aj+ XC1.j+l, C1.j+l + �j+l, �j+l + xyj+l) continuación involucran una estrategia algo diferente de la utilizada en las secciones
anteriores, y este nuevo enfoque requiere la solución numérica de sistemas de ecuaciones
paraj = n - I, n - 2, ... , O. Entoncesp(x) = a.o,p'(x) = �o, y p"(x) = 2yo. diferenciales ordinarias, tema que no se tratará en este libro hasta el capítulo 8. Además,
22. Demuestre en el análisis del método de Laguerre que: una de las maneras de ilustrar el método incluye el problema de la programación lineal,
n
el cual se abordará en un capítulo posterior.
C2 +(n- l)D2 = �uf.
j=l Conceptos básicos
23. En la descripción del método de Laguerre se dijo que las cantidades Ay B son funciones de La idea básica del método de continuación es (incluir) el problema dado en una
z y dependen del polinomio p dado. Sea r un cero de p . Demuestre que las funciones
correspondientes Ay B parap(z)/(z-r) son: familia de problemas que dependan de un parámetro, utilizando un parámetro t que
recorre el intervalo [O, l]. Se hace corresponder el problema original con t = 1, y
A+(z-r)-1 y B-(z-d. se hace que otro problema con solución conocida corresponda a t = O. Por ejemplo,
podemos definir
24. Demuestre que si p es un polinomio de grado n con coeficientes reales, entonces
h(t, x) = tf(x) + (1 - t)g(x). (2)
"
(n - 1) [p/(x)]2 >
= np(x)p (x).
La ecuación g(x) = O deberá tener una solución conocida. El siguiente paso es elegir
<25. Escriba y ponga a prueba un programa que calcule todos los ceros de un polinomio complejo. los puntos to, t1, .•. , tm de manera que
Utilice el método de Laguerre y calcule los ceros en orden creciente de magnitud. Utilice
el procedimiento de deflación sobre un polinomio y mediante la iteración de Laguerre con el O = to < t¡ < tz < · · · < tm = l.
polinomio original refine cualquier cero obtenido del polinomio reducido. Para verificar su
programa calcule todas las raíces del polinomio:
A continuación intentamos resolvercada ecuaciónh(t¡, x) = O, (O� i� m). Suponiendo
x8 - 36/ + 546x6- 4536x5 + 22449x4- 67284x3 que se utilizará algún método iterativo (tal como el método de Newton), es prudente
+ l l 8124x2 - 109584x + 40320 = O. utilizar la solución en el i-ésirno paso como punto de partida en el cálculo de la solución
en el (i + 1)-ésimo pasó.
Las raíces correctas son los enteros !, 2, ... , 8. A continuación resuelva la misma ecuación,
pero con el coeficiente de x1, cambiado a-37. Observe cómo una pequeña perturbación en Este procedimiento puede considerarse como un remedio para la dificultad que
los coeficientes puede provocar fuertes cambios en las raíces. Por ende, las raíces son afecta al método de Newton: la necesidad de un buen punto inicial.
funciones inestables de los coeficientes. La relación (2), que incluye el problema original (1) en una familia de problemas,
<26. Modifique el algoritmo de Laguerre de manera que los polinomios que aparecen como aporta un ejemplo de una homotopía que conecta las funciones f y g. En general,
cociente se salven en la aplicación del algoritmo de Horner. Esto hace innecesario un cálculo
por separado del polinomio deflacionado después de que se ha calculado un cero. Verifique una homotopía puede ser cualquier conexión continua entre f y g. Fonnalmente, una
su programa con: homotopía entre dos funciones f, g: X ---> Y es una transfonnación continua:

z4 -(10 + 26z)z3 -(216 + !90i)z2 +(1140 + 636i)z-(72- 68i) = O. h: [O, 1] x X ---> Y, (3)
112 Capítulo 3 Solución de ecuaciones no lineales
*3.6 Homotopía y métodos de continuación 113

La inversa de f'(x) es:


tal que h(O,x) = g(x) y h(l, x) = f(x). Si esta transformación existe, decimos que
f es homotópica a g. Ésta es una relación de equivalencia entre las transformaciones [hxr 1 = [J'(x)r 1 = .!. [ l;l 61;2]
continuas de X a Y, donde X y Y son dos espacios topológicos cualesquiera. d -1;2 21;1 Ll= 21;i+61;�.
Una homotopía sencilla que con frecuencia se utiliza en el método de continua- La ecuación diferencial que rige la trayectoria que parte de Xo es la ecuación (8). En este
ción es: caso concreto es un par de ecuaciones diferenciales ordinarias:
h(t,x) = tf(x)+ (1 - t) [!(x) -f(Xo)]
1;; 1 l;1 61;2 1 1 l;1+421;2
= f(x)+ (t - l )f(Xo) [1;;]- -t.: [ -1;2 21;1 ] [7]-
(4)
-t.: [-1;2+141;1] .
Aquí x0 puede ser cualquier punto en X, y es evidente que Xo será una solución del Este sistema se integró numéricamente (utilizando uno de los métodos que se presentarán
problema cuando t = O. en el capítulo 8) en el intervalo O � t � 1, y en t= 1 la solución fue (- 2.96 1, l.978).
Si la ecuación h(t, x) = O tiene una raíz única para cada t E [O, 1], entonces la raíz Dese cuenta de que f tiene una raíz en (-3, 2).
es una función de t, y podemos escribir x(t) como el único miembro de X que hace válida Para finalizar este problema y encontrar su solución numérica podemos utilizar la
la igualdad h(t, x(t)) = O. El conjunto iteración de Newton, comenzando en el punto proporcionado por el método de homo­
topía. La iteración de Newton reemplaza cualquier raíz aproximada x por x - o, con la
{ x(t) : O � t � 1 } (5)
corrección o dada por:
o= [f'(x)r 1J(x).
puede interpretarse como un arco o curva en X parametrizado por t. Este arco lleva del
punto conocido x(O) a la solución del problema, x(1). El método de continuación intenta En este ejemplo el vector o es:
determinar esta curva mediante el cálculo de puntos en ella, x(to), x(t 1 , ••. , x(tm). º1 .!. l;1 61;2 l;f- 31;i+ 3 .
)
[ ]= [ -1; 2 J[
Si la función t --> x(t) es diferenciable, y si h es diferenciable, entonces el teorema 82 Ll 2 1;1 l;1l;2+6 ]
de la función implícita nos permite calcular x'(t). Siguiendo esta idea podemos describir Los siguientes resultados corresponden a tres pasos de la iteración de Newton:
la curva en (5) mediante una ecuación diferencial. Suponiendo una homotopía arbitraria
tenemos: k l;1 l;2
O= h(t, x(t)). (6) o -2.961000 000000 l.978000 000000
-3.000253 281314 2.000320 274478
Si diferenciamos respecto de t obtenemos
1
2 -3.000000 005780 2.000000 037824
O= hr(t, x(t))+hx(t, x(t))x' (t), (7) 3 - 3.000000 000000 2.000000 000000 11
El siguiente resultado formal, debido a Ortega y Rheinboldt [1970], proporciona algunas
donde los subíndices denotan derivadas parciales. Así condiciones bajo las cuales el método de homotopía tiene éxito.
x'(t) = -[hx(t,x(t))]-1hi (t,x(t)). (8) TEOREMA Sif:lR." --> lR." es continuamente diferenciable y si IJJ'(x)- 1 11 � M en lR.", entonces
para cualquier Xo E IR" existe una curva única {x(t) : O � t � I} en IR" tal que
Esta es una ecuación diferencial para x. Tiene un valor inicial conocido, ya que x(O) se f(x(t))+ (t - llf(Xo) = O, con O � t � l. La función t H x(t) es una solución
supone conocido. Al integrar esta ecuación diferencial (en general mediante procedi­ continuamente diferenciable del problema de valor inicial x' = -[ f'(x)]-1f (Xo), donde
mientos numéricos) tendremos el valor x(l ), que es la solución. x(O) =xo.

Ejemplo 1 Hagamos X= Y= lR.2, y definamos Trazado de la trayectoria


- 3/;i+ 3
f(x) = [l;f 1 X= (/;1, /;2) E lR.2. García y Zangwill [1981] han descrito otra manera de trazar la trayectoria x(t).
l; 1l;2+6 Partimos de la ecuación h(t,x) = O, suponiendo que x E lR." y que t E [O, l]. Un vector
y E JR.•+I se define como
La ecuación (4) nos da una homotopía conveniente, y elegimos xo = (1, 1). Las derivadas
en el segundo miembro de la ecuación (8) resultan ser: Y= (t, l; 1 . l;2, ..., I;.).
donde 1;1 , 1;2, ... , 1;. son las componentes de x. Por lo tanto nuestra ecuación queda
/81;¡ fJf¡/81;2] =[ 21;1 -61;2 ] simplemente como h(y) = O. Cada componente de y, incluyendo t, puede ser una
hx =J'(x) = [[)f¡ l;2 l;1 función de una variable independientes, y entonces se escribe h(y(s)) = O. Al derivar
8h/l;1 8 f2/l;2
respecto de s obtenemos la ecuación diferencial básica:
f1 (Xo)
h,=f(xo) = [ (xo)1 = [711 . h' (y(s))y'(s) = O. (9)
fz
114 Capítulo 3 Solución de ecuaciones no lineales *3.6 Homotopía y métodos de continuación 115

Al igual que t, la variable s parte de O . El valor inicial de x es x(O) = x0• Con ello se �
dispone de valores iniciales adecuados para la ecuación diferencial (9).
Ya que f y g son aplicaciones de R" en JR", entonces h es una aplicación de JE.•+l Fin
en lR". Por lo tanto, la derivada h'(y) está representada por una matriz A den x (n + 2.0
1). El vector y(s) tiene n + I componentes, las cuales denotamos con 11 1, 11 2, ••. ,
Tln+ ¡. Recurriendo al lema que aparece más adelante obtenemos otra forma de la ecuación
(9), a saber,
TI¡ = (-!/ det(Aj) ( l�j�n+ l), (10) Principio

donde Aj es la matriz den x n que resulta de A al omitir laj-ésima columna Ilustremos


1.0

este formalismo con el mismo problema del ejemplo l.

Ejemplo 2 Tomando f y x0 igual que en el ejemplo 1 tenemos:

[�t - 3�� +2 +t] . --3.0


.....L-----'-----.1...--
-2.0 -1.0
---+------'-----
1.0
�¡

h(t, x) =
�1�2 - 1 +7t
Figura 3.7 La trayectoria generada en el ejemplo 2.
La ecuación diferencial (9) está dada por

[
oh¡/at EJhi/0�1 8h1/B�2 �'. = [1 2�1 -6�2] [�] =
] [ J
oh2/8t fJhi/8�1 8h2/8�2 ; 7 �2 �1 O
[º]. Ol) Demostración Seleccione cualquier fila (por ejemplo la i-ésima) de A y añada una copia de él a la cabeza
de A, como si fuera una nueva fila. Esto genera una matriz B de (n + 1) x (n + 1) que

obviamente es singular, debido a que la fila i de A aparece dos veces en B. Al desarrollar
��

Sin embargo, es preferible usar la ecuación (10) y escribir las ecuaciones diferenciales el determinante de B a partir de los elementos de su fila superior obtenemos:
en la forma
t' = -(�t +6�1) t(O) = O n+l

O= detB = ¿(- l)Í a¡¡det(Aj) = ¿ a¡¡xj.


n+I

{ �;= �¡ +4�2 �l (0)= 1 (12)


�; = -(�2 - l�¡) �2(0) = l.
j=l j=l

En este sistema las derivadas se toman respecto de s. Dado que desearnos que t varíe de Ya que esto es cierto para i= 1, 2, . .. , n, tenemos que Ax= O. 1111
O a 1, es evidente (a partir de la ecuación que determina t) que debemos hacer que s se
desplace hacia la izquierda. En forma alternativa, podemos recurrir a la homogeneidad
del sistema y simplemente cambiar los signos del lado derecho de las ecuaciones pre­
Relación con el método de Newton
sentadas en (12). Siguiendo este camino, y llevando a cabo una integración numérica, El nexo entre los métodos de homotopía y el método de Newton es más profundo
llegamos a los siguientes dos puntos: de lo que parece a primera vista. Empecemos con la homotopía

s = .087 t= .969 �l = -2.94 �2= 1.97 h(t, x)= f(x) - e-1f(xo). (13)
s = .088 t= 1.010 �l= -3.02 �2 = 2.01.
En esta ecuación, t varía desde O hasta oo. Buscamos una curva o trayectoria, x = x(t),
Tal como se hizo en el ejemplo 1, puede utilizarse cualquiera de estos puntos para iniciar en la cual
una iteración de Newton. La figura 3.7 ilustra la trayectoria generada por esta homotopía O= h (t,x(t))= f(x(t)) -e-1f(XQ).
11
Como es usual, la derivación respecto de t nos lleva a una ecuación diferencial que
Una desventaja del método utilizado en el ejemplo 2 es que no tenemos conoci­ describe la trayectoria:
miento a priori del valor de s que corresponde a t = l. En la práctica es posible que se O= J'(x(t))x'(t) + e-tf(xo)
tenga que ejecutar el programa varias veces.
= J'(x(t))x'(t) +f(x(t))
LEMA Sea A una matriz de n x (n + 1). Una solución de la ecuación homogénea Ax= O está
dada por Xj = (-1)i det(Aj), donde Aj es A sin la columna j. x'(t) = -[f'(x(t))r f(x(t)) (14)
1
116 Capítulo 3 Solución de ecuaciones no lineales *3.6 Homotopía y métodos de continuación 117

Si esta ecuación diferencial se integra mediante el método de Euler (descrito en la sección y suponiendo que para alguna función acotada G,
8.2) usando un tamaño de paso 1, el resultado es la fórmula
f(x) = D(x)G(x). (17)
1
Xn+I = Xn - [f'(x.)]- f(x. ).
Si éste es el caso, entonces de las ecuaciones (15) y (17) obtenemos:
Es evidente que ésta es la fórmula para el método de Newton. Está claro que se pueden
esperar mejores resultados integrando la ecuación (14), con un método numérico más x/ =x;G;(x)
preciso y un tamaño de paso variable. (Para estas cuestiones consulte el capítulo 8.)
y claramente x/ -> O si X¡ -> O.
Para satisfacer la condición (ii) basta con pedir que Ax1 = O. Ya que x' = f = DG,
Programación lineal debemos exigir que ADG = O. Esto se resuelve convenientemente si hacemos G = PH,
El método de homotopía se puede utilizar para resolver problemas de programación donde Hes cualquier función, y Pes la.proyección ortogonal sobre el espacio nulo de
lineal. (Tales problemas se discuten en el capítulo 10.) Este enfoque nos conduce de AD.
manera natural al nuevo algoritmo propuesto por Karmarkar [1984]. Al explicar el Finalmente, para asegurar la validez de la propiedad (iii); deberemos seleccionar H
método de homotopía en este contexto seguimos de cerca la descripción debida a Brophy de manera que crx(t) sea creciente. Así, deseamos que
y Smith [1988]. El lector que desee explorar con mayor profundidad estas ideas puede
d
consultar provechosamente las otras referencias que aparecen más adelante. 0< dt(cYx(t)) = cr x' = crf(x) = crDG=crDPH.
Considere el problema de programación lineal estándar:
De es una selección conveniente para H, ya que en este caso, si v = De, entonces
maximizar crx
{ (15)
sujeto a Ax = byx � O. crDPH = crDPDc = vr Pv = (v, Pv)

En este caso e E IR", x E IR", b E IRm y A es una matriz de m x n. Partimos de un punto


= (v-Pv+Pv,Pv) = (Pv,Pv) � O.
factible, esto es, un punto x0 que satisface las restricciones. El conjunto factible es: Obsérvese que v - Pv es ortogonal al rango de P, y que (v - Pv, Pv) = O.
La versión final de nuestro problema de valor inicial es:
:F = { X E IR" : Ax = b y X � o }
Nuestra intención es desplazarnos de xº a una sucesión de puntos, permaneciendo siem­ x' = D(x)P(x)D(x)c x(O) = x0. (18)
pre en :F, e incrementando el valor de la función objetiva, crx. Está claro que si nos
La fórmula teórica para Pes:
movemos de x0 a x 1 , la diferencia x 1 - xº debe encontrarse en el espacio nulo de A .
Trataremos de encontrar una curva t H x(t) en e l conjunto factible, iniciando en x0 y
P = I - (ADl[(AD)(ADlr AD.
1
que conduzca a una solución del problema extremal. Nuestros requerimentos son: (19)

(i) x(t) � O para t � O =


La validez de esto depende de que B AD tenga rango completo de manera que BBT
sea no singular. A su vez, esto requerirá que X¡ > O para cada componente. Con ello los
(ii) Ax(t) = b para t � O
puntos x(t) deberán permanecer en el interior del conjunto
(iii) crx(t) es creciente para t � O.
La curva se definirá por un problema de valor inicial: {X: X� 0 }.

x' =f(x) x(O) = xº . (16) En particular xº deberá seleccionarse de esta forma. En la práctica Pv no se calcula
mediante la fórmula (19), sino resolviendo la ecuación BBrz = Bv y utilizando
La tarea que enfrentamos es determinar una f apropiada. Para satisfacer la condición
(i) debemos asegurar que siempre que una componente x; tienda a O, su velocidad r¡(t) Pv = v-Brz.
también se aproxime a O. Esto se puede lograr escribiendo
El problema de valor inicial (18) no necesita resolverse con mucha precisión. Se puede
[XI Ü1 usar una variante del método de Euler. Recuérdese que el método de Euler para la
Xz ecuación (16) nos dice que:
D(x) =
0 Xn x(t + 8) = x(t) + Bx' (t) = x(t) + of(x).
118 Capítulo 3 Solución de ecuaciones no lineales Capítulo 4

Utilizando este tipo de fórmula generamos una sucesión de vectores xº, x 1 , • • • mediante
la ecuación RESOLUCIÓN DE SISTEMAS
/ = i + 8,J(i).
+l
DE ECUACIONES LINEALES
Aunque resulta muy tentador tomar el valor de 8k tan grande como sea posible, en tanto
se satisfaga el requerimiento xk+I E :F, esto conducirá a un punto xk+1 que tenga al
menos una componente igual a cero. Como mencionamos antes, esto provocará otras 4.1 Álgebra de matrices
dificultades. Lo que parece funcionar bien en la práctica es tomar a 8k aproximadamente 4.2 La factorización LU y la factorización de Cholesky
como 9/10 del paso máximo posible. Éste último se calcula fácilmente; es la A. máxima 4.3 Pivoteo y construcción de un algoritmo
para la cual xk+I � O. (La restricción Ax = b se mantiene automáticamente.) 4.4 Normas y análisis de errores
4.5 Series de Neumann y refinamiento iterativo
*4.6 Solución de ecuaciones con métodos iterativos
SERIE DE PROBLEMAS *3.6 *4.7 Métodos del descenso máximo y del gradiente conjugado
l. Resuelva el sistema de ecuaciones *4.8 Análisis de los errores de redondeo en el método de Gauss
X -2y+ l +y3 - 4= -X - y+ 2/ - 1 = 0
mediante el método de homotopía utilizado en el ejemplo 2, iniciando con el punto (O, O).
(Todos los cálculos se pueden hacer sin recurrir a métodos numéricos.)
2. Considere la homotopía h(t, x) = tf(x)+ (1 - t)g(x), en la cual
El objetivo principal de este capítulo es examinar los aspectos numéricos que se presentan
2
f(x) =x -5x+6 g(x) =i-1. al resolver sistemas de ecuaciones lineales de la forma

Pruebe que no existe una trayectoria que conecte un cero de g con un cero def. a¡¡xi. + a¡2X2+ a13X3 + · · · + a¡nXn = b¡
3. Sea y = y(s) una función diferenciable de IR a IR" que satisface la ecuación diferencial (9). az¡X¡ + a22X2+ a23X3 + · · · + a2nxn = b2
Suponga que h(y(O)) = O. Demuestre que h(y(s)) = O.
4. Si se utiliza el método de homotopía del ejemplo (2) en el sistema a3¡X¡ + a32X2+ a33X3+ · · · + a3nXn = b3 (1)

senx+ cosy+ /Y= tan-1(x +y) -xy = O


an¡X¡+ an2X2+ an3X3 + · · · + annXn = bn,
iniciando en (0, O), ¿cuál es el sistema de ecuaciones diferenciales que rige la trayectoria?
5. Demuestre que la homotopía es una relación de equivalencia entre las aplicaciones continuas Éste es un sistema den ecuaciones en las n incógnitas x¡, Xz, •.•, Xn , Los elementos aij
de un espacio topológico en otro. y b; se supone que son números reales fijados.
6. ¿Son homotópicas las funcionesf(x) = senx y g(x) = cosx? Las matrices son instrumentos muy útiles para representar sistemas de ecuaciones.
7. Considere las siguientes aplicaciones de [O, l] en (O, l] U (2, 3] Así, el sistema (1) se puede escribir como:
f(t)=O g(t)=2.
ra11 a¡z a¡3 a¡n X¡ b¡
a21 a22 a23 a2n Xz b2
¿Son homotópicas? I
a3¡ a32 a33 a3n X3 = b3

an¡ an2 an3 ann Xn bn


Entonces podemos denotar estas matrices por A, x y b de forma que la ecuación se reduce
simplemente a:
Ax=b.
En este capítulo, vamos a construir un algoritmo de alcance general para resolver
este problema. Después vamos a analizar los errores que aparecen cuando se resuelve

119
120 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.1 Álgebra de matrices 121

con ayuda de una computadora, y los distintos métodos para controlarlos y reducirlos. 3 2 -1 = 6 -3
[1 3] [ 3 9]
Finalmente, vamos a introducir el tema de los algoritmos iterativos para resolver este 4 -4 12 -12
problema.
l. 5 -6 ; � -4
[2 1 3] [ -3
]= �
1;]
[-
2 1 5 3 19
O 3
4.1 Álgebra de matrices O 1 -2 -5 -2
Cuando se trata con sistemas de ecuaciones lineales hay un concepto de equivalen­
En esta sección daremos un repaso a los conceptos básicos de la teoría de matrices. El cia que es muy importante. Considere dos sistemas de ecuaciones, cada uno de ellos
material adicional sobre este tema se irá introduciendo y examinando en las secciones compuesto de n ecuaciones con n incógnitas:
subsiguientes cuando así sea necesario.
Ax=b Bx=d.

Si los dos sistemas tienen exactamente las mismas soluciones, decimos que son equi­
Conceptos básicos
Una matriz es una disposición rectangular de números como, por ejemplo, valentes. En lugar de resolver un sistema de ecuaciones, podemos resolver cualquier
3.0 1.1 -0.12 sistema equivalente; ninguna solución se pierde y ninguna nueva aparece. Esta idea tan
3.2 simple es la sustancia de nuestros procedimientos numéricos. Dado un sistema de ecua­
6.2 o.o 0.15
[
0.6 -4.0 1.3
l 7 -17]
(3 6 ll [ -4.7 ] ciones cuya solución se busca, lo transformamos -por medio de ciertas operaciones
0.11 elementales- eh un sistema equivalente más simple que podemos resolver en su lugar.
9.3 2.1 8.2
Las operaciones elementales que mencionamos en el párrafo anterior son de los
Éstas son, respectivamente, una matriz de 4 x 3, una matriz de 1 x 4 y una matriz de siguientes tres tipos. (Aquí E; representa a la i-ésima ecuación del sistema.)
3 x 1. Al describir las dimensiones de una matriz, el número de filas (líneas horizontales) (i) Intercambiar dos ecuaciones del sistema: E¡ H E¡
se indica primero y el número de columnas (líneas verticales) en segundo lugar. Las (ii) Multiplicar una ecuación por un número distinto de cero: 'U¡ -+ E¡
matrices de 1 x n se llaman vectores fila. Las matrices de m x 1 se llaman vectores
columna o simplemente vectores. (iii) Añadir a una ecuación un múltiplo de alguna otra ecuación: E¡+ "A.E¡ -+ E¡
Si A es una matriz, las notaciones ªif , (A)if o A(i,j) se utilizan para denotar al
elemento en la fila i y la coiumnaj. Por ejemplo, si A denota a la primera de las matrices TEOREMA 1 Si un sistema de ecuaciones se obtiene a partir de otro por medio de una sucesiónfinita
que se muestran arriba, entonces A(3, 2) = -4.O. La traspuesta de una matriz se denota
Ar y es la matriz definida como (Ar )if = ají· Volviendo a nuestro ejemplo, la traspuesta
� operaciones elementales, los dos sistemas son equivalentes.

de la matriz A es Demostración Basta con examinar el efecto de una sola aplicación de cada operación elemental. Su­
3.0 0.2 0.6 9.3 ponga que una operación elemental transforma el sistema Ax=b en el sistema Bx=d.
Ar = [ 1.1 O.O -4.0 2.1] . Si la operación es del tipo (i), los dos sistemas constan de las mismas ecuaciones aunque
-0.12 0.15 1.3 8.2 estén escritas en distinto orden. Es evidente que si x es una solución del primer sistema
Cuando una matriz A tiene la propiedad de que Ar = A, decimos que A es simétrica. también resuelve al segundo y viceversa. Si la operación es del tipo (ii), suponga que
Si A es una matriz y J.. un escalar (es decir, un número real en este contexto) fue la i-ésima ecuación la que se multiplicó por un escalar J.. con J..* O. Las ecuaciones
entonces J..A se define como (J..A)if = J.. a¡¡ Si A=( a if) y B = ( b¡¡) son matrices de i-ésima yj-ésima de Ax = b son:
m x n, entonces A+ B se define como (A+ B)if = a¡¡+ b¡¡. Obviamente, -A significa
(-1 )A. Si A es una matriz de m x p y B es una matriz de p x n, entonces AB es una a¡¡X¡ + · · ·+ ainXn = b¡
matriz de m x n definida como
(2)

a¡¡X¡ + · · ·+ a¡nXn = b¡
y
¿ aikb (1 � i � m, 1 �j � n).
(3)
y la i-ésima ecuación en Bx = d es
(AB)if = kj
k=I

He aquí algunos ejemplos de estas operaciones algebraicas: J..a¡¡X¡ + · · ·+ Aa ¡nXn = J..b ¡. (4)

[� -i]
4 -4
+ [� -�] = [ ;
8 2 12 -2
-!] Como J..* O, cualquier vector x que satisfaga la ecuación (2) satisface la ecuación (4)
y viceversa. Por últímo, suponga que la operación es de tipo (iii) y que se ha sumado
122 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.1 Álgebra de matrices 123
a la i-ésima ecuación A veces la j-ésima ecuación. En· tal caso la i-ésima ecuación de Demostración Sea C = BA - I + B. En tal caso
Bx = des:
(a¡¡ + A.aj ¡)X¡ + · · · + (a¡n + A.ajn)Xn = b; + Abj , (5) AC = ABA -Al+ AB = A -A+ I = I

Observe en particular que la j-ésima ecuación del sistema Bx = d no ha cambiado. y C (al igual que B) es una inversa por la derecha de A. Por el teorema 2, B = C, por lo
Si Ax = b, entonces las ecuaciones (2) y (3) son verdaderas. En consecuencia (5) es tanto BA = l. 11
verdadera. Por lo tanto Bx = d. Por el contrario, si suponemos que x es una solución
de Bx = d, entonces las ecuaciones (3) y (5) son verdaderas. Si se sustrae A veces la De los teoremas 2 y 3 se sigue que si una matriz cuadrada A tiene una inversa por
ecuación (3) de la ecuación (5), el resultado es la ecuación (2). Por lo tanto Ax = b. 11 la derecha B, ésta es única y BA = AB = l. En tal caso llamamos a B la inversa de A y
decimos que A es invertible o no singular. (Es obvio que B también es invertible y que
A es su inversa.) Escribimos B = A- 1 y A= B-1• He aquí un ejemplo:
Propiedades de las matrices
[-i �] [1 2] = [l 2] [-i �] = [1 º].
La matriz de n x n 2 -2 3 4 3 4 O 1
1 o o o 2 -2
o 1 o o Si A es invertible, el sistema de ecuaciones Ax=b tiene la solución x = A-1 b.
I= O 1 o CuandoA- 1 esté disponible, esta ecuación nos da un buen método para calcular x. Por
'� el contrario, si A- 1 no está disponible, no debería calcularse en general, con el solo
o o o propósito de obtener la solución x. Más adelante desarrollaremos métodos de mayor
eficiencia.
se llama matriz identidad. Tiene la propiedad de que 1A = A = Al para toda matriz A Las operaciones elementales que ya hemos visto se pueden realizar mediante la
den x n. multiplicación de matrices como se indica a continuación. Se define una matriz ele­
Si A y B son dos matrices tales que AB = I, se dice que B es una inversa por la mental como una matriz de n x n que se origina al aplicar una operación elemental a la
derecha de A y que A es una inversa por la izquierda de B. Por ejemplo, matriz identidad de n x n. Las operaciones elementales, expresadas en términos de las

º] [ º] [ º]
filas de la matrizA, son:
l
1 O 1 (i) El intercambio de filas de A: A, H A,
[010 � =01· (6)

(ii) Multiplicar una fila por una constante distinta de cero: AA, -> A,
(iii) Añadir a una fila un múltiplo de otra fila: A, + A.A, -> A,.
En este ejemplo podemos ver que la inversa por la derecha de una matriz, en caso de que
exista, no es necesariamente única. No obstante, para las matrices cuadradas la situación En esta descripción, hemos denotado las filas de A con subíndices, A,, A,, y así sucesiva­
es mejor, como a continuación se muestra. mente. Cada operación elemental sobre las filas de A se puede realizar multiplicando A
por la izquierda con una matriz elemental. He aquí tres ejemplos, cada uno de los cuales
TEOREMA 2 Una matriz cuadrada puede tener a lo sumo una inversa por la derecha. ilustra un tipo de operación:

Demostración SeaAB = I, en donde A, B e I son matrices den x n. SeaAUl laj-ésima columna de A


1 0 º]
ª11
[ o o 1 [ª21
a12
ª22
a13
a23] =
a11 a12 a13
[ a31 a32 a33]
e ¡(kl la k-ésima columna de l. La ecuación AB = I significa que
º]
O 1 O a31 a32 a33 a21 a22 a23
1 0 ª11a12 a13 a11 a12 a¡3
Lb A
n
= ¡(k) (1 � k � n). [O A O [ a21a22 a23] = [A.a21 A.a22 A.a23]
(7)

º]o
jk (i) O O 1 a3¡ a32 a33 a31 a32 a33
i=l
1 0 ª11 a12 a13 a11 a12 a13
Por lo tanto, cada columna de I es una combinación lineal de columnas de A. Como las [o 1 [ª21 a22 a23] = [ a21 a22 a23 ] .
columnas de I generan lR", lo mismo sucede con las columnas de A. En consecuencia, O A 1 a31 a32 a33 A.a21 + a3¡ A.a22 + a32 Aa23 + a33
las columnas de A forman una base de JR" y los coeficientes bjk en la ecuación (7) están Si lo que buscarnos es aplicar una sucesión de operaciones elementales a las filas de A,
determinados en forma única. 111 introducimos matrices elementales E1, E2, ••• , Em y escribimos la matriz transformada
-como
TEOREMA 3 Si A y B son dos matrices cuadradas y AB = I, entonces BA = l. EmEm-1 ·' · E2E1A.
124 Capítulo 4 Resoluci6n de sistemas de ecuaciones lineales 4.1 Álgebra de matrices 125

Cuando una matriz es invertible, tal sucesión de operaciones elementales con sus Una matriz A es definida positiva si xrAx > O para todo vector x no nulo. Este
filas la reducen a I. De este modo, concepto es de fundamental importancia en el estudio de las matrices. Por ejemplo, la
matriz
EmEm-1 · • · E2E1A=f. A= [� ; ]

De lo anterior resulta que A-1 = EmEm-l · · · E2E1. En consecuencia, A- 1 se puede es definida positiva, pues
obtener sometiendo a I a la misma sucesión de operaciones elementales con sus filas.
He aquí un ejemplo que nos muestra el cálculo de una inversa:
[i ;][::]
º
X
T
Ax= [x¡ X2] = (X¡ +xd +xf +Xi> 0

]
1 2 3 1 O
A= 1 I 3 3] [ O 1 O =l
para toda x1 y x2 salvo x1 = x2 = O. Aquí xrAx se llama forma cuadrática. De los

º
l2 4 7 O O 1 problemas 18 a 20 se deduce que al tratar con matrices definidas positivas podemos

]
1 2 3 [ 1 O suponer que son simétricas. Verificar que una matriz es definida positiva a partir de la
E1A = [O 1 O] -1 1 O = E1I definición no es, en general, una tarea sencilla, ya que la definición hace referencia a un

º
2 4 7 O O 1 vector arbitrario x * O. Si A es definida positiva y es simétrica, sus valores propios son
reales y positivos.

]
[1 2 3 1 O
E2E1A = O 1 O] [ -1 1 O = E2E1I

º
,o O 1 -2 O 1 Partición de matrices

]
[1 O 3 3 -2 A menudo conviene dividir las matrices en submatrices y calcular los productos
E3E2E1A = O 1 O] [ -1 1 O = E3E2E1I como si dichas submatrices fuesen números. Un ejemplo de este procedimiento es el

[ ¡-¡ -l ¡-¡ !l ¡-¡ l [J 1]


º
O O 1 -2 O 1 siguiente:

]
9 -2 -3

;] �]
1 O
o
[-�
[ -1 1 O =E4E3E2E1I=A-1.
E4E3E2E1A = [O 1 O ] [ 1 -1 o 1
O O 1 -2 O 1 O -1 [ �
1 o o
Aquí las matrices elementales son: o 1 1

º º 1

- ¡=¡ "] ¡-¡ l l


2 1

] ]
1 -1
[ 1 O [ 1 O
E1 = -1 1 O E2= O 1 O 1 2 7] [ 2

º
O O 1 -2 O 1
3 2
]
1 -2 1 O -3 ]
E3 = [O 1 O E4= O -1
[O 1 O] 3 2
O O 1 O O 1 5

TEOREMA 4 Para toda matriz n x n las siguientes propiedades son equivalentes: Si estas matrices se dividen como se muestra y si cada submatriz la representamos con
una sola letra, tendremos un producto de la forma:
(i) La inversa de A existe; es decir, A es no singular.
(ii) El determinante de A es distinto de cero. [A11 A12 [Bu B12] _ [C11 C12] .
-
(iii) Las filas de A forman una base de ntn. A21 A22J B21 B22 C21 C22
(iv) Las columnas de Aforman una base de JR.".
Podemos verificar que Cij=I:;;=l A;,B,¡. Así, por ejemplo,
(v) Como aplicaci6n de ntn en ntn, A es inyectiva (uno a uno).
(vi) Como aplicaci6n de R" en ntn, A es suprayectiva (sobre). 1 O 1]
1 O 1 -1 1 O
(vii) La ecuaci6n Ax = O implica que x = O. [1 21[_ ]+ 1 -1 O 1 [ = [ ¡ 2 7]
1 l 2 � 1 O
(viii) Para cada b E JR.", hay exactamente una x E nt•, tal que Ax=b. �
] 1 1
(ix) A es un producto de matrices elementales.
(x) O no es un valor propio de A. y, como muestra el cálculo, C11 = A11B11 + A12B21-
126 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.1 Álgebra de matrices 127

A fin de establecer un resultado de alcance general respecto de esta técnica, consi­ PROYECTO DE PROGRAMACIÓN
deremos tres matrices A, B y C, que se han dividido en submatrices:

A, , ]
Para aquellos lectores interesados en la experimentación numérica, sugerimos un proyecto de

ª ª
programación que se puede desarrollar por etapas. El proyecto incluye escribir un cierto número
[Au A12 ... B12
de subrutinas para llevar a cabo algunas tareas básicas en álgebra lineal Esta colección de su­
brutinas le suministrará un paquete personal de programas con los que podrá resolver sistemas de
A21 A22 ... A2n B21 B21c

[" "]
B22 ' ecuaciones, factorizar matrices de varias maneras y calcular valores propios y seudoinversas. La
A= B=

e"
primera parte del proyecto se describe en los problemas 12 (Sec. 4.1), 4 (Sec. 4.3), 50 a 55 (Sec.
4.3) y 56 (Sec. 4.4).
Ami Am2 ... Amn Bn1 Bn2 Bnk

C12 SERIE DE PROBLEMAS 4.1

[
C 21 C22 C
C2uk
C= 1. Pruebe que cualquier operación del primer tipo se puede realizar con cuatro operaciones de
los otros tipos, restringiendo). a los valores ±1.
Cm1 Cm2 cmk l 2. ¿Es cierto el teorema 1 para aquellos sistemas en que el número de ecuaciones difiere del
número de incógnitas?

TEOREMA 5 Si cada producto AisBsj se puede formar y si Cij=¿� 1 A;, B ,j, entonces C=AB. 3. Demuestre que cada operación elemental se puede anular por medio de una operación del
mismo tipo.
4. Considere el sistema de ecuaciones lineales Ax = b, donde A es una matriz de m x n,
Demostración Seanm¡ x nj las dimensiones deAij y Ín¡ XÍij las dimensiones de Bij· ComoAisBsj existe, x es den x 1 y b es de m x l. Denote los vectores columna de A con At, A2, ..., A•.
m,
se debe tener n, = para toda s. En tal caso Cij tendrá dimensiones m; x Íij .
Demuestre que el sistema tiene una solución si y sólo si b pertenece al espacio lineal generado
por {A1 ,A2, ...,A.}. Demuestre que si {A1,A2•... ,A.} es linealmente independiente, el
Considere ahora un elemento arbitrario Cij de la matriz C. Suponga que Cij se ubica sistema tiene a lo sumo una solución.
en el bloque C,, en la fila p y la columna q de C,,. En tal caso: 5. Sea E(p, q, t.) la matriz que resulta de añadir). veces la fila q a la fila p en la matriz identidad
den x n. Demuestre (suponiendo que p et q) que se cumple la igualdad E(p, q, A)-1 =
i=m¡ +m2 +···+m,_¡ +p ( 8) E(p, q, -A.). Demuestre que para cualquier matriz A de m x n, el producto AE(p, q, t.) se
calcula añadiendo A. veces la columna p a la columna q en A.
j=Íi¡ +Íi2+···+Íi,-1 +q. (9) 6. Una matriz monomial es una matriz cuadrada en la que cada fila y cada columna contiene
exactamente una sola componente distinta de cero. Demuestre que toda matriz monomial es
no singular.
En consecuencia,
7. SeaA una matriz subdividida en bloques de forma
Cij= (C,,)pq A=[g ;]

= (tAnBrs) en donde los bloques son de n xn. Demuestre que si B - I es no singular, entonces, para
t=I I pq k � I,
n A'=[i' CB'-1)c1-
n-1c].

l l [ t=;
=¿(AnBrs)pq
r=l 8. Multiplique las siguientes matrices, utilizando primero el método del producto por bloques
y después el producto ordinario.
¿ ¿(An)

[ ¡-¡ -!] ¡-¡


n n,

= ¡,u(Brs)aq
o o
�] !]
i] [ ¡ 1]
2] [ 1 -1
t=la=I o -1 1
o
[ �
1 o
Por la ecuación (8), sabemos que los elementos (An)pu están en la fila i de la matriz A. o 1 1
1 O -2
Estos elementos cubren la fila i de A, pues 1 � t � n y 1 � a. � n,. De la misma 2 1
1 1 -1
manera, por la ecuación (9) sabemos que los elementos (Brs)aq están en la columnaj de
B. Aquí también resulta que toda la columna está presente y conserva su orden natural. 9. En relación al problema 7, encuentre la estructura de bloques deAk cuando
Por lo tanto:
n A=[��].
Cij= ¿(A\Jl (B)�j = (AB)q. 11
�=! Demuestre su resultado por inducción matemática.
128 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 La factorización LU y la factorización de Cholesky 129

10. Demuestre que el conjunto de todas las matrices triangulares superiores de n x n es una Demuestre que Ao es simétrica, A1 es antisimétrica, que A = Ao +A1 y que para toda x,
subálgebra del álgebra de las matrices de n x n. En otras palabras, demuestre que el conjunto ?Ax = xrAo.x. Esto explica por qué, al estudiar las formas cuadráticas, podemos restringir
es algebraicamente cerrado bajo las operaciones de suma, producto y multiplicación por un nuestra atención a las matrices simétricas.
escalar.
21. Dé un ejemplo de una matriz simétrica A que contenga sólo componentes positivas con la
11. Demuestre que la inversa de una matriz triangular superior no singular es una matriz triangular propiedad de que xrAx sea negativa a veces.
superior.
22. ¿Puede una matriz tener una inversa por la derecha y una inversa por la izquierda que no
<12. Escriba y ponga a prueba subrutinas o procedimientos para lo que sigue: sean iguales entre sí?
(i) STORE (n, x, y), que sustituye el n-vector x por eln-vector y.
(ii) PROD (m, n, A. x, y), que multiplica el n-vector x por la matriz A de m x n y almacena el
resultado en el m-vector y.
(iii) MULT (k, m,n, A, B, C), que calcula C = AB, donde A es de k x m, B es de m x n y C es de 4.2 La factorización LU y la factorización de Cholesky
kxn.
(iv) DOT (n, x, y, a), que calcula (con aritmética de doble precisión) el producto escalar ¿�=l x¡y¡
y almacena la respuesta como un número real a de precisión simple. Nota: x;, y¡: a son Consideremos un sistema den ecuaciones en n incógnitas x1, x2, ••• , x•. Éste se puede
números de precisión simple. escribir en la forma
13. Sea A una matriz inversible den x n, y sean u y v dos vectores de R.". Encuentre condiciones
necesarias y suficientes para u y v para que la matriz a11 a12 a13 an X¡ b¡
¡
a21 ª22 a23 a2n Xz b2
a31 a32 a33 a3n 1 rX3 1 = rb3
[J �]
sea invertible, y dé una fórmula para la inversa cuando ésta exista. an1 ª•2 an3 ... aMJ LXnJ Lbn
14. Sea D una matriz en forma de particiones: Denotemos las matrices en esta ecuación con A, x y b. Así, el sistema es, simplemente,

D= [� f] Ax=b. (1)

Demuestre que si A - BC es no singular, D es no singular.


Sistemas fáciles de resolver
15.. (Continuación) Demuestre el resultado más fuerte acerca de que la dimensión del espacio
nulo de D no es mayor que la dimensión del espacio nulo de A - BC. Comenzamos con la búsqueda de sistemas que seanfáciles de resolver. Por ejemplo,
16. ¿Son definidas positivas las siguientes matrices? suponga que la matriz A de n x n tiene una estructura diagonal. Esto significa que todos
los componentes distintos de cero de A se encuentran sobre la diagonal principal y el
(a) [ -11 -1]
1
(b) [42 25 21] sistema ( 1) es de la forma:
1 2 4
a¡ o o o X¡ b
17. ¿Para qué valores de a es definida positiva la siguiente matriz?
o a22 o
¡
o Xz
¡
b2
o o a33 o
1 a
A= [a I a ª] X3 = b3

a a 1
o o o aM x. b.
18. Una matriz cuadrada A se dice que es antisimétrica cuando A = -A. Demuestre que si A
r
En este caso el sistema se reduce a n ecuaciones simples y la solución es:
es antisimétrica entonces xrAx = O para toda x.
19. (Continuación) Demuestre que los elementos de la diagonal de una matriz antisimétrica son b¡ /a ¡
O y que su determinante también es O cuando la matriz es de orden impar. b2/a¡22
20. (Continuación) Sea A una matriz cuadrada, y defina x= b3/a33
1
A1 = (A-A)
1
r
Ao = -(A+AT ) b./aM
2 2
130 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 La factorización LU y la factorización de Cholesky 131

Si a¡¡ = O para algún índice i, y b; = O también, entonces X¡ puede ser cualquier número Hay otro tipo de sistemas que se puede resolver fácilmente con ideas similares: a
real. Si a¡¡ = O y b; O, el sistema no tiene solución alguna.
* saber, los sistemas que se obtienen al permutar las ecuaciones de un sistema triangular.
Continuando la búsqueda de soluciones fáciles para el sistema (1), supongamos que Para esclarecer este punto, considere el sistema:
A tiene una estructura triangular inferior. Esto significa que todos los elementos de A
distintos de cero se sitúan sobre la diagonal principal o debajo de ella y el sistema (1) es: · a l1 a12 Ü XI [bl]
ª21 a22 a23 J x2] = b2 .
a¡ X¡ b [ [

11 a31 Ü Ü X3 b3
o o (4)
a21
¡ a22 Ü X2 b2¡
rX3 r
o
a31 a32 a33 Ü
º = b3 Con tan sólo reordenar las ecuaciones podemos obtener un sistema triangular inferior:

a3¡ Ü Ü] XI b3
a.1 a.2 an3 ··· ann J LXnJ Lbn
[a11 a12 Ü X2 = b¡ .
[ ] [ ]
Para resolver este sistema, supongamos que a;¡* O para todo i; en tal caso x1 se obtiene a21 a22 a23 b2
(5)

a partir de la primera ecuación. Sustituyendo el valor conocido de x 1 en la segunda


x3

ecuación, resuélvala para x2. Procediendo de la misma forma, se obtienen x1, x2, ••. , Xn , Este sistema se puede resolver de la manera previamente indicada En otras palabras,
uno por uno y en este orden. En este caso el algoritmo formal para encontrar la solución deberíamos resolver las ecuaciones del sistema (4) no en el orden usual 1, 2, 3 sino en
se llama sustitución progresiva: el orden 3, 1, 2.
Tratemos de describir de un modo formal la propiedad de matrices que acabamos
input n, (au), (b;) de considerar. Deseamos decir que una fila de A, digamos la fila p 1, tiene ceros en
las posiciones 2, 3, ... , n. Después, que otra fila, digamos la fila p2, tiene ceros en las
for i = l, 2, ... , n do
i-1 posiciones 3, 4, ... , n, y así sucesivamente. Si éste es el caso, utilizaremos la fila p 1 para
x¡ .- b; - a¡jXj / a¡¡ obtener X¡, la fila p 2 para obtener x2, y así sucesivamente. Si reordenásemos las filas en
� (2)
( ) el orden p 1, p2, ••. , Pn la matriz resultante sería triangular inferior.
¿ Cómo resolvemos Ax = b cuando A es una matriz triangular superior o triangular
inferior permutada? Supongamos que el vector de permutación (p 1, p 2, ... , Pn ) es cono­
end
output (x¡) cido o fue determinado ¡;,reviamente de algún modo. Modificando nuestros anteriores
algoritmos, llegamos a la sustitución progresiva para sistemas permutados:
Como es costumbre, cualquier suma del tipo X¡ en donde � < (l se interpreta
1:r=
como O. input n, (au), (b;), (p¡)
Se pueden utilizar las mismas ideas para resolver un sistema que tiene una estructura
for i = 1, 2, ..., n do
triangular superior. En este caso el sistema matricial tiene la forma: i-1

a11 a12 a13 a1n X¡ b¡


X¡ f- (
hp; - JXj / ap;i
; ap ) (6)
o a22 a23 ª2n X2 b2
o o a33 a3. X3 = b3 end
output (x;).
o o o ann Xn bn Por supuesto, esto funciona sólo en el caso de que A tenga la propiedad ªPJ = O para
j > i y ap,i O para toda i. De forma parecida, la sustitución regresiva para un sistema
Debemos suponer nuevamente que a;; O para 1 � i � n. El algoritmo formal que
*
permutado es:
*
resuelve para x se llama sustitución regresiva y es el siguiente:
input n, (aij), (b;), (p¡)
input n, (au), (b;) for i = n, n - 1, ... , 1 do
for i = n, n - 1, ..., 1 do X¡ f- ( hp; - .t ap;jXj) / ap;i

X¡ .- (b; - .t
1=1+1
a¡jXj) jau (3)
end
1=1+1
(7)

end output (x¡).


output (x;). Esto funciona cuando ap,j = O paraj < i y ap;i * O para toda i.
132 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 Lafactorización LU y lafactorización de Cholesky 133

Los algoritmos (2), (3), (6) y (7) no se han especificado con suficiente detalle como superior unitaria (u;; = 1 para cada i). Estos casos especiales revisten una particular
para que puedan traducirse directamente a alguno de los lenguajes de programación co­ importancia.
nocidos. Por ejemplo, el algoritmo (7) requeriría del siguiente conjunto de instrucciones Para deducir un algoritmo para la factorización LU de A, comenzamos con la
más elaborado: fórmula para la multiplicación de matrices:
input n, (aij), (b;), (p¡)
for i = n, n - 1, .. . , 1 do
¿l Usj = ¿ l;sUsj·
n mín(i,¡)

s f- bp, aij = is (9)


s=l s=l
for j = i+ 1, i+ 2, ... , n do
S f- S - ap1 jXj Aquí nos hemos valido del hecho de que lis = O para s > i y u,j = O. paras > j.
end En este proceso, cada paso determina una nueva fila de U y una nueva columna
X¡"'"" s/ap,i de L. En el paso k, podemos suponer que ya se calcularon las filas 1, 2, ... , k- 1 de U,
al igual que las columnas l , 2, ..., k- I de L. (Si k = 1, la suposición es obviamente
end
cierta.) Haciendo i = j = k en la ecuación (9) obtenemos:
output (x;).

¿l1csUsk+l UkJc.
k-I

Factorizaciones LU akk = kk (10)


s=l
Suponga queA se puede factorizar como el producto de una matriz triangular inferior
L con una matriz triangular superior U: A = LU. En este caso, para resolver el sistema Si UkJc o lkk se han especificado, utilizamos la ecuación (10) para determinar a la otra.
de ecuaciones Ax = b se puede proceder por etapas como sigue: Conocidas UkJc y ekk, utilizamos la ecuación (9) para escribir para la k-ésima fila (i = k)
y la k-ésima columna (j = k), respectivamente,
Resolver Lz = b para z
¿l1csu,j+l u/cj
k-1
Resolver Ux = z parax. a/cj = kk (k+ 1 �j � n) (11)
s=l
El análisis previo nos muestra lo simple que es resolver estos dos sistemas triangulares.
¿l Usk+l;kukk
k-1
Vamos a ver cómo se puede llevar a cabo la factorización A = LU, con el supuesto a¡k = is (k+ 1 � i � n) (12)
de que en el cálculo no aparecen divisores iguales a cero. No toda matriz tiene una s=l
factorización de esta índole, por lo que debemos investigar esta dificultad.
Comenzamos con una matriz A de n x n y buscamos matrices Si lkk * O, la ecuación (11) se puede utilizar para encontrar los elementos u/cj. Del
mismo modo, si UkJc * O, la ecuación (12) se puede utilizar para obtener los elementos
lu o o o UJ1 U¡z U¡3 Utn lile, Es interesante observar que estos dos cálculos pueden, en principio, desarrollarse
l21 l22 o o o U22 U23 U2,¡ en paralelo (es decir, simultáneamente). En algunas computadoras esto en realidad sí se
o U= o o U33
puede hacer, lo cual redunda en un considerable ahorro del tiempo de ejecución. Para
L= 1 l 1 l32 l33 UJn
una mayor información, véase Kincaid y Oppe [1988]. El cómputo de la k-ésima fila de

U y de la k-ésima columna de L, tal como se han descrito, completan el k-ésimo paso en
lnt ln2 ln3 lnn o o o UM el algoritmo. Los cálculos exigen divisiones porlkk y ukk ; en consecuencia, si alguno de
estos divisores es cero, los cálculos por lo general no se pueden concluir. Sin embargo,
tales que se puede en algunos casos llevar éstos a buen término. (Véase el Prob. 43.)
A=LU. (8) El algoritmo basado en el análisis precedente se llama factorización de Doolittle
cuando L es triangular inferior unitaria (l;; = 1 para 1 � i � n) y factorización de
Cuando esto es posible, decimos que A tiene una descomposición LU. Se puede ver Crout cuando U es triangular superior unitaria (u;; = 1 para 1 � i � n). Cuando
que las ecuaciones (8) no determinan a L y U en forma única. De hecho, para cada i, U = Lr de modo que lu = u;; para 1 � i � n, el algoritmo se llama factorización de
podemos asignar un valor distinto de cero al;¡ o a u¡¡ (mas no a ambos). Por ejemplo, una Cholesky. El algoritmo de Cholesky lo vamos a estudiar con más detalle en esta sección,
elección simple es fijarl;; = 1 para i = 1, 2, ... , n, haciendo de este modo a L una matriz ya que la factorización requiere que la matriz A tenga varias propiedades especiales: a
triangular inferior unitaria. Otra elección obvia es hacer de U una matriz triangular saber, A tiene que ser real, simétrica y definida positiva.
134 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 Lafactorización LUy lafactorización de Cholesky 135

El algoritmo para la factorización LU es el siguiente: for i = k + 1, k + 2, ..., n do

eik -(a¡k - � eisUsk) /Ukk


inputn, (aij)
for k = 1, 2, ... , n do end
Especificar un valor distinto de cero para end
ekk o ukk y calcular el otro a partir de output (eii), (uif).

I:
k-1
ekkukk = ªkk - e1csu,k Ejemplo Encuentre las factorizaciones de Doolittle, Crout y Cholesky de la matriz
s=l 603020
forj = k + 1, k + 2, ... , n do A= [ 302015

f
]
2015 12
ukj -(akj - e1csu,j) /ekk

º]
Respuesta La factorización de Doolittle es, a partir del algoritmo,
s=I
end
!
1 O 603020
for i = k + 1, k + 2, ..., n do A= [ 1 O [ O 5 5 ::LU
l3 1 1l ] O O 3
eik -(a¡k - � eisUsk) / Ukk
En vez de calcular las otras dos factorizaciones directamente, las podemos obtener a
end partir de la factorización de Doolittle que acabamos de ver. Si ponemos los elementos
de la diagonal de U en una matriz diagonal D, podemos escribir

º] º] ! !] =
end
1 O 60O l
OUtpUt (eij ) , (U¡j)•
A=
[
i 1 O [ O 5 O [O 1 1 WU
11 1
3
0 013 001
Observe el posible paralelismo (simultaneidad ) en el cómputo de la k-ésima fila de
U y de la k-ésima columna de L. (Véase el Prob. 59.) Si escribimos L = W, obtenemos la factorización de Crout:
En la factorización A = LU con L triangular inferior y U triangular superior, se
obtienen, a partir de la ecuación ( 9 ), n2 ecuaciones para los n2 +n elementos desconocidos
60O
A = [ 305 O
º] [1 O
l l]
i i = LU
de L y U. Obviamente, n de ellos deben especificarse. Una factorización más general 205! 001
permitiría que n elementos de L y U fuesen especificados y resolvería el sistema de
ecuaciones resultante. Desafortunadamente, dicho sistema podría ser no lineal en eif y La factorización de Cholesky se obtiene al descomponer Den la forma D 1 12D 1 12 en la
u9. (Véase el Prob. 53.) En el algoritmo recién expuesto hay que especificar, ya sea ekk, factorización LD fJ, asociando un factor a L y el otro a fJ. Así,
o Ukk, para después calcular los elementos de la k-ésima columna de L y de la k-ésima
fila de U, antes de movernos a la siguiente fila y a la siguiente columna Es más, en estos
l O
! º] [y'bO O º] [y'bO O º] 1 ! !]
iv'3 iv'3
A= [ 1 O O v5 O O v5 O [O 1 1

º] [
cálculos el orden k = l , 2, ..., n es importante.
i
1 1 O O O O O O 1

y'bO v'5o o y'bOo !v'6o iv'6o


El seudocódigo para llevar a cabo la factorización de Doolittle es el siguiente:.

!v65 v'5 l = LF
=
[ v65 v'5
inputn, (aif) ! y5 !J3 o o !J3
fork = 1, 2, ... , n do 11
ekk -1
forj = k, k + 1, .•. , n La factorización más importante es A = LU, donde L es una matriz triangular
k-1 inferior unitaria y U es una matriz triangular superior. De ahora en adelante, cuando
Ukj -ªkj - e1csu,jL
s=I
nos refiramos a una factorización LU, nos referiremos a una factorización en la que L
es triangular inferior unitaria. He aquí una condición suficiente para que una matriz
end cuadrada A tenga una descomposición LU.
136 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 Lafactorización LU y lafactorización de Cholesky 137

TEOREMA 1 Si los n menores principales de la matriz A de n x n son no singulares, entonces la matriz Demostración Recuerde que una matriz A es simétrica y definida positiva si A = A r y xrAx > O, para
A tiene una descomposición LU. . todo vector x distinto de cero. Se sigue de inmediato que A es no singular, pues A no
puede aplicar ningún vector distinto de cero en el vector cero. Es más, al considerar
Demostración Hay que recordar que el k-ésimo menor principal* de la matriz A es la matriz vectores especiales de la forma x = (x1, xz, ... , Xk, O, O, ... , Ol, podemos ver que los
menores principales de A son también definidos positivos. El teorema I implica que A
[a¡¡ a¡z · · · aul tiene una descomposición LU. Debido a la simetría de A, tenemos que
a21 a22 · · · a2 k
Ak = ... .. .. . ...
. LU=A=A T = urLr.
ªkl ªk2 . .. ªkk
Lo cual implica que
Sean A k , Lk , y Uk los k-ésimos menores principales de las matrices A, L y U, respecti­ U(Lrr1 = i-Iur.
vamente. Nuestra hipótesis es que A1, A2, .. ., A. son no singulares.
Supongamos, para los propósitos de una demostración.inductiva, que Lk -l y Uk-l El miembro izquierdo de esta ecuación es una matriz triangular superior, mientras que el
ya se obtuvieron. Si en la ecuación (9) i y j se encuentran entre los números 1, 2, ... , miembro derecho es una matriz triangular inferior. (Véase el Prob. l .) En consecuencia,
k-I, también s se ubica en ese dominio. En consecuencia, la ecuación (9) nos dice que hay una matriz diagonalD tal que U(Lrr i = D. Per lo tanto, U=DLr y A=WLr .
Por el problema 2 7,D es definida positiva y sus elementos d;¡ son positivos. Denotando

=
con D 1 12 la matriz diagonal cuyos elementos sobre la diagonal son ..[clü, tenemos que
A k-1=Lk -1Uk-1
A = LF con L LD1 12, la cual es la factorización de Cholesky. La demostración de
Como por hipótesis A k-I es no singular, Lk-I y Uk-1 también son no singulares. Al ser que esta factorización es única se deja como ejercicio para el lector. 111
Lk-I no singular, podemos resolver el sistema
k-1 El algoritmo para la factorización de Cholesky es un caso especial del algoritmo
¿ l;,u,k=aik (1�i�k-1) general para la factorización LU. Si A es real, simétrica y definida positiva, entonces,
s=I por el teorema 2, tiene una factorización única de la forma A = ur, en donde L es
triangular inferior y tiene una diagonal positiva. Así, en la ecuación (8), U = Lr. En el
para u,k con 1�s�k-l . Estos elementos se encuentran en la k-ésima columna de k-ésimo paso del algoritmo general, el elemento de la diagonal se calcula por medio de
U. Dado que Uk -l es no singular, podemos resolver el sistema

et .
k-1
k-1 I/Z
lkk = (akk-; ) (13)
¿fksUsj = akj (l�j�k-1)
s=l
En este caso, el algoritmo para la factorización de Cholesky es el siguiente:
para lks con 1�s�k-l . Estos elementos están en la k-ésima fila de L. A partir de
las igualdades input n, (aij)
L lksUsk = L
k k-1
for k = 1, 2, ... , n do
ªkk = l ksUsk + ekk ukk
f-
k-1 1/2
s=I s=l
lkk (ªkk-;lt)
podemos obtener Ukk, pues ekk ya se especificó que es unitario. De este modo, todos
los elementos necesarios para formar Lk y Uk ya están definidos. La inducción queda for í = k + I , k + 2, ... , n do
completa al observar que e¡¡u¡¡ = a¡¡ y, por lo tanto, e¡¡ = 1 y u11 = a 11•

Factorización de Cholesky
11
l ;k f- ( a¡k - f
s=I
l;,l ks) /ekk
end
Como ya se mencionó, hay una factorización de matrices que resulta muy útil en end
algunas situaciones. A esta factorización se le ha dado el nombre del matemático André output (eij ).
Louis Cholesky, quien demostró el siguiente resultado:
El teorema 2 garantiza que ekk > O. Observe que la ecuación (13) nos da como
TEOREMA 2 Si A es una matriz real, simétrica y definida positiva, entonces tiene una factorización resultado para j�k
única A = Ur en donde L es una matriz triangular inferior con diagonal positiva.
¿ et � e� ,
k
ªkk = j
*N. del R.T. El ténnino 'principal minor' se emplea con dos significados diferentes.
s=I
138 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 Lafactorización LU y lafactorización de Cholesky 139

de donde concluimos que 11. SeaA una matriz den x n. Sea (p¡, p2, •.. , p.) una permutación de (1,2, ... ,n) tal que (para
i = 1, 2, ... ,n) la fila i de A tiene elementos distintos de cero sólo en las columnas p1,
pi, ... , p;. Escriba un algoritmo para resolver Ax= b.

J
¡ikj ¡ � ¡a; (1 �j � k).
12. Demuestre que toda matriz de la forma A = [ � � tiene una factorización LU. Demuestre
En consecuencia, cualquier elemento de L está acotado por la raíz cuadrada de un ele­ que aun en el caso de que L sea triangular inferior unitaria, la factorización no es única. (Este
mento diagonal correspondiente de A. Esto implica que los elementos de L no se hacen problema. al igual que los problemas 13 y 15, ilustra la máxima de Taussky: Si una conjetura
muy grandes en relación con A, aun sin pivoteo. (El pivoteo se explicará en la siguiente acerca de matrices es falsa, por lo general puede descalificarse con un ejemplo de 2 x 2.)
sección.)
Tanto en el algoritmo de Cholesky como en el de Doolittle, los productos escalares
i
13. Demuestre que toda matriz de la forma A = [ � J tiene una factorización LU. ¿Tiene
de vectores deberían realizarse con doble precisión, a fin de evitar una acumulación de una factorización LU en la que L es triangular inferior unitaria?
errores de redondeo. (Véase el Prob. 6 de la Sec. 4.1.) <¡4_ Diseñe un algoritmo eficiente para invertir una matriz triangular inferior A den x n. Su­
gerencia: Utilice el hecho de queA-1 también es triangular inferior. Escriba en código su
algoritmo y póngalo a prueba con la matriz cuyos elementos son aij = (i +j)2 para i i;; j.
SERIE DE PROBLEMAS 4.2 Tome n = 1O. Desarrolle el producto AA-l para comprobar que la matriz que se calculó es
la inversa.
l . Demuestre los siguientes hechos, necesarios en la demostración del teorema 2.
(a) Si U es triangular superior e inversible, entonces u-1 es triangular superior.
15. Encuentre todas las factorizaciones LU de A = [ j J
1� en las que L es triangular inferior
unitaria.
(b) La inversa de una matriz triangular inferior unitaria es una matriz triangular inferior
unitaria. 16. Si A es invertible y tiene una descomposición LU, entonces todos los menores principales
(c) El producto de dos matrices triangulares superiores (inferiores) es una matriz triangular deA son no singulares.
superior (inferior). 17. Suponga que el sistema Ax = b tiene la siguiente propiedad: Hay dos permutaciones p =
(p ¡ , pi, ... , p.) y q = (q¡,q2,... ,q.) de ( l ,2,...,n), tales que, para cada i, la ecuación
2. Demuestre que si una matriz no singular A tiene una factorización LU, en donde L es una número p; contiene sólo las variables Xq1, Xq2, •••, Xq,. Escriba un algoritmo eficiente para
matriz triangular inferior unitaria, entonces L y U son únicas. resolver este sistema.
3. Demuestre que los algoritmos (2), (3), (6) y (7) siempre resuelven Ax = b cuando A es no 18. Cuente el número de multiplicaciones y/o divisiones necesarias para invertir una matriz
singular. triangular inferior unitaria.
4. Demuestre que una matriz triangular superior o inferior es no singular si y sólo si los ele­ 19. Demuestre o refute: Si A tiene una factorización LU en la cual L es triangular inferior
mentos de su diagonal son todos diferentes de cero. unitaria, entoncesA tiene una factorización LU en la cual U es triangular superior unitaria.
5. Demuestre que si todos los menores principales de A son no singulares y l;; ;e O para cada i, 20. Dé un algoritmo para invertir una matriz A suponiendo que su factorización LU es conocida.
entonces Ukk ;t O para 1 � k � n. (Use los problemas 8 y 14.)

6. Demuestre que la matriz A = [ � n no tiene una factorización LU. Advertencia: Esta no 21. Desarrolle un algoritmo para invertir una matriz A que tiene la propiedad de que a¡¡ = O
siempre que i +j � n.
es una simple consecuencia del teorema que se demostró en esta sección.
22. Utilice el teorema de Cholesky para demostrar que las siguientes propiedades de una matriz
7. (a) Escriba la versión parafilas del algoritmo de Doolittle que calcula lak-ésima fila de ( y simétrica son equivalentes: (a) A es definida positiva; (b) hay un conjunto de vectores
lak-ésima fila de U en elk-ésimo paso. (Consecuentemente, en elk-ésimo paso el orden en linealmente independientes x<l) , x<2> , ••., x<•> de JR", tales queAij = (x<l))7 (xU>J.
el cómputo es la, P.1c2, •••, lu-1, Ukk, ••• , ui,,.)
23. Determine la corrección del siguiente algoritmo para resolver Ux = b en el caso en que U
(b) Escriba la versión para columnas del algoritmo de Doolittle que computa la k-ésima es triangular superior:
columna de U y la k-ésima columna de L en el k-ésimo paso. (Consecuentemente, en el
k-ésimo paso el orden en el cómputo es u1k, U2k, •.• , Ukk, lk+l, ••. , ln1c.) forj=n,n-1,... ,ldo
X¡ <- b¡ /Ujj
8. Haciendo uso de la ecuación uu-1 = I, obtenga un algoritmo para encontrar la inversa de for i = 1, 2, ...,j - 1do
una matriz triangular superior. Suponga que u-1 existe, es decir, que los elementos sobre b; <- b; - UijXj
la diagonal en U son todos diferentes de cero.
end
9. Calcule el número de operaciones aritméticas que implica cada uno de los algoritmos (2), end.
(3), (6) y (7).
24. Demuestre que si los menores principales de A son no singulares, entonces A tiene una
10. Una matriz A= (aij) en la que aij = O cuandoj > i oj < i-1 se llama matriz deStieltjes. factorización LDU en la cual Les triangular inferior unitaria, U es triangular superior unitaria
Diseñe un algoritmo eficiente para invertir dicha matriz. y D es diagonal.
140 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.2 La factorizaci6n LU y la factorización de Cholesky 141

25. (Continuación) Si A es una matriz simétrica cuyos menores principales son no singulares, 37. Considere la matriz tridiagoual definida positiva

º·º
entoncesA tiene una factorización LDLr, en la cual L es triangular inferior unitaria y D es
diagonal. o.o
]
136.01 90.860
A - [ o.o -67.590 132.01 46.260 ·
r _ 90.860 98.810 -67.590 O.O
26. (Continuación) Escriba un algoritmo para computar la factorización LDL de una matriz
simétricaA. Su algoritmo deberá hacer aproximadamente la mitad del trabajo que realiza
el algoritmo estándar de Gauss. Observación: Este algoritmo puede fallar cuando algunos
. o.o o.o 46.260 177.17
menores principales de A son singulares. (Esta modificación del algoritmo de Cholesky no Utilizando hasta cinco dígitos significativos, factorice A de las siguientes maneras:
(a) A = LU, donde Les triangular inferior unitaria y U es triangular superior.
implica el cálculo de raíces cuadradas.)
27. Demuestre: A es definida positiva y Bes no singular si y sólo si BABr es definida positiva. (b) A = LDU, en donde Les triangular inferior unitaria, Des diagonal y U es triangular
superior unitaria.
28. Cuando A es definida positiva, ¿también lo es r 1 ? (c) A = LU, en donde L es triangular inferior y U es triangular superior unitaria.

[-426 -17176 -20


-4
29. Considere la matriz (d) A = U� en donde L es triangular inferior.

-17 ] .
38. Determine la factorización LU de la matriz
A=
6 10
A= [ 12 26 4 ,
º]
Determine en forma directa (es decir, sin recurrir a la eliminación gaussiana) la factorización
A = LDLr, en la que Des diagonal y Les triangular inferior unitaria.
O 9 12

30. Desarrolle un algoritmo para encontrar en forma directa la factorización UL de la matriz A, en donde L es una matriz triangular inferior con doses en su diagonal principal.
en donde L es triangular inferior unitaria y U es triangular superior. Dé un algoritmo para 39. Demuestre que si una matriz singular tiene una factorización de Doolittle, dicha factorización
resolver ULx = b. no es única.
31. Encuentre la factorización LU de la matriz 40. Demuestre la unicidad de la factorización A = U7, en donde Les triangular inferior y tiene
una diagonal positiva.
3 O l
A= [O -1 3] ,
41. Una matriz que es simétrica y definida positiva (SPD) tiene una raíz cuadrada X que es SPD.
2 13 10 .
1 3 O De este modo, X = A. Encuentre X s1• A = [10 17]
en donde L es triangular inferior y U es triangular superior unitaria. 42. Desarrolle algoritmos para resolver el sistema lineal Ax = b en dos casos especiales:
(a) aq = O, cuandoj ;;¡ n-i; (b) aij = O cuandoj > n+ 1-i.
32. Factorice la matriz A = [ � ;] de modo que A = LL7 con L triangular inferior. 43. Encuentre todas las factorizaciones de Doolittle de la matriz

33. Para la matriz


[2 1 -2]
[4 ! ¡1] '
A= 4 2 -1 ,
1 17 1
6 3 11
A= :¡ T6
1 l4 � utilizando las ecuaciones (10), (11) y (12). En este ejemplo, el algoritmo funciona pese a
que u22 = O.
64

determine directamente la factorización LL7, en la cual L es una matriz triangular inferior 44. Demuestre que si A es simétrica, entonces en su factorización LU las columnas de L son
con elementos positivos en la diagonal. múltiplos de las filas de U.
34. Suponga que la matriz no singular A tiene una factorización de Cholesky. ¿Qué se puede
45. Para la matriz A = U 1]
� , encuentre todas las factorizaciones LU y tod�s las factoriza­

U ¡6
decir del determinante de A?
ciones UL en las que L es triangular inferior unitaria.

�n
] en la que Ly U tienen elementos
46. Una matriz Pes aquella en la que a¡¡ = O paraj ;;¡ n-i; una matriz Q es una matriz P con
35. Determine lafactorización LU de la matriz A=
la propiedad adicional de que a,n-i+I = 1 parai = 1, 2, . .. , n. Encuentre 1afactorizaci6n
[-i
diagonales unitarios.
c36. Resuelva el siguiente sistema con el método de Cholesky: PQde la matrizA =

0.05x1 + 0.07x2 + 0.06xi + 0.05x.i = 0.23 47. (Continuación) Diseñe un algoritmo para obtener la factorización PQ de una matriz. De
manera similar, diseñe un algoritmo para resolver un sistema de ecuaciones de la forma
0.07x1 + O. l0x2 + 0.08xi + 0.07x.i = 0.32 PQx=b.
{
0.06x1 + 0.08x2 + O. lOXJ + 0.09x.i = 0.33
48. Suponiendo que la factorización LU de una matriz A está disponible, escriba un algoritmo
0.05xi + 0.07x2 + 0.09xi + O. lOx.i = 0.31. para resolver la ecuación x7A = b7.
142 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 143

e49. Escriba un subprograma o procedimiento que instrumente el algoritmo general para la facto­ 4.3 Pivoteo y construcción de un algoritmo
rización LU. Los elementos diagonales dados se pueden almacenar en una tabla D. Después,
puede utilizarse una tabla lógica asociada para indicar si un elemento de D pertenece a la
diagonal de Lo a la de U. Ponga a prueba la rutina con algunas matrices de Hilbert, cuyos En las secciones anteriores se presentó una versión abstracta de la eliminación gaussiana a
elementos son aij (i + j - 1)-1. Para cada matriz, haga las factorizaciones de Doolittle, guisa de factorización LU de una matriz. En esta sección se describe la forma tradicional
Crout y Cholesk:y =
más algunas otras con elementos específicos sobre la diagonal.
de la eliminación gaussiana y se relaciona con la forma abstracta. Después, se hacen las
50. Si A tiene una factorización de Doolittle, ¿cuál es una fórmula simple para el determinante modificaciones necesarias para elaborar una transposición satisfactoria de la eliminación
de A? gaussiana a la computadora. A lo largo de este estudio, usaremos las palabras ecuación
y fila de un sistema matricial en forma indistinta.

l]-
51. Sea
25 o o o
27 4 3 Eliminación gaussiana básica
A=
. � 54 58 O
[ o 108 116 O He aquí un sistema simple de cuatro ecuaciones con cuatro incógnitas que utiliza­
100 o o o 24 remos para ilustrar el algoritmo gaussiano:
Determine, para la matriz A, la factorización LU más general en la que L es triangular inferior
unitaria. Demuestre que el algoritmo de Doolittle produce una de estas factorizaciones LU. 6 -2 2 4 12
52. Sea A una matriz simétrica cuyos determinantes de los menores principales son no negativos.
¿Tiene la matriz A + el las mismas propiedades para e > O?
12 -8 6
[ 3 -13 9
-6
10

4 1 -18
Xz _
3] X3 -
X4
34
[X¡] [
27 ]
-38
. (1)

53. Considere la factorización LU de una matriz A de 2 x 2. Demuestre que si f-22 y u22


son conocidos, entonces las ecuaciones que determinan los restantes elementos de L y U son En el primer paso del proceso sustraemos 2 veces la primera ecuación de la segunda.
no lineales. i
Después sustraemos vez la primera ecuación de la tercera. Por último, sustraemos -1
54. Demuestre: Si A es simétrica y definida no negativa, entonces A = UT para alguna matriz i
vez la primera ecuación de la cuarta Los números 2, y -1 son los multiplicadores
triangular inferior L. La terminología definida no negativa significa que .itAx � O para del 'primer paso del proceso de eliminación. El número 6 utilizado como divisor al
todax. determinar cada· uno de los multiplicadores es el elemento pivote de este paso. Al

55. Encuentre condiciones precisas sobre a, b y e para que la matriz [: t] sea difinida no concluir el primer paso, el sistema tiene el siguiente aspecto:

4]
negativa. 6 -2 2 12

56. Demuestre que si la matriz [:


ur con L triangular inferior.
t] ·es definida no negativa, entonces tiene una factorización
O -4 2
[O -12 8
O
2
1
2 3 -14
[X¡] [
Xz _
X3
X4
-
10
21]
-26 .
. (2)

57. Demuestre o refute: Una matriz simétrica A es definida no negativa si y sólo si los determi­ Pese a que la primera fila se utilizó en el proceso, no sufrió cambio alguno. En este primer
nantes de todos sus menores principales son no negativos. paso nos referimos a la fila 1 como la fila pivote. En la etapa siguiente del proceso,

t]
la fila 2 se utiliza como fila pivote y -4 es el elemento pivote. Sustraemos 3 veces la
58. Encuentre condiciones necesarias y suficientes sobre a, b y e para que la matriz [: segunda fila del tercero, y -!
vez la segunda fila del cuarto. Los multiplicadores son en
T
tenga una factorización LL con L triangular inferior. i.
esta ocasión 3 y - El resultado es

4]
59. En este problema la notación X;,i;k denota la parte de la k-ésima columna de la matriz X que 6 -2 2 12
va desde la componente i hasta la componente j. En forma análoga, la notación Xti:j denota
la parte de la k-ésima fila de X que va desde la componente i hasta la componente j.
(a) En relación a la ecuación (11), demuestre que la misma se puede escribir como
O -4 2
[O
O
O 2
O 4
2
-5
-13
[X¡] [
Xz
X3 =
X4
10
-9 ]
-21
. (3)

Uu+i:n = (Atk+l:n - Lt1:k-1M)/lkk, El último paso consiste en sustraer 2 veces la tercera fila del cuarto, de modo que 2 es
tanto el multiplicador como el elemento pivote. El sistema resultante es

j] [;:] [i�]-
donde M es la matriz cuyas filas son U,k+l:n, para 1 ;;; i ;;; k - l.
(b) Efectúe una transformación análoga con la ecuación (12). Los cálculos discutidos en este 6 -2 2
problema tienen la forma y +- y - Mx. Se pueden llevar a cabo con gran eficiencia en una O -4 2
(4 )
super computadora vectorial. (Para mayores detalles véase Kincaid y Oppe (1988] y Oppe [O O 2 =
y Kincaid (1988].) o o o -3 X4 -3
144 Capítulo 4 Resolución de sistemas de ecuaciones lineales
4.3 Pivoteo y construcción de un algoritmo 145
Este sistema es triangular superior y equivalente al sistema original, en el sentido de l columna k l columnaj
que las soluciones para ambos son las mismas. No obstante, el segundo de ellos es más w
�¡ . . . � ... w ... w
fácil de resolver; se comienza con la cuarta ecuación y se trabaja hacia atrás ascendiendo u � �
por filas. La solución es
..

x-[=!l
Los multiplicadores utilizados al transformar el sistema pueden colocarse en una fila k o ... o w ...

º
matriz triangular inferior unitaria L= (fif) �
� ... ªq �
m
o ... o
]
1 O O
2 1 O O
[
L= ! 3 1 O . (5)
-1 -! 2 1 fila i o ... o � .. . �
g
... �
m

Observe que cada multiplicador se ha escrito en el lugar del cero de la matriz que él
contribuyó a producir. La matriz U = (uif) formada por los coeficientes del sistema
resultante, es triangular superior o ... o �
M ... �
� ... �
M

6 -2 2 4
U= [ O -42 2 ]
. Nuestra tarea consiste en describir cómo se obtiene A(k+I) a partir de A(kl. Para originar
(6)
O O 2 -5 ceros en la columna k debajo del elemento pivote a a't], sustraemos múltiplos de la fila
O O O -3 ka las filas debajo de él. Las filas 1, 2, ... , k no se alteran. Por consiguiente, la fórmula

{
correspondiente es:
Estas dos matrices nos dan la factorización LU de A, siendo A la matriz de los coeficientes

º
del sistema original. Así, a(k) &i�k

]
�t) - (a�) 1ai1)ai?
g
ar
!)
=

j]
6 -2 2 4 1 O O 6 -2 2 &i�k+lyj�k+l (8)
12 -8 6 10 2 1 00 0-42 &i�k+lyj��
= [ l [O
3]
[ (7)
3 -13 9 3 1 O O 2
-6 41 -18 -1 -! 2 1 O O O -3 Luego definimos U= A(nl y definimos L de la siguiente manera:
No es difícil cerciorarse de lo anterior. Si sabemos cómo obtener U a paritr de
A, podemos, invirtiendo el proceso, obtener A a partir de U. Si representamos las filas a�l /a't] Síi � k + 1
de A con A1 , A2, A3 , A4 y los de U con U¡ , U2, U3 , U4, el proceso de eliminación
f;k= { 1 Sí i= k (9)
nos da, por ejemplo, U2 = A2 - 2A¡. De aquí que A2 = 2A1 + U2 = 2U1 + Uz. Los O Si i � k-1.
coeficientes 2 y l están situados en la segunda fila de L. Análogamente, las operaciones
con las filas que conducen a la fila 3 son U3= (A3 - !A1) - 3U2, por lo que tenemos Aquí A = LU es la factorización gaussiana estándar de la matriz A con L trian gular
A3 = !A1 + 3U2 + U3 = 1U1 + 3U 2 + U3 . Por lo tanto, los coeficientes!, 3, 1 deben inferior unitaria y U tri angular superior. Debería estar claro a partir de las ecuaciones·
ocupar la tercera fila de L, y así sucesivamente. (8) y (9), al igual que del ejemplo numérico que acabamos de ver, que este proceso de
Para describir formalmente el desarrollo del algoritmo gaussiano, podemos inter­ eliminación fallará en caso de que alguno de los elementos pivote sea igual a cero. Ahora
pretarlo como una sucesión den -1 pasos mayores que dan como resultado una sucesión podemos demostrar:
de matrices, como a continuación se indica:
TEOREMA 1 Si todos los elementos pivote a't] son distintos de cero en el proceso recién descrito,
A = A(ll -> A(2l -, .·. _, A(nl. entonces A= LU.

Al terminar el paso k - 1, la matriz A(k) estará concluida; su aspecto se muestra en el Demostración Observe que at1l = atl si i � k oj � k - l. Advierta además que Ukj = ªkJ) = ai?.
siguiente diagrama. Por último, vea que f;k = O si k > i y Uk¡= O si k < j. Supongamos que i � j. Por los
4.3 Pivoteo y construcción de un algoritmo 147
146 Capítulo 4 Resolución de sistemas de ecuaciones lineales
Aquí el algoritmo falla en virtud de que no hay forma de añadir un múltiplo de la primera
hechos que acabamos de observar, tenemos ecuación a la segunda, de modo que el coeficiente que se obtenga para x1 sea igual a
cero. (Véase el problema 6 de la sección precedente.)
¿ l;kukj = ¿ l;kukj = ¿ l;ka�l
n i i
(LU);j= La dificultad con que acabamos de tropezar persiste en el siguiente ejemplo, en el
k=1 k=l k=1 cual e es un número muy pequeño aunque distinto de cero.

[� !][ :�] = [;].


i-1 i-1
(k) (k) (k) (<)
- L., �ikakj + �;;aij - L., (ª;k /ª kk) ªkj + ªij
_ �n (k) n (i) _ �
(11)
k=l k=l

í-1 Al aplicar el algoritmo gaussiano a (1 1), se obtiene el siguiente sistema triangular supe-
= ¿(a\¡1- at+ll) + ai> = ªijl l= ªij· rior:
k=l 1
=
[� 1- s-1J[;�J [2- c 1 ]·
1
(12)
Análogamente, si i > j, entonces
La solución es
j j 2- s- 1
�n (k) _ � (k)
a(k+l) Xz=---1 �1
( LU)ij = L. �;kakj - L.( aij - ij ) { 1- s- (13)
k=l k=l
x1 = (1 - x2)E-l � O.
l)
= a(i1j ) - a(iij+ = a(1)
ij = aij En 1/computadora, si E es suficientemente pequeño, 2-c 1 y -e 1 se computarán como
un mismo número. De la misma manera, el denominador 1-c 1 y-s- 1 se computarán
pues at> = O para i � j + 1 y k � j + l. 11
como un mismo número. Por lo tanto, en tales circunstancias, x2 se calculará como 1 y
Dada una matriz A = (ag), un algoritmo para llevar a la práctica el proceso básico x1 como O. Dado que la solución correcta es
de eliminación gaussiana que acabamos de describir es el siguiente: 1
{X1=- �1
input n, (a;j) 1-E
for k = 1, 2, ..., n- 1 do 1- 2E
Xz=--:a:;1,
for i = k + 1, k + 2, ..., n do 1-E
z +- aik/akk la solución calculada es exacta para x2, ¡pero es extremadamente inexacta para x1 !
a,k +- O En la computadora, cuando e es muy pequeño, ¿por qué el cómputo de 2 - E-1
forj = k + 1, k + 2, ..., n do nos da el mismo número de máquina que el cómputo de -e 1 ? La respuesta es que
ag +- ag- Wkj antes de que tenga lugar la sustracción, se debe hacer coincidir los exponentes en la
end forma de punto flotante de 2 y s- 1 desplazando el punto radical. Si este desplazamiento
end es suficientemente grande, la mantisa de 2 será cero. Por ejemplo, en una máquina con
end siete posiciones decimales similar a la hipotética MARC-32, con E = 10-8, tenemos
i,- = 0.1000000 x 10 y 2 = 0.2000000 x 10 • Si 2 se reescribe con exponente 9,
1 9 1
output (aij).
9 1
tenemos que 2 = 0.000000002 x 10 y 2- c =-0.099999998 x 109 , de tal modo
En este caso se supone que todos los elementos pivote son distintos de cero. Los multi­ que 2- e- 1 = -0.1000000 x 109 =-s-1 en la máquina.
plicadores se eligen de tal modo que al calcular las componentes debajo de la diagonal Un último ejemplo nos mostrará que no siempre es la pequeñez del coeficiente a11
principal de A éstas resulten iguales a cero. En.el algoritmo, en vez de efectuar el cómputo la que causa el problema. Más bien, es la pequeñez relativa de a11 respecto de los otros
correspondiente, simplemente sustituimos cada una de dichas componentes por un cero. elementos en su fila. Considere el siguiente sistema, el cual es equivalente al precedente:

Pivoteo \ e l
u � ][:�] = [
e;l (14)
El algoritmo gaussiano que acabamos de describir no es satisfactorio en la me­
dida en que fracasa ante sistemas que son fáciles de resolver. Para aclarar este punto, El algoritmo gaussiano simple produce
consideremos los siguientes ejemplos elementales. El primero de ellos es:
1 ¡;-1 Xl
= ¡;-1
[� i1[::J [0 1- ¡;-l] [Xz] [ 2- ¡;-l] .
(15)
=[] (10 )
; .
148 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 149

La solución de (15) es Al comparar este algoritmo con el proceso básico de eliminación gaussiana, podemos ver
2-e- 1 que son idénticos, salvo por dos cambios. Primero, el cómputo de los multiplicadores se
Xz=---1 �1
{ l -e- ha desplazado fuera del ciclo j, ya que no dependen de j. Segundo, el primer subíndice
x 1 = e-1 -e-1x2 � O, de los elementos de la tabla de coeficientes A incluye a la permutación p. Por supuesto,
Nuevamente, para e muy pequeño, x2 se computará como 1 y x 1 se computará como O, cuando la permutación corresponde al orden natural (p¡ = i) lo que se obtiene es el
lo que, al igual que en el caso anterior, ¡es erróneo! proceso básico.
Las dificultades en estos ejemplos desaparecerán si se cambia el orden de las ecua­
ciones. Así, el intercambio de las dos ecuaciones del sistema (11 ) nos lleva a
Eliminación gaussiana con pivoteo de filas escaladas*

[! i][::] = [�]. Vamos a describir un algoritmo llamado eliminación gaussiana con pivoteo defilas
escaladas que permite resolver un sistema den x n
La eliminación gaussiana aplicada a este sistema nos da
Ax=b.
=
[ � 1 �e] [::] [ 1 � 2e] '
El algoritmo consta de dos partes: una fase defactorización (conocida también como
cuya solución viene dada por
eliminación hacia adelante) y una fase de solución (que comprende actualización y
1-2e sustitución hacia atrás). La fase de factorización se aplica sólo a A, y tiene como
X2=--� l
{ 1-e finalidad producir la descomposición LU de PA, donde P es la matriz de permutación
X¡=2-X¡ � l. derivada de la permutación p. (PA se obtiene a partir de A permutando sus filas.) El
sistema lineal permutado es
La conclusión que podemos extraer de estos ejemplos elementales es que un buen
PAx=Pb.
algoritmo debe incluir el intercambio de ecuaciones en un sistema cuando las circuns­
tancias así lo exijan. Por razones de economía en el cómputo, preferimos no mover La factorización PA = LU se obtiene de un algoritmo modificado de eliminación gaus­
las filas de la matriz en la memoria de la computadora. En vez de ello, simplemente siana que explicaremos en breve. En la fase de solución consideramos dos ecuaciones
elegimos las filas pivote de una manera lógica. Suponga que en vez de utilizar las filas Lz = Pb y Ux = z. Primero, la parte derecha b se vuelve a ordenar de acuerdo con P y los
en el orden 1, 2, ... , n -1 como filas pivote, utilizamos las filas p¡, pz,..., Pn-1· En resultados se almacenan en b, es decir, b <- Pb. Acto seguido, Lz = b se resuelve para
este caso, en el primer paso los múltiplos de la fila p 1 se sustraerán de las otras filas. z y los resultados se almacenan en b, es decir, b <- L- 1 b. Como L es triangular inferior
Si introducimos una componente Pn de modo que (p¡, pz, ..., Pn ) sea una permutación unitaria, esto equivale a un proceso de sustitución hacia adelante. Este procedimiento se
de (1, 2, ... , n), entonces la filaPn no figurará como fila pivote, pero podemos decir que llama actualización de b. Por último, se utiliza la sustitución hacia atrás para resolver
los múltiplos de la fila p 1 se sustraerán de las filas p2,p3,... ,Pn· En el siguiente paso, los Ux = b paraxn , Xn-1, ••• , X¡.
múltiplos de la fila p2 se sustraerán de las filas p3, p4,... , Pn, y así sucesivamente.
En la fase de factorización comenzamos por calcular la escala de cada fila. Escri­
He aquí un algoritmo que lleva a cabo esta tarea. (Se supone que la permutación
bimos:
p ha sido determinado de antemano y consiste en los números naturales 1, 2, ... , n en

\ cierto orden.) s, = máx iaijJ = máx{Ja¡¡J, la,21, ..., Ja;,,I} (1 � i � n)


¡�;;¡n
input n, (aij)
for k = 1, 2, ...,n-1 do Éstos se registran en el algoritmo en una tabla s.
for i = k + 1, k + 2, ... , n do Al iniciar la fase de factorización, no sustraemos arbitrariamente múltiplos de la fila
z <- ap,k /ap,k uno de las otras filas. Más bien, seleccionamos comofila pivote aquella fila para la cual
ap,k <- O la¡¡ J/s, es mayor. El índice que así se escoge se denota con p¡ y se convierte en la
primera componente de la permutación. Así, lap1 1 I/Sp1 f; la¡¡ 1/s¡, para 1 � i � n. Una
for j = k + 1, k + 2, ..., n do vez determinado p1, sustraemos los múltiplos adecuados de la fila p 1 de los otras filas
ap,j <- ap,j - zapú con el propósito de producir ceros en la primera columna de A. Por supuesto, la fila p 1
end permanece inalterada a lo largo del proceso de factorización restante.
end Para hacer un seguimiento de los índices p¡ que van surgiendo, comenzamos por
fijar (p1, pz, ..., Pn ) como (1, 2, ..., n). Después seleccionamos un índice j para el cual
end
output (ag). *N. del T. Por filas escaladas nos referimos a filas cuyas componentes han sido objeto de un cambio de escala.
150 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 151

¡¡
laP; 11/Sp; es máximo y se intercambia p¡ con Pj en la permutación p. El paso efectivo de donde
eliminación incluye sustraer (a¡,,1 /ap, 1) veces la filap1 de la fila p¡ para 2 � i � n. O l
Para describir el proceso general, suponga que estamos preparados para producir
ceros en la columna k. Inspeccionamos los números lapikl/sp, para k � i � n buscando
P= o o l
1 O
una componente que sea máxima. Si j es el índice del primero de los cocientes más
grandes, intercambiamos Pk conpj en la tablap y sustraemos (ap,k/ap,k) veces la filapk
3 -6]
de la fila p; para k + 1 � i � n. -6 8
He aquí cómo funciona esto con la matriz: A=[! -2 1
La matriz de permutación P se obtiene a partir de la permutación p escribiendo
6
3 - ]
[ (P)ij = 8p,j· En otras palabras, P se forma al permutar las filas de la· matriz identidad I
A= 21 -6 8 . conforme a las componentes de p.
3 -2 1 He aquí un algoritmo para llevar a cabo la fase de factorización de la eliminación
gaussiana con pivoteo de filas escaladas:
Al principio, p= (1, 2, 3) y s= (6, 8, 3). Para elegir la primera fila pivote, examinarnos
los cocientes {2/6, 1/8, 3/3}. El mayor corresponde aj = 3, por lo que la fila 3 es input n, (aij)
la fila pivote, de modo que intercambiamos p¡ con p3 obteniendo p = (3, 2, 1). Ahora for i = 1, 2, ... , n do

[� n _±.Ql
sustraemos múltiplos de la fila 3 de las filas 2 y 1 para producir ceros en la primera p¡ +- i
columna. El resultado es s¡ +- máx¡�j�n laijl
3 3 3 end
1 16 23
3 -3 3 · for k= 1, 2, ... , n - 1 do
3 -2 1 seleccione j � k tal que
Las componentes en las posiciones a11 y a21 son los multiplicadores. En el siguiente 1/
lap; kl/sPi � lap,k sp, para i = k, k + 1, ..., n
paso, la elección de la fila pivote se hace sobre la base de los números lal'22 I /sl'2 y Pk H Pj
lap,21/Sp; · El primero de estos cocientes es (16/3)/8 y el segundo es (13/3)/6. De este for i = k + 1, k + 2, ... , n do
modo, j = 3 e intercambiamos p2 conp3. Después, un múltiplo de la fila p2 se sustrae
z +- ap,k/ll¡,,k
de la filap3. El resultado es p = (3, 1, 2) y
ap,k +- z

l
for j = k + 1, k + 2, ... , n do

[� .!1 -n -t.
3 3 -3
1 16 ap,} +- ap,j - zap,j
3
±!!1 end
3 -2
end
El último multiplicador se almacena en la posición a22. end
output (aij), (p¡).
Si las filas de la matriz original A se intercambiasen de acuerdo con la última
permutación p, tendríamos una factorización LU de A. Tenemos, en consecuencia, Observe que los multiplicadores se guardan en A en las posiciones donde se habrían
producido los ceros en el proceso de eliminación. Por lo tanto, todos los datos necesarios

°][' -rll
para reconstruir la factorización LU están almacenados en esta tabla. Sin embargo, el
2
usuario debería ser consciente de que el algoritmo escribe sobre los valores de la tabla
PA= [lt
O
- original A. La matriz A se debería guardar en una tabla por separado, en caso de que se
O
o 1¡o -n
O
:
3 -n 1
I vaya a necesitar después.
Para resolver Ax = b una vez que la fase de factorización se ha llevado a cabo con
' -2 A, aplicamos a b la fase hacia adelante del algoritmo, utilizando la tabla final p para la
= 2 3 -6 ,
[
ll permutación y los multiplicadores que fueron determinados en la fase de factorización
1 -6 8 del algoritmo. Después, se lleva a cabo la sustitución hacia atrás, es decir, se resuelve
152 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 153

para Xn, Xn-I, ... , x1 en este orden. He aquí el algoritmo que cumple con la fase de Estas dos ecuaciones dependen de dos hechos: de que la fila Pk de A(n) se fijó en el paso .
solución del algoritmo. k, y de que la columna k de A(n) se fijó en el paso k +1. De este modo
n
input n, (a;j), (p¡), (b;)
<•)
aPkl_ =a<pk;)_¡ y ap( ¡k) = ap<k,k+I)
for k =1, 2, ..., n -1 do
Es más, la fórmula que acabamos de dar para l;k es válida cuando i = k, ya que produce
for i = k +1, k + 2, ..., n do un 1 para ekk. Ahora suponga que i ;;; j. Tenemos:
bp, <- bp, - ap,k bp,

�e �( e
i
end i-1
(LU)¡¡ = L., ik uk ¡ = L., ap(k,k)/ ap(k),k) ap(kü) + ¡¡ap(i),j
end
k =I k =I

_t
for i = n, n - 1, ... , 1 do i-1

X¡ <- (bp, - ap,ixi) /ap,i


=�
L., (ªPd - ap,¡ ) + ªP,i = ªP,i = ªP,i·
(k) ( l) (i) (!)
k+

k =I
¡=t+I
end Si i> j, entonces
output (x¡).

La primera parte de este seudocódigo actualiza el lado derecho b correspondiendo a


j
°"
j -1
� tk ukJ· = L., (ap(k¡k)¡ap<k;)k)ap(k;)J_ + (apff¡¡l./aPJJ(il.)aPJJv1.
(LU)··IJ = L., <
lo que sucedió durante la fase de factorización. La segunda parte recuperax a partir de un k =I k =I

°"
sistema triangular superior, es decir, se trata de una sustitución hacia atrás. Por supuesto, j -1
la permutación p debe utilizarse para evitar que las cosas se embrollen. Observe que la (I )
= L., (ipk¡¡) _ aP;J (k+I)
)
PU = aPU = aPU·
+ il.
suma j es nula cuando i = n, de modo que Xn = bp./ap,n· k =I

Factorizaciones PA = LU Por otra parte,


L P; a ¡=¿=I B
n n
Como ya lo referimos con anterioridad, si el pivoteo con filas escaladas lo incluimos (PA)ij= k k p1k ª k i = ªPJ·
en el algoritmo gaussiano, obtendremos una factorización LU de PA en donde P es una k=I k

matriz de permutación. Daremos una demostración formal de este resultado, construida Es así como hemos demostrado que, para todos los pares (i,j),
según el modelo de la prueba del teorema1. Tal demostración no depende de la estrategia

{
que se utiliza para determinar los pivotes. (PA);¡ = (LU)ij. 111
Sean p¡, p2, • • • , Pn los índices de las filas en el orden en que se seleccionaron como
filas pivote. Sea A(!) = A y defínanse A (Z), A <3l, ..., A (n) recursivamente con la fórmula TEOREMA 3 Si lafactorización PA = LU se lleva a cabo con el algoritmo gaussiano con pivot�o de
filas escaladas, la solución de Ax = b se encuentra resolviendo en primer lugarLz = Pb
a��) Si i � k o i> k> j
y en segundo lugar Ux = z. De igual manera, la solución de l A = cr se encuentra
ap<k¡J:ll = ap(k¡¡) (ap(k,k) /ap(k,k) )ap(k;)¡_
- Si i > k y j> k (16) resolviendo primero urz = e y después LrPy = z.
ikl¡a<kl Si i> k y1· = k
p, k p;k Demostración Esto se deja como un ejercicio para el lector. 11
TEOREMA 2 Defina una matriz de permutación P cuyos elementos son P;j = Bp,j- Defina una ma­
triz triangular superior U cuyos elementos son u;¡ = atJ si j � i. Defina una matriz El seudocódigo para resolver Ax = b en términos de L y U tiene el siguiente
aspecto:
triangular inferior unitaria L cuyos elementos son f;¡ = a¡7J si j < i. En tal caso,
PA=LU.
input n, (lij ), (uij), (b;), (p;)
Demostración Con base en la fórmula recursiva tenemos: for i = 1, 2, ... , n do
¿ e z¡
i-1
k)
Uk_J· =a<•)_=
P,J a(P,J_ (j "?;, k) z; ...... bp, - ij
j=I
e-1k=a<•)¡k
p
= ap(k¡k+I)=ap<k¡k) /ap(k;)k (i "?: k) end
154 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 155

.t
fori=n,n-1, ..., l do Considere el primer paso (k = 1) que se da en el proceso de factorización cuando
se opera con una matriz A de n x n. El cómputo necesario para definir p1 ( el índice de la
X¡ <- (z¡- UijXj) /u¡¡ fila pivote) comprenden divisiones (n ops) . Para cada uno de las n - 1 filas numeradas
1=1+!
P2, p3, ... , Pn, se calcula un multiplicador (1 op) y un múltiplo de la fila p1 se sustrae
end de la fila p¡ para 2 � i � n. Los ceros que se generan en la primera columna no son
output (x¡). computados. Así, el multiplicador y el proceso de eliminación consumen n ops por fila.
Como el número de filas procesadas es den -1, tenemos n(n -1) ops. A éstas hay que
Se puede escribir el mismo algoritmo utilizando las componentes de la matriz A añadirles las n ops necesarias para determinar p1• El total es de n2 ops.
que se origina con el proceso gaussiano. El resultado es El resto del proceso de factorización se puede interpretar como una repetición del
primer paso con matrices cada vez más pequeñas. Por ejemplo, en el segundo paso la
input n, (aif), (b¡), (p¡) fila p1 y la primera columna no se toman en cuenta. El cálculo de componentes en este
fori=l,2, ... ,ndo caso es como si el primer paso se aplicara a una matriz de(n-1) x(n-1). Esto significa
Z¡ <- ¿
bp, -
i-1

i=I
apJZ¡
que la factorización requiere
n2 + (n - 1) 2 + ...+ 32 +22 -3
- ln3 + ln2 + ln -1 ;:::; ln3 + ln2
2 6 3 2
end

.t
for i = n, n - 1, ..., 1 do operaciones extensas. En la fórmula anterior usamos el hecho de que I:;=t k2 =
X¡ <- (
Zi -
1=1+1
apJXj) /ap,i
!n(n +1)(2n +1) . Cuando n es grande, el término }n3 es dominante. De este modo,
encontrar la factorización LU con pivoteo de filas escaladas requiere aproximadamente
in3 operaciones extensas cuando n es muy grande.
end Un examen de la segunda fase del algoritmo nos muestra que la actulización de la
output (x¡). parte derecha b toman-1 pasos. En el primero de ellos hay n -1 operaciones extensas;
en el segundo hayn -2, y así sucesivamente. El total es
Recordando que p-l = pT, el seudocódigo para resolver/ A = cT es el siguiente:
(n - 1) + (n - 2) + · · · +1 = !n2 - !n.
input n, (aij), (c;), (p¡)
forj = 1,2, ...,ndo En la fórmula anterior usamos el hecho de que I:;=t k = !n(n +1). En la sustitución

<- (
j -1 hacia atrás hay una operación extensa en el primer paso ( computar x.). Después hay
Z¡ C¡ - � apJZi) /aPiÍ sucesivamente2, 3, ... , n operaciones extensas. El total es

end 1 + 2 + 3 + · · · + n = !n2 + fn
forj = n, n - 1, ... , 1 do Pot consiguiente, el gran total para esta fase del algoritmo es n2• Para resumir nuestras

YPi <- ¿
Z¡ -
n

i=j+I
apJYp,
conclusiones formulamos el siguiente resultado de carácter más general.

TEOREMA 4 Si la eliminación gaussiana se utiliza con pivoteo de filas escalonadas, la solución del
end sistema Ax= b para Afija y m vectores distintos b comprende aproximadamente
output (y¡).
!n3 +(! +m)n2

operaciones extensas (multiplicaciones y divisiones).


Recuento de operaciones
Para valorar el esfuerzo computacional que conlleva la solución de un sistema de Esta forma de organizar el algoritmo de eliminación gaussiana permite un trata­
ecuaciones lineales vamos a contar el número de operaciones aritméticas comprendidas miento eficaz del problema Ax(il = b(i) para i = 1, 2, ... , m. Aquí tenemos m sistemas
en las fases de factorización y solución. En virtud de que las operaciones de multipli­ lineales, cada uno con la misma matriz de coeficientes pero con distinta parte derecha.
cación y división son, en general, equiparables en tiempo de ejecución y en virtud de Una aplicación de la fase de eliminación hacia adelante nos da la factorización PA = LU.
que estas operaciones consumen mucho más tiempo que la sustracción y la adición, es Después se necesitan m "soluciones hacia atrás" que hacen uso de esta factorización para
ya una tradición contar sólo las multiplicaciones y las divisiones, agrupándolas en la obtener las x(il . De esta manera sólo se requieren O(!n3 + (! +m)n2) operaciones ex­
categoría de operaciones extensas, u ops para abreviar. tensas en vez de O(fmn3 ) como sería el caso si los m sistemas se tratasen cada uno por
156 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 157

separado. Es más, podemos computar A - I en 0(1n3) ops, puesto que se trata de un Una desigualdad equivalente es
caso especial de una situación que ya hemos analizado con anterioridad; es decir, AX = I
se puede resolver para cada columna de A-I resolviendo Ax(i) = e¡ utilizando n valores
L laiil > L J(an/au)avl-
n n

para i. Tenga en mente que A -I no se debería computar cuando se resuelve Ax = b; más Ja;d -
bien, lo que se debe resolver es x directamente. j=2 2 j=
j,;:i

Matrices diagonalmente dominantes Con base en el predominio diagonal en la fila i, sabemos que

Hay ocasiones en que un sistema de ecuaciones tiene la propiedad de que en él se


pueda aplicar la eliminación gaussiana sin pivoteo, sin correr riesgo alguno. Una clase [a¡¡J - ¿JaiiJ> lanJ.
de matrices para las que esto es cierto es la formada por las matrices diagonalmente j=2
j,;,i
dominantes. Esta propiedad se expresa a través de la desigualdad
n
Por lo tanto, basta con demostrar que
Ja¡¡J> ¿JaiiJ (1 � i � n), (17) n
j =I
j,•i Ja;¡ ?; ¿J(a¡¡/au)a!jl·
1

j=2
Si la matriz de coeficientes tiene esta propiedad, entonces en el primer paso de la elimi­
nación gaussiana podemos utilizar la primer fila como fila pivote, ya que, en virtud de la Sin embargo, estó último es cierto en virtud que la fila 1 es diagonalmente dominante:
desigualdad (17), el elemento pivote a11 es distinto de cero. Al terminar el primer paso n n
nos gustaría saber que la segunda fila se puede utilizar como la siguiente fila pivote. Esta Jau!>¿ Ja1jl =} 1> ¿Jalj/a111- 11
situación se rige por el siguiente teorema. j=2 j=2

TEOREMA 5 La eliminación gaussiana sin pivoteo preserva una matriz diagonalmente dominante. COROLARIO 1 Toda matriz diagonalmente dominante es no singular y tiene unafactorización LU.

Demostración Basta con considerar el primer paso de la eliminación gaussiana (el paso en que se Demostración El último teorema y el teorema 1 implican que una matriz A diagonalmente dominante
producen los ceros en la columna 1), ya que los pasos subsiguientes son una imitación tiene una descomposición LU en la cual L es triangular inferior unitaria. Por el teorema
de éste, salvo que se aplican a matrices de menor tamaño. anterior, la matriz U es diagonalmente dominante. En consecuencia, sus elementos sobre
Así, sea A una matriz de n x n con predominio diagonal. Teniendo en cuenta los la diagonal son distintos de cero, de modo que L y U son no singulares. 11
ceros producidos en la columna 1 y el hecho de que la fila 1 no sufre cambio, debemos
demostrar que para i = 2, 3, ... , n, COROLARIO 2 Si la versión de pivoteo con filas escaladas de la eliminación gaussiana se aplica a
n
una matriz diagonalmente dominante, los pivotes serán los usuales: 1, 2, ... , n. Por
consiguiente, en este caso el trabajo de elegir los pivotes se puede omitir.
Ja¡¡lJ> ¿Ja�lJ
j=2
j:1:i Demostración Por el teorema 5, basta con demostrar que el primer pivote que se elige en el algoritmo
es l. Por lo tanto, es suficiente demostrar que
En términos de A, esto significa que
n
Ja11I/S¡ > Ja;¡J/s¡ (2 � i � n).
Ja¡¡ -(a¡¡/a11)a¡¡J> ¿ [aij - (an/a11)a1jl Por el pred.ominio diagonal, Ja¡¡J = máxj laiil = para toda i. Por consiguiente,

j=2
j,;,i Ja11 I/s¡ = l . Para i ?; 2 tenemos:

Basta con demostrar la desigualdad n

la¡¡J � ¿\aii\ < \au\ = S¡.


n j =l
[a¡¡[ - [(an/au)a¡¡[> ¿{JaiiJ + J(an/au)a!jJ} j,;,i
j=2 y así Janl/s¡ < l.
j,;:i 11
158 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 159
En la sección 4.2 se demostró (teorema 2) que una matriz A simétrica y definida y el resto es similar. He aquí el algoritmo:
positiva tiene una factorización de Cholesky única A= ur . También se demostró que
los elementos de la matriz triangular inferior L satisfacen la desigualdad input n, (a¡), (b¡), (c¡), (d;)
for i = 2, 3, ... , n do
[iij [ � /a¡¡. (18)
d¡ +- d¡ - (a¡_¡ /d¡_ ¡)C¡_ ¡
El algoritmo para la factorización de Cholesky es un caso especial de la factorización b; ,,_ b; - (a¡_¡/d¡_¡ )b;_1
LU. El pivoteo es innecesario en este caso particular por que -como muestra la des­ end
igualdad (18)- los elementos de L siguen siendo modestos en magnitud cuando se Xn +- bn /dn
comparan con los elementos de A. for i = n - 1, n - 2, ... , 1 do
X¡ ,,_ (b¡ - C¡X¡+¡ )/d¡
Sistemas tridiagonales end
output (x;).
En algunas aplicaciones aparecen a menudo sistemas de ecuaciones en los que la
matriz de coeficientes tiene una estructura especial. Por regla general, es preferible resol­
ver estos sistemas utilizando un algoritmo hecho a la medida que tome ventaja de dicha
SERIE DE PROBLEMAS 4.3
estructura particular. Consideramos un ejemplo de éstos: los sistemas tridiagonales.
Una matriz cuadrada A = (aij) se dice que es tridiagonal si aij = O para todos l. Resuelva los siguientes sistemas lineales dos veces. Primero, utilice la eliminación gaussiana
los pares (i,j) que satisfacen [i - j[ > l. De este modo, en la fila i sólo a�i-!, a;; y simple y encuentre la factorizaciónA = LU. Después, utilice la eliminación gaussiana con
pivoteo de filas escaladas y determine la factorización de la forma PA = LU.
a�;+1 pueden ser distintos de cero. Para almacenar los elementos distintos de cero son
suficientes tres vectores, por lo que introducimos la siguiente notación: (a)
1- 1 - 4 X¡ Ü
d¡ C¡ X¡ b¡ [22 Ü ] [X2] =
[l]
3 3 2 X3 f
a¡ d2 c2 X2 bi
a2 d3 C3 X3 b3
(b)
a3 d4 C4 X4 = b4 (19)

¡-1 1 -,i n ¡·i


'
u!�][;:]=[!]
ª•-2 dn-1 Cn-1 Xn-1 bn-1
ª•-1 dn Xn bn (c)

O 11 2
En este despliegue, los elementos de la matriz que no se muestran son ceros. 1 Ü 1 j X2 Ü

¡ , _, , .1 n ¡ ºJ
=
Supondremos que la matriz de coeficientes es tal que el pivoteo es innecesario Ü 1 -1 1- X3 3
para resolver el sistema. Esto es cierto, por ejemplo, cuando la matriz es simétrica y 3 X4 1
definida positiva. En este algoritmo, utilizamos la eliminación gaussiana simple, y la (d)
parte derecha de la igualdad (el vector b) se procesa simultáneamente. En el paso 1,
un múltiplo de la fila 1 se sustrae de la fila 2 para producir un cero en el lugar que 12 8 - 4 10 xz = 1- 0
originalmente ocupaba a1. Observe que d2 y b2 sufren alteraciones, pero c2 no. El 3 1- 3 3 3 X3 39 -

[¡ ¡["] ] [ ']
múltiplo adecuado es a¡ /d 1 . Por lo tanto, el primer paso se compone de los siguientes -
6 42 -18 X4 1- 6
reemplazos: (e)
d 2 ,,_d2 - (a¡/d¡ )c1 O 2
4 9- 21 x2 14
b2 ,,_b2 - (a¡ /d1)b1 . 8166 5 X3
=
3-
Los pasos restantes en la fase de eliminación hacia adelante son exactamente iguales al 2 3 21 X4 Ü

primero. En la fase de sustitución hacia atrás, el primer paso es


2. Demuestre que la ecuación 8 ) define el algoritmo de eliminación gaussiana también
( que

{
puede escribirse en la forma
Xn ,,_ bn /dn.

-
El siguiente paso es �o =
a(kl
, . Sii -� k o j <k
Xn-1 ,,_ (bn-1 - Cn-1Xn )/dn-l ª;¡ a�kl (a/;l;atl)ai? Si i > ky j '?, k.
160 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 161

3. Sea (p i, p2, ..., p.) una permutación de (1, 2, ...,n ) y defina la matriz P con P¡¡ = /5p1¡. Sea entonces el algoritmo para los sistemas tridiagonales, por lo menos en teoría, surtirá efecto
A una matriz arbitraria den x n. DescribaPA, AP, p-I y PAP-1• en virtud de que no se encontrará ningún elemento pivote igual con cero. Remítase a la
ecuación (19) para la notación.
e 4. La eliminación gaussiana con pivoteo total trata tanto las filas como las columnas en un
orden distinto del orden natural. Así, en el primer paso, el elemento pivote ag se elige de 13. Escriba un algoritmo especial de eliminación gaussiana para resolver sistemas de ecuaciones
tal modo que Ja;¡ 1 es el valor máximo de toda la matriz. Esto determina que la fila i sea lineales cuando A tiene la propiedad de que aij = O para i > j + l. No haga uso del
la fila pivote y la columna j sea la columna pivote. Los ceros se producen en la columna pivoteo. Incluya en el algoritmo el procesamiento de la parte derecha del sistema. Cuente
j sustrayendo múltiplos de la fila i de las otras filas. Escriba el algoritmo que realiza este las operaciones necesarias para resolver Ax = b.
proceso. Serán necesarios dos vectores de permutación.
1 4. Cuente las operaciones en el algoritmo para sistemas tridiagonales que aparece en el texto.
5. SeaA una matriz den x n con factores de escalas;=máx1;.¡�.Jal Suponga que todos los s;
son positivos y sea B la matriz cuyos elementos son (aij/s;). Demuestre que si la eliminación 15. Vuelva a escribir el algoritmo para sistemas tridiagonales de modo que el orden en que se
hacia adelante se aplica tanto a A como a B, los dos L-tablas finales son iguales. Encuentre procesan las ecuaciones y variables se invierta.
una fórmula que relacione las matrices finales A y B (después de ser procesadas).
16. Demuestre el teorema relativo a las operaciones extensas en la eliminación gaussiana.
6. En ocasiones es aconsejable modificar un sistema de ecuaciones Ax = b, introduciendo
nuevas variables y, = d1x;, en donde los d1 son números positivos. Si las x; corresponden 17. Ejemplifique el funcionamiento de la eliminación gaussiana con pivoteo de filas escaladas
a magnitudes físicas, entonces este cambio de variables corresponde a un cambio de las cuando se le aplica a la matriz
unidades por medio de las cuales se mide x;. Por ejemplo, si decidimos cambiar x1 de
centímetros a metros, y1 = 10-2x1. En términos de matrices, definimos una matriz diagonal [-9 l 17]
D con las d; como componentes sobre la diagonal, y establecemos y = Dx. El nuevo A= 3 2 -1
sistema de ecuaciones es AD-1y = b. Si d¡ se elige como máx1:;¡;:;¡. JagJ, llamamos a esto 6 8 1
equilibración de columnas. Modifique los algoritmos de factorización y solución a fin de
incorporar laequilibración de columnas. (Los dos algoritmos juntos aún resolverán Ax = b.) Muestre la tabla de factores de escala. La matriz final A deberá tener escritos los multiplica­
7. Demuestre que en el algoritmo gaussiano con pivoteo total (es decir, con pivoteo en las filas dores en la posición correcta. Determine P, L y U y verifique que PA = LU.
y las columnas), los multiplicadores se encuentran en el intervalo [-1, l]. (Véase el Prob.4.)
18. Ilustre el funcionamiento de la fase de eliminación gaussiana con pivoteo de filas escaladas
cuando se aplica a la matriz

J]
8. Sea A una matriz de n x n que al ser procesada por eliminación hacia adelante da como
resultados la matriz B y la permutación p =(p¡, p2, ..., p.). Sea P la matriz que se obtiene ¡ -2
al escribir las filas y las columnas de la matriz identidad en el orden p1, p2, ..., p•. Demuestre [2 -4
que la descomposición LU de PA se obtiene de la siguiente forma: Sean C = PB, Lg = Cij 3 -5
paraj < i y Uij = C;¡ para i � j. (Obviamente, U;¡ = O si i > j y L;¡ = O sij > i y L¡¡ = l.)
Muestre todos los pasos intermedios: los multiplicadores, la tabla s de factores de escala y
9. Si el factor U de la descomposición LU de A es conocido, ¿cuál es el algoritmo para c�lcu­ el vector p de permutación. Muestre también la matriz final A que resulta de la aplicación
lar L? completa del algoritmo.
10. Ilustre el funcionamiento de la eliminación gaussiana con pivoteo de filas escaladas en este 19. Este problema nos muestra cómo la solución de un sistema de ecuaciones puede ser inestable
caso (sólo en la fase hacia adelante ). en relación a pequeñas perturbaciones en los datos. Resuelva Ax = b con cada una de las
siguientes matrices, con b = (100, lf. (Véase Stoer y Bulirsch [1980, p. 185].)
2 -2 -4
[1 1 -1]
3 7 5 A1 =
[i 6] A2 =
[i o.oi]
Muestre la tabla de factores de escala (s1, s2, s¡) y la última permutación (p 1, pi, p¡). Muestre
la matriz.final A con los multiplicadores escritos en el orden que les corresponde. 20. Suponga que O< s< i-22• Si se utiliza el algoritmo de Gauss sin pivoteo para resolver el
sistema
11. Lleve a cabo las instrucciones del problema 10 con la matriz {SX¡ +2x2 = 4
x1-x2=-l
3 7 3
1 t
4 '. en la MARC-32, ¿cuál será el vector solución (x¡, x2)?

[4 1 o] 21. Resuelva el siguiente sistema por medio de la eliminación gaussiana con pivoteo total (tal
como se le describe en el problema 4 ):
1 2. Suponga que A es tridiagonal. Defina co = O yª• = O. Demuestre que si A es diagonalmente
dominante por columnas [-9 J 17] [X¡] [ 5]
3 2 -1 X2 = 9
Jd;J > lad + lci-d (1 � i � n), 6 8 l X3 -3
162 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.3 Pivoteo y construcción de un algoritmo 163

22. Resuelva el sistema 30. Utilice la eliminación gaussiana con pivoteo de filas escaladas para encontrar el valor del
determinante de
0.264Lt1 +0.1735x2+0.8642x3 = -0.7521 [o -1 o 1]
{ 0.9411Xt +0.017fo +0.1463X3 = 0.6310 A= O 1 O 1
1 1 2 O
-0.864lx1 - 0.4243x2 +0.07 l lxi = 0.2501 2 O 1 O
utilizando la eliminación gaussiana y: (a) sin pivoteo, (b) pivoteo de filas escaladas. 31. Considere el sistema
23. Escriba un algoritmo para resolver el sistema Ax= b bajo las condiciones siguientes: Hay x2+2x3 = 1
una permutación (p1 ,p2, ••• , p.) de (1, 2, ... , n) tal que para cada i, la ecuación p; contiene { 2x1 - X2= 2
sólo a la variable x;.
2x2+xi= 3
24. Repita el problema anterior suponiendo que para cada i, la ecuación i sólo contiene la
variable Xp¡ - Determine la factorización PA = LU, donde P es una matriz de permutación. Utilice la
factorización para obtener det(A).
25. Repita el problema anterior suponiendo que para cada i, la ecuación p; sólo contiene la
variable xp,. Proporcione el algoritmo más simple en este caso. 32. Considere
26. (a) Demuestre que si aplicamos la eliminación gaussiana sin pivoteo a una matriz simétrica 3 2 -1
A, entonces l;1 = a¡¡/au. A= [ 6 6 2]
(b) A partir de lo anterior, demuestre que si se suprimen la primera fila y la primera columna -1 1 3
de A(2l, se obtiene una matriz de (n - 1) x (n - 1) que es simétrica Concluya que no es
necesario computar los elementos bajo la diagonal de la matriz más pequeña. Por medio Utilice la eliminación gaussiana con pivoteo de filas escaladas para encontrar la factorización
de la inducción matemática demuestre que lo mismo sucederá en cada paso de la fase de
factorización. PA=WU
(c) Demuestre que la cantidad de cálculo requerida es casi la mitad si se compara con el caso
de las matrices no simétricas. en donde L es una matriz triangular inferior unitaria, U una matriz triangular superior unitaria,
(d) Utilice la simplificación para resolver el sistema D una matriz diagonal y P una matriz de permutación.
33. En los siguientes problemas fijamos el valor de n y denotamos con 1 al conjunto {1, 2, ... ,
0.6428x 1 +0.3475x2 - 0.8468xi= 0.4127 n}. Una permutación de 1 es una aplicación p: 1....1. en donde la flecha doble indica que
{ 0.3475x1 + l.8423x2 +0.4759x3 = 1.7321 p es suprayectiva. De este modo cada elemento de 1 es la imagen p(i) de algún elemento
-0.8468x1 +0.4759x2 + l.2147xi= -0.8621 i de 1. La permutación identidad se define como u(i) = i para toda i E 1. Demuestre
que si p y q son dos permutaciones de 1, entonces también po q lo es, definiéndose esta
última aplicación de la manera usual con la ecuación (po q)(1) = p(q(¡)). Demuestre que
27. Considere la matriz po (qo r) = (po q)o r y quepo u = uo p = p.
o 4 25 79
[ 9O 167 392 89
99
] 34. (Continuación) Demuestre que cada permutación p tiene una inversap-1, la cual satisface
1 1
p o p- = u = p- o p. El conjunto de todas las permutaciones de 1 se llama grupo
O 6 6 49
simétrico de 1.
Marque con un círculo la componente que será utilizada como elemento pivote en la eli­
minación gaussiana con pivoteo de filas escaladas. La tabla de los factores de escala es 35. (Continuación) Dé un algoritmo para determinar la inversa de cualquier permutación
s = (80, 89, 160, 30). dada. (Una permutación de 1 se puede representar en la computadora como un vector
28. Muestre la matriz que resulta de aplicar la fase hacia adelante de la eliminación gaussiana (p( l),p(2), ... , p (n)).)
con pivoteo de filas escaladas a la matriz 36. Suponga que se nos da un sistema de ecuaciones Ax = b con A de n x n. Sean p y q
dos permutaciones de {1, 2, ... , n}. Escriba un algoritmo para resolver el sistema bajo la
2 -2 -4 suposición de que para i = !, 2, ... , n, la ecuación con número p; contiene solamente
[1 1 -1] la variable Xq1•
3 7 5
37. (Continuación) Repita el problema anterior bajo la hipótesis de que para cada i, las variables
En la matriz final, escriba los multiplicadores en los lugares adecuados. Xq1 , xq,, •••• Xq1_, no figuran en la ecuación con número p;.

º]
29. Encuentre el det(A) para 38. (Continuación) Repita el problema 36 bajo la.premisa de que para cada i, la variable Xqi
2 1 figura sólo en las ecuaciones correspondientes a los números p¡, pi, ... , p;.
A= [1 4 1
O 1 2 39. (Difícil) Encuentre un algoritmo para resolver Ax = b bajo la hipótesis de que todos los
elementos ay son cero, a menos que li -ji � 1, (i,j) = (!, n) o (i,j) = (n, 1). Use la
sin calcular el determinante por desarrollo de menores. eliminación gaussiana sin pivoteo.
4.4 Normas y análisis de errores 165
164 Capítulo 4 Resolución de sistemas de ecuaciones lineales

40. Cuente el número de operaciones extensas que hay que realizar en la factorización LU de c52. Escriba y pruebe programas que incluyan la equilibración de columnas en el algoritmo
una matriz de n x n, suponiendo que no se realiza pivoteo. gaussiano (Prob. 6.)
41. Sea A una matriz de n x n con predominio diagonal en sus columnas. Esto significa que c53_ Escriba y pruebe programas para resolver los sistemas Ax = by lA = cr con una sola
factorización de A (con pivoteo de filas escaladas) y otros dos subprogramas en donde se
resuelva para x y y respectivamente.
¿laifi<laiil (1 �j � n)
c54_ Escriba y pruebe programas para resolver el sistema Ax = b utilizando equilibración de
i=l
t*j columnas, equilibración de filas y pivoteo total. (Consulte los problemas 4 y 6 si no entiende
la terminología.)
Determine si la eliminación gaussiana sin pivoteo preserva dicho predominio diagonal.
'55. Escriba una subrutina GAUSSJ (N, A, B. X, P. S, D) que resuelva un sistema Ax= b de n x n
42. Sea A una matriz diagonalmente dominante. Se define el exceso en la fila i con la ecuación por el método de Gauss-Jordan con equilibración de columnas y pivoteo de filas escaladas.
En el algoritmo de Gauss-Jordan (sin pivoteo), en el k-ésimo paso principal se sustraen
múltiplos de la fila k de las demás filas, de tal modo que el coeficiente de x, es O en todas las
e,= la¡¡! -¿!aij! filas menos la k-ésima fila. Al final, la matriz será diagonal (en vez de triangular superior,
i=l como en el método de eliminación gaussiana). En el pivoteo de filas escaladas, la fila p, se
fr.i utiliza como pivote para producir coeficientes O para x, en todas las filas menos la fila p,.
La equilibración de columnas, tal como se examinó en el problema 6, se debería realizar al
Muestre que en la demostración del teorema 5 es cierto lo que sigue: principio. Los divisores necesarios en este proceso deberían guardarse en una tabla D, pues
se necesitarán al final para obtener x.
¿ !aij -a11alj/a11! +e¡.
"
!au -a¡¡au/a11!;;; 56. Demuestre o refute la conjetura natural de que si una matriz tiene la propiedad
j= Z
O.<:!a¡¡¡;;;¿laijl (1 � i � n),
Y el exceso en la fila i no disminuye con la eliminación gaussiana. i=l
fr.i
e 43. En relación al problema 26, escriba un programa que lleve a cabo la fase de factorización de
la eliminación gaussiana con una matriz simétrica. Suponga que no se requiere el pivoteo. entonces la eliminación gaussiana sin pivoteo conservará esta propiedad.
44. Sea p una permutación de { l. 2, ... , n}, y sea P la matriz de permutación correspondiente.
(Es decir,Pij = l5p,¡.) Sea q la inversa de p y Q la matriz de permutación correspondiente a 57. (a) Demuestre que el cómputo del determinante de una matriz por desarrollo de menores
comprende (n - l )(n!) ops.
q. Demuestre que p-1= Q. Diríjase a los problemas 33 a 35 en caso de necesidad.
(b) Demuestre que la regla de Cramer necesita de (n2 - 1)(n!) ops.
45. (Continuación) Demuestre que si Pes una matriz de permutación, entonces p-1 = PT.
(c) Demuestre que el método de Gauss-Jordan comprende !n(n +1)2 :::a !n3 ops y es, par lo
46.. Si A es de n x n y B es de n x m, ¿cuántas multiplicaciones y divisiones se requieren para tanto, 50% más costoso que la eliminación gaussiana.
resolver AX= B mediante la eliminación gaussiana con pivoteo de filas escaladas? ¿Qué se
puede decir cuando B= l?
47. Demuestre o refute: Si A es tridiagonal y Pes una matriz de permutación, entonces PAP-1
es tridiagonal. 4.4 Normas y análisis de errores
48. Suponga que la tabla de factores de escala se vuelve a computar en cada paso mayor de
la eliminación gaussiana con pivoteo de filas escaladas. Demuestre que para toda matriz
simétrica con predominio diagonal, la eliminación gaussiana produce los mismos resultados Para discutir los errores en problemas numéricos que manejan vectores resulta útil recu­
sin pivoteo que con pivoteo de filas escaladas. rrir a las normas. Usualmente nuestros vectores son elementos de uno de los espacios
49. Demuestre el teorema 3. IR", pero ello no impide que una norma pueda definirse en cualquier espacio vectorial.
'50. Escriba y ponga a prueba algunos programas que lleven a cabo la eliminación gaussiana
con pivoteo de filas escaladas. En los problemas 19, 21, 22 y 26 encontrará algunos casos Normas vectoriales
interesantes para ponerlos a prueba.
5 L En el algoritmo de la eliminación gaussiana con pivoteo de filas escaladas, suponga que los Definida sobre un espacio vectorial V, una norma es una función 11 · II que va de V
factores de escala se redefinen como sigue: al conjunto de reales no negativos que satisface los siguientes tres postulados:
S¡ = la¡¡ 1 +!a,2! +···+!a,.¡.
llxll > O si x .<: O, x E V (1)
Demuestre que al. aplicar el algoritmo que resulta de ello a una matriz diagonalmente domi­
nante, el orden entre los pivotes será el orden natural (1, 2, ..., n). Escriba y pruebe algunos IIAXII = IAI llxll si A E IR, x E V (2)
programas en los que se desarrollen las ideas expuestas en el problema 26, especialmente la si x, y E V (desigualdad del triángulo).
eliminación gaussiana sin pivoteo para sistemas simétricos. llx + YII � llxll + IIYII (3)
166 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.4 Normas y análisis de errores 167

Podemos considerar llxll como la longitud o magnitud del vector x. Una norma sobre Xz
Xi Xi
un espacio vectorial generaliza la noción de valor absoluto, lrl, de un número real o
complejo. La norma sobre 1n más conocida es la norma Euclídea, la cual se define
(O,!)
mediante

�xr
n 1/2

llxll2 = ( ) donde x = (x¡,x2, ... , xnl-


(!, 0)
X¡ X¡ , ) -. X¡
Ésta es la norma que corresponde a nuestro concepto intuitivo de longitud. El subíndice
2 tiene como único propósito identificar la norma. En análisis numérico también se
utilizan otras normas, siendo la más simple y sencilla de calcular la llamada f.00-norma:

I Jxlloo = 1 má x lx;!. (4)


;;ái;;án
[[x[b l[xll� llxtli
Una vez más se recurre a un subfudice para distinguir esta norma de las otras. Un tercer
Figura 4.1 Esferas unitarias en 12 para tres normas.
ejemplo importante de una norma sobre 1n es la llamada f.1 -norma:
n

llxlli = Í: lxd. (5)


i=l
Ésta también se conoce como la norma matricial asociada con la norma vectorial dada.
Ejemplo 1 Usando la norma 11 · 111 compare las longitudes de los siguientes tres vectores en 14. En este caso se considera que A es una matriz de n x n.
Repita los cálculos para las normas 11 · lb Y 11 · 11oo ·

X= (4,4,-4, 4)7 V= (Q,5,5,5)7 w = (6,0,0,0)7. TEOREMA! Si 11 · 11 es cualquier norma sobre In, entonces la ecuación (6) define una norma sobre
el espacio lineal de todas las matrices n x n.
Respuesta Los resultados se muestran en la siguiente tabla.
Demostración Verificaremos que se satisfacen los tres axiomas correspondientes a una norma. Pri­
11 · lli ll · 112 11 · lloo mero, si A * O, entonces A tiene al menos una columna distinta de cero. Digamos
X 16. 8. 4. que A(J) * O. Considere el vector en el que 1 es la j-ésima componente, es decir,
V 15. 8.66 5. x = (0,... ,O,l. O,. .. ,Di. Es obvio que x * O y que el vector v = x/ llxll tiene norma
w 6. 6. 6. 11 l. Por consiguiente, por la definición de IIAII ,
Para entender mejor estas normas es ilustrativo considerar 12. En la Figura 4.1
IIAxll _ IW''I\ O.
mostramos imágenes, para las tres normas dadas anteriormente, que corresponden al
conjunto
IIAII � IIAvll =
llxll - > "Txf
{ x: x E lR.2, llxll � l } . Acto seguido, debido a la propiedad (2) de la norma vectorial, tenemos:
Este conjunto se llama esfera unitaria o bola unitaria en un espacio vectorial bidimen­
sional. IIAAII = sup{I\Uull: = 1} = IAI sup{IIAull : llull = 1} = IAI IIAII-

Normas matriciales Para verificar la desigualdad del triángulo usamos la propiedad análoga de la norma
vectorial y el problema 4. Con esto en mente escribimos:
Pasemos ahora a ocuparnos del problema de la definición de normas para matrices.
Si bien podríamos tratar con normas de matrices en general, sujetas sólo a los mismos
IIA+BII = sup{ ll(A+B )uil: llull = 1}
requerimientos ( 1) a (3), usualmente preferimos que la norma matricial esté Últimamente
ligada a una norma vectorial. Si se ha especificado una norma vectorial 11 · 11, su norma � sup{ IIAull+ IIBul\: llull = 1 }
matricial subordinada se define como � sup{IIAull : llull = 1} + sup{IIBull : llull = 1}
IIAII = sup{IIAull : u E Rn, llulJ = 1}. (6) = IIAil+IIBII 1111
168 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.4 Normas y análisis de errores 169

Una consecuencia importante de la definición (6), y de hecho la motivación de esta


definición,es:
Número de condición
Pongamos ahora a trabajar estos conceptos. Consideremos una ecuación
IIAxl J� IIAl l llxl l (x E IR"). (7)
Para demostrarlo obsérvese que es cierta para x= O. Si x;: O , entonces el vector
Ax=b,
donde A es una matriz de n x n. Suponga que A es invertible.
v= x/ l Jxlltiene norma l. Por tanto, de la ecuación (6)se deduce que
Ejemplo 2 Si se perturba A-1 para obtener una nueva matriz B, la solución x= A- 1 b resulta
JIAxJJ. perturbada y se convierte en el vector x = Bb. ¿Cuán grande es esta perturbación en
IJAII� JJAvJJ= términos absolutos y relativos?
IJxJI
Respuesta Usando cualquier norma vectorial y su norma matricial subordinada resulta lo siguiente:
A modo de ilustración de este importante concepto fijemos como nuestra norma
J ¿Cuál es la norma matricial subordinada? El cálculo es el
vectorial la norma llxl 00 ll l ll x-BAxll = IIU -BÁ.)xll � 111 -BAll 114
x- x ll = ll x- Bbl =
siguiente: Esto nos da la magnitud de la perturbación de x. Si se mide la perturbación relativa

podemos escribir:
l lx-xll ::; ­
IJAl loo = sup IIAul Joo = sup {�á.t
j(Au);J} = � { sup l(A u);f} l lx
- IJJ - BAll (11)
ll•lloo=l ll•lloo=l 1='=n 1='=n ffulloo=l
La desigualdad (11)da una cota superior para llx-x ll / ll xll, y este cociente se considera
ll

una medida del error relativo entre xy x. 1


máx {
= ¡<·< sup � agru1· } �a -
máx L.,
= ¡<·< ( 8)
='=n ll•lloo=l jL.,
=l n l gl
='= j=l Ejemplo 3 Suponga que se perturba el vector b para obtener el vector b.Si xy x satisfacen Ax = b
r

y Ax = b, ¿cuánto difieren xy x en términos absolutos y relativos?


Aquí se ha utilizado el hecho (Prob. 9)de que se pueden intercambiar dos procesos Respuesta Si suponemos que A es invertible tenemos que
de maximización. También se utilizó que el supremo de IÍ::J=l a¡¡u¡[, para i fija y
x- x l l= IW b -A- b l =
l IW cb -b ) II
JJ ul l oo = l ,se obtiene haciendo u¡ =+l sia;¡ � O y u¡= -1sia¡¡ < O.
1 1 1
ll

Con esto hemos demostrado el siguiente teorema. � JW IJ bll -b l l


1

Esto nos da una medida de la perturbación sobre x. Para obtener una estimación de la
TEOREMA 2 Si la nonna vectorial 11 · [J 00 se define mediante perturbación relativa escribimos:

l l xl loo máx l x;,f ll -b ll


l\x-\x \::;- I\A- 11 l b\ -b ll = I\A- ll 11Axl\ b
b
= l�i�n 1 1
ll ll

� \W II IIAll l \xl\! � t .
entonces su nonna matricial subordinada está dada por 1 lb ll
ll l

Por consiguiente ,
máx
IIAlloo = l�i�n ¿ [aijl· \\x-i x \ 1 ¡¡ llb -b l l
j=l < \IAII I\A- (12)
x \ = ll ll ·
b
11
ll l

Además de las propiedades básicas (1)a (3), una norma matricial subordinada a
una norma vectorial tiene otras propiedades. Por ejemplo: La desigualdad (12)nos dice que el error relativo en xno es mayor que K(A)veces
el error relativo en b, donde
" "= 1 (9) =
K(A) \IA\IIW 1 11. (13)
El número K(A)se llama número de condición de la matriz A. Su valor depende de la
IIABII� IIAII II BIJ. (10) norma vectorial seleccionada al iniciar el análisis. En la desigualdad (12)se observa que
si el número de condición es pequeño, entonces pequeñas perturbaciones en b conducen
La demostración de (9)se obtiene de manera inmediata de la definición (6), y la ecuación a pequeñas perturbaciones en x. La desigualdad K(A)� 1siempre se cumple.(Véase
(10)se deduce de las ecuaciones (6)y (7.) el Prob. 13. )
170 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.4 Normas y análisis de errores 171

Para ejemplificar el uso del número de condición tomemos e > O y lo cual se deduce de inmediato de

A= [ 1 1 + e] -1-E IJrll lJxll = IIAell lW bll � IIAll llell lW ll llbll


A-1 =E-2 [ 1 ]
1 1

1- e 1 -1 + e 1
111111

Una matriz con un número de condición grande se dice que está mal condicionada.
Si se emplea la norma oo tenemos que, usando la ecuación (8), JIAJJ 00 = 2 + �-'l_ Para una matriz A mal condicionada habrá casos en los que la solución de un sistema
J¡A- 1 JJ 00 = e-2(2+e). PortantoK(A) = [(2+e)/e]2 > 4/e2 . Si e � 0.01, K(A) � 40,000. Ax = b será muy sensible frente a pequeños cambios en el vector b. Dicho de otro
En tal caso una pequeña perturbación relativa de b puede inducir una perturbación relativa modo, para lograr una cierta precisión en la determinación de x, requerimos una precisión
40,000 veces mayor en la solución del sistema Ax = b. significativamente mayor de b. Si el número de condición de A es de tamaño moderado,
Si resolvemos numéricamente un sistema de ecuaciones se dice que la matriz está bien condicionada.
Ax=b

no obtenemos la solución exacta x, sino una solución aproximada x. Nos podemos


SERIE DE PROBLEMAS 4.4

formar una idea de lo buena que es la aproximación x calculando Ax y viendo si su valor l. Demuestre que las normas llxlloo, llxllz, llxllt satisfacen los postulados (1), (2) y (3) para
normas.
es cercano a b. Con ello se obtiene el vector residual
2. Demuestre que llxlloo ;;; llxll2 ;;; llxllt para todo x E IR", y que las igualdades pueden darse
aun para vectores distintos de cero.
r = b-Ax.
3. Demuestre que JJxJh ;;; nlJxlJoo Y que IJxJJ2;;; /ñllxlloo para x E IR".
La diferencia entre la solución exacta x y la solución aproximada x recibe el nombre de 4. Demuestre que para dos funciones cualesquiera cuya imagen está en R
vector de error,
e=x-x. sup[f(x) +g(x)] ;;; supf(x) +sup g(x)
La relación 5. Para la norma matricial en el teorema 2, demuestre o refute: IIABlloo = IIAlloollBlloo- ¿Qué
Ae=r. (14) sucede en el caso especial IIA2 lloo = IIAII;.,?
entre el vector de error y el vector residual tiene una importancia fundamental. 6. Demuestre que una norma definida sobre IR" debe de alguna manera tomar en cuenta todas
Dése cuenta de que x es la solución exacta del sistema lineal Ax = b, el cual tiene el las componentes de un vector. Demuestre que la norma llxlloo es la más sencilla en IR". (Para.
ello tiene que definir un concepto adecuado de simplicidad.)
segundo miembro perturbado,b = b- r. A continuación establecemos relaciones entre
los errores relativos de x y de b. En otras palabras, deseamos relacionar.JJx- xJl/ll xll 7. Determine si las siguientes expresiones definen normas en IR":
con JJb-bJJ/JJbJJ = Jlrll/llbll- El siguiente teorema muestra que el número de condición (a) máx{Jx2J, lxil, ..., Jx.l}
K(A) juega un papel importante. n
(b)¿lxd3
l
_ J!.1 < J!:Jl < K(A)J!.1
K(A) JJbll = JJxlJ =
t
i=l

JJbJJ
TEOREMA3
(c) { lx.1 11 r
2

Demostración La desigualdad de la derecha se puede escribir como


(d) máx{lx1 -x2 I, lx1 +xzl, lxil, lx41, ··. , lx.l}
iieii llbll � IIAII llrlJ ll xll (e)¿z-ilxd
n

y esto resulta cierto ya que


i=I

8. Defina IIAII = I:;=t I:7=t laijl· Demuestre que ésta es una norma matricial (esto es,
una norma sobre el espacio lineal de todas las matrices den x n). Demuestre que no es una
llbll = IW rll llAxll � IW II IJrll llAll ll xll norma subordinada a norma vectorial alguna. ¿Satisface los criterios que se establecen en
1 1

las ecuaciones (9) y (10)?


(De hecho la desigualdad de la derecha en el teorema es la desigualdad (12).) La
desigualdad de la izquierda se puede escribir como 9. (a) Demuestre que si A y B son conjuntos arbitrarios yfes una función real acotada en Ax B,
entonces
sup supf(a, b) = sup supf(a, b)
ll xll � IIAII llbJJ llell aEA bEB áEB aEA
172 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.4 Normas y análisis de errores 173

(b) Demuestre mediante un ejemplo que el supremo y el ínfimo en general no pueden inter­ 21. Sean= 3 y tomemos
cambiarse. 4 -3 2
(c) Demuestre que 4. = [-1 O 5] .
2 6 -2
sup ínff(a,b) � ínf sup/(a,b)
aEA bEB bEB aEA Entre todos los vectoresx que satisfacen l lxll oo � 1, encuentre uno para el cual IIAxl loo , sea
tan grande como sea posible. Proporcione además el valor numérico de IJ A lloo -
10. Demuestre que para cualquier norma vectorial y su norma matricial subordinada, y para
cualquier matriz A den x n, existe un vector x;o O tal que IJAx lJ = IIAll llx ll - 22. La norma e00 ponderada es una norma sobre IR." de la forma
IxJ l l = máx w;lxd,
11. Demuestre que para la norma vectorial definida en la ecuación(5) la norma matricial l�i�n
subordinada es
donde w1, w2 , ..., w. son números positivos que se han fijado y reciben el nombre de pesos.
Demuestre que esta norma satisface, en efecto, los postulados de una norma. ¿Cuál es la
IIAllt = máx "'""'"laijl­ norma matricial subordinada?
l�!>n�
23. Demuestre que si 11 · 11 es una norma sobre un espacio vectorial, y que si definimos llx ll' =
- i=l

12. ¿Satisfacen las normas matriciales subordinadas la igualdad IIABII = l!BAII? Justifique su al xJ ll , donde a en un número positivo fijo, entonces 11 · II' también es una norma.
respuesta. 24. Si se usa la misma construcción del problema anterior en el caso de una norma matricial
subordinada, ¿es la norma resultante también una norma matricial subordinada?
13. Demuestre que el número de condición de una matriz invertible debe al menos valer l.
25. Sea 11 · II una norma sobre un espacio vectorial V. Parax y y en V se defined(x, y)= llx-yll­
14. ¿Qué clase de matrices tienen número de condición igual a 1? Demuestre que d tiene las siguientes propiedades:
(a) d(x,x) = O
15. Usando la norma matricial IIA ll t (Prob. 11), calcule el número de condición de la matriz (b)d(x, y)=d(y,x)
1 1 +e] (c)d(x,y)>O six;oy
[ 1-e 1 ·
(d)d(x,y) �d(x, z ) +d(z,y)
16. Usando la norma matricial IIAll oo , ecuación(8), calcule el número de condición de la matriz (U na función que posee estas cuatro propiedades se denomina métrica.)
c26. Genere subrutinas para calcular la norma de un vector y de una matriz cuadrada. Use la
G 1�]- norma máxima, llxll oo , y su norma matricial subordinada.
17. Sea A una matriz den xn con matriz inversa C=(cij). Demuestre que al resolver el sistema 27. Dé llil ejemplo de una matriz bien condicionada cuyo determinante tenga un valor muy
Ax= b, una perturbación de magnitud de o en b¡ provoca una perturbación de c;¡/5 en x;. pequeño.
28. Calcule el número de condición de una matriz triangular inferior de n x n que tiene unos
18. (Continuación) Demuestre que una perturbación de magnitud o en a¡k producirá una per­ positivos en la diagonal y unos negativos debajo de la diagonal. Use la norma matricial
turbación de aproximadamente-CijXkÓ enx;.
1 1 · lloo •

19. (Continuación) En algunas ocasiones la siguiente cantidad se usa como número de condi­ 29. Demuestre que si A tiene un punto fijo no trivial(es decir, Ax= x;o O), entonces IIAIJ � 1,
ción de una matriz A de n x n: para cualquier norma matricial subordinada.
30. Dé un ejemplo de una norma sobre IR2 tal que la norma de(1, 0) sea 2 y la norma de(1, 1)
M(A)= n máx laijl máx l c ijl , sea l .
31. ¿Existe una norma sobre IR tal que 11(1. 0)11 = 11(0, 1) 11 = ll(l, N?
2
l�ij�n l;';ilj�n

donde C es la inversa de A. Demuestre que si Ax = b y si se perturba sólo una de las 32. (Véanse los Prob. 2 y 3.) Encuentre las condiciones precisas sobrex para que se satisfaga
componentes de b (digamos que en llila cantidad e), entonces !ax perturbada(denotada por (a) llxl loo = Jlx ll1 (b) J xl l loo = IxJ ll2 (c) IxJ J l t = J xJ l J 2
i) satisface:
33. Demuestre que IIAII es el número M más pequeño que satisface IIAxll � M llx lJ para todax .
llx - xlloo < M(A)L
IxJ lloo = IJb lloo · 34. Para cualquier matriz A den x n se define IIAII, = (¿;= 1 ¿;=1at)1l2• (Ésta se llama
norma de Frobenius.) ¿Es una norma matricial subordinada? Responda la misma pregunta
20. En el texto se demuestra que si Ax = b y Ax = b , entonces para IJ AII = máx1�,¡�. laij J . Demuestre que estas ecuaciones definen normas sobre el espacio
vectorial de todas las matrices de n x n.
- 35. ¿Es necesariamente cierto, para cualquier norma matricial subordinada, que la norma de una
llx -xl l � K(A)llb-bl l . matriz de permutación sea uno? Explique su respuesta.
IxJ ll - lbll
·· 1-
36. Dado un vector x = (xi,x2, ...,x.l E IR.", definimos lxl , el valor absoluto del vector x,
Demuestre que para toda matriz no singular A esta desigualdad se vuelve igualdad para
como el vector(xJ 11, lx2 I, ...' 1x.1r
Para los vectores X, y definimos también X � y para
reindicar que x; � y, para i = 1, 2, ... , n. Demuestre que las normas 11 · l l1, 11 · 1 12 y 11 · l loo,
algunos vectores by b. (Es obvio que buscamos b ;o O y b ;o b.) poseen la propiedad de que si lxl � IYI, entonces l lx ll � IIYII-
174 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.5 Series de Neumann y refinamiento iterativo 175

37. Para cualquier número real p � 1,la fórmula 47. Sea 11· II una norma sobre l.",y A una matriz den x n. Haga llxlJ' = IJA xlJ. ¿Cuáles son las

\lx!Jp=
(n ) 1 /p
condiciones que se deben imponer sobre A para asegurar que también 11 · 11' es una norma?
48. Demuestre que si utiliza la norma Euclídea, el conjunto
�lxl
H = {x E lR" : llx - ali = IJx - bll}
define una norma. (La demostración se encuentra en el texto de Bartle [1976, pág. 61].) representa un hiperplano (es decir,una traslación de un subespacio lineal de dimensión n -1),
Demuestre que para cada x E JR" pero lo mismo no resulta generalmente cierto si se usan otras normas. Ilustre esta situación
en el caso n = 2.
lím llx!Jp = !Jxlloo ·
p-oo
49. Demuestre que el número de condición tiene la propiedad
Esto ilustra el por qué de la notación JI·
K(AA) = K(A) (A.;0).
38. Demuestre las siguientes propiedades de normas:
(a) JJOII = 0 50. Demuestre que si una matriz cuadrada A satisface la desigualdad IJAxlJ � 8llxll para toda x,

t
(b) IJx+yJJ � IIJxll - llY III con 8 > O, entonces A resulta no singular,y JJA-1 11 �a-1• Este resultado es válido para
cualquier norma vectorial y su norma matricial subordinada.
(c) lltil ll � !Ji�IJ para vectoresi1>,P ,.. . ,x<ml 51. Demuestre que si A es diagonalmente dominante,entonces tendrá la propiedad mencionada
en el problema 50. Proporcione un valor de 8 para cuando se utiliza la norma 11 · !loo·
39. Sea IJ · 11 una norma sobre lR". Defina 52. Demuestre que si A es no singular existe entonces una o > O con la propiedad de que A +E
es no singular para todas las matrices E que satisfacen IIEJJ < o. Esto se puede demostrar
IJx\l' = sup{u x : u E lR ", !Ju\l = 1}. para cualquier norma sobre el espacio vectorial de todas las matrices de n x n.
r

Demuestre que esta ecuación define una norma. Demuestre que al repetir el proceso se 53. Demuestre que en el problema 52 podemos utilizar
obtiene la norma original; es decir, (11 · JJ')' = 11 · !J. Demuestre que para toda x,y E lR",
o = ínf{IIAxlJ : JlxlJ = 1}.
lhl�\lxlJ IIY II'
Es este caso se usan la norma vectorial y la norma matricial subordinada.
40. Demuestre la siguiente desigualdad para los números de condición definidos en la ecuación
(13): 54. Sea A una matriz de n x n y N su espacio nulo (kernel). Defina
!C(AB)�!C(A)K(B).
o = ínf{IJA x\l : llxll = 1 y x.LN}.
41. Calcule los números de condición usando las normas IIAJJ¡, JJA ll2,y IJA IJoo :
(a)[a+la a - l ª] 1
(b)[-2O O!] (c)[1ª 1] Demuestre que si IJEIJ < o,entonces rango (A+ E) � rango (A).
55. Demuestre lo siguiente: si A es no singular, entonces existe una matriz singular en una
42. Use los problemas 2 y 3 para demostrar que
vecindad de radio IIA -1 ¡¡-1 centrada en A. En este caso la norma puede ser cualquier norma
1 2 matricial subordinada.
n- IIA ll2�n- 1 IJA IJoo � IJA ll2�n 1 IIA IJi �n!IA ll2-
1 2 1

56. Deduzca la ecuación (14).


43. Al resolver el sistema de ecuaciones Ax = b con A =[
i
�.Ol]. Haga una predicción de
cómo pequeños cambios en b afectarán a la solución x. Ponga a prueba su predicción en el
caso concreto en que b = (4, 4) y b' = (3, 5).
4.5 Series de Neumann y refinamiento iterativo
44. Sea A una matriz de m x n. Interpretamos a A como un_a transformación lineal de JR", con
la norma IJ · 11 1 , en JR"', con norma 11 · lloo · En estas circunstancias, ¿qué es IIA II? Lo que se
desea es una fórmula sencilla para Una de las aplicaciones importantes del concepto de norma es el de precisar el concepto
de convergencia en un espacio vectorial. Si a un espacio vectorial V se le asigna una
IIA IJ = máx{IJA xlloo : llxlli = 1 }. norma[\· I\, decimos que la pareja (V, l\ · 11) es un espacio lineal normado. La noción
45. Repita el problema 44,pero ahora intercambiando las normas 11 · lli = ll · lloo- de una sucesión convergente de vectores y(!) , v(2l , .. . se define entonces de la manera
siguiente: decimos que la sucesión dada converge a un vector v si
46. Demuestre que el número de condición K(A) se puede expresar mediante la fórmula

K(A) = sup IIAxll/l!Ay!J. lím l\ikl - v\l = O.


k-+co
llzll=IIYII
176 Capítulo 4 Resolución de sistemas de ecuaciones lineales
4.5 Series de Neumann y refinamiento iterativo 177
k
Esto coincide con nuestra idea intuitiva de que las distancias entre los vectores vC J y el A continuación demostramos que las sumas parciales de la serie deNeumann con­
vector límite v tienden a cero conforme K aumenta. vergen a (l -A)-1:
Un ejemplo en 1.4 sería el siguiente: m

,{!]
3 -k-1
¿Ak -+ (l-A)-1 (cuando m -+ oc).
-2+k-4] k=O
yCk) = [
+ l)k-1 y Basta con demostrar que

l
(k
k
e- m

(l -A) ¿Ak -+ l (cuando m -+ oc). (2)


Entonces k=O
k-1

y(k) _V= [ -k-f


El lado izquierdo de la ecuación puede presentarse como
k-1 . m m
k
e- ([-A) ¿Ak = ¿(Ak -Ak+I)=Aº -Am+l = [-Am+I.
Si calculamos llv(kl - vil, utilizando la norma infinito de la sección 4.4, vemos que k=O k=O
-+ -+
llv Ckl -vll oo O cuando k oc. Por consiguiente, v es el límite de la sucesión [v (kl] Ya que IIAm+r 11 � IIAlr+1 -+ O, conforme -+ oc, entonces la expresión (2) queda
m
en el espacio lineal normado (1.4, 11 · ll oo)- demostrada. ¿Por qué? 1111
En este momento resulta apropiado citar, sin demostrarlo, un importante resultado
acerca de espacios lineales normados: dos normas cualesquiera sobre un espacio vec­ Este teorema aparece, esencialmente bajo el mismo aspecto, en la teoría de los
torial de dimensión finita conducen al mismo concepto de convergencia. Así, en el operadores lineales continuos definidos sobre cualquier espacio de Banach. El teorema
ejemplo anterior, y habiendo verificado llv(k) -vll oo -+ O, podemos concluir sin ningún tiene consecuencias que revisten una gran importancia, tanto en el aspecto teórico como
otro cálculo que llv(kl -vil -+ 4
O para cualquier norma sobre 1. • Advertencia: este en el práctico. Observe que a partir de la ecuación (1) podemos hacer la siguiente

f
teorema no es válido para espacios lineales normados de dimensión infinita. (Como estimación:
ejemplo de lo anterior vea el problema 20.) IIU-A)-1 11 � f)A kll � IIAll k =
Otro resultado importante acerca de espacios lineales normados de dimensión finita k=O k=O l -\AIJ'
es el que nos refiere que en dichos espacios toda sucesión de Cauchy converge. Por ello, si
una sucesión [y(kl] en un espacio lineal normado de dimensión finita satisface el criterio Ejemplo 1 Use la serie deNeumann para calcular el inverso de la matriz
de Cauchy [0.9 -0.2 -0.3
lím sup llv(il -v(i)II = O, B = O.I 1.0 -0. l ] .
k-oo i,j?;k
0.3 0.2 1.1
entonces necesariamente existe un punto v E V, al cual converge la sucesión. Respuesta Sea B = l - A, donde
Estas ideas se pondrán en uso en el caso de vectores en 1.n y matrices de n x n. En 0.1
0.2 0.3
el siguiente teorema tomamos a 11 · 11 como una norma cualquiera sobre l." y usamos su A= [ -0.I O.O 0.1] .
norma matricial subordinada 11 · 11 conforme se definió en la sección 4.4. -0.3 -0.2 -0.1
Ya que IIA[\ = 0.6, la serie deNeuman ¿�Ak converge as-1• Usando el algoritmo
00

º]
Series de Neumann que aparece en el problema 23, calculamos algunas de las sumas parciales:
TEOREMA 1 Si A es una matriz de n x n, tal que IIAII < 1, entonces l -A es invertible y o 1 O 1 [ 1.1 0.2 0.3
¿Ak = [ O 1 O I>k = -0.1 1.0 0.1 ]
00 k=O O O l k=O -0.3 -0.2 0.9
(l -A)-1 = ¿Ak. (1) 2 [ 1.00 0.16 0.32
k=O
¿Ak = -0.14 0.96 0.06]
k=O -0.28 :....Q.24 0.80
Demostración Primero demostraremos que l-A es invertible. Si no es invertible, entonces es singular,
y por lo tanto existe un vector x que satisface llxll = 1 y ([ - A)x = O. De este hecho se
concluye que
1 = \lx[\ = IIAx\l � [\A[[ \lxll = I IA[[ 19 [ 1.00000000 0.14285714 0.28571429
¿Ak = -0.12500000 0.96428571 0.05357143 ]
lo cual contradice la hipótesis de que [\A \1 < l. k=O -0.25000000 -0.21428571 0.82142857
4.5 Series de Neumann y refinamiento iterativo 179
178 Capítulo 4 Resolución de sistemas de ecuaciones lineales
El proceso se puede repetir con el fin de obtener mejores soluciones x <2l, x<3l, . . . . El
La última suma parcial que se muestra proporciona s- 1 con 8 dígitos decimales de
éxito del método depende de calcular los residuos r(0 con doble precisión, con el fin de
precisión. 11
evitar la pérdida de dígitos significativos que resulta de la resta. Por consiguiente, la
A continuación se presenta una variante del Teorema 1: expresión b¡ - 4=! aifxJ°l se evalúa en doble precisión. (Recuerde que idealmente r(0
debería ser el vector cero, y que la sustracción inherente al cálculo de r<•) debe involucrar
TEOREMA 2 Si A y B son matrices de n x n tales que 111-ABII < 1, A y B son invenibles. Además, cantidades casi idénticas.)
00
Ejemplo 2 Utilice el refinamiento iterativo para resolver el sistema
00

r 1 =B¿(l-AB/ y S- 1 =¿(I-AB/A. (3)


k=O k=O 420 210 140 105
210 140 105 84 Xz
=
875
539
[X¡]
Demostración El teorema anterior nos indica que AB es invertible y que su inversa es [140 105 84 70 ] X3 [399]
00 105 84 70 60 x.¡ 319
(AB)- 1 =¿(l-AB/ Respuesta Primero se factoriza el sistema usando la eliminación gaussiana con pivoteo por filas
k=O
escaladas, y la solución
Por consiguiente X(
O)
= (0.999988, 1.000137, 0.999670, 1.000215/
00

1 1
A- 1 =BB- 1 A- =B(AB)- =B¿([ -ABi se obtiene recurriendo a la sustitución hacia atrás. Varios pasos de mejoramiento iterativo
k=O proporcionan los siguientes resultados:
00

s- 1 =S- 1 A- 1 A =(ABr 1 A =¿U-ABiA 11 x<1l = (0.999994, 1.000069, 0.999831, 1.000110/


k=O
x (Zl = (0.999996, 1.000046, 0.999891, 1.000070/
Refinamiento iterativo P = (0.999993, 1.000080, 0.999812, 1.000121/
Si iºl es una solución aproximada de la ecuación x<4l = ( l.000000, 1.000006, 0.999984, 1.000011/
Ax=b, La solución verdadera es x = (1, 1, 1, lf. Ya que se utilizó una computadora con una
precisión muy similar a la de la MARC-32 consideramos que este resultado es suficiente­
entonces la solución exacta x es
mente bueno. 1!11
x =x (Ol +A- 1 (b-Ax (ºl) =x (Ol +e<0l, (4)
Para analizar este algoritmo desde el punto de vista teórico, adoptamos el punto de
donde e(O l =A- 1(b-Ax (ºl ) y recibe el nombre de vector de error. El vector residual vista de que nuestra solución x<0l se obtiene de la fórmula
que corresponde a la solución aproximada x (O) es r <0l =b - Ax (Ol, que se puede calcular.
Claro está que no deseamos calcular A-1, pero aun así el vector iºl = A- 1 r <0l puede x (O ) =Bb,
calcularse resolviendo la ecuación
donde B es una aproximación a la matriz inversa de A. El proceso iterativo puede
A/ºl = r (Ol_ escribirse entonces como
Estas observaciones conducen a un procedimiento numérico llamado mejoramiento x(k+tl =x(k) =B(b-Ax(k)) (k � 0). (6)
iterativo o refinami�nto iterativo, el cual se describe a continuación con mayor detalle.
Suponga que la ecuación Ax = b se ha resuelto utilizando el procedimiento de A continuación procedemos a demostrar que estos vectores son las sumas parciales de
eliminación gaussiana, descrito en la sección 4.3. Dado que no se espera que el resultado la serie de Neumann y aprovechamos este hecho para demostrar que la sucesión [.x(kl]
sea la solución exacta ( debido a errores de redondeo), lo denotamos como x (Ol y acto converge a la solución de Ax =b.
seguido calculamos r <0l, iºl, y xOl mediante las tres ecuaciones siguientes: La expresión "B es una aproximación a la matriz inversa de X', que resulta vaga,
se interpreta como que 111-ABII < l . Según el teorema 2, A- 1 se expresa como
r(O) =b - Ax (O) 00

{ Ae(O) =/ºl (5) A- 1 =B¿(I-ABf (7)


x ( tl =x (Ol +/Ol k=O
180 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.5 Series de Neumann y refinamiento iterativo 181

Así, la solución exacta de la ecuación Ax=b es (i) Precondicionamiento mediante equilibración de filas.
00
(ii) Precondicionamiento mediante equilibración de columnas.
x=B¿(I-ABlb. (8) (iii) Pivoteo total.
k=O (iv) Precondicionamiento o escalamiento en cada uno de los pasos principales del
proceso de eliminación.
TEOREMA 3 Si III - ABI\ < 1, entonces el método de mejoramiento iterativo dado por la ecuación (v) Mejoramiento iterativo al final.
(6) da lugar a la sucesión de vectores
La equilibración de filas es un proceso que consiste en dividir cada fila de la
m matriz de coeficientes por el máximo elemento en valor absoluto de dicha fila; es decir,
x(
m)
=B¿(!-AB/b (m � O). multiplicar la fila i por r; = 1/ máx 12?.• la;,¡\ para 1 � i � n. Después de haber hecho
k=O esto, los nuevos elementos, lig, satisfarán máx 1 ?.i?. n jag = 1 para 1 � i � n. En la
1

práctica, al estar trabajando en una computadora binaria, el factor r; se toma como un


Éstas son las sumas parciales que aparecen en la ecuación (8) y por lo tanto convergen número de la forma zm tan próximo como sea posible a 1/ máx 1 ?.i?. n ja;¡ J. Esto se hace
a x. con el fin de evitar que se introduzcan errores de redondeo adicionales. Ya que la i-ésima
ecuación de nuestro sistema es
Demostración Utilizaremos la inducción. Dado que iºl = Bb, el caso m = O es cierto. Si se supone
que el m-ésimo caso es cierto, entonces el (m+1)-ésimo también es cierto, ya que
n n

¿agXj = b; O ¿(r;ag)x¡ =r;b;,


m m i =l i =l
x(m+n =x'ml+B(b-Ax(ml) = B¿(!-ABib+Bb-BAB¿(!-ABlb
k=O k=O deberíamos también multiplicar b; por r;. Por lo tanto, los números r; deberán alma­
cenarse durante el proceso de factorización de tal manera que puedan utilizarse en el
m+l
proceso de cálculo de la solución. En la notación usual para matrices y vectores la
m
= B { b+(I-AB)¿(!-AB/b } = B¿(!-AB/b. 11
equilibración de filas se escribe como
k=O k=O
( RA)x =(Rb),
También es posible demostrar de manera directa que los vectores x convergen a
(m )

x. Para ello utilice la ecuación (6) y obtenga donde R =diag(r;).


La equilibración de columnas es un proceso similar, excepto que ahora se trata
x(m+l)-X = x( )-X+B( Ax-Ax(m) ) con columnas: multiplicamos la columnaj por c¡ = 1/ máx 1?.i?.• jagl para 1 � j � n.
m

= (I-BA)(x'ml-x) Al igual que en el caso anterior, es preferible tomar c¡ como un número, de la forma 2m
tan cercano como sea posible a 1/ máx 1?.i?.n la¡¡!. Nuestras ecuaciones uriginales
Por consiguiente, n
l\x(m+l)-x\\ � \\!-BA\\ \\x( )-x\\ ¿aijXj = b;
m
(l � i � n)

� \\I-BAl\2\\x -1)-xi\
(m j=l

pueden ahora escribirse como

(2) = b;

� \\!-BA\¡m llx(Ol _xi\ t(c¡ag) (1 � i � n)

¡=I
Ya que hemos supuesto que III - BAII < l, los errores ¡¡x<m>-xll convergen a cero
conforme m -+ oo para cualquier iºl. Después de la fase de cálculo de soluciones habremos obtenido soluciones aproximadas
para las componentes x¡/c¡. Estas soluciones deberán multiplicarse por c¡ para obtener
x¡. Por consiguiente también se tendrán que almacenar los valores c1, c2, •.. , c•. La
Equilibración equilibración de columnas se escribe, usando matrices, como:
Para resolver sistemas de ecuaciones lineales en casos extremadamente críticos, se
puede añadir un cierto número de refinamientos a los procedimientos de factorización y (AC)(C- 1 x) = b,
de cálculo de soluciones descritos en la Sección 4.3. Discutiremos brevemente cinco de
estas técnicas: donde C = diag(c¡).
182 Capítulo 4 Resolución de sistemas de ecuaciones lineales 4.5 Series de Neumann y refinamiento iterativo 183
Si ya se llevaron a cabo los procesos de equilibración de columnas y filas de nuestro 3. Demuestre que si [JA11< l, entonces
sistema, la estrategia de pivoteo total en el paso inicial se puede reducir sin problema a
una mera búsqueda del elemento de mayor valor numérico en la matriz. Este elemento 1
determina, tanto la primera fila de pivoteo, como la primera columna en la que se ge­ li(J-A)- 11 � 1 + \ AJI
1
nerarán los ceros por el proceso de eliminación. Esto significa que buscamos trabajar 1
con las columnas no en el orden natural 1, 2, 3, ... , n, sino en el orden determinado por 4. Demuestre que si A es invertible y IIA-BJJ< JIA- [J-1, entonces
esta estrategia de pivoteo que aporta una mayor precisión a los cálculos. Se necesitan
IIA-l -B- 1 11 < IIA-111 III -A- BII
1
dos arreglos de permutación, uno para alistar los números de fila de los elementos pivote
= l -llI-A- 1 BJJ'
sucesivos, y otro para alistar los números de columna correspondientes. (Véanse los
Probs. 4 y 6 de la Sec. 4.3.) 5. Demuestre que si IJAB-III< 1, entonces (con E en lugar de AB-I)
La cuarta técnica en nuestra lista de refinamientos es la de precondicionamiento
o escalamiento. Dicha técnica contribuye a una organización más lógica de la fase de r1 = B-BE+ BE2-BE3 +.. ·.
factorización, en vista de que cada paso del algoritmo será igual al anterior, excepto por
el hecho de que se aplica a matrices más pequeñas. 6. Demuestre que si A es invertible, entonces para cualquier B
La quinta técnica de nuestra lista es el mejoramiento iterativo, la cual se estudió
previamente. _ rip 111-ABJI
IIB = IIA II
La utilidad de la equilibración de columnas y filas, como un proceso de pre­
condicionamiento, ha sido motivo de controversias. Se puede. observar que la 7. Demuestre o refute el siguiente enunciado: si 1 = IIAIJ > JIBJI, entonces A-Bes invertible.
equilibración de filas, seguida de la eliminación gaussiana con pivoteo de filas sin 8. Demuestre que si JIA11< l, entonces
escalamiento, es virtualmente equivalente a efectuar una eliminación gaussiana con
pivoteo de filas escaladas. Por consiguiente, una estrategia razonable consiste en iniciar (/+A)-1 =l-A+A2 -A3 +...
con equilibración de columnas, seguida de una eliminación gaussiana con pivoteo de
filas escaladas. 9. Demuestre o refute el siguiente enunciado: si JJAB-I JJ< 1, entonces JJBA-IJJ< l.
El siguiente ejemplo muestra la diferencia entre equilibración fila-columna 10. Demuestre que si JIAJJ< l , entonces JIU +Ai- 1 JJ � (1-IJAll)- 1 .
1 108 10-8 1 --+ [ 10
-8 1 11. Demuestre que si A es invertible y IIB-Ali< JJr1 11-1 , entonces
[
2 o] ____, [
1 oJ 1 J
o· 00

y equilibración columna-fila
s- 1 =r 1 ¿u-Br 1 ) k

[! 1]- [!
k=O

[l 108 1
]- 12. Demuestre que para cualquier matriz A de n x n
2 0 10 10]·
m-1
Dése cuenta de que la equilibración fila-columna equivale a un escalamiento en dos fases m
A =l-(l-A) ¿A ,
k

del sistema por medio de matrices diagonales, digamos R y B, tales que k=O

((RA)B)(B- x) = (Rb),
1
13. Critique la siguiente "demostración", de que toda matriz den x n es invertible: dada una
matriz A elija una norma vectorial, de manera que 111-A 11< 1 cuando se usa la norma
en tanto que la equilibración columna-fila corresponde a matricial asociada. Utilice luego el teorema acerca de la serie de Neumann.
14. Demuestre que si ínf,ea 111-MIi< 1, entonces A es invertible.
(S(AC))(C- 1 x) = (Sb)
15. Demuestre que las matrices de n x n invertibles forman un conjunto denso en el conjunto
para algunas matrices diagonales C y S. de todas las matrices de n x n. Esto significa que si A es una matriz de n x n y si e > O,
entonces existe una matriz invertible B, tal que [JA-BJJ< &. (Véase el Prob. l.)
16. Demuestre que si JJAB-/[J = &< 1, entonces
SERIE DE PROBLEMAS 4.5
l. Demuestre que el conjunto de matrices de n x n invertibles es un conjunto abierto en el
conjunto de todas las matrices de n x n. Por ello, si A es invertible, existe entonces un
1
(-º )
IIA- -BJI< IIBII 1-e
número positivo e tal que toda matriz B que satisface JIA-BJI< e también es invertible.
17. Demuestre que la operaciónx ,-, Ax es continua. Es decir, para una A fija, demuestre que si
2. Demuestre que si A es invertible y JI B-Ali< [JA- 1 JJ- 1 , entonces Bes también invertible. una sucesión [x(kl ] converge ax, entonces [Ax(kl] converge a Ax.
184 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 185

18. Demuestre que si E es una matriz de n x n para la cual IIE II es suficientemente pequeña, 28. Considere el sistema lineal = ,
entonces [ 1 � 6 �] [;� ] [ 3 � 6] para una pequeña o > O.
11([- E)-l - (l + E)il � 3 IIEll ,
2
(a) Usando la solución aproximadax = (3, O{, compare la norma infinito del vector residual
¿Qué tan pequeña debe ser IJ E II? y la norma infinito del vector de error. ¿Qué se concluye de esto?
(b) Determine el número de condición ic00(A). ¿Qué sucede conforme o se hace pequeña?
19. Muestre que si A es invertible, entonces
(c) Lleve a cabo un paso de mejoramiento iterativo basándose en la solución aproximada x.
IIAxll ;:;; llxll lW 1 !1- 1 29. Demuestre que si III-ABII < 1, entonces BA es invertible. (En este caso A y B son matrices
cuadradas. ¿Qué sucede si no lo son?)
20. Considere el espacio vectorial V de todas las funciones continuas definidas sobre el intervalo
[O, 1]. Dos normas importantes sobre V son las siguientes: 30. Demuestre que si III-cA•¡¡< 1 para alguna e y algún entero n;;;; !, entonces A es invertible.

[
31. Demuestre que si existe un polinomio p sin término constante, y que satisface
llxlloo = máx lx(t)I llxllt = lx(t)I dt
O�t�I III-p(A)II< !,

Demuestre que la sucesión de funcionesx.(t) = f tiene las propiedades siguientes: IJx. IJoo = entonces A es invertible.
1 y llxnlit -> O conforme n --> oo. Por lo tanto, dichas fórmulas conducen a nociones de
convergencia diferentes. 32. Demuestre que si p es un polinomio con término constante co y si !col + III-p(A)II < 1,
entonces A es invertible.
21. Demuestre que si IIAB -III < 1, entonces 2B - BAB es una mejor aproximación para la
matriz inversa de A que B, en el sentido de que A(2B - BAB) está más cerca de l. <33_ Resuelva el siguiente sistema lineal y utilice tres pasos de mejoramiento iterativo. Imprima
<22. El propósito de este proyecto es diseñar y verificar procedimientos que son refinamientos de r, e, y x después de la iteración
los algoritmos dados en el texto. Los refinamientos que se incorporarán son los siguientes:
(i) Equilibración de columnas. 60 30 20 X¡ [11º]
[30 20 15] [X2] = 65 .
(ü) Equilibración de filas. 20 15 12 X¡ 47
(iü) Pivoteo total.
(iv) Añadir al final dos pasos de refinamiento iterativo. Como alternativa, diseñe por separado
un subprograma �ue acepte A, x , by mejore doblemente (o m veces) a x . En este caso cada
residuo b; - ¿j=l alfXj deberá calcularse con doble precisión y luego redondearse con
precisión sencilla. Tenga en cuenta que la matriz original A y el vector b deben almacenarse *4.6 Solución de ecuaciones mediante métodos iterativos
con el fin de calcular los residuos. Verifique sus códigos mediante la solución del problema
Ax = b, donde n = 10 y
El método de Gauss y sus variantes son conocidos como métodos directos para resolver
(! � i, j � n) el problema matricial Ax = b. Se ejecutan a través de un número finito de pasos y
ªlf = (i/ l l'Í
{ generan una solución x que sería exacta si no fuera por los errores de redondeo.
b; = i[l -(i/11) ]/(33-3i ) (1 � í � n),

En contraste, un método indirecto da lugar a una sucesión de vectores que ideal­
Como segunda prueba de sus códigos h!ga n = 4, ªlf = l/(2n-i-j+ 1), y b; = I:;=1 a;¡. mente converge a la solución. El cálculo se detiene cuando se cuenta con una solución
La solución deberá ser x = (1, 1, 1, ll. Para la tercera prueba repita lo anterior con n = 10. aproximada con cierto grado de precisión especificado de antemano o después de cierto
Incluya suficientes enunciados de impresión, para que se aprecien los detalles, en particular número de iteraciones. Los métodos indirectos son casi siempre iterativos por natura­
la solución inicial y las soluciones que se obtuvieron usando el mejoramiento iterativo. leza: para obtener la sucesión mencionada se utiliza repetidamente un proceso sencillo.
Para sistemas lineales grandes, con miles de ecuaciones, los métodos iterativos
23. Sea B k = z;=OAÍ. Demuestre que la sucesión [Bk] puede calcularse recursivamente me­
con frecuencia muestran ventajas decisivas respecto de los métodos directos, en cuanto
diante las fórmulas Bo = I y Bk+I = I + ABk.
a velocidad y requerimientos de la memoria de la computadora. En ocasiones, si los
<24_ Usando una matriz de prueba A de dimensión 3 x 3 y el método del problema anterior, calcule requerimientos sobre la precisión no son muy fuertes, bastará con un número modesto
B= ZJ! 0 Ai y vea si (I-A)B !>:! l. Asegúrese de que IIA 11< 1 para alguna norma matricial de iteraciones para obtener una solución aceptable. Para sistemas ralos (en los cuales
subordinada. una proporción grande de los elementos de A son ceros) los métodos iterativos son con
25. Dé una serie que represente a A-1 bajo la suposición de que l!I-a.Al!< 1 para algún escalar frecuencia muy eficientes. En problemas ralos, los elementos distintos de cero de A
conocido et. se almacenan algunas veces en un formato de almacenamiento ralo, mientras que en
26. Demuestre, en un espacio lineal normado, que si una sucesión de vectores converge, entonces otros casos ¡no es en absoluto necesario almacenar A! Esta última situación ocurre con
debe satisfacer el criterio de Cauchy. frecuencia en la solución numérica de ecuaciones en derivadas parciales. En este caso
27. Demuestre que si A está mal condicionada, entonces existe una matriz singular cercana a A. se puede generar cada fila de A conforme sea necesario, pero no se retiene después de
De hecho, existe una matriz singular dentro de un radio l!All /ic(A) de A. usarse. Otra ventaja de los métodos iterativos es que usualmente son estables y de hecho
186 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 187

amortiguan errores (debidos al redondeo o a errores pequeños) conforme el proceso se Las iteraciones de Jacobi y de Gauss-Seidel convergen al parecer a un mismo límite,
lleva a cabo. pero la segunda lo hace más rápido. Observe que, en contraste con un método directo,
Para dar a entender la idea general, vamos a describir dos métodos iterativos fun­ la precisión que se obtiene en la solución depende del momento en que se detenga el
damentales. proceso. 11
Ejemplo 1 Considere el sistema lineal

[-� -�][;�]=[-!]
Conceptos básicos
Pasamos ahora a considerar los métodos iterativos dentro de un marco matemático
más general. Un tipo general de procesos iterativos para resolver el sistema
¿ Cómo se puede resolver por medio de un procedimiento iterativo?
Respuesta Un procedimiento natural consistiría en resolver la i-ésima ecuación para la i-ésima Ax=b (1)
incógnita de la manera siguiente:
se puede describir de la siguiente manera. Se recurre a una cierta matriz Q, llamada
X(k) - 2 r\k-l) + d1 matriz de descomposición, y el problema original adopta la forma equivalente
1 - r-i
_ -ªx (k-1 ) _ 19
X2(k) - Qx = (Q - A)x + b. (2)
9 1

Este procedimiento se conoce como método o iteración de Jacobi. Inicialmente, se La ecuación (2) sugiere un proceso iterativo que se concreta al escribir
eligen como x[ºl y xfl las mejores suposiciones disponibles o simplemente se igualan
= (Q - A)x(k-1) + b
;q
a cero. En tal caso, las ecuaciones anteriores producen lo que esperamos sean valores (k � 1).
k
Qx( ) (3)
mejorados x\1) y 1l. El proceso se repite un número prescrito de veces o hasta que se
alcance lo que se considera una buena precisión en el vector (x\kl, xrf. He aquí algunos El vector inicial x<0l puede ser arbitrario; si se dispone de un buen candidato como
valores seleccionados de las iteraciones del método de Jacobi para este ejemplo: solución se debe utilizar como x(Ol . Diremos que el método iterativo de la ecuación (3)
converge si converge para cualquier vector inicial x . A partir de la ecuación (3) se
(O )

k x(1k) 4k)
puede calcular una sucesión de vectores x , x , . • . , y nuestro objetivo es escoger una
<l) (Z)

o 0.000000 0.000000 Q de manera que:


10 0.148651 -0.198201 (i) se pueda calcular fácilmente la sucesión ¡x(kl ], y
20 0.186816 -0.249088 (ii) la sucesión [x ] converja rápidamente a la solución.
(k)

30 0.196615 -0.262154 En esta sección se mostrará que ambas condiciones se satisfacen si resulta sencillo
40 0.199131 -0.265508
resolver el sistema Qx(k) = y y si Q-1 es una aproximación de A -1•
50 0.199777 -0.266369
Para empezar observe que si la sucesión ¡x(kl ] converge, digamos a un vector x,
Es evidente que este proceso iterativo se podría m.odificar de modo que el más reciente entonces automáticamente x es una solución. En efecto, si simplemente se toma el límite
valor de x\kl se utilice en la segunda ecuación. El método que de ello resulta se llama en la ecuación (3) y se usa la continuidad de las operaciones algebraicas, el resultado es
método o iteración de Gauss-Seidel. Sus ecuaciones son:
Qx = (Q - A)x + b (4)
§,.ik-1) + d7
_ 7--¿
X(kl ) -
lo que significa que Ax = b.
rikl - � (k ) - 1 Para tener la seguridad de que el sistema (1) tiene una solución para cualquier vector
·-¿ - 9 x 1 9
b, supondremos que A es no singular. Supondremos también que Q es no singular, de
A continuación mostramos algunos resultados del método de Gauss-Seidel: tal manera que la ecuación (3) pueda resolverse para cualquier vector desconocido x(k).
Habiendo hecho estas suposiciones, podemos usar la siguiente ecuación para llevar a
k x(lk) x2(k)
cabo el análisis teórico:
o 0.000000 0.000000
10 0.219773 -0.249088 x<k) = (l - Q-lA)x(k-1) + Q-1 b. (5)
20 0.201304 -0.265308
30 0.200086 -0.266590 Se debe enfatizar que la ecuación (5) resulta conveniente para el análisis, pero en cuanto
40 0.200006 -0.266662 al trabajo numérico x(k) , casi siempre se obtiene resolviendo la ecuación (3) sin utilizar
50 0.200000 -0.266666 Q - 1.
188 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 189

Observe que la solución x satisface la ecuación El siguiente algoritmo ejecuta la iteración de Richardson:
X= (1-Q- 1 A)x+Q- 1 b. (6) input n, (aij), (b ¡), (x¡), M
for k = I, 2, ..., M do
As� x es un punto fijo de la transformación for i = 1, 2, . . ., n do
n

x H (1-Q-1A)x+Q-1b. (7) r¡ <- b ¡ - ¿aijXj


j=l
Restando de la ecuación (5) los términos de la ecuación ( 6) obtenemos: end
for i= 1, 2, ... , n do
x'k) -x = (1-Q- 1 A)(x(k -l) -x). (8) X¡ <-X¡ +r¡
end
A continuación elija cualquier norma vectorial conveniente y su norma matricial subor­ end
dinada. De la ecuación (8) obtenemos:
output k, (x¡), (r;).
llx< ) -xll � 111- Q- 1A ll llik-ll-xjj.
k
(9) Ejemplo 2 Comenzando con x = (0, O, Of, use el método de Richardson y calcule 100 iteraciones
para el siguiente problema:
Repitiendo este paso eventualmente llegamos a la desigualdad
[1 ¡] l [¡¡]
[x2] =
2 3 X¡ 18
ll � 111-Q- A ll llx<ºl -xjj.
x(k) -x
i
1
(10)
f
k
ll 1 ti .
l l ¡ X3 11
Así, si 111- Q - 1AII < 1, podemos de inmediato concluir que 2 3 18

Respuesta Se diseñó un programa de computadora basado en el algoritmo anterior. A continuación


lim llx(k) -xll = O (11) se muestran algunas de las iteraciones que resultaron de esta rutina:
k....co

para cualquier x<OJ. Observe que de la hipótesis 111 -Q- 1A 11 < 1 se deduce (por el X(
O)
= (0.000000, 0.000000, 0.000000/
Teorema 1 de la Sec. 4.5) la inversibilidad de Q- 1A y la de A. Por lo tanto tenemos el X (! )
= (0.611 l l l, 0. 61 l l l l, 0.611 l l lf
TEOREMA 1 Si IIJ - Q- 1AII < 1 para alguna norma matricial subordinada, entonces la sucesión
generada por la ecuación (3) converge a la solución de Ax= b para cuqlquier vector
inicial iºl. X( I )
O
= (0.279498, 0.279498, 0.279498/

=
Si la norma o 111-Q-1 AII es menor que 1, resulta seguro detener el proceso
iterativo cuando ¡¡x<kl -x<k -1) 11 sea pequeño. Incluso podemos probar (Prob. 35) que x(
40l
= (0.333107, 0.333107, 0.333107) 7

llx( ) -xi! � 1 � 6 lli ) -x( -1) 11.


k k k

x<80l = (0.333333, 0.333333, 0.333333) 7. 111


Método de Richardson
Método de Jacobi
A modo de ilustración de estos conceptos consideramos el método de Richardson
y escogemos como Q a la matriz identidad. En este caso la ecuación (3) queda de la Otra ilustración de nuestra teoría básica es la iteración de Jacobi, en la cual Q
manera siguiente: es la matriz diagonal, cuyos elementos diagonales son los mismos que los de la matriz
x(k) = (1-A)x(k-1) + b= x<k-1) + ,(k-1), (12) A = (aij). En este caso el elemento genérico de Q- 1 A es ag/a;¡. Todos los elementos
diagonales de esta matriz son 1, y por consiguiente,
donde r<k-l) es el vector residual definido mediante r< - l) = b -Ax(k- l). Según el
k

�� ¿ laij/a¡¡I .
Teorema l la iteración de Richardson dará lugar a una solución de Ax= b (en el limite) n

si 111-AII < 1 para alguna norma matricial subordinada. (Dos clases de matrices con la 111- Q- 1 A lloo = (13)
¡='= " j=I
propiedad requerida aparecen en los problemas 2 y 3). ¡.i
190 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 191
TEOREMA 2 Si A es diagonalmente dominante, entonces la sucesión que resulta de la iteración de Otra manera de interpretar lo anterior es que el sistema original Ax = b se ha reemplazado
Jacobi converge a la solución de Ax = b para cualquier vector inicial. por D-1Ax = D-1 b, donde D = diag(a¡¡). De manera alternativa, se pueden evitar las
divisiones mediante un proceso previo que utiliza otro tipo de escalamiento para el
Demostración La dominancia diagonal significa que sistema. Un ejemplo sería el escalamiento a ambos lados (D-112AD-r/2)(D1/2x) =
(D-112b ), donde D 1 12 = diag(.Ja¡i), a condición de que los elementos diagonales de A
n
sean positivos. Dése cuenta de que si A es simétrica, entonces este escalamiento preserva
la¡¡!> ¿laiji (1 � i � n).
la simetría. Para muchos de los métodos iterativos, este sencillo trabajo previo puede
j=l aportar grandes beneficios en cuanto a eficiencia o velocidad de convergencia.
fa'i

De la ecuación (1 3) concluimos que


Análisis
1
IIJ - Q- All oo < l. Nuestra siguiente tarea es desarrollar parte de la teoría para procesos iterativos
lineales arbitrarios. Consideramos que dicho proceso se ha definido mediante una
Por el teorema 1, la iteración de Jacobi converge. ecuación de la forma
A continuación se presenta un algoritmo para el método de Jacobi: x(k) = Gx<k-l) + c (14)
input n, (aif ), (b¡), (x ¡), M en la que G es una matriz dada den x n y e es un vector dado en R". Obsérvese que
for k = l, 2, ..., M do la iteración definida mediante la ecuación (3) se incluirá en cualquier teoría general
fori= 1,2, ... ,ndo que desarrollemos para la ecuación (14); a saber, podemos definir G = I - Q-1A

u¡ +- (b¡ - f, aijxj) /a¡¡ y c = Q-1b. Deseamos encontrar una condición necesaria y suficiente sobre G, de
manera que la iteración definida por la ecuación (14) converja para cualquier vector
j=I inicial. Pero antes de ello se deben tratar algunos asuntos preliminares.
j1;i
end
Los valores propios de una matriz A son los números complejos A para los cuales la
matriz A-Uno es invertible. Estos números son las raíces de la ecuación característica
for i = 1, 2, ... , n do
de A:
X¡+- U¡
det(A - U) = O.
end
output k, (x¡) (Si lo desea, el lector puede adelantarse y leer la sección 5 .1, donde se analizan más a
end. fondo estos conceptos.) El radio espectral de A se define mediante la ecuación

Éste y otros algoritmos en esta sección se pueden hacer más eficientes si se llevan a p(A) = máx{1l .I: det(A - Al)= O}
cabo todas las divisiones antes de iniciar la iteración. De esta manera podríamos iniciar
el cálculo con estas operaciones: Por consiguiente p(A) es el número más pequeño, tal que el círculo con este radio,
centrado en el cero del plano complejo , contendrá todos los valores propios de A.
for i = 1, 2, ...,ndo Se dice que una matriz A es semejante a una matriz B si existe una matriz no
d = 1/a¡¡ singular S tal que s-1AS = B. Resulta entonces que las matrices semejantes tienen los
b¡ +- db¡ mismos valores propios. Más aún, resulta fácil ver que los valores propios de una matriz
for j = 1,2, ... ,n do triangular son los elementos sobre su diagonal.
aij =daij
end TEOREMA 3 Toda matriz cuadrada es semejante a una matriz triangular superior (posiblemente
end. compleja) cuyos elementos fuera de la diagonal son arbitrariamente pequeños.

Entonces la sentencia de reasignación para U¡ se convierte en Demostración Sea A una matriz de n x n. Recurrimos a un resultado conocido, como el teorema de
Schur que se incluye en la sección 5 .1. El teorema establece que A es semejante a una
L aijXj·
n
u¡ +- b¡ - matriz triangular superior T = (tij ), que pudiera ser compleja. Hagamos ahora O < e < I,
j=l y D = diag(e, e2, . . . , e"). Mediante un cálculo elemental se concluye que el elemento
fa'i genérico de D-1rD es tijej-i_ Ya que Tes una matriz triangular superior, los elementos
192 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 193

debajo de la diagonal en D- 1TD son O, en tanto que los elementos por encima de la El teorema 4 nos dice que para cualquier matriz su radio espectral es menor que su
diagonal satisfacen valor en norma para cualquier norma matricial subordinada y, además, existe una norma
lt;/f-i � 6lt;jl, matricial subordinada con un valor arbitrariamente cercano al radio espectral.
A continuación proporcionamos una condición necesaria y suficiente sobre la matriz
en vista de que j > i y 6 < l . Disminuyendo el valor de 6, esta cota superior se puede de iteración G para la convergencia del método iterativo asociado.
hacer tan pequeña como se desee. 1111

TEOREMA 5 Si se desea que la fórmula de iteración


TEOREMA 4 Lafunción llamada radio espectral satisface la ecuación
x(k) = Gx(k - l) + e
p(A) = ínf IIAII,
11 · 11 genere una sucesión que converja a (l -G)- 1 c, para cualquier vector inicial x(Ol, es
necesario y suficiente que el radio espectral de G sea menor que 1.
en la cual el ínfimo se toma sobre todas las normas matriciales subordinadas.
Demostración Suponga que p(G) < l. El teorema 4 nos indica que existe una norma matricial subor-
Demostración Es fácil demostrar que p(A) � ínf11. 11 IIA11- Para ello tómese un valor propio A. de A. Elija dinada, tal que 11GIi < l. Escribimos a continuación:
uno de sus vectores propios x correspondientes a A. y, claro está, que sea distinto de O.
Entonces, para cualquier norma vectorial y su norma matricial subordinada, tenemos: i ll =Giºl +c

IA-1 llxll = 11:l..xll = IIAxll � IIAll 114 x(2l =G2x (O) +Ge +e
x(3l =G3x(Ol +G2c +Ge+e,
Por consiguiente IA-1 � IIAII , de donde se deduce que p(A) � IIAII- Tomando el ínfimo
se obtiene p(A) � ínf 11 _ 11 IIAII- cuya fórmula general es
Para la desigualdad inversa usamos el teorema anterior. Dicho teorema afirma que k-1

para cualquier 6 > O existe una matriz no singular S, tal que s-1 AS = D + T, donde D x'kl = Gk x(O)+¿de. (15)
es una matriz diagonal y T es estrictamente triangular superior, con IITll oo � 6. Acto j=O
seguido tenemos: Usando la norma vectorial que indujo nuestra norma matricial tenemos:

11s- AS ll 00 = IID +Tll oo � IIDlloo +IITlloo• IIG x( lll � IIG ll llx( ll\ � IIGll llx( lll-+ O conforme k-+ oo
1 k º k º k º

En vista de que D tiene en su diagonal los valores propios de A, resulta que Recurriendo al teorema acerca de la serie de Neumann ( teorema 1 en la Sec. 4.5) obte-
nemos:
00
máx IA.d = p(A).
IIDll oo = l;;éi;;én ¿de= (1 -G)-1 c.
j=O
Por consiguiente, tenemos: Haciendo que k -+ oo en la ecuación (15) resulta:
II S- ASll oo � p(A) +s. lím ikl = (l -G)-1 c.
1
k-oo

Usando el resultado del proble� (6) sabemos que la función 11 · ll::O definida mediante Para demostrar el enunciado recíproco, suponga que p(G) � 1 y elija u y A. de
\\All:X, = II S- AS\\oo
1 manera que
Gu = A.u IA-1 � 1 u ;t O.
es una norma matricial subordinada. Por otra parte se tiene que I\All::O � p(A) + 6. Si IA-1 =1, sea e = u y x(O) = O. De la ecuación (15) se deduce que x =
( k)
I;J;¿
du =
Tomando el ínfimo sobre todas las normas matriciales subordinadas obtenemos: ±ku, la cual diverge conforme k -+ oo. Si A.> 1, sea e= O y x(O) = u. De forma similar,
y debido a la ecuación (15), x(kl = du =A.k u, la cual diverge conforme k-+ oo. 111
ínf I\AII � p(A) +6
11·11 CORQLARIO La fórmula de iteración (3), es decir Qx(k) = (Q - A)x(k-1 ) + b, dará lugar a una
sucesión que converge a la solución de Ax = b, para cualquier x(O) , con la condición de
En vista de que due tomado de manera arbitraria, resulta que í nf 11 . 11 IIAII � p(A). 11 que p(l -Q-1A) < l.
194 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 195

Dése cuenta de que en el algoritmo de Gauss-Seidel los valores actualizados de x; susti­


tuyen de inmediato a los valores anteriores, mientras que en el método de Jacobi todas
Método de Gauss-Seidel
Examinemos ahora con más detalle la iteración de Gauss-Seidel. Se define al las componentes nuevas del vector x se calculan antes de que la sustitución se lleve a
tomar Q como la parte triangular inferior de A, incluyendo a la diagonal.
cabo. En el algoritmo de Jacobi las nuevas componentes de x ( representadas mediante
TEOREMA 6 Si A es diagonalmente dominante, entonces el método de Gauss-Seidel converge para u; en el seudocódigo) se pueden calcular simultáneamente, en tanto que en el método
de Gauss-Seidel se deben calcular en forma seriada, en vista de que el cálculo de la
nuevax; requiere los valores actualizados dex1,x2, ... , X¡_¡. Debido a estas diferencias,
puede resultar más recomendable la iteración de Jacobi cuando se usan computadoras
cualquier vector inicial.

Demostración Según el corolario anterior basta con probar que que permiten procesamiento vectorial o en paralelo. Dése cuenta de que la mejoría en
p(l-Q-1A) < l. la eficiencia del algoritmo de Gauss-Seidel se puede obtener mediante un trabajo previo
sobre el sistema. De hecho, las observaciones hechas acerca de la iteración de Jacobi
Con esto en mente tomemos un A. que sea cualquier valor propio de/ -Q-1A . Sea x son también válidas en este caso.
un vector propio asociado. Sin perder generalidad suponemos que llxlloo= l . Tenemos
ahora que Ejemplo 3 Considere el sistema
1
(l-Q-A)x=A.X o Qx-Ax=t..Qx.
Ya que Q es la parte triangular inferior de A, incluyendo su diagonal,
2 -1 X¡ º]2
[ 1 6 -2 [X2] = [-4] .
4 -3 8 X3 5
= A. LªijXj (1 � i � n). Use la iteración de Gauss-Seidel iniciando conx (O)=(0, O, Of.
n i
- L aijXj

1 = v-1 b, con D = diag(A),


Respuesta Después del escalamiento mencionado previamente, v-Ax
j=í+l j=l

Transponiendo términos en esta ecuación llegamos a: el sistema se convierte en:

')...a;;X;
i-1
= -AL aijXj - L
n
aijXj (1 � i � n).
[
! -! º] XI
[X2] = [
1]
t ! -i -i .
j= I j=i+I

Elija un índice i tal que lxd = 1 � lxil para todaj. Entonces 2 -8 1 X3 8

Éste es el sistema al que nos referiremos como Ax=b. En el método de Gauss-Seidel, Q


IAl la;d � IAI L laijl + L laijl· se considera como la parte triangular inferior de A , incluyendo la diagonal. La fórmula
i-1 n

j=I j=i+I que define esta iteración es:


Despejando \t..\ y utilizando el dominio diagonal deA encontramos que -A)x(k-ll + b
Q}kl=(Q
-1
l""I � {.t \aiji} {1a¡¡I - i= laijl} <L

[; � �] ¡:1: 1 ;] ¡:1::: 1 [-i].


1111

= [� t +
1=1+1 1= 1

A continuación se presenta un algoritmo para la iteración de Gauss-Seidel:


l _l 1 (k) O O O Jk-)1 1
input n, ( a;j), (b¡), (x;), M
for k= l. 2, ... , M do
2 8 x3 ""j 8

De aquí obtenemos x (k)


a través de la solución de un sistema triangular inferior. En este
for i = l. 2, ... , n do ejemplo las fórmulas pertinentes son:
(b; - taijxi) /a;;
x\kl=!4-ll + 1
x; +-

x(k) --lx(k) + lx(k-)1 - l


j,ei

output k, (x;)
end
Jkl -lx(k) + lx(k) + 1
""j =
2 - 61 33 3

end. 2 l 8 3 8
196 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 197

El proceso de cálculo genera los siguientes valores Se dice que una matriz A=(a¡j) es hermitiana si A*= A. En este caso A*= (Zlj¡)
es la traspuesta conjugada de A. Finalmente, se dice que una matriz A es definida
x(
l)
= (1.000000,-0.833333, -0.187500/ positiva si (Ax,x) > O para toda x i: O. Observe que si A es hermitiana, entonces
(Ax,y) = (x,Ay).
A continuación presentamos un teorema que establece condiciones para la conver­
gencia del método SOR, en el caso de que A sea hermitiana y definida positiva
x(5) = (0.622836, -0.760042,0.0285661/
TEOREMA 7 En el método SOR, suponga que se escoge la matriz Q como aD-C, con un parámetro
real a, con una matriz D que es hermitiana y definida positiva, y con una matriz C que
ilO) = (0.620001, -0.760003, 0.0299981/ satisface C+ C* =D-A. Si A es hermitiana y definida positiva, si Q es no singular; y
si a> f, entonces la iteración SOR converge para todo vector inicial.

x(
l3)
= (0.620000,-0.760000, 0.03000000/ 11 D emostración Al igual que en la demostración anterior, tomamos G = I -Q- 1 A e intentamos demostrar
que el radio espectral de G satisface p ( G) < 1. Sea 'J.,. un valor propio de G y x un vector
propio correspondiente al mismo A. Si se define y = ([ - G)x se pueden verificar las
Método SOR siguientes igualdades:
El siguiente ejemplo de método iterativo importante es el que se conoce como sobre­
y=x-Gx=X-AX=Q- 1 Ax (16)
rrelajación sucesiva, comúnmente abreviado como SOR (siglas en inglés de successive
overrelaxation). En vista de que deseamos presentar una teoría general para el método Q-A=(aD-C) - (D - C-C*) = aD - D + C*. (17)
SOR que sirva para matrices y vectores sobre el campo de los números complejos, vamos
a revisar primeramente algunos de los conceptos relevantes para este escenario. Usando (16) deducimos que
Si y es un número complejo, entonces y se puede escribir de la forma y = a+ i�,
donde a y� son números reales e i 2 = -1. El conjugado de y se define como (aD-C)y = Qy=Ax. (18)

y=a-i�. Recurriendo a (17), (18) y (16) se obtiene

El módulo de y es Ir! = ,ja.2+�2 = ..fif. El espacio de los n-vectores complejos se (aD-D + C*)y = (Q-A)y=Ax-Ay= A(x-y)
denota por IC". En este espacio el producto escalar se define mediante la ecuación = A(x - Q- 1 Ax) = AG.x. (19)

(x,y) = y*x = ¿x¡y¡. de (18) y (19) tenemos que


i=l
a(Dy,y) - (Cy,y) = (Ax,y) (20)
En este caso y• es el vector fila definido por y• = (y¡, h .. . , y.), y se conoce como el a(y,Dy) - (y, Dy) + (y, C*y) =(y, AGx). (21)
traspuesto conjugado de y. Es fácil ver que
Sumando las ecuaciones (20) y (21) obtenemos
(x,x) >0
(x, 'J.,.y) = i(x,y)
2a(Dy,y)- (y,Dy) =(Ax.y)+(y,AGx) (22)
(2a - l )(Dy,y) = (Ax,y)+ (y,AGx). (23)
(x,y) = (y, x)
En este paso de la demostración hemos utilizado que (Dy,y) = (y,Dy), ya que D es
de donde resulta que (ax+ �y. z) = a.(x,z)+�(y,z), para escalares a y� y vectores x, hermitiana. En vista de que y = (1 - 'J.,.)x y Gx = AX, la ecuación (23) da lugar a lo
y, z, y que (x,Ay)= ( A*x,y). La norma euclidiana de x es siguiente:
{ n }1/2
(2a - 1)11 - 'J.,.[2 (Dx, x) = (1 - i)(Ax,x) + i( l - 'J.,.)(x,Ax)
!lx!b = � = Vx*x = � lxd2
= (1 - IAl2 )(Ax,x) (24)
198 Capítulo 4 Resoluci6n de sistemas de ecuaciones lineales *4.6 Soluci6n de ecuaciones mediante métodos iterativos 199

y en donde se ha utilizado el hecho de que A es hermitiana. Si).. ,t. 1, el lado izquierdo de SOR:
la ecuación (24) es positivo. Por ende también el lado derecho debe ser positivo y lll < l .
1
{ Q = ro- (D-roC1i )
Por otra parte, si)..= 1 entonces y=O debido a que y= (1-l)x y Ax=O , resultado
que se·deduce de la ecuación (18). Este hecho contradice la condición (Ax, x) > O para G = (D-roCi )- (roCu+(1-ro)D)
cualquier x,;:. O. Por consiguiente, p(G) < 1 y el método SOR converge.
(D-roCi)x (k) = ro(Cux(k -l)+ b)+(1-ro)Dx(k-ll,
Cuando se utiliza el método SOR, una elección común es utilizar D como la diagonal
de A y hacer de C la parte triangular inferior de A, excluyendo la diagonal. Sin embargo,
el teorema 7 no presupone esta posibilidad de elección. Una vez más el lector debe estar SSOR:
consciente de que en los textos el parámetro a. generalmente aparece como 1/ro. Como
{ Q = (ro(2-ro))- 1(D-roCi )D- (D-roCu) 1
1 1
consecuencia de ello O < ro < 2. La cuestión de elegir ro de manera que se obtenga
G = (D-roCu)- (roCi +(I-ro)D)(D-@C¿r (roCu+(1-ro)D)
la convergencia más rápida para la iteración SOR se estudia en Young [1971], Varga
[1962], Hageman y Young [1981], Wachspress [1966], Issacson y Keller [1966], y en (D-roC¿ )x<k-I/2l = ro(Cux(k-l) +b)+(1-ro)Dx(k-l)
muchos otros libros.
(D-roCu )x (k) = ro(Cdk-l/2l +b)+(1-ro)Dx(H /2l

Matrices de iteración En esta lista se ha incluido otro método iterativo básico, el de sobrerrelajación suce­
Suponga que A se ha separado de la siguiente manera: siva simétrica (SSOR, siglas en inglés de symmetric successive overrelaxation). Cada
iteración del método SSOR consiste de una iteración SOR hacia adelante, que calcula
en cierto orden las incógnitas y luego una barrida SOR hacia atrás, que las calcula en
A=D-Ci-Cu,
el orden inverso. Lo que se considera la mejor elección de los parámetros de relaja­
miento para los métodos SOR y SSOR está ligado a preguntas complejas con respuestas
con D= diag(A), Ci es el negativo de la parte triangular inferior, estrictamente, de A, y igualmente complicadas, que no se comentarán aquí.
Cu es el negativo de la parte triangular superior, en sentido estricto, de A. Otra partición
posible es similar· pero con bloques como componentes. En el caso de la discretiza­
ción de ecuaciones en derivadas parciales, la primera etapa de partición corresponde a Extrapolación
puntos sobre una malla, en tanto que la etapa posterior corresponde a agrupamientos A continuación presentamos una técnica general denominada extrapolación, la cual
de puntos de la malla, ya sea por líneas o por bloques. puede utilizarse para mejorar las propiedades de convergencia de un proceso iterativo
. A continuación se presenta un resumen de las matrices clave correspondientes a los lineal. Con este fin presentamos la fónnula de iteración:
métodos iterativos básicos presentados en esta sección.
Richardson:
k
x( ) = Gx(k-l) +c. (25)

Q=l Adoptamos un parámetro y * O y consideramos el método (25) como si estuviera inmerso


{
G=l-A en una familia de métodos de iteración dependientes de un parámetro dado por:
x(kl = (l-A)x(k -1) + b,
x( )
k
= y(Gx(k-l) +e)+(1-y)x(k -1)
(26)
Jacobi: = Gyx (k-l) +ye,
Q=D donde
{ Gy =yG+(I-y)l.
G=D-1(Ci +Cu )
Dikl = (Ci +Cu )x(k-l) +b, Dése cuenta de que si hacemos y = 1, recuperamos la iteración original definida por la
ecuación (25).
Gauss-Seidel: Si la iteración en (26) converge, digamos a x, entonces al tomar el límite obtenemos

x =y(Gx +c)+(l -y)x


Q=D-Ci
{
G = (D-Ci )-1Cu
o
(D-Ci )x(k) = Cux(k-l) +b, x = Gx+c,
200 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 20 1

ya que y ;t O. Recuerde que el objetivo de la iteración (25) es dar como resultado una Con ello hemos demostrado que
solución de la ecuación x = Gx +c. Si G = I - Q- 1 A y c = Q- 1 b, entonces este
proceso corresponde a la resolución del sistema Ax = b. -1+yd � 11. ;;;í 1 -yd,
Antes de intentar la determinación de un valor óptimo para el parámetro y, necesi­
tamos un resultado acerca de los valores propios. por consiguiente p(G1) � 1 -yd. Para que el lector asegure, de que nuestra elección
de y es la óptima, vea que si y aumenta, entonces el extremo izquierdo del intervalo
TEOREMA 8 Si A. es un valor propio de una matriz A, y si p es un polinomio, entonces p(A.) es un valor en la ecuación (28) se mueve hacia la izquierda. Si dicho punto es un valor propio de
propio de p(A). Gy, entonces p(Gy ) aumentará. Si y disminuye, continuará siendo válido un argumento
semejante al anterior. 111
Demostración Sea Ax = A.X con x ;t O. Entonces A2x = A.Ax = 11.2x. Utilizando inducción y una
verificación por separado para k =O, tenemos: Debe observarse que este proceso de extrapolación puede utilizarse en métodos que
por sí mismos no son convergentes. Todo lo que se requiere es que los valores propios
Akx = 11.kx (k = O, 1,2, ...). de G sean reales y se encuentren en un intervalo que contenga a l.
Si A es una matriz cuyos valores propios A.¡, A.2, ... , A.n son reales, definimos:
Porlo tantoA.k es un valor propio de Ak. Para un polinomio p se escribe p(z) =I:Z=o ck zk.
Entonces m(A) = rnín11.¡ M(A) = máxA.¡. (29)
¿ c A x = ¿ CkA. x = p(A.)x.
m m
i i
p(A)x = k
k k
1111
k=O k=O Por lo tanto, en el teorema 9 podemos tomar a = m( G) y b = M(G).
El teorema 5 nos permite decir que es necesario y suficiente que p(G7) < 1 para
asegurar la convergencia del método extrapolado que define la ecuación (26). Suponga Ejemplo 4 En el caso de la iteración de Richardson tomamos Q =I y G = I-A. Si A sólo tiene
que no conocemos con precisión los valores propios de G, sino que sólo conocemos un valores propios reales, lo mismo es cierto para G. El teorema 8 nos permite decir que

=
intervalo [a,b] sobre la recta real que los contiene a todos. El teorema 8 nos dice que
los valores propios de la matriz Gy yG+( 1 - y)l se encuentran en el intervalo cuyos
extremos son ya+ I -y yyb+ I -y. ¿Es posible seleccionar y de forma que p(G7) < 1?
M(G) = 1-m(A), m(G) = 1-M(A). (30)

Denote con A(A) al conjunto de valores propios de cualquier matriz A. Entonces: Si m(A) > O o M(A) < O, entonces la aceleración es posible en la iteración de Richardson.
La y óptima, calculada según lo indica el teorema 9, es
p(Gy ) = máx 111.I = máx ly11.+ 1-yl � máx lr11.+ 1-y¡. (27)
l.EA(G,) l.EA(G) a;P.;:éb
y =2/[m(A)+M(A)].
Demostraremos que si 1 r;J. [a, b], entonces y puede elegirse de manera que p(G1) < l .
El radio espectral resultante, teniendo en cuenta que d = m(A), es:
TEOREMA 9 Si l a única información disponible acerca d e los valores propios d e G nos indica que se
encuentran en el intervalo [ a,b], y si I r;J. [a, b], entonces la mejor elección para y es p(G1) = [M(A) -m(A)]/[M(A)+m(A)].
2/(2-a - b). Con este valor para y, p(Gy ) ;;;í 1-lrld, donde d es la distancia de I a
[a,b]. 11111

Demostración Suponga la:¡_ hipótesis y tome el valor dado de y. Ya que 1 r;J. [a, b ], resulta que a > 1 o Ejemplo 5 La iteración de Jacobi puede utilizarse como se indica en el problema 9. Hagamos:
b < l . Haremos la demostración sólo para el segundo caso, dejando el primero para la
sección de problemas. Ya que a ;;;í b < 1, resulta que y> O y d = 1 -b. Por lo tanto, D = diag(a¡¡, a22, ..., aM)
cualquier valor propio A. de G7 satisface la desigualdad:
y apliquemos la iteración de Richardson al problema D- 1Ax = D- 1 b. Usando el
ya+ 1-y � A. ;;;í yb+ 1 -y, (28) resultado del ejemplo anterior concluimos que si m(D- 1 A) > O o M(D- 1 A) < O, entonces
es posible la aceleración en la iteración de Richardson. Además, el radio espectral de la
tal como se mencionó en los párrafos anteriores. Por consiguiente,
matriz de iteración será:
11. ;;;í yb+ 1 -y = 1+y(b - 1) = 1 -yd.
p(Gy ) = [M(D- 1 A)-m(D- 1 A)J/[M(D- 1 A) +m(D- 1 A)].
Más aún,
A.� ya+! -y =y(a+b-2)+ 1+y(l -b) = -1+yd si se utiliza la y óptima y= 2/[m(D- 1 A)+M(D- 1 A)]. •
202 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 203

Aceleración de Chebyshev sujeto a la condición de que el coeficiente más grande sea 2 k -l. Estos polinomios se
La aceleración de Chebyshev es un procedimiento de aceleración más general que pueden generar recursivamente mediante las fórmulas:
también se puede usar en un algoritmo iterativo lineal. Como antes, consideremos un
To(z) = 1, T1(z) = z
método iterativo básico: {
x(k) = Gx ( k-l) + c. Tk(Z) = 2zTk-1(z)-Tk-2(z) (k � 2).

Se supone que la solución al problema es un vector x que satisface la ecuación x = Suponga ahora que los valores propios de G están contenidos en un intervalo [a, b]
Gx + c. Durante el proceso, al llegar al k-ésimo paso, habremos calculado los vectores que no incluye al 1; digamos que b < l. Nos interesamos en el siguiente problema de
x (l) , x (2) , ...x (kl , y nos preguntamos si alguna combinación lineal de estos vectores valores extremos:
puede ser una mejor aproximación a la solución que la dada por ik). Suponemos que mín { máx P (z) .
P,(1)=1 a;;;;z;;;;b I k I}
ªb ) + a\kl + · .. + at ) = 1 , y hacemos:
k

La solución de este problema está contenida en los siguientes cuatro lemas. Dichos
resultados incluyen los polinomios de Chebyshev, Tk> los cuales se discutieron antes y
ik) = I: af liil.
k

i=O
k sobre los que se dirá algo más en la sección 6.1. El conjunto de polinomios que tienen
a lo más grado k, se denota con ITk ·
LEMA 1 Sea� E lR \ (-1, 1). Si p E rrk y p(�) = 1, entonces IIPII � la.l, donde a. = 1 /Tk (�) y
Usando técnicas que nos resultan familiares obtenemos: IIPII =máx-1;:;;,;:;;1 IP (t)I .
k k Demostración Suponga que p satisface las hipótesis pero no la conclusión. Sea t; =cos(in/k) para
ikl -x = ¿a?\x (i) -x) = ¿a[k) G(il(x (O) -x) O � i � k. Estos puntos son los extremos de Tk. De hecho,
i=O i=O
Tk(t;)=cos(kcos-1 t;)=cosirc=(-1{
= P( G) (x (O) -x)
Sea cr=sgna. . Entonces
donde P es el polinomio definido mediante P(z) = ¿�=o ªf l z;. Al tomar la norma
k
cr(-li[a.Tk (t;) -p(t¡)] � la.1-IIPII > O.
obtenemos:
Con ello se demuestra que el polinomio a.Tk-p toma, de manera alternativa, valores
llu( ) -xll � IIP(G)ll ll x O -xll-
k ( )
positivos y negativos en los puntos to, t ¡ , ... , tk. Por consiguiente, este polinomio tiene
En este caso se puede utilizar cualquier norma vectorial y su norma matricial subordinada. al menos k ceros en el intervalo (-1, 1 ). También se anula en el punto � , dando un total
Recuerde que el teorema 4 nos indica que el ínfimo de IIP(G)II sobre todas las normas de por lo menos k + 1 ceros. Ya que a.Tk-p es de a lo sumo grado k, debe ser por lo
matriciales subordinadas es p(P(G)); ésta es la cantidad que se debe minimizar. Si los tanto igual a O, lo cual es una contradicción. 1111
valores propios µ; de G se encuentran dentro de algún conjunto S acotado en el plano
complejo, entonces por el teorema 8, LEMA 2 Sea a< b < l. Si p E rrk y p(l)= 1, entonces IIPII � 1/Tk(w(l)). En este caso

IIPII = máx IP(t)I Y w(t)=(2t-b-a)/(b-a)


p(P(G))= máx IP(µ;)I � máx IP(z)I . a;:;;1;:¡;b
1;:¡;;;:¡;n zES
La desigualdad se convierte en igualdad si p = Tk o w/Tk(w(I)).
Se debe escoger al polinomio P de forma que minimice esta expresión, sujeta a la
restricción ¿�0 a;= 1, que equivale a tener P(l) = l. Éste es un problema estándar Demostración Sea �=w(l)yp=qow,conq E Il- Dése cuenta de que 1=p(l)=q (w(l))=q@)
en la teoría de la aproximación, para el cual en algunos casos se conocen soluciones y � > l. El lema anterior nos indica que llqllr-1.11 � 1/Tk@). De forma equivalente,
explícitas. tenemos que IIPllra.bJ � 1/Tk (w(l)). Si p = Tk o w/Tk(w(l)), entonces es obvio que
Por ejemplo, si S es un intervalo [a, b] sobre la recta real que no contiene al 1, p(l)= 1 Y IIPllra. b]=II TkllH1J/Tk (w(l))= 1/Tk(w(l)). 111
entonces el problema se resuelve mediante un polinomio de Chebyshev desplazado y
sujeto a un cambio de escala. El polinomio de Chebyshev clásico Tk (k � 1) es el único
LEMA 3 Los polinomios Pk = Tk o w/Tk(w(l)) pueden generarse mediante una relación de
recurrencia:
polinomio de grado k que minimiza la expresión
Po(t) = 1, P1(t) = (2t-b-a)/ (2 - b-a)
máx ITk (z)I {
-1;:;;z;:;;1 Pk(t) = PkP1(t)Pk-1(t) + (1 - PklPk-2(t) (k � 2).
204 Capítulo 4 Resolución de sis temas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos i terativos 205

en la cual los coeficien tes de p k se ob tienen a partir de las ecuaciones Se deduce que u COJ =x (OJ y que u (ll se calcula con la fórmula que aparece en el lema. Esto
-1 a.=[2w(l)] -2 se deja para que el lector lo verifique. Usando ecuaciones demostradas con anterioridad,
P1=2 P k=(I- ªP k- 1) (k � 2). y con x que satisface x =Gx + c, resulta:

Demos tración Se define �k =T k(w(I)). Apoyándose en la relación Tk(t) = 2tT k_ 1(t)-T k-z(t) y en u(k)-x=P¡;(G)(u(O)-x)
que� kP k(t) =T k(w(t)), obtenemos:
=[P kP1(G)P k-1(G) + (1- Pk)P k-z(G)](u(O)-x)
P k(t) =�¡ 1Tk(w(t)) =�¡ 1 [2w(t)T k- 1(w(t))-T k-2(w(t))] =P kP 1(G)(uCk-l) -x) + (1- P k)(u(k-Z) -x).
=2�¡ 1� k-1 w(t)P k- 1(t)-�k 1� k-2P k-2(t) Esto se puede escribir como:
u(kl=P kP 1(G)u(k-lJ + (1- Pk)ulk-ZJ+p k [l-P ¡(G)]x.
1 1
=2�¡ � k-1 w(I)P ¡(t)P k-1(t)-�¡ � k-2Pk-2(t)
En este caso hemos utilizado la ecuación w(I)P 1(t) = w(t), la cual puede verificarse Un cálculo sencillo nos revela que el último término en esta ecuación es igual a pk"(c .
fácilmente . Resulta conveniente definirpk =2p¡ 1p k-1w(l)=a.- 1!2p¡ 1p k-l · Usando Finalmente nos damos cuenta de que
nuevamente la relación de recurrencia para los polinomios de Chebyshev, obtenemos:
P 1(G)=y G+(l- y)l. 1111

�k =T k(w(I)) =2w(I)T k- 1(w(I))-T k-2(w(I))=a.-z� k- 1-� k-2 Igual que en el caso del método de extrapolación, también aquí podemos obtener
1
1 =2w(l)p¡ Pk-l-p¡ p k-2=P k- P¡ Pk-2·
1 1 una cota superior para el radio espectral de P k(G):

Así, la relación de recurrencia para Pk puede escribirse como: p (Pk(G))= máx 111 � máx 1P k(1)1
A-EA(Pk(G)) A-EA(G)

P k=P kP1P k-1+(I- P k)P k-2· ;;¡; máx 1P k(1)1=1/T k ( w(I)).


a�;;ib
Los coeficientes pk satisfacen la ecuación: En este caso se ha recurrido al lema 2. Para llevar a cabo el cálculo de la cota superior
_1 1 l _l 1
podemos utilizar el resultado del problema 36 y llegar a las siguientes fórmulas:
Pk =a. 2�¡ Pk- 1 =a.2� k- 1[a. 2fü-1-�k-zr
1 2
-1 _l = b=t+� t=w(I).
=a 2 [a. 2 -�k-lt� k-2] -1 T k(w(l)) b" + b-n

=a.- l { a.- l- a 2� k-1-1P k-2 }-!


_l Se puede demostrar que la aceleración de Chebyshev es un orden de magnitud más rápida
que la técnica de extrapolación. Para mayores detalles puede consultarse Hageman y
Young [1981] o Kincaid y Young [1979).
=a-1 {a. l- Pk- 1 }-!
-
Ejemplo 6 Resuelva el problema
=(1- O.P k- 1) - 1 . 111

-1
4 -1 -1
4 0 -1 Xz _ 0
º [X¡] ¡-4
LEMA 4 Los vec tores u(k)en el método de aceleración de Chebyshev pueden calcularse recursi­
vamen te a partir de un vec tor inicial arbi trario u(O) mediante las fórmulas:
[
-1 0 4 -1 ] X3 - 4]
0 -1 -1 4 X4 -4
usando la aceleración de Chebyshev del método de Jacobi.
u(!)=y[Gu(O)+ c]+(1- y)iº)
(r=2-!-a) Respues ta Primero cambiamos la escala del sistema mediante D- 1 Ax=D- 1b, donde D=diag(A) ,
ikl=Pk[y(Gu (k- 1)+ c)+(1- y)u (k-!J¡+(1- P k)ik-2) . y obtenemos una matriz de iteración de Jacobi, cuyos valores propios se encuentran en
el intervalo [-!, !J. Se puede acelerar la convergencia de este método básico usando
Demostración Mantenemos toda la notación establecida con anterioridad En particular, la aceleración de Chebyshev. Comenzando con el vector inicial u=(0, O, O , O)Z: en una
computadora similar a la MARC-32, después de diez iteraciones encontramos que con­
k verge a la solución aproximada u=(-0.999996,-0.500002, 0.500002,-0.999996?.
ulk)= L i=O
k
a\ \(i) P k(t) ="a (kl i
L.' t .
i=O
206 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.6 Solución de ecuaciones mediante métodos iterativos 207

Puede escribirse un algoritmo para el método de aceleración de Chebyshev de la 2. Demuestre que si A tiene la propiedad (fila unitaria diagonalmente dominante)
manera siguiente:
input u, a, b, M, o a¡¡= 1 > ¿la;¡¡ (1 �i�n)
y .--2/(2-b-a) i=l
jr-i
a.- [4(b- a)/(2-b - a)]2
entonces funciona la iteración de Richardson.
outputO, u
3. Repita el problema 2 suponiendo que (columna unitaria diagonalmente dominante)
call Extrap (y, n, G, e, u, v)
output 1, v
p.- 1/(1-2a) ªii = I> ¿laiji (l;;¡j�n )
i=l
call Cheb (p. y, n, G, e, u, v) i'1-j

output2, u 4. Demuestre que si A tiene la propiedad enunciada en el problema 2, entonces el sistema


for k = 3, 5, ... , M step 2 do Ax = b se resuelve (en el límite) mediante la siguiente iteración:

P .--(1-pa) fork = 1,2,3, ...,


call Cheb (p, y, n, G, e, v, u) for i = I. 2, 3, ...n do
¿ aijx¡
n
outputk, v x; +- x; + b;-
p .- 1/(1-pa) i=l
end
call Cheb (p, y, n, G, e, u, v) end.
output k+ 1, u
5. Sea 11 · II una norma sobre IR", y seas una matriz no singular den x n. Defina llxll ' = 11 Sxll,
if llu-vlloo < o stop y demuestre que 11 · 11' es una norma.
end. 6. (Continuación) Sean 11 · IIuna norma matricial subordinada y S una matriz no singular. Defina
El primer paso de este método sólo es el procedimiento de extrapolación, y cada iteración IIA II' = IIS AS -111, y demuestre que 11 · II' es una norma matricial subordinada.
sucesiva implica dos etapas de aceleración. Para llevar a cabo los pasos de iteración 7. Usando Q igual que en el método de Gauss-Seidel, demuestre que si A es diagonalmente
básicos se necesitan dos subrutinas o procedimientos: Extrap y Cheb, los cuales se dominante, entonces III-Q-1Alloo < l .
explican más adelante. Obsérvese que mediante las llamadas apropiadas a la subrutina 8. Demuestre que p(A) < 1 s i y sólo si límk-oo Ak x= O para toda x.
o procedimiento Cheb obtenemos un intercambio automático de los vectores deseados. 9. Demuestre que si se divide por a;; a la i-ésima ecuación en el sistema Ax = b, y si luego se
utiliza la iteración de Richardson, el resultado es el mismo que si se hubiera recurrido desde
procedure Extrap (y, n, G, e, u, v) el principio al método de Jacobi.
10. ¿Cuáles de los axiomas correspondientes a una norma son satisfechos por la función radio
v .- ye+(1-y)u espectral p? ¿cuáles no? Conforme corresponda, presente ejemplos o demostraciones.
v .-yGu+ v 11. Para unan fija, considere el conjunto de matrices triangulares superiores den xn. Demuestre
return que dicho conjunto es un espacio vectorial. Demuestre además que la función radio espectral
p es una seudonorma sobre el espacio vectorial, ya que satisface todos los axiomas de una
procedure Cheb (p, y, n, G, e, u, v) norma, excepto por el hecho de que p(A) puede ser cero aun cuando A ;o O.
12. Explique por qué en la demostración del teorema 3 no podemos hacer que e .....,. O y de ahí
u ;.-pyc+p(l -y)v+(l -p)u concluir que A es semejante a una matriz diagonal.
u;.- pyGv+u 13. Sean A una matriz inversible yf una función de la formaf(z) = I:;::_,,.
crl Demuestre
retum. que si 1'. es un valor propio de A, entonces f(1'.) es un valor propio de f(A).
14. Demuestre que los valores propios de una matriz herrnitiana son reales.
15. Sea A diagonalmente dominante, y Q la parte triangular inferior de A, tal como se tornó en
SERIE DE PROBLEMAS *4.6 el método de Gauss-Seidel. Demuestre que p(I - Q-1A) no es mayor que el más grande de

{t f
los cocientes.
l. Demuestre que si A es diagonalmente dominante y si Q se elige igual que en el método de
Jacobi, entonces r; = laijl} /{la¡;!- laql}
1
p(l - Q- A) < l. 1=1+1 ¡=l
208 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4. 7 Métodos del descenso más rápido y del gradiente conjugado 209
16. Demuestre que si A es no singular, entonces AA• es definida positiva. las matrices de descomposición Q y las matrices de iteración G dadas en esta sección son
17. Demuestre que si A es definida positiva, entonces sus valores propios son positivos. correctas.
18. Demuestre que si A es definida positiva, también lo son A2. A3 ,•. . así como A-1, A-2,••• 31. Encuentre la forma explícita para la matriz de iteración I- Q-1A, suponiendo que se utiliza
19. ¿Existe una matriz A tal que p(A) < IIAI\ para todas las normas matriciales subordinadas? el método de Gauss--Seidel y que
20. Demuestre que si p(A) < I, entonces I -A es invertible y (I - A)-1 = I::OAk . 2 -1
-1 2 -1
21. ¿Resulta cierto que p(AB) ;;; p(A)p(B) para todos los pares de matrices den x n? ¿Se obtiene
-1 2 -1
la misma respuesta si A y B son matrices triangulares superiores? A=
22. Demuestre que el proceso de iteración básico planteado en la ecuación (3) es equivalente a
lo siguiente. Dado x<kl, calcule r<kl = b - Ax(kl , despeje zC l de la ecuación QzCkl = /kl, y
k
-1 2 -1
<k•IJ ikl + z<kl -1 2
defina x = .
23. ¿Forman las matrices herrnitianas de ordenn un espacio vectorial sobre el campo complejo? 32. Caracterice a la familia de todas las matrices A no singulares den x n para las cuales un
paso del algoritmo de Gauss--Seidel resuelve el sistema Ax= b, suponiendo que se inició el
24. Usando la notación del problema 22, demuestre que proceso con x = O.
33. Dé un ejemplo de una matriz A que no sea diagonalmente dominante y para la cual converja
,Ck+tl = (l _ AQ-1)/kl
el método de Gauss--Seidel aplicado a Ax= b.
l•1 = (I- Q-1A)l
l l
34. ¿Cómo se simplifica el método de aceleración de Chebyshev si el método básico es el de
Jacobi?
25. Demuestre que para matrices no singulares A y B, p(AB) = p(BA). (Si es posible, demuestre 35. Demuestre que si el número 6 = III- Q-1AII es menor que 1, entonces
un resultado más fuerte.) ¿Cuál es la relevancia de este hecho para el problema 24?
1\i l- x!I;;; � \!x'kl- x<k-1)\1
k
26. ¿Cuáles son las condiciones necesarias y suficientes sobre la matriz diagonal D para que se
1 6
pueda demostrar que si A es definida positiva también lo es DA?
36. Demuestre que
<27. Programe el método de Gauss--Seidel y póngalo a prueba con los siguientes ejemplos:
T.(t) = �(b" +b-") b = t+ /t2="I
3x+y+z = 5 3x+y+z= 5
37. Demuestre el teorema 9 para el caso en que a > l .
(a) { X+ 3y - Z = 3 (b) { 3x+y-5z = -1
3x+y-5z = -1 x+3y-z = 1 38. Usando l a definición, demuestre que una matriz A definida positiva es herrnitiana; es decir,
A es definida positiva si x•Ax > O para todo x E C" distinto de cero. En particular, si se va
a utilizar esta definición, la matriz A definida positiva debe ser simétrica. Sin embargo, si
Analice lo que sucede cuando estos sistemas se resuelven por eliminación gaussiana sin
se utiliza la definición alternativa xr Ax > O para todo x E IR" distinto de cero, entonces no
pivoteo.
hace falta que la matriz definida positiva sea simétrica.
<28. Use la iteración de Gauss-Seidel en un problema para el cual

_ 0.96326 0.81321 _ 0.88824


A - [0.81321 0.68654 lJ b- [
0.74988] *4.7 Métodos del descenso más rápido y del gradiente conjugado

Utilice (0.33116, 0.70000{ como punto de partida y explique qué ocurre. En esta sección vamos a desarrollar al8llllOS métodos especiales para resolver el sistema
29. Demuestre que el método de Gauss--Seidel es un caso especial del método SOR.
Ax=b
30. Demuestre que las siguientes matrices
cuando A es una matriz de n x n simétrica y definida positiva. Esto significa que
'R.=l-A
:J = l-D-1A A T =A
1
g = l- (D- CiT A
lw = l- ro(D- roCi)-1A Ax > O
r
x para x ;= O.

U., = l-ro(D-oiCu)-1A A lo largo de esta sección vamos a utilizar la notación para el producto escalar de
1 dos vectores x y y con componentes reales
-1
S., = l- ro(2-ro)(D-oiCu) D(D-roCi)- A
n
son las matrices de iteración para los métodos de Richardson, Jacobi, Gauss-Seidel, SOR r
(x, y) = x y= ¿x;y;.
hacia adelante, SOR hacia atrás, y SSOR, respectivamente. A continuación demuestre que i=l
210 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4. 7 Métodos del descenso más rápido y del gradiente conjugado 211

Algunas de sus propiedades más simples son las siguientes: Utilizando este valor t, podemos calcular el mínimo de q sobre del rayo:
(i) (x, y) = (y, x)
(ii) (ax,y) = a.(x, y), para toda constante a. q(x+tv) = q(x)+t[2(v,Ax-b) +t(v,Av)]
(iii) (x + y, z) = (x, z) + (y,z) = q(x)+t[2(v,Ax-b) + (v, b-Ax)J
(iv) (x,Ay) = Wx, y) = q(x)-t(v, b-Ax)
Por la propiedad (i), el orden de los argumentos en las propiedades (ii)-(iii) se puede = q(x)- (v, b-Ax)2 /(v,Av) (4)
invertir.
Comenzamos estableciendo la equivalencia de dos problemas numéricos que de­
penden de A y b. Nuestro cálculo nos muestra que al pasar de x a x +tv siempre hay una reducción en el
valor de q, a menos que v sea ortogonal al residuo, es decir, (v, b -Ax) = O. Si x no es
LEMA Si A es simétrica y definida positiva, el problema de resolver Ax = b es equivalente al una solución del sistema Ax= b, hay muchos vectores v que satisfacen (v, b-Ax) -¡,. O.
problema de minimizar laforma cuadrática Por consiguiente, si Ax -¡,. b entonces x no minimiza q. Por el contrario, si Ax = b,
no hay ningún rayo que emane de x sobre el cual q tome un valor menor a q(x). En
q(x) = (x,Ax) -2(x, b). consecuencia, una x con tales características es un mínimo para q. 1111

Demostración En primer lugar, veamos cómo se comporta la función q a lo largo de un rayo unidimen­
sional. Para ello, consideremos x + tv, con x y v vectores y t un escalar. La figura 4.2 La demostración anterior sugiere un método iterativo para resolver Ax = b. Pro­
nos muestra por qué podemos considerar esto como un rayo unidimensional. cedemos por minimización de q a lo largo de una sucesión de rayos. En el k-ésimo
paso de tal algoritmo se dispondrá de x<0J , x< 1J , x<2J , ..., x . Después, utilizando cierta
<k )

¡;z
fórmula, se elige una dirección de búsqueda v<kJ conveniente. El siguiente punto de
nuestra sucesión es:
X( +I)
k
= i + t V(
k)
k
k)
,

donde
(v <kJ,b-Ax<kl)
tk =
(v <kl,Av <k))
Figura 4.2 Ejemplo de un rayo unidimensional.
Muchos métodos iterativos tienen la forma general
Un cálculo directo hace patente que para todo escalar t:
x< +I)
k
= x< J + t v <kl,
k
k

q(x+tv) = (x+tv,A(x+tv))-2(x+tv,b)
= (x,Ax)+t(x,Av)+t(v,Ax)+t2(v,Av)-2(x,b)-2t(v,b) para valores específicos del escalar t y los vectores v <k J . Si llv(kJ II = 1, entonces tk mide
k

= q(x) + 2t(v,Ax)-2t(v, b) + t2 (v,Av) la distancia que nos movemos de x para obtener x k+I)_ (Véase la Fig. 4.3.)
< k) <

= q(x) + 2t(v, Ax - b) + t2(v, Av) (1)

ya que Ar = A. Observe que en la ecuación (1) el coeficiente de t2 es positivo. Así, la


función cuadrática sobre el rayo tiene un mínimo y no un máximo. Con la ecuación (1)
podemos calcular la derivada con respecto a t: v<k)

d
(2)
di + tv) = 2(v,Ax -b) + 2t(v, Av).
q(x

Cuando la derivada en (2) es cero, hay un mínimo de q a lo largo del rayo. El valor de t
que nos da este punto mínimo es, por lo tanto,

t = (v, b - Ax)/ (v, Av). (3) Figura 4.3 Movimiento a lo largo del vector de dirección v<k).
212 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más rápido y del gradiente conjugado 213

Descenso más rápido Direcciones conjugadas


El método del descenso más rá pido es un algoritmo del tipo recién descrito. Se Hay una familia de métodos, llamada de las direcciones conjugadas, que compar­
define al estipular que v(k) debería ser el gradiente negativo de q en ikl. Resulta que ten la estrategia básica de minimizar la función cuadrática a lo largo de una sucesión de
este gradiente negativo apunta en la dirección del residuo r (k) = b - Ax(k) . (Véase el rayos. Por lo general, estas direcciones de búsqueda se determinan dentro del proceso
Prob. l.) La siguiente es una descripción formal del método del descenso más rápido: de solución de una en una. No obstante,primero vamos a examinar el caso en que éstas
se conocen de antemano.
in putx(0l,A,b, M Suponga que A es una matriz de n x n definida positiva, y que un conjunto de
vectores { uCll, u(2l,...,u<nl } nos es dado con la propiedad
output O, x(O)
for k = O,1,2,... , M -1 do (u(l),AuV) ) = Oij (1 � i,j � n)
y(k) ,- b -Ax(k)
Esta propiedad es una obvia generalización de la ortonormalidad usual; se llama A­
tk +- (v(kl,v(k)) /(v(kl, Av (kl) ortonormalidad. Si estos vectores se utilizan como direcciones de búsqueda en la
xfk+l) +- x(k) + tk v(k) minimización paso a paso de la función cuadrática q,entonces la solución se obtiene en
output k+¡jk+l) eln-ésimo paso. Antes de enunciar formalmente este resultado, debemos observar que la
condición de A-ortonormalidad se puede expresar por medio de una ecuación matricial:
end.
urAU=I,
Al programar este algoritmo, no es necesario conservar los vectores x , x(ll, ... ; de
(O)

modo que el vector x en curso puede sobrescribirse. La misma observación se aplica a donde U es la matriz den x n cuyas columnas son u(ll,u(Z) ,... , u(n) . Es obvio que A y
los vectores v(O) , v(I), ..•. Por lo tanto, podríamos escribir alternativamente: U son no singulares, y que las columnas u(I) ,u(2), ... , u(•) son una base de JR.n .

input x, A, b, M TEOREMA 1 Sea { u(ll ,u(2l, ...,u (•)} un sistema A-ortonormal. Defina
output 0,x ii) = x(i-1)+(b-Ax (i-1),uUl)u(i) (i � i � n),
for k = 1,2, 3,... , M do
en donde x(O) es un punto arbitrario de lR.". Entonces Ax< ) = b.
n

v+-b-Ax
t +- (v, v)/(v,A v) Demostración Defina t; = (b-Ax(i-I),u (i)), de modo que la fórmula recursiva se convierta simple­
x+-x+tv mente en
outputk,x X(¡) = X(i-l)+t;i¡).
end. Con esto y con la relación (AuVJ,u Ul) = Oij,deducimos las siguientes ecuaciones:

El método del descenso más rápido rara vez se usa en esta clase de problemas debido Ax(L) = Ax(i- ll+t;Au(I)
a su lentitud. La manera en que éste podría marchar en un problema bidimensional Ax(n) = Ax(O) +t ¡ Au(ll+· · ·+t.Ai•l
está representada en la figura 4.4, en la que mostramos las curvas de nivel de la forma
cuadrática q. (Ax(n ) -b, u(i)) = (A x(O) -b, iº)+t¡
A continuación podemos ver que la parte derecha de esta última ecuación es O:

t; = (b-Ax(i-!J,u(L))
= (b-Ax(ºl, uUl)+(Ax (O) -Ax(!) ,u(i))+· · ·+(A x(i-Z) -Ax(i-1) ,él )
= (b-Ax(Ol,u(i) )+(-t ¡ Ai1l , u(i) )+· · ·+(-t;-1Au(i-I), u (¡))
= (b-Ax(ºl,u(I) )

Nuestro análisis muestra que Ai•l -b es ortogonal (en el sentido usual ) a los vectores
i1l,u(2), ..• , u(•),y por ende debe ser cero. 11
Figura 4.4 Interpretación geométrica del descenso más rápido.
214 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más rápido y del gradiente conjugado 215

Vamos ahora a describir una manera de desarrollar este método. Sea A una matriz Método del gradiente conjugado
de n x n simétrica y definida positiva. Es muy fácil comprobar que la ecuación
Un tipo particular del método de la dirección conjugada es el método del gradiente
n n conjugado de Hestenes y Stiefel [1952]. Éste se aplica a los sistemas de la forma Ax = b,
(x,y)A = (x,Ay) = ¿¿aijXíYj en los cuales A es una matriz simétrica y definida positiva. En el método del gradiente
i=l j=l conjugado las direcciones de búsqueda y(il a las que se hace referencia en el teorema 2,
se eligen de una en una en el proceso iterativo y forman un sistema A-ortogonal. No
define un producto escalar. A éste le corresponde una norma cuadrática llx lli = (x, x)A· obstante, la propiedad distintiva es que los residuos r(i) = b -Ax(i), forman un sistema
Si aplicamos el proceso de Gram-Schmidt con este producto escalar al conjunto { el1l , ortogonal en el sentido ordinario, es decir, (rCil , r(D ) = O para í *" j.
e<2l , ... , e<•l } de vectores unitarios estándar, el resultado es un sistema A-ortonorrnal El método del gradiente conjugado es preferible a la eliminación gaussiana simple
{ u(ll, uC2l , ... , uCnl }. El proceso de Gram-Schmidt (que discutiremos con mayor amplitud cuando A es muy grande y rala. Teóricamente, el algoritmo del gradiente conjugado nos
en la sección 5.3) se describe como sigue: dará la solución del sistema Ax = b en n pasos a lo sumo. No obstante, en la práctica el
algoritmo se utiliza como un método iterativo que produce una sucesión de vectores que
converge a la soluciór.. En los problemas mal condicionados, es frecuente que los erro­
u
(í)
= (ilv(i) IIA r 1 v(i) donde ylíl = é) - ¿(el'1, uii'! )A uú\ res de redondeo impidan que el algoritmo nos proporcione una solución suficientemente
j<i precisa en el n-ésirno paso. Cuando Hestenes y Stiefel [1952] presentaron el método
del gradiente conjugado, éste causó una gran conmoción. Sin embargo, el interés dis­
Por la naturaleza especial de los vectores elíJ, estas fórmulas se reducen a: minuyó cuando se descubrió que la propiedad de la terminación finita no era asequible
en la práctica. Esta propiedad era indeseable para un método directo. Veinte años más
u(i) = (llvCilllA ) - vCO donde yli) = /íl - ¿(Au Ci\ u Ul.
1
tarde hubo un interés renovado por el método cuando se consideró como un método
j<i
iterativo. Lo que no debemos esperar de un método iterativo es obtener la solución
con absoluta precisión después de n pasos. De hecho, lo que se espera es obtener una
Por ejemplo, uC 1l = (1/faíi)e(l l . Las fórmulas nos indican que cada uCíl es una combi­ respuesta satisfactoria en menos de n pasos para sistemas extremadamente grandes. En
nación lineal de los vectores unitarios e<1l , e<2J , ... , eCíl . La matriz U, cuyas columnas los problemas bien condicionados, el número de iteraciones necesarias, para que el mé­
son u< 1 l , uC2), .•• , uC•l , es por tanto triangular superior. La ecuación urAU = I, que todo del gradiente conjugado converja satisfactoriamente, puede ser muchÓ menor que
mencionamos previamente, nos da A = (Ur )-1 u- 1, la cual es una factorización LU. el orden del sistema. La historia del método ha sido escrita por Golub y O'Leary (1989].
De este modo, la solución de Ax = b se calcula con una variante de la eliminación El algoritmo formal del gradiente conjugado es el siguiente. (Este seudocódigo
gaussiana sin pivoteo. no se diseñó para ejecutarse en una computadora. Más tarde veremos un algoritmo
En los trabajos numéricos es preferible utilizar sistemas A-ortogonales a sistemas adecuado para tal fin.)
A-ortonorrnales. Un conjunto de vectores v( l), v(Z) , ... es A-ortogonal si (v(i) ,AvVl ) = O, inputiºl ,M,A, b, e
siempre que i "#- j. De un sistemaA-ortogonal podemos pasar a un sistemaA-ortonormal rCO) +- b - Ax(O)
por medio de un proceso de normalización: y(O) +- rCO)
1
output O, x(O), rC0l
uiíJ = (llv(i) IIA )- /íl. for k = O, I, 2, ... ,M - 1 do
if v(OJ = O then stop
Si cada vector v(íl es distinto del vector cero y A es una matriz definida positiva, los tk +- (rik>, r(k)) /(/kl,Av(k))
vectores u ,) formarán un sistemaA-ortonormal. El siguiente es el análogo al teorema l .
(
(x k+I) +- x(k) + t v k)
(
k
r(k+l) +- r(k) - tkAv(k)
TEOREMA 2 Sea { vC l l, vC2l, ... , v(•l } un sistema A-ortogonal de vectores distintos de cero correspon­
dientes a una matriz A de n x n definida positiva. Defina if llr(k+l ) II� < e then stop
sk +- (rCk+l), r(k+l)) /(r(k l, r(k ))
(k +I +- r(k+I + Sky(
) ) k)
(b -Ax(i- 1)' v(í)) ro V
xli) = xií-1) + y (1 � i � n) output k + 1, x(k+l ) , ,Ck+l)
(y<O,Av(O )
end.
en donde xCO ) es arbitrario. En tal caso, Ax(n) = b. En el algoritmo, si v(k) = O entonces x es (teóricamente ) una solución del sistema
( k)

lineal Ax= b. La ejecución del algoritmo en una computadora requiere lugar de alma­
}c
216 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más r ápido y del gradiente conjugado 217

cenamiento para cuatro vectores, a saber, x( k) , ,-(k) , vCk) y AvCkl . También se debe hacer Supongamos ahora que el teorema es válido para una cierta m. Con base en esto, lo
provisión para el cómputo de los productos AvCk) . (Esto puede o no requerir el alma­ demostraremos para m+ l . Con este propósito en mente, suponemos que vCOl , v( ll , ... ,
cenamiento de toda la matriz A .) El trabajo en cada iteración es muy modesto, siendo vCm+l) son todos diferentes de cero. Por hipótesis de inducción, los incisos (a) a (f) son
igual a un sólo producto matriz-vector para Av( k) , y tan sólo dos productos escalares válidos. Queremos demostrar que
(después de las primeras iteraciones) para (vCkl ,AyCkl ) y (r (k+ll ,r (k+ll) . Observe que el
criterio de detención incluye el número JJr (k+llll1 = (r (k+ll ,r (k+ll ) , que es muy fácil de (a') (r (m+ll, v(íJ ) = O (0�i �m)
(b') (r (m+ll , r(m+l)) = (r (m+l),v(m+l) )
calcular, pues r (k+ll se tiene disponible. Por consiguiente, un código de computadora
(c') (vCm+ll,Av(i) ) = O (O�i �m)
para el método del gradiente conjugado debería basarse en el siguiente algoritmo.
(d') r (m+l) = b-Ax(m+l)
(e') (,-{m+l),,-J.il) = O (O�i �m)
input X, A, b, M, e, 8
(f') r (m+l) * O
r+-b-Ax
V+-r Para (a'), sea i = m. Tenemos:
c +- (r, r)
for k = 1, 2, ... , M do (r(m+l),y<m)) = (r(m)- tmAyCm l ,V(m)) = (r(ml ,V(m) )-tm(v(m) ,Aylm))
if (v, v) 1/2 <8 then stop = (r(ml ,y<m) ) = (r(ml ,r(m)) = O.
z+-Av
t +-c/(v,z) Utilizando (b). Si O�i <m, por (a) y (c),
X+-X+tv
r+-r-tz (r(m+ll ,v(i)) = (r(ml ,v(i) )-tm(y<ml ,Av(i)) = O.
d +- (r,r)
if d2 <e then stop Para demostrar (b'), utilizamos el inciso (a') concluyendo que
v +- r +(d/c)v
(r(m+l),y<m+l)) = (r (m+l) ,r(m+l)+Sm V(m) ) = (r (m+ll ,r (m+ll).
c+-d
output k, x, r Para demostrar el inciso (c') tomamos s_ 1 = O y vHl = O donde quiera que estos
end. términos aparezcan. Si O�i �m, entonces

TEOREMA 3 En el algoritmo del gradiente conjugado,para todo entero m <n, si v(Ol ,v(ll,... ,v Cm) son (v( m+ll ,Av(!)) = (/m+l)+Smy<ml ,Avf'))
vectores distintos de cero,entonces r ( ) = b-Ax( íJ para O�i �m ,y {r ( Ol , r (l l ,•. . ,,.<m)}
i

es un conjunto ortogonal de vectores distintos de cero. = (rfm+ll ,Av(il )+sm (yCml,Av('))


= t¡-1 (,Cm+ll , r( i)- r( i+l))+sm (v<m ,Av(i )
l l

Demostración Vamos a demostrar algo más; a saber, que (según las hipótesis dadas) cada uno de los
siguientes incisos es válido: = rl (/m+l) ,yli) _ S¡_¡V(i-1) _ V(i +l)+sií))
+sm (v(ml ,AvCil)
(a) (r (m),v(í)) = O (O�i <m)
(b) (r<1\ r (i) ) = (r (í) ,v(il ) (O�i�m) = rl [(rfm+l l,yli)) _ S¡_¡ (r fm+l), V(i-1)) _ (r (m+ll, V(i+l))
(c) (vCml,Av( i) ) = O (O�i <m)
(d) r (í) = b-Ax(i) , (O�i�m) +s¡(,Cm+ll ,ylil )J+sm (V(ml ,Avf'1).
(e) (,-{mJ,r CíJ) = O (0�i <m)
,.<z) * O Si i <m, por el inciso (a'), r <m+ll es ortogonal a v<íJ , vCi-ll y vC +Il. También, por el inciso
i
(f) (0�i �m)
( ml , <11 ) = ( m+ll ,A Cil ) = O. El caso i =mes
(c), v Av
< O. Por consiguiente, en este caso v< v
La demostración es por inducción sobre m. En el caso m = O suponemos que y(Ol * O, especial. De una ecuación previa tenemos que
debiendo demostrar los incisos (a) a (f). Observe que (a), (c) y (e) son identidades nulas
en este caso. En cuanto a (b), (d) y (f), resultan de manera inmediata de la definición del
(v(m+ll ,Ay<m)) = t;l(r (m+l),y<m) _ Sm-JV(m-l) _ V(m+l)+Sm V(m) )
algoritmo, pues
,(0) = b-Ax(O) = y(O) Q. * +s (v(m),Aylm)).
m
218 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más rápido y 1el gradiente conjugado 219
Por el inciso (a'), /m +l) es ortogonal a y (ml y v(m-l) . Por lo tanto donde
A= S T A S
(y (m +l),Ay (m )) = -t,;;1(/m +l),y (m +l) ) +sm (r (ml,Av (m) ) { x=s-1x
= -t,;;t(r (m +ll, v(m +l)) +sm (v(m),Ay (m )) b= ST b
(V(m), AV(m))
= (/m +l)' V(m +l)) es tal que K(A)< K(A). Como un producto secundario, el método iterativo que se utiliza
(r( m ),r(m)) para resolver el sistema precondicionado puede que converja más rápido que como lo
(,(m +l), ,(m +l)) m haría con el sistema original. En vez de tomar una matriz arbitraria S, supondremos
+ (V( )' AV(m)) que la matriz de descomposición Q simétrica y definida positiva se puede factorizar de
(r(m),,(m))
modo que
Q-1=SS T.
Podemos ver, utilizando (b'), que esta expresión es cero.
Para demostrar (d'), escribimos: La razón de todo esto se hará clara en breve.
El algoritmo formal del gradiente conjugado se puede escribir para el sistema pre­
b - A./m +l)=b - A(x(m) + lm y (m ))=b -Ax (m ) - tm Ay (m) condicionado como sigue:
=,(m ) _ ( /m ) _ , (m +l))=, (m +l) ,(O)=b _ A_t(O)
í)(O)=,(O)
Para demostrar (e'), sea O;;; i;;; m y pongamos L¡=O y vHl=O.Entonces a partir
del inciso (a') tenemos: for k = O, l ,...,M do
1k=(ik),,(kl) / (v(k),Av(k ))
(r (m +l),r(f¡)= (r (m +l), yUl -S¡-¡V( i-1)) x(k +t)=ik ) + tkv(k )
= (/m +l),v(f¡) -Si-1 (/m +ll, v(i-1)) = O. ,(k +l)= ,<k ) _ tk Av(k )
sk=(,(k+I),,<k+I)) / (,<kl,,<k ))
Para el inciso (f'), utilice (c') y el hecho de que A es definida positiva como sigue: v<k+t) =;-(k+ll + skv<kl
end.
O< (v (m +ll,Av (m +l))=(r(m +l) +sm y (m l,Ay (m +l))
Al precondicionar el sistema original, toda dispersión en la matriz A se puede
=(/m+l),Ay (m+l) ) + Sm (y{m ),Aim +l)) destruir al formar A. De este modo, en vez de conformar explícitamente el sistema pre­
=(/m +l),Aim +l)). condicionado, quisiéramos utilizar el sistema original y realizar el precondicionamiento
implícitamente dentro del algoritmo.
Escribimos
En consecuencia, ,(m +l) � O. 11
ik l=S-lik )
El teorema y su demostración están adaptados del libro de Stoer y Bulirsch [1980].
í)ik )=s-ly(k)

Gradiente conjugado precondicionado r(k) = b -Ax(k) = sTb -(STAS)(s-1x(O))=sT,(k )


;,(k)= Q-1 ,(k )_
Queremos resolver el sistema
Ax=b,
Entonces
donde A es simétrica y definida positiva, con una variante del método del gradiente 1k=(,(kl,,.(k)) / (v(kl,Av(k ))
conjugado. Para ello sería ventajoso precondicionar este sistema para obtener uno
nuevo que estuviese mejor condicionado que el original. Con esto lo que queremos = w, k ,5
( l T ,(k)
) / (S-lv(kl ,(S
TA
S)(S-ly (kl))
decir es que, para alguna matriz no singular S, el sistema precondicionado =(Q-1, (kl, , (kl)/ (ikl,Av(kl)
Ax=b, =(';.(k),,(k ))/ (v(k),Av(k ))
220 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4. 7 Métodos del descenso más rápido y del gradiente conjugado 221

Es más, input x(OJ , A, b, M


,(O) +- b - Ax(O)
_x(k+l) = _x(k ) +t y(k)
k resuelva Qr<0> = ,(o) para ¡:(O)
s-l x(k +l) =s-lx(k) +t ks-lv'k) yeoJ +- ,coJ
output O, iºl
y, multiplicando por S, tenemos: for k = O, 1, 2, ... , M - I do
if v(kl =O then stop
X(k +I) = ik ) +tkv'k). tk +- (;:Ckl, ,ckl)/ ( vCkJ,AvCkl)
ik +l) +- xCk) +tkv(k)
De igual manera, ,(k+I) +- r(k) - t kAv<kJ
,-(k +1J =,-(kl - ik Av(k> resuelva Qr<k+l) = r(k+I) para ¡:(k +l)
if (¡:(k+lJ, ,ck+l)) < e then
sr,<k+I) =sr,(k) _ ik (srAS)(s-'v'k\ if ¡¡,ck+ll ii� < e then stop

si ahora multiplicamos por s-r, tendremos: endif


sk +- (¡:Ck+n, ,(k+l))/ (¡:(k l, ,(kl)
y(k+l) +- ¡:(k+l) + SkV(k)
,(k+I) = ,(k) - t kAv(kl.
output k + 1, x(k+I), ,(k+I)
end.
Ahora
¡
sk = (r(k+I), ¡.(k+ 1>) (r<k>, ,(k>) El algoritmo del gradiente conjugado precondicionado que acabamos de presentar se
toma en el algoritmo del gradiente conjugado ordinario, cuando Q-1 =I, pues ¡:Ckl =
¡
= (Sr,(k+l), sr,(k+1J) (sr,<kl, sr,(kl) ,(k), t k = tk y Sk = Sk .
Si Q-1 =A y S = A 112, el sistema precondicionado se reducirá ax = by
= (Q-1,(k+l), ,(k+l))/ (Q-1,(k), ,(k) )
s.e habrá resuelto de manera trivial. Desafortunadamente, este sistema perfectamente
= (i'(k+l), ,(k +l))/ (ikl , ,(kl). condicionado (x:(A) = 1) no tiene ningún valor computacional, ya qu� el problema de
determinar b=srb sería tan difícil de resolver como el sistema original.
También, Como en cada iteración del algoritmo del gradiente conjugado precondicionado
debemos resolver un sistema de la fonna Qx =y, hay que seleccionar Q de modo que
v(k +I) = ,-(k +I) +sé(k) este sistema sea fácil de resolver. Si Q es una matriz diagonal, esta condición se cumple
sin más, aunque algunos precondicionadores más complicados podrían conducir a una
s-l v'k+l) = Sr,(k +I) +skS-lv(k). convergencia más rápida. En la medida en que Q-1 resulta ser una mejor aproximación
de A, el sistema precondicionado se vuelve mejor condicionado y la convergencia del
y, multiplicando por S, tenemos: método iterativo se da en menos pasos. Por otra parte, resolver Qx = y se hace más·difícil;
esto ilustra las típicas concesiones mutuas entre los métodos iterativos que requieren de
pocos aunque costosos pasos, y aquellos que requieren de muchos pasos más económicos.
v'k +I) =Q-1,(k+1) +skv'k ) ¿Qué ocurre con el criterio de convergencia? Como no se dispone de llr(k+l) lli
en este algoritmo, se requiere un cómputo adicional. De lo que sí se dispone es de
=¡:(k+l ) +skv(k)_
(¡:{k+ n, ,Ck+l)) . Usarlo puede ocasionar que el proceso iterativo se interrumpa, ya sea
antes o después de lo que debería hacerlo, de acuerdo con la precisión especificada. Por
Ahora podemos escribir el algoritmo del gradiente conjugado precondicionado consiguiente, se debería realizar como control una evaluación adicional de llr(k+ll 11�, una
primordialmente en términos del sistema original. El seudocódigo que presentamos a vez que el criterio anterior indique que sí hay convergencia.
continuación no es el adecuado para un programa de computadora Otra versión más Un código de computadora se puede basar en el siguiente algoritmo del gradiente
eficiente se proporcionará más adelante en esta sección. conjugado precondicionado:
222 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.7 Métodos del descenso más rápido y del gradiente conjugado 223

inputx, A, b, M, 8, e 4. Sean A una matriz definida positiva y b un vector fijo. Para toda x, el vector residual es
rt-b-Ax r = b- Ax y el vector de error es e = A - t b- x. Demuestre que el producto interno del
resuelva Qz = r para z vector de error con el vector residual es positivo, a menos que Ax = b.
5. Sean A una matriz simétrica, Ax = b y y un vector arbitrario. Con q definida como en el
V f- Z texto, demuestre que
c ,- (z, r) ((x-y),A(x-y)) = (b,r1 b) +q(y).
fork = 1, 2, ... , M do Esto muestra que minimizar q(y) es equivalente a minimizar ((x- y),A(x-y)).
if (v, v) 112 < 8 then stop 6. Con t definida como en la ecuación ( 3), demuestre que si y = x + tv, entonces v.l(b -Ay),
es decir, (v. b-Ay) = O.
zt-AV
7. Demuestre que en el método del descenso más rápido
t ,-c/(v,z)
X t-X+tv q(x(k+tl) = q(x(kl)- [J/klf[4/(/kl ,Ar(kl ),
rt-r-tz donde /kl = b-Ax(k).
resuelva Qz = r para z 8. Si {u(t)' u(2l , ..., u(•l} es un conjunto de vectores ortonormal en el sentido usual, y si estos
d ,- (z, r) vectores se utilizan como direcciones de búsqueda para minimizar q ¿se alcanzará la solución
después de n pasos?
if d2 < ethen
9. Sea A una matriz de n x n. Demuestre que de la existencia de un sistema A-ortonormal
e;- (r;r) {u't)· u(2l, ..., u'"l} se infiere que A es simétrica y definida positiva.
if e2 < e then stop 10. Demuestre que en el método del gradiente conjugado,
endif
lk = (/kl, /kl)/ (/kl, Av (k))
v ,-z+(d/c)v
Sk =-(/k+t),Av(k) )/ ( v(kl,Av(k))
c ,-d
output k, x, r '11. Programe y ponga a prueba el método del gradiente conjugado. Un buen problema para
ponerlo a prueba es la matriz de Hilbert con un simple vector b:
end. n
¡
El método del gradiente conjugado precondicionado es un área de intensas investi­ ªU = (i+j+ 1)-t b, = 3LªU (1 � i,j � n)
gaciones. Hay toda una gama de elecciones para Q, tales como la matriz de sobrerrela­ i=l

jación sucesiva simétrica y muchas otras. También hay paquetes de cómputo asequibles 12 . En el método del gradiente conjugado, demuestre que si /kl = O, entonces Ax(k) = b.
que contienen rutinas del gradiente conjugado y otros métodos iterativos. Ejemplos de
13. ¿Para qué valores de tk el método del descenso más rápido se reduce al método de Richardson?
ello son los paquetes ITPACKV 2D de Kincaid, Oppe y Young [1989], NSPCG de Oppe, ¿Qué condiciones debemos imponer a lk y a A para que el método del descenso más rápido
Joubert y Kincaid [1988], o PCGPAK [1984]. Nosotros hemos modelado nuestra presen­ sea equivalente al método de Jacobi?

[X¡ ] [
tación del método del gradiente conjugado precondicionado basándonos en la de Ortega 14. Considere el sistema lineal
[1988]. Ahí encontrará usted información adicional, al igual que en muchos otros libros,
tales como el de Golub y van Loan [1989]. 2 Ü -1 J
[-2 -lQ Q ] X2 = -12 ]
-J -1 4 X¡ 2

SERIE DE PROBLEMAS *4.7 Tomando como vector inicial a iºl = (O, O, ül, efectúe dos iteraciones de cada uno de los

l[
siguientes métodos: (a) Jacobi (b) Gauss-Seidel (c) Gradiente conjugado.
l. Demuestre que si A es simétrica, entonces el gradiente de la función
'15. Resuelva el siguiente sistema a partir de x'ºl = O usando el método que se indica: (a) Jacobi
q(x) = (x, Ax)- 2 (x, b) (b) Gauss-Seidel (c) Gradiente conjugado
JO 1 2 3 4 [Xt 12
en x es 2(Ax- b). Recuerde que el gradiente de una función g: IR" -,. l. es el vector cuyas 1 9 -1 2 -3 x2 -27
componentes son Bg/Bx,, para i = 1, 2, ... , n. [ 2 -1 7 3 -5] X3 = 14]
3 2 3 12 -1 X4 -J7
2. Demuestre que el valor mínimo de q(x) es-( b, A - 1 b). 4 -3 -5 -J 15 X5 12
3. Demuestre que en el método del descenso más rápido, v(kl .l /k+tl . Nota: La matriz de coeficientes es simétrica y definida positiva, mas no diagonalmente
dominante.
224 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.8 Análisis de los errores de redondeo en el algoritmo gaussiano 225

*4.8 Análisis de los errores de redondeo en el algoritmo gaussiano Cuando todas estas cuestiones se toman en cuenta, los números computados con el
algoritmo gaussiano se pueden describir con las ecuaciones:
Vamos a investigar ahora los errores de redondeo que surgen inevitablemente al resolver ()
un sistema de ecuaciones lineales: -(k+!) _ áIJ i�k
aij - -(k)
- [áfl - ft(fika )] i>kyj>k
{fi � kj

Ax=b (A E Rnxn, x E Rn, b E Rn). - {1 i=k


eik = fl(á�) i>k
/áWl
En particular haremos un análisis del algoritmo gaussiano con pivoteo por filas no es­
caladas, debido a Wtlkinson. Los resultados se dan en términos de cotas a posteriori TEOREMA 1 Sea A una matriz no singular de n x n cuyos elementos son números máquina de una
impuestas al error. Así, justo al concluir el cálculo se puede estimar la magnitud del computadora con redondeo unitario s. El algoritmo gaussiano con pivoteo de filas
error. produce dos matrices i y Ü tales que
En el análisis suponemos que al inicio del cálculo se han intercambiado las filas,
de modo que los elementos pivote correctos están situados en la posición deseada. Bajo iü=A+E donde jeijl � 2ne f.1� JaflJ.
l=IJ• k=n
tales circunstancias, la estrateria del pivoteo por filas nos garantiza que en el k-ésimo
paso del algoritmo !aWI � ja�ll para i � k. (Consulte la sección 4.3 para la notación.)
La desigualdad que acabamos de dar implica que los multiplicadores necesarios en el Demostración Introduzcamos las cantidades Oij y o(; para que desempeñen el papel de ±o y ±o' en la
proceso de eliminación no tienen una magnitud superior a la unidad. ecuación (1). En tales circunstancias, los números calculados con el algoritmo obedecen
a las siguientes ecuaciones:

{
Las fórmulas que definen la descomposición LU son las siguientes:

áf l
+I
= [áfl -(l -oij)lik á�l]/0 -oif) (i>k, j>k)
a(k)
ij i�k
(k+I) (k) _ t a(k)
a9 = aq ,k k ¡ i>kyj>k lik = (1 + Oik)á�)/áW (i > k).
o j�k<i
La primera de las dos ecuaciones se puede escribir en la forma
i<k
eik = i=k -(k+l) _ -(k) - l -<k)+ <k>+ , -(k+l)
{ �a(k) 'a(k) i>k aij - ªif ikakj 81
g ,k ákj 8ifªij (i>k, j>k).
ik ¡ kk

Introduzcamos ahora una matriz i(k) de n x n compuesta en su totalidad de ceros, salvo


El proceso inicia con A(I) = A y termina con A(n) = U. Las matrices L y U son, los elementos debajo de la diagonal en la k-ésima columna:
respectivamente, triangular inferior unitaria y triangular superior.
Los números que en realidad se encuentran en la computadora los distinguimos con o
una tilde. Así, por ejemplo, l;k es el número computado y almacenado en la posición
de memoria asignada a f;k. Por consiguiente, el significado de la tilde depende de la
Dk>=
o
máquina. Por otra parte, suponemos que en el transcurso del cómputo no acontece lk+l,k
ningún desbordamiento por exceso o por defecto.
Al describir los cálculos efectuados por la computadora, utilizamos la función ji,
definida en la sección 2.1. Recuerde que si x y y son números de máquina y si 0 denota l11,k o
una operación aritmética, la computadora producirá en vez de x0 y un número máquina
denotado confi(x0 y). Por la ecuación (8) y el problema 8 de la sección 2.1, la relación En tal caso A(k) - i(k)A(k) es el resultado de aplicar ciertas operaciones elementales a
entre x 0 y y fl(x0 y) se puede expresar con la ecuación las filas de A(k), a saber, sustraer l;k veces la fila k de la fila i, para k + 1 � i � n. Ésta
es casi la definición de A(k+I). La diferencia surge del redondeo y del hecho de que en
J(k+l tomamos á�+l )
l = O para k + 1 � i � n. Debido a eso es posible escribir
fi(x 0 y)= (x 0 y)(l -8) = (x 0 y)/(l -8 ).
1
(1)
J(k+l) =A(k) -Dk)J(k) +E(kl,
(2)
en donde o y o' son números cuyas magnitudes no exceden al redondeo unitario e de la
computadora que se esté considerando. donde E<kl es una matriz que compensa los errores.
226 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.8 Análisis de los errores de redondeo en el algoritmo gaussiano 227

Para analizar la matriz E(kl, considere primero el caso i > k, j = k. De ecuaciones En la práctica, antes de aplicar este teorema, debemos conocer el número
previas tenemos que
P = máx la(kl1
l�4 �n IJ ,
_ a-(k+I) _ a(k)+ e(- k)a(- k)
ei(kk) -
j
ik ik ik kk
k) - -< k) Éste puede calcularse durante la ejecución del algoritmo si se añade el código adecuado.
= O -aik + e ikakk
- <

= -a�l+ ( a�1 / a(;])(1+oik) a(;] TEOREMA 2 Si X¡, X2, ..., Xn y y¡, Y2, ..., Yn son números máquina, entonces el valor máquina de

=u•ika-(ikk) (i > k). ¿x;y;


i=l
Después considere el caso i > k, j > k. En este caso tenemos que
calculado en la forma natural se puede expresar como I:;=I x;y;(l+8;), en donde cada
/kJ = a(k+11 _ a(kl+ ¡(kla< kJ 8; satisface la desigualdad 18;1 ;;;i �(n+l)E. (El número E es el error de redondeo unitario
'J •J l] k kJ ¡

de la máquina, y suponemos que n¡¡ < f.)


= Uo..geik- ak-(kj)+ U¡j
ot a-ij(k+I) (i > k. j > k).
Demostración La hipótesis quiere decir que el cálculo se hará de la manera siguiente:
Los demás elementos de E (kl son cero. Añada ahora las ecuaciones (2 ) para k = 1,
2, ... ,n -l. El resultado lo podemos escribir como sigue: zo = o Zk =fl [Zk -1+jl(XkYk )] (1 ;;;i k ;;;in).
i(ll.4.(l)+ ...+ v•-l).4.(n-l)+ ¡.4.(n) = A(I)+E(!)+...+ E(n-1). Utilicemos inducción sobren para demostrar que 16;1 ;¿; (1 + st+Z-i - l. Paran = 1
tenemos que
Observe que i(kJA(k) es una matriz cuyas filas son simplemente diversos múltiplos del z1 =.fi(x1y1) =x1y1(1+81) l81I;¿; E.
vector
-k - ) -( k En este caso, la aseveración que se quiere demostrar es 16 1I ;¿; (1 + i;)2 -1, lo cual es
[ªk( 1•) ªk(k2•···· ªkn)l '
cierto pues E ;¿; (1 +E ) 2 - l. Si el teorema es cierto paran = k - 1, su demostración
como este vector es el mismo que paran = k es como sigue:
-(n) -(n) -(n)
[ªkt, ª1a, ... ' ª1ai ] ' zk = [zk -1+xkYk (l+o')j(l+o)

concluimos que f.<kl.4.(kl = f.< kl.4.(•l. Recuerde que A(Il =Ay que el factor triangular k -1

superior computado U es Ü = J.<•l. Tomando E= I:;;;;/ E (kl, tenemos que = [;x;y;(l+8;)+x kyk(1+8') ] (1+8)

(D1l+ L<21+ · · ·+ r<•-1)+ l)Á(n) =A(!)+ E k-1


= ¿x;y;(l+8;+8+M) +xkyk(l+8+8'+00 1).
i=l
ÍÜ=A+E.
Tenemos las siguientes cotas para la ecuación precedente:
Todo lo que nos resta ahora es encontrar una cota para IJEJJ. Sea p = máx 1 �i.j.k�n IAtll.
El intercambio preliminar de filas garantiza que todos los multiplicadores satisfagan lol;¿; E 18'1;¿; E lo ¡I;¿; c1 +d+t-i -1 (1 ;¿; i;¿; k -1).
lé,1c 1 ;;;i l. Así, de las ecuaciones dadas previamente para et), tenemos que Necesitamos demostrar que

Je1ll = IB;k l ¡a)fll ;;;i sp (i > k) 18;+8+MI;¿; CI +e/+z-i -1 18+o'+8o'I;¿; c1+d -1.
( k) • e- - k • - k < ,,_
1 e¡j I = 1 uij ikak< j)+ u;j' ai< j +t) ¡ = ""'P (i > k. j > k). La primera de estas desigualdades se establece al escribir

De la definición de E resulta que lo¡+o+MI;¿; lo;I+lolO+lo d)


n-1 ;¿; (1+d+l-i _ l+E(l+E/+1-i
L et) ;;;i ¿ Je\]lJ ;;;i 2nsp.
I n-!
Jeijl =
=(1+d+2-i -1.
1111
k=1 1 k=I
228 Capítulo 4 Resolución de sistemas de ecuaciones lineales *4.8 Análisis de los errores de redondeo en el algoritmo gaussiano 229

La segunda desigualdad se demuestra de manera similar. Esto completa la inducción. Esto lo interpretamos como una ecuación matricial
(L+t:.)y = b,
Ahora se requiere la siguiente estimación para k � n + 1:
(6)
en donde t:. es la matriz triangular inferior cuyos elementos son lgo¡¡ , siempre que
(l + e) -1= [l + ke + --e +···+e ] -1
I �j � i � n. De este modo
k k(k-1) z k

it:.;¡J = Je¡¡ ¡ lo¡¡ I � �(n+I)e¡e¡¡ ¡.


2

k- I
[¡+-e+ (k-l)(k-2)
= ke e +···
] 11
TEOREMA 4 Sea U una matriz triangular superior no singular de n x n. Si los elementos de U y c
2
2 2 ·3
son números máquina, y ne < entonces la solución calculada y de Uy = c satisface
!,
� ke [1+ +( +· · exactamente un sistema perturbado
I IY · ]
(U+t:.)y = c con ¡t:.¡¡ I � J(n + l)e[ug[-
= kej(l-!ke) < �ke.
Demostración Se deja como ejercicio.
En el último paso se utilizó la hipótesis de que ke � ne < ! . Finalmente 1
TEOREMA 5 Sean los elementos de A y b números máquina. Si se utiliza el algoritmo gaussiano con
� (l + et+2-i-1::;; �(n+2-i)e::;; �(n+l)e. 11 pivoteo por filas para resolver Ax = b, la solución calculada x es la solución exacta de
un sistema perturbado
TEOREMA 3 Sea L una matriz triangular inferior unitaria de n x n, cuyos elementos son números
máquina. Sea b un vector cuyas componentes son números máquina. La solución (A+F)x=b en el cual Jj¡¡J � 10n2ep.
calculada de Ly = b es el vector y, que es la solución exacta de
Aquí n es el orden de la matriz A, p = máx 1�4¡,k�n l at\ y e es el error de redondeo
(L+t:.)y = b con lé:.;¡ I ::;; �(n+l)ell;¡ ¡. (3) unitario de la máquina. Se supone que ne < !.
Aquí e representa el error de redondeo unitario de la máquina, y se supone que ne < !. Demostración Por los teoremas l, 3 y 4, y en vista de que ne<!, tenemos lo siguiente:

Demostración La solución exacta del sistema Ly = b se calcula con la fórmula A+E = ÍÜ [e¡¡ ¡ � 2nep
(Í+t:.)y=b lé:.;¡I � J(n+l)eilij[
y¡ = b;- ¿ l;¡y¡ (Ú+t:.')x=y it:.iji::;; �(n+l)elii;¡ ¡.
i-1

j=I
(1 � i ::;; n),

Los valores calculados y1, Y2, ... , Yn satisfarán una ecuación de la forma
Al reunir estas ecuaciones obtenemos:
b = (L+t:.)y = (L+A)(ú+t:.')x = (íü+t:.ú+fo' +M')x
= (A+E+t:.ú + fo'+M')x = (A+F)x,
y; = ¡ b;- ¿ l y¡(I + 8;¡) (1 + 8u),
í i-1 ]/

1=1 donde F = E+AÚ + fo' + M'. Recurrimos a las cotas dadas más arriba para obtener
ij (4)

una estimación de F, junto con la observación de que ¡eij 1 ::;; 1 y


en donde las 8¡¡ son números que satisfacen
[u¡¡ I = iat)J � P·
l8ijl::;; �(n + l)e (1 �j � i � n). ( 5)
Esta aseveración es una consecuencia de las suposiciones hechas en la sección 2 .1 y del
De este modo

teorema precedente. La ecuación (4) se puede reexpresar como sigue:


[fijl � leg[ + ¿ {IA;v[ liiv I+il;vJ [t:.�¡I+[A;vl I� [}
¡ ¡

(1 + ou)Y; = b;- ¿ l yj(I + o )


i-1 v=l

::;; 2nep + n(n + I)ep + n(n + I)ep + n(n + I)2 e2p


6 6 36
5 5 25
if if
j=l

1 n+l 36 n+1
=n2ep {� + 2 + 8( )
2}

n 5 n n
para después reescribirla así:

¿ t y¡(I + 8 ) = b;.
25
if ij La cantidad dentro de las llaves no puede ser mayor que 10. 1111
j=l
230 Capítulo 4 Resolución de sistemas de ecuaciones lineales Capítulo 5

Las cotas impuestas por el teorema 5 se pueden mejorar si se pone más atención
a los detalles en los teoremas 1 a 5 y si se calcula IIFl! 00 El lector debería consultar

TEMAS SELECTOS
Forsythe y Moler [1967], Golub y Van Loan [1989], Wtlkinson [1965] e Isaacson y
J(.eller [1966]. DEL ÁLGEBRA LINEAL NUMÉRICA

SERIE DE PROBLEMAS *4.8 5.1 Problema de los valores propios de una matriz: el método de la potencia
l. Demuestre el teorema 4. 5.2 Los teoremas de Schur y Gershgorin
2. En el teorema l, demuestre las desigualdades *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados
*5.4 Descomposición en valores singulares y seudoinversas
(k) *5.5 Algoritmo QR de Francis para el problema de los valores propios
\IE lloo :;;; (1+ 2(n- k)]ep
2
IJE\1 00 :;;; n ep.

3. En el teorema 3, demuestre que


máx llvl­
lló.lloo :;;; �n(n+ l)]e t�íJ�n

5.1 Problema de los valores propios de una matriz: el método de la potencia

El estudio de los valores propios de una matriz requiere cierta familiaridad con los
números complejos, por lo que comenzamos con un breve repaso de las nociones básicas
que se necesitan.

Conceptos básicos
El campo l de los números reales tiene el defecto de que un polinomio de grado n
con coeficientes reales no necesariamente tiene n ceros (o raíces) reales. Por ejemplo,
el polinomio p(x) = x2 - 2x+ 2 carece de ceros reales. Este defecto se supera de golpe
extendiendo el campo de modo que contenga al elemento (no real) i. Éste elemento se
caracteriza por la ecuación i2 = -1. El campo que se obtiene de esta manera se denota
con C, y sus elementos se llaman números complejos. Estos números tienen la forma

r=a+iP (a, P números reales).

El conjugado y el módulo de y se definen, respectivamente, por

y=a-ip
lrl = )a2 +V

Observe que y=y y yy = !Yl -


2

El campo C no tiene la deficiencia ya mencionada de los números reales. Es más,


contamos con el teorema fundamental del álgebra, el cual establece que todo polinomio
no constante con coeficientes complejos tiene al menos un cero en el plano complejo.

231
232 Capítulo 5 Temas selectos del álgebra lineal numérica 5.1 Problema de los valores propios de una matriz: el método de la potencia 233

Una de sus consecuencias es que todo polinomio de grado n se puede descomponer como La condición de que la ecuación (1) tenga una solución no trivial es equivalente a
un producto de n factores lineales. cada una de las siguientes condiciones:
El espacio vectorial e• se compone de todas las n-tuples complejas tales que
A- M mapea algún vector distinto de cero en O (2)
X= (X¡,Xz,... ,x.l, A- U · es singular (3)
donde Xj E C para 1 � j � n. Si el vector complejo x se multiplica por el número det(A- U)= O. (4)
complejo1, el resultado es otro vector complejo, a saber,
De este modo nosotros podemos, en principio, resolver la ecuación (4) para las incógnitas
AX = (AX¡, AXz, ..., AX./. ), y así calcular los valores propios de A. La ecuación (4) se conoce como la ecuación
característica de la matriz A. Si esta ecuación se escribe con más detalle resulta:
De esta manera, podemos considerar a C" como un espacio vectorial sobre el campo de
escalares C. En el espacio C", el producto interno y la norma euclidiana se definen, a¡¡ - A. a12 a13 ª1•

respectivamente, como a21 a22-1 a23 ª2n

n
det ¡ a31 a32 a33 -1 a3. 1 =0.

(x,y) = I>Yi y llxll2 =�.


anl a.2 ª•3 aM-1
i=l

Observe que La función determinante se define como una suma de términos que son productos de
(x,y) = (y,x) (x, ly) = �(x,y) elementos de la matriz. De acuerdo con esta definición podemos ver que la parte izquierda
de la ecuación (4) tiene la forma de un polinomio de grado n en la variablel. Éste es
y el polinomio característico de A. De golpe, nos vemos llevados a la conclusión de
(x+y, z) = (x,z) + (y, z). que una matriz de n x n tiene exactamente n valores propios, siempre y cuando éstos se
Si A es una matriz con elementos complejos, con A* denotamos su conjugada tras­ cuenten con las multiplicidades que tienen como raíces de la ecuación característica.
puesta: (A*)ij = Aji· En particular, si x es una matriz de n x l (o vector columna), Para aclarar estos conceptos, determinemos los valores propios de la matriz
entonces x*= (i¡) es una matriz de l x n (o vector fila), y [1 2 1]
n
A= O I 3 .
y*x = (x,y) = ¿x¡y¡ 2 1 1
i=l La ecuación característica es
¿ [xi[ .
n n
x*x = (x,x) = JJxj[� =¿x¡i; = 2 1-1 2 1
i=l i=l det [ O 1-1 3 ] =-13 +312 +2\+8=-(\- 4)(12 +1+2)=0.
2 1 1-1
Sea A una matriz den x n (cuyos elementos pueden ser números complejos). Seal un
escalar (un número complejo). Si la ecuación Las raíces de la ecuación característica son

Ax= AX 1 v?. 1 v?.


(1) 4 --+-1 - - 1
2 2 2 2•
tiene una solución no trivial (es decir, x '# 0), entonces 1 es un valor propio de A. Un Esto ilustra el hecho de que los valores propios de una matriz real no son necesariamente
vector x distinto de cero que satisface la ecuación (1) es un vector propio de A corres­ números reales.
pondiente al valor propiol. Por ejemplo, la ecuación El procedimiento anterior es el método directo para calcular valores propios. Éste
[ 2 O 1] [ l] [ l] quizá sea el mejor método para calcularlos a mano cuando se trata de matrices pequeñas.
5 -1 2 3 =-2 3 Para matrices de mayor tamaño y para el cómputo automático, no se recomienda de
-3 2 -i -4 -4 ninguna manera este método. Una de las razones de su proscripción es que las raíces de un
polinomio pueden ser funciones muy sensibles de los coeficientes del polinomio. Así,
nos dice que-2 es un valor propio de la matriz de 3 x 3 y que (1, 3, -4? es un vector pro­ cualesquiera errores (como los errores de redondeo) que se presenten en los coeficientes
pio correspondiente. Observe que cualquier múltiplo distinto de cero de un vector propio pueden conducir a un valor enormemente inexacto de las raíces calculadas. Un ejemplo
es también un vector propio correspondiente al mismo valor propio. clásico de esto, debido a Wilkinson, se discutió al final de la sección 2.3.
234 Capítulo 5 Temas selectos del álgebra lineal numérica 5.1 Problema de los valores propios de una matriz: el método de la potencia 235

Método de la potencia Para simplificar la notación, escribimos x en la forma


(k)

El siguiente método numérico que examinaremos es el método de la potencia.


Este procedimiento está delineado para computar el valor propio dominante y un vector ik ) =1ef [u<l)+e(kl] ,
propio correspondiente a dicho valor. Para que la teoría se desarrolle con fluidez, es
necesario suponer que A tiene las siguientes propiedades: donde f!.(kl -+ O cuando k -+ oo. A fin de poder formar cocientes, sea$ cualquier
(i) sólo hay un valor propio de módulo máximo; funcional lineal sobre IC" con la propiedad de que$(u (ll) :;é O. Recuerde que un funcional
lineal$ satisface$(a x+� y = a$(x +�$(y), para escalares a y� y vectores x y y.
(ii) hay un conjunto linealmente independiente de n vectores propios.
(Por ejemplo,$ podría evaluar simplemente la i-ésima componente de cualquier vector
) )

De acuerdo con la primera de nuestras hipótesis, los valores propios J..1, J..2, ...),n , dado.) Entonces
se pueden indexar de modo que $(x k =1ef[$(u' ll )+$(E(k))]
( )
) (8)
JJ..d > JJ..2 1 � JJ..3J � ... �JJ..nl- En consecuencia, los cocientes siguientes tienden a 1e 1 cuando k-+ oo:
De acuerdo con la segunda de nuestras hipótesis, hay una base {u(Il , uC2l , ... , u<nl } de $(ik+l <n +$(dk+ll )
IC" tal que rk - - [$(u l) ]
)

$(x l ) le¡ $(u( l)+$(z(k))


=
)
-+
Au(il ='J..;u( il
k ( le¡.
(1 � i � n) (5)
Sea x<0l cualquier elemento de ic n de modo que cuando x<0l se escribe como una com­ Éste es el método de la potencia para calcular 1e 1 • Dado que la dirección del vector x<k )

binación lineal de los elementos de la base u<ll , u<2l , ... , u(n , el coeficiente de u(l ) es
)
se va alineando cada vez más con u(l) a medida que k -+ oo, el método también nos
distinto de cero. Así, puede proporcionar al vector propio u( ll . En la literatura sobre el tema se encuentran
muchas variaciones y refinamientos del método de la potencia.
x<0l = a¡u(ll +a2 i2l+ · · ·+an u< ) (a¡ :;é O).
n
(6)

Ahora formamos Algoritmo

X(l) =Ax O( )
x(2l =Ax(ll x( )
k
= Ax(k -1) El algoritmo para el método de la potencia tal como lo acabamos de describir es el
siguiente:
de modo que input n, A, x, M
x kl = Akx(ºl.
<
(7) outputO,x
for k = I, 2, ..., M do
En el análisis siguiente no hay pérdida de generalidad al absorber todos los coeficientes
a; en los vectores u"1 que multiplican. Por lo tanto, la ecuación ( 6) se puede escribir y <-Ax
como r <-$(y)/$(x
X(O) = u( )+u(2)+ ...+ u<•l.
X <-y
)

l
output k, x, r
De esta ecuación y (7) tenemos que end.
x(
k) = Aku(I) +A ku(2)+ ...+A ku'n) Aquí,$ es algún funcional lineal.
En las realizaciones prácticas del método de la potencia, es recomendable introducir
y utilizando la ecuación (5), llegamos finalmente a una normalización de los vectores x<k ), ya que de otra manera podrían converger a cero
o crecer sin límite. Por ello, podemos modificar la iteración como sigue:
ik ) =J..fu(ll +1e1u'2) + ...+1e!u<nl .
input n, A, x, M
Esta última ecuación se puede volver a escribir en la forma outputO, x

x(k ) =1ef [u(ll + (tiY u' 2l +...+ (?iY u • ]. < l


for k = I, 2, .. ., M do
y <-Ax
r <-$(y /$(x
X t- y/JJy JJ
) )

ComoJ1e 1 I > J 1ej J para 2 � j � n, podemos ver que los coeficientes (1ej /1e d tienden a output k, x, r
cero y el vector entre paréntesis converge a uOl cuando k -+ oo. end.
236 Capítulo 5 Temas selectos del álgebra lineal numérica 5.1 Problema de los valores propios de una matriz: el método de la potencia 237

Se puede utilizar aquí cualquier norma que sea conveniente: la norma l00 llxll oo =
, TEOREMA 1 Sea [r.] una sucesión numérica convergente al límite r. La nueva sucesión
máx 1:,;;:,;. lxd, por ejemplo. Los cocientes r son los mismos que en la versión no norma­
rnrn+1- r�+I
lizadadel algoritmo. (En el problema 2 se pide la demostración de esta aseveración.) s. = (n � O)
r n+2- 2rn+I + r.
Ejemplo 1 Para ilustrar el método de la potencia se tomaron una matriz y un vector inicial de la converge a r más rápido, sirn+I-r = (c+o.)(r.-r) con e
! l< 1 y lím ......00 On =O. En
siguiente forma:
[6 -5] efecto, (s.- r)/(r.- r)-+ O cuando n-+ oo.

= rn- r. Un breve cálculo nos muestra que


5
A= 2 6 -2 X= (-1, !, 1/. Demostración Defina una sucesión de error h.
2 5 -1
Se programó la versión normalizada del algoritmo, tomando $(x) = x2 como funcional Sn = (r(r+ )(r +h n+2)- (r+ h n+I)2
hn

lineal $. En la siguiente tabla mostramos los vectores normalizados x'k) y los cocientes + h n+z)- 2(r+h n+I)+ (r +h n )
rk para algunos valores de k: +2- h�+I
hn h n
= r+
-
n+1 2hn+l + n
k=O X = (-1.000000, 1.000000, 1.000000)
h h
(O)

k=I X(!) = (-1.000000, 0.333333, 0.333333) ro= 2.0 Utilizando la hipótesis hn+l =(e+8.)h. se obtiene hn+1 =(e+On+1 )(c+o.)hn y
k=2 pl =(-1.000000,-0.111111,-0.111111) r¡ = - 2.0
k=3 i3) = (-1.000000,-0.407407, -0.407407) hn ( e+8n+1 )( e+ o.)h.- ( e+8.) h� 2
r2 = 22.0 Sn - r = -----------=
k=4 x( l = (-1.000000,-0.604938, -0.604938)
4
r3 = 8.90909 (c+8.+1 )(c+8.)h.-2( +o.) .+ .
c h h

(c+8.+1)(c+8n)- (c+8.) 2
= n
h

k=6 x(6) = (-1.000000, -0.824417,-0.824417) r5 = 6.71508 (c+8.+1 )(c+8.)- 2(c+8n)+ 1


Ahora es evidente que lím......00 (sn-r)/h n = O, pues en la ecuación previa el numerador
k = 28 x(28l = (-1.000000,-0.999977,-0.999977) r21 = 6.00007. tiende a cero y el denominador a (e- 1)2, que no es cero. 11
Es importante detener el proceso de aceleración de Aitken poco después de que
El valor propio dominante de A es 6, y es un vector propio (1, 1, ll. 1111
éste produzca en apariencia valores estacionarios, ya que la cancelación sustractiva en
la fórmula estropeará eventualmente los resultados.
Nuestro análisis del método de la potencia sigue siendo válido cuando todos o
Antes de examinar otras variantes del método de la potencia vamos a demostrar un
algunos de los valores propios son complejos, y bajo nuestras suposiciones el algoritmo
hecho elemental acerca de los valores propios.
computaA.¡ y un vector propio asociado.
TEOREMA 2 SiA. es un valor propio de A, yA es no singular, entoncesA.-I es un valor propic deA- 1•
Aceleración de Aitken
Demostración Sea Ax = A.X, conx;,: O. En tal casox = A-1 (u) = u- 1x. Por lo tanto,A- 1x = A.-1x
Si los cocientes rk se consideran aproximaciones deA.1 , entonces hay cierto interés yA. -1 es un valor propio deA-1 . 11
por estimar los errores h - A.d. Los resultados pertinentes al respecto se pueden
encontrar en los problemas 3 y 4. Resulta que
Método de la potencia inversa
rk+ l -A. ¡ =(e+ ok)(rk -A.¡ ) El teorema precedente sugiere un mecanismo para calcular el valor propio más
pequeño de A. Suponga que los valores propios de A se pueden arreglar como sigue:
para una constante c que satisfase e ! l< 1 y para números Ok convergentes a cero. En
la terminología de la sección 1.3 esto implica que la sucesión [rk] converge linealmente l"-i\ � A.
! 2 ! � · · · � A. ! ni > O.
! n-1 I > A.
a A.¡. Debido a este conocimiento adicional acerca del comportamiento de los errores, Esta hipótesis implica que A es no singular, pues O no es uno de sus valores propios. Los
se puede utilizar un procedimiento general conocido como aceleración de Aitken. A valores propios de A-1 son los númerosA.¡ 1 , y están arreglados de la siguiente forma:
partir de la sucesión [rk ], construimos otra sucesión [skl por medio de la fórmula
! ; 1 > A! .;�1 1 � . . . � l"-1 1 1 > o.
A. 1

rk rk+Z- ri+i
Sk=---�� En consecuencia, podemos computarA.; 1 aplicando el método de la potencia aA-1 . No
rk+2 - 2rk+l + rk es una buena idea computar primero la inversa A- 1 y utilizar después x(k+I) = A- 1 x(k) .
Esta sucesión converge más rápido que la original, todo de acuerdo con el siguiente En vez de ello, podemos obtener x'k+l) resolviendo la ecuación
resultado general (teorema de la aceleración de Aitken). Ax(k+l) = x(k) _
238 Capítulo 5 Temas selectos del álgebra lineal numén·ca 5.1 Problema de los valores propios de una matriz: el método de la potencia 239

Esto se puede hacer con eficiencia utilizando el método de eliminación gaussiana Lo Resumen
único que se necesita es efectuar una vez la fase de factorización de la eliminación
Resumimos estos resultados en la siguiente tabla:
gaussiana y repetir la fase de solución cambiando las partes derechas de x(OJ a x( 1l de x( 1l
a x<2l , y así sucesivamente. Éste es el método de la potencia inversa. Método Ecuación Valor computado
potencia z'k +tl =A:/<l máximo valor propio A1
Ejemplo 2 Ilustramos el método de la potencia inversa con la matriz del ejemplo anterior. Su potencia inversa A..'k+IJ =x( kl mínimo valor propio An
factorización LU es potencia con desplazamiento x(k + 1J =(A -µl)x(<l valor propio más alejado deµ

º]
potencia inversa con desplazamiento (A -µl)x( k+IJ =x'kl valor propio más cercano aµ
6 5 -5 1 O 6 5 -5
[ 2 6 -2] [j
= 1 O [O ] t -t
2 5 -1 l3 .lQ 1
Ll
O O ll
Ll SERIE DE PROBLEMAS 5.1

Comenzamos con el vector x = (3, 7, -13f y computamos 25 pasos del proceso. En l. Sea A una matriz den x n con un conjunto den vectores propios {u'º, u (2l , ... , u'•l }
cada paso obtenemos x<k+ I) resolviendo Ux (k+I) = L- 1x(k) _ Un cociente se computa e linealmente indepediente. Sean Aé1 =;\.;u'" y P la matriz cuyas columnas son los vectores
ulll , ul2l , ... , él. ¿Cómo es p- 1AP?
imprime; a saber, rk =x\k+ I)jx\kl. Antes de avanzar al siguiente paso,x<k+l) se normaliza
(es decir,se divide por su norma f00 ). He aquí un fragmento de los resultados: 2. Demuestre que si las versiones normalizada y no normalizada del método de la potencia
comienzan en el mismo vector inicial, los valores de r en los dos algoritmos serán los
k=O O
x( ) =(
3.000000, 7.000000, -13.000000) mismos.
k=l x(!J =(-0.801653, -0.008264, -1.000000) ro=-5.8889 3. En el método de la potencia sea r¡ = �(x( k+ll)N(x(kl). Sabemos que lím k-oo rk = A. 1 .
k=2 x(2l =(-0.950887, -0.017735, -1.000000) ri = 1.19759 Demuestre que los errores relativos cumplen con
k=3 x(3l =(-0.987589, -0.007125, -1.000000) r2 = 1.02750
k=4 x <4l = (-0.996882, -0.002233, -1.000000) 73 = 1.00446 Tk - A.¡ _ A.2 k
--- ( - ) Ck'
A. [ A. [
k=6 x(6) =(-0.999805, -0.000171, -1.000000) rs = 1.00012
donde los números Ck forman una sucesión convergente (y por ende acotada).
k=11 x(ll) =(-1.000000, 0.000000, -1.000000) r10 = 1.00000. 4. (Continuación) Demuestre querk +t -A.1=(c+o¡)(rk-t..1),donde !el < 1 y límn -oo Ok=O,
de modo que la aceleración de Aitken es aplicable.
El resto de las iteraciones no mostró ningún cambio. 111 5. Demuestre que en la aceleración deAitken, (s. -r)/(r.+2 -r)-. O cuandon-. oo, siempre
que e ;t O.
En esta etapa hemos bosquejado el método de la potencia para computar el mayor
de los valores propios de A y el método de la potencia inversa para computar el valor 6. Cuente el número de multiplicaciones y divisiones implicadas en la ejecución de m pasos
del método básico (no normalizado) de la potencia.
propio más pequeño de A. Si consideramos la matriz desplazada A -µl, podemos lograr
un procedimiento para computar el valor propio de A más cercano a un valor dado µ. 7. Demuestre que en el método de la potencia normalizado, los vectores x(kl convergen a un
Suponga que un valor propio de A, digamos A k, satisface la desigualdad O< IAk -µ < s, 1 vector propio cuando f.1 > O.
donde µ es un número complejo determinado con anterioridad. Suponga que los demás
8. Diseñe una modificación simple para el método de la potencia que le permita manejar el
valores propios de A satisfacen la desigualdad IAi - µ >s. En vista de que los valores
1
siguiente caso: t..1=-�> IAil ¡;; 1"'41 ¡;; · · · ¡;; lt..nl-
propios de A-µ! son los números A;-µ,el método de la potencia inversa se puede aplicar
a A-µ!, obteniéndose como resultado un valor aproximado de (Ak -µ)- 1. Nuevamente, 9. ¿Qué puede usted demostrar acerca de la aceleración de Aitken si la sucesión [r.J sólo
la sucesión de vectores que el método demanda se obtendrá al resolver las ecuaciones satisface la hipótesis lr.+1 - rl � clr. -rl, en donde O< e< 0.2?
(A - µl)x(k+I) = x (kl. La descomposición gaussiana de A - µ! debería computarse 10. Permita que los valores propios de A satisfagan las desigualdades A.¡ > A.2 > · · · > "'• ( todos
una sola vez en este algoritmo. Dado que el procedimiento computa z = (Ak - µ 1, >- ellos reales mas no necesariamente positivos). ¿Qué valor del parámetro� se debe utilizar
podemos recuperar A k de la fórmula Ak =z- 1 + µ. Este algoritmo se llama método de para que el método de la potencia converja lo más rápidamente posible a;\.1 cuando se aplica
la potencia inversa con desplazamiento. a la matriz A +�I?
De manera semejante,podemos computar el valor propio,digamos A k , más alejado 11. Si alguna de las matrices A o Bes no singular, demuestre que I -AB tiene los mismos valores
de un valor dado µ. Suponga que hay una & positiva tal que !Ak - µI >&,para algún propios que I - BA.
valor propio A k de A, y que para todos los demás valores propios A ¡ de A se tiene que
12. Si el método de la potencia se aplica a una matriz real con un vector inicial también real,
O< IA; - µ¡ < &. Al aplicar el método de la potencia a (A - µJ) se obtiene z =A k - µ. ¿qué sucederá si un valor propio dominante es complejo? ¿Se puede aplicar en este caso la
Por consiguiente, A k =z + µ. teoría desarrollada en el texto?
240 Capítulo 5 Temas selectos del álgebra lineal numérica 5.1 Problema de los valores propios de una matriz: el método de la potencia 241

c13_ Aplique el método de la potencia a la matriz del ejemplo 1, tomando como vector inicial al O cuando p --+ oo, y tiende a 1/2 cuando p --+ l. ¿Qué sugiere esto respecto de los valores
vector (1, 2, 3f Desarrolle 100 pasos y explique la convergencia aparente en la etapa inicial propios de las matrices reales?
seguida de otra convergencia posterior a un valor diferente.
24. Para calcular i•l = Akx cuando los valores de k son muy grandes, podemos elevar al cuadrado
14. ¿ Cuál es el polinomio característico de esta matriz? en forma repetida las matrices:

a1 a2 a3 ª•-1 ª• m
1 o o o o A--+Az --+A4 - -+As--+ ... --+Az .
o 1 o o o m
Después, un simple producto matriz-vector produce x(Z l = A2• x. Compare este proce­
dimiento con el método ordinario de la potencia. Cuente el número de multiplicaciones
o o o o o que requiere cada método para llegar a p•l. Demuestre que para valores muy grandes de
o o o 1 o m el método de los cuadrados es más económico. Esquematice una manera de evitar el
desbordamiento, escalando las potencias sucesivas de A.
15. Demuestre que para todo número complejo 1. <25. Escriba un programa para la computadora que realice el método de la potencia inversa y
póngalo a prueba con algunas matrices de su elección.
dim{x:Ax = M} =n - rango(A - U)
<26. (a) Escriba un programa que reproduzca en su computadora los resultados que se dan en el
16. Sea A = LU, con L una matriz triangular inferior unitaria y U una matriz triangular superior. ejemplo l. Divida su programa en un número suficiente de subrutinas o procedimientos para
Sea B=UL. Demuestre que B y A tienen los mismos valores propios. el cómputo de cada uno de los segmentos principales del algoritmo. (Por ejemplo, quizá
quiera el lector construir rutinas para: (i) multiplicar matrices y vectores, (ii) el producto
e17. Escriba un procedimiento o subrutina que desarrolle M pasos del método de la potencia punto, (iii) sustituir un vector por otro, (iv) la norma de un vector, (v) normalizar un vector,
normalizado cuando éste se aplica a una matriz A de n x n, a partir de un vector inicial x. y así sucesivamente.)
Incorpore la aceleración de Aitken. En cada paso, imprima el vector x(kl , el cociente rk y el (b) Incluya en su código la aceleración de Aitken y vuelva a ejecutar el programa. Escriba
valor acelerado Sk en curso, según se definieron en el texto. Ponga a prueba el procedimiento las conclusiones que pudo extraer de este proyecto.
con las matrices A - µl, donde
(i) <21. (a) Repita el problema 26 (a) con el ejemplo 2.

[" 1 ¡]
4 5 1 1
A= 1 1 4 2 y µ=O, 3, 6, 11.
(b) Repita el problema 26 (b) con el ejemplo 2.
<28. Escriba y ponga a prueba un programa para la computadora que calcule el valor propio más
1 1 2 4
alejado de un número complejo dado. Ponga a prueba la rutina con la matriz del ejemplo 1
(ii) de esta sección.
2 3 4
A= [7 -1 3] y µ=O, 5, 10. 29. Aproxime el radio expectral p(A) de la siguiente matriz, efectuando dos iteraciones del
1 -1 5 método de la potencia y utilizando la norma infinito para$. Tome (1, 1, lf como vector
inicial.
[ 2 O -1]
18. Suponga que la k-ésima fila de A es tal que r,;=t,¡.k lalil = O. Sea B la matriz que resulta A= -2 -10 O
al eliminar la fila k y la columna k de la matriz A. Demuestre que akk es un valor propio de -1 -1 4
A y que los demás valores propios de A también lo son de B.
Demuestre que cuando$ es una norma, los cocientes rk en el método de la potencia convergen
19. Una matriz de n x n es defectuoS,llf sus vectores propios no generan a iR". Demuestre que a 11.iJ.
1 1 ;¡¡¡;¡,
la matriz A = [ 0 1 ] es defectuosa.
30. Demuestre que para los cómputos, la siguiente forma de la aceleración de Aitken es preferible:
20. Demuestre que si una matriz den x n tiene n valores propios distintos, no es defectuosa.
21. Demuestre que el recíproco del teorema que se enuncia en el problema 20 es falso. Sk =rk - (tird
f:.2 r; '
22. En algunos experimentos se observó que al computar los valores propios de las matrices
reales, los valores obtenidos eran con mucha frecuencia números reales. Demuestre que una donde
matriz real de n x n tiene al menos un valor propio real cuando n es impar.
!::.rk =rk+l - rk !::.2rk =!::.rk+I - !::.rk.
23. (Continuación) Cualquier polinomio real se puede descomponer como un producto de fac·
lores cuadráticos y lineales, pudiendo tener dichos factores cuadráticos raíces complejas. Éstas son las diferencias hacia adelante, las cuales se examinarán en el capítulo 6.
Calcule cuál es la probabilidad de que un polinomio cuadrático real de la forma x2 + ax + b
tenga raíces reales, suponiendo que los coeficientes a y b son variables aleatorias uniforme· '31. Construya un ejemplo que demuestre que la aceleración de Aitken conduce a resultados
mente distribuidas en el cuadrado Jal � p, lb! � p. Demuestre que la probabilidad tiende a insensatos si no se detiene oportunamente.
242 Capítulo 5 Temas selectos del álgebra lineal numérica 5.2 Los teoremas de Schur y Gershgorin 243
5.2 Los teoremas de Schur y Gershgorin más adelante, hay una matriz unitaria U, tal que U x =�i1l. Dado que U es unitaria,
u-1 = u•, y �-lx= u•il) de modo que
Continuamos nuestro repaso de la teoría básica de los valores propios. Recuerde que
dos matrices A y B son semejantes entre s� cuando hay una matriz no singular P tal UAU*/1l = UA�- 1 x =�-1 A.Ux = A./1l.
que B = PAP- 1• La importancia de este concepto surge del teorema que establece que
dos matrices que representan una misma transformación lineal, con respecto a dos bases Esto demuestra que la primera columna de UAU* es Ai1l. Sea Á la matriz que se obtiene
distintas, son semejantes entre sí. al eliminar en UAU* la primera fila y la primera columna. Por hipótesis de inducción,
hay una matriz unitaria Q de orden n -1, tal que QÁQ* es triangular. La matriz unitaria
TEOREMA 1 Todas las matrices semejantes tienen los mismos valores propios. con que se reduce A a una forma triangular es

Demostración Sean A y B dos matrices semejantes, es decir,

B=PAP-1•
pues
V=
[�
�Ju,
Vamos a ver que A y B tienen el mismo polinomio característico. Ciertamente,
V AV* = 1 º uAu· 1 º = l 1
det(B-U) = det(PAP-1 - U) [O Q] [O Q*] [O Qº][OA. A
".:'][O Q*º]

= det[P(A-A.J)P-1] º] ["'
= [o1 Q o wQ*] = ["' wQ* ]
ÁQ* o QÁQ*
= detP det(A-A./) detP-1
= det(A-U). En esta ecuación, w es un vector fila de orden n-1, y los ceros representan vectores
nulos de orden n-l . Como la matriz
Hemos incluido dos hechos básicos en este pasaje: el determinante del producto de dos
matrices es el producto de sus determinantes; el determinante de la inversa de una matriz
es el recíproco de su determinante. 11 [� �]
es unitaria, la demostración está completa. 1111
Faétorización de Schur
El teorema 1 sugiere una estrategia para encontrar los valores propios de A: con­ El lector habrá observado que la demostración que acabamos de ver no es cons­
viértase A en una matriz B por medio de una transformación de semejanza, B= PAP-1, tructiva, pues apela a (y hace uso de) la existencia de valores propios, mas no aborda el
y calcule los valores propios de B. Si B es más simple que A, el cálculo de sus valores problema de cómo se pueden calcular.
propios quizá sea más fácil. Específicamente, si B es triangular, los valores propios de B
(y los de A) son simplemente los elementos diagonales de B. Esto nos lleva de un modo COROLARIO 1 Toda matriz cuadrada es semejante a una matriz triangular.
natural al teorema de Schur, según el cual la estrategia precedente siempre será posible
(al menos teóricamente). Recuerde que una matriz U es unitaria si UU* = J. Aquí,
U* denota a la conjugada traspuesta de U: (U*)ij = Úji· El siguiente es el teorema de
COROLARIO 2 Toda matriz hermitiana es semejante unitan·amente a una matriz diagonal.
Schur.
Demostración Si A es hermitiana, entonces A = A *. Sea U una matriz unitaria tal que UAU* es
TEOREJ.'\fA 2 Toda matriz cuadrada es unitariamente semejante a una matriz triangular. triangular superior. En tal caso (U AU*)* es triangular inferior. Pero

Demostración Procedemos por inducción sobre n, el orden de la matriz A. El teorema es trivial cuando (U AU*)* = U**A *u• = U AU*
n = I. Suponga que el teorema ya se demostró para todas las matrices de orden
n-1, y considere una matriz A de orden n. Sea A. un valor propio de A, y x un vector Así, la matriz U AU' es ambas cosas, triangular superior y triangular inferior; por con­
propio correspondiente. No habrá pérdida de generalidad si suponemos que [jx[[2 = l. siguiente, se trata de una matriz diagonal. 1
Como es usual, denotamos con /1) al vector unitario estándar /1l = (1, O, ..., 0)1 . Sea
� = x1/[x¡\ si x1 * O, y� = 1 cuando x1 = O. Por el lema 2, que enunciaremos LEMA 1 La matriz I-w* es unitaria si y sólo si J!v[J� = 2 o v = O.
244 Capítulo 5 Temas selectos del álgebra lineal numérica 5.2 Los teoremas de Schur y Gershgorin 245

Demostración Para que la matriz U = I -w* sea unitaria se requiere 3 . Defina a= VZ/[fx-�e(ll [[2, v= a.(x -�eO) ) y U= I -vv*.
4. SeaÁ la matriz que se obtiene de U AU* al omitir la primera fila y la primera
I = UU*= (I -vv*)(l -vv*) columna.
= l -2w* +w*vv* En la sección 3.5 se examinó un proceso análogo de deflación para encontrar las
= I -2vv* + (v*v)(vv*) s,
raíces de un polinomio p. Después de encontrar una raíz, digamos podemos dividir p(x)
por x-s para obtener un polinomio de menor grado con las mismas raíces (excepto s).
= I -(2-v*v)vv*. La mayoría de los métodos numéricos para calcular valores propios computan un
valor a la vez. Cualquier método de este tipo se puede combinar con el procedimiento
(Aquí se movió la magnitud escalar v*v hacia el frente.) Una condición necesaria y de deflación para computar tantos valores propios de una matriz como se desee. No
suficiente para v es que v*v= 2 o vv• = O. 1111 obstante, en la práctica hay que aplicar esta estrategia con cautela, pues la sucesión
de valores propios puede estar contaminada por los errores de redondeo que se van
LEMA 2 Sean x y y dos vectores tales que ffx[[2 = ffy[[2 y (x, y) es real. En este caso hay una acumulando.
matriz unitaria U de la forma I -vv* tal que Ux= y.

Demostración Six= y, tómesev= O. Si x * y,nuestra inspiración nosllevaa suponer quev= a(x-y), Localización de valores propios
con a.= VZ/[fx-yff2. Esta elección de v nos conduce a: En la literatura sobre el tema hay una multitud de teoremas que indican de forma
burda dónde se sitúan los valores propios de una matriz en el plano complejo. El más
2
Ux -y= (I -vv*)x -y= x -w*x -y= x -y -a. cx -y)(x* -y*)x famoso de ellos es el teorema de Gershgorin.
= (x -y)[l -a2 cx*x -y*x)J. TEOREMA 3 El espectro de una matriz A de n x n (es decir, el conjunto de sus valores propios) está
Esta última expresión es igual con cero, pues el factor entre paréntesis es nulo. Para ver contenido en la unión de los siguientes n discos, D;, en el plano complejo:

t
esto, apoyémonos en las hipótesis x*x = y*y y y*x = x*y para calcular:

1-a2. cx*x -y*x) = 1-!a.2(x*x +x*x -y*x -y*x)


= 1-!a.2 (x*x + y*y -y*x -x*y)
D; = {z E C : [z -a;;[ �
¡=1
[ag[} (1 � i � n).
�i

= 1-!a.2(x* -y*)(x -y)


Demostración Sea A. un elemento del espectro de A. Elija un vector x tal que ffxff00 = 1 y Ax = h.
!a.
= 1- 2 ffx-y[[�= O. 11111
Sea i un índice para el cual [x;f= l. Como (Ax);= h;, tenemos que
Ejemplo 1 He aquí un caso concreto de la factorización de Schur U AU*= Ten el que U es unitaria
¿
n
y T triangular superior. A.X¡ = aijXj .
j=I
0.36 0.48 0.80 361 123 -180 0.36 0.48 0.80
[0.48 0.64 -0.60] [ 148 414 -240] [0.48 0.64 -0.60] En consecuencia,
0.80 -0.60 0.00 -92 169 65 0.80 -0.60 0.00
¿
n
(A. -a;;)x; = aijXj.
125 380 -125
j=I
= [ O 465 125] . 111 jcJ:.i
O O 250
Tomando valores absolutos, aplicando la desigualdad del triángulo y utilizando la
Si se conoce un valor propio "' de una matriz A de n x n, entonces la demostración desigualdad [xj[ � 1= [x;[, tenemos que
del teorema de Schur nos indica cómo producir una matrizÁ de (n -1) x (n -1) que
tiene los mismos valores propios que A, salvo A.. Este proceso se conoce bajo el nombre
de deflación. I"- -a·n·[=L_,¡
<°" fa·1J·f [x·f<°"fa·y,
1=L.,¡ ·[
La formalización del proceso de deflación para valores propios es la siguiente: j=l j=I
j,,i j;,i
1. Obtenga un vector propio x correpondiente a un valor propio A. conocido.
2. Defina�= x¡/[x1 f si x1 * O, y�= 1 en el caso contrario. de modo que A. E D;. 11
246 Capítulo 5 Temas selectos del álgebra lineal numérica 5.2 Los teoremas de Schury Gershgorin 247

Eje imaginario cuales son

2i
{7'.. E C: 11-;l..¡-c¡¡I �
.
r,
j=I
jd;i+cijl = t
j=I
lc;ij}
Í*Í Í*Í

Por la desigualdad del triángulo y la definición de 11 Cll co , tenemos que

t ¿
n
1:i..-:i..¡[ � 1:i..-A.¡-cul +lcul � lc¡¡!+
1 1 1 ,. Eje real i=l
-2 -1 2 3 4 j,,;:i

� l!Clloo � IIP- 1 llool!BlloollPl!oo= Koo(P) IIBl!co· 11


-i
El último teorema indica que cuando se perturba una matriz A, sus valores propios
se ven perturbados por una cantidad que no excede de K00 (P) IIB11 00 donde B es la matriz
,
-2i de perturbación y K00 (P) es el número de condición de P, computado a partir de la norma
de matrices f00 (Véase la Sec. 4.4.)
Para las matrices herrnitianas (es decir, aquellas para las que A* = A) se puede
elegir una matriz P unitaria; se trata en realidad del corolario 2 del teorema de Schur.
Figura 5.1 Discos de Gershgorin. Por lo tanto, en este caso las filas de P son vectores que satisfacen llxlb = l . De lo
anterior se obtiene que IIP llco � .¡ñ. Esto también es cierto para P-1, de modo que
K00 (P) � n. En consecuencia, para toda matriz B, los valores propios de A +B están
situados en la unión de discos

il
Ejemplo 2 Los discos de Gershgorin para la matriz

-\+i o {A. E C: 11-1¡1 � nllBll co },


A= [ ;¡ 1 {
1 3 donde :i.. 1 , 7'..2 , ... , 1n son los valores propios de la matriz herrnitiana A.

se muestran en la figura 5.1. De la figura podemos deducir que todos los valores propios
de A satisfacen la desigualdad !�
11 I � 5. 11111 SERIE DE PROBLEMAS 5.2
l. Encuentre las factorizaciones de Schur de
TEOREMA 4 Si una matriz A se diagonaliza por medio de la transformación de semejanza p- 1AP, y
si B es una matriz arbitraria, entonces los valores propios de A+B se encuentran en la
unión de discos [-� �] y [ i 1i] ·
{1 E e: 17'..-A.¡I � Koo(P) IIBlloo},

t
2. Demuestre que los valores propios de A se encuentran en la intersección de los siguientes
donde 7'..1, 7'..2, ..., A.n son los valores propios de A y K00 (P) es el número de condición conjuntos D y E:
de P.
D = � {z E IC: Jz-a¡¡J ;;; lalfl)

t
Demostración Vamos a demostrar un resultado, en cierto modo más preciso. Si p- 1AP = D, la

{"
J"
diagonal de la matriz diagonal D consta de 7'.. 1 , 12, ... , 1n . Escribiendo "esp" por
espectro, tenemos:

esp(A+B) = esp[P- 1 (A+B)P] = esp(D+P- 1 BP).


E=º C l<-'<I > l'ftl)

Aplicando el teorema de Gershgorin a D + C, con C = p- 1 BP, concluimos que el 3. Demuestre que si).. es un valor propio de A, entonces hay un vector x distinto de cero, tal
espectro de A+ B se encuentra en la unión de los discos de Gershgorin de D + C, los que?A= A.Xr . (Aquíxr denota un vector.fila.)
248 Capítulo 5 Temas selectos del álgebra lineal numérica 5.2 Los teoremas de Schury Gershgorin 249

4. Demuestre que cuando A es hermitiana, la técnica de deflación da lugar a una matriz hermi­ 22. Demuestre que si a2 + b2 = 1 y c2 + d2 = 1, entonces la siguiente matriz es unitaria:
tiana.
ad ac b]
5. Demuestre que si la j-ésima columna de la matriz A satisface ag = O para i * j, entonces ªii [bd be -a .
es un valor propio de A. e -d O
6. Una matriz normal es aquélla que conmuta con su adjunta: AA• =A·A. Demuestre que si
A es normal, también lo es A - 'J.../ para todo escalar 7'.. Observe que podemos tomar a = sene, b = cose, e = sen $ y d = cos $ con e y $
arbitrarios.
7. Suponga que A es normal y que x y y son vectores propios de A correspondientes a valores
propios distintos. Demuestre que x•y = O. 23. Demuestre que si x es un vector que satisface = 1, entonces hay una matriz unitaria
cuya primera columna es x.
8. Demuestre que si A es normal, A y A· tienen los mismos vectores propios.
24. Sea JlxJl2 = 1 y U = l - 2xx·. Demuestre que U2 = l.
9. Demuestre que si A es normal, la condición AB = BA implica que A• B = BA •.
25. Sean A den x n, Bdem xm y C den xm. Demuestre que si el rango de C esmy AC = CB,
l O. Demuestre que si x y 7 son puntos de IC" que tienen la misma norma euclidiana, entonces entonces
hay una matriz unitaria U, tal que Ux = y. esp(B) e esp(A).

1 1. Demuestre o refute: si {xi, x2, ... , Xk} y {y1 , y2, ... , Yk} son conjuntos ortonormales de IC", 26. Si x*x=2,¿qué es (l-xx* )- 1 ?
entonces hay una matriz unitaria U, tal que Ux, = y, para 1 ;; i ;; k.
27. Sea x*x = l. Determine si I - xx* es invertible.
12. Demuestre que si (l - vv")x = y para alguna terna de vectores v, x, y, entonces (.x, y) es real.
28. Demuestre o refute: Si A es una matriz cuadrada, entonces hay una matriz hermitiana unitaria
13. Encuentre las condiciones precisas que deben satisfacer dos vectores u y v para que l - uv• U, tal que U AU es triangular.
sea unitaria.
29. Demuestre, sin calcularlos, que los valores propios de la matriz
14. Sea Q una matriz unitaria. Demuestre que
[6 2 1]
IIAll2 = II QAll2 = IIAQ ll2, A= 1 -5 O
2 1 4
15. Sea A una matriz diagonal. Demuestre que
satisfacen la desigualdad 1 ;; 17'.J;; 9.
IIAll2 = máx la¡¡I. 30. Demuestre que las partes imaginarias de los valores propios de la matriz
l�t�

16. Demuestre que si A es una matriz cuadrada, entonces IIA lli;; IIA"All2 ,
17. Denote con A¡ laj-ésima columna de A. Demuestre que IIA¡ll2 ;; IIAll2. Es esto cierto para
todas las normas matriciales subordinadas?
[! -1 _!]
2 2

están situadas en el intervalo (-1, 1].


18. Se define la traza de la matriz A como tr(A) = I:;= 1 a¡¡. Demuestre que la traza de una

[
matriz es igual a la suma de sus valores propios. (El teorema de Schur puede ser útil en este 3 1. Encuentre la factorización de Schur U AU* = T de la matriz
caso.)
19. Demuestre que si 7'.1 , 1'.2, ..., 7'.. son los valores propios de A, la traza de Am es 2.888 0.984 -1.440]
A= 1.184 3.312 -1.920
tr(Am) = 7'.f +7'.i + · · · +7'.:. -0.160 2.120 -0.200

20. Demuestre que si los valores propios de A satisfacen J1'. 1 I > J7'.¡J para i = 2, 3, ... , n, entonces 32. Demuestre que l -xx• es singular si y sólo si x·x= l. Encuentre la inversa en todos los
casos en que la matriz es no singular. (Véanse los Probs. 24, 26 y 27.)
33. Si Ja,, - 7'.J > "�-i .. Ja,¡I, entonces la matriz A -7'.l es diagonalmente dominante. Apo­
1'.1 = lím tr(Am+1 )/ tr(Am ). i...J1- ,J$t
m-oo yándose en esta idea, demuestre el teorema de Gershgorin.

2 1. Demuestre que AB y BA tienen los mismos valores propios cuando A y B son matrices 34. Sea u un vector arbitrario y U = l -7'.uu*. Encuentre todos los valores complejos de 7'. para
cuadradas. los cuales U es unitaria.
250 Capítulo 5 Temas selectos del álgebra lineal numérica
*5.3 Factorizaciones ortogonalesy problemas de mínimos cuadrados 251
35. Suponga que la matriz A es semejante a una matriz B casi diagonal. ¿Podemos concluir
que los valores propios de A son muy próximos a los elementos de B sobre la diagonal? Con esto queda establecido que para todax E IC"
Demuestre un teorema acerca de esto, e investigue el problema cuando B es casi triangular.
n
36. Sea A una matriz de n x n y sean D1, D2, ... , Dn sus discos de Gershgorin. Suponga que x = ¿(x,v;)v;.
un valor propio ). se encuentra en Dk pero en ninguno de los otros discos. Sea x un vector (1)
i=l
propio correspondiente a J.. Demuestre que lxd > lx;! para i e;, k.
37. (a) Bosqueje los discos de Gershgorin para la matriz El término(x,v;)v; se conoce como la componente de x en la dirección v;. En la figura
5.2 mostramos un esquema de esta situación en 12.
[ O 2 -1]
-2 -10 O
-1 -1 4 r(X,V¡)V¡

y encuentre una cota para el radio espectral p(A). / ',',


/
(b) Usando IJAlh, determine una cota superior y otra inferior para p(A), donde A es la /
:;. X
matriz / /'/
[ 1 O 1] /
1 4 O .
/
/
O O 3 /
repita la operación utilizando el teorema de Gershgorin. I
/
v, ',.._
38. Utilice el teorema de Gershgorin para demostrar que una matriz diagonalmente dominante
no tiene el número O como valor propio, siendo por ello no singular. �(x,v,>v,

Figura 5.2 Componentes ortogonales de un vector.


*5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados
Un espacio con producto interno es un sistema algebraico abstracto del que IC" es
Continuamos trabajando en esta sección con vectores y matrices complejas. Como tan sólo un caso particular. Se trata de un espacio lineal (sobre el campo de los números
recordará,la sección 5.1 contiene una revisión del álgebra básica del espacio complejo complejos) en el que se ha definido un producto interno sujeto a los siguientes axiomas:
IC". En este espacio, el producto interior(·,·) nos permite definir el concepto de or­
togonalidad. Un conjunto de vectores indizados [v,1 v2, ...,Vk] de IC" se dice que es (i) (x,x) > O six * O
ortogonal si (v;,vj) = O, siempre que i *- j. Si además (v;,vj) =Oij, se dice que el (ii) (ax+�y,z) =a.(x,z) +�(y,z) a ,� E IC
conjunto es ortonormal Tomando i =j vemos que esto implica que llvdlz = 1 para (iii) (x,y) =(y,x)
cada i. Si los vectoresv; son las columnas de una matriz A de n x k, la ortonormalidad
se expresa por medio de la ecuación A*A =I. Las definiciones de los conceptos de norma, ortogonalidad y ortonormalidad son las
mismas que se dieron para IC". Un espacio con producto interno no es necesariamente
de dimensión finita. Con base en los axiomas se puede demostrar que (x,y+z) =
Conceptos básicos ( x.y) +(x. z) y que (x. ay) =ü(xy, ) .
Ahora suponga que [v¡,v2, .•. , Vn] es una base ortonormal de IC". Cada elemento La regla pitagórica es válida en este caso: si(x,y) = O, entonces
x E IC" tiene una representación única de la forma
[[x+Yll� =llx[I�+IIYII�-
n
x = ¿c;v;, Esto resulta de escribir
i=l
llx+YII� =(x+Y,x+Y) =(x,x) +(y,x) +(x, y) +(y,y) =llx[[�+[[y[[�.
en donde ion números c; son escalares complejos apropiados. Al efectuar el producto
interno de ambos lados de la ecuación con algún vector Vj, tenemos:
\n ) n "
Proceso de Gram-Schmidt
El clásico proceso de Gram-Schmidt se puede utilizar en cualquier espacio con
(x, Vj) = ¿c;v;, = ¿c;(v;, = ¿c;O = 9.
Vj Vj) ij producto interno para obtener sistemas ortonormales. A fin de describirlo, suponemos
i=l i=l i=l
dada una sucesión [x 1, x2, ••• ] de vectores linealmente independientes en un espacio
Capítulo 5 Temas selectos del álgebra lineal numérica
*5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados
252
253
con producto interno (la sucesión puede ser finita o infinita). Generamos una sucesión for j = 1, 2, ..., n do
ortonormal [u1, u2, .•. ] por medio de la fórmula
for i = 1, 2, ..., j - 1 do
I tif +- (Aj, B;)
uk = (llxk - �(xk,u¡)ul)- (xk - �(xk,u¡)u¡) (k � 1). (2) end
Cj +- Aj - ¿tgB¡
TEOREMA 1 La sucesión [u 1, u2,.. .] de Gram-Schmidt tiene la propiedad de que {u 1, u2,...,uk} es
i<j

una base ortonormal del espacio generado por {xi,x2,... ,xk},para k � l. tg +- 11Cj 112
Bj +- t/Cj
Demostración Procedemos por inducción sobre k. Si k = 1, por la ecuación (2) tenemos que end.

u¡ = Cllx1 ll2)-1x1. TEOREMA 2 Si se aplica el proceso de Gram-Schmidt a las columnas de una matriz A de m x n de
rango n, el resultado es una factorización
Por lo tanto, el conjunto {u 1} es ortonormal, y el espacio generado por él es idéntico
al espacio generado por {x1 }. Observe que 1Jx 1 Jlz "f:. O, pues el conjunto {x 1, x2, ...} es A = BT, (4)
linealmente independiente.
Suponga, como hipótesis de inducción, que {u¡,uz,... ,Uk- } es una base orto­ en donde B es una matriz de m x n con columnas ortonormales
normal del espacio generado por {x 1, x2, . . . , Xk- l} (espacio que I denotamos con y T es una matriz de
n x n triangular superior con diagonal positiva.
sp{x¡,xz,... , Xk- l} por su nombre en inglés span). Sea

V = Xk - ¿(xk,U¡)u¡. (3) Demostración En primer lugar, observe que el algoritmo anterior lleva a cabo el proceso de Gram­
Schrnidt que está encapsulado en la ecuación (2). Acto seguido, concluimos la definición
de la matriz T haciendo tif = O, para i > j. Por el teorema l, las columnas de B constituyen
i<k

Entonces v es ortogonal a u¡, u2, ..., Uk-1, pues paraj < k, un conjunto de n vectores ortonormales de Rm , y cada Aj es una combinación lineal de
B 1, B2, ... , Bj , De hecho, por la ecuación (1),
(v, uj) = (xb uj) - ¿(xb u;)(u;, U¡')
L(Aj, B )B = L (A ,B )B + (A ,B )B
j
Aj =
j-1
i<k

= (Xk, Uj) - ¿(xk,U¡)Oij = (xk,Uj) - (xk, Uj) = o.


¡ ¡ j ¡ ¡ j j j
i=I i=I
i<k

L tgB + (A ,Bj}B ,
j-1
=
Cuando v = O podemos ver, por la ecuación (3), que xk E sp{u1, u2, ... , Uk-¡}. Ha- ¡ j j (5)
ciendo uso de la hipótesis de inducción concluimos que Xk E sp{x1,x2,... , Xk-¡}, lo
i=I

que contradice la supuesta independencia lineal de {x¡,xz, ...,xk}, Por consiguiente,


v "f:. O, y uk está bien definido por la expresión (IJvlJ2)- 1 v. Como la norma de uk es 1, el
Ahora nos detenemos para calcular
conjunto {u1,u2,...,uk} es ortonormal. La hipótesis de inducción junto con la ecuación
(3) nos demuestran que v (al igual que uk) está en el espacio sp{x1, x2, ••• , xk}. Podo (Aj,Bj) = (Cj + L t B¡,Bj) = (Cj, B )
tanto, sp{u¡,uz,...,uk} e sp{x1,xz,...,xk}. Como {u¡, uz,... ,uk} y {x1,xz,...,xk}
ij j
i<j

son linealmente independientes (los dos generan espacios de dimensión k), tenemos que = (Cj, Cj)/tjj = tjj,
sp{u1, u2,...,uk} = sp{x¡,Xz,... , xk}-
(6)
11
Si utilizamos el resultado de la ecuación (6) en la ecuación ( 5), obtenemos
Cuando el proceso de Gram-Schmidt se aplica a las columnas de una matriz, se
puede interpretar el resultado como una factorización matricial. En este caso, los pro­ j n
ductos internos que aparecen en el cálculo se pueden guardar en una matriz que será Aj = ¿tifBi = ¿tif Bi (l�j�n). (7)
uno de los factores. Aplicamos el proceso a las columnas A 1 , A 2 , ... , A n de una matriz
A de m x n, y llegamos finalmente después de n pasos a una matriz B de m x n cuyas
i=I i=I

columnas constituyen un conjunto ortonormal. He aquí el algoritmo Gram-Schmidt Ésta es otra manera de escribir la ecuación (4).
11
254 Capítulo 5 Temas selectos del álgebra lineal numérica *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 255

Algoritmo modificado de Gram-Schmidt for k= 1, 2, ..., n do


La experiencia ha mostrado (Rice [1966]) que cierto reordenamiento del proceso dk <--1/Atl l/i
de Gram-Schmidt tiene, en general, superiores propiedades numéricas. El algoritmo for j = k + 1, k + 2, ..., n do
modificado de Gram-Schmidt es el siguiente: t ·1 <-- kd-1 (Aj(k•
l (kl
Ak )
k
(k+ ll (kl _ · (kl
Aj .... Aj tkJ Ak
for k= 1,2,..., n do
end
Ak .... (II Ak !'2)- 1 Ak
for j = 1, 2, ..., k do
for j= k + 1, k + 2, ..., n do
Aj( k+ll .... A(kkl
Aj <-- Aj - ((Aj,Ak) )-1 Ak
end
end
end.
end.
(En este algoritmo no hay sobrescritura.)
Podemos ver que las componentes de Aj en la dirección del vector base Ak se remueven Ahora vamos a demostrar por inducción sobre k la siguiente aseveración:
apenas es posible, de una en una. En este algoritmo se sobrescriben muchas cosas,
y al final el conjunto original {A1 , A2, .•• , A.} ha sido reemplazado por un conjunto A(A) : si mín(i,j) < k entonces (Atl. A?l) = d;f,if
ortonormal.
Para evitar las raíces cuadradas incluidas en el cómputo de !!xl!2, el algoritmo Observe que A(1) es verdadera por vacuidad, pues ninguna pareja satisface mín(i,j) < l.
modificado de Gram-Schmidt se presenta con frecuencia de otra manera, con lo que se Ahora tome A(k) como hipótesis de inducción. La demostración de A(k + 1) sigue el
produce una factorización diferente: siguiente curso. Considere cualquier pareja (� j) con la propiedad de que mín(i,JJ < k+ l .
Por simetria, podemos suponer que i � j . Hay cuatro casos por analizar.
for k = 1, 2,..., n do (a) Cuando i < k y j � k. Por A(k),
dk <-- IIAklli A¡k+ll, Ay+ll ) = (A¡kl,f/J) = dl>ij·
(
tkk .... ¡
for j = k + 1, k + 2, ..., n do (b) Cuando i < k y j > k. Por A(k),
1(
t/ef <-- d¡ Aj,Ak)
Aj <-Aj -t/ef Ak (A)k+ll ,Ay+ll ) = (A)kl ,Afl - tlefAkkl )
end = (Atl, At) - t1q (A¡kl, Akkl)
end.
= d;&ij - tkjd;&;k = o
TEOREMA 3 Si se aplica el proceso modificado de Gram-Schmidt a las columnas de una matriz A (c) Cuando i = j = k. Tenemos que
de m x n y rango n, la matriz transformada B de m x n tiene un conjunto de columnas
ortogona¡ y satisface: (Arll ,At+ll ) = (At\ Atl) = dk
A= BT,
(d) Cuando i = k <j. Tenemos que
do,nde T es una matriz triangular superior unitaria de n x n, cuyos elementos tkj (para
j > k) se generan con el algoritmo.
(Ak(k+l•l A(k+ll) -
_ (A(kl A(kl _k
k·j
_ (A(kl A(kl) _ -t ·(A(kl A(kl)
A(kl) -
t ·1k
j k•j ki k• k

Demostración Para demostrar este teorema, escribimos el algoritmo de modo que las cantidades se = tkA - tkj dk = o
conserven en vez de sobrescribirse. Si no se hiciera esto, en una demostración formal, Aj
seria ambigua, ya que denotarla vectores distintos en las diferentes etapas del algoritmo. Resulta de la demostración inductiva precedente que A(n) es verdadera Esto
.
Reetiquetamos el conjunto original como {A\1\All, ...,A�1l}. El algoritmo es ahora el s1gruºfica que s1. i. < n, (A¡(n), A1(n)) = diºif
O .
. As1,, e1 conJunto {A(n1 ), A2(n), ... , An(n)}
siguiente: es ortogonal. Si B es la matriz cuya j-ésima columna es Aj"), entonces B* B =
T
Capítulo 5 Temas sele ctos del álgebra lineal numérica *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 257
256

diag(d1, d2, ••. , d.). Sea tkk = 1 y t1q = O si k > j. Para ver que A= BT, observe Si la matriz A de m x n es de rango n, entonces A•A es una matriz de n x n no singular
que la k-ésima columna de A está dada por (Prob. 2) y sólo hay una so lución de mínimos cuadrados, que se determina res olviendo
un sistema no singular de n x n, el de las llamadas ecuaciones normales:
Ak = A11l = (A11l -A1 l)+ (A1 l -Afl)+ · · ·+ (A�-l l -A1 l ) + A�
2 2 k l

(9)
-tlkA(¡!)+ t2k A2(Zl+ · • '+ tk-1,k Ak(k--1 )+ tkk Ak(
1 kl A*Ax=A* b.

La matriz A• A es hermitiana y definid a positiva (Prob. 3). P or consiguiente, se puede


= t[k Ar)+t2kAr)+ ...+tkk At)
-

utilizar la factorizaci ón de Cholesky para resolver (9). Si el rango de A es menor que n,


11

la ecuación (9) será consistente, pero puede tener muchas so luciones.


Problema de los mínimos cuadrados El uso directo de las ec uaciones normales para resolver un problema de mínimos
Una aplicación importante de las factorizacio nes ortogonales que no s ocupan es el cuadrad os es muy atractivo debi do a su simplicid ad conceptual. Sin embargo, se con­
problema de lo s mínimos cuadrados para sistemas de ecuacio nes lineales. Considere sidera uno de los métodos menos satisfactorios para abordar este problema. Una de las
un sistema de m ecuaciones con n incógnitas escrito en la forma razones en las que se funda este juicio es que el número de condición de A*A puede ser
considerablemente peor que el de A. Ilustrarnos esta eventualid ad con un ejempl o:
1 1 1
Ax=b. (8)

e O O 1+e2 1 1
Aquí, A es de m x n, x es de n x 1 y b es de m x l . Supondremo s que el rango de A es A= [ l A*A= [ 1 l+e2 1 ] .
n, de lo que resulta que m � n. Por lo genera l, el sistema (8) no tiene solución debido a 1 1 l+e2
O e O (10)
O O e
que b no pertenece al subespacio de c de dimensión n, generado por las columnas de
s que se requier a encontrar una x que minimice la norma
m

A. Es frecuente en tales as
En A, el parámetro e distinto de cer o evita que el rango de A sea 1. En A•A es sólo e2
del vector residual b -Ax. La "solución" en mínimos cuadrado s de (8) es el vector x
c o

lo que evita que la matriz tenga rango 1. Así, la no singularid ad de A*A es una cuestión
que hace de llb -A xl12 un mínimo . (Según lo que hemos supuesto acerca del rango de
mucho más delicada cuando e es muy pequeña Por supuesto que en una computadora,
A, esta x será única)
podemos tener que A es de rango 3 y A• A de rango 1.
LEMA Si x es un punto tal que A• (Ax -b) = O, entonces x es una solución del problema de los
mínimos cuadrados. Factorización QR de Householder
Vamos a ocuparnos ahora de la más útil de las factorizaciones ortogonales, a saber,
Demostración Sea y cualquier otro punto. Dad o que A*(Ax -b) = O, conclui mo s que b - Ax es
o rtogonal al espacio co lumna de A. Es más, como A(x -y) está en el espacio co lumna
una debida a Alsto n Householder, que lleva su nombre. La idea es factorizar una matriz
de A, tenemos que (b -Ax, A(x - y)) = O, y la regla pitagórica no s da de m x n como un producto
A=QR,
\\b -Ay l\i = l\b- Ax+ A(x -y)l\i = llb -Axll�+ IIA(x - y) I\� � l\b -Axl\i· 11 donde Q es una matriz unitaria de m x m y R es una matriz triangular superior de m x n.
En realid ad, el algoritmo de factorizac ión produce
Si A se ha factorizado en la forma A = BT , tal como se describe en el teorema
anterior, la soluci ón en mínimos cuadrad os del sistema Ax = b será la solución exacta
del sistema de n x n
Q*A=R,

construyéndose Q* paso a paso como un pr oducto de matrices unitarias que tienen la


Tx = (B*B)-1B* b.
Esto se puede verificar utilizando el lema precedente: forma especial
[h o
A*Ax = (BT)* BTx = T*B*B(B*B)-1B*b = T*B*b = A*b O lm-k - vv• ] ·

La matriz (B*B)- 1 es la matriz diag(d1 , tt¡ , ... , d,;- ), y los números d¡ so n lo s que Éstas se llaman reflexiones o transformaciones de Householder. Acerca del rango de
Gram-S hmidt. Como hemos señalado A no suponemo s na da.
1

ad de
1 1

se co mputan con el alg ritm m difi


previa mente, este arreglo de los cómputos evita el cálculo de raíces cuadradas. En primer lugar,determinamos un vector v E cm con la propiedad de que I -vv*
o o o c o c

Otra manera de abordar el problema de los mínimos cuadrado s asociado al si stema sea unitaria de manera que ([ -vv*)A empiece a parecerse a R. Específicamente,su
Ax = b co nsi ste en utilizar directamente el lema anterior. Así, la cantidad I\Ax - b\l2 primera co lumna debe tener la forma correcta, a saber,(�, O, O, ... , Ol. Denotemos la
será un mínimo si primera columna de la matriz inicial A con A ¡ . Queremo s que (l-vv*)A¡ = �e . Según
A*(Ax- b) = O. la demostración del lema 2 de la sección 5.2, esto se lleva a cabo como sigue: primero,
( l)
258 Capítulo 5 Temas selectos del álgebra lineal numérica *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 259

elegimos un número complejo � tal que l�I = IIA 11 h y (A 1, �eOl ) sea real. Después, producto de todas las matrices unitarias que se han utilizado como factores. Dado que Q
hacemos v = a(A1 - �eOl) con a = V2/IIA 1 - �/1)112- Esta descripción admite dos es unitaria, A = QR, tal como se quería. Ésta es la factorización QR de Householder.
elecciones de �, y nosotros elegimos aquella para la que haya menos cancelaciones al La ecuación Q* = Un-1Un-1 . . . U 1 nos lleva a Q = Ui U2 · · · u;_1. Por la fonna
computar la primera componente de v. Para entender cómo se hace esto, escriba los de Uk,
números complejos � y a11 en forma polar: U k = Ik-1 O
[ O ln-k+l - vv*]
� = IJA 1 Jliil> a1 1 = la 11 Jei8 . podemos ver que U k es herrnitiana (U¡ = U k), por lo que
Tenemos que Q = U1 U2··· Un-1·
(A1 , �i1l ) = a11� = la 11 J IIA 1 l 2iHl.
Ejemplo Ilustramos la factorización QR con la matriz
Éste debe de ser un número real, de modo que 9 - � es O o 1t. Si elegimos 9 - � = 1t, la
primera componente de v no tendrá cancelación sustractiva, pues 63 41 -88
42 60 51
9-
A = [ O -28 56] .
- �) = a(la 1 iieí9 - l�lei( "l) = a( la 11I + l�l)e .
i8
V¡= a(a 11
126 82 -71
Así, definimos � de la siguiente manera: En el primer paso computamos �, el cual puede considerarse como - IJA 1 11 2 , pues A 1 es
real:
� = - JIAi[[2 ei8 = - IIAill2 a1 1 /Ja 11 J- � = - IIA 1 lli = -11(63,42,0,126fll2 = -147.
El algoritmo para construir la matriz U en esta primera etapa es el siguiente: Después computamos a:
1
a = V2/IIA 1 - �/ llJ2 = V2/IJ(210,42, O,126f ll2 = 2 lv70
1
� <- -(a 11/la 11 l)JJA 1 lh ¡;,;:¡ .

y <-A¡ -�e<I) Por lo tanto, el vector v viene dado por


a <- V2/JIYll2 V= a(A¡ - �i1)) = (10,2,0,6)7//fü.
V <-ay En este caso el primer factor unitario es
U <--1 - vv*. -15 -10 O -30
• 1 -10 33 O -6
U 1 = I - vv = [ O
Los pasos subsiguientes de la factorización QR son similares al primero. Después 35 O 35 O] •
de k pasos, habremos multiplicado A por la izquierda por k matrices unitarias, y el -30 -6 O 17
resultado será una matriz que tiene la fonna correcta en las primeras k columnas; es
decir, con ceros debajo de la diagonal. La situación se puede resumir escribiendo Ahora computamos el producto U 1 A como

!} ,
-5145 -3675 2940
uku k -1 ··. U1A = [ � U 1A = � [
O 1078 2989
.
35 O -980 1960]
donde J es una matriz triangular superior de k x k, O es la matriz nula de (m - k) x k,
o -196 1127
H es de k x (n - k) y W es de (m - k) x (n - k). Por el análisis previo, hay un vector En el segundo paso, los cálculos correspondientes son:
v E cm -k tal que I - vv* es una matriz unitaria de orden m - k con la propiedad de
que (J - vv*)W tiene ceros debajo del elemento inicial en su primera columna. Observe � = -11(30.8, -28, -5.6/112 = -42
ahora que
a = V2/Jl(72.8,-28,-5.6/IJ 2 = 0.018085
[� I -ºvv• ][� !] = [ � (/ - �v*)W]·
V= a(l.3[66, -0.50637, -0.10127)
7

En esta ecuación, el primer factor a la izquierda es unitario y lo denotamos con U k+l· -0.73333 0.66667 0.13333
El proceso termina cuando la columna (n - 1-ésima) de R queda en la fonna I - vv* = [ 0.66667 0.74359 -0.05128 ] .
apropiada. En ese momento tenemos una ecuación Q*A = R, donde Q* denota el 0.13333 -0.05128 0.98974
260 Capítulo 5 Temas selectos del álgebra lineal numérica
63 41 -88 ¡-·
*5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados

2 10 16 - -5
1]
261

[ ] -
14 -14 -7]
¡ 7
-
El segundo factor unitario es por consiguiente:

l
42 60 51 -6 -15 -12 -6 O -2
= o -5 11
l. o. o. o. -28 56 O O
o. -0.73333 0.66667 0.13333 12� 82 -71 -18 4 -1 10 O o o
U2 = o. 0.66667 0.74359 -0.05128
[o.

l
0.13333 -0.05128 0.98974 SERIE DE PROBLEMAS *5.3
y tenemos que l . Demuestre que six;: y y (xy), es real, entonces la matriz U = I - vu* es unitaria y satisface
-147. -105. 84. la igualdad Ux = y, donde v = x - y y u= 2 v/llvllf Explique por qué éste es un mejor
o. -42. -21.
método para construir las transformaciones de Householder.
U2U1A = o. O. 96.9231
. 2. Demuestre que si A es una matriz de m x n de rangon, entonces A•A es no singular.
[ o. O. 40.3846 3. Demuestre que si A es una matrizdem xn de rangon, entonces A*A es hennitiana y definida
positiva.
En el último paso, los cómputos correspondientes son:
'4. Programe el algoritmo de Gram-Schnúdt y el algoritmo modificado de Gram-Schnúdt, y
pruébelos para ver cuál es mejor. La primera prueba podría comprender una matriz de
� = -11(96.9231,40.3846)% = -105 20 x 10 con elementos aleatorios uniformemente distribuidos en el intervalo [O, !]. La
segunda prueba podría comprender una matrizde 20 x 1O con elementos generados por una
a= v2;11c201.9231, 40.3846)% = 0.0068677 función elemental como, por ejemplo,

V= (1.38675, 0.27735f .. _ 2i - 2I j-i


-( ) (1 � i � 20, 1 �j � 10).
ag -19-
• [-0.92308 -0.38462]
l - vv = -0.38462 0.92308
. En cada caso genere a partir de A una matriz B, cuyas columnas deberán ser ortonormales.
Examine BrB para ver cuan próxima es a la matrizidentidad. Para mayor información acerca

l
de las pruebas de este tipo, vea Rice (1966].
Por consiguiente, el tercer factor unitario es:
5. Sea { u1, u2, .•. , u.} una base ortonormal de un espacio X con producto interno. Demuestre
l. o. o. o. que parax, y E X,
n
o. l.
U3 = O. O. -0.92308 -0.38462
o.
.
o. (a) llxJJ� =¿i=l
1 (x,u;) J
2

[O. O. -0.38462 0.92308


(b) (x,y) = ¿(x,u;)(y,u;)
En este caso la matriz triangular superior Res: i=l

-
6. Sea X un espacio con producto interno, U un subespacio de X y {u1, u2, ... , u.} una base
-147. -105. 84.

5 4]
= 21 ¡-7
ortonormal de U. DefinaP: X .... U con la ecuación Px = ¿;;=1 (x, u;)u;. Demuestre que:
O. -42. -21. o -2 -1 (a)P es lineal
R=
o. o. -105. O O -5

l
(b) P es idempotente (es decir, P2 = P)
[ o. o. O.l O o o (c)Px=xpara todax E U
(d) jjPxJl2 � Jlxll2 para todax E X
Por último,
(La transformación P se llama proyección ortogonal de X sobre U.)
-0.42857 -Q28571 o. -0.85714

¡-·
7. ¿A qué es igual el determinante de una matriz unitaria? ¿A qué es igual el determinante de
una matriz ortogonal?
*_
Q -
U3 U2 U1
_
-
¡ 0.09524 -0.71429 0.66667 0.19048
0.47619 -0.57143 -0.66667 -0.04762 8. ¿Qué condición es necesaria y suficiente para que un conjunto ortogonal sea linealmente
-0.76190 -0.28571 -0.33333 0.47619 independiente? Demuestre que todo conjunto ortonormal es linealmente independiente.

-6 O -18 9. Sean u y x fijos. ¿Qué valor de t hace que Jiu- ttll 2 sea un núnimo? (La respuesta debe de
ser válida en el caso complejo.)
1 2 -15 14 4
-1 ]
= . 10. Demuestre que la matriz con elementos (x,; YÚ es unitaria cuando {x1,x2, ... ,x.} y {y1,
21 10 -12 -14 y2, . . . , y.} son bases ortonormales de C".
-16 -6 -7 10
11. Una matrizA se llama involución o se dice que es involutoria cuando A2 = l. Encuentre
Podemos verificar que A = QR; es decir, una condición necesaria y suficiente para que una matrizI - uv* sea una involución.
262 Capítulo 5 Temas selectos del álgebra lineal numérica *5.3 Factorizaciones ortogonales y problemas de mínimos cuadrados 263

12. Sea v*v = 2. Demuestre que la matriz particionada c23. (Continuación) Escriba una subrutina o procedimiento para resolver un sistema de ecua­
ciones Ax = b en el sentido de los mínimos cuadrados. Este procedimiento deberá hacer
llamados, es decir, referirse a el procedimiento del problema anterior.
[� l-ºvv·] 24. Demuestre que al resolver el problema de los mínimos cuadrados para la ecuación Ax = b,
podemos reemplazar las. ecuaciones normales por CAx = Ch, donde Ces cualquier matriz
es una involución. (Véase el Prob. 11.)
de n x m equivalente de filas a Ar.
13. ¿Es el producto de dos matrices involutorias una involución?
25. Sea A una matriz de m x n de rango n. Sea b cualquier punto de IRm . Demuestre que los
14. Si U y V son matrices unitarias, ¿se sigue de ello que conjuntos
K,. = {x E llt': [[Ax- b[[2 � A}

[g i] son cerrados y acotados. (Las normas en IRm y JR" pueden ser arbitrarias.)

es unitaria? 26. (Continuación) Asuma las mismas hipótesis que en el problema anterior. Demuestre que
si A = 2[[b[[2, entonces
15. (a) Demuestre que el conjunto de matrices unitarias (de un orden dado) es un grupo multi­ ínf [[Ax- b[[2 = ínf [[Ax - b[[2.
plicativo. xEltn :EKt

(b) Demuestre que el conjunto es cerrado bajo las operaciones A .... Ar, A* y A. 27. (Continuación) Si A es una matriz de m x n de rango n, entonces la solución en mínimos
16. Utilice el algoritmo de Householder para determinar la factorización QR de cuadrados de Ax = b satisface la desigualdad

[ -�O -�-4]
[[x[[2 � 2[[b[[2 [[Bl[2,

donde B es cualquier inversa izquierda de A. Aquí se utiliza la norma vectorial euclidiana


en JR" y JRm , y [IB[[ 2 denota la correspondiente norma matricial subordinada.
17. Demuestre que si Q es unitaria, entonces para todo x y todo y, 28. Sea A una matriz de m x n de rango no especificado, b E JRm y

[\x[\2 = [[Qx\[2 y (x,y ) = (Qx, Qy) p = ínf{l[Ax- b[[ : X E JR"}.


De este modo, Q (cuando se considera como una transformación) preserva longitudes, dis­ Demuestre que este ínfimo sí se alcanza. En otras palabras, demuestre que existe un vector
tancias y ángulos en el espacio euclidiano. Compute \\Q [\2 utilizando la norma matricial x tal que [[Ax- b[[ = p. La norma, definida en JRm, es arbitraria en este problema.
subordinada a la norma euclidiana.
29. (Continuación) Adopte las suposiciones del problema anterior para demostrar que la ecua­
18. Demuestre que A es unitaria si y sólo si sus filas constituyen un conjunto ortonormal. (Aquí
A es una matriz cuadrada.) ción A rAx= Arb tiene solución. No suponga nada acerca del rango de A.
30. Demuestre que para todo sistema de ecuaciones Ax = b, el sistema A rAx = Arb tiene
· 19. Sea A una matriz de m x n, b un vector de m x 1 y a. > O. Utilizando la norma euclidiana, solución. No suponga nada acerca de las magnitudes relativas de m y n, ni acerca del rango
defina:
F(x) = [[Ax- b[[� + a.[[x[\�. de A.

Demuestre que F(x) alcanza un mínimo cuando x es una solución de la ecuación 31. Dé un ejemplo de vectores x y y para los cuales (x, y) � O y [[x + y[[ i = [[x[[i + IIYll?-

r
32. Sea AB = Q donde Q es de m x n, B de n x n y Q*Q = l. Demuestre que QQ* es la
(A A+al)x=Ar b. proyección ortogonal de IRm sobre el rango de A. (Véase el Prob. 6.)

Demuestre que cuando x se define de esta manera, 33. Encuentre la solución en mínimos cuadrados del sistema

F(x+h) = F(x)+(Ah{ Ah+a.hr h.


3 2 ¡]
[x y] [2 3 2 = [ 3 O l].

20. Sea Duna matriz diagonal y U una matriz unitaria. ¿Qué hipótesis adicionales sobre D se
necesitan para inferir que DU es unitaria? 34. Se afirma que en el problema precedente la solución es (29/21.-1/3( ¿Cómo se puede
verificar esto sin resolver el sistema para x y y?
21. Si U y AU son unitarias, ¿qué se puede concluir acerca de A?
35. Sea A una matriz de (n + 1) x n y rango n, y sea z un vector no nulo ortogonal a las columnas
'22. Escriba una subrutina o procedimiento que lleve a cabo el algoritmo modificado de Gram­ de A. Demuestre que la ecuación Ax + A.z = b tiene una solución en x y A. Demuestre
Schmidt. El dato de entrada de la subrutina será una matriz A de m x n de rango n, y los además que el vector x que se obtiene de esta manera es la solución en mínimos cuadrados
datos de salida serán las matrices By T. de la ecuación Ax = b.
1

L
264 Capítulo 5 Temas selectos del álgebra lineal numérica *5.4 Descomposición en valores singulares y seudoinversas 265

36. Para mostrar el efecto de los errores de redondeo cuando se usa el método de Gram-Schmidt Demostración La matriz A•A es una matriz hermitiana de n x n. También es semidefinida positiva,
no modificado, Noble y Daniel (1977] dieron el siguiente ejemplo. Sea E un número positivo pues
muy pequeño, tal que 1 + E y 3 + 2E son números de máquina, pero 3 + 2E + e2 se computa x'(A.A)x = (Ax)*(Ax);;; O.
como 3 + 2E. Aplique el proceso de Gram-Schmidt a los 3 vectores:

V¡ = (1 +e, 1, J{ v2 = (1, 1 +E, 1{ V3 = (1, l, J +el. ot


Resulta de lo anterior que los valores propios de A•A son no negativos. 01éase el Prob.
42.) Denotémoslos con cri, ... , cr;. (Nota: en esta lista, cada crf se repite según su
multiplicidad como raíz de la ecuación característica.) Además, la lista está ordenada de
Compruebe que la supuesta base ortonorrnal producida por la computadora es modo quecrf, cr�, ... , cr; son positivos ycr;+1 ,cr�+2' • • • , cr; son cero. Sea {u1, u2, • • • , u.}
un conjunto ortonormal de vectores propios de A* A, dispuestos de modoque
X¡= [ljv3 + 2z]V¡ x2=[J/V2](-l, l, 0)7 X3 =[JV2](-J, 0, Jf
A*Au¡ = cr¡u¡.
Note que (x2, xJ) =f.
Entonces
37. ¿Cuáles son las operaciones elementales con las filas de un sistema Ax = b que dejan [[Au¡j[� = u;A*Au¡ = u;crfu; = cr¡.
inalteradas las soluciones en mínimos cuadrados?
Esto nos muestraque Au; = O cuando i ;;; r + l . Observe que
38. Sea A una matriz de m x n, con m > n. Suponga que A tiene una factorización QR, A = QR.
Sea Q' la matriz de m x n que se obtiene al eliminar las últimas m - n columnas de Q, y sea
R' la matriz de n x n que se obtiene al eliminar los últimos m - n filas de R. Demuestre que r= rango(A*A) � mín{rangoA*, rangoA} � mín{m, n}.
A= Q'J?!.
Ahora fonnamos una matriz Q de n x n cuyas filas son uj, u2, . . . , u� y definimos
39 . Proporcione todos los detalles del siguiente método para obtener la factorización QR de una
matriz A de m x n. Denote con Aj, Qj y Rj lasj-ésimas columnas de A, Q y R respectivamente. V¡=cr;- 1Au; (1 � i � r).
Demuestre que Aj�= rkjQk y que rkj = (Aj, Qk). Utilice esta ecuación para determinar
Q1 y r11, y demuestre cimo se obtienen Qj y Rj una vez que se conocen Qr, Q2, ..., Q¡ r y Los vectores v; fonnan un sistema ortononnal, pues para l � i,j � r tenemos que
Rr, R2, ..., R¡-1. -
40. Encuentre la factorización QR de la matriz v;vj = cr¡- 1 (Au¡ )*crj- 1 (Auj) = (cr;O'j)- 1 ( u7A*Auj) = (cr;crj)- 1 ( u;crJuj) = O¡j.

[3 2 3]
Elegimos vectores adicionales V¡ de modoque {V¡, v2, ..., vm} sea una base ortonormal
4 5 6 · de c . Sea P la matriz de m x m cuyas columnas son v 1, v2, ..., V . Sea D la matriz de
m
m

m x n que tiene cr1, cr2, ... , cr, en la diagonal y ceros en los lugares restantes. En tal
41. Programe y ponga a prueba la factorización de Householder.
e caso
42. Determine Koo(A) y K00 (A.A) utilizando las matrices de la ecuación (10). ¿Qué sucede A=PDQ.
cuando e --+ O? Para demostrar esto vamos a ver que

P*AQ* = D.

*5.4 Descomposición en valores singulares y seudoinversas En efecto,


(P*AQ * )ij = v;Auj.

La descomposición en valores singulares es otra factorización matricialque tiene muchas Cuandoj ;;; r+ l , esto es igual a cero. En cambio, sij � r, el término es v1crjVj = O'jOij .
aplicaciones. Comenzamos su estudio con un teoremaque describe su fonna y asegura 1111
su existencia.
Los números cr 1, cr2, ... , cr. (que se toman no negativos) son llamados valores sin­
TEOREMA 1 Toda matriz compleja A de m x n se puedefactorizar en la forma gulares de A. Son, por consiguiente, las raíces cuadradas no negativas de los valores pro­
pios de A•A. La factorización A = PDQ del teorema anterior es una descomposición
en valores singulares.
A=PDQ, Observeque en la demostración hay algunos pasos en losque se hicieron elecciones
arbitrarias. Por ejemplo, el ordencr1, cr2, ... , crres arbitrario, y los vectores Vi+!, V¡+2, ••• ,
donde P es una matriz unitaria de m x m, D una matriz diagonal de m x n y Q una Vm dan lugar a cierta elección. Por consiguiente, una matriz siempre tendrá muchas

matriz unitaria de n x n. descomposiciones en valores singulares.


266 Capítulo 5 Temas selectos del álgebra lineal numérica *5.4 Descomposición en valores singulares y seudoinversas 267

º]
Ejemplo 1 Encuentre una descomposición en valores singulares de la siguiente matriz: Hay cierto grado de libertad en la elección de v3 y v4• La más simple es
= (0 = (O

l
7OO V3 1,
O,, O)* V4 O, 1 )*.
, O,

º] [ º] [º
A O
[ 3OO .
=

o o o o De este modo, una descomposición en valores singulares es:


o 1- .60.6 0.6 0.8O 1 o
Respuesta Tenemos que
O 1.20.8 = 0.8 -0.6 o o o 2O O1
49OOO
[o o o ] [ o
o o1O O o o 1 -1o Oo] . 1111

AA [
O 9OO
OOOO
= . o o o o oO1 OO o
o o o o
Seudoinversa
1 7 , o-2 =
Así, o-= 3 O y o-=
3, o-= 4 O. Siguiendo la demostración del teorema,

º] º] º]
formamos las matrices: Para las matrices de m x n de la forma
1 OO O"¡
1O 7OO 0-2
p= [ o ¡ o Q O 1 OO
D = O
[ 3OO [ O1 O .
=

O O 1 o o o o O
OOO1 D= O"r
o

º ] [� º]
El lector podrá verificar que otra descomposición en valores singulares de A es

7OO 1 3OOº ] [º
¿ o o
.
º] o
11 donde cr; O,
> definimos la seudoinversa como la matriz den x m
o
0300=10
[ O 0700
[ 00O1
OOOO OO -1 OOOO -1
OO1 O O"¡
-1
O"z
Ejemplo 2 Encuentre una descomposición en valores singulares de la matriz
o -1.6o.6 D+
= cr-r 1
O 1.20.8 o
[ o o o] .
o o o o

º]
Respuesta Seguimos nuevamente la demostración del teorema. Encontramos que En ambos casos, los elementos de la matriz que no se muestran son ceros. La seudoin­
versa de una matriz general A se define tomando primero una descomposición en valores
o o singulares
[ 4O
A*A=O A PDQ,
=

O O 1
para después poner
+
y hacemos o-=1 1, o-=
2 2 y o-=
3 O. (Hayotro orden posible.) Eligiendo vectores
A
= Q*D +P*.
propios y formando Q, tenemos que ( ntre
e otras elecciones posibles) Más adelante veremos que aunque la descomposición en valores singulares no es única,
o o 1] la seudoinversa de una matriz sí lo es.
[ 1
Q O
= - O Ejemplo 3 ¿Cuál es la seudoinversa de la matriz A del ejemplo
1?
1 OO

!]
Respuesta Como en este ejemplo P Q
y son matrices identidad, resulta de inmediato que:
y
r1 o
= Au=
V¡ ¡ 0
( 0.8,
.6, O,
O)*
O r1
A+ [
= �Au2 = 0
o o
= 1111

v2 ( .8,0
- O,
.6,O)*. o o
268 Capítulo 5 Temas selectos del álgebra lineal numérica *5.4 Descomposici6n en valores singulares y seudoinversas 269

Ejemplo 4 Encuentre la seudoinversa de la matriz A del ejemplo 2. En la medida en que x recorre todo en, también y lo hace, pues Q es suprayectiva; es
Respuesta Los resultados del ejemplo 2 nos dan:
decir, se transforma C" sobre e•. Por consiguiente:


O l l O o º º' 08 00]
0.8 -0.6 O O
p = ínf JJAx -bJJ2 = ínf JJPDQx -bJJ2 = ínf JJ?*(PDQx -b)JJ2
A+= O -1 O ][O 0.5 o O l[ = ínf JJDQx -?*bJJ2 = ínf JJDy-cJJz.
X X

O
X

1 O O O O O o O 1 O
O O O 1
X

º] Ahora, por la naturaleza misma de la matriz D, tenemos:


y

o o o
= [-0.4 0.3 O O
0.6 0.8 O O JJDy-cJJ� = ¿(cr;y; - d + ¿ e¡.
111 m

i=l i=r+l

Esta cantidad se minimiza tomando y;= c¡/cr; para 1 � i � r y permitiendo que Yr+l,
Sistemas inconsistentes y sistemas indeterminados
Las seudoinversas se aplican principalmente a sistemas de ecuaciones inconsistentes Yr+2 , ..., Yn tomen valores arbitrarios. Así,
o que tienen soluciones no únicas. Considere un sistema de ecuaciones escrito en forma
matricial como:
p=
( m )1/2

Ax=b,
donde A es de m x n, x es de n x 1 y b es de m x l. Se define la soluci6n mínima del
i�/

sistema como sigue: Entre todos los vectores y que dan un valor mínimo p, el de menor norma corresponde
a Yr+l = Yr+2 = · · · = Yn = O. Este vector viene dado por
(a) Si el sistema es consistente y tiene una única soluciónx, la solución mínima
esx.
(b) Si el sistema es consistente y tiene un conjunto de soluciones, la solución
y =D+c.

mínima es el elemento que tiene la menor norma euclidiana Por lo tanto, la solución mínima a nuestro problema es:
(c) Si el sistema es inconsistente y tiene una solución únicax en mínimos cuadra­
dos, la solución mínima esx. X=Q*y = Q*D+ c = Q*D+rb=A+b. 11111

(d) Si el sistema es inconsistente y tiene un conjunto de soluciones en mínimos La seudoinversa juega el mismo papel respecto de los sistemas inconsistentes o
cuadrados, la solución mínima es el elemento que tiene la menor norma eucli­ indeterminados que la inversa respecto de los sistemas invertibles. Cabe señal·.rr que la

¡
diana. solución mínima de cualquier ecuación Ax=b es única, pues el conjunto K es convexo
Una definición alternativa es la siguiente. Sea y tiene un único elemento con norma mínima.

p = ínf{JJAx -bJJ2:x E C"}. Ejemplo 5 Encuentre la solución mínima del sistema

En tal caso, la solución mínima de la ecuación Ax = b es el elemento del conjunto Ox-l.6y+0.6z= 5


K = {x: JJAx -bJJ2 = p} que tiene la menor norma. Podemos ver de inmediato que Ox+ 1.2y+0.8z = 7
esta definición abarca los cuatro casos anteriores. Por ejemplo, si p = O, tenemos los
casos (a) y (b), mientras que los casos (c) y (d) corresponden a p > O. Ox+ Oy+ Oz= 3
Ox+ Oy+ Oz = -2
TEOREMA 2 La solución mímina de la ecuación Ax = b viene dada por la seudoinversa:
Respuesta La matriz de coeficientes es la matriz del ejemplo 2, y su seudoinversa se encontró en el
x=A+ b. ejemplo 4. Por lo tanto, la solución mínima es
5
Demostración Sea A = PDQ una descomposición de A en valores singulares. Sean O O O O
A+ b = [-0.4 0.3 O O] [ ; l = 0.1 . [º·º ] 11
y 0.6 0.8 O O 8.6
e=?*b y=Qx. -2
270 Capítulo 5 Temas selectos del álgebra lineal numérica *5.4 Descomposición en valores singulares y seudoinversas 271

Propiedades de Penrose De lo anterior se sigue que


La seudoinversa comparte algunas propiedades con la inversa, mas no todas. Por DD+D= D.
ejemplo, no podemos esperar que A+A = I sea cierto para n > m, pues A+,A, y A+A Para ver que así es, escribimos
son a lo más de rango m, mientras que I es de n x n. Sin embargo, una ecuación
como AA+A=A es cierta para una A arbitraria. El siguiente teorema se ocupa de tales n m
ecuaciones en forma general. (DD+ D);j=¿Div ¿D�µ Dµj-
v=l µ=!
TEOREMA 3 Para cada matriz A hay a lo más una matriz X con las cuatro propiedades siguientes:
Debido a la presencia de los términos Div y Dµj la parte derecha de la igualdad es cero,
(i) AXA=A (iii) (AX)*=AX a menos que i � r y j � r. De esta manera, podemos suponer que i � r y que j � r y
(ii) XAX=X (iv) (XA)* = XA continuar, simplificando la parte derecha de la igualdad de la siguiente forma:
r r r
Demostración Sean X y Y dos matrices que tienen las propiedades (i) a (iv). Utilizando estas propiedades 1
en forma sistemática tenemos: ¿Div ¿D�µ Dµj=cr¡ ¿DtDµj=cr¡cr1 Dij=Dij.
v=l µ=! µ= l

X=XAX (ii)
Con un razonamiento similar demostramos que v+ tiene las otras tres propiedades de
= XAYAX (i) Penrose en relación a D. Después, es muy fácil demostrar que A+ tiene las cuatro
=XAYAYAYAX (i) propiedades. Por ejemplo, la primera de ellas se demuestra como sigue:
=( XA)*( YA)*Y(AY)*(AX)* (iv) y (iii)
AA+A=PDQQ*D+P*PDQ
=A*X*A*Y*YY*A*X*A*
=(AXA)*Y*YY*(AXA)* =PDD+DQ
=A*Y*YY*A* (i) =PDQ=A.
= ( YA)*Y(AY)*
Las propiedades restantes se dejan como ejercicio para el lector. 11111
= YAYAY (iv) y (iii)
= YAY (ii)
Teoremas sobre la descomposición en valores singulares
=Y (ii) 111
TEOREMA 5 SiA tiene una descomposición A=PDQ en valores singulares tal como se describe en
Este teorema fue enunciado por R. Penrose [1955], y las condiciones (i)-(iv) se el teorema 1, entonces
conocen como las propiedades de Penrose. (a) el rango de A es r
(b) {u,+1, Ur+2, ... , un} es una base ortonormal del espacio nulo de A
TEOREMA 4 La seudo inversa de una matriz tiene las cuatro propiedades dePenrose. Por consiguiente,
cada matriz tiene una única seudoinversa. (c) {v 1, v2, ..., v,} es una base ortonormal del recorrido de A
(d) IIAll2=máx1�i�n lcrd
Demostración Sea A una matriz y sea
A=PDQ Demostración Puesto que P y Q son no singulares, A y D tienen el mismo rango, que es r.
Sir < i � n entoncesAu, = O, como se demostró en el teorema l. Dado que el rango
su descomposición en valores singulares. Se sigue que
de A es r, el espacio nulo de A tiene dimensión n - r. Por lo tanto, { u,+1, u,+2, •.• , un }
es una base del espacio nulo.
A+= Q*D+P*.
Como el rango de A es r, su imagen tiene dimensión r también. Tal como se
Si A es de m x n, también D lo es y tiene la forma demostró en el teorema 1, v ¡ = cr ;- 1Au, y {v1, v2, ... , v,} es una base ortonormal de la
imagen de la matrizA.
_ { CJ¡ si i=j � r En vista de que P y Q son matrices unitarias, operan como isometrías (es decir,
D9·· - mapeos que preservan la norma de un vector) sobre cm y en respectivamente. Por
O de lo contrario.
272 Capítulo 5 Temas selectos del álgebra lineal numérica *5.4 Descomposición en valores singulares y seudoinversas 273

consiguiente, Ahora la ecuación A = PDQ nos lleva a P*AQ* = D. La matriz D es diagonal,


de m x n, y tiene en la diagonal a los valores singulares de A, cr 1, cr2, ..• , cre, donde
IIAll 2 = sup{IIA xll 2 : ll xll2 = 1} e= mín(m, n). Por consiguiente,
= sup{II PDQxll2: ll xll 2 = 1} e
Luk = ¿ Dksv, = { O"k Vk sik �
= sup{IIDYll 2: IIYll 2 = 1} o si > e
11
s=l
k

= sup { v(cr¡y¡)2 +· · · +(O-nYn)2 : IIYll 2 = 1}

'f,r; =
SERIE DE PROBLEMAS *5.4
= . 1 sup {crIYf + · · · +cr�y�: 1} l. Encuentre las descomposiciones en valores singulares de las matrices siguientes:
4
º]
1=!

[Oo OoO 7o
o o o
[2 1]
[_¡J.
= máx lcrd 11 2. Encuentre las soluciones núnimas de los siguientes sistemas de ecuaciones:
!�i�n

=
Una interpretación geométrica de la descomposición en valores singulares es inhe­
(a) x1 +x2 b1 4X¡ :b¡
=
rente a la demostración del teorema l. En el siguiente teorema se expone una interpre­
X¡ =b¡ Ox1 b2
(b) {x1=b2 (c) ?xi= bi
{
tación más fácil de visualizar. X¡ =b¡ Ox2 = b4
TEOREMA 6 Sea Luna transformación lineal de cm en IC". Hay bases ortonormales {u1, u2, ••• , um } 3. Encuentre A en el caso en que AA• es invertible.
+

de cm y {V¡, Vz, .. :' Vn} de C", de manera que 4. Encuentre A• en el caso en que A' A=l.
5. Encuentre A+ en el caso en que A es hermitiana e idempotente; es decir, A' = A y A2 = A.
Lu·' =
cr;v; si·1<
= ·<= mm
'(m, n)
6. Demuestre que si A es hermitiana también A+ lo es.
{
1
O si mín(m, n) < i � m
7. Si A es hermitiana y definida positiva, ¿cuál es su descomposición en valores singulares?
Demostración Sea {e1, e2, ••• , em } la base usual de cm y {e¡, ez, ... , en} la de C". Defina la matriz A de 8. Demuestre que la seudoinversión es una función discontinua de una matriz.
m x n por medio de la ecuación Le¡ = 'f,J=i A;¡e¡ , 1 � i � m. Elija una descomposición 9. Si A es hermitiana, ¿cuál es la relación entre sus valores propios y sus valores singulares?
en valores singulares de A, digamos A = PDQ. Denote las filas de P* con u1, u2, ••. , Um 10. Demuestre las siguientes propiedades de la seudoinversa:
y las columnas de Q* con v1, v2, .•. , vm . Como veremos, Lu¡ = cr¡v;, donde los cr¡ son (a) A* =A
los elementos diagonales de la matriz D de m x n. He aquí los cálculos que demuestran
(b) A+' =A'+ .
lo anterior. Sea k una variable entera que toma valores entre 1, 2, .. . , m. En tal caso,
11. Demuestre las siguientes propiedades de la seudoinversa:
(a) (AA't=A+•A+
luk = L (t(ub e¡)e¡) = t(uk, e;)le¡ (b) A+ =A'(AA't
12. Demuestre, mediante un ejemplo apropiado, que en general (ABt ;= s+ A+.
13. Demuestre: Teorema. Si A es una matriz de m x n y de rango r, con m ;;;; n ;;;; r, entonces A
¿¿(f*)kiAge
n m

= ¿(P*)k;¿ A;¡e¡ =
m n

se puedefactorizar en laforma A = VSU, en donde V es una matriz de m x r con columnas


ortonormales, S es una matriz diagonal de r X r no singular y U es una matriz de r x n con
¡

filas ortonormales. (Ésta se llama la versión económica de la descomposición en valores


i=l j=l j=l i=l

singulares.)
n n

=¿(f*A)kjé¡ =¿(P*A)k¡¿(e¡, v,)v,


n

j=l j=l s=I 14. Refiérase al teorema 1 y demuestre que


n

= ¿¿(P*A)k¡(Q*)¡,v, = ¿(P*AQ*)ks v,. A=¿crjvjuj


n n

s=l j=l s=I j=I


274 Capítulo 5 Temas selectos del álgebra lineal numérica *5.5 El algoritmo QR de Francis para el problema de los valores propios 275

15. Sea A una matriz de m x n de rango r, con m f n f r y descomposición en valores 33. Demuestre que la proyección ortogonal de cm sobre el espacio columna de A es AA+ .
singulares A = PDQ. Demuestre que el sistema de ecuaciones Ax = b es consistente si y 34. Demuestre que si A es simétrica, también A+ lo es.
sólo si (P*b), = O parar< i � m.
35. Demuestre que si A y B son de rango completo entonces (AB/ = B+A+ . Una matriz A de
16. Sea A una matriz de m x n de rango r. Defina u,, v, y cr, igual que en la demostración del m x n tiene rango completo si rango(A) = mín(m, n).
teorema l.Demuestre que
36. Encuentre la seudoinversa de uv', donde u y v son elementos de IC".
� cr¡-1 u¡v¡•.
A+ = �
37. Encuentre la seudoinversa de una matriz de m x n en la que todos los elementos son l.
i=l
38. Utilice el teorema de Penrose para demostrar que si B , C y B C son de rango r, entonces
(Compare con el Prob. 14.)
17. Utilice el resultado del problema 14 para demostrar que si se tiene disponible una descom­ (BC)' = C* (CC*)-1(B'B)-1B*,
posición de A en valores singulares, entonces Ax se puede computar con un costo adicional donde B es una matriz dem x r y C es una matriz der x n.
de (n + m + l)r multiplicaciones y r(n + m - 1) - m adiciones. Compare este resultado con
la multiplicación directa, que cuesta nm multiplicaciones y (n - l)m adiciones. 39. Demuestre que los valores propios de una matriz semidefinida positiva son no negativos.
1 8. Demuestre que si A es hermitiana y semidefinida positiva, entonces sus valores propios son '40. Escriba un programa para la computadora que encuentre la solución mínima de un sistema
idénticos a sus valores singulares. de ecuaciones Ax = b, utilizando la descomposición en valores singulares y la seudoinversa.
19. Demuestre que si dos matrices son unitariamente equivalentes, entonces sus valores singu­
lares son iguales. (Dos matrices A y B son unitariamente equivalentes si A = UBV, con
U y V matrices unitarias.)
20. Sea A una matriz den x n con valores singulares cr1, cr2, ... , cr •. Demuestre que el determi­
*5.5 El algoritmo QR de Francis para el problema de los valores propios
nante de A es
det(A) = ±cr1cr2... cr. En la sección 5.2 demostramos el teorema de Schur, según el cual cualquier matriz
21. Denote con [[A[[ 2 la norma matricial subordinada a la norma vectorial euclidiana. Sean cuadrada es semejante unitariamente a una matriz triangular. Esto posibilita una facto­
cr1 f cr2 f . . . f cr •. Los valores singulares de A demuestre que [[A[[2 = cr1. rización del tipo
22. Sea A una matriz cuadrada con descomposición en valores singulares A = PDQ. Demuestre UAU* = T, ( 1)
que el polinomio característico de A es ± det(D -\f*Q*). en donde U es unitaria y T es triangular. Dado que los valores propios de A y T son los
23. Sea A una matriz de m x n, y sea X una matriz de n x m que tiene las cuatro propiedades de
Penrose con relación aA. Demuestre que la solución minima del sistema Ax= bes Xb.
mismos, y en virtud de que los valores propios de una matriz triangular son simplemente
los elementos sobre la diagonal, encontraremos los valores propios de A escritos en
24. Demuestre que si A es real, tiene una descomposición real en valores singulares y una la diagonal de T. Aunque sabemos que la factorización (1) existe para toda matriz
seudoinversa real. A, computarla no es sencillo. Encontrar U debe ser tan difícil como encontrar todas
25. Si la suma en el problema 14 se trunca después de k sumandos, lo que queda es una aproxi­

t
las raíces (complejas) de un polinomio de grado n, pues en realidad lo que estamos
mación de A. Demuestre que el error que deriva del truncamiento satisface computando son las raíces del polinomio característico de A. Por el problema 3, todo
polinomio es (salvo múltiplos escalares) el polinomio característico de una matriz.
\\A - cr¡Y¡U¡11 = crk+!,
2 Factorización QR
donde la normal matricial utilizada es la subordinada a la norma vectorial euclidiana. El algoritmo QR de Francis [1961] es un procedimiento iterativo concebido para
26. Demuestre que los cuadrados de los elementos de v,u1 suman 1. (La notación es la utilizada revelar los valores propios de A produciendo la matriz T de la ecuación (1). Como se
en la demostración del teorema l.) puede inferir de su nombre, el algoritmo hace uso de la factorización QR. Por ahora,
27. Sean U una matriz unitaria de m x m, V una matriz unitaria de n x n, D una matriz diagonal de todas las matrices serán de n x n.
m x n y A = UDV. Demuestre que los números [du[ ( 1 � i � n) son valores propios En la sección 5.3 se desarrolló un algoritmo para producir una factorización
deA'A.
2

28. Demuestre las tres propiedades restantes de Penrose paraD+.


A=QR, (2)
29. (Continuación) Complete la demostración del teorema 4. donde Q es unitaria y R es triangular superior. En esta ocasión vamos a requerir que
30. Demuestre que si una matrizA de m x n tiene rango n, entoncesA+ = (A'Ar 1A*. la diagonal de R sea no negativa, lo que constituye un refinamiento del algoritmo en
31. Demuestre que la seudoinversa de una matriz diagonal de m x n es una matriz diagonal de
cuestión. Este arreglo es muy sencillo. De hecho, si en la ecuación (2) R no tiene una
n x m. diagonal no negativa, podemos definir cierta matriz diagonal unitaria D y sustituir la
32. Encuentre las seudoinversas de una matriz cualquiera dem x 1 y de una matriz arbitraria de
ecuación (2) por
1 X n. A = (QD)(D*R) = QR (3)
276 Capítulo 5 Temas selectos del álgebra lineal numérica
*5.5 El algoritmo Q R de Francis para el problema de los valores propios 277

La definición de D = diag(d¡¡) debería ser: La reducción de A aH por medio de transformaciones de semejanza unitarias utiliza
un algoritmo de Householder.En el primer paso, la primera columna se lleva a la forma
/l apropiada En el segundo paso, la segunda columna se lleva a la forma apropiada, y
d ¡¡ = { �¡ r¡¡J Si ru = 0
Sir¡¡;,: Ü
así sucesivamente. Permí.tanos describir el k-ésimo paso. Al comienzo del paso k,
las columnas de la 1 a la k - I tienen la forma correcta para una matriz superior de
Es fácil verificar que D es unitaria y que R= D*R tiene una diagonal no negativa Hessenberg. Dividamos de la siguiente manera la matriz parcialmente reducida, donde
El algoritmo QR en su forma básica es el siguiente: las dimensiones se indican por encima y a la izquierda de la matriz:

k n-k
A1 +-A
for k= 1, 2, ..., M do
k
n-k [i � l
factorización Q R: Ak = QkRk , donde Qk es unitaria
y Rk es triangular superior con diagonal no negativa Aquí, Bes una matriz superior de Hessenberg de k x k. La matriz Des de (n - k) x k, y
tiene ceros en todas partes excepto en la k-ésima columna. La matriz Ces de k x (n -k),
Ak+I +-RkQ k
y la matriz E es de (n - k) x (n - k). Las dos últimas matrices no tienen ninguna
end estructura especial. Sea U una matriz unitaria de ordenn - k. En tal caso
Si las circunstancias son favorables, la diagonal de Ak converge ( cuando k -, oo) a un
vector cuyas componentes son los valores propios de A.
[/ O] [B C] [/ O] [
O U D E O U*
=
B
UD UEU*
CU*] . (4)
En la práctica, el algoritmo QR básico se combina con varios procedimientos adi­
cionales para economizar la aritmética y acelerar la convergencia. Esto lo vamos a
examinar de inmediato. Primero, observamos que todas las matrices Ak producidas en Seleccionaremos a U de modo que UD tenga en la k-ésima columna un vector
el algoritmo son unitariamente semejantes a A. Esto resulta de la ecuación (fl, O, O, ..., O/. Observe que la forma de la matriz Des

Ak = QkRk= (Q kRk)(Q k Q;) = QkAk+iQZ.


[o o d1 1
0 0 d2
D= . . .
Segundo, hacemos notar que cuando la matriz A es real, las matrices subsiguientes
Ak también son reales. Así, si A tiene algunos valores propios que no son reales, sólo O O dn�k


podemos esperar, en el mejor de los casos, que Ak converja a una matriz "triangular" con
submatrices de 2 x 2 sobre su diagonal. Por lo tanto, basta con determinar U de modo que

Reducción a la forma superior de Hessenberg


Ud= �/1) donde d= [ �:
Para reducir el número de cálculos aritméticos comprendidos en la iteración QR,
primero se reduce la matriz A a la forma superior de Hessenberg por medio de una serie dn-k
de transformaciones de semejanza unitarias. Una matriz superior de Hessenberg es una
matriz H en la que hij = O cuando i > j + l. Así, H es de la forma donde een denota al primer vector unitario estándar de cn-k. En el producto UD, las
* * * primeras k-1 columnas serán automáticamente cero, y la k-ésima columna tendrá ceros
* * * * * debajo de el elemento�-
* * * * * * * *
* * * * Utilizando el lema 2 de la sección 5.2, podemos ver que� debería elegirse de modo
o * * * que (d,�eOl ) sea real y que ll�1PlJJz= lldllz. Hacemos
o o * * * * * *
\
H= : U = I - vv* donde v= a(d -�/1)) (5)
o o o o * * * *
o o o o * * * * habiendo elegido�= -(di/ld1i)lldll 2 y a= v2/l/d -�/1lll2- (Estos detalles provie­
o o o o o * * * nen de la demostración del susodicho lema y de la explicación de la factorización de
o o o o o o * * Householder que se dio en la sección 5.3.)
278 Capítulo 5 Temas selectos del álgebra lineal numérica *5.5 El algoritmo QR de Francis para el problema de los valores propios 279

Ejemplo 1 Vamos a reducir la siguiente matriz a la forma superior de Hessenberg por medio de Llevando nuevamente a cabo la ecuación (4), obtenemos finalmente la matriz superior
transformaciones de semejanza unitarias: de Hessenberg

tl 1 m
l. -5. -1.5395 -1.2767
-6. 8.5556 0.10848 3.6986
H= [ .
O. -5.9182 -2.1689 - l.!428]
[ [l]

A= [i] O. O. -0.14276 3.6133


Observe que ya hemos dividido la matriz A en la forma requerida por el primer paso del Aunque los cálculos se hicieron con una computadora similar a la MARC-32 con siete
procedimiento recién descrito. Inicialmente, tomamos d = (4, 2, 4f. En virtud de que dígitos significativos, los resultados se han redondeado para exponerse aquí. 1
la primera componente es real, tomamos simplemente�= -lldll2 = -6 y a.= 1/v60.
Utilizando la fórmula (5), obtenemos Factorización QR con desplazamientos
La siguiente técnica que se combina con el algoritmo QR básico es un repetido
v= v60(10,2,4)T. desplazamiento del origen. Antes de discutir la técnica, damos una indicación de por
I

qué es necesaria.
Así, la primera matriz U es
Ejemplo 2 Vamos a mostrar cuál es el resultado de aplicar el algoritmo QR a la matriz H de 4 x 4
del ejemplo l . En él, por medio de la iteración básica Ak = QkRk , Ak+l = Rk Qk , se
U= I - vv* = _!.. [ -5 14 -2 ] . genera una sucesión de matrices Ak . Mostramos aquí algunos de los resultados con un
15 -10 -2
-10 -5 -10

11 redondeo de hasta cinco lugares significativos.

El primer paso se completa llevando a cabo la multiplicación indicada en la ecuación A 1 <- Hessenberg (A)

-[ ¡-;
(4). El resultado es 10.135 1.9821 -0.75082 5.5290
6.7949 -2.8402 0.52664 1.2616
A2 = [
0.19692 1.5057 1.7031]

"1
-5] o.
[[ m72 ] 1.7508 2.1994
45
385
45
_ 163
45
34

45
o. o.
UA�
m _3!!]

g] 11.105 -4.7599 3.8826 -4.0296


45 225

l
� [l -�
259 536 352

-5 ] -0.00045570 -3.8487 -0.72647 1.2553


45 - 225 -225

Aw = [
8.5556 -3.6222 0.75556 -0.068658 3.5669 0.16324 l
[ t.6 12
o.
O. 1.3778] 3.0089 -1.3822 ] O. O. o. 0.17645
[ o. 5.7556 [-2.3822 -1.5644- J

En el paso 2, la matriz parcialmente reducida en curso se divide en bloques tal como se 11.106 -4.7403 3.9060 -4.0296
muestra en la ecuación anterior. Los cómputos nos llevan a: O. -3.8526 -0.68985 1.2559
A20 = [ .
O. -0.032156 3.5706 0.15706 l
O. 0.17645
d = (1.3778, 5.7555/
o. o.
�= -5.9182 Podemos observar que la ansiada forma triangular superior no se puede alcanzar rápida­
mente en virtud de que el elemento en la posición (3, 2) aún es lejano a O. Pese a que un
a.= 0.15218 valor propio, a saber, 0.17645, se ha determinado con mucha precisión cerca del décimo
V= (1.1103, 0.87590/ paso, la lenta convergencia a una matriz triangular superior, tan evidente en este ejemplo,
es muy importuna. Otro valor propio, 11.106, también se ha determinado rápidamente,
U= -0.23280 -0.97252] pero los dos de en medio sólo se pueden estimar con dos o tres cifras significativas en el
[ -0.97252 0.23280 vigésimo paso. 11
280 Capítulo 5 Temas selectos del álgebra lineal numérica *5.5 El algoritmo QR de Francis para el problema de los valores propios 281

La lenta convergencia del algoritmo básico se alivia por medio de desplazamientos Ejemplo 3 Ahora mostramos cuál es el resultado de aplicar el algoritmo QR con desplazamientos
efectuados sobre las sucesivas matrices, definiéndose un desplazamiento como el reem­ a la matriz de Hessenberg H del ejemplo l . Exhibimos los resultados después de cinco
plazo de una matriz A por A - z/. El algoritmo QR con desplazamientos procede de la pasos de la factorización QR con desplazamientos, junto con las matrices reducidas.
siguiente manera. A-+H

A1 .- Hessenberg(A) 2.6141 -10.087 -2.4480 -2.4727


-5 5345 4.6668 3.5719 2.8753
for k = 1, 2, . . . , M do H -+ As = [ .
o. -0.28730 0.14546 0.10900 l
dado Ak computa el escalar Zk como se explica abajo o. o. o. 3.5736
factorización QR: Ak - Zkl = QkRk 11.001 -5.0329 -4.1730
Ak+l .._ RkQk + Zkl reducir (As) -+ As = [ -0.30955 -3.7507 1.3719 ]
end. o. o. 0.17645
. - - 11.106 -4.7234
Si en el algoritmo se toma el elemento de la esquina inferior derecha de Ak como el reducrr (As) -+ As= [ _18556] .
O.
escalar Zb la iteración deberá producir rápidamente un vector de la forma (0, O, . . . , O, a.)7
en la última fila. El número a. será en este caso un valor propio de A. La mejor manera Claramente, los valores propios computados son 3.5736, 0.17645, 11.106 y -3.8556.
de proceder de aquí en adelante es por reducción de la matriz, eliminando la última Estos valores son exactos para el número de dígitos que se muestran. 1111
fila y la última columna en forma semejante a la explicada en la sección 51, repitiendo
el proceso con matrices cada vez más pequeñas. Para las matrices de gran tamaño, es Operaciones elementales con filas y columnas
aconsejable una reducción inicial a la forma de Hessenberg, lo cual reduce la carga en Para reducir una matriz a su forma de Hessenberg hay un método alternativo en
el cómputo. cierto sentido más simple. Este método recurre a operaciones elementales con las filas
En el siguiente lema se describe el proceso de reducción. y las columnas. En cada paso, la matriz en curso se premultiplica por una matriz E; y se
posmultiplica por E¡_ 1. Así, A .- E;AE¡- 1• Las inversas E¡- 1 se determinan fácilmente.
LEMA Sea A una matriz en forma dividida: (Véase el Prob. 5 de la Sec. 4.1.) Las filas y las columnas se someten a este proceso
de uno en uno, procediéndose de izquierda a derecha. Un ejemplo nos indicará cómo se
A=[� ;], hace ésto.
en donde By E son matrices cuadradas. En tal caso el espectro de A es la unión de los Ejemplo 4 Queremos reducir la siguiente matriz a la forma superior de Hessenberg por medio de
espectros de By E. transformaciones de semejanza:
[-3 3 7 2]
Demostración La ecuación Ax = 'kx es, en forma dividida, 1 2 3 -5
A= .
2 -1 O 3
[i ;][:]=\[:] (6) 4 2 -2 4
Primero, si no pivoteamos, sustraeremos a las filas 3 y 4 múltiplos de la fila 2 para crear
o, lo que es equivalente, los ceros deseados. Sin embargo, al igual que en la eliminación gaussiana, queremos
Bu+Cv=Au que los multiplicadores sean pequeños. Por lo tanto, intercambiamos las filas 2 y 4 para
{ traer el pivote más fuerte a la posición correcta. (Aquí utilizamos tan solo el pivoteo de
Ev=\v filas en vez del pivoteo de filas escalados.) Por consiguiente, es necesario intercambiar
Si\ es un valor propio de A, entonces (6) tiene una solución no trivial (u, vl. Si v;,: O, la columna 2 con la 4 para tener una transformación de semejanza. (Para simplificar el
entonces A es un valor propio de E. Si v = O, entonces u;,: O y A es un valor propio de procedimiento, realizamos aquí los intercambios y no utilizamos un arreglo indizado,
tal como se hizo en el algoritmo de la eliminación gaussiana en la sección 4.3.) Las

3]
B. Esto demuestra que esp(A) C esp(B) U esp(E).
Recíprocamente, si A es un valor propio de B, y si u es un vector propio corres­ matrices que se obtienen son:
pondiente (distinto de cero), entonces (u, Of resolverá (6). Si A es un valor propio de -3 3 7 2 -3 2 7
E, pero no un valor propio de B, entonces sea v un vector distinto de cero que satisface 4 2 -2 4 4 4 -2 2
Ev = \v. A continuación se resuelve la ecuación (B-M)u = -Cv. Esto se pudo hacer A-+ [ 1 -+ ¡
2 -1 O 3 2 3 O -1
puesto que A no es un valor propio de B. Entonces el vector (u, vl resuelve (6). Esto
demuestra que esp(B) U esp(E) e esp(A). 1 1 2 3 -5 1 -5 3 2
282 Capítulo 5 Temas selectos del álgebra lineal numérica
*5.5 El algoritmo QR de Francis para el problema de los valores propios 283
Después sustraiga de la fila 3 la fila 2 multiplicado por 1/2, y de la fila 4 la fila 2
6. Encuentre los valores propios de la matriz

¡]
multiplicado por 1/4. Haga lo mismo con las operaciones columna inversas. Es decir,
añada, a la columna 2 la columna 3 multiplicada por 1/2, y a la columna 2 la columna -1 -4

-� -¡ -� .

l
4 multiplicada por 1/4. (Véase el Prob. 3 de la Sec. 4.1.) Los resultados son: [

-
2 - 11 7 -3 � 7 3
3 3 2 3 7. Demuestre que en el algoritmo QR con desplazarnientosA1+1 , es unitariamente semejante a
4 4 -2 2 4 3 -2 2 4 1 -2 2 A1 .
O 1 1 -2 O 3 8. El problema de los valores propios generalizado consiste en encontrar los valores de ).
2 -2 - O � 1 -2 .
para los que la ecuación Ax = 1'.Bx tiene soluciones no triviales. Demuestre que el problema
- -6
O �7 � 1 ¡ O3 17
--;¡ 2
7
� ¡ o -� i !1 se puede reconstruir como un problema ordinario de valores propios cuando Bes no singular.
9. (Continuación) Demuestre que el valor propio para el problemaAx=1'.Bx se puede calcular
El pivoteo es necesario nuevamente al procesar la segunda columna. Llevando a cabo fácilmente si se conoce un valor propio generalizadoµ para el problema Ax= µ(B + tA)x.
las operaciones adecuadas con las filas y con las columnas inversas, obtenemos las dos
10. Elija dos números enteros p y q tales que 1 � p < q �n, y dos números complejos a y �
matrices siguientes, la última de las cuales es la que estamos buscando:
tales que lal 2 + 1� 1 2 = l. Sea U una matriz den x n que coincide con la matriz identidad
en todas partes, con la sola excepción de los cuatro elementos siguientes:

-
25

-
25 25 37
-3 4 7 3 -3 4 3 7 -3 4 -8 3
7 7 7 39 Upp = Uqq =a Upq =-Uqp = �.
4 2 -2 2 4 2 2 -2 4 2 --;¡ 2
o 31
-8 7
2
3
2 o 31
-8 3
2
7
2 o 31
-8
3
2 2
7 Demuestre que U es unitaria.

o 1 1 -2 o 1 -2 1 o o 50
-TI
59
TI
11. Sea A una matriz real con una estructura triangular superior de bloque
Au A12 A13 · · · Ain
O A22 A23 . . · A2n
SERIE DE PROBLEMAS *5.5 -
_
A [ O
..
O Aii · · · Ain
,,
. ... ... . . . ...
l. Sea A una matriz superior de Hessenberg den x n con un O en la posiciónAu-1. Demuestre
que el espectro de A es la unión de los espectros de las submatrices Aij (1 � i,j < k) y Aij o o o ... AM
(k<ü �n).
en la que cada A;; es una matriz de 2 x 2. Dé un procedimiento simple para calcular los
2. Demuestre que en el algoritmo QR se tiene queA1+1 = QiA1Q¡. A partir de este resultado valores propios deA, incluyendo demostraciones.
demuestre que la factorización QR de AI es 12. Demuestre o refute: Si U es unitaria, R triangular superior y UR superior de Hessenberg,
entonces U es superior de Hessenberg.
(Q1Q2 · · · Q¡)(R1R1-1 · · ·R1)= A1.
13. En relación con el problema 11, demuestre que A es singular si y sólo si al menos una A;; es
singular.
3. Sean ao, a¡, ... , ª•-l números complejos arbitrarios. Sea
14. Demuestre que si Tes triangular superior e invertible, lo mismo sucede con r-1.
p(t) = CZ0 + a¡t + a2t2 + · · · + ª•-ltn-l + t" 15. Demuestre que si A es superior de Hessenberg y Tes triangular superior, entonces AT y TA
son superiores de Hessenberg.
Se define la matriz asociada a este polinomio como la matriz n x n.
16. Demuestre que si T es triangular superior y AT es superior de Hessenberg, entonces TA
o 1 o o o o es superior de Hessenberg. (Suponga que A y T son de n x n, mas no necesariamente
o o 1 o o o invertibles.)
'17. Escriba las subrutinas o los procedimientos necesarios para reducir, con la ayuda de la
o o o 1 o o computadora, una matriz a su forma de Hessenberg a través de la ecuación (4 ); aplíquelas a

A=I
la matriz del ejemplo l .
o o o o 1 o '18. (Continuación) Añada las subrutinas o los procedimientos necesarios para llevar a cabo el
o o o o o 1 algoritmo QR básico y reproduzca los resultados del ejemplo 2.
-ao -a¡ az -a3 -an-2 -an-1 '19. (Continuación) Modifique las subrutinas o los procedimientos para la computadora, de modo
que lleven a cabo el algoritmo QR con desplazamientos. Reproduzca los resultados del
Demuestre que (-l)"p es el polinomio característico deA.

1
ejemplo 3. Asimismo, utilice las subrutinas para encontrar los valores propios de la matriz
4. Sea A la matriz del problema precedente. Demuestre queA"•1= I:;;=0 a;A;. 190 66 -84 30
5. Demuestre que para todo conjunto con n números enteros, hay una matriz entera den x n 66 303 42 -36
[336 -168 147 -112]
cuyo espectro es dicho conjunto de enteros. 30 -36 28 291
Capítulo 6
284 Capítulo 5 Temas selectos del álgebra lineal numérica

Los valores propios son 343, 294 y 147 ± !96i. APROXThfACIÓN DE FUNCIONES
c20. Escriba una subrutina o procedinúento pararmacio reducir una matriz a su forma superior de Hes­
senber g a través de una sucesión de transfo nes de semejanza, como en el ejemplo 4.
Cada transformació n de semeja nza deberí a seguir el algoritmo esbozado en este ejemplo, es 6.1 Interpolación polinomial
decir, las operaciones elemen tales de la fila seguid as del inverso de la operación elemental
de la columna. Póngalas a prueba con la matriz del ejemplo 4. Aplíquela a la matriz del 6.2 Diferencias divididas
ejemplo 1 y compárela con el procedimient o que se da en el texto. 6.3 Interpolación de Hermite
r de Hessenberg, tal como se indica en el 6.4 Interpolación de splines
21. Al reducir una matriz den x na la forma superio as multip licaciones se requieren aproximada- *6.5 Los E-splines: Teoría básica
problema precedente y en el ejempl o 4, ¿cuánt
mente? *6.6 Los E-splines: Aplicaciones
6.7 Series de Taylor
*6.8 La mejor aproximación: Teoría de mínimos cuadrados
*6.9 La mejor aproximación: Teoría de Chebyshev
*6.1 O Interpolación en dimensiones superiores
*6.11 Fracciones continuas
*6.12 Interpolación trigonométrica y la transformada rápida de Fourier
6.13 Aproximación adaptativa

En este capítulo se discute el problema de representar funciones en una computadora.


Se tomarán en consideración varios subproblemas distintos. Difieren según el tipo de
función representada, ya sea que ésta se conozca en relativamente pocos puntos o en
muchos (o todos). La representación elegida (sea un polinomio, una función spline, una
fracción continua, etc), también determina la naturaleza de la teoría. Iniciamos con el
caso de los polinomios, por ser el más antiguo y sencillo.

6.1 Interpolación polinomial

En esta sección resolvemos el siguiente problema: se nos da una tabla de n + I puntos


(x¡, y¡), los cuales corresponden a parejas de datos:

X Xo X¡ Xz Xn

y Yo y¡ Y2 Yn

y buscamos un polinomio p con el menor grado posible, para el cual

p(x¡) == Yi (0 � i � n).

Se dice que tal polinomio hace una interpolación de los datos. A continuación presen­
tamos el teorema que rige este problema.

285
286 Capítulo 6 Aproximación de fanciones
6.J Interpolación polinomial 287
TEOREMA 1 Si Xo, x1, ••• , Xn son números reales distintos, entonces para valores arbitrarios y0,
Aquí se ha adoptado la convención de que TI�0(x-Xj) = I, siempre que m < O. Los
y¡, ... , Yn existe un polinomio único Pn de a lo sumo grado n, de manera que:
primeros casos de la ecuación (4) son
pn (x;)=y¡ (O� i� n).
po(x) = co
Demostración Demostremos primero la unicidad. Suponga que hubiera dos polinomios, Pn y qn, que p¡(x)=co +c1(x-xo)
cumplieran con el enunciado del teorema. Entonces el polinomio Pn -qn tendría la
P2(x) = co +e¡ (x-xo) +c2(x-xo)(x-x1)
propiedad CPn -qn )(x;) = O para O � i � n. Ya que el grado de Pn-qn puede ser a
lo más n, este polinomio puede tener a lo más n ceros, en tanto que no sea el polinomio y así sucesivamente. Estos polinomios reciben el nombre de polinomios de interpola­

=
cero. En vista de que las x; son distintas, Pn -qn tiene n + 1 ceros; debe por Jo tanto
valer cero. Por consiguiente, Pn qn ,
Para la parte del teorema que se refiere a la existencia procedemos de manera
ción en la forma de Newton.
Un método eficiente para evaluar Pk (x), suponiendo que se conozcan los cóeficientes
c0, c 1, •.• , ck, es el conocido como multiplicación anidada o Algoritmo de Horner.
inductiva. Para n = O la existencia es obvia, ya que una función constante p0 (un Éste se puede explicar muy fácilmente para una expresión arbitraria de la forma
polinomio de grado � O) se puede escoger de manera que po(xo) = yo. Supongamos
ahora que hemos obtenido un polinomio Pk-l de grado� k-1, con pk-i(x;)=y¡, para
IT dj=co +c do +c2dod + ..·+ckd d ..·d -l·
k i-1
O � i� k -l . Tratemos de construir Pk en la forma u=¿e; 1 1 o 1 k (5)
i=O j=O
Pk (x) = Pk-1(x) + c(x-Xo)(x-x¡) ···(x-Xk-1). (1)
La idea es presentarla en la forma:
Observe que éste es sin lugar a dudas un polinomio de, a lo más, grado k. Además, Pk
interpola los mismos datos que Pk -l, ya que U=(···(((ck )dk -1 +Ck_¡)dk-2 +Ck-2) +dk-3 + · · ·+C¡)lfo +CQ. (6)
El algoritmo para calcular u se puede desarrollar como sigue: denotamos con Uk,
Pk(x¡) = Pk-1(X¡) = y¡ (O� i� k-1).
uk -1, ... , uo las cantidades que se encuentran entre paréntesis, iniciando con los pa­
réntesis más internos. Por ello
Procedamos ahora a determinar el coeficiente desconocido c a partir de la condición
Pk(xk) = Yk · Esto lleva a la ecuación
Uk +--q
P H(xk) + c(xk-xo)(xk-X¡) ···(xk-Xk-1) = Yk· (2) Uk-1 +-- Ukdk-1 +Ck-1
Uk -2 +-- Uk -ldk-2 +Ck-2
De la ecuación (2) se puede despejar c con toda seguridad, debido a que los factores que
multiplican a c no son cero. (¿Por qué?) 111 Uk -3 +-- Uk-2dk-3 +Ck-3

Forma de Newton del polinomio de interpolación


UQ+--U¡do +CQ.
Antes de que intentemos presentar un algoritmo que lleve a cabo el proceso recursivo
en esta demostración, necesitamos hacer algunas observaciones. Primero, los polinomios Ya que sólo se busca u0, algorítmicamente podemos escribir:
Po, p1, . • . , Pn generados en la demostración, poseen la propiedad de que cada Pk se
obtiene simplemente añadiendo un término a Pk -l · Con ello, al final del proceso, Pn U+-- Ck
estará constituido por una suma de términos, y cada Po, p1, ... , Pn-l será claramente for / = k-1, k -2, ... , O do
visible en la expresión para Pn· Cada Pk tiene la forma U+--ud¡ +C¡
end.
Pk(x) = co +c¡(x-xo) +c2(x-Xo)(x-x¡) +···+Ck (x-xo) ·· ·(x-xk-1). (3)
Regresando al polinomio dado por la ecuación (3) o por la (4), usamos el siguiente
La forma compacta para esta expresión es: algoritmo para obtener u = Pk(t), para un valor dado de t:
U+--q
k i-1
for i = k-I,k-2, ... , O do
Pk (x)=¿c;IT(x-xj), (4)
i=O j=O
U+-- (t-X¡ )U +C¡
end.
288 Capítulo 6 Aproximación defunciones 6.1 Interpolación polinomial 28 9

Podemos ahora escribir un algoritmo para calcular los coeficientes e; en la ecuación Forma de Lagrange del polinomio de interpolación
(4). Observe que el coeficiente e que aparece en la ecuación (2) es lo que posteriormente Presentamos ahora una forma alternativa del polinomio de interpolación p asociado
llamamos Ck. Por lo tanto la fórmula para Ck es: con una tabla de datos (x;, y;), con O� i � n. Es importante entender que existe uno y
sólo un polinomio de interpolación de grado � n asociado con los datos (suponiendo,
Yk -Pk-l (xk).. . . claro está, que las n + 1 abcisas x; son distintas). Sin embargo, existe ciertamente la
Ck =
(Xk -xo)(Xk -X¡)··· (Xk-Xk-1) posibilidad de expresar este polinomio de maneras distintas y de llegar a él a través de
distintos algoritmos.
A continuación presentamos un algoritmo para calcular co, ci, ..., en a partir de la tabla El método alternativo expresa a p en la forma:
de valores para xo, X¡, ... , Xn y para Yo, y¡, .. . , Yn· n
p(x) = Yofo(x) +y¡f¡(x) +··· +ynfnCx) = ¿Ykfk(x). (9)
co +- Yo k=O

for k = 1, 2, ... , n do En este caso lo, l1, .•• , ln son polinomios que dependen de los nodos x0, x1, ••. , Xn,
d +-Xk-Xk-1 más no de las ordenadas Yo, y¡, ... , Yn· En vista de que las ordenadas podrían ser todas
U+- Ck-1 iguales a cero, excepto por un 1 que ocupe la i-ésima posición, tenemos:
for i = k-2, k-3, ..., O do
¿
n n

u +- u(xk-x;) + e¡ Oij = Pn(Xj) = LYkMXj) = Ok;fk(Xj) = f;(Xj),


k =O k=O
d <- d(Xk -X¡)
(Recuerde que O¡; = 1 si k = i y O¡; = O si k * i.) Podemos fácilmente obtener un
end conjunto de polinomios que tengan esta propiedad.
Ck +- (yk - u)/d Consideremos fo. Éste será un polinomio de grado n que tome el valor O en x1,
end. x2, ..., Xn y el valor 1 en xo. Claramente fo debe adoptar la forma:
n
El ciclo interior calcula Pk-l (xk) y (xk-Xo)(Xk-X¡)··· (xk-xk_¡), el primero de ellos fo(X) = C(X -X¡)(X-xz)···(X-Xn ) = C Il(x-Xj).
mediante una modificación directa del algoritmo previamente estudiado. j=l
Este algoritmo tiene sólo un propósito didáctico. Ilustra el importante proceso de El valor de e se obtiene haciendo x = x0, de manera que
traducir una demostración constructiva de existencia a un algoritmo adecuado para un
programa de computadora. Sin embargo, hay un procedimiento más eficiente que logra
el mismo resultado. El método alternativo utiliza diferencias divididas para calcular los 1 = C IT(xo-Xj)
coeficientes c0, ci, ... , ck de la ecuación (4). Este método se presentará en la siguiente j=l

sección. y
El algoritmo anterior fue programado y sometido a verificación, tal como se detalla
e= rrcxo-xj)- 1•
a continuación. Definimos el polinomio
j=l
2 Por consiguiente,
p3(x) = 4x3 + 35x -84x- 954. (7)
II --
n
x-x·
fo(x)= 1

En la siguiente tabla se proporcionan cuatro valores de esta función j=l
Xo-Xj
Un razonamiento ·similar nos permite obtener el resto de las l;, y entonces la fórmula
xL�6 I º general se expresa como:

y �-.:_ 23
-954 1 _-;-1 (8)
f;(x) = II x-xj (O� i � n). (10)
Dichos valores se utilizaron como datos de entrada a la rutina de computadora, y ésta j=O X¡ -Xj
j;,i
calculó correctamente los coeficientes c0 = 1, e¡ = 2, c2 = 3, c3 = 4. Éstos son los
coeficientes de la forma de Newton del polinomio en la ecuación (7), a saber: Para el conjunto de nodos x0, x1, ... , Xn, estos polinomios son conocidos como funciones
cardinales. Utilizando los polinomios cardinales en la ecuación ( 9) obtenemos la forma
p3 (x) = 1 + 2(x-5) + 3(x -5)(x + 7) + 4(x -5)(x + 7)(x + 6). de Lagrange de los polinomios de interpolación.
290 Capítulo 6 Aproximación de funciones 6.1 Interpolación polinomial 291

Ejemplo 1 Para los datos en la tabla (8) los nodos son 5, -7, -6, O. Por ende, las funciones precisión como resultado de resolver el sistema (12). (Véase Gautschi [1984].) Además,
la cantidad de trabajo invertida en la obtención del polinomio (11) resulta excesiva. Por
consiguiente no se recomienda este enfoque.
cardinales son:

_ (x +7)(x +6)x (x -5)(x +6)x Si en el polinomio de Lagrange (9) hacemos x = x¡ para O � i � n, obtenemos las
siguientes n +1 ecuaciones lineales:
f0(x) - f¡(x) =

[Yº]
(5 +7)(5 +6)5 (-7 -5)(-7 +6)(-7)
(x -5)(x +7)x (x _ 5)(x +7)(x +6)
fz(x) = f3(x) = fo(xo) f1(xo) · · · fn(xo) p(xo)
(-6 -5)(-6 +7)(-6) (O _ 5)(0 +7)(0 +6) p( ¡)
fo( ;¡) Í¡ X¡) · fn( ;¡) ¡
[ � .:: ] � = [ � ]
El polinomio de interpolación es:
fo(Xn) Í¡(xn) · · · fn(Xn) Yn
p3 (x) = fo(x) -23f1 (x) -54f2 (x) -954f3 (x).
p(x.)

La matriz de coeficientes se reduce a la matriz identidad I, y la solución es y¡ = p(x¡)


para O � i � n, como era de esperarse. En vista de que sólo puede haber un polinomio
idéntico a él como función, a pesar de que su forma sea muy diferente.
Este podría no verse como el polinomio p 3 de la ecuación ( 7), pero de hecho debe ser
11 de interpolación para los n +1 puntos, diferentes entre sí, x0, x1, ••• , Xn , obtenemos una
identidad a la que satisface cualquier polinomio de a lo más grado n:
Ejemplo 2 Encuentre una fórmula de interpolación para la tabla de dos puntos:

p(x) = ¿p(x¡)f¡ (x).


n

X Xo X¡
y Yo y¡
i=O

Para el trabajo numérico probablemente es mejor utilizar la forma de Newton del polino­
Respuesta La fórmula de interpolación de Lagrange nos da mio de interpolación. Esto se puede combinar con el algoritmo de diferencias divididas
(que se estudiará en la siguiente sección) para calcular los coeficientes requeridos. Por
p(x)=Yo -- +y¡ -- .
(x -x¡) (x -xo)
inmediato gracias a que los coeficientes de la fórmula de Lagrange son las y¡ dadas. Este
otra parte, la forma de Lagrange del polinomio de interpolación se puede escribir de
XQ -X¡ X¡ -XQ
11
hecho resultará de utilidad en el capítulo 7, cuando se generen las fórmulas de cuadratura.
Existen otros algoritmos para la interpolación polinomial, con sus ventajas y sus Otra ventaja adicional de la forma de Newton es que, si se añaden más puntos al
desventajas. En vista de que existe uno y sólo un polinomio de grado � n que toma los
valores dados en los n+I puntos ( distintos) elegidos, dichos algoritmos generan el mismo
problema de interpolación, los coeficientes ya calculados no necesitan cambiarse. Así,

puntos (xo, Yo) y (x¡, y1), y así sucesivamente. La forma de Newton acomoda fácil­
en la ecuación (3), c0 depende del punto (x0, Yo ). Enseguida c1 depende de los dos
polinomio en diferentes formas. Por ejemplo, podemos pedir que nuestro polinomio se
exprese mediante potencias de x: mente puntos adicionales para ser interpolados.
p(x) = ao +a¡x +a2x 2 +· · · +anx".
El algoritmo de multiplicación anidada se aplica tanto a la forma de Newton como
(11) a la forma que se presenta en (11). Esto constituye una clara ventaja sobre la forma de
Las condiciones de interpolación, p(x¡) = y¡ para O � i � n, conducen a un sistema de
Lagrange. Sin embargo, también existen algoritmos para calcular la forma de Lagrange
n +I ecuaciones lineales que determinan ao, a1, .•• , ª"· Este sistema adopta la forma:
de manera eficiente. Vea Werner [1984] y las demás referencias que ahí se dan. Vea
también los problemas 31 y 32.
XQ X� Yo
X¡ XI a¡ y¡
Xo ªº
x'/ El error en la interpolación polinomial
X2 xi xi a2 = y (12)
t
Presentamos ahora algunos teoremas que tratan de la discrepancia entre una función
¡ y el polinomio que la interpola.
Xn x; x;: Yn
TEOREMA2 Sea f una función en cn+I [a, b], y sea p un polinomio de grado � n que interpola a la
ª"
Esta matriz de coeficientes se conoce como matriz de Vandermonde. Es una matriz función f en n +1 puntos distintos xo, X¡, .. ., Xn en el intervalo [a, b]. Para cada x en
no singular ya que el sistema tiene una solución única para cualquier elección de yo, [a, b] corresponde un punto i;, en (a, b) tal que:
y¡, ... , Yn (teorema 1). Por consiguiente, el determinante de la matriz de Vandermonde
es distinto de cero para los distintos nodos xo, x1, ••• , Xn, El problema 34 proporciona una
f(x) -p(x) = (n+IJ(i;,) (x -X¡).
n
¡
(n +1/
TI (13)
está mal condicionada, y por ello los coeficientes a¡ podrían no quedar determinados con
fórmula para este determinante. Sin embargo, con frecuencia la matriz de Vandermonde
,=O
292 Capítulo 6 Aproximación de funciones 6.1 Interpolación polinomial 293

Demostración Si x es uno de los nodos de interpolación X¡, la aseveración es obviamente cierta, en Las formas explícitas para algunos de los Tn son las siguientes:
vista de que ambos lados de la ecuación (13) se reducen a cero. Así, tomamos ax como
cualquier punto que no sea un nodo, y hacemos: T2(x)= 2x2 - 1
T3(x)= 4x3 - 3x
w(t) = IT(t-x¡)
i::O
q> =f - p - A.w,
T4(x)= 8x 4 - 8x2 + l
Ts(x)= I6x5 - 20x3 +5x
donde A. es el número real que permite que q>(x)= O. (Recuerde que x ha sido fijado.)
Por ende, T6(X) == 32x6 - 48x4 + 18x2 - l.
A.= f(x) p(x).
-
w(x) TEOREMA3 Para x en el intervalo (-1, 1 J, los polinomios de Chebyshev se expresan en
la siguiente
forma ce"ada:
Además, q> E cn+1 ¡a, b], y q> se anula en los n + 2 puntos x, x0, x1, ••• , Xn, El teorema Tn(x)= cos(ncos- 1 x) (n � O).
de Rolle nos dice que q>1 tiene al menos n + 1 ceros distintos en (a, b). Con el mismo
razonamiento se concluye que q>" tiene al menos n ceros distintos en (a, b). Si repetimos Demostración Recuerde la fórmula de adición para el coseno:
el argumento llegamos eventualmente a que q¡Cn+ll tiene al menos un cero, llamémoslo
�' en (a, b). Además, cos(A + B)= cosAcosB - senAsenB.
q¡Cn+l)= ¡<n+I) _ in+!) _ A.W(n+l)= ¡Cn+l) _ (n + l)!A.. De ella obtenemos:

Por consiguiente, cos(n + 1)9= cose cos ne - sen 9 sen ne


cos(n - 1)9= cos9 cos ne + sen 9 sen ne
0= q¡Cn+l\�x) = ¡C•+l)(�x) - (n + l)!A.= /•+l)(�x) - (n + I)l(x) - p(x).
w(x) Al sumar estas dos ecuaciones y reacomodar términos obtenemos:

Ésta es la ecuación (13) disfrazada. 1111 cos(n + 1)9 = 2 cose cos ne - cos(n - 1)9. (14)
Hagamos ahorae= cos- 1 x y x= cos9. La ecuación (14) demuestra que las funciones
Ejemplo 3 Si se aproxima la función f(x) = senx mediante un polinomio de grado nueve que fn definidas mediante
interpola a f en diez puntos del intervalo [O, l], ¿qué tan grande es el error en este fn(x)= cos(ncos- 1 x)
intervalo?
satisfacen este sistema de ecuaciones:
Respuesta Para responder a esta pregunta usamos la ecuación (13) del teorema anterior. Obviamente
[Jºº\�x)[ � 1 y íli=o [x -x;I� l. De esta manera, para toda x en [O, l], fo(x)= 1 f¡ (x)= x
{
fn+l (x)= Zxfn(x) -Ín-1 (x) (n � 1)
1
senx - p(x)[� < 2 .8 x 10-7• 11
lO! Se deduce entonces quefn= Tn para toda n. 111
A partir de la fórmula en el teorema 3 obtenemos propiedades adicionales de los
Polinomios de Chebyshev polinomios de Chebyshev, tales como:
En el teorema 2 hay un término que puede optimizarse si se escogen de manera
especial los nodos. El primero en hacer un análisis de este problema fue el gran ma­ [Tn (x)[� 1 (-l�x� l)
temático ruso Chebyshev (18 2 1-1894). De manera natural el proceso de optimización Tn(cos(j1t/n))= (-1/ (O�j� n)
conduce a un sistema de polinomios llamados polinomios de Chebyshev, de los cuales
daremos tanto sus definiciones como sus propiedades básicas. Tn(cos((2j - 1)/(2 n))7t) = O (1�j� n).
Los polinomios de Chebyshev (de primer tipo) se definen recursivamente como
sigue: Un polinomio mónico es aquel para el cual el término de mayor grado tiene coefi­
ciente l. A partir de la definición de los polinomios de Chebyshev podemos observar
T0 (x)= 1 T1 (x)= x que para Tn(x) el término de mayor grado es 2n-1xn. Por consiguiente, 2 1 -•r. es un
{
Tn+1(x)= 2xT.(x)- Tn-i(x) (n � 1). polinomio mónico.
294 Capítulo 6 Aproximación de funciones 6.1 Interpolación polinomial 295

TEOREMA 4 Si p es un polinomio mónico de grado n, entonces La convergencia de los polinomios de interpolación

II Plloo = máx lp(x)I ¡;; 21 -•. Si se da una función continua f sobre un intervalo [a, b ], y si se construyen para
-1 �� 1 f polinomios de interpolación Pn de grados cada vez mayores (con nodos igualmente
espaciados), lo natural sería esperar que estos polinomios convergieran uniformemente
Demostración Haremos una demostración por contradicción. Suponga que a f sobre [a, b]. Es decir, esperamos que la cantidad

lp(x)I < 2 -n (lxl � 1). llf - Pn lloo = máx lf(x) - Pn(x)I


1

Sea q = 2 -•r. y X¡ = cos(i1t/n). Como se hizo notar con anterioridad, q es un


·��b
1

polinomio mónico de grado n. Entonces, converja a O conformen -. oo. Ya hemos visto ejemplos, comof (x)=sen x, donde esto
resulta cierto, pero debe reconocerse que sen x dista mucho de ser una función continua
(-Iip(x¡) � lp(x¡)I < 21 -•=(-liq(x¡) típica. Es de clase C00 sobre la recta real y, como función de una variable compleja, es
unafunción entera, lo cual significa que no tiene ninguna singularidad en (la parte finita
y por consiguiente de) el plano complejo.
El hecho sorprendente es que para la mayoría de las funciones continuas la cantidad
(-li[q(x¡) -p(x¡)] > O
llf-Pn 11oo no converge a O. El primer ejemplo de este hecho fue presentado por Meray en
(O� i � n).

Esto muestra que el signo en el polinomio q -p oscila n+ 1 veces sobre el intervalo 1884.Tomó como nodos las n raíces n-ésimas de la unidad en el plano complejo. Éstos
(-1, 1]. Debe por lo tanto tener al menos n raíces en (-1, 1). Pero esto no es posible, son puntos igualmente espaciados sobre el círculo unitario lz l= 1, tal como se muestra
debido a que q -p tiene, a lo más, grado n - l . (Recuerde que q y p son polinomios en la figura 6.1 paran=6. Denotamos estos nodos con ro1, ro2, ... , ro•. Considere ahora
mónicos, y que el término x" no aparecerá en q -p.) 11111 el problema de interpolar la función f(z)= 1/ z en los nodos ro1, ro2, ••. , ro•. Existe un
único polinomio Pn-l de grado n- 1 que resuelve el problema. No resulta sorprendente
que sea Pn-1 (z)=z"-1, ya que
Selección de nodos
Suponga en el teorema2que los nodos de interpolación se encuentran en el intervalo Pn -1 ©j =roJ. =-ro.Jn=-=
( ) n-1 1 I f( )
[-1, 1]. Si x está en el mismo intervalo, entonces �x también estará en dicho intervalo.
©j (1 �} � n).
©j roj
Por ende podemos deducir que
Midamos ahora la discrepancia sobre el círculo unitario entre f y Pn -1 · Tenemos:
máx lf(x) -p(x)I � -
lxJ�l
1
' máx lf•+ll(x)I máx (x -x¡)l.
(n+ 1) . Jxl�l Jxl�l i=O
\ft llf - Pn -1 lloo =máx lf(z) - Pn -1(z)I =máx lz -1 - z"- 1 I
lzl=l Jzl=l
El teorema 4 nos dice que (para cualquier conjunto de nodos):
=máx_!._l l -z"l=2
lzl=l lz l
� \IT(x -x¡)\ ;;;r•.
Jxl=l i=O

Este valor mínimo se alcanza si rr;=o(X -X¡) es el múltiplo mónico de Tn+I; es decir,
Eje imaginario

2-•rn+l · En consecuencia, los nodos serán las raíces de Tn+l · Estas son:
Plano complejo

W¡ = f(-1
" + ¡,/j) - -. Wz = -¡ (1 + ¡,/j) 1

2i+ 1
.I" 'a.
'-
( )
\
I
X¡ COS (O� i � n). /
W4: -1 /
=

W¡ = 1
2n+21t

Estas consideraciones se resumen en el siguiente resultado.


------+-------� Ejereal
1
/
TEOREMA 5 Si los nodos X¡ son las raíces del polinomio de Chebyshev Tn+h entonces la fórmula de
\ I
\ /
error del Teorema 2 nos dice que (para lx l � 1): W5 = 1
¡(-1 -NJ) ..._
'a.
_.,. -" _ l(I
W6 - 2 - ¡.fj)

1
\f(x) -p(x)I � - - máx \f(n+l\t)I .
2"(n+ 1)! Jrl�l Figura 6.1 Las 6 raíces sextas de la unidad.
296 Capítulo 6 Aproximación de fanciones 6.1 Interpolación polinomial 297

(Confonne z se desplaza alrededor del círculo /z/ = 1, lo mismo hace z", y cuando En la definición de gn.t, el término m es un coeficiente binomial que se define en
z" = -1 obtenemos el 2 del cálculo anterior.) Por consiguiente, en este ejemplo, Pn y f
se mantienen separadas siempre por dos unidades confonne n -+ oo.
Otro ejemplo, en esta ocasión sobre el dominio de los reales, lo dio Runge en 1901.
términos de
n
()
{ ni.
= k!(n-k)! o<k<n
= =
Éste consiste en la función f(x) = (x2 + 1)- 1 sobre el intervalo (-5, 5]. Si para esta fun­ k
O de otra fonna.
ción se construyen polinomios de interpolación Pn usando nodos igualmente espaciados
en [-5, 5], se encuentra que la sucesión 11! - p./100 no está acotada. En la siguiente Resulta esencial interpretar a B. como un operador lineal que mapea elementos de C[O, l]
sección se esboza un experimento de cómputo para observar este comportamiento. Aun en otros elementos. La linealidad de Bn se expresa en la ecuación
para valores modestos de n (digamos n = 15) observamos grandes oscilaciones en el
polinomio Pn· Trabajos posteriores debidos a otros matemáticos, como Faber, llevaron B.(af + bg ) = aB,J + bB.g (a, b E IR f. g E C[O, 1]),
al siguiente resultado, muy general, en 1914:
la cual se verifica fácilmente. Otra importante propiedad de estos operadores es que
TEOREMA 6 Para cualquier sistema de nodos dado son positivos. Esto significa que si f � O también B.J � O. La veracidad de esta
aseveración se confinna de inmediato a partir del hecho de que gnk � O sobre el intervalo
a � 4•) < x\") < · · · < x�•) � b (n � O) (15) [O, l]. (Consideramos todas las funciones como definidas sólo sobre el intervalo [O, l].)
Juntas, las propiedades de linealidad y positividad son muy poderosas, tal como lo
existe unafanción continua f sobre [a, b], de manera que los polinomios de interpolación indica el siguiente teorema demostrado por Bohman y Korovkin.
para f que utilizan estos nodos no convergen uniformemente a f.

Esta cuestión es un poco más sutil de lo que parece a primera vista. Como muestra TEOREMA 9 Sea Ln (n � 1) una sucesión de operadores lineales positivos definidos sobre C[a, b],
de ello tenemos el siguiente resultado en positivo: que toman valores en el mismo espacio. Si 1/LJ - f/1 00 -+ O para las tresfanciones
f(x) = 1, x, x2, entonces lo mismo es válido para toda f E C[a, b].
TEOREMA 7 Si f es unafanción continua sobre [a, b], existe entonces un sistema de nodos como el
de la ecuación (15) tal que los polinomios Pn de interpolación para f en dichos nodos Demostración Tomamos valores absolutos en el espacio C[a, b] y denotamos mediante /JI la función
satisfacen la expresión límn-co 1/f - Pn l/oo = O. cuyo valor en x es /f(x)/. Observe que si Les un operador lineal positivo, entonces la
siguiente cadena de implicaciones es válida:
Este teorema se obtiene a partir de la fusión de otros dos poderosos teoremas, el
teorema de aproximación de Weierstrass y el teorema de alternancia de Chebyshev. f � g => f - g � O => L( f - g) � O => Lf - Lg � O => L f � Lg.
Pasamos ahora al primero de estos dos resultados. (El segundo se considera en la
sección 6.9.)
Otra propiedad nos dice que L(/fl) � /Lf/, ya que /!/ � f y /!/ � -f, a partir de lo
cual se deduce L(/f/) � Lf y L(/f/) � -Lf.
El teorema de aproximación de Weierstrass Hagamos ahora hk(x) = xk parak = O, 1, 2. Definirnos las funciones a..,�. y Yn
TEOREMA 8 Si f es continua sobre [a, b] y si e > O, entonces existe un polinomio p que satisface igualando
/f(x) - p(x)/ � e sobre el intervalo [a, b].
ª• = L.ho - ho �. = L.h1 -h 1 Yn = L.h2 - hz.
Demostración Debido a que el cambio de variable x = a +t(b - a) puede utilizarse para pasar en ambos
sentidos entre [a, b] y [O, 1], basta con demostrar este teorema para el caso del intervalo Las hipótesis del teorema aseguran. que
[O, l]. Es evidente que un polinomio de una función lineal de tes un polinomio en t. Tal
como se explica más adelante, sif E C[O, l], la sucesión de polinomios de Bernstein -+ O 1/Mco -+O 1/Yn l/co -+ O.
B.J converge unifonnemente af. 11
Tratemos ahora acerca de los polinomios de Bernstein, presentados por Serge (Aquí y en lo que resta de la demostración estamos usando la nonna infinito.) Para la
Bernstein en 1912. Se definen mediante: parte principal de la demostración tomemos aj como un elemento de C[a, b]. Sea a > O.

ü)
Queremos demostrar que existe un entero m tal que:
Bnf = tf gn.t(x) donde gnk = G)l(l - x)•-k.
n � m => 1/Ln f -!/l oo < 3e.
298 Capítulo 6 Aproximacói n de funciones 6.1 Interpolación polino mi al 299

En vista de que f es continua sobre un intervalo compacto, entonces es uniformemente Si es necesario, aumente m, de manera que paran� m tengamos que l\!ll oo lla.n ll oo < s.
continua. Por consiguiente existe una o positiva tal que para toda x y toda y en [a, b], Con ello el último término de la expresión anterior no será mayor que 3s. 11

l x-YI < o =?- 1/(x)-/(y) I < e. Un detalle aún pendiente en la demostración del teorema de Weierstrass es mostrar
que B nhk -;. hk para k = O, I, 2. En este caso hk(x) = i. Para h0 usamos el teorema
Observe que con e= 21\/\\00 /02, obtenemos: del binomio para escribir:

(x (Bnho)(x) = tgnk(x) = t (�)J(I-x)"-k = (x+(I-x))" = l.


\ x-y\ � O =?- \f(x)-f(y)I �2\\/\\ oo �2\lf\\ oo ;/ = c(x-y)2.
2
)
k=O k=O

Por lo tanto, para toda x y y en [a, b ], tenemos: Para h 1 tenemos, con ayuda del problema 35,

\f(x)-/(y)\ �e+c(x-y) .

Esta desigualdad se puede escribir en la forma:


2

(Bnh i)(x) = ta (D G)l(I-xr =


k
t G= � )J x -
n k

n-1 ( )
\f-f(y)ho \ �eho+c[h 2-2yh¡ +lho].
=x ¿ n; ¡ J+lx"-1-k =x.
k=O
Para verificarlo basta con sustituir x y usar las definiciones de hk . Tomando en cuenta Por último, para k = 2, y usando dos veces el problema 35, tenemos:
las observaciones hechas al inicio de la demostración deducimos que:

ILnf-f(y)L n hol �SL n ho +c[L nh 2-2yL nh1 +y2L nho ]. (Bnh2 )(x) = ta G) 2

G)J(l -x)"-k = t (�) G= �)J(I-xr


k

Ésta es una desigualdad entre funciones y por lo mismo tenemos la libertad de sustituir
� n 1k-1 !) n - l )J(l _ x) -
y en ella: = ( n- n-1 +n (k-1
L.i
n k

t
k=l
\(L nf)(y)-f(y)(L nho )(y)\ ;;; s (L n ho)(y)+c[(L nh2 )(y) -2y(L n h¡)(y) = n-I 2
+y 2(L n ho)(y)] n
x (n - )J- (¡ -xrz +::
k=2 n-2
n
2 2

= s [l +a.n<Y)] +c[y2+y.(y)-2y(y+�.(y)) n -I
=--x2-+-->x2.
x

+y2(1+a.n (y))]
n n

= s +SO.n +cy.(y)-2cy�.(y)+cy a..(y)


2
SERIE DE PROBLEMAS 6.1
;;; s +e\\a.nlloo+cl\Yn \l oo + 2c\\h¡ \\ oo llM oo l. Encuentre los polinomios de menor grado que interpolan a los siguientes conjuntos de datos:
+cl\h 2\\oo\\a..l\oo· (a)
_l_ij--2___
Elija m de tal manera que el lado derecho de esta desigualdad sea menor que 2s, siempre
. _x.

quen� m. Por lo tanto, paran� m, tenemos:



(b)

I\ Ln-f · L n ho\\oo ;;; 2s. X 7 1 2


y 146 2 1
Escribimos finalmente:
(e)

IIL nf-fl\oo � IILnf-f · L nho lloo+\lf · Ln ho-f · ho\loo xi 31 71112


;;; 2e+\lflloo \\ a. n l\ oo·
300 Capítulo 6 Aproximación de funciones 6.1 Interpolación polinomial 301

(d) 10. Demuestre que el coeficiente de x" en el polinomio p de la ecuación (9) es:
xJ 311[1[2
¿ y;
i:O
II
j=O
(x;-Xj)-1.
(e)
X 1.5 2.7 3.1 -2.1 -6.6 11.0
11. Demuestre que para cualquier polinomio q de grado ;j¡ n - 1
y o.o o.o o.o 1.0 o.o o.o
¿q(x;)II(x;-Xj)-1 =O.
2. El polinomio p de grado � n que intexpo!aa unafuncíónf dada en n+1 nodos preestablecidos j=O
i=O
está unívocamente definido. Por ende existe una transfonnacíón f ....,. p. Denote esta
transfonnación con L y demuestre que
12. Determine si el algoritmo
Lf = ¿f(x;)i;.
i=O
X+- anb n
fori=1,2, ...,ndo
Demuestre que L es lineal; es decir, X+- (X+an-i)b¡
L (af+bg) = aLf+b Lg. end

3. Demuestre que el algoritmo para calcular los coeficientes e; en la, fonna de Newton del calcula
polinomio de interpolación requiere n2 operaciones largas (multiplicaciones y divisiones).
x=¿ a;II b j.
4. Tomando en cuenta el problema 2, defina otra transfonnacíón G mediante la fónnula: i=O j=O
13. Demuestre que si tomamos cualquier conjunto de 23 nodos en el intervalo [-1, 1] e inter­
Gf = ¿J(x;)fr. polamos la funciónf(x)=coshx con un polinomio p de grado 22, entonces en el intervalo
i=O [-1, !] el error relativo IP<x) - f(x)I/IJ(x)I no es superior a 5 x 10-16•
Demuestre que Gf es un polinomio de a lo más grado 2n , que Gf interpola af en los nodos, 14. Sea p un polinomio de grado � n - 1 que interpola a la funciónf(x) = senhx en cualquier
y que Gf es no negativa siempre que f es no negativa. conjunto de n nodos en el intervalo [-1, l], con la única condición de que uno de los nodos
sea el O. Demuestre que sobre [-1, 1J el error relativo obedece a la siguiente desigualdad:
5.. Discuta el problema de la determinación de un polinomio de a lo más grado 2, para el cual
p(O), p(l), y p'(�) toman valores preestablecidos, y � es un punto dado de antemano. IP(x)- f(x)I < �
6. Demuestre que la transfonnación L en el problema 2 tiene la propiedad de que Lq = q para !f(x)j = n!"
todo polinomio q de a lo más grado n.
15. ¿Cuál es el valor final de v en el algoritmo que se muestra?
7. (Continuación) Demuestre que para toda x:
V f- Ci-1

¿t;(x)=l. forj = i,i+ l, ...,ndo


i=O v +- vx+cj
end
8. (Continuación) Si p es un polinomio de grado � n que interpola a la función f en xo.
x¡, ... , x. (pun tos distintos), entonces
¿Cuál es el número de sumas y restas involucradas en este algoritmo?
16. Diseñe un algoritmo eficiente para calcular
f(x) - p(x)=¿[f(x) -f(x;)]l;(x).
i=O

9. Demuestre que sí g interpola a la función! en XO, x1, ... , Xn-1 y sí h interpola af en xi,
u= I:II d¡.
i=l i=l
x2, ... , x., entonces la función
XI) - x 1 7. Suponga que p es un polinomio de grado mayor que n que interpola aj en n+1 nodos. ¿Qué
g(x)+ --[g(x)- h(x)] puede descubrir acerca def(x)- p(x)?
x. -xo
I 8. Demuestre o refute la siguiente aseveración: sí n es un divisor de m, entonces cada cero de
interpola aj enxo, x1, ... , x,. Observe que h y g no necesitan ser polinomios. T. es un cero de Tm .

ji
302 Capítulo 6 Aproximación de funciones 6.2 Diferencias divididas 303

19. Encuentre un polinomio que tome l os siguientes valores: 31. Tomando en cuenta el proceso de interpolación de Lagrange, defina

x 1\2\ O 13 w, = II(x,-x¡)-1.
¡
y 3 2 -4 1 1 5
i=O

20. Demuestre que parax � 1, Tn ( x ) = cosh(ncosh-1 x ). Demuestre que si x no es un nodo, entonces el polinomi o de interpolación se puede calcular
mediante la fórmula
21. Escriba l os polinomios de interpolación de Lagrange y de Newton para los siguientes datos:

X 2 o 3 p(x)= [t y¡w¡(X-X¡)-1 ]/ [t w;(X-X¡)-1].

f( x) 11
1=0 1=0
7 28
Esto se llama laforma baricéntrica del proceso de interpolación de Lagrange.
22. Encuentre las formas de Lagrange y de Newton de los polinomios de interpolación para los 32. Demuestre que el cálculo del valor dep en el problema 31 es estable en el sentid o de que,
siguientes datos: si las w; son calculadas incorrectamente, aun así se satisface la propiedad de interpolación
X 1-=� lím,-,, p(x) = y¡ (O� k � n).
33. Sea E un espacio vectorial de aimensión n + 1 de funciones definidas sobre un d ominio D.
f(x) foT1 1 -1
Sean Xo,x1, ..., Xn puntos distintos en D. Demuestre que el problema de interpolación
Escriba ambos polinomios en la forma a + bx + d- con el fin de verificar que so n idénticos
como funciones. f (x;) = y; (O� i� n) f E E
23. Considere los datos siguientes: tiene una solución única para cualquier elección de ordenadas y; si y sólo si ningún elemento
de E, además del O, se anula en todos los puntos xo,X¡, ..., Xn .
X -/f I o v1 34. Demuestre que
f(x) /(-/f) \ /(O) J(/f)
xo x5
Para estos datos, ¿cuál es el polinomio de interpolación de Newton y cuál el de Lagrange? X¡ XI
24. La fórmula para el coeficiente del término de orden superior de Tn es 2"-1 . ¿Cuál es la
detl l x2 x? �I= II (Xk - x¡)
fórmula para el coeficiente dex"-2?, y ¿qué ocurre con respecto a x"-1?
;¿
O�j<k�n
Xn
25. Encuentre el polinomio de interpolación para la tabla
X::
= (Xn -Xo)(Xn -X¡)(Xn -X2) · · · (xn -Xn I) · · ·
-
x]� 3 2 6 (X¡ -xo)(X¡ -X¡)(X¡ - x2)(x2- XQ)(X2-X¡)(X¡-Xo).
y 1-2 l -22 -1 -37 35. Demuestre que

26. Laecuaciónx- 9-, = O tiene unasoluciónen(O, 1]. Encuentreelpolinomio de interpolación


sobrexo = O,x1 = 0.5,x2 = l para lafunción enel lado izquierdo de la ecuación. Igualando
a cero el po linomio de interpolación y resolviendo dicha ecuación, encuentre una solución
(�) (�)
=
(�= �}
aproximada de la ecuación.
27. Si interpolamos lafunción/(x) = 1-1 co n un polinomiop de grado 12, utilizando 13 nodos 6.2 Diferencias divididas
en (-1. l ], ¿cuál es una buena cota superior para 1/(x)-p(x)J en[-!, 1]?
28. Sea p¡ el polinomio de grado � k, tal que p¡(x,) = y, para O � i � k. Demuestre que
Pk = Pk-1 si y sólo sip¡_¡(x¡) = Yk· En la sección precedente discutimos el problema de interpolar una función por medio de
un polinomio. Retomamos aquí dicho problema. Seaf una función cuyos valores son
29. Diseñe un método para resolver una ecuación/(x) = O que dé la raíz correcta en n+ 1 pasos conocidos o calculables en un conjunto de puntos (nodos) x0, x1, ••• , x•. Supondremos
i,I 1
si ¡- es un po linomio de grado n en una vecindad de la raíz buscada. En este caso r1
1 en esta sección que estos puntos son distintos entre sí, mas no que están ordenados en
denota la función inversa: ¡- (/(x)) = x.
la recta real. Sabemos que hay un único polinomio p de a lo más grado n que interpola
30. Demuestre lo siguiente: si ges unafunción ( no necesariamente un polinomio) que interpola af en los n + I nodos:
a la función/ en los nodos Xo, x1, ..., Xn 1, y si h es una función tal que h(x,) = 81n
- g + ch interpola a/ en Xo, x , ..., x .
(O� i� n), entonces para alguna e la función p(x¡) = f(x¡) (O� i � n). (1)
1 n
304 Capítulo 6 Aproximación defunciones 6.2 Diferencias divididas 305

Por supuesto, el polinomio p se puede construir como una combinación lineal de los Al resolver la ecuación (2) para c0, e¡ , ... , en , podemos ir de arriba hacia abajo,
polinomios básicos1, x,x 2, . . . ,x'. Como vimos en la sección anterior, esta base no es calculando el valor de los coeficientes Cj en el orden de sus índices. En este proceso,
recomendable, por lo que nosotros preferimos utilizar una más apropiada para la forma podemos ver que co sólo depende de f(Xo), que e¡ depende de f(xo) y f(x¡ ) , y así
de Newton del polinomio de interpolación: sucesivamente. De este modo, en depende def en Xo,x 1, ••. ,Xn. La notación

qo(x) = 1 Cn = f[Xo,X¡, ... ,Xn] (6)


q1(x) = (x-Xo) se adoptó hace muchos años para significar esta dependencia. En realidad, lo que esta­
qz(x) = (x-Xo)(x-x¡) mos haciendo es definir el símbolo f[xo,X¡, ...,Xn] como el coeficiente de qn cuando
I:;=O ckqk interpola af enxo,x1, ... ,Xn . Como
q3(X) = (x- .x:o)(x-X¡)(x-Xz)
qn(x) = (x-Xo)(x-x¡) · · · (x-Xn-1) = x" + términos de orden inferior,
también podemos decir quef[Xo,x 1, ••• ,xn] es el coeficiente dex" en el polinomio de
qn(x) = (x-Xo)(x-x¡)(x-x2) · · · (x-Xn-1). a lo más grado n que interpola aj en Xo, x¡, ... , Xn . En la descripción precedente n
Esto nos conduce a la forma de Newton: puede tomar valores arbitrarios. Las expresionesf[Xo,X¡, ...,Xn] se llaman diferencias
divididas def.
Vamos ahora a presentar fórmulas explícitas para las primeras diferencias divididas.
p(x) = ¿ Cj<li(x). En primer lugar,f[x0] es el coeficiente dex0 en el polinomio de gradoO que interpola a
f enx0• De esta manera tenemos que
j=O

Las condiciones de interpolación dan lugar a un sistema de ecuaciones lineales con el


que se determinan los coeficientes Cf f[xo] = f(xo). (7)
La cantidad f[xo,x¡] es el coeficiente de x en el polinomio de a lo más grado 1 que
L CjiJj(X¡) = f(X¡) (O � i� n). (2 ) interpola af enx0 yx1• En vista de que el citado polinomio es
j=O
x
En este sistema de ecuaciones la matriz de los coeficientes es una matriz A de (n +1) x p( x) = f(xo) + f( ¡)-f(Xo) (x-Xo), (8)
(n +1 ), cuyos elementos son:
X¡ -XQ
podemos ver que el referido coeficiente es:
ag = IJj(x¡) (O� i,j� n). (3 )
f(x¡)-f(Xo)
La matriz A es triangular inferior, pues f[xo,x¡] = .
X¡-Xo (9)

qj(x) = II(x-Xk)
j -1
Esto nos da una idea de por qué se adoptó el término diferencia dividida. Se puede
exhibir una tabla de diferencias divididas con la fonna siguiente:
(4 )
k=O
Xo f(xo) f[Xo,x¡]
qj(x¡) = II(x¡-xk) =O
j -1
si i�j-1. X¡ f(x¡ ).
A partir de ella es muy fácil formar el polinomio de interpolación:
k=O

Por ejemplo, considere el caso en que hay tres nodos con


p(x) = f(Xo) +f[xo,x¡](x-xo).
pz(x) = coqo(x) + e¡ q¡(x) + czqz(x)
Las fórmulas (7) y (9) se pueden obtener resolviendo el sistema (5) para c0 y c1, pues
= Co + C¡(x-Xo) + Cz(X- .xo)(x-X¡). c0 = f[Xo] y c1 = f[Xo,x¡], de acuerdo con la ecuación (6 ). La ecuación (1) nos permite
Haciendox = Xo ,X = x1 yx =x2 , tenemos un sistema triangular inferior escribir el polinomio de interpolación de Newton en la forma:
1 O O eº f(xo)
(5) ¿ qqk(x) = ¿f[Xo,X¡, ...,xk] J}(x -xj).
n n k-1

[1 (x¡ -Xo) O j [ e¡] = (f(x¡)j . p(x) = (1 0 )


1 (x2-Xo) (x2-xo)(x z-x¡) Cz f(x2) k=O k=O j=O
306 Capítulo 6 Aproximación de funciones 6.2 Diferencias divididas 307
La ecuación (10 ) es correcta y se demuestra como sigue. Si truncamos la suma que o tabla de la siguiente manera, en la que las diferencias de orden
O,1,2, 3 se muestran
aparece en la ecuación (10) en el valor k = m,obtendremos I:;=0 ckqk(x). Sabemos en columnas consecutivas:
que éste es el polinomio de a lo más grado m que interpola a f en xo, x¡, ..., Xm, Por
consiguiente,Cm = f[x0,x 1, ••• , Xm], Esto es cierto para todo entero m desde O hasta n.
Xo f[xa.] f[xa,X¡] f[xa. X¡,X2] f[xa, X¡,Xz,X3]
Diferencias divididas de orden superior X¡ f[x¡] f[x¡,x2] f[x¡,Xz,x3]
El siguiente teorema se puede utilizar para calcular las diferencias divididas de x2 f[x2] f[x2,X3]
orden superior. X3 f[x3]

TEOREMA 1 Las diferencias divididas satisfacen la ecuación: La información a la izquierda de la línea vertical ya se conoce,mientras que las cantidades
a su derecha se deben calcular. Para ello se utiliza la fórmula (11 ),cuyo carácter recursivo
f[x¡,X2,·.,,Xn]-/[Xo, X¡,••·,Xn-iJ . impone la estructura triangular de la tabla. Por ejemplo, los datos conocidos no nos
f[xo,xi,...,x.] = (11)
Xn-XQ
permiten calcular/(x3,x4],f[x2,X3,x4],etcétera.
Comparando las ecuaciones (1O) y (11),podemos ver que los coeficientes precisados
Demostración Primero,sea pk el polinomio de a lo más grado k que interpola a/ en los nodos Xo,x1,..., en el polinomio de interpolación de Newton ocupan la primera fila en el cuadro de las
Xk, Nosotros necesitaremos a p . y ªP•-1· Sea q el polinomio de a lo más grado n-1 diferencias divididas.
que interpola a/ en x1,x2,... ,x•. Tenemos:

x-x Ejemplo 1 Calcule un cuadro con las diferencias divididas para los siguientes valores de una función:
Pn(X) = q(x) + --" [q(x)-Pn -1(x)]. (12)
x.-xa
X 3 5 6
Esta igualdad se demuestra observando en primer lugar,que en ambos lados de la ecua­
ción hay polinomios de a lo más grado n. Después, hay que verificar que estos po­ f (x) -3 2 4 (14)
linomios tienen los mismos valores en los puntos Xo, x1, ••• , x.. En consecuencia,
los polinomios deben ser idénticos entre si Examinemos ahora el coeficiente de Xn en Respuesta Arreglando verticalmente los valores de la función y calculando
las diferencias divididas
ambos lados de la ecuación (12). Éstos deben ser iguales,con lo que se llega a la ecua­ por medio de la fórmula (11), obtenemos lo siguiente:
ción (11). 11

El teorema precedente nos da las siguientes fórmulas: ¡ 3 1 2 -3/8 7/40

J
-3 5/4 3/20
f[ x¡ ]-f[xo]
f[xo,xil = 5 2 2
X¡ -Xo ¡,

f[xo,X¡,x2] =
f[ Xz]-f[xo, x¡]
x¡, ¡ 6 4
x2-xa
etcétera. 1 11

Ejemplo 2 Encuentre el polinqmio de interpolación de Newton para la función


En estas fórmulas x0, x1, x2, •.. se pueden interpretar como variables independientes. cuyos valores figuran
en la tabla (14).
Debido a ello,también tenemos ecuaciones como:
Respuesta p(x) = 1 + 2(x- 3)-l(x- 3)(x-1) + �(x- 3)(x-l)(x
· . ¡]
· f[x;+¡, Xi+2,···,Xi+jl-f[x¡,X¡+¡ ... Xt+J -5). 11
f¡X· X· ¡
X· ] -
1 1

,, i+,•••1 z+¡ - (1 3)
Xi+j -X¡
Un algoritmo para las diferencias divididas
Aquí, f[x;], f[x;,X;+il, f[x;,X;+1,X;+2l, f[x¡,X;+1,X;+2,X;+3J, etc., son, respectivamente,
i diferencias de orden O, 1,2, 3, etcétera. Para producir un polinomio de interpolación, lo más eficiente y recomendable es
Dada una tabla con los valores (x;,/ (x;)) de la función, podemos construir con ella quizá un algoritmo para calcular la tabla de las diferencias divididas. Cambiemos la
un cuadro sinóptico de las diferencias divididas. Se acostumbra desplegar dicho cuadro notación de modo que nuestro cuadro de las diferencias divididas tenga las componentes
Capítulo 6 Aproximación de funciones 6.2 Diferencias divididas 309
308

que se muestran a continuación: no alterar la parte de arriba, que es donde se están creando paulatinamente los valores
finales. He aquí el algoritmo:
XQ coo Co¡ CQ2 Co3 Co,n-1 Co,n
C¡z C ¡3 C1,n-l .fori=O, 1, ... ,ndo
X¡ CIQ cu
d¡ <- f (x¡)
X2 Czo Cz¡ c22 C23
end
forj = 1, 2, ..., n do
for i = j,j + 1, ... , n do
d¡ <- (d¡ - d¡_¡)j(X;-X¡_j)
Xn-1 Cn-1.0 Cn-1,I
end
Xn Cno end.
De nuevo, una línea vertical separa los datos (en este caso a su izquierda) de las compo­
nentes que serán calculadas. Está claro que Al concluir el algoritmo, el vector d contiene todos los coeficientes del polinomio:
C¡¡ = f[X¡, Xi+I,, .. , Xi+¡]. n i-I
p(x) = ¿d¡ IIcx-x¡).
Al traducir la ecuación (13) se obtiene de inmediato el algoritmo siguiente:
i=O i=O

forj = 1, 2, ... , n do En los problemas al final de esta sección, la eficiencia de este procedimiento se compara
for i = O, 1, ..., n - j do con la del método que se examinó en la sección 6.1.
·Cij <- (Ci+l,j-1-Ci,j-1)/(X¡+¡ -X¡)
end

I¡·;.
Propiedades de las diferencias divididas
end.
Concluimos la sección con algunas propiedades interesantes de las diferencias di­
En este algoritmo, los números CiQ (que son datos de entrada) son los valores de la función . vididas.
f en los puntos .x¡. Son también los valores que el polinomio de interpolación tendrá en
dichos puntos. El polinomio de interpolación es, por cierto, TEOREMA 2 La diferencia dividida es una función simétrica de sus argumentos. Es decir; si

p(x) = coo + coi (x - xa) + c02(x - xo)(x - X¡)+ · · · ¡1. (zo, Z¡, •.., Zn) es una permutación de (Xo, X¡, ... , x.), entonces

f[zo, z1, ...• z.] =f[xa, xi, ...• x.].


+ Co.(x-Xo)(X - X¡)·'· (X - Xn-J).
1 (15)
n i-1

= ¿co; IIcx-x¡). Demostración El coefiente de x" en el polinomio de a lo más grado n, que interpola af en los puntos
i=O i=O zo, z1, ..., Zn, es la diferencia dividida que aparece en la parte izquierda de la ecuación
(15). Por su parte, el coefiente de x" en el polinomio de a lo más grado n, que interpola
Si el algoritmo de las diferencias divididas sólo se va a utilizar para computar los
aj en los puntos Xo, x¡, ... , Xn, es la diferencia dividida que aparece en la parte derecha
coeficientes del polinomio de interpolación de Newton, se puede emplear un algoritmo
de la ecuación referida. Estos polinomios son, por supuesto, uno solo. 11
que ocupe menos memoria en la computadora. Esto se logra utilizando una sola variable
con subíndice. Denotémosla con d = [do, d1, ••• , d.]. En un principio, ponemos en d los
valoresf(xa),f(x 1), ... ,f(x.) de la función. Observe que do ya es el primer coeficiente TEOREMA 3 Sea p el polinomio de a lo más grado n que interpola a la función f en un conjunto de
del polinomio de interpolación de Newton. Después, computamos la primera columna n + I nodos distintos Xo, X¡, ... , x•. Si t es un punto diferente de los nodos, entonces
de las diferencias divididas y ponemos sus valores en d1, d1, . . . , d•. Hecho lo anterior,

II
do habrá conservado su valor original, mas d1 se habrá convertido en el siguiente de n
los valores buscados. Después repetimos el procedimiento anterior, teniendo cuidado f (t) - p(t) =f[xa, X¡, ... ' Xn, t] (t - X¡). (16)
de almacenar las nuevas diferencias divididas en la parte de abajo del vector d, a fin de i=O
310 Capítulo 6 Aproximación de funciones 6.2 Diferencias divididas 311

Demostración Sea q el polinomio de a lo más grado n + l que interpola af en los nodos Xo, x 1, ••. , Xn, 6. Demuestre que las diferencias divididas son mapeos lineales en relación con las funciones.
t . Sabemos que q se obtiene añadiendo un témrino a p. De hecho, En otras palabras, demuestre la igualdad

(a.f + �g)[Xo, X¡,...,Xn] =a.f[Xo,X¡,, .. ,Xn] + �g[Xo,X¡,...,Xn],


q (x) = p(x) +f[xo, X¡, ..., Xn, t] TI(x - Xj),
j=O 7. Como se señala en el teorema 4, la diferencia divididaf[xo,xtl es el análogo de la primera
derivada. ¿Tiene alguna propiedad similar a (fg)' = J' g +Jg'?
Como q(t) = f(t), haciendo x = t tenemos que: 8. Utilizando las funciones l; definidas en la sección 6.1 y tomando como base los nodos xo,
X¡, ... , x,, demuestre que para todaf.
f(t) = p(t) +J[xo, X¡, ... , Xn, t] TI (t - Xj), 11 11 n i-1
j=O ¿f(x;)l;(x) = ¿J[xo,xi,...,x;] TI<x-xj):
i=O i=O j=O
TEOREMA 4 Si f es n veces continuamente diferenciable en [a, b] y Xo, X¡, . . . , Xn son puntos distintos
de [a, b], entonces hay un punto 1; en (a, b), tal que 9. (Continuación) Demuestre la fórmula siguiente:
n n
1
f[xo, X¡, ..., x.] = �¡<•)(1;). (17) J(xo,xi,... ,x,]= ¿f(x;) TI(x;-Xj)- .
n.
i=O i=O
j1:i
Demostración Sea p el polinomio de a lo más grado n - 1 que interpola a f en los nodos Xo, x¡, . . . ,
Xn-l· Por el teorema 2 de la sección 6.1, hay un punto 1; en (a, b) , tal que
10. Con relación al cálculo de los coeficientes del polinomio de interpolación de Newton, com­
pare la eficiencia del algoritmo de las diferencias divididas con la del procedimiento descrito
n-1
en la sección 6.1.
¡
J(;c.) - p(xn) = 1¡<•)(1;)
n.
TI(xn - Xj), (18) 1 1. Utilice la regla de Cramer en la teoría de matrices para demostrar que
j= O i 1 Xo X5
Xo X5 �- f(xo) �
X¡ X[ x�-l f(x1) 1 X¡ X[ x't
Por el teorema 3 de esta sección, f(Xo,X¡,... ,Xn]= 1
:
n-1 :.. 1
Xn ;. 1 Xn ;. X:
f(xn) - p(x.) = f[Xo, X¡, ... , Xn] TI(Xn - Xj), (19)
i.: f(x,)

j=O 12. Para/(x)·= :i", con m EN, demuestre que


Y al comparar las ecuaciones (18) y (19) se obtiene la ecuación (17). 1 sin=m
f[xo,xi,...,x,] = { ¿ sin>m

SERIE DE PROBLEMAS 6.2 13. (Véase el Prob. 7) Demuestre laf6nnula de Leibniz:


l. Demuestre la ecuación (12) mediante el proceso que se indica en el texto.
2. Demuestre que sif es continua, entoncesf[xo,xi,... ,x,] es continua en el abierto de R"•1, (fg)[Xo, X¡,...• Xn ] = ¿J[xo. X¡, ...• Xk]g[Xk, Xk+l,...• x,,]
donde las componentes del vector (xo. xi,...,x,) son distintas entre sí. k=O
3. Seaf E C"[a, b]. Demuestre que si xo E (a, b) y xi, x2, ..., x, convergen a Xo, entonces
14. Escriba la ecuación del problema 9 en la forma:
f[xo,X¡,...,Xn] Converge af")(Xo)/n!.
4. Demuestre que sif es un polinomio de grado k, entonces paran> k: n n

f[Xo,X¡,... ,x,]= ¿a.d(x;) donde a.;= ¿(x;-Xj)-1.


f(xo,X¡,... ,X¡] = Ü. i=O j=O
j'1/l.i

5. Demuestre que sip es un polinomio de a lo más grado n, entonces Demuestre que si los números x; están ordenados como sigue:

Xo < X¡ < Xz < .. • < Xn,


TI(x-Xj).
11 i-1
p(x) = ¿p[Xo,x1,... ,x¡]
i=O j=O entonces los a.; tienen signos alternados.
11
312 Capítulo 6 Aproximación de funciones 6.3 Interpolación de Hermite 313

15. (Continuación) Demuestre que 24. Determine el polinomio de interpolación de Newton para la siguiente tabla:

0 2 7
y 1 51 113 1 1 1 201
¿a.,x?=l yque ¿a.,=0. X
i=O i=O

16. Seaf(;:) = 1/x. Demuestre que 25. El polinomio p(x) = 2- ( x + 1) +x(x + I)-2x(x + l)(x- 1) interpola los primeros cuatro

f[Xo,X¡, ...,Xn] = (-1)" II


i=O
x,- •
1
-�-... : 1 � l
¡

'I'
1 , I '
Añada un término a p de modo que el polinomio que resulte interpole a la tabla entera.
17. Encuentre el polinomio de interpolación de Newton para los siguientes datos:
26. Escriba el polinomio de interpolación de Newton para los siguientes datos:

3/2 o 2 4 2 o 3
X
X

f(x) 3 13/4 1 3 1 5/3 f(;:) I 63 111712 8

18. Demuestre que sif es un polinomio, entonces la diferencia divididaf[Xo,x1, ... ,x.] es un 27. Establezca un método de iteración para resolver la ecuaciónf(x) = O como a continuación
polinomio en las variablesxo ,xi, ..., x•. se indica: Sean q. el polinomio de interpolación cuadrático para los datos de la siguiente
tabla yXn+l el cero de q. más cercano ax•.
a la funciónf(x) = 1/(1 + x2) sobre el intervalo (- 5, 5]. Utilice nodos unifonnemente
'19. Paran=5, 10 y 15, encuentre el polinomio de interpolación de Newton p. correspondiente

espaciados. Compute en cada caso la diferenciaf(x) - p.(x) en 30 puntos distribuidos a Xn Xn-1 Xn-2

iguales distancias en el intervalo (-5, 5], a fin de observar la divergencia de Pn respecto def. f(;:n) 1 f(Xn-1) 1 f(Xn-2)
20. Demuestre que si u es una función que interpola af enXQ,xi, ..., Xn-1 y si v es una función
que interpola af enX¡, xi, ..., Xn , entonces la función

[(xn-x)u(x) + ( x-XQ)v(x)]/(xn -xo) 6.3 Interpolación de Hermite

interpola af en Xo,xi, ..., x•. El término interpolación de Hermite se refiere a la interpolación de una función y de
21. (Continuación) Considere el arreglo algunas de sus derivadas en un conjunto de nodos. (Posteriormente se dará una definición
más precisa.) Cuando se hace una distinción entre este tipo de interpolación y otra más
Xo Yo ao bo co sencilla (en la cual no se interpolan las derivadas de una función), la última se denomina
X¡ y¡ a¡ b¡ interpolación de Lagrange.
xi y2 a2
X¡ Yl Conceptos básicos
en el cual, para algunax fija, las a;, b; y e; se calculan con las fónnulas: Un ejemplo de interpolación muy educativo y útil es el siguiente. Necesitamos e!
polinomio de menor grado que interpola a una función! y a su derivada f' en dos puntos
a;= [(x;+i-x)y; + ( x-x;)y,.¡]/(x1+1-x;) distintos, digamos·xn y x1• El polinomio buscado deberá satisfacer las siguientes cuatro
condiciones:
b; = [(x1+2-x)a; + (;:-x;)a,.¡]/(x;+2-x;) p(x,) = f (x,) p'(x,) =f'(x;) (i = O, 1).
e; = [(x;+J-x)b; + (x-x;)b1+il/C;:1+i-x;).
En vista de que se cuenta con cuatro condiciones, parece razonable buscar una solución
Demuestre que co es el valor del polinomio de interpolación cúbico enx. en I13, el espacio lineal de todos los polinomios de a lo más grado 3. Un elemento de
Il3 pone a nuestra disposición cuatro coeficientes. Sin embargo, en lugar de presentar a
22. (Continuación) Generalice el algoritmo sugerido en el problema anterior a fin de calcular p(x) en términos de 1, x, x2, x 3, lo hacemos como sigue:
p.(x) para cualquier n. Éste se conoce con el apelativo de algorittno de Neville.
'23. (Continuación) Programe el algoritmo descrito en el problema22 y póngalo a prueba. p(x) =a+ b(x- xo) + c(x- xnJ1 + d(x- xnJ1 (x - x¡).

L 1
314 Capítulo 6 Aproximación de funciones
6.3 Interpolación de Hermite 315

ya que esto simplifica el trabajo. Esto nos conduce a: interesado en el tema puede consultar la monografía de Lorentz, Jetter, y Riemenschnei­
der [1983].
p'(x) = b +2c(x -xo) +2d(x -xo)(x -x1) +d(x -xd.
A continuación pasamos a estudiar una clase muy grande de problemas de inter­
Con ello las cuatro condiciones sobre p se presentan así: polación que tienen soluciones únicas. Los problemas de esta clase restringida gene­
ralmente se conocen como problemas de interpolación de Hermite. En un problema de
Hermite se supone que siempre que se da el valor de una derivada pV\x;) (en un nodo
f(xo) = a x;), también se dan los de p<Hl(x;), pU-Zl(x;), ... , p'(x;) y p(x¡). Escogemos nuestra
f'(xo) = b notación de manera tal que en el nodo x; se den k; condiciones de interpolación. Observe
que k; puede variar si la i cambia. Sean xo, X¡, •.• , Xn, los nodos y suponga que en el
f(x1) = a+bh + ch
2
(h=x1 -xo) nodo X¡ se dan las siguientes condiciones de interpolación:
!'(xi)= b + 2ch+dh2. PVl(x;)=cij (O�j�k;-1,0�i�n). (1)
Obviamente a y b se obtienen de inmediato. La e se calcula con la tercera ecuación, El número total de condiciones sobre p se denota mediante m +1 y por ende
pasando al lado izquierdo los términos que incluyen a a y a b. Finalmente, d puede
determinarse usando la cuarta ecuación. Por consiguiente, el problema tiene solución, m+1 = ko +k¡ +· · · +kn. (2)
sin importar los valores que adopten!(x;) y f' (x;). TEOREMA 1 Existe un único polinomio p en ITm que satisface las condiciones de interpolación de
En general, si se van a interpolar mediante un polinomio los valores de una funciónf Hermite en la ecuación (]).
y de algunas de sus derivadas, se deberán enfrentar algunas dificultades, debido a que los
sistemas lineales de ecuaciones (a partir de los cuales se espera calcular los coeficientes Demostración El polinomio p se busca en el espacio ITm y tiene por lo tanto m +1 coeficientes. El
del polinomio) pueden ser singulares. Un ejemplo sencillo ilustrará este punto. número de condiciones de interpolación que la ecuación (1) impone sobre p también es
m + l. Por lo tanto tenemos para resolver un sistema cuadrado de m +1 ecuaciones
Ejemplo 1 Encuentre un polinomio p que tome los siguientes valores: p(O) = O, p(l ) = 1, con m+1 incógnitas, y deseamos asegurarnos de que la matriz de coeficientes es no
p'(!) = 2. singular. Para demostrar que una matriz cuadrada A es no singular basta con mostrar
Respuesta En vista de que se tienen tres condiciones, proponemos una función cuadrática: que la ecuación homogénea Au = O tiene únicamente la solución cero (u = O). Para
el problema de interpolación que estamos tratando el problema homogéneo consiste en
p(x) = a+bx+cx2. encontrar p E ITm tal que
p<il(x;) = O (O� j�k; - l. O� i � n).
La condición p(O) = O conduce a a = O. Las otras dos condiciones nos dicen:
Dicho polinomio tiene un cero de multiplicidad k; en x; (O � i � n) y debe por lo tanto
1=p(l)=b+c ser un múltiplo del polinomio q dado por
2 = p'(!) = b+c.
q(x) = II(x -xi'.
n

i=O
Y por lo tanto, ninguna función cuadrática resuelve nuestro problema Observe que
la matriz de coeficientes es singular. Si ahora intentamos resolver el problema con un Observe, sin embargo, que q es de grado
polinomio cúbico: n
p(x)=a+bx+cx2+dx'. m+l=rk¡,
i=O
descubrimos que tiene solución, pero ésta no es única Al igual que antes a = O. Las
condiciones restantes son: en tanto que p es a lo más de grado m. Por lo tanto, concluimos que p = q = O. 11
1 = b+c+d
Ejemplo 2 ¿Qué sucede con la interpolación de Hermite cuando sólo existe un nodo?
2 = b+c+ !d. Respuesta En este caso necesitamos un polinomio p, digamos de grado k, para el cual
La solución del sistema es d = -4 y b +c = 5. 11
/i\ro) = Coj (O � j�k).
En este tipo de situaciones el problema general plantea serias dificultades, y su La solución es el polinomio de Taylor
estudio se lleva a cabo mediante la llamada interpolación de Birkhoff, tema al que se co c
le ha dedicado una cantidad considerable de trabajo en los últimos tiempos. El lector p(x) = coo +coi(x -xo) +2!2 (x -Xo)2 +· · · + ok (x -xo)k . 11
k!
316 Capítulo 6 Aproximaci6n defunciones 6.3 lnterpolaci6n de Hermite 31 7

Método de diferencias divididas de Newton a partir de la siguiente tabla de diferencias divididas:


Expliquemos ahora cómo se puede extender el método de diferencias divididas de
Newton para resolver problemas de interpolación de Hermite. Iniciamos con un ejemplo xo f(Xo) !'(xo) f[xo,xo,x¡] f[xo,Xo,X¡,x¡]
sencillo en el que se busca un polinomio cuadráticop que se ajusta a ciertos valores dados: Xo f(xo) f[Xo,x¡] f[Xo,X¡,x¡]
X¡ f(X¡) f'(x ¡ )
p(xo) = coo p'(xo) = coi p(x¡) = C¡o. (3)
X¡ f(x¡)
Presentamos la tabla de diferencias divididas en la forma siguiente:
Las diferencias divididas en las que todos los argumentos son idénticos se definen
según lo estipula el teorema 4 de la sección 6.2. El teorema afirma la existencia de un
Xo CQO CQ¡ ?
punto �, tal que
Xo CQO ? 1 �k)(�).
f[Xo,X¡,... ,X k] = k!J
X¡ ClQ
Los signos de interrogación denotan espacios para datos cuyos valores no se han calcu­ En este caso se debe suponer la existencia y continuidad de ¡<k) en el más pequeño inter­
lado aún. Observe que Xo aparece dos veces en la columna de argumentos, debido a que valo que contenga a los nodos Xo, x1, •.• , Xk. El punto � se encontrará en el mismo in­
se han impuesto dos condiciones sobre p en x0• Además, dése cuenta de que el valor tervalo. Si la longitud del intervalo se reduce a cero, en el límite obtenemos:
dado para p'(Xo) se ha colocado en la columna de las diferencias divididas de primer
orden. Esto concuerda con la ecuación 1
- (k)(Xo).
f[xo,Xo,... ,Xo]-k!f (7)
)-f(Xo) =J'
lím = lím f(x (Xo).
x-.ro f[Xo,X] x-.ro X-X{) Observe que cuando k � 2 debemos tener cuidado de incluir el factor 1 /k!.
Dicha ecuación justifica que definamos Ejemplo 3 Utilice el algoritmo extendido de diferencias divididas de Newton para determinar el
polinomio que ajusta los siguientes valores:
f[Xo,Xo] =!'(Xo).
Las entradas restantes de la tabla de diferencias divididas se pueden calcular de la manera p(l) = 2 p'(l) = 3 p(2 ) = 6 p'(2) = 7 p"(2) = 8.
usual. Las dificultades que puede esperarse que surjan cuando se repiten los nodos
Respuesta Colocamos los datos en el arreglo de diferencias divididas, usando "?" para señalar las
ocurren sólo en la entrada c01, y en este caso el valor de coi, en lugar de calcularse, se ha
cantidades que se deben calcular. El resultado final se coloca a la derecha.
suministrado como parte de los datos. Acto seguido las entradas denotadas con signos
de interrogación se calculan como de costumbre:
2 3 ? ? ? 1 2 3 1 2 -1
p(x¡)-f(Xo) c¡o-coo ' 2 ? ? ? 1 2 4 3
p[xo,x¡] = = . (4)
X¡-X{) X¡-Xo 2 6 7 4 2 6 7 4
2 6 2 6
PXo,Xo,X¡
[ l=
p[xo,x¡]-p[xo,Xo] c10-coo
= (X¡-xo)2 - --.
co1
(5) ' 2 6 2 6
X¡-Xo X¡-Xo
Observe que la fila 3 se inserta en la segunda diferencia de 4 en concordancia con la
El polinomio de interpolación se escribe de la manera usual: fórmula (7) para el caso k = 2. Cuando se ha completado el arreglo, los números de
la fila superior (excluyendo el nodo) corresponden a los coeficientes del polinomio de
p(x) = p(xo) + p[Xo, Xo](x-xo) + p[Xo,Xo, x¡](x-Xol (6)
interpolación:
El problema 5 sugiere la verificación directa de que, en efecto, este polinomio resuelve
el problema planteado por la ecuación (3) . p(x) = 2 + 3(x-1) + (x-1)2 + 2 (x --' 1)2(x-2 )-(x-I)2(x-2)2. 1
Regresemos ahora al ejemplo utilizado al principio de esta sección. Podemos
construir directamente el polinomio .Forma de Lagrange

p(x) = f(Xo) +!'(xo)(x-xo) + f[Xo, xo,X¡](x-Xoi En principio es posible desarrollar para la interpolación de Hermite fórmulas afines
a la fórmula de interpolación de Lagrange. Presentaremos una de dichas fórmulas que
+ f[xo,xo,X¡,X¡](x-Xoi(x-x¡) atañe a un caso muy importante. Al igual que antes, los nodos son Xo, x1, ••• , Xn, y
318 Capítulo 6 Aproximación de funciones 6.3 Interpolación de Hermite 319

suponemos que para cada nodo se han dado los valores de la función de su primera En el siguiente teorema se proporciona una fórmula para el error asociado a este
derivada. El polinomio p que buscamos debe satisfacer las siguientes ecuaciones: tipo de interpolación de Hermite.
p(x,) = c,o p' (x,) = e¡¡ (O� i � n). (8) TEOREMA 2 Sean xo, x1, ..., x. nodos distintos en [a, b] y seaf E c2n+2 [a, b]. Si p es el polinomio
de a lo más grado 2n + 1 tal que
De manera similar a como se hizo con la fórmula de Lagrange escribimos:
p(x;) = f(x;) p' (x,) = !'(x;) (O� i � n),
¿ c;oA;(x) + ¿ c;¡B;(x),
n n
p( x) = (9)
i=O i=O entonces a cada x en [a, b] corresponde un punto� en [a, b] tal que:
en donde A; y B, son polinomios con ciertas propiedades. Un momento de reflexión nos /2n+2) n
revelaque las siguientes propiedades se acomodan perfectamente a nuestros propósitos: f (x)- p(x) = (
2
TI(x-x¡) .
2n + 2) .1 i=O
A;(Xj) = 8ij B;(Xj) = o
Demostración Si x es un nodo, resulta obvio que la fórmula es correcta. Fijemos x suponiendo que no
A;(xj) = O B/(xj) = 8ij, es un nodo. Defina w y $ mediante
En efecto, si A, y B, poseen dichas propiedades, entonces resulta trivial mostrarque p, tal
como aparece en la ecuación (9), tendrá las propiedades de interpolación que aparecen
en la ecuación (8). Se puede ahora verificarque con ayuda de las funciones
w(t )= II(t -
i=O
xi $=f-p-1,.w,

II
n X X
- j donde A. se escogió de maneraque$(x) = O. Observeque$ tiene al menos n+2 ceros en
e,(x) = (O� i � n).
X¡-Xj [a, b], a saber x, Xo, x1, ... , x•. Por el teorema de Rolle sabemos que$' tiene al menos
j=O
�¡ n + 1 ceros distintos de los puntos ya ennumerados. Además,$' se anula en cada nodo.
Por consiguiente $' tiene al menos 2n + 2 ceros en [a, b]. Una vez más, por el teorema
A, y B, se pueden definir como sigue: de Rolle,$" tiene al menos 2n + I ceros en (a, b), y repitiendo el argumento concluimos
que $(2n+2) tiene un cero, llamémoslo �, en (a, b). Por tanto
A¡(x) = [1 - 2(x -x;)f/(x,)]f;(x) (O� i � n)
(O� i � n).
Q = $(2n+2)(�) = /2n+2)(�) _ P'2n+2\�) - A.W(2n+2)(�).
B,(x) = (x -x;)f;(x)
Dése cuenta deque cada e, es de grado n, y que por lo tanto A; y B; son de- grado 2n + I. Ya que p es de a lo más grado 2n + 1, resulta que p(2n+Z) = O. Ya que w(t) tiene como
Por consiguiente p será de a lo más grado 2n + l. Y así debería ser, en vista de que en término con la potencia más alta a t2n+2 , se concluye que w(2n+2l = (2n + 2)!. Usando
la ecuación (8) se impusieron 2n + 2 condiciones sobre p. esta información junto con el valor A. = [/(x) - p(x)]/w(x) en la ecuación para $(2n+Z),
La forma de Lagrange del polinomio de interpolación en el ejemplo 1 se expresa: obtenemos
O= /2n+Z)@ - [/(x) - p( x)]( 2n + 2)!/w(x),
p(x) = f(xo)Ao(x) +/(x1 )A 1 (x) +J'(.xo)Bo(x) +J'(x¡)B¡(x), que es otra forma de la ecuaciónquequeríamos comprobar. 11
donde
A0 (x) = [1 - 2(x-.xo)f�(xo)]f5(x) Diferencias divididas con repeticiones
A1 (x) = (1 - 2(x-X¡)f\ (x¡)]ff(x) El resto de esta sección se dedica a discutir el tema de las diferencias divididas
cuando se permiten repeticiones en los argumentos. Hay muchas maneras de proce­
Bo(x) = (x -.xo)f5(x) der, como usar una definición recursiva (Braess [1984]) o una definición con determi­
B1 (x) = (x-xi)Rf(x) nantes (Schumaker [1981]), o simplemente extendiendo la definición antes dada para
f[x0, x1 , ..., xnl en el caso de argumentos distintos. Tomaremos la última opción, si­
y guiendo a Conte y de Boor [1980].
X-X¡ x-xo
fo(x) = f¡(X) = Recuerde que si los puntos x0, x1 , ... , Xn son distintos, entonces /[Xo, X¡, ... , Xn]
xo-x 1 X¡ -Xo se ha definido en la sección 6.2 como el coeficiente de x" en el polinomio de que rr.
1 1 interpola/ en x0, x1, ••• , x•. Definamos ahora el significado de interpolación para el
f�(X) = f\(x) = caso en que la lista de puntos incluye repeticiones.
Xo - X¡ X¡-Xo
320 Capítulo 6 Aproximación de funciones 6.3 Interpolación de Hermite 321
Definición Decimos que f interpola O en .ro, x 1, • • • , Xn si ¡{k-l)(�) = O para cada punto � que de lo que es una diferencia dividida, el coeficiente de x" en
p es f[.ro, x 1, ••• , x.]. Por
aparece k o más veces en la lista.ro,X¡, • • • , x•. consiguiente,el polinomio

Así,por ejemplo,diremos quef interpolaO en 1, 3 , 8, 1,13, 1,8 si


TI( -x;)
n-1
p( x ) -f[Xo, X¡, ..., x.] x
f(l)=f(3)=f(8)=J'(l)=!(13) =f"(l)=J'(8)=Ü. i=O

Es fácil demostrarque un polinomio p interpolaO en x o, x¡, ...,Xn si y sólo si p(x) es de a lo más grado n- l . Como se muestra en los problemas 8 , 9 y 11,dicho polinomio
contiene el factor interpola aj en x0 , x1, ••• , x._ 1• Por la unicidad de q debemos tener:
q( x ) = íl( x - xj ).
j=O
TI(x -x;) = q( ).
n-1
p( x ) - f[Xo, x 1, •.• , x.] x
Sif y g son funciones talesquef-ginterpolaO en xo,x1,... ,Xn , entonces decimos
i=O
quef interpolag(o g interpola!) en.ro,X¡, ..., x•.
Usando esta terminología el teorema demostrado anteriormente en esta sección se Por lo tanto,
puede replantear de la manera siguiente:
TI( -x¡)
n-1
p(x) = q( x ) + f[xo, x ¡, ..., x.] x
TEOREMA 3 Sea Xo,x¡, ...,Xm una lista de puntos en la cual ningún elemento se repite más de k í=O
veces. Sea f una función de clase ck-l sobre un intervalo que contiene estos puntos.
n j-1
Ex iste entonces un polinomio único en ITm que interpola a f en los puntos dados.
= ¿f[XQ, x ¡, ..., xj]IT( x - x¡). 11
j=O í=O
La definición de f[ x o, x1, .•• , x .] en el caso general señala que es el coeficiente
rr.
de x" en el polinomio de que interpola a f en x0, x 1, ..• , x•. Si un número �
El problema final es establecer si las diferencias divididas en su forma general
aparece k veces en la lista,entonces esta definición necesita la existencia de la derivada
¡(k-ll(�). En el caso contrario no existe la diferencia dividida (es decir, no está definida). obedecen a la relación de recurrencia:
Una vez hecha esta definición,podemos pasar a demostrar la validez de la fórmula de
interpolación de Newton general. f[XQ,x¡, ..., x .] = {f[x ¡, Xz, ..., xn] -f[Xo,X¡, ...,x n-rl} /( x.-.ro).

n j-1

TI
p( x ) = ¿f[Xo,X¡, ..., Xj] (x- x¡). (10)
Supongamos que.ro � x1 � • • · � x•. Esto no conlleva ninguna pérdida de generalidad,
en cuanto que las diferencias divididas generalizadas son funciones simétricas de sus
j=O i=O argumentos.(La demostración de este hecho, proporcionada en la sección 6.2,también
es válida en el caso general.) La relación de recurrencia obviamente no se cumple en el
Recuerdeque por definición TI�0(x - x¡) = l . caso x. = .ro. Pero esta igualdad implica que.ro= x 1 = · · ·= x. y éste es precisamente
el caso para el cual desearemos usar la fórmula
TEOREMA 4 Sif es suficientemente diferenciable como para que existan las diferencias divididas que
aparecen en (1 O), entonces dicha ecuación da el polinomio p en IT.,que interpola a f
en x0, x 1, ••• , x•. f[Xo, Xo, · ·.,Xo] = �¡<n)(XQ).
n.

Demostración Procedemos por inducción sobren. Paran = O se afirma que f[x o] es el polinomio en En todos los demás casos la fórmula recursiva es válida. Procedemos ahora a demostrarlo
IIo que interpola aj enXQ. Esto obviamente es cierto. formalmente.
· Suponga ahoraque el polinomio q,definido mediante
n-1 j-1
TEOREMA 5 Sea Xo � x 1 � •• • � x.. Entonces las diferencias divididas obedecen a la siguiente
q( x ) = ¿f[Xo, X¡, ... ' Xj] I1(x- X;) fórmula recursiva:
j=O i=O
f[ x ¡, xz, ..., Xn ] - [ x o,x¡, ...,Xn-il
! si x . ;1:xo
interpola aj en x0, xi, ... , Xn-l · Sea p el polinomio enIIn que interpola aj en.ro,x 1, ••• , f[XQ,X¡, ...,Xn ]-
-{ X,. X¡
• (11)
x •. Los teoremas anteriores garantizan la existencia y la unicidad de p. Por definición ¡< )(xo)/n! six. = .ro
322 Capítulo 6 Aproximación defunciones
6.4 Interpolación de splines 323
Demostración Procedemos por inducción sobren. El polinomio en Il1 que interpola aj en Xo y x1 es: 6. Verifique las propiedades que deben satisfacer las funciones A; y B;.
7. Demuestre que el polinomio de Taylor
X
p(x) = { (x-xo)[f(x¡) -j( o)]/(x -Xo) +j(xa) (Xo ;=x1)
f'(xo)(x¡-xo) +j(xo) (Xo = x¡).
¿ {/1\xo)(x-xo)Í.
k-1

p(x)=
En este polinomio el coeficiente de x es: i=O },

interpola aj en .xo. xo,... ,xo (k repeticiones).


j -j o (x -.xo) (xa ;=x1)
j[x0,x¡] = { { [x¡J [X l}/ 1 8. Demuestre que un polinomio interpola O en.xo,xi,... , x. (se permiten repeticiones) si y sólo
f' (xo) (Xo = x 1) si contiene el factor rr;=O(X - X¡).

Esto concuerda con la ecuación (11) . 9. Demuestre que sif interpola a g en.xo,xi, ... ,x,,,y si h interpola a O en estos puntos,entonces
f ± ch interpola a g en estos puntos.
Suponga ahora que la ecuación (11) es válida para todas las n, desde 1 hasta m-1.
inclusive. Sea x 0 � x 1 � • • • � Xm una lista de nodos, y considere el polinomio p en Ilm 10. Fije xo,x1,... , x. y demuestre que el conjunto de funciones que interpola O en estos puntos
que interpola aj en estos puntos. Si Xm = x0, entonces todos los puntos Xo, x 1, ••• , Xm es un álgebra; es decir, es cerrado bajo la adición, multiplicación, y multiplicación por
escalares.
son el mismo. En este caso, del problema 7 se deduce que p es el polinomio de Taylor

t
dej en xo dado por: 11. Demuestre que sifinterpola O en los nodos.xo,x1, ... , x.,entonces interpola O en los nodos
XO, Xt,... ,Xn-l.
p(x) = �j<kl (xo)(x-xof 12. Sea .xo < xi < · · · < Xn ,y seaf una función continuamente diferenciable. Demuestre que
k=O
a
El coeficiente de xm en p(x) es ¡(ml(x0)/m!, y esto muestra la validez de la ecuación a-f[ XO, X¡, ..., Xn] = j[XO, X¡, .•. , X¡, X¡, Xi+!, •.., Xn].

(11) para el caso en que n = m y Xm = xo. En el otro caso resulta válido el argumento
usado para demostrar el teorema 1 de la sección 6.2. 11 13. Tomando n = 2, escriba en detalle y luego simplifique las funciones A ; y B; que aparecen
en la ecuación (9).
14. Deduzca unafórmula paral/(x).
SERIE DE PROBLEMAS 6.3
15. (Use el teorema de Rolle) Seaf E C"[a, PJ. Suponga que f tiene un cero de multiplicidad
l. Use el método extendido de diferencias divididas de Newton para obtener un polinomio de mena y una raíz de multiplicidad k en p, con m � l , k � 1,y m+ k + 2 = n. Demuestre
grado 4 que ajuste los siguientes valores: que f•l tiene al menos un cero en (a, P ).
16. Considere el polinomio
X

p(x)
o
2[-4144
2
p(t) = b - (b - a) 3
[ (b-t)2
b
_
a
-2
(b-t)'
b
_
a
]
p'(x) -9 4
Demuestre que [p'(t)I � p'((a + b)/2) = 3/2,p(a) = a, p(b) = b, p'(a) = O y p' (b) = O.

2. (Continuación) Encuentre un polinomio de grado 5 que ajuste los valores dados en el


problema 1 y que, además, satisfaga p(3) = 2.
6.4 Interpolación de splines
3. Obtenga una fórmula para el polinomio p de menor grado que ajuste estos valores:

p(x;) = y; p' (x;) = O (O� i� n) Una función spline está formada por varios polinomios, cada uno definido sobre un
subintervalo, que se unen entre sí obedeciendo a ciertas condiciones de continuidad.
4. ¿Qué condición se debe imponer sobre los nodos .xo y xi si se quiere que el problema de Para una definición formal procedemos como sigue: suponga que se han especificado
interpolación n + 1 puntos to < t¡ < · · · < tn, Estos puntos se llaman nudos. Suponga además que se
p(x;) = c;o p"(x¡) = c,1 (i = O, 1) ha fijado un entero k � O. Una función spline de grado k con nudos en to , t1, .•• , tn es
se resuelva con un polinomio cúbico (para Cij arbitrario)? una función S que satisface las siguientes condiciones:

5. Demuestre que el polinomio dado en la ecuación (6), con las diferencias divididas de las (i) en cada intervalo [t¡_ 1, t;), S es un polinomio de grado � k.
ecuaciones (4) y (5), satisface las condiciones de la ecuación (3). ( ) S tiene una derivada de orden (k-1) continua en [to, t.].
ii
6.4 Interpolación de splines 325
324 Capítulo 6 Aproximación defunciones
Si se han dado los nudos t¡ y los coeficientes a¡, b¡, el valor de S en x se obtiene
s.

r
s, identificando primeramente el subintervalo [t¡ , t;+I) que contiene a x. La función spline
¡ se puede definir sobre toda la recta real. Por conveniencia podemos utilizar la expresión
•1
So
1 /¡ /3
1
1
1 •
1
X
aax + bo sobre el intervalo (-co, tI) y la expresión ª•-Ix + bn -l sobre el intervalo
[tn -i, co). La función Ses continua, y por ello los polinomios que la integran se unen

en los nodos; es decir, S;(t;+1) = S;+i (t;+1). A continuación presentamos un seudocódigo
lo 1 1 /4. /5
1 1
.,__..!¡ para calcular el spline S(x) de primer grado.
S2 .___
Si
input (t;), (a¡), (b);, x, n
Figura 6.2 Un spline de grado O. for í = 1, 2, ... , n - I do
ifx < t¡ then
S(x) = a¡ _Ix+ b¡ _¡
outputS(x)
stop
end if
end
S(x)=ª•-IX+ bn-1
output S(x).

Splines cúbicos
Debido a que en la práctica los splines cúbicos (k = 3) se usan con frecuencia,
vamos a presentar con más detalle su construcción y la teoría subyacente. Supondremos
Figura 6.3 Un spline de grado l. que se ha dado una tabla de valores:

X to t¡ t.
tiene
Por consiguiente Ses un polinomio continuo por pedazos de a lo más grado k, que y Yo YI Yn (1)
derivadas continuas de orden hasta k( - I).
Los splines de grado O son funciones constantes por pedazos. Una forma explícita y que se debe construir un spline cúbico Spara interpolar la tabla. Sobre cada intervalo
de presentar un spline de grado O es la siguiente: [to, t¡], [tI, t2], ... , Un -1, tn], Sestá definida por un polinomio cúbico diferente. Sea S;
el polinomio cúbico que representa a Sen [t¡, t;+tl· Por ende:
So(x) = co x E [to, t1)
S¡ (X) = C¡ X E [tI, t2) So(x) E (to, t¡ ]
{.
X
S(x) =
S¡ (X) x E [tI , t2]
Sn _¡(x) = Cn -I X E [tn -I, tn )• S(x)= { . (2)

Los intervalos [t;-I, t¡) no se intersecan entre sí y por ello no surge ambigüedad al definir Sn-I (x) X E (tn -I, tn ]•
la función en los nudos. La figura 6.2 muestra un típico spline de grado O con seis nudos.
La figura 6.3 muestra la gráfica de una función spline de grado 1 típica con nueve Los polinomios S;_1 y S;interpolan el mismo valor en el punto t¡ y por ello:
nudos. Una función tal se puede definir explícitamente escribiendo:
S;_1 (t;) = y¡ = S;(t¡) (1 � i � n-1). (3)
So(x) = aax+ bo X E [to, t¡)
S1 (x) = aix+ b1 X E [tI, t2) Esto hace que S sea continuo automáticamente. Además, se supone que S' y S" son
S(x) = { . continuos, y estas condiciones se usarán en la deducción de una expresión para la función
spline cúbico.
Sn-1 (x) = an-!X+ bn-l X E [tn -I, t.).
326 Capítulo 6 Aproximación defunciones 6.4 Interpolación de splines 327

¿Proporciona la continuidad de S, S' y S" suficientes condiciones para definir un De manera análoga, si utilizamos la ecuación (7) para obtener S;_ 1, llegamos a:
spline cúbico? Se cuenta con 4n coeficientes en el polinomio cúbico por pedazos, ya
que hay 4coeficientes en cada uno de los n polinomios cúbicos. Sobre cada subintervalo h; 1 1
S¡_¡(t¡) = - -Zi-! + - --Zi-Yi- + .J!.....
h¡_¡
[t;, t;+d se tienen dos condiciones de interpolación, S(t;) = y; y S(t;+ 1) = Yi+ I, lo cual 6 3 h¡_¡ h¡_¡ ·
(9)
resulta en 2n condiciones. La continuidad deS no proporciona condiciones adicionales,
en vista de que ya se ha tomado en cuenta en las condiciones de interpolación. La
Si se igualan los términos del lado derecho de las ecuaciones (8) y (9), el resultado se
continuidad de S' proporciona una condición en cada nudo interior, Sf_1 (t;) = Sf (t;),
puede escribir como:
lo que corresponde a n - I condiciones adicionales. Análogamente la continuidad de
S" redunda en n - I condiciones. Por consiguiente se cuenta con un total de 4n -2
condiciones para determinar 4n coeficientes. Quedan aún dos grados de libertad, y hay 6 6
h¡_¡z¡_¡ + 2(h ¡ + h¡_¡)z¡ + h;Zi+I = - · ( Yi+l -y¡) - - · (y¡- y¡_¡). (10)
varias maneras de utilizarlos para nuestro beneficio. ht hi-1
Deducimos ahora la ecuación para S;(x) en el intervalo [t;, t;+1J. Primero definimos
los números z; = S"(t;). Obviamente losZ; existen para O � i � n y satisfacen Esta ecuación se utiliza sólo para i = I, 2, ... , n-1. (¿Por qué?) Esto genera un sistema
de n - I ecuaciones lineales para las n + 1 incógnitas zo, z1, • • • , z.. Podemos elegir
límS"(x) =Z; = IímS"(x) (1 � i � n -1) (4) zo y Zn de manera arbitraria y resolver el sistema de ecuaciones resultante para obtener
Zt, z2, ... ,Zn-t· Una excelente elección es zo = Zn = O. La función spline resultante
xlt; xjt;

se llama spline cúbico natural. (Esta elección de spline se apoya en un teorema que se
debido a queS" es continua en cada nudo interior. Ya queS; es un polinomio cúbico en demostrará más adelante.)
[t;, t;+d, Sf' es una función lineal que satisface S/' (t;) = Zi y Sf' (t;+1) = Zi+ t y por tanto
El sistema lineal de ecuaciones (10) para 1 � i � n - 1 con zo = O y Zn = O es
corresponde a la línea recta entre Z; y Z;+ 1
simétrico, tridiagonal, diagonalmente dominante, y de la forma

; x) =
Z¡ i+I Z
(5)
S"(
¡;1 U;+¡-x) + -¡1 ;(x-t;), U¡ h¡ Z¡ V¡
h¡ U2 h2 z2 V2
donde h; = t;+i - t;. Si integramos dos veces esta expresión obtendremos S;: h2 U3 h3 Z3 r V3
=
S;(x) =
Z¡ 3 Zi+I 3
(t;+ 1-x) + (x -t;) + C(x- t¡) + D(t;+i - x), (6) hn-3 Un-2 hn-2 Zn-2 l Yn-2
6h¡ 6h;
hn-2 Un-1 Zn-1 Yn-1

donde C y D son constantes de integración. (Como verificación derive la Ecuación ( 6)


dos veces y obtenga (5).) Las condiciones de interpolación S¡ (t¡) = y; y S;(t;+ 1) = Yi+t donde
se pueden imponer a S; para determinar C y D. El resultado es: h; = t¡+¡ - t¡
Z+i l U¡= 2(h¡ +h¡_¡)
S¡ (x) =
Z¡ 3
(t;+ 1 - x)3 + (x- t¡)
6h; 6h¡ 6
(7) b¡ = -( y¡+¡ -y¡ )

Yi+ l Z;+¡h¡ y¡ Z;h¡
+ ( h¡ + - - (x- t;) + ( -¡;; - (t;+ 1-x).
6 ) 6) V¡ = b;-b¡ _¡

La ecuación (7) también se puede verificar fácilmente. Simplemente tome x = t¡ y Se puede resolver usando un algoritmo especial (eliminación gaussiana sin pivoteo de
x = t;+i para ver que se satisfacen las condiciones de interpolación. Una vez que se han filas escaladas ), como se muestra a continuación:
determinado los valores de zo, z1, ••• , Zn, se pueden utilizar las ecuaciones (2) y (7) para
calcularS(x) en cualquier x del intervalo [to, t.].
Para deterrninar·los valores de z1,Z2, ..., Zn-I utilizamos las condiciones de conti­ input n, (t;), (y¡ )
nuidad impuestas sobreS'. En los nudos interiores t¡ debemos tener queSf_1(t;) = Sf(t¡). for i = O, I, ..., n - I do
Si derivamos la ecuación (7) obtenemos Sf (x). Sustituyendo x = t¡ y simplificando h¡ ,__ t;+I - t¡
obtenemos:
b; ..... 6(y;+1-y¡ )/h¡

S¡(t¡) = -jz;
h;
6
-
y¡ Yi+l
z+i I - h¡ + -¡;;· (8)
end
328 Capítulo 6 Aproximación de funciones 6.4 Interpolación de splines 329

U¡ +- 2(ho +h¡) (7) en una forma anidada más eficiente:


V¡ +-b¡-bo
for i = 2, 3, ... , n - 1 do S;(x) =y¡+(x-t¡) [C; +(x-t¡)[B; +(x-t;)A;]], (11)
U¡ +-2(h¡ +h¡_¡ )-h¡_¡/Ui-J
donde
V¡+- b¡ -b¡_¡-h¡_¡ V¡_¡/u¡_¡
1
end A¡ = (Zi+l - Z¡)
6 h¡
Zn +- 0 B--�
,-
for i = n-1, n-2, ... , 1 do 2
Z¡ +- (v; - h¡Z;+i)/u; h- h· 1
C¡ =--tZi+I - -tz¡ + h¡(yi+l - y¡)
end
zo +- o Tomando en cuenta estas explicaciones, el lector no deberá tener problema para
output (Z¡). diseñar un subprograma o rutina que haga los cálculos que se muestran en la ecuación
( 1 1). Tomaría como datos de entrada el número n, el conjunto de nodos (t¡), el conjunto
(y¡) de valores de la función, y los (z;) que resultaron de la rutina anterior. También
Se puede escribir fácilmente un subprograma o procedimiento basado en el algo­ tomaría como entrada un sólo número real x para dar como salida el valor de S(J).
ritmo anterior. Aceptaría como entrada un conjunto de nodos (t;) y el conjunto de los A continuación presentamos algunos de los resultados que se obtuvieron mediante
valores de la función correspondientes (y¡). La rutina calcularía y produciría un arreglo un sencillo programa de prueba para dos rutinas basadas en los algoritmos que se acaban
de los valores (Z¡). de mostrar. Tomamos muestras de la función f(x) = .¡i en 1 1 nudos igualmente

=
En vista de que en este algoritmo se producen divisiones por u;, necesitamos de­ espaciados en el intervalo [ O, 2.25], interpolamos con una función spline cúbico S, e
mostrar que u;"#- O. Con esto en mente demostramos por inducción que u¡>h¡>O. Esto imprimimos las diferencias E(J) S(x)-f(x) en 37 puntos:
resulta evidente para i = 1, ya que u¡ = 2(ho +h¡ ). Si u¡_¡ >h;- 1 , entonces u; >h;,
debido a que X IE(x)I
0.0000 O.O
h2 l 0.0625 l .0732 1E-Ol
U¡ = 2(h¡ +h¡_¡)-_;::._>2(h¡ +h¡_¡ )-h¡_¡ >h¡ = t¡+¡ -t¡>Q
U¡_¡ 0.1250 7.52666E-02
0.1875 3.326 17E-02
Una vez que se han determinado los coeficientes zo, Z¡, ... , Zn, puede calcularse 0.2500 o.o
cualquier valor de la función spline cúbico (2) a partir de la ecuación (7). Dada cualquier
x es necesario determinar primero cuál de los intervalos 1.7500 o.o
1.8 125 3.64780E-05
(-oo, t¡ ), [t¡ , t2), ... , [tn-2, tn_ ¡ ), [tn- 1 , oo) 1.8750 6.36578E-05
1.9375 5.85318E-08
contiene a x. Por convención utilizamos So no sólo en (to, t¡ ], sino también en (-oo, to).
2.0000 o.o
2.0625 1.14083E-04
Igualmente utilizamos Sn-l en [tn-1 , tn] y en Ctn, oo). El intervalo que contiene a x se 2.1250 2.123 12E-04
determina examinando, de manera ordenada las diferencias, 2.1875 2.04682E-04
2.2500 o.o
X-tn-1, X-tn-2, ...,X-t¡
Los datos de salida muestran que el error, E, es cero en cada nudo. Para los puntos que
para ver si alguna es no-negativa. Si una de ellas es no negativa, tomamos la primera para no son nudos, IEI no es mayor que 0.1 1. El valor más grande de IEI se presenta en [to, t¡].
la cual esto ocurrió, digamos x-t¡. Entonces x-t; � O, pero x-t;+1 < O, y por lo tanto é¿Por qué?)
t¡ � x < t;+t· Si todos los términos examinados son negativos, entonces x E (-oo, t 1 ]. A Presentamos ahora un teorema que nos dice que el spline cúbico natural genera la
partir del índice i así determinado, usando la ecuación (7) se puede calcular el polinomio función de interpolación más suave posible. En el teorema se da el significado técnico
deseado S; en el punto x dado. Sin embargo, utilizando el problema 4 podemos reescribir de la palabra suave.
330 Capítulo 6 Aproximación defunciones 6.4 Interpolación de splines 331

TEOREMA 1 Seaf" continua en [a, b] y tomemos a= to< t¡ < ... < tn = b. Si S es el spline cúbico
natural que interpola af en los nudos t¡, para O � i � n, entonces:

[ [S"(x)]\ix � [ [J'1(x)] 2 dx
=
Demostración Sea g f -S. Entonces g(t;) = O para O � i � n y o 10 15 20 25

Figura 6.4(a) Curva de spline con tensión alta (i: = 10).


[u"idx = [(s")2dx+ [(g")2dx +2 [ s"g"dx

La demostración estará completa si podemos hacer ver que

¡ S"g"dx � O
b

La justificación de esta desigualdad se lleva a cabo integrando por partes, usando la


condición S"(to) = S"(tn) = O, y el hecho de que S"' sea constante (digamos que vale
e;) en (t¡_¡, t;].
¡t' o 15
},, , S11 g11dx
n 10 20 25
L
{b
S11 g11 dx =

t{
Jaª

El dx}
i=I 11-1 Figura 6.4(b) Curva de spline con tensión baja (i: = 0.1 ).

= (S"g')(t¡ )-(S"g')(t¡_¡)- S"'g'

=-t [ S"'g'dx=-te;[' g'dx de interpolación. Cuando i: -+ +oo, la curva tiende a la función lineal por pedazos, es
i=l tr-1 i=l t1-1 decir, al spline de grado l .
Un modelo matemático de una curva como la que acabamos de describir es el
L C (g(t )-g(t¡_¡)] = o
n
11 siguiente. Al igual que antes, tenemos nudos
=- ¡ ¡
i=l
to< t¡ <···<In
Recuerde que la curvatura de una curva descrita por la ecuación y = f(x) es la
cantidad
\J"<x)\ [1 + {f'(x)}2r ;
3 2 y datos y¡ para cada t;. El spline de tensión que buscamos es una función! que tiene las
siguientes propiedades:
Si se elimina el término no lineal entre corchetes, \f"(x) [ queda como una aproximación
de la curvatura. En la interpolación de spline cúbico natural lo que encontramos, ·de­ (i) f E C2 [to, tn]
bido a que la cantidad J: [!" (x)J2 dx se minimiza, es una curva con (aproximadamente) (ii) f(t;) = YÍ (O � i � n)
curvatura mínima sobre un intervalo.
(iii) Sobre cada intervalo abierto (t;_ 1, t;),f satisface¡(4l -i:2f" = O.
Splines de tensión Con ello, f tiene globalmente dos derivadas continuas, interpola los datos proporcio­
En algunos problemas de ajuste de datos resulta útil disponer de un parámetro i:, nados, y satisface cierta ecuación diferencial en cada subintervalo. Es evidente que
que se conoce como tensión. Cuando i: tiene un valor grande la curva que pasa a través esta receta genera un spline cúbico cuando, = O, ya que las soluciones de la ecuación
de los puntos dados tendrá una tensión alta. Esto se puede interpretar como una fuerza ¡(4) = O son polinomios cúbicos.
Para determinar f procedemos igual que en el caso de los splines cúbicos. Por
que estira la curva, tensándola entre los puntos, tal como se muestra en las figuras 6.4 (a
y b). Cuando i: tiene un valor bajo, la curva toma una forma más cercana al spline cúbico =
consiguiente, tomamos z; f"(t;) y planteamos las condiciones que debe satisfacerf
6.4 Interpolación de splines 333
332 Capítulo 6 Aproximación de funciones
El enfoque poco sofisticado que hemos esbozado se puede utilizar para llevar a cabo
sobre el intervalo [t¡, t;+1J:
experimentos interesantes. Por ejemplo, a las dos curvas que se muestran en las figuras
6.4 (a) y 6.4 (b). En la primera tomamos t= 10 y en la segunda t = 0.1. Se utilizaron
¡(4) _ 't !'' = Ü
2
los mismos datos, compuestos de valores dados de la función en los puntos t; = i, para
f(t¡ )=y¡ f(t,+1) =Yi+l O�i�25.
Los splines de tensión fueron presentados por primera vez por Schweikert [196 6 ].
f11(t;) = Z; f" (t;+J)= Zi+I
Otros artículos relacionados con esto son los de Cline [1974a,b] y de Pruess [1976,
Se puede verificar que la solución a este problema de valor en la frontera para dos 1978]. Cline ha generado software para el cálculo de curvas y de superficies con la
puntos es
ayuda de splines de tensión. Una alternativa a los splines en tensión es el spline rígido
de Boor [1984]. Estas funciones son splines cúbicos ordinarios con nudos adicionales
(y datos también) colocados en las regiones en donde se desea que la curva cambie
J(_x)= {z; senh[t' (t;+J -x)] + Zi+l senh['t(x - t;)l} /['t2 sen h('th;)] abruptamente de dirección. La ventaja de los splines rígidos es que no necesitan de
(12)
+ (y¡ -z;/t2)(t;+l -x)/h¡ + (Yi+I -Z;+i/'t2 )(x -t¡)/h¡ programas nuevos de computadora y evitan la carga computacional derivada de usar
funciones hiperbólicas.
Una vez que se han determinado los coeficientesz;, esta ecuación se utilizará para calcular
los valores de f en el intervalo [t;, t;+il· Todo esto guarda una fuerte semejanza con el
caso de los splines cúbicos. Teoría de splines naturales de grado superior
Para que f sea globalmente de clase C2 se deben imponer las condiciones En la parte final de esta sección presentamos algunos elementos de la teoría de spli­
nes naturales de grado superior. Los splines naturales sólo existen para grados impares,
límf'(x) = Iímf'(x) ( l � i�n-1) y por ello el grado se denotará por medio de 2m + l . Cuando m = I se tienen los splines
xlx, xTx,
cúbicos naturales, tal como se presentaron anteriormente. En el caso de la teoría general
en los nudos interiores. No se incluyen aquí los tediosos cálculos que esto implica. Basta es conveniente proceder de manera diferente. Al igual que antes, se da un conjunto de
con saber que se llevan a cabo de forma similar a como se hizo en el caso de los splines nudos:
cúbicos. El resultado es un sistema tridiagonal de ecuaciones conzo, z1, ..., Zn como to < ti < · · · < r•.
incógnitas, que se puede escribir en la forma
Un spline natural de grado 2m+1 es una función S E c2m (]R) que se reduce a un polinomio
a.;-1Zi-l + (�i-1 + �¡)Z¡ + CT.¡Zi+ l = Yi -Yi-1 (1� i�n -1), (13) de grado�2m + 1 en cada intervalo [to, t¡ ], [t¡, t2 ], ... , [tn-l, t.] y a un polinomio de a
lo más grado m en (-oo, to) y en (t., oo). Con esta definición, un spline cúbico natural
donde se utilizan las siguientes abreviaturas: se debe reducir a polinomios lineales en (-oo, to) y en (tn, oo).
El espacio lineal de todos los splines naturales de grado 2m + 1 con n+ I nudos to,
a.;= 1/h; -t/ senh(th;) t1 , . • . , tn, se denota con Af2m+l (t0, t1 , • . . , tn ) o, en aras de la brevedad, con N7:'+1 •
Resulta conveniente utilizar la llamada función de potencias truncada, denotada
�¡ = t cosh(th;) / senh('th; ) -1/h; por .xi;.. Ésta se define como x" si x � O, y como O si x < O. Esta función pertenece a la
y¡= t2(yi+l -y¡)/h¡ clase de continuidad cn- 1•

nar el vector
Puede observarse que se necesitan dos condiciones adicionales para determi TEOREMA 2 Cada miembro de N';;1"+1 tiene una representación del tipo
una posibili dad consiste en especifi car que
z. Al igual que en el caso del spline cúbico,
Zo = Zn = 0.
¿ a¡x + ¿ b;(x - t;)¡'."+
m n
, ,)
Los pasos que conducen a obtener un spline de tensión! que ajuste los datos (t; y S(x)= i 1
, (1 4)
son los siguientes: i=O i=O
l. Verifique que to < t¡ < · · · < tn.
2. Calcule h;, a.;, �¡, y¡ para O� í�n- l. con r,;=O b;�= O para O�j� m.
3. Tomez1 = Zn= O.
4. Resuelva el sistema tridiagonal (13) paraz; con 1� i�n- l. Demostr ación En el intervalo ( -oo, to) el spline S es un polinomio Po de a lo más grado m. Este
5. Use la fórmula (12) para calcular valores de f en el intervalo [t;, t;+d· polinomio determina los coeficientes a;. En el intervalo [to, t¡ ] S se reduce a un polinomio
¡
6.4 Interpolación de splines 335
334 Capítulo 6 Aproximación de funciones
Si los valores establecidos para S son l;, entonces (según el teorema 2) el problema de
p1 de grado 2m + l. Las condiciones de continuidad en to son interpolación requiere que resolvamos el sistema:

1 ) (O �j � 2m).
Pi (to)= PY (to)
m n
Lªii; + Lbj(t¡ -;)¡"'
+1
= ii (O� i � n)
j=O j=O
El Teorema de Taylor nos dice que p1 se puede escribir como

2m+ I
L bA = O (O � i � m).
1 j= O
p¡(x) = L -:¡ pi\to)(x-to)
i

j=O J
.
Éste es un sistema cuadrado de m + n + 2 ecuaciones con m + n + 2 incógnitas. Para
2m
1 v1 mostrar que no es singular basta con probar que el problema homogéneo correspondiente
=�L., -:¡.Po (to)(x- to) + b0(x - t 0 )
2m+t
tiene como única solución el cero.Suponga, por lo tanto, que S(t; ) = O para O � i � n.
1

=l
i=ºJ Demostraremos que
= Po(x) + bo(x - to)2m+1. l [s<m+ll (x)J dx = O ,
2
(15)

Esta ecuación muestra que en (-oo, t 1) donde a = to y b= t•. Usando integración por partes obtenemos:

S(x) = po(x) + bo(x - to)¡"'


+1
.
/ = s ( m+l\x)s( m)cx{ - l s( m)(x)s( m+Zl(x)dx

(De pasada observamos que s(l1(t0) = O para m < j � 2m.)


en to se repite ahora en cada nodo para obtener los términ
En el intervalo (t,., oo ), S debe corresponder a un polinomio
os
El argumento utilizado
restant es b;(x - t;)¡"'+ 1•
de grado � m. Por tanto,
=- l s< m)(x)s< m+2)(x)dx.

en este intervalo, Aquí hemos explotado el hecho de que Ses un polinomio de a lo más grado men (-oo, a)
y que por lo tanto s<m+tl(a) = O. Igualmente, s<m +tl(b) = O. El argumento se repite
L
1
O=s<m+ll(x)= b;(2m + 1 )(2m) · ·· (m + l )(x- t;t, hasta que llegamos a
i=O l = (-I)m s<ll(x)S(2m+ l l (x)dx .
A partir de esta ecuación, y utilizando el Teorema del Binomio, obtenemos:
Como s<2m+ l) es constante por pedazos, resulta que
n

o= I:b;(x-t ¡r = I:b¡
i=O
n

i=O
I: � f-Íc-ti.
m

j=O
( )

]
n
1=(-l r L} , c;S'(x)dx=(-Ir¿ c;[S(t;) - S(t;-1)] =o.
,,
{"
n

i=l fi-1 i=l

Lo que aquí tenemos es un polinomio de a lo más grado men x. Sus coeficientes deben
anularse y, por lo tanto, r;=O b;t/ = Ü paraj = Ü, 1, ... , m. fl
Esto demuestra que la ecuación (15)es correcta . De ella podemos deducir que s<m+l) O .
Por tanto, Ses un polinomio de a lo más grado m. Ya que S tiene ceros en to, t1, ••• , tn
=
y n + 1 > m, concluimos que S = O . 1
TEOREMA 3 Sea to < t 1 < ·. · < t. un conjunto de nudos y tomemos O � m � n. Existe un único
Seguimos ahora con el análogo al teorema l .
spline natural de grado 2m + 1 que ajusta los valores preestablecidos en los nudos.
TEOREMA 4 Sean m � n yf E c m+!
[a, b]. Sea S e l spline natural d e grado 2 m + 1 que interpola af
Demostración Por el teorema 2se sabe que un spline natural tiene la forma: en los nudos a = to < t 1 < · · · < tn = b. Entonces

S(x) = L ai + L=O bj(x - t¡)¡"'


m n
+1
.
l [s<m+l)(x)] dx �
2
l [¡( m+ l)(x)] dx.
2

j=O j
6.4 Interpolación de splines 337
336 Capítulo 6 Aproximación defunciones
=O 7. Diga si la función del problema6 es un spline cúbico.
se hizo en el teorema l. Sea g f- S. Entonces =
Demostración Se procede igual que como
g(t;)
nte podem os demo strar:
para O � i � n. Integrando por partes repetidame 8. Determine todos los valores de a,b, c,d y e para los cuales la siguiente función es un spline
cúbico:

l lm+l)(x)S(m+ll(x)dx = O.
· a(x- 2)2 b(x-1)3 xE( -ce, l J
f(x) = { c(x- 2)2
+
xE[l, 3]
d(x- 2)2 +e(x- 3)3 xE[3, ce]
escribiendo:
Acto seguido se completa la demostración Acto seguido determine los valores de los parámetros de manera que el spline cúbico interpole

t
esta tabla:

[J-<m+Il(x)}1 dx = l 2
[s<m+l)(x) + g(m+ll(x)} dx X 1
0
1
1
1
4

=t m l l (m ll dx
¡s(m+l)(x)J2 dx + 2 [ s< + (x)g + (x) +
t [g(m+ll(x)]2 dx 9. Verifique que las ecuaciones (7), (9) y (10) del texto son correctas.

t ¡s (m+ll(x)]2 dx + l ¡g<m+ll (x)]2 dx


10. Usando el desarrollo de los splines cúbicos como modelo,deduzca las ecuaciones apropiadas
y el algoritmo que proporcione un spline cuadrático que interpole los datos (t;, y;) para
O � i � n, donde to < ti < · · · < t•. Si Q es el spline interpolante, entonces los números

�t Zi = Q' (t;) están bien de finidos. Encuentre las ecuaciones que determinan zo, z1,••• ,z..
=
Debe rá descubrir que uno de los puntos z puede ser arbitrario,digamos por tanto que zo = O.
m+ll(x)J 2 dx 11
[s< 'l l. (Continuación) En alguna etapa del desarrollo del problema anterior encuentre una fonna
de determinar (zo, ZI, •.. , z.) de manera que r:=O z; sea un l!Únimo. Es decir,utilice esta
condición para erradicar la arbitrariedad que se mencionó en el pro blema anterior. Incorpore
esta modalidad en su algoritmo y póngala a prueba en la computadora.
SERIE DE PROBLEMAS 6.4 12. Demuestre que en el algoritmo que resuelve el sistema (10) sucede que u; > 2h; + h,-1 para
s de Zi,demuestre que para toda i = 1,2, ... ,
l. Usando el algoritmo que determina los valore todai=1,2,... ,n- l.
n -1,resulta U¡Zi + h;Zi+I - V¡ = o.
1 3. Determine los valores de a, b , e de mane ra tal que la siguiente función sea un spline cúbico
de la ecuación en el problema l . Entonces
2. (Continuación) Denote con E, al lado izquierdoecuación puede reducirse a la ecuación (10) con nudos O, l, 2:
( h,/u,)E,+ Ei+i = O. Demuestre que esta última
solución
si se usan las fónnulas e n los algo
ritmos . Esto significa que el algoritmo genera una
_ 3 +x- 9x2 xE[O, l]
de la ecuació n ( 1 0). f(x) - { a +b(x-1) +c(x-1)2 + d(x-1)3 xE[l, 2]
s 1;+1 por/¡+ h;,el resultado es:
3. Demuestre que si en la e cuación (6) sustituimo
Calcule d de forma que Jo2[f"( x)J2dx sea un mínimo. Finalmente,encuentre el valor de d
Zi+l - t;) 3- Zi (x- t¡- h;)3 + C(x-/;) - D(x- t,- h.). que hace de/ un spline cúbico natural y explique por qué este valor es diferente del que se
S¡(x) = 6h,
(x 6h; calculó previamente.

-t; - h} en la e cuación anterior y usando 14. Determine si la siguiente función es un spline cúbico:
4. (Continuación) Desarrollando el término (xla ecuación (11) del texto es corre cta.
los valores correc t d C y D, mue tre qu e
x3+x X� 0
s

tos de
e

espiral, en un papel. Elija varios pun


os

'5. Trace una curva, semejante a un óvalo o unanos regular a lo largo de la curva y etiquételos f( x ) = {
x3 _ X X � 0.
manera que tengan una distribuc ión más o m
lectura de las coordenadas x y y en
to = !.O, t1 = 2.0,y así sucesivamente. Haga una de x(t) y y(t). Ajuste estas funciones
e

tabla
cada uno de los puntos elegidos para gene rar unaulta que l as fónnulas x = S(t) y y = S*(t) Demuestre que
mediante funciones spline S y S".Con ello res de la curva. Tomando varios casos,use un lím/"(x) = lím/'(x)
son una representación paramétrica
aproximada
e.
graficador automático y grafique la curva resultant
,ro ,10

e cuadrática: 15. Determine si el spline cúbico natural que interpola la tabla


6. De termine si la siguiente es una función splin
x xE(-oo,l] X 1 0 \ 1 1 2 1 3
( 2-x)2 + ! xE[l, 2]
f(x) = { �f
2 xE[2,col
338 Capítulo 6 Aproximación de funciones 6.4 Interpolación de splines 339

coincide o no con la función 21. Encuentre el spline cúbico natural cuyos nudos son-1,O,1 y que toma los valores S(-1) =
13, S(O)=7, y S( l)=9.
l+x- x3 xE[O, l] 22. ¿Cuáles de las propiedades de un spline cúbico natural posee la siguiente función, y cuáles
f(x) = { 1- 2(x- 1)- 3(x- 1)2+4(x- 1)3 xE[ 1,2] no posee?
4(x- 2)+9(x- 2) 2- 3(x - 2) 3 XE[ 2,3].
f(x)={ (x+ l)+(x+ l) XE[-1,0]
3

4+(x- l)+(x- 1) 3 xE(O, l]


<16. Demuestre la validez de la siguiente fórmula:

1 t;+1
S;(x)dx =

+ )-
/i¡
+ ).
2 (y; y;+1 N(z; Z;+1
23. Encuentre un spline cúbico natural cuyos nudos sean-1,O, 1 y que tome los siguientes
valores:
t¡ X 1 -1 1 0 J 1

Escriba y ponga a prueba un programa que calcule

1,,

S(x)dx
24. Determine los coeficientes a, b, e, d de manera que la función

l-2x XE(- oo,-3]


17. Determine si la siguiente función es un spline cúbico natural: S(x)= { a+bx+cx2+tix3 xE[-3,4]
157- 32x xE[ 4,+oo)
2(x+ l)+(.t+1)3 xE[-1,0]
f(x) = { 3+5x +3x2 XE[O, l] sea un spline cúbico natural en el intervalo [-3,4].
11+ l l(x- 1)+3(x- 1) 2- (x- 1) 3 XE[ 1,2] 25. ¿Es la siguiente función un spline cúbico natural?

18. Un teorema de cálculo asegura que sif es una función diferenciable en un punto, entonces
necesariamente es continua en ese punto. La razón de esto es muy sencilla: si existe el límite xE[-1.t]
S(x) =
{r-1
que define af'(x) 3xl _ 1 xE[l !J.
1ím f(x+h)-f(x)
J'(x)=h-0 ,
h
26. Repita el problema anterior para la función
entonces el límite del numerador por sí sólo debe ser cero, y esto equivale a quef sea continua
en x. Suponga ahora que para cierta función! y un cierto punto Xo se satisface
S(x) = x3- xE[-1,O]
{ 3xi _¡1 xE[O, l]
!ímJ' (x)=lím!' (x)
xJ.to <T.to
27. ¿Se puede definir a a y a b de manera que la función
¿podemos de aquí concluir queJ' es continua en Xo?
19. (Continuación) Cuando se busca determinar si una función cúbica por pedazos es un spline (x- 2)3+a(x- 1)2 xE[- oo, 2]
cúbico ¿basta con verificar que se satisface la ecuación
S(x)= { (x- 2)3- (x- 3)2 xE[ 2,3]
l ímf " (x) = límf"(t) (x- 3)3+b(x- 2)2 xE[ 3,+oo)
xjt xft

sea un spline cúbico natural? ¿Por qué sí o por qué no?


para cada nudo t?
28. Si S es una función spline de primer grado que interpola a f en una sucesión de nudos
<20. Escriba y ponga a prueba un programa de computadora que calcule el spline cúbico S que O=to < ti < · · · < t,=1, ¿cuánto vale fo S(x)dx?
tiene nudos en to < t 1 < ... < t,, que satisfacen las siguientes condiciones:
1

29. ¿Qué valor de (a, b, e, d) hace de la siguiente función un spline cúbico?


S(t;) = y; (0 � i � n)
S"(to) = a. f(x)={x
3
xE[-1,0]
S" (t,) = �- a+bx+cx2 +dx3 xE[O,!]
340 Capítulo 6 Aproximación defu.nciones 6.4 Interpolación de splines 34 I

30. Determine el valor de (a, b, e) que hace de la función Luego, usando splines cúbicos S, y Sy como funciones interpolantes, ajuste x = S,(t) y
y = Sy(t). Esto dará lugar a una representación paramétrica de la curva original. Calcule un

{x3tlx x E (0, l ] número elevado de valores de S,(t) y Sy (t) para suministrarlos al graficador.
f(x) =
- 1) + a(x - 1) + b(x - 1) + e x E (1,3]
3 2

un spline cúbico. ¿Es un spline cúbico natural?


31. Sean to < t1 < · · · < tn y -oo < x < oo. ¿Cuál es el valor de salida de k si se ejecuta el
siguiente algoritmo?
10
for i = 1, 2, ..., n do
if x < t; then
k +- i
stop
endif
end.
Figura 6.6 Letra script con once nudos.
32. ¿Cuántas condiciones se necesitan para definir un spline de interpolación cuadrático S(x)
sobre a = to < t1 < · · · < 120 = b? ¿Aporta la continuidad de S'(x) todas las condiciones
necesarias? Si se desea aprender más acerca de cómo se usan las curvas spline para el diseño tipográfico
33. Demuestre el teorema 1 para el caso en que las condiciones para Sen los extremos se cambian de letras, el lector debe consultar Knuth (1979].
por S'(a) = J'(a) y S'(b) = J'(b).
38. Dé la versión simplificada de interpolación mediante splines cúbicos naturales para el caso
34. Desarrolle un procedimiento adecuado para encontrar splines cúbicos interpolantes para el de nudos espaciados de manera regular.
caso en que las condiciones en los extremos especifican valores de S' (to) y de S' (tn ),
39. Demuestre que la función spline de grado 1 que tiene nudos en to < t1 < · · · < tn se puede
<35, Programe el algoritmo para splines de tensión y póngalo a prueba tomando varios valores expresar como
de,.
n-1

<3 6. Inicie con la silueta de la carrocería de un auto, tal como se ilustra en la figura 6.5. Como S(x)=ax+b+¿c;/x-t¡/
se indicó en este tipo de situaciones, haga una tabla de abcisas y ordenadas de cerca de diez i:::::l
puntos. Usando los valores de tensión,= 0.25, 4, 10, genere y grafique valores del spline
de tensión interpolante para ver cuál de ellos da lugar a la apariencia más agradable.
40. Demuestre que la función dada en la ecuación (12) resuelve el problema de valor en la
frontera para dos puntos.

41. Demuestre que, como se afirma en el texto, la ecuación (13) se deduce a partir de las
condiciones de suavidad global.

42. Demuestre que la matriz de coeficientes que aparece en la ecuación (13) es diagonalmente
dominante.

<43_ Interprete los resultados del siguiente experimento numérico y extraiga algunas conclusiones.
(a) Defina p como el polinomio de grado 20 que interpola a la funciónf(x) = (1 + 6x2r1
en 21 nodos igualmente espaciados en el intervalo (-1, 1]. Incluya como nodos a los ex­
tremos del intervalo. Imprima una tabla con los valores def(x), p(x), y f(x) - p(x), en 41
puntos igualmente espaciados en el intervalo.
(b) Repita el experimento usando los nodos de Chebyshev dados por
Figura 6.S Silueta de un carro.

<37_ Dibuje una letra del abecedario script, como la que se muestra en la figura 6.6. Ahora x¡ = cos[(i - l)1t/20] (1 � i � 21)
reprodúzcala con la ayuda de splines cúbicos y un graficador. Proceda como se indica a
continuación. Elija un número modesto de puntos sobre la curva, digamos n = 15. Póngales (c) Con 21 nudos igualmente espaciados, repita el expefirnento u�ando un spline de interpo-
la etiqueta t = 1, 2,... , n. Para cada punto obtenga las coordenadas x y y correspondientes. lación cúbico.
342 Capítulo 6 Aproximación de funciones *6.5 Splines-E: teoría básica 343

Esta última ecuación se verifica eligiendo cualquier x E lR y luego determinando el


*6.5 Splines-B: teoría básica
intervalo entre nudos en el cual se encuentra la x, digamos tj ;; x < tj+I ; entonces
1::-00 srcx) = B'j(x) = l .
Esta sección está dedicada al estudio de un sistema de funciones spline a partir de las
cuales se pueden obtener, mediante combinaciones lineales, todas las demás funciones sr
Un comentario final acerca de los splines-E es que constituyen una base para
spline. Dichos splines constituyen bases para ciertos espacios de splines, y por lo tanto todos los splines de grado O definidos sobre la sucesión de nudos dada, suponiendo que
se llaman splines-E. Los splines-E se distinguen por la elegancia de la teoría que hayan normalizado dichos splines de manera que sean continuos por la derecha. Para
los sustenta y su comportamiento ejemplar durante los cálculos numéricos. verificar esta afirmación suponga que S es una de tales funciones spline. Por tanto es
Iniciamos con un sistema de nudos, t;, sobre la recta real. Para efectos prácticos, constante por pedazos y se define mediante un conjunto de reglas de la forma
sólo se necesita un número finito de nudos, pero en lo que respecta al desarrollo teórico
es más sencillo suponer que los nudos forman un conjunto infinito que se extiende hasta S(x) = c; si t; ;; x < t;+i (i E Z).
+oo por la derecha y hasta-oo por la izquierda:
Está claro que S(x) = 1::,_00 c;�(x). (Con esto tenemos una base en el sentido de

I::_
· · · < L2 < L¡ <to<t¡ < t2 < · · · Schauder: cada vector en el espacio tiene una representación única en términos de una
serie infinita 00 C¡�.)
Vamos a suponer que esta sucesión de nudos queda fija a lo largo de esta sección, y que Las funciones � son el punto de arranque para una definición recursiva de todos
todos nuestros splines se basan en ella. los splines-E de grado superior. La relación de recurrencia básica es:

Splines-B de grado O
B� denota a los splines-E de grado O y éstos tienen la apariencia que se muestra en
Bf (x) = ( X -t¡ s:-1 + ti+k+I -X sf.:il
ti+k -t¡
) cx) (
ti+k+l-ti+I
)
(x) (k;;; 1). (1)
la figura 6.7. El índice i abarca a todos los enteros.
Todas las propiedades de los splines-E de orden superior se deducen de esta definición
recursiva. Mediante la presentación de algunas funciones lineales especiales

r-¡
1 1 Vf(x) = -
x t¡
(2)
1 ti+k-t¡
1
1 1 podemos escribir la relación de recurrencia en la forma más elegante, que se ofrece a
1
1 continuación:
1
.J._.____________ x Bf-
Bf = Vf 1 +(1- V!¡ )Bt¡ 1 . (3)
t¡_¡ I; l1+1 11+2 l;+)
sr
En vista de que es un polinomio por pedazos de grado O, y dado que Vf es lineal, B)
es un polinomio por pedazos de grado ;; l. El mismo razonamiento demuestra que, en
Figura 6.7 El spline-E sr general, Bf será un polinomio por pedazos de grado � k.
= O.
Los puntos en negro sobre la gráfica indican que definimos �(t¡) = 1 y �(t;+i)
La definición formal es Splines-B de grado 1
º 1 si t; ;; x < t;+i
B ' (x) = { Con la ayuda de la ecuación (1) podemos dar una fórmula explícita para B/(x),
O de lo contrario como se ilustra a continuación:
:
Estos splines-E constituyen una sucesión infinita, {si i E Z}. (En este caso Z
denota al conjunto de todos los enteros, positivos, negativos, o O.) Observemos algunas
- )
{o - t¡
t¡ t¡+ -
de sus propiedades más sobresalientes: B[(x) = ( X ) Br(x) + ( z X Br+I (x)
t;+i -t¡ t;+2 - t;+ 1
(i) El soporte de B�, definido como el conjunto de las x donde B�(x) ,t. O, es el si x < t¡ o x;;; t;+z
intervalo [t;, t;+1).
X si t¡ ;; X< ti+!
(ii) B�(x) � O para toda i y toda x. = t ¡ t
¡+ - ¡
(iii) � es continua por la derecha en toda la recta real. t;+2 - x
si t;+i � x < t;+2
(iv) 1::,_00 B�(x) = 1 para toda x. t;+z -t;+1
344 Capítulo 6 Aproximación de funciones *6.5 Splines-E: teoría básica 345

Demostración Ya habíamos comentado que la afirmación del lema 2 es cierta cuando k =O o k = l .


(Que es cierta para k = 1 se deduce de las fórmulas explícitas que se dieron antes
para B/.) Suponga ahora que la afirmación es cierta para un índice k -1, con k � 2.
Esta suposición y el lema l implican que Bf-1 (x) � O para toda x y toda i. Sea ahora
t¡ < x < t;+k+I · Entonces'los factores lineales del lado derecho de la ecuación (1) son
positivos. Por la hipótesis de inducción, B1-1(x) > O en (t;, t;+k), y B1+"i 1 (x) > O en
s
(t;+i, t,+k+i). Dado que k 2, estos intervalos se superponen, y atendiendo a la ecuación
------4-------1---------=------x (1) vemos que Bf(x) > O. 11'11

(¡ t¡+¡ l1+2
Debido a que tenemos en mente usar los splines-E Bf como una base para todos
Figura 6.8 El E-splines B/.
lineales de la forma I::_
los splines de grado k, estaremos interesados en las propiedades de las combinaciones
c;Bf(x).
00

L c;Bf= ¿ [c¡Vt+ci-!O-Vt)]Bf-
00 00
1
En la figura 6.8 se muestra la gráfica de B/. LEMA3 •
Nuevamente, pueden hacerse algunas observaciones acerca de las funciones B/: i=-oo i=-oo

(i) El soporte de B/ es (t¡, t¡+z). Demostración Usamos la ecuación (3) y un manejo elemental de series para obtener:
(ii) B/(x) � O para toda i y toda x.
¿ c¡B1 = ¿ c;[vtB1-1+(1-V : )B11 J
00 00

(iii) B) es continua y diferenciable en todo punto excepto en t;, t;+1, y t;+Z·


I::_
1
¡ 1 +
(iv) 00
B/(x)=1 para toda x. i=-oo i=-oo

L L C¡_¡(l-Vf)B7-1
00
Para verificar la validez de esta última ecuación, tome x E R Dado que tj converge a+oo
00

= c;vts7-1+ 11111
cuando i crece, y converge a-oo cuando i decrece, podemos encontrar un índice j tal i=-oo
i=-oo
que� � x < tj+I · Sucede entonces que B/(x)=O para toda i, con la posible excepción
de i=j o de i=j- l. Por consiguiente, para esta x,
Procedimiento numérico

¿ Bf(x)=BJ_1(x)+B}(x) En el lema 3 los coeficientes e¡ pueden ser constantes o funciones. Este hecho nos
00

proporciona una manera de calcular los valores de una función dada en la forma:
i=-oo
t·+ i-x x-t-
¿ Cf(x)Bf(x).
00

= -i-- +--J =1 f(x)=


tj+I -tj tj+I -tj i=-co

Propiedades de los splines-B Suponemos que las funciones Cf están dadas; por supuesto, éstas pueden ser constantes.
Ahora definimos
Procedemos ahora a desarrollar, mediante una sucesión de lemas, las propiedades
importantes de la familia Bf (i E Z, k E N). c7- 1 (x)=Cf(x)Vt(x)+C7... 1 (x)[l -V¡k(x)]. (4)

LEMA 1 Si k � 1 y x � (t;, t;+k+¡), entonces Bf(x)=O. Usando el lema 3 y la fórmula (4) obtenemos:

¿ Cf(x)Bf(x)= ¿ cf-1(x)Bf- (x).


00 00
1
Demostración Ya hemos visto que esto resulta cierto para k =1, pero no para k =O. Si es cierto para
un cierto índice k-1, entonces, atendiendo al siguiente razonamiento, es cierto también i=-oo i=-oo
para k. Si x � (t;, t;+k+i), entonces x � (t;, t¡+k) y x � (t;+1, t;+k+1)- Por la hipótesis de
inducción, B1-1(x)=O y B�1 1 (x)=O. De la ecuación (12) se deduce que Bf(x)=O. Repitiendo el argumento para k -1, k -2, . .. , O, eventualmente se llega a:
lllll
¿ cf(x)Bf(x)= ¿ cf(x)Bf(x).
oc 00

LEMA 2 Sea k � O. Si x E (t;, t;+k+i), entonces Bf(x) > O. i=-co _E-oo


346 Capítulo 6 Aproximación de fimciones *6.5 Splines-E: teoría básica 347

Como ya sabemos, la expresión del lado derecho se puede calcular fácilmente: para Otras fórmulas útiles, que se comprueban trivialmente, son las siguientes:
ti � x < ti+!, su valor es J(x). Usando la ecuación (2) expresamos con todo detalle la
C

Ecuación (4), obteniendo: a.tvf+l = a.J+Ivf (8)


c{- cx) = [(x-t¡ )C¡(x) + (ti+i -x)C¡_¡ (x)} /(ti+i -t¡).
1
(5) a.t+1(1-Vf ) = a.f (¡ -V¡:¡ )
+I +1
(9 )
Las consideraciones anteriores nos conducen al siguiente procedimiento numérico. En ambos casos, la comprobación consiste en utilizar las definiciones de a.f, y de Vf.
ALGORITMO Si se dan los coeficientes Cf, lafanción spline S(x) = I::_
fBf(x) para una x 00
C

LEMA 5 Para k � 2,
dada se puede calcular como se indica a continuación. Determine el índice m tal que
tm � x < tm+I· Calcule el arreglo triangular
c� c�- 1 C;. �
d k
dxB¡ (x) = --
(k
) nk-1
ti+k -t¡ Jj
¡ (x) - (
k
li+k+I -I;+¡
nk-1
) Jji+I (x). (10)
c;_ 1 c�-:::.\ c,),_ 1
Cuando k = 1, la ecuación es válida para toda x excepto x = t¡, t¡+¡ , t¡+2•

C;_k+I c�-:::_\+1
Demostración La demostración se hace por inducción, dejándose para la sección de problemas los casos
c;_k k = 1 y 2. Suponemos que la fórmula es válida para una k fija, y con esta hipótesis
deducimos el caso siguiente. La hipótesis de inducción es la ecuación (10), la cual
usando la ecuación (5). Entonces S(x) = C�. reescribimos de manera más compacta usando la notación que se presentó líneas arriba:

LEMA 4 Para toda k, I::-oo Bf(x) = l. d ft¡. k kftk-I k k ftk-1


dxJji = 0.¡ Jj¡ - ªi+1lfi+1 · (11)
Demostración Podemos utilizar el algoritmo que acabamos de describir. Iniciamos con fB1(x),I::_ 00
C

en donde f = 1 para toda i. Luego fijamos x y usamos la ecuación (5) para calcular
C
De la relación de recurrencia básica, ecuación (3), tenemos:

c�-l = [(x-t¡ )Cf +(ti+k -x) L 1 ]/( t¡+k -t¡ )


C !!_sk+1 = !!_ [v'k+1sk1 + (l _ yk1+!+1 lÍ1+! 1
dx I dx )

= [x-t¡ + t¡+k -x]/(t¡+k -t¡) d d


= Vik+1 dxski + U¡k+18ki + (l -yki++l1 ) "J;; ski+l - a.ki++l18ki+l (12)
= l.

Repitiendo el argumento descubrimos que ¡ = 1 para toda i y paraj = k, k -1, ... ,


C En esta parte se usó dos veces la ecuación (7). Ahora, recurriendo a la hipótesis de
O. Por lo tanto: inducción, ecuación (11), reemplazamos las derivadas que aparecen en el lado derecho
¿ ¿ de (12). El resultado es:
00 00

B1(x) = sr(x) = l. 11
i=-oo i=-oo
!!_x8k+1 = v1k+1(ka.ksk-1
1 1
_ ka.k1+!sk-1 + k+1 �
t+l ) a.1 81
d I (13)
La derivada y la integral de los splines-B
+ Cl -vt�1)(ka.f+1Bf..:¡ - ka.f+2Bf+2 l- a.f:lsf+1·
1 1
El siguiente lema presenta una importante fórmula para la derivada de Bf. Es
conveniente usar la fórmula (2) para Vf y tomar
Reagrupando términos, obtenemos:
a.k=-1-. (6)
1 t;+k - t¡ !!_ 8k+1 = a.k+1sk + ka. kv k+isk-1 _ a. k+18 k
dx 1 1 1 1 1 1 1+! 1+!
Observamos que, con esta notación,
k k+ k-1 k + k-1 (14)
-k0.;+2 (l -vi+l1)8i+2 -kªi+l yki 18i+l
d k
xV; (x) = a.kI' (7) + ka.f+i (1-V¡:�1 )B�,:j 1.
d
348 Capítulo 6 Aproximación defunciones *6.5 Splines-B: teoría básica 34 9

En esta ecuación haremos las siguientes sustituciones, todas justificadas mediante las Demostración Utilizando la ecuación (20) podemos verificar que las derivadas de ambos lados de la
ecuaciones (8) y (9): ecuación son iguales si tomamos

ka.}vf+ 1 B 7-1 = ka.7+ 1vtB 7-1 (15) =


sij < i
Cj { � sij � i.
-ko.f+z(l- V!1 )B7� =-ka.f:¡1(1- V!z)B7+ z (16)
1 1 1

k+t ni:-1 k+ 1 k-1 Se observa que Cj- Cj-l es cero excepto cuando j= i, de donde se deduce que:
- kO.;+J y i 1:Ji+l + kO.i + l(l- yi + l )B i +l
k k

= k0.;k+1(1- yik+l)Bki+-l 1- kªik+ l yik+ I k-1


+l B i+l t i + k + I - t¡
B'¡(x)= ( (k + l) (-- B }(x ) .
k+I )
= kO.¡k+I(l- yi+l
k
)Bki+-1 k-1
l - kªi+l yi+l B i+l .
k+I k
(17)
1 )
ti+k+ I- t¡

La versión transformada de la ecuación (14) es: Con el fin de asegurarse de que las funciones a ambos lados de la ecuación no difieren
en una constante, observe que las dos se reducen a cero cuando x= t;. 1111
!!_g;+l k+I k+ I k k-1 -1
dx l = a.i g;l + k[a.t y¡ Bt + (ll (l _ yt+l)Ift+l ]
k+l k
(18) Propiedades adicionales
k+ I nk k+ l k nk-J } k-J
-U¡ + ¡ .Of+l- k [O.¡+¡ yi+llli+l + ¡ ( - yi +2)Bi +2 ] ·
+ U;k+l Sif es una función y K es un subconjunto de su dominio, entoncesflK denota la
k

restricción defa K. Por ello:


Usando la relación de recurrencia básica (3) se pueden simplificar los términos entre
corchetes en la ecuación (18). El resultado es: (x E K).
UIK)(x) = f(x)
d k+ l k+ I nk k+ I nk k+ I nk k+ I nk
B = O.¡ .o¡ + kU¡ .o¡ -U; + ¡ .Uf+ !- k a i+l .Oi+ I Este concepto resulta útil al trabajar con splines, debido a que cada función E11Uj, tj+l l
dx i
es un polinomio (con mayor precisión, la restricción de un polinomio). Cuando se dice
= (k + l)a} +1 B}- (k + l)af:/Bt1. (1 9) que un conjunto de funciones f¡ es linealmente independiente sobre un conjunto K,
esto significa que el conjunto de funciones restringidasf¡ JK es linealmente independiente
Dado que ésta es la ecuación (1 1) con k sustituida por k + I, el paso de inducción se ha en el sentido usual.
completado. 111 Consideremos ahora los splines-E E�, Ef, ... , Bí, Cuando éstos se restringen a
un sólo intervalo entre nudos (tv, tv+ tl, el resultado es un conjunto de polinomios de
LEMA 6 Para k � 1, los splines-B B } pertenecen a la clase de continuidad ck-l(JR). grado � k. Un hecho sorprendente y a la vez útil es que si el intervalo considerado es
(tk, tk+I), dichas restricciones forman una base del espacio polinomial Ilk,
Demostración Resulta evidente que B / es continuo: B/ E C°(JR). Supongamos ahora que B } E
ck-1 (JR). Por el lema 5, (d/dx)B } + 1 E ck-l (JR), debido a que esta derivada es una LEMA 8 El conjunto de splines-E {E}, EJ+i• .., Bf+k} es linealmente independiente en(tk+j, tk+j+ J) ,
.
combinación lineal de B'f y de B'f+i · Por ende B'¡ +1 E Ck (JR). Según el principio de
inducción, esto completa la demostración. 1111
Demostración Considere primero el caso k= O. El lema afirma que {EJ} es linealmente independiente
Usando el lema acerca de las derivadas de los splines-E se obtiene la fórmula
en el intervalo (tj, t¡+ 1). Esto obviamente es cierto. Con el propósito de llevar a cabo una
siguiente, la cual resulta de gran utilidad:
demostración por inducción hagamos k � 1, y supongamos que el lema es correcto para
el índice k- l . Partiendo de esta suposición probaremos el lema para el índice k. Sea
!!..dx. f
1=-00
c; B }(x) = k f C¡
(C¡ - _¡ Bf-l (x)
.t=-oo ti+k- t¡ )
(k � 2). (20) S = Z:::1=o Cj+iEJ+i' y suponga que SJ(tk +j, tk+j+ I) = O. De la ecuación (20) tenemos:

Esta fórmula se puede usar cuando se lleva a cabo una diferenciación numérica, si bien '\""' Cj+ i-Cj+ i-1 Bk-11(tk+ , t .
O= S'I(tk+j, tk+j+1 ) = k L., (2 1)
j k+j+1)
la diferenciación numérica de datos "con ruido" es una empresa muy riesgosa en cuanto i=l
t¡+i+k- tj+ i j+i
a la credibilidad de sus resultados. Para k= 1, la ecuación (20) es válida para todas las
x, excepto en los nudos. Para llegar a esta ecuación usamos que Bf+k�l = O y EJ-1 = O en (tk +j, tk+j+ 1) . Usando
. , . de m
1a h1potes1s . ducc1on
k-1 ni:-1
., en { Bj+l k-1
.
, .Uj+z , ..., Ej+k } , conc1wmos .
que e1 co111u11to es
t¡ +1 linealmente independiente en el intervalo Uk+j, tk +j+i). Entonces en la ecuación (20)
LEMA 7 [,,, Bf(s) ds= e+� :� ) tBJ (x).
+

todos los coeficientes deben ser O, y por ello c0 = c1 = · · · = ck Si este valor común
r=i .
350 Capítulo 6 Aproximaci6n de funciones *6.5 Splines-E: teoría básica 351

se denota por A., tendremos que, por el lema 4, S(x) = i en Ct k+j,t k+j+ t), (Observe que 5.Cuente el número de multiplicaciones, divisiones, y sumas/restas que tienen lugar en el
en el lema 4 los únicos términos que no son cero en el intervalo (t k+i• t k+j+t) son EJ , algoritmo para calcular CfBf(x).
I;;:_
EJ+I ' ... , EJ+k ·) En vista de haber supuesto que S se anulaba en Ct k+i•t k+j+i), concluimos
00

6. Verifique la fórmula ( 20) para las derivadas de splines.


que),= O.
7. Demuestre que
1111

LEMA 9 El conjunto de splines-E {E�k' E�k+1 ' ..., B!-i }, es linealmente independiente en t¡+ + t;.
f"' Bf(x) dx = � ��
(to,t.). L"'
8. Demuestre que si I;;:_ c¡Bf(x)= O para todax, entonces e¡= O para toda i.
Demostraci6n Sea S = ¿;;,:;�k c;E}, y suponga que Sl(to,t n) = O. En el intervalo (to, t 1) sólo E�k '
00

E�k +I' ... , E�, son distintos de cero, y por consiguiente: 9. Defina funciones des mediante la fórmula

Uf(s) = (ti+t - (t;+z- ) · · · (ti+k- )


s) s s

O= Sl(to, t¡)= '¿ c;Ef 1 (to,t¡). (22) para k = O, tome u?( = l. Demuestre que
i=-k
s)

Uf(s)Vt(x) + uf_1(s)[l - Vtx)] = (x- )Ut 1 .


Por el lema 8, el conjunto {E�k • E�k+ I' ..., En, es linealmente independiente en
( s (s)

(to, t 1 ). Por tanto, de la ecuación (22) deducimos que e¡ = O cuando -k � i � O. 10. (Continuación) Demuestre que
Si todos los e, son O, hemos llegado a la conclusión deseada. Si no todos los e, son cero,
tomemosj como el primer índice para el cual Cj ,¡:. O. En vista de lo hecho anteriormente,
L Uf L uf- (s)Bt\x).
00

,Bf x) = x- )
00

j � l. Por consiguiente, (t j,ti+J) e (to, t.). Para cualquier x E (t j , ti+t) obtenemos la


1
(s) s

contradicción:
( (

i=-oo i=-oo

L 11. (Continuación) Demuestre la identidad de Marsden:


n-1
O= S(x) = c;Ef(x) = CjEJ(x) O.
i j
=
,¡:.

Por lo tanto todos los C¡ son cero. 11111 L uf(


i=-oo
s) B7(x) = (x- /. s

12. (Continuación) Demuestre que todo polinomio de grado ;;; k se puede expresar en la forma
¿;:_ooc¡/Jf.
SERIE DE PROBLEMAS *6.5
1. Verifique la fórmula para BJ(t¡):

2
Bj(I¡) = ( ---
-
/¡ /¡_¡
) U(j+l + ( --- ) Oi,j+2·
0
l;+t - li-1
/¡ li+l -
t,+t -/¡_¡

Bf(x) = 1-
{
13. Con la misma notación del texto, demuestre que Bf está dado por las fórmulas
v,2 v,1
V!1Vi+tl
X E[/¡, /;+1)

x E [li+t, t¡+zl
2. Demuestre que si tm � x < lm+¡, entonces l - V¡�1 )( 1- V¡�z) X E [1i+2, li+l)
� x en otras partes.

L c¡.Bf(x) = L c;Bf(x). 14. Verifique las siguientes dos ecuaciones:


oo m

i=-oo i=m-k

3. Hagah, = t;+1 - t;. Demuestre que si dx


1
- ti+t - ti t¡+z - tr+t

C;-¡h;-¡ + C¡_zh¡ = y;(h¡ +h¡_¡ ) (i E Z), d 2 --


- 2B) - ---.
2B.1+1
dx B¡ t¡+z -t¡ t;+i - li+t
=
entonces la función spline S = I;;:_ c;Bf tendrá la propiedad de interpolación S(ti) = Yi
para todaj.
00
15. Demuestre que
4. Suponga que se toman como nudos a todos los enteros:
Bf x) = �(x- t;).
(
t; = i (i E Z). Demuestre que sup I
-oo<x<oo ,
f
1=-00
c¡.Bf(x)I � sup
-00<1<00
Capítulo 6 Aproximación de fanciones *6.6 Splines-E: aplicaciones 353
352
27. Encuentre ex y � en la fórmula

itoo
16. Demuestre que si sup¡ lti+t - td � m, entonces

1: ttoo c¡Bf(x)\ dx � m lcd-


soporte (úm) = ó soporte(Sf ) = (ex.�).

17. Encuentre una cota superior para 28. ¿Cuál es el intervalo más pequeño para el cual [Bf. Bf.1 •..., B!.k+J-il es linealmente inde­

1: [too
pendiente?
29. Demuestre que
e¡Bf(x{ dx.
¿Bf(x) = 1 (tk �X� lk+n).
i=O
18. Demuestre que para k � 3
30. Demuestre que
d2
¿ c¡Jt;(x) = k(k - 1) ¿ Bf-2(x)
00
-
(e¡. -�-t _ Ci-t c,-2)
00

- .
dxZ t1+k t, ti+1c-l - t¡-1 t¡+1c-1 - t¡ ¿Bf(x) >0 (t¡ <x < l..t+tl,
i=-oo i=-oo i=O

19. Demuestre que si a;= k-1(1;+1 + IM + · · · + t;+k ), entonces

¿ a,lt;(x) = x *6.6 Splines-B: aplicaciones


00

(k � 1).
i=-oo
En esta sección adoptamos la notación de la sección anterior. Dada una sucesión inicial
20. Dé un ejemplo de una función spline ¿:_00 c;Bf que no sea la función cero y que sin de nudos
embargo, se anule en todos los nudos. ··· < Lz < L¡ <to<t¡ < tz < ..., (1)
<21. Escriba y ponga a prueba una subrutina para calcular valores aproximados de g(x) =
J:f(t) dt en un intervalo [a, b]. El usuario proporciona la función! en un subprograma
se define un sistema de splines-E, Ef(x), sustentado en los nudos. Deseamos relacionar
estos splines-E con las funciones spline presentadas al principio de la sección 6.4. Ahí
separado. El método que se utilizará con,iste primero en interpolar! en [a, b] con un spline
J:
cúbico natural, S, usando n nudos igualmente espaciados, y luego utilizar g(x) ,::; S(t) dt. consideramos funciones que son de clase c•-1 globalmente y que se componen de
El usuario especificará los valores de a, b, y n. polinomios por pedazos de grado ;;i; k en los n intervalos [to, t¡], [ti, t2], ... ,[tn-I, t.].
Denotamos mediante S! a la familia de estos splines. La notación no exhibe los nudos por
22. Suponga que en la sucesión de constantes C!-t- C!-k+I • ..., C!, dos elementos adyacentes haber quedado estos fijos desde el principio. Consideramos que las funciones spline en
son iguales. Demuestre que la función spline S! tienen como dominio a [to, t.]. ¿Cómo se relacionan estas funciones con los splines-E
Ef? A lo largo de la sección suponemos que n ;;; l .
¿ c1i;(x)
00

i::-00
Bases del espacio S!
será un polinomio de grado menor que k en el intervalo (tm, lm+t). Con el fin de que el dominio de estas funciones sea el mismo, restringimos la función
23. Use el algoritmo que aparece después del lema 3 para demostrar que :z=:_ 00
c;.Bf es un Bf al intervalo [to, t.]. La notación para las funciones restringidas es Sf [(to, t.].
polinomio de grado � k en (tm, lm+1).
24. Use el algoritmo que aparece después del lema 3 para hacer nuevas demostraciones de los TEOREMA 1 Una base para el espacio S! es
lemas 1 y 2.
{Sff[to, t.]:-k ;;i; i ;;i; n -1}. (2)
25. Demuestre formalmente que Bf(x) > O en (t¡, l¡+1l si y sólo sij - k � i � j.
26. Demuestre que la fórmula (10) en el lema 5 es cierta para k = 1, excepto en los tres nudos Por consiguiente, la dimensión de S! es k + n.
t¡, !i+l, fi+2·
354 Capítulo 6 Aproximación de funciones *6.6 Splines-E: aplicaciones 355

Demostración Resulta obvio que las funciones en la ecuación (2) pertenecen a S!, ya que son splines LJ=I CjEJ. Para que esto sea posible hace falta que la matriz de interpolación A dada
de grado k, apoyados en la sucesión de nudos dada en (1). por
Pasamos a demostrar que la dimensión de S! es a lo más k + n. Esto se logrará Aij = BJ(x;) (1 � i,j � n) (4)
exhibiendo un conjunto de k + n funciones que generan S!. En efecto, cada elemento de sea no singular. Un bello teorema de Schoenberg y Whitney nos indica las condiciones
S! se puede expresar como: necesarias y suficientes para que se dé esta no singularidad, a saber, que la diagonal de
A no incluya ceros.
¿ a¡i + ¿ b (x - t;)!
k n-I
Para la demostración de este resultado seguimos las ideas de de Boor [1976, y
S(x) = ¡ (3) com.pers.]. Consta de varias partes que se considerarán por separado.
i=O i=l
LEMA 1 Si la matriz de la ecuación (4) es no singular, entonces Au;: O para 1� i� n.
En esta ecuación se usan las potencias truncadas:

t six � t¡ Demostración Suponga que A" = O para alguna r. Entonces E�(x,) = O, y por el lema 2 de la
(x-t¡)!={t- l sección 6.5, x, rj; (t,,t,+k+i), Suponga primero que x, �- t,. Si i � r � j, entonces
six < t¡
x;� x,� t,� t¡ y x; no está en el soporte de Bj. Como consecuencia, Aij = EJ(x;) = O.
Para demostrar la validez de la ecuación (3) empezamos con el intervalo [to, t1] en el Las primeras r filas en A se pueden interpretar como vectores en JR'- 1, debido a que
que todas las potencias truncadas son O. Sobre [to, t1], S(x) es un polinomio de grado k, Aij = O para j = r, r + 1, .. . , n. Por lo tanto este conjunto de filas es linealmente
digamos p0• Tenemos entonces po(x) = ¿�0 a¡}. Esta expresión determina todos los dependiente y por ende A es singular.
coeficientes a¡. En el intervalo [t1, t2], S(x) es otro polinomio, llamémoslo p1• Tomando En el otro caso, x, � t,+k+l · Si i � r � j, entonces x; � x, � t,+k+l � tj+k+l, y
en cuenta las condiciones de continuidad en t1, tenemos: Aij EJ(x;) = O. Las columnas numeradas del ! a r forman un conjunto linealmente
=
dependiente, debido a que sus componentes numeradas como r, r + 1, ... , n son todas
( p¡ - potl(t1 ) = O (O� r� k - 1). cero. Una vez más concluimos que A es singular. 11

En vista de que p 1-: p0 es de a lo más grado k, concluimos que (p1 - po)(x) = b 1(x- td LEMA 2 Si k = 1 y t¡ < X¡ < t;+2 para 1� i� n, entonces A es no singular.
para alguna b 1 . Por lo tanto escribimos:
Demostración Para demostrarlo utilizamos inducción sobre n. Si n = 1, la matriz A es una matriz de
k 1 x 1 con un único elemento All = E/(x¡);: O.
'\"" a;i. + b1(x - ti)k (to � x � t2).
S(x) = � Suponga ahora que el lema 2 se ha demostrado para todos los casos en que el número
+
i=O de nodos es menor que n. Considere entonces el caso de n nodos, con n � 2. Si existe
un índice r para el cual 1 � r � n - 1 y x, � t,+1, entonces para cualquier par (i,j)
Este mismo argumento se repite en t2, t3, ..., tn-1 para justificar los términos restantes que satisfaga i � r < j tendremos que X¡ � x, � t,+1 � tj y Aij = EJ(x;) = O. Por
en la ecuación (3). consiguiente la matriz A tendrá la forma:
La tercera parte de la demostración consiste en utilizar el lema 9 de la sección 6.5
y concluir que el conjunto de la ecuación (2) es linealmente independiente. Por lo tanto
es una base de S!. 11 A=[�
�]
La demostración del teorema 1 muestra que las funciones en la cual Ces una matriz de r x r y Des de (n - r) x (n - r). La matriz A es invertible
si y sólo si C y D son invertibles (véase el Prob. 11). Las matrices C y D son como a
1,x,x 2 , ... ,}, (x-t¡t (x - t2t ..., (x - t,-1)! A excepto por el hecho de tener menor tamaño (ya que r < n y n - r < n). Por tanto,
según la hipótesis de inducción, son invertibles.
forman una base de S!. Debido a que está muy mal condicionada, deberíamos tener Se puede utilizar un argumento similar cuandox, � t,+1 para algún índice r en el
precaución al usar esta base en los cálculos numéricos. En su lugar debería usarse la rango 2� r � n. En este caso, sij < r � i, entonces Aij = O. La estructura de A es
base de splines-E que se plantea en el enunciado del teorema.
A= [ �
�]
Matriz de interpolación
Las funciones spline se pueden utilizar para hacer interpolaciones en otros puntos con C y D matrices de (r - 1) x (r - 1) y (n - r + 1) x (n - r + 1), respectivamente.
además de los nudos. Seax1 < x2 < ... < Xn un conjunto de nodos dado. Nos gustaría El caso que vamos a considerar ahora es el que se ocupa de x; > t;+1 para 1� i �
interpolar datos arbitrarios dados en los nodos mediante una función spline de la forma n - 1 y X¡ < t;+i para 2� i� n. Esto tiene lugar si n = 1 (caso ya considerado), o si
· 356 Capítulo 6 Aproximación de funciones *6.6 Splines-E: aplica ciones 357

n =2. En este caso especial,n = 2, k = 1,x¡ > tz yx2< /3. Por ende t2<x1<x2<13. Vj de la ecuación (6) deben ser cero. Como en la ecuación (20) de la
sección 6.5, la
En el intervalo (12, t3) tenemos queEl(x) + E!(x) = l. Por lo tanto la matriz A tiene la fórmula para Vj es:
forma: Vj = k(Uj -Uj 1)/(lj+k-lj).
El(x¡) E!(x¡) - A. 1-A. -
[ ] [ J
E/(x2) E!(x2) µ 1-µ · Podemos utilizar esta fórmula para1;;j;;n+ I si acordamos en tomar uo =Un +! = O.
Que todos los coeficientes Vj se anulen significa:
=
El determinante esA. - µ E[(x1) -El(x2) > O. 11
U¡-Uo =Uz-U¡ = • • • =Un +I -Un = Ü.
El teorema de Schoenberg-Whitney nos dice lo siguiente.
Ya que uo = Un+I = O, llegamos a la conclusión de que todas las u; son cero.
TEOREMA 2 S uponga que x1 < x2 < ... < x.. Para que la ma triz A dada por A;j =E}(x;) se a no En el caso2 suponga que �l � tk+l y que �n+l > tn+I· EntoncesE1-1(�;) = O para
singular esnecesario ysuficiente que no haya e lementos igua les a cero ensu dia gona l. 1;;i;; n+ I, debido a que�; no está en el soporte de �- 1• En este caso inferimos, de
la ecuación (6), que
Demostración La necesidad ya se ha demostrado en el lema l . La suficiencia en el casok = O es trivial, n+I
debido a que la condición !3?(x;) '# O es equivalente a que t; � x;< t;+J· En vista de que ¿ vj13J- 1
(�;) = O (2;;i;;n + 1).
los soportes de los splines-E son ajenos entre sí, BJ(x;) = ºif· j=2
Para k =1, la demostración de la suficiencia se ha proporcionado en el lema 2.
Recurrimos ahora a la indución sobre k. Suponga que el teorema se ha demostrado Pero�; está en el soporte de (-1 para 2 ;; i ;; n + 1, por la hipótesis de inducción
para splines-E de grado < k. A partir de esta hipótesis lo demostramos para splines concluimos que vj = O para2;;j;;n + l . Como antes, esto conduce a:
de grado k. Por el lema 2 resulta que k � 2. Nuestra demostración requerirá, al
igual que en la correspondiente al lema2, otra inducción sobre n, aunque en este caso Uz -U¡ = U3 -Uz = · · · =Un+I -Un = Ü
seremos menos formales. Lo esencial en el argumento es que, si x, � t,+ 1 para alguna y en vista de queUn+l = O, entonces u; = O para1;;i ;;n.
r E { l,2, ...,n-1} o six, � t,+k para algunar E {2,3, ... ,n}, entonces la matriz A
En el caso3 suponga que �l < tk+ l y que �n ;; tn+l· Esto es semejante al caso2.
tendrá una estructura de bloque tal como aparece en el lema 2, y será invertible, como
Ahora�; está en el soporte de (-1 para1;;i;;n, y los mismos argumentos utilizados
se comprueba si usamos la hipótesis de inducción en las dos submatrices de A.
antes nos conducen a u; = O para1;;i;;n.
Podemos por lo tanto considerar que
Para el caso 4 suponga que �l � tk+I y que tn+I � �n+I· Tenemos ahora que
E�-1(�;) = O y queE!:;:¡1 �;) = O para1;;i;;n + l. La ecuación (6) nos da:
t;+¡<X¡< Xi+! < li+k+I (1� i�n-1). (5)

¿
n
Suponga que A es singular. Entonces Au = O para alguna u :t: O. Seaf = ¿�UjEJ. vjEJ- 1
(�;) = O (2;;i;;n).
Observamos de quef se anula en losn+2 puntos t1,x1,x2 , ... ,Xn , tn+k+I· Ya quek � 2, j
=2
f' existe y es continua. Por lo tanto se puede aplicar el teorema de Rolle para deducir la
existencia den+1 ceros,�;, def' distribuidos como sigue: Pero como �; está en el soporte de E7- 1 para 2 ;; i ;; n, repitiendo argumentos ya
familiares, concluimos que:
t¡<�¡<X¡<�2<X2< · ..<Xn-l<�n <Xn <�n+I < ln +k+l·
Uz -U¡ = U3 -Uz = · · · =Un -Un 1 = Ü.
-
Como se demostró en la ecuación (20) de la sección 6.5,f' es de la forma I:
También tenemos que
1:� vjBJ-1• Esto demuestra que todas lasUj son iguales, digamos que toman el valor A.. Por lo tanto
f = A.¿�EJ. Ya que E} � O y E1(xi) > O, la ecuaciónf(x1) = O demuestra que
A.=� •
¿
n+l
VjEJ- (�¡) =f'(�;) = 0
1
(1� i�n + 1). (6) Ejemplo Tomemos como nudos a todos los enteros. Si deseamos interpolar mediante combina­
j I
= ciones lineales deE¡,Bi, ... ,E� ¿podemos usar el conjunto de nodos {3.1,3.5,3.6,6.1,
6.6}?
Usando la ecuación (5) vemos que�; pertenece al soporte de E7- 1 para2 � i � n. En
esta etapa aparecen varios casos. Respuesta En este caso, la condición dada por el teorema2 se puede escribir en la forma:
En el caso1 suponga que �1< tk+I y que �n+l > ln+l· Entonces �1 está en el soporte
de E�-! y �n+I en el soporte de E!:;:'/. Por ende, usando la hipótesis de inducción, la i<x;< i+3 ( l;;i�5).
matriz (EJ- 1(�;)) de (n + 1) x (n+ 1) es no singular. Por lo tanto, todos los coeficientes Se verifica fácilmente que esta condición es satisfecha por los nodos dados. 1111
358 Capítulo 6 Aproximación de funciones *6.6 Splines-E: aplicaciones 359

Existencia Este sistema contiene n ecuaciones y n +1 incógnitas. Podemos resolverlo asignando


cualquier valor a c_1 y calculando recursivamente los valores de co, c1, •.• , c._ 1 me­
En el teorema 1 vimos que el espacio de splines S! tiene dimensión n +k. Se diante la ecuación (10). Por lo tanto existen muchas soluciones para este problema de
considera que las funciones que componen S! tienen un dominio [to, t.]. Si los nodos interpolación.
x1, x2, .•. , Xn+k se escogen en [to, t.], ¿qué condiciones deben satisfacer para que sea Si se procede de la misma manera en el caso k = 3, obtenemos n ecuaciones con
posible la interpolación mediante S!? n+2 incógnitas. A continuación presentamos el sistema (8) para k = 3:

TEOREMA 3 Si se eligen nodos X¡, x2, .•• , Xn+k en [to, t.] que satisfacen
C¡ _3Bt-3(t¡)+C;-2Bf-i(t¡)+C¡_¡BL (t¡ ) = f(t¡ ) (1;::; i � n) (11)
ti-k-1 <X¡ < t¡ (1;::; i;::; n+k),
Se puede calcular los valores BJ(t,) necesarios usando el teorema 4 de la sección 6.5.
entonces se pueden interpolar datos arbitrarios en estos nodos mediante el espacio Los resultados son:
spline S!.
(t;+1-t¡)2
Bt-3(t¡) =
Demostración Por el teorema 1, el conjunto de funciones BJJ[to, tn ], con -k ;;; j ;;; n- 1 conforma (1;+1-t¡_2)(t;+1-t¡_ ¡ )
una base de S!. Reetiquetamos los nodos definiendo y¡ = x;+J+k para-k;;; i;::; n- l. n3 _ (ti+2-t¡)(t¡-t¡_¡) (t¡ -t;-2)(t;+1 -t¡ )
Entonces y; E sop(Bf), y, por el teorema 2, la matriz BJ(y;) es no singular. 11 11¡_2 (t¡ )- +
(1i+2-/¡ _¡)(ti+l-IH) (ti+l-t,-2)(1,+t -t¡ _¡ )
Si suponemos que Bf(x;) if: O para 1;::; i;::; n (que equivale a suponer que t; < x, < Bt-i(t;) =
(t¡ -t,-1)2
t;+k+i), entonces se puede tomar como función interpolante a (t;+2-t¡_ ¡ )(ti+l -t¡_¡ )

¿ c BJ(x).
n
Al igual que en el caso k = 2, se puede obtener una solución sencilla para el sistema
S(x) = j de ecuaciones; a saber, asignando valores arbitrarios a C-2 y a c_ 1, y luego calculando
j=l
recursivamente los valores de c0, c¡, ... , Cn -l, mediante la ecuación (11). Esta forma
Los coeficientes en esta ecuación se obtienen resolviendo el siguiente sistema lineal de de resolver el sistema (11) no es recomendable, debido a que no se explota la presencia de
ecuaciones: los dos parámetros extras c_2 y c_ 1. Es común que se imponga una condición adicional
n
sobre el spline en los nudos t1 y tn , es decir en cada extremo del intervalo en cuestión.
¿B}(x;)Cj = f(x¡ ) (i;::; i;::; n). (7 ) Por ejemplo, las condiciones para el spline natural se definen como S" (t 1 ) = S" (t.) = O.
j=l
El sistema de ecuaciones que se requiere resolver para el spline natural interpolante
Esta solución al problema de interpolación no es necesariamente la única. Echaremos se compone de la ecuación (11), junto con un par de ecuaciones adicionales proporcio­
un vistazo a esta falta de unicidad al considerar el caso especial de la interpolación en nadas en los problemas 8 a 1O. Para orientarse acerca de la interpolación por splines y
los nudos. Suponga que x; = t,. El problema de interpolación para estos nodos requiere el arreglo de los cálculos el lector puede consultar a de Boor [1984]. (En ese libro, BJ
la solución del sistema denota un spline de grado k- l.)

L C Bj(t ) = f(t¡)
00

¡ (1 � i � n). (8)
j=-oo
j Métodos de aproximación no interpolatorios
Para ilustrar los métodos de aproximación no interpolatorios recurrimos a un mé­
El caso más sencillo, k = O, se resuelve de inmediato usando BJ(t¡ ) = 8ij. Por lo tanto, todo muy elegante propuesto por Schoenberg [1967]. Dada una función!, definimos
tenemos Cj = f(tj) para 1 ;::;j;::; n. Como B}(t¡ ) = Bi-1.j, el caso k = 1 se resuelve de una función spline Sf mediante la ecuación
manera idéntica. Por ello c¡_1 = f(t;) para 1 � i � n.
Para resolver el problema de interpolación cuando k = 2, necesitamos el siguiente
¿ f(x;)Bf
00
1
hecho (véase el Prob. 2 de la Sec. 6.5): Sf = x¡ = k(t,:+1 +· · ·+l;+kl (12)
i=-oo
2 t¡ -t¡_¡ � li+I -t¡ �
Bj (t;) = - --0;-1,j+t ºi-2.j· (9)
l¡+¡ -t¡ _¡ ¡+¡ -t¡ _¡ Cuando k = O tomamos X¡ = t¡. En este caso no tenemos nada nuevo, debido a que la
ecuación (12) se reduce al esquema de interpolación discutido previamente. El mismo
De la ecuación (9) se deduce de inmediato que cada ecuación lineal en el sistema (8) comentario es válido para el caso k = l. Pero para valores superiores de k la función
tendrá sólo dos de las incógnitas. De hecho, la ecuación (8) es como sigue: spline Sf definida por la ecuación (12) no interpola aj en ningún conjunto preestablecido
t¡+¡ -t¡ t¡-t¡ _¡ de nodos. (Tales operadores reciben el nombre de operadores de cuasi interpolación.)
Ci- 2+---C¡_¡ - f(ti ) (1 � i;;; n). (10)
t¡+---
¡ -t¡_¡ l¡+t -t¡_¡ Las principales propiedades de este esquema de aproximación son las siguientes:
360 Capítulo 6 Aproximación defunciones *6.6 S plines-E: aplicaciones 361

(i) Si f es una función lineal, entonces Sf = f .


(ii) Para cualquier función lineal f, Sf -f no cambia de signo más veces quef -f.
(iii) Si f f O, entonces Sf f O.
(iv) Si IJ 1 � M, entoncesISJI � M.
(v ) Ses un operador lineal: S(a.J + pg) = a.SJ + psg .

El lector interesado debería consultar cualquiera de las siguientes fuentes: Marsden


[1970] o Schoenberg [1967]. a b
Nuestra siguiente tarea es investigar si una función continua puede aproximarse
con una precisión arbitraria por splines. En situaciones como ésta esperamos mantener Figura 6.9 Extensión de J.
fijo el grado k mientras que aumentamos el número de nudos con el fin de obtener una
mayor precisión. La pregunta que nos ocupa es si se puede alcanzar cualquier precisión
deseada a través del aumento de la densidad de nudos; el teorema que responda a ésto TEOREMA 4 S if es unafunción definida en [to, tn], entonces la función spline g en la ecuación (13)
será el análogo para splines del teorema de aproximación de Weierstrass. satisf ace:
Como de costumbre, se elige un conjunto de nudos: máx IJ(x) - g(x)j � kro(f;o),
to;;íx;;ít,
·· · < Lz < L1<to<t1 < tz < · · ·. donde o= máx_k;;íi;;ín+1 lt;- t;-il y ro(!;·) es el módulo de continuidad def.

El intervalo [to, tn] también se denota con [a, b], y suponemos que se tiene una función Demostración Recuerde queBf f O y que I:;:_ Bf = 1. Entonces, con una g como la de la ecuación
f definida en [a, b]. Se extiende la función! como se muestra en la figura 6.9. Así, sif
00

(13),
es continua en [a, b] también lo será su extensión.
lg(x) -f(x)I =/ t J(ti+2)B(
f x) -f(x) t Bf(x)/
i 00
Sea continua o no la función!, definimos su módulo de continuidad mediante la
i oo
ecuación:
ro(f;o) = máx IJ(x) -f(t)I.
[s-r[;;í6

Sif es una función continua definida en un intervalo [a, b], entonces es uniformemente
= litoo [f(t;+z)-f(x)]Bf(x)/

continua en ese intervalo. Esto significa que para cualquier e > O existe una o > O tal
� ¿ IJCt;+2)-f(x)IBf(x).
00

que para toda s y t en [a, b],


i=-oo
Is- ti < o *IJ (s)-f (t)I < e. Sea x E [ 9, t¡+d e [a, b]. Sobre el intervalo [t¡, 9+il sólo Bf-k• BJ-k+1' ... , BJ están
activas. Por lo tanto,
Por lo tanto ro(!; o) � e. En otras palabras, para una función continua¡ en un intervalo
cerrado y acotado, el módulo de continuidad ro(!;o) converge a O conforme o converge
a cero.
Si f' existe, es continua, y satisfaceIJ'(x)I � M, entonces el teorema del valor
lg(x) -f(x)I � ¿ IJ(t;+2) -J(x)IBf(x)
i=j-k
medio nos dice:
IJ(s)-f(t)I = IJ'(�)I Is- ti � Mis- ti
� máx JJ(t;+2)-f(x)I
-k;;í
j i;;íi
Por consiguiente, ro(f;o) � Mo. Para i en el rango j-k � i � j tenemos:
El siguiente paso es presentar una función spline que aproximeJ de manera sencilla.
t;+z- x � t¡+z- 9 =(t¡+z- 9+1) +(t¡+r- t¡) � o
Con este propósito elegimos:

X - l¡+z � t¡+l - t¡-k+2= (9+1 - t¡) + · · · + (9-k+3- 9-k+z) � ko


¿ f(t;+z)Bt,
00

g = (13)
i=-oo Tomando en cuenta la definición de módulo de continuidad y el problema 21, resulta:
Con ayuda de esta función podemos demostrar el siguiente resultado. Jf(t¡+z)-f(x)I � ro(f;ko) � kro(f;o). 11
362 Capítulo 6 Aproximación de funciones *6.6 Splines-E: aplicaciones 363

Distancia de una función a un espacio spline 2. Seak = 2 y/(x) = x en la ecuación (12). Demuestre queS/ = f.
El resultado anterior se puede enunciar en términos de la distancia de f al espacio 3. Demuestre que
¿ t;+1t1+2Ef(x).
00

S!. La distancia entre una función! y un subespacio G en un espacio normado se define x2 =


como i=-oo
dist(f, G) = ínf 11! - gll- 4. Sea k = 2 y f(x) = 1 en la ecuación (12). Demuestre queS/ =/.
gEG
5. Demuestre la propiedad (v) del proceso de aproximación de Schoenberg.
Usemos la norma definida por 6. Demuestre la propiedad (i) del proceso de Schoenberg en el caso k = 2.
7. Demuestre las propiedades (iii) y (iv) del proceso de Schoenberg.
11! 11 = máx l f(x)I .
a�;;íb 8. Demuestre el siguiente teorema: siS = I:;J:_00 c¡BJ, entoncesS" = I:;¡';::_00 e¡ EJ con

El teorema 4 afirma que: 6 C¡-Cj-1 C¡ -1-Cj-2


e¡ = -
dist(f, S!) � kro(f; 8). (14) t¡+2 -t¡ ( t¡+J -t¡ t¡+2 -t¡ -1 ) ·

Sif es continua, entonces 9. (Continuación) Demuestre que siS = I:;J:_00 c¡ BJ, entoncesS"(t¡) = e¡_¡, donde e¡ se ha
Iímro(f;o) = o. definido en el problema anterior.
sio
10. (Continuación) Demuestre que el interpolante spline cúbico natural para la función f es
Por consiguiente, aumentando la densidad de los nudos se puede lograr que la cota I:;J;:\ c¡ EJ, donde los coeficientes satisfacen la ecuación ( l l ) del texto y las siguientes dos
superior de la ecuación (14) tienda a cero. condiciones naturales en los extremos, correspondientes a i = 1 e i = n:
Todavía es posible decir más en los casos en que la función! tenga más derivadas. (ti+2-/¡_¡)Ci-3 -(ti+2 + li+l -li-1 - t,-2)Ci-2 + (li+I -1;-z)ci-1 = 0
11. Sean C y D dos matrices cuadradas. Demuestre que

rn i1
TEOREMA 5 Sea r < k < n. Si f E C'[to, tn], entonces (con 8 como en el teorema 4):

dist(f, S!) � k'o'llf')II-


es no singular si y sólo si C y D son no singulares.
Demostración Sea g cualquier elemento de S!. Por el teorema 4, '12. Sea k = 3, y tome como nudos los enteros. Paran= 5, 10, 15, y 20, estime el condiciona­
miento de la matriz (f¡(x;)) cuandojj representa la base paras; que se compone de potencias
y potencias truncadas (como en la demostración del teorema 1). Tome los x; como puntos
dist(f, S!) = dist(f - g, S!) � kro(f - g;8) � koll!' - g'JI . igualmente espaciados en [lo, 1.].

Conforme g recorre S!, g' recorre todo s!-1. (Véase el Prob. 14.) Entonces, tomando 13. Sea K cualquier subconjunto de R Demuestre que para que {Et.... , E�} sea linealmente
independiente sobre K es necesario y suficiente que Kn (I;, 1;+1+1) no sea vacía para 1 � i � n.
el ínfimo sobre g en la desigualdad anterior, obtenemos:
14. Use el teorema 1 para demostrar que el operador derivada es suprayectivo si va des! as!-1•
- 15. Demuestre el lema 8 de la sección 6.5 planteándolo como un corolario del teorema de
dist(f, S!) � ko dist(f', s! 1).
Schoenberg-Whitney.
Este argumento se puede repetir r - 2 veces, dando lugar a: 16. Demuestre el lema 9 de la sección 6.5 planteándolo como un corolario del teorema de
Schoenberg-Whitney.
dist(f, S!) � k'o'-1 dist(f(,-ll, s!+1-') 17. ¿Es la siguiente una versión válida del teorema de Schoenberg-Whitney? Si los nodos x; no
se han ordenado necesariamente, entonces el que la matriz (BJ(x;)) no sea singular equivale
- -
� k' 18'ro(f(r 1);8) a la afirmación de que cada intervalo (t¡, t,+k+I), para l � i � n, contiene al menos un nodo.

� k'o'llt<')II 1 18. Use el método de demostración utilizado en el teorema 14, con el fin de probar un resultado
similar para el operador de Schoenberg.
19. (Continuación) Afine el resultado obtenido en el problema 18 para el caso de nudos igual­
SERIE DE PROBLEMAS *6.6 mente espaciados.

l. Demuestre que la matriz EJ(x;) que aparece en la interpolación con splines-E tiene una 20. Pruebe el teorema !, mostrando que sólon + k elementos de la sucesión Ef tienen valores
diferentes de cero en [to, 1.].
estructura de bandas. Esto significa que si EJ(x¡ ) * O y x¡ < x¡+1 para cadaj, entonces cada
fila y columna de la matriz contiene a lo más 2k + I elementos distintos de cero. 21. Demuestre que ro(/; kli) � kro(f; o).
364 Capítulo 6 Aproximación defunciones 6.7 Series de Taylor 365

6.7 Series de Taylor El siguiente teorema resulta relevante en cuanto a sus aplicaciones.
TEOREMA 2 Sea r el radio de convergencia de E:o ak(x -el. Entonces la ecuación
En esta breve sección deseamos ilustrar (y enfatizar) la utilidad de las series de Tay­
lor como mecanismo para hacer aproximaciones. Es evidente que el teorema de Taylor 00
resulta útil cuando se está tratando con funciones que tienen un cierto número de de­ f(x)= ¿ a (x -dk
rivadas continuas. Sin embargo, pierde importancia cuando lo que se tiene son datos k=O
empíricos o funciones con un número escaso de derivadas. Cuando se están usando define unafunción continuamente diferenciable en el intervalo lx -el< r. Más aún,
funciones para las cuales se puede aplicar el teorema de Taylor, no se debería soslayar
00
la posibilidad de representarlas eficientemente mediante un polinomio de Taylor.
Recuerde que si una función f posee una derivada continua de orden (n+ 1) en un J'(x) = ¿kak(x -c/- 1
intervalo (e - 8, e+ 8), entonces k=O
y esta serie tiene a r como radio de convergencia. Finalmente, si lb-el<r y lx-cl<r,
f(x) = p.(x)+ E.(x), entonces
[t(t)dt
donde Pn es un polinomio de grado � n y En es la función residuo. Estos se definen
como: puede calcularse integrando la serie{ término a término. La serie resultante tiene a r

6
• 1 k como radio de convergencia.
p.(x) = -
k! ¡< l(c)(;,; d
A manera de resumen, diremos que este teorema nos indica que podemos integrar
l y derivar una serie de potencias término a término en el intervalo de convergencia.
E (;,;)= _1 _¡<n+ )(� )(x - cr+¡ l�x -el<O.
n (n+ 1)! x Para ilustrar la manera en que funciona este teorema, pasamos a considerar una de
Un caso muy importante tiene lugar cuando e= O; esta serie se conoce como serie de
Maclaurin.
Usando el teorema de Taylor junto con un análisis de E.(;;) conformen -+ oo,
mediante:
S(;;)= -dt
1
las funciones trascendentes de orden superior, a saber, la integral seno. Ésta se define
x sent

obtenemos la serie de Taylor para muchas funciones importantes, como: o t


La integración no se puede llevar a cabo recurriendo a las técnicas usuales en el cálculo
00 elemental. En lugar de ello podemos hacer lo siguiente:
x?1' (1)
cos x= ¿(-l/ ( oo<x<oo)
(2k)! - 00
k=O t2k+l
00
sent= ¿(-1/
1 k=O
(2k+ l)!
-= 2)-ll(x- l / (O<x<2) (2)
X 00
k=O sent _ '°' _ k _t__
2k
1)
t - L)

1
(2k+ l)!


Estas series se conocen como series de potencias. A continuación tenemos un teorema k=O
acerca de la convergencia de las series de potencias. 00
x sent 1
-dt = '°'(-1/-- t2k dt
0 t {:o (2k+ l)! 0
TEOREMA 1 Para toda serie de potencias
00 00
x2k+l
¿ak(x -d S(x)= ¿(- l/
k=O k=O (2k+ 1)!(2k+ 1)
existe un número r en el intervalo [O, oo] tal que la serie diverge para lx - el > r y La serie que hemos derivado para representar S(x) converge rápidamente para valores
converge para lx -el<r. pequeños de x. Así, con sólo diez términos podemos calcular S(l) con veinte lugares
decimales de precisión. (Véase el Prob. 37.)
El número r (puede ser+oo) se denomina radio de convergencia de la serie. Con Otro ejemplo semejante viene dado por:
frecuencia puede calcularse mediante el criterio de la razón. (Véanse los Prob. 1 y 2.) x 00 2k+l
El radio de convergencia de la serie del coseno, ecuación (1), es+oo; el de la serie de la r ldt= " X
(3)
lo k=O (2k+ l)k!
L.;
ecuación (2) es+ l.
366 Capítulo 6 Aproximación de funciones 6.7 Series de Taylor 367

SERIE DE PROBLEMAS 6.7 12. Usando la prueba del cociente (véanse los Prob. 2 y 3), demuestre que si lím._00 la,/a,+i l
l. Demuestre que [:0ak i y z:0ak X( -d tienen el mismo radio de convergencia. ¿Qué
existe o es + oo, entonces es el radio de convergencia de [:0ak (x-el.
sucede para [:0ak i+p, con p, un número natural? 13. Sea ao = 1 yª••l = (2 + (-l)"Ja, paran ;;; l. ¿Cuál es el radio de convergencia de
L..1c=
'\"00
oak(x-e) ?
k

2. (Criterio de la razón) Si Jím,_00 !A..1/A.! < 1 , entonces [:0Ak converge. Use la


prueba del cociente para demostrar que la serie del coseno en la ecuación (1) converge para
toda x real. 14. Sir y r' son los radios de convergencia de 0aki yz: z:0 b l, respectivamente, ¿cuál
k
es el radio de convergencia de [:0(ak + bk)i?
3. (Criterio de la razón, continuación) Si lím,-oo !A..1/A,! > 1 , entonces [: 0 Ab diverge.
Use este hecho junto con el problema 2 para encontrar el radio de convergencia de 15. Una función que guarda cierta relación con el dilogaritmo se define como
00

¿(-1)\x- li f(x) = -
¡ o
X ln(l-t)
--dt -
( oo <x -
t
� 1)

4. Encuentre el radio de convergencia de z: 0 k!x'.


Encuentre la serie de Maclaurin para f y determine su radio de convergencia. ¿Cómo
5. Sif(x) = z: 0 ak(x
-d y si el radio de convergencia es r, entonces! posee derivadas de
todos los órdenes en el intervalo definido por lx-el < r. Más aún,
calcularíaf(-2)? ¿Yf(0.001)?
16. Obtenga una serie para In x integrando la serie de la ecuación ( 2).
17. Demuestre que la serie para senx se puede obtener de dos maneras: derivando o integrando
/"\x) = '°'
00

�(x- d-• ( !x- e! < r)


¿k
( -n)!
k=n
k' la serie de la ecuación ( 1).
18 Obtenga como se indica a continuación una serie de potencias para tan-1 x: inicie con
(1 +xi-1 = z:o(-x)\ sustituya x porx 2 , y luego integre los términos de la ecuación
(Para demostrarlo use el teorema 2.) resultante. Compare este método con el procedimiento alternativo de calcular las derivadas
6. Encuentre una serie de potencias para la función sucesivas de tan-1 x para obtener la serie de Taylor.

2
- ¡· e_¡i.dt
1 9. Haga una crítica de las siguientes igualdades y realice las correcciones pertinentes.

[!- costl dt = [!- f


.fíi. o
(' 1- cost = (' (' (-I -1]
Nota: esta función se conoce como función de error y se denota por erf(x). Se usa en dt /r< dt
lo t lo t t lo t (2k)!
estadística. k=O
�(-lf?

¡
7. Encuentre una serie de potencias para la función = lux-
¿ 2k(2k)! ·
'e'-I k=O
f(x)= -dt
o t 20. Encuentre la serie de Maclaurin para la función

r
Use la serie que obtuvo para calcular f(l) con tres cifras significativas. (En este ejemplo
quiere decir dos lugares decimales.)Finalmente, demuestre que la suma de todos los términos ¡- cost
que no incluyó es tan pequeña que no afecta el resultado. Nota cultural: La función! juega f(x) = dt
un papel muy importante en matemáticas aplicadas. Para mayor información consulte la lo --t- .
obra de Abramowitz y Stegun [1964, cap. 5].
8. Demuestre que la funciónf( x) = z:0 ?/( k!i) es una solución de la ecuación diferencial Nota cultural: esta función se llama en ocasiones integral coseno y se denota porCin (x).
Esta nomenclatura no ha sido estandarizada.
y' =xy. 21. Encuentre la serie de Maclaurin para la integral de Fresnel:

¡·
9. Seaao = 1 yª• = a, 1/[2(n + l)] paran ;;; l. ¿Cuál es el radio de convergencia de
-
z:oakb
cp(x) = sent2dt
< 1 O. Escriba un subprograma o procedimiento que calcule la integral seno con diez decimales de
precisión para cualquierx en -
[ 1, !]. Permita que el número de términos en la serie dependa
de x. Programe una señal de salida que indique que se ha cometido un error cuando se use z:
z:
22. F( unción recíproca) Suponga que f(x) = 0aki, conao = l. Entonces, en alguna
unax que esté fuera del intervalo permitido.
vecindad de O, 1/f(x) está bien definida. Suponga una serie 0 bkl para la función
1 1. Seaf(x) la función cuya serie aparece en el problema 9. ¿Cuál es la serie de potencias para recíproca, y determine recursivamente las bk a partir del hecho de que el producto de las dos
J'(x)? Basta con qne obtenga una relación de recurrencias para los coeficientes. series es l.
368 Capítulo 6 Aproximación de funciones *6.8 La mejor aproximación: teoría de mínimos cuadrados 369

23. (Continuación) Use el resultado del problema anterior para encontrar las series de Maclau­ *6.8 La mejor aproximación: teoría de mínimos cuadrados
rin de x/(e' -1).
24. (Continuación) Demuestre que los coeficientes bk del problema anterior tienen la propiedad Uno de los problemas clásicos de la mejor aproximación se puede enunciar como sigue:
de que b3= bs= b7= ... =O. Nota cultural: los coeficientes k!bk se llaman números de se define una función continua f sobre un intervalo [a, b]. Para n fija, buscamos un
Bemoulli, y con frecuencia se denotan con Bo, B1, ... , Bk, polinomio p de a lo más grado n que se aparte tan poco como sea posible de f. La
25. (Continuació�) Demuestre que los números de Bemoulli en el problema 24 tienen la pro- desviación se puede medir mediante la expresión:
piedad:
n-1 máx. lf (x) -p(x)I,
¿( n Bk =O (n > 1).
a��b

k=O Se reconoce de inmediato que esto es muy distinto de interpolar simplementef en algún
Pruebe que conBo= 1 esta ecuación puede usarse para calcular B1, B2, ... , Bk yqueBo = 1, conjunto fijo de nodos y es distinto también de truncar simplemente la serie de Taylor
B1 = -i, B2 = !,Bi =O,B4=--fo. def, si es que tiene una. De hecho, tenemos aquí un problema extrema!, cuya solución
no es del todo evidente.
26. Demuestre que si r es el radio de convergencia de ¿;;:
k
0 akx , entonces el radio de la serie
derivada, I;:O kak} -1, también es r. Existencia
27. Demuestre que El problema lineal general de la mejor aproximación engloba al que acabamos de
-= 1-2 ¿X
00
x+I k
I I 1).
(X< describir. En este caso consideramos cualquier espacio lineal normado E y un subespacio
x-1 k=O G en E. Para cualquier f E E,la distancia de f a G se define como la cantidad
28. Encuentre una serie de potencias alrededor deO para la función cscx-1/x. dist(f, G) = ínf 11! -gll-
29. Encuentre la serie de Maclaurin para la función/ definida por la ecuación:
gEG

Ésta es una medida de la desviación mínima absoluta que esperamos alcanzar al aproxi­
-ln(l -x)f(x)= mar el vector f mediante un elemento de G. Si un elemento g de G tiene la propiedad
1-x·
X

11!-gll = dist(f, G),


30. Encuentre una serie de potencias de (x -1) para la función
entonces g alcanza esta desviación mínima y se denomina una mejor aproximación de
x i-e f desde G. El significado de mejor aproximación depende, por lo tanto, de la norma
f(x)= J -dt. escogida para el problema.
1 t-1
En el problema clásico mencionado líneas arriba, el espacio normado E es el espacio
Use la serie resultante para calcular /(0) con una precisión de tres cifras significativas. C[a, b] de todas las funciones continuas definidas sobre [a, b], y la norma es
31. Deduzca la ecuación (3). 11111 = máx. lf(x)I f E C[a,b] (1)
32. ¿Cuál es el radio de convergencia de la serie ¿;;:,0 k(2x/? a��b

El subespacio G sería entonces el espacio II. de todos los polinomios de grado ;;;;
¿;;:,0 e¡} si co= 1 yen= (n/3)Cn-1 para n> 1?
33. ¿Cuál es el radio de convergencia de n, interpretado como un subespacio de C[a, b]. La sección 6.9 se ocupa de este tipo
particular de aproximación.
34. ¿ Cuál es el radio de convergencia de la serie ¿;:,0 e¡}, donde co = 1 y Cn+I =
(3n + 3)cn/(n + 5)? En el problema general de la mejor aproximación, uno de los puntos más importantes
es si existe una mejor aproximación paraf. A continuación presentamos un importante
35. Encuentre los tres primeros términos en la serie de potencias de x para e'°". teorema de existencia.
36. Encuentre una serie de potencias para TEOREMA 1 Si G es un subespacio de dimensión finita en un espacio lineal normado E, entonces

l e-'dt
cada punto de E posee al menos una mejor aproximación en G.

Demostración Seaf un elemento de E. Cualquier candidato, g, para ser una mejor aproximación def,
37. Demuestre que en la serie para la integral seno S(l) sólo se necesitan 10 términos para debe competir con el elemento cero de G; por ende,
obtener 20 lugares decimales de precisión. ¿Cuántos se necesitan para obtener 25 lugares
decimales? 11!-gil ;;;; 11!-011 = 11!11,
370 Capítulo 6 Aproximación de funciones *6.8 La mejor aproximación: teoría de mínimos cuadrados 371

Podemos por lo tanto reducir nuestra búsqueda al conjunto donde w es una función positiva y continua que ha sido fijada. En cualquier espacio con
producto interno escribimos f.L g si sucede que (f, g} = O. Escribimos f.LG si f.L g
K = {g E G: llg - fil � llfll}. para toda g E G.
El conjunto K es cerrado y acotado. Ya que G es de dimensión finita, entonces K es LEMA 1 En un espacio con producto interno se satisfacen las siguientes propiedades:
compacto. Dado que la función g 1-+ 11! - gll es continua, podemos hacer alusión al
(a) (I:7=1 aJ¡, g} = I:7=1 a¡(J¡, g}
teorema que nos dice que una función continua con valores reales sobre un conjunto
compacto alcanza su ínfimo. 11 (b) 11! + g¡¡2 = 111112 + 2(!, g} + ¡¡g¡¡2
(c) Sif.Lg, entonces 11! + gll2 = 11!112 + llgll2
Unicidad (d) l(J,g}I � ll!llllgll
(e) 11! + gll2 + 11! - gll 2 = 211!112 + 2llgf
En general, las llamadas mejores aproximaciones no son únicas. Un ejemplo sen­
cillo surge al aproximarf(x) = cosx sobre el intervalo [O , n/2] mediante una función
g(x) = u, donde 11. es una constante a nuestra disposición. La figura 6.1O muestra varias Demostración La parte (a) se demuestra por inducción matemática, usando los axiomas (i) y (ii). La
mejores aproximaciones, para el caso en que se ha adoptado la norma en la ecuación (1). parte (b) usa los axiomas (i) y (ii), y la definición en (iv):

11! + gll = (f + g,f + g} = (f,f} + (f, g) + (g,J} + (g, g}


2

2 2
= 11111 + 2(f, g) + llgll
La parte (c), la ley pitagórica, se deduce de inmediato de la parte (b). La parte (d) es la
desigualdad de Schwarz. Para demostrarla suponga que no es válida para el par (f, g):

1 (f, g}1 > ll!ll llgll


Dado que (f, O} = O, resulta evidente que g :;1: O. Por homogeneidad podemos suponer
,r/2 que llgll = 1,demaneraque l(J,g}I > IIJII. También porun argumento dehomogeneidad
podemos suponer que (f, g) = 1, y que por lo tanto 11!11 < l . Con ello surge una
contradicción:
Figura 6.10 Aproximación de cosx por u.
El proceso de obtener mejores aproximaciones para casos específicos de E, G y f o � 11! - gll
2
= 11!11 2 - 2(¡, g} + llgll 2 = 11!1! 2 - 1.
puede ser una tarea complicada. Normalmente implica resol ver un sistema de ecuaciones
no lineales. Sin embargo, se tiene un caso importante en el que sólo necesitamos resolver
Para demostrar la parte (e) se lleva a cabo un cálculo directo a partir de la parte (b). 11
algunas ecuaciones lineales. Éste es el caso en que E es un espacio con producto interno. Una vez que se cuenta con la desigualdad de Schwarz, la desigualdad del triángulo
Recuerde que un espacio real con producto interno es un espacio lineal E, en el cual se para la norma se demuestra escribiendo:
han definido un producto interno y una norma que satisfacen estas propiedades:
(i) (f, h) = (h,f) 2 2
11! + gll = 11!11 + 2(f, g} + llgll
2

(ii) (f, a.h + �g) = a.(f, h) + � (J, g) 2


� 11111 + 211!11 llgll + llgll
2

(iii) (f,f} > O sif :;1: O


= Cll!II + llgll ) .
2

(iv) llf11 = ../(ff¡


Dos espacios importantes con producto interno son R", con TEOREMA 2 Sea G un subespacio en un espacio con producto interno E. Para f E E y g E G las
siguientes propiedades son equivalentes:
n
(i) g es una mejor aproximación af en G
(x,y} = í:x¡y¡.
i=l (ii) f - g.LG.
y Cw [a, b ], el espacio de las funciones continuas en [a, b ], con
Demostración Sif - g.LG, entonces para cualquier h E G tenemos que, debido a la ley pitagórica,

(f, g} = tf(x)g(x)w(x)dx, 11! - hll = IIU - g) + (g - hlll = 11! - gl¡ + llg - hll � 11! - gf
2 2 2 2
372 Capítulo 6 Aproximación de funciones *6.8 La mejor aproximación: teoría de mínimos cuadrados 373

h E Gy A. > O. Entonces
Para demostrar el enunciado inverso suponga que ges una mejor aproximación af. Sea Sistemas ortonormales
Existe otra fonna de enfocar los problemas de aproximación en un espacio con
-11! - gll
2 2 producto interno, y consiste en construir primero sistemas ortononnales. Decimos que
o ;; 11! - g +A.hll
2 2 2 una sucesión finita o infinita de vectoresf1 ,fz, ... en un espacio con producto interno es
= 11! - gll2 +2A.(f - g, h) +A. llhll - 11! - gll
(i,;: j)
ortogonal si
= A.{ 2(! - g, h ) +A.llhll2 }.
(f¡,[) = o
Haciendo que A. L O, obtenemos que (f - g, h) � O. La misma desigualdad debe ser Se dice que el conjunto es ortonormal si para toda i y j
satisfecha por -h, y por lo tanto (f - g, h) ;; O. Por lo tanto (f - g, h) = O. Ya que h
fue elegida de manera arbitraria en G,f - gj_G. 11 (J¡,Jj) = Oij
Observe que en esta situación la unicidad de la mejor aproximación es una conse­ Tales sistemas se adaptan muy bien para hacer aproximaciones gracias al siguiente
cuencia de la demostración que se acaba de ofrecer. resultado.

TEOREMA 3 Sea {g¡, gz, ..., gn} un sistema ortonormal en un espacio con producto interno denotado
Ecuaciones normales por E. La mejor aproximación a f mediante un elemento I:7=1 c;g; se obtiene si y sólo
si C¡ = (j, g¡).
mediante un polinomio g(.x) = c 1x + c2x3 + c3.x5 en el intervalo [-1, l], y donde se
Ejemplo 1 Use el teorema 2 para determinar la mejor aproximación de la funciónf(x) = senx

Demostración Sea Gel subespacio generado por g1, g2,••• , gn. Observe que la mejor aproximación,
I:;=1 c;g;, se caracteriza, al igual que en el teorema 2, por la condición:
utiliza la nonna
l/2
1
2
ll!II = { [ [f(x)J t1x }
Respuesta La función óptima g posee la propiedad ! - gJ_G, donde Ges el espacio generado por f- ¿ c;g;J_G.
1 n

g1 (x) = x, g2(x) = x3, y g3 (x) = .x5. Por lo tanto, se pide que (g- g ) = Opara i = l ,
f, ¡
i=l
2, 3. Estas ecuaciones se pueden escribir como:
c1 (g¡, g;) +c2(gz,g ) +c 3(g3, g;) = (f, g;) e; = (f, g;). Por otra parte,! - I:7=1 c;g; será ortogonal a G si y sólo si es ortogonal a
Por ello sólo necesitamos verificar que esta condición es equivalente a la condición

¡ cada vector gj de la base. Al calcular los productos internos requeridos obtenemos (para
(i = 1, 2, 3)
y se llaman ecuaciones normales en este problema. Suministrando los detalles se 1 ;;j;; n):
obtiene:

- cg g =( g) c g
r x2dx+cz ¡ x4dx+c3 ¡ x 6dx= ¡ X·Senxdx
v t ¡ ¡, ) f, j -t ¡(g¡, j)
l l l l
C1
Í-1 -1 -1 -1

c 1 ¡ x 4dx +c2 ¡ x 6dx +c 3 ¡ x 8dx = [ x 3 senx dx = (f,gj)-Cj =Ü.


1 1 1 1
11
L1 L 1-1 1-1

x 6dx +Cz x 8dx +C3 x 10dx = ;? senx dx


1 1 1 La estrategia sugerida por estas consideraciones es la siguiente: si se desea apro­
r r r r
base ortononnal {g1, gz, ... , gn} para G. En este caso la mejor aproximación af es
C1 ximar elementos de E mediante elementos de un subespacio G, obtenga primero una
L 1-1 1-1 1-1
Después de haber integrado numéricamente todas las expresiones que aparecen arriba I:7=1 (f, g;) g;.
obtenemos el siguiente sistema de ecuaciones de 3 x 3 que debemos resolver: Para ilustrar dicha estrategia reconsideremos el ejemplo anterior
senx � C1X +czx3 +C3x5
l l 7

! [:]=
3 5 C¡ U-�

[�'�;,:] •
[ 5l 'il
1 l Es un hecho conocido que una base ortononnal para nuestro subespacio tridimensional
'i 9 l l puede estar constituida por los siguientes tres polinomios de Legendre:

g¡(X) =x/v2}3
donde a. = sen 1 y � = cos l. Usando los valores numéricos para a. y � resolvetnos
el sistema y obtenemos c 1 :::; 348.9, c2 � -1491.1, y c3 � 1275.6. Los valores tan
gz(x) = (5x3 - 3x)/ jffj
grandes que se obtienen para estos coeficientes son un síntoma de que nos encontramos

g3(x) = ( 63:r? -70x 3 +15x)/ jz¡ü·


ante un sistema mal condicionado de ecuaciones. (La base elegida para Ges inapropiada
para el trabajo numérico .) 11
374 Capítulo 6 Aproximación defunciones *6.8 La mejor aproximación: teoría de mínimos cuadrados 375

Por tanto la solución a nuestro problema es el polinomio Z::;=1 c;g;, donde e; = (f. g;). El proceso de Gram-Schmidt
Así
Centramos por ahora nuestra atención en la cuestión de cómo obtener bases orto­
c¡ = /fii / x · senxdx = 2/fii(a.- �) norrnales. En el siguiente teorema se describe el proceso de Gram-Schrnidt.

L
1
TEOREMA 4 Sea {v1, v2, ... , v.} una base de un subespacio U en un espacio con producto interno.
= /fii senx(5x3 -3x) dx = 2/fji (-18a.+ 28�) Defina recursivamente:

i-
c2
i-1
c3 = yll/2 L senx(63x -7 0x + 15x)dx = 2yll/2(4320 a.- 6728�)
5 3 u¡ = ( V¡-
11

1 (v;, u¡)u¡ ) 1 (V¡-
11 -

(v;, u¡)u¡) (i= 1,2, ... ,n)

donde a.= sen 1 y � = cos l. Usando valores numéricos para a. y � obtenemos las
Entonces {u ¡ , u2, . .. , Un} es una base ortonormal de U.
soluciones aproximadasc1 � 0 .7377 1, c2 � -6.7391x 10-2, yc3 � 2.2904x 10-3• En
vista de que ya se cuenta con la base ortonormal, estos resultados se pueden obtener con un
menor esfuerzo recurriendo a este segundo método. Dése cuenta de que los coeficientes Demostración Denote con U; al espacio generado por {V¡, v2, ... , v.}. Demostraremos por inducción
son de tamaño modesto, lo cual significa que nuestra base está bien condicionada. sobre i que
(i) {u¡, u2, ... , u;} e U;
Ley pitagórica generalizada y desigualdad de Bessel (ii) { u1, uz, ... , u;} es ortonorrnal
El siguiente resultado es una ley pitagórica generalizada. Para i = 1 vemos de inmediato que u 1 E U1 y que [Ju¡JJ = l. Suponga ahora que (i)
y (ii) son ciertas para el índice i - l . Entonces {u1, u2, ••• , ui-1} e U;_ 1 y v; � U;_ 1.
LEMA 2 Si [g¡, g2, ..., g.] es ortogonal, entonces
Por lo tanto v; no es una combinación lineal de u1, u2, ... , u;-¡, y el denominador en
la definición de u; no es O. Esto implica que u;_ está bien definida y pertenece a U¡ . Por
2
a¡g
=
a JJg; JJ ende {u1, u2, ... , u;} e U;. En vista de que z::;::(v;, u¡)u¡ es la mejor aproximación de
\\t f t 7 v; en U;_ 1 (por el teorema3 ), tenemos que, como consecuencia del teorema2, u¡J_U;-1.
Resulta entonces que u;j_{u1, u2, ... , u;- 1} y que, obviamente, JJu; JJ = l . 1111
Demostración Sin = 1, la igualdad es Óbvia. Si la ecuación es correcta paran, entonces resulta también
correcta paran+ I, debido a que ª•+lgn +l es ortogonal a z::;=1 a¡g;, y se utiliza el caso Una simplificación sorprendente ocurre cuando el proceso de Gram-Schrnidt se

1 t,, r � 1 t.,, J
elemental de la ley pitagórica: aplica a los monomios 1, x, x2, ... (en su orden natural). En el teorema siguiente
se puede utilizar cualquier producto interno mientras satisfaga la propiedad de que para
+ll�,,�dl' tres funciones cualesquiera:
(fg, h) = (f. gh).

• Es obvio que ésto es válido para el producto interno que comunmente se usa:

l
[ af lJg; IJ
2
+ ª�+1 JJg.+iJ12
=
i=l

El siguiente resultado es la desigualdad de Bessel. (f. g) = f(x)g(x)w(x)dx

LEMA 3 Si [g¡, g2, . .., g.] es ortonormal, entonces TEOREMA 5 La sucesión de polinomios definida inductivamente como sigue es ortogonal:
n
2 2 p.(x) = (x- a.)p.-1(x)- bnPn-z(x), (n;;; 2)
[ 1(f. g¡) 1 � IIJIJ
i=l
con po(x) = 1, p¡(x) = x - a¡, y
Demostración Tome g * = Z::7=1 (f. g; )g;. Por el teorema 3 , g* es la mejor aproximación af en el
espacio G generado por las g;. El teorema 2 nos indica que f - g* J_G. Utilizando dos ª• = (xp.-1,Pn-1)/(Pn-1,Pn-1)
veces la ley pitagórica obtenemos: bn = (XPn-l,Pn-z)/(Pn-2,Pn-2) ·
n
2
11!11
2
=
JI!- g* JJ
2
+ IJg * 112 ;;; IJg* 11 = 2
[ 1 (f. g; ) 1 11 Demostración Al ver las fórmulas resulta evidente que cadaPn es un polinomio mónico de grado n, y
i=l por lo tanto es diferente de cero. Como consecuencia de ello los denominadores en las
376 Cap ít ulo 6 Aproximación defanciones *6.8 La mejor aproxi mación: teoría de míni mos cuad rados 377

fórmulas no son cero. Demostramos ahora, por inducción sobren , que (p n,p¡) = O para Respuesta Haciendo el cambio de variablex = cose, escribimos el producto interno como sigue:
i = O, 1, ... , n - l. Paran = O no hay nada que demostrar. Paran = 1 observamos que
por definición dea 1:
(J,g) = ['f( cose)g ( cose) d e.
(pi,Po) = ( (x-a¡)po,Po) = (xpo,Po)-a¡ (po, Po) = O.
Suponga ahora la validez de nuestra afirmación para un índice n - 1, donde n � 2. Ya que T.(x) = cos(n cos- 1 x), entonces ( sin ;1: m)
Entonces:

( Pn, Pn-1) = (XPn-l, Pn-1)-an( Pn-l, Pn-1) -bn( Pn- 2 , Pn-l) = O


(T.,Tm) = 1" cosne cosmed e

( Pn, Pn- 2) = (X Pn-l, Pn- 2 )-an( Pn-!, Pn-2) -bn(Pn- 2, Pn- 2 ) = O = -2 [ cos(n+m) e+ cos(n-m) e]d e
11·o
Para cualquier i = O, 1 , ... , n- 3, tenemos: ! sen(n+m)0 sen(n-m)0]"=O
= 2 [ n+m + 1
= (x Pn-1, Pt)-an( Pn-1,pi)-bn( Pn- 2 , Pn-i) n-m
( Pn, Pt) 0

= (Pn-1, xp¡ )
Algoritmo
= (Pn-1,Pi+1+ai+ t Pi+b¡ 1
+ Pi-1)= O
Si se da un polinomio en la forma u = r;=O C¡p¡, donde los polinomiosp¡ son los
En el último paso hemos utilizado la fórmula de recurrencia para representar xp¡ . Sj descritos en el teorema5, entonces el cálculo de u(x) se puede llevar a cabo con eficiencia
i = O, deberíamos entonces escribir xpo =p¡+a1po. 1111 haciendo lo siguiente:

f
Ejemplo 2 Utilice el teorema5, con el producto interno J(x)g(x) dx, para obtener los polinomios dn+2 O
de Legendre.
i-

dn+l O i-

Resp ue sta Los primeros cálculos se efectúan como sigue: for k = n, n- 1, ..., O do
po(x) = 1 d k <-- C k+ (x -a k+1)d k +l-b k+2d k+2
end.
a¡= (xpo,Po)/(po,Po) =O
p¡(x) =X Entonces u(x ) = do.
a2 = (xp1,p1)/(p1,P1) =O He aquí la demostración de la validez del algoritmo:

b 2 = (xpi, po)/(po, Po) = 1


u(x) = ¿ CkPk(x)
pz(X) = x2- t. k=O
Los siguientes dos polinomios de Legendre son:
= ¿[d k- (X-a k+t)d k+l+b k + 2d k + 2JPk(X)
3 k=O
p3(X) =X - - X 3
5 =dopo(x) +d¡[p¡ (x) - (x-a¡)po(x)J
62 3
p4(X) =X4 - .x-+ ° 1
7 35 + ¿d k P[ k (x) - (x-a k) Pk -1 (x) +b kPk - 2 (x)]
Ejemplo 3 Demuestre que los polinomios de Chebyshev forman un sistema ortogonal en[-1, l]
k=2

cuando se usa el siguiente producto interno: =do


¡
dx TEOREMA 6 Los pol i nomios Pndescr itos en el teorem a 5poseen la siguiente prop ied ad: Pnes el
(J,g) = Lf(x)g(x) v' 2· poli nomio mónico de gr ado n p a r a el cua l JJp.JIes un mínimo.
l-x
378 Capítulo 6 Aproximación de fanciones *6.8 La mejor aproximación: teoría de mínimos cuadrados 379

Demostración Un polinomio mónico arbitrario de grado n puede representarse como Pn - ¿7,;;-¿ c;p¡. Demostración Usando el proceso de Gram-Schmidt podemos encontrar una matriz B den x n tal que
La norma de esta función será un mínimo si los vectores n
n-1

¿ C¡p;ll -l·
v; = ¿B¡,u,
Pn - n s=I
i=O
formen un conjunto ortonormal. Entonces
Esta relación de ortogonalidad se logra tomando c; = O para toda i, debido a que
111
Pn.lIIn-1 ·
Oij = (v;, Vj) = ( �B¡,u, , �BjrUr)
Si [u1, u2, .. .] es un sistema ortonormal en un espacio con producto interno E, se
define una familia de operadores de proyección Pn mediante la ecuación:
= ¿¿B¡,(u,,u,)B;.
n
Pnf = ¿(f. u;)u¡.
í=l Esta ecuación es de la forma I = BG Br. Por consiguiente Ges no singular. 11

TEOREMA 7 Los operadores Pn poseen las siguientes propiedades Resulta imposible resistirse a la tentación de ofrecer otra demostración de este
resultado. En vista de la observación hecha inmediatamente después del teorema 2,
(a) Pn mapea linealmente a los elementos de E al subespacio Un generado por el problema de aproximación descrito líneas arriba tiene una solución única. También
Ut, Uz, •.. , Un, resulta única la expresión de u en términos de la base, u = ¿ c;u;, por ser ésta una
(b) Cada Pn es una proyección; es decir, P� = Pn. propiedad de cualquier base. Por lo tanto nuestro problema tiene una solución única, a
(c) Cada Pn es una transformación ortogonal en el sentido de quef - Pnf .lUn. saber, (e¡, c2, ..., Cn)- Ya que esto es cierto para cualquier!, la matriz de coeficientes G
debe ser no singular.
(d) P,f es la mejor aproximación def en Un. El lema nos asegura que las ecuaciones normales tienen una solución única. Por
(e) Cada Pn es autoadjunta: (Pnf. g) = (f. Png). ello, en principio, cualquier base del subespacio U se puede emplear para resolver
el problema de aproximación. En la práctica debe tomarse en cuenta el número de
111 condición de la matriz de Gram. Recuerde las observaciones hechas acerca de la matriz
Demostración Se deja al lector. (Véase el Prob. 18.)
de Hilbert en la sección 2.3. Ésta es la matriz de Gram para las funciones u¡(x) = xj-I
cuando se utiliza el producto interno (f. g) = J0 f(x)g(x) dx. Desde el punto de vista
1

La matriz de Gram del condicionamiento, las bases más satisfactorias son las bases ortonormales, ya que
sus matrices de Gram son la matriz identidad.
Los problemas de aproximación en espacios con producto interno se pueden resolver
de manera elemental sin utilizar bases ortonormales. Si {u1, u2,... , un} es cualquier
base de un subespacio U, y si deseamos calcular una mejor aproximación en U para un SERIE DE PROBLEMAS *6.8
elemento f, podemos proceder como sigue. Para que un elemento u E U sea la mejor
aproximación def, según el teorema 2, es necesario y suficiente que u -f.LU. Una l. Usando la norma del supremo, encuentre la mejor aproximación a sen x mediante una función
u(x) = ;l.x en el intervalo [O, rc/2].
condición equivalente es que (u - f. u;) = O para 1 ;;; i ;;; n. Al escribir u= LJ=t CjUj
encontramos la condición: 2. Resuelva el problema 1 usando la norma cuadrática usual.
3. Suponga que deseamos aproximar una función par mediante un polinomio de grado � n,

¿ Cj ( j, u;) = (f. u;)


U (1 ;;; i;;; n)
usando la norma IIJII = {J�1 lf(x)l2dx} 1/2• Demuestre que también la mejor aproximación
es una función par. Generalice este resultado.
j=l
4. Sea po, p¡, p2, ... una sucesión de polinomios tal que (para cada n) p. tiene exactamente
grado n. Demuestre que la sucesión es linealmente independiente.
Éstas son las ecuaciones normales del problema. Constituyen un sistema de n ecua­
ciones lineales con lasn incógnitas c1, c2, ... , Cn. Se conoce a la matriz de coeficientes 5. Demuestre la identidad de Parseval
como matriz de Gram; sus elementos son G;j = (u;, uj). "
(f,g) = ¿(f,u,)(g,u,)
i=l
LEMA 4 Si [u¡, u2, ... , Un] es linealmente independiente, entonces la matriz de Gram es no sin­
gular. que es válida sif y g están en el espacio generado por el conjunto ortonormal [u1, u2, ... , u.].
380 Capítulo 6 Aproximación de funciones *6.9 La mejor aproximación: teoría de Chebyshev 381

6. Demuestre que la conocida matriz de Hilbert, con elementos 19. Sea t. el múltiplo mónico de T,. Encuentre la relación de recurrencia de tres términos
satisfecha por To, T1 , ....
a,¡=(l+i+1T1 (0 � i,j�n)
20. Encuentre una fórmula para dist(f, G), donde G es el subespacio generado por un conjunto
1
ortonormal (g¡, g2, ...,.g.].
es una matriz de Gram para las funciones 1, x, :r?-, ...,x•- •
21. Deduzca las siguientes expresiones para polinomios de Legendre
7. En un espacio vectorial con base { V¡, v2, ..., v.}, cualquier otra base se obtiene mediante
una transformación lineal
p¡(X)=xi - 3 x
5
Uj = ¿agvi (l�j�n) 6 3
4
p4(x) = x - x2 +
i=l 1 35
510 l 5
para la cual su matriz de coeficientes es no singular. Demuestre que la matriz que se genera ps(x)=x - -x +-x
de esta manera a partir del proceso de Gram-Schmidt es una matriz triangular superior. 9 21
8. Suponga, en la relación de recurrencia de tres términos que da lugar a los polinomios orto­
gonales, que el producto interno está dado por (f, g) = fJ(x)g(x)w(x)dx, donde w es una
función par. Demuestre que a. = O para toda n. Demuestre también que p. es par si n es *6.9 La mejor aproximación: teoría de Chebyshev
par, y que Pn es impar si n es impar.
9. Sea {V¡, v2, ..., v.} un conjunto ortogonal de vectores en un espacio con producto interno. En esta sección vamos a trabajar con el espacio C(X) de todas la funciones reales y
¿Qué elección de coeficientes da lugar a un valor mínimo de 11/ - I:;=1 c¡V¡IJ? No elimine
la posibilidad de que alguno de los vectores v pueda ser cero. continuas definidas en un espacio topológico X. Supondremos que X es un espacio
de Hausdorff compacto. El lector que desee evitar toda consideración de la topología
10. En el algoritmo para calcular una combinación lineal de polinomios ortogonales, demuestre general puede imaginar que X es un conjunto cerrado y acotado en el espacio real, JRk
que se necesitan a lo más 2n-1 multiplicaciones. En el caso de los polinomios de Chebyshev
basta con n multiplicaciones. como, por ejemplo, un intervalo [a, b] en IR.
El espacio C(X) deviene un espacio normado (en realidad, un espacio de Banach)
11. Demuestre que b. es positivo en la fórmula de recurrencia de tres términos para generar si definimos la norma como:
polinomios ortogonales, probando que bn = 11Pn-dl /IIPn-2 IJ .
2 2

llf 11 = m áx IJ(x)I
xEX
12. Demuestre que para los polinomios de Legendre los coeficientes en la fórmula de recurrencia
de tres términos son a. = O ybn = (n - 1)2/[(2n - 1)(2n - 3)]. Esta norma es la que utilizaremos en esta sección.
13 . ¿Cómo tendría que cambiarse la fórmula de recurrencia de tres términos para generar poli­ El siguiente es un problema importante, relativo a la mejor aproximación en el
nomios ortogonales, si quisiéramos generar un sistema ortononnal? espacio C(X). Se dan un elemento f de C(X) y un subespacio de dimensión finita G
14. Aplique el proceso de Gram-Schmidt a la sucesión de funciones x >-+ (:r?- - 1)1, k = O, de C(X). Se pide aproximar aj con un elemento de G de la mejor manera posible. En
f
1, 2, ... usando el producto interno (u, v) = 1 u(x)v(x)dx. Demuestre que si la suce­
consecuencia (al igual que en la sección precedente) definimos:
sión ortonormal resultante se renorrnaliza para formar una sucesión de polinomios m6nicos,
entonces estos últimos satisfacen una relación de recurrencia de la forma dist(f, G) = ínf 11! - gll
gEG
q.+1(x) = xq.(x) -b.qn-i(x).
y no preguntamos si hay una mejor aproximación, es decir, un elemento g E G, tal que
Dé una fórmula parab•. Determine los primeros tres q-polinomios.
15. Demuestre que un conjunto ortogonal de elementos diferentes de cero es por necesidad IIJ - gll = dist(J, G).
linealmente independiente.
16. Sea A una transformación lineal sobre un espacio con producto interno. Suponga que A Esta pregunta recibió una respuesta afirmativa en la sección precedente (teorema 1).
es auto-adjunta, lo cual significa que (Af,g) = (f,Ag) para toda/ y g. Demuestre que Podemos, por lo tanto, emprender la tarea de determinar mejores aproximaciones en
las soluciones de la ecuación AJ = V que corresponden a valores diferentes de "A. son este contexto. Para tener una idea de qué es lo que debemos esperar, consideremos un
mutuamente ortogonales. ejemplo.
17. Sea [u 1, u2, •••] una sucesión ortonormal. Demuestre que para cualquier/, los coeficientes
de Fourier (f, u.) son de cuadrado sumable: I:: 1 (f, u,)2 < oo. Ejemplo 1 Describa la mejor aproximación de la funciónf(x) = cosx en el intervalo [O, !l por un
18. Demuestre el teorema 7. elemento de I11 .
*6.9 La mejor aproximación: teoría de Chebyshev 383
382 Capítulo 6 Aproximación de funciones
Así, necesitamos entender con exactitud cuáles elementos ! de C(X) tienen el cero
como mejor aproximación en G, es decir, tienen la propiedad de que 11! 11 = dist(J, G).
Para un elementof E C(X) se define el conjunto crítico como:

crit(f) = {x E X: lf(x) J = ll!II} .

El siguiente resultado se conoce como el teorema de la caracterización de Kolmogorov.

TEOREMA 1 Para un elementof y un subespacio G de C(X), las siguientes propiedades son equiva­
lentes:
(i) 11! 11 = dist(J, G);
,r/2

Figura 6.11 Aproximación de cos x en el intervalo [O, 1t/2]. (ii) ningún elemento de G tiene los mismos signos que f en crit (!).

Demostración Suponga que (i) es falso. Entonces para alguna g E G, 11!-gjj< I IJII- Para x E crit (!)
Respuesta Los elementos de II1 son funciones lineales, y sus gráficas son líneas rectas. La gráfica definimos cr(x) = sgnf(x) y escribimos:
de cos x junto con una función lineal no muy alejada de ella se muestran en la figura 6.11.
¿Es la función lineal que se muestra una mejor aproximación? No, pues se puede po­ cr(x)[f(x)- g(x)] � lf(x)-g(x)J � 11!-g ll< llfll = lf(x)I = cr(x)f(x)
ner más abajo,reduciendo la máxima desviación. También su pendiente se puede ajustar.
Así,cr(x)g(x) > O y g(x) tiene el mismo signo que f(x) en crit (f).
Para la mejor aproximación habrá tres puntos en los que se da la desviación máxima.
Ahora suponga que (ii) es falso. Sea g(x)f(x) > O en crit (!). No hay pérdida de
Estos serán, al parecer, los puntos O, � y un punto � en el interior del intervalo. Si
generalidad si suponemos que JJg 11 = l . Como crit (!) es un conjunto compacto y gf es
denotamos la desviación máxima con o y la función lineal con g(x) tenemos:
una función continua, hay una E positiva, tal que g(x)f(x) > E en crit (!). Sea
g(O) -f(O) = o O= {x E X:g(x)f(x) > e}
g@-f@=-0
{ En tal caso, O es un conjunto abierto que contiene a crit (!). Su complemento es un
g(1t/2)-f(1t/2) = o conjunto compacto ajeno a crit (!). Por lo tanto,
g'(�)-f'(�) = o
Estas cuatro ecuaciones sirven para determinar o,� y los dos coeficientes de la ecuación
p = máx{l f(x) ! : x E X\ O}< ll!II

g(x) = C¡ + CzX. 11 Tratemos ahora de aproximar a f por medio de \g, en donde el coeficiente A. ha de
escogerse juiciosamente. Veamos qué es lo que se necesita. En primer lugar,queremos
que la siguiente designaldad sea válida en un sentido puntual para los puntos de O:
Caracterizaciones de las mejores aproximaciones
Antes de pasar a la caracterización de las mejores aproximaciones, haremos una (f- \g)2 = J2- 2\gf + "-2 i � 11! 11 - 2A.e + "-
2 2
= 11!1! 2- \ (2e- A)< ll!ll 2
observación:
Como es fácil de comprobar, esto es cierto si O< A.< 2e . En segundo lugar, para los
LEMA 1 Las propiedades siguientes son equivalentes para todo elemento g E G: puntos restantes (es decir, aquellos en X\ 0) queremos que

(i ) g es una mejor aproximación de f. lf- "-gl � I! 1 + "-lgl � P + "-< llfl! .


(ii) O es una mejor aproximación def - g.
Esto es cierto si O< A.< !! JI!-p. De este modo, si A. se elige correctamente, 11!-\gil <
con lo que se demuestra que (i) es falso. 11
Demostración Si (i) es cierto, entonces para todo h E G,
Utilizando el lema 1 y el teorema anterior obtenemos el siguiente:
lit-gJJ � lit- g- hJJ.
COROLARIO 1 Seaf un elemento de C(X), G un subespacio de C(X) y g• un elemento de G. Para que
Esto último implica que O es una mejor aproximación def- g. Recíprocamente, si (ii) g* sea una mejor aproximación def en Ges necesario y suficiente que ningún elemento
es cierto, la desigualdad anterior es válida para toda h E G, y (i) es verdadero, (pues g de G satisfaga g(x)[f(x) - g* (x)] > O en el conjunto {x : !f(x) - g* (x)J = llf- g'II }.
g + h puede ser cualquier elemento de G). 11
384 Capítulo 6 Aproximación de funciones *6.9 La mejor aproximación: teoría de Chebyshev 385

COROLARIO 2 Para que un elemento g E Il¡ sea una mejor aproximación de un elementof E C[a,b] es
necesario y suficiente que lafunciónf -g tome el valor± 11! -gil con signo alternante
en al menos tres puntos de [a, b].

Demostración Aplicando el teorema de la caracterización aj -g, la propiedad característica es que


ningún elemento de II1 puede tener el mismo signo quef -gen crit (f -g). Debe haber
al menos tres puntos en crit (f -g) en los que los valores def - g cambian de signo, ya
que de lo contrario habría un punto� en [a, b] con la propiedad de que los puntos que
satisfacen/(x ) -g(x) = 11! -x ll estarían en uno de los lados de�, y los que satisfacen
f(x) -g(x) = -11! -g ll estarían del otro. De este modo habría una función lineal que
se anularía en� y que tendría los mismos signos que f -gen crit (f -g). 11111

Figura 6.13 Un conjunto convexo y un conjunto no convexo.


COROLARIO 3 Sea X un conjunto cerrado y acotado en JR. • Sea Gel subespacio de C(X) formado por
2

las funciones lineales


En la figura 6.13 se muestran dos conjuntos en 12 , uno de ellos convexo y el otro no.
g(x,y) = a+bx+cy. Las combinaciones lineales de vectores de la forma¿�=! 9;u; se llaman combina­
ciones convexas cuando¿�=! 9; = 1 y 9; � O. El conjunto de todas las combinaciones

t t
Para que g sea una mejor aproximación de un elementof E C(X) es necesario y suficiente
convexas de puntos seleccionados de un conjunto dado S se llama cáscara convexa de
con que el conjunto crítico def -g contenga alguno de los tres patrones que se muestran
en lafigura 6.12: S. Así,
co (S ) = { 9;u¡: k E N, u; E S, 9; � 0, 9; = 1}
Convexidad
LEMA 2 Sea K un conjunto convexo y cerrado del" (o de cualquier espacio de Hilbert). En este
Se dice que un conjunto K en un espacio lineal es convexo si contiene a todo caso K contiene un único punto de norma mínima. Es más, las siguientes condiciones
segmento rectilíneo que conecte a dos puntos cualesquiera de K. Formalmente, esto se son equivalentes para K:
expresa mediante la implicación: (i) O r/. K;
(ii) hay un vector v tal que (v, u) > O para todo vector u E K.
K]
U, V E
9u+ (1 -9)v E K
O � 9 � ¡ :::} Demostración Sea p = ínf{lluJJ: u E K}. Seleccione Uj E k de modo que Jlujll ...... p. La sucesión [uj]
es de Cauchy, pues por la ley del paralelogramo:

!Ju; - Ujll
2
= 2¡Judl2 + 2llujll2 - liu¡ + ujf
...., = 2lludl2 + 2llu¡ll2 - 4ll (u¡ + u¡)/2112
/ ..............
� 2IJudJ + 21Juj¡¡z -4p2 ...... 2p2 + 2p 2 -4p 2 = O.
2
/ "'O...,
o-------f-___ .....o
", ............... Como el espacio es completo, la sucesión de Cauchy es convergente, digamos uj ...... u.
En tal caso u E K, pues K es cerrado, y por continuidad IJulJ = p. La unicidad se
// / / '\
'\
demuestra por medio de un argumento semejante al anterior: si uy u' son dos elementos
con norma p en K, entonces

------�
// '\,\.
'--- Jiu - u'JJ � 2JJulJ + 2JJu'JJ -4p2 = O.
2
o 2 2

\. Si (ii ) es cierto, (i) se sigue de inmediato. Para el recíproco, suponga que (i) es cierto.
'\ Sea v un punto de norma mínima en K. Tenemos que, para una u E K arbitraria y
9 E (O, 1)
Figura 6.12 Puntos críticos en una mejor aproximación. O� IJ9u+ (1 - 9)vll2 -1Jvll2 = IJ9(u - v) + vll2 - IJvJl 2 = 92 llu -vl2 + 29(u -v, v).
386 Capítulo 6 Aproximación de funciones *6.9 La mejor aproximación: teoría de Chebyshev 387

Demostración Si (ii) es falso, entonces podemos escribir O = ¿J=l 0;u; para ciertos 0; > O y u; E S
Esto demuestra que
2 + 2(u-v, v). convenientemente elegidos. Para toda v E JR• tenemos que
O� e¡¡u- vll
Permitiendo que e 1 O, concluimos que (u-v. v) � O, de donde (v, u) ;;; (v, v) > O. 11
O= (v, O) = ¿ 0;(v,u¡)
El resultado siguiente se conoce como el teorema de Carathéodory. i=l

TEOREMA 2 Sea S un subconjunto de un espacio lineal de dimensión n. Cada punto de la cáscara Está claro que no todos los números (v, u,) pueden ser positivos. Por consiguiente, (i) es
convexa de S es una combinación convexa de no más de n + 1 puntos de S. falso.
Para el recíproco, suponga que (ii) es cierto. Por el lema 3, co(S) es compacto.
Ahora se puede aplicar el lema 2 para concluir que (i) es cierto. 11
Demostración Sea p un punto de la cáscara convexa de S. No habrá pérdida de la generalidad si
suponemos que pes O. En tal caso tenemos que O = ¿�=l 0;u; para ciertos 0; E [O, 1)
Y u; E S, convenientemente elegidos, con í::J=l 0; = l. Es más, podemos suponer Solución de Chebyshev a las ecuaciones lineales
que dicha representación de O es mínima (es decir, k es tan pequeña como es posible). COROLARIO 4 Sea A una matriz de m x n, b E lRm, x E lR", cr; = sgn(Ax- b); e I= {i: !(Ax- b);I =
Se sigue de lo anterior que 0; > O para i = 1, ... , k. Si k � n + l, la demostración
habrá terminado. Por el contrario, si k > n + l, encuéntrese una combinación lineal no IIAx- b[[ oo }. Para que x minimice la norma IJAx- blJ00 es necesario y suficiente que
,

O sea un elemento de la cáscara convexa del conjunto { cr,A;: i E I}, donde A, denota la
trivial ¿�2 l;u; = O. Tome ").. 1 = O. Observe que para todos los números reales t, i-ésima fila de A.
¿�= 1 (0; + tl1)u; = O. Haga

$(t) = mín (0; + tl;). Demostración Cuando pretendemos minimizar [[Ax - blJ00 , buscamos una combinación lineal de las
l;;ái;;ák columnas de A lo más cercana posible a b. Los vectores columna de A los interpretamos
como funciones del conjunto T = {1.2, . ..,m}. El elemento que se aproxima es b
La función $ es continua, y $(0) > O. Además, para alguna t, $(t) < O. Por lo tanto, y el subespacio G de aproxirnantes es el espacio columna de A. Por el teorema de
hay una t0 tal que $(10) = O. Si 0( = 0; + t0l;, tenemos que 0( � O, mín 0( = O y Kolmogorov, la solución x se caracteriza por el hecho de que Iringún elemento de G
Sí = 01 > O. Por consiguiente, en la expresión¿J= 1 e;u;= O uno de los términos tiene tiene los signos cr; en l. De manera equivalente, el sistema cr,(Av); > O, i E I, es
a e; = O. Dividiendo por¿ 0f, podemos expresar a O como una combinación convexa inconsistente. Como este último se puede escribir en la forma (cr;A;, v) > O, i E /, el
de k- 1 elementos de S, lo cual contradice la supuesta minirnalidad de k. 11 teorema 3 nos proporciona una condición equivalente,a saber, O E co{cr;A; : i E I}. 11

LEMA 3 En todo espacio lineal normado de dimensión finita, la cáscara convexa de un conjunto Ejemplo 2 Utilice el resultado anterior para determinar si x = (2, 3f es la solución de Chebyshev
compacto es compacta. del sistema
5xi -7x2 = -14
Demostración Sea S un conjunto compacto en un espacio X de dimensión n. Considere el conjunto V
de todos los (n + 2)-tuplos 3X¡ + Xz = 8

v = (So, 0 , ... , e., UO,


¡ U¡, ••. , Un)
X¡ -9xz = -23
3x1 - lx2 = 6
donde 0; E JR,u; E S,0; � O y¿;=0 0; = l. Estos (2n+2)-tuplos son puntos del espacio 6x1- xz= 6
JR•+l xXxXx· · -xX. Este espacioes de dirnensión n+l+(n+l)n = (n+1)2,yel conjunto
V es cerrado y acotado; por consiguiente, V es compacto. Definaf(v) = ¿;=O 0;u¡. Respuesta Los residuos r¡ = (A;,x)-b; son 3, 1,-2,-3, 3. Por consiguiente, los cr; son +l, +l,
En tal caso f mapea a V en co (S). Por el teorema de Carathéodory,f es suprayectiva -1,-1, +1. El conjunto crítico es I = {1, 4, 5}. El corolario nos dice que x es una
(sobre). También es continua. En virtud de que la imagen continua de un compacto es solución de Chebyshev si y sólo si:
compacta, concluirnos que co (S) es compacto. 11
O E co{cr1A1, cr,µ44, crsAs}.
TEOREMA 3 Para todo conjunto compacto S de JR" las siguientes propiedades son equivalentes:
(i) Hay una v tal que (v. u) > O para todo u E S. Estos tres vectores se pueden graficar rápidamente para ver que esta circunstancia es en
(ii) O no es un elemento de la cáscara convexa de S. realidad verdadera. Vea la figura 6.14. 111
388 Capítulo 6 Aproximación de funciones *6.9 La mejor aproximación: teoría de Chebyshev 389

Para la implicación (iii) => (iv), suponga (iii). Por el teorema de Carathéodory podemos
Xz
escribir:
k

( 3, 1) O = ¿ 0¡/(x¡)g(x¡)
"'l q-,+- .b.....!:: 1 1 1 .- X¡ i=l
(6, -1)
donde k � n + 1, 0; > O y x¡ E crít (!). Poniendo A¡ = 0¡/(x¡), resulta que A¡/(x¡) > O
y O = ¿�1 A¡g(x¡). La última ecuación nos muestra, utilizando la definición de g, que
paraj = 1, ... , n O = I:1=r A¡ gj(x¡) = (¿1=r "-i.x¡)(gi). Dado que G está generado por
las funciones gj, podemos ver que el funcional I:J=l A¡.X¡ aniquila a G.
Para la implicación (iv) => (i), suponga (iv). Si h E G entonces.

¿ l"-d = ¿ A /(x¡) = ¿ A [/(x¡)-h(x;)] � 11! - hll ¿ l"-d


k k k k
Figura 6.14 Cero en la cáscara de tres puntos.
11111 ¡ ¡
i=l i=l i=l i=l
Teoremas adicionales de caracterización Por consiguiente, 11/ 11 � 11/-h ll, y (i) es verdadero. 11
En los siguientes teoremas vamos a utilizar una notación especial. Si G es un
subespacio de C(X) de dimensión n, y si {g¡, gz, ..., g.} es una base de G, escribimos Ejemplo3 Sea X= [O, 1] y sea G generado por g1 (x) = 1-2x2 y g2(x) = x-x2• Demuestre
que cualquier f E C[O, 1] que satisfaga 11/ 11 = /(0) = /(1) tiene la propiedad de que
g(x) = (g¡ (x), gz(x), ... , g.(x)) (x E X). 11/ 11 = dist(.f. G).
Respuesta Utilice la parte (iv) del teorema 4. Si g E G, podemos ver que g(O) + g(l ) = O.
Esto se interpreta como un punto de lR". (Simplemente pruebe esta propiedad con las dos funciones básicas.) Así, podemos
Para toda x E X definimos un funcional lineal x en C(X) por medio de la ecuación tomar x1 = O, x2 = 1, ).1 = 1 y ).2 = 1 en el teorema.

x(f)=f(x) (f E C(X)).
Subespacios de Haar
La linealidad de x se infiere mediante un simple cálculo: Definición Un subespacio G de C(X) de dimensión n es un subespacio de Haar si ningún elemento
de G (salvo 0) tienen o más ceros en X.
.x(af+�g)=(aj+�g)(x) = af(x)+�g(x)=ax(!)+�.x(g)
Ejemplo 4 El subespacio IIn-l de los polinomios de grado< n es un subespacio de Haar en C(X)
TEOREMA 4 Sean G un subespacio de C(X) de dimensión n y f un elemento de C(X). Los siguientes para todo subconjunto X de lR.
enunciados son equivalentes: El resultado siguiente nos muestra que los subespacios de Haar se adecúan muy
bien a los problemas de interpolación.
(i) 11/ 11 = dist(.f. G).
(ii) Ningún elemento de G tiene los mismos signos que f(x) en crít (!). LEMA 4 Un subespacio G de C(X) de dimensión n es un subespacio de Haar si y sólo si para
cualesquiera números reales A¡, A2, ... , "-n y puntos distintos y arbitrarios x1, x2, ... ,
(iii) O se halla en la cáscara convexa del conjunto {f(x)g(x):x E crít (/)}.
Xn de X, hay un único elemento g de G tal que g(x¡) = A¡ (1 � i � n).
(iv) Hay un funcional r:=I A¡.X¡ que aniquila a G y que satisface
X¡ E crít (!), ).¡ f(x¡ ) > O y k � n + l .
Demostración Tome una base {g 1, g2, ..• , g.} de G. El problema de interpolación consiste en determi­
nar C¡, Cz, ••• , Cn tales que
Demostración La implicación (i) => (ii) es parte de la demostración del teorema de Kolmogorov que
ya hemos realizado.
L Cjgj(X ) = A¡
n
Para la implicación (ii) => (iii) supongamos (ii). Sea {g 1, gz, ... , g.} una base de ¡ (1 � i �n)
G. Es imposible que encontremos C¡, c2, ... , Cn tales que I:7= 1 c¡f(x)g;(x) > O en i=l
crít (/). Como esta desigualdad se puede escribir como (c,f(x)g(x)) > O, el teorema de
las desigualdades lineales implica que O se halla en la cáscara convexa del conjunto Si esto es resoluble para todas las elecciones de A¡, entonces la matriz con elementos
de puntos: gj(x¡) es no singular, y el problema homogéneo correspondiente (A¡ = 0) sólo tendrá la
{f(x)g(x):x E crít(f)} solución trivial (e¡=O para toda i). Así, ninguna combinación lineal de g¡, g2, . .. , gn
390 Capítulo 6 Aproximación defunciones *6.9 La mejor aproximación: teoria de Chebyshev 391

se puede anular en los puntos x1, x2, ••• , x•. Ésta es precisamente la propiedad de Haar TEOREMA 7 Sea G un subespacio de Haar en C(X) de dimensiónfinita, y sea A: C(X)-+ Gel mapeo
para G, pues los puntos x1, x2, .•• , Xn son arbitrarios. En vista de que el argumento es tal que IIJ -Af\l = dist (f, G). En tal caso, para cada f hay un número positivo A(/)
reversible, la demostración está terminada. 11 tal que:
liAf -Ah[[� A(j) [\f -h[[ h E C(X).
En los subespacios de Haar, se puede describir las mejores aproximaciones como
sigue: Demostración Por el teorema de la unicidad fuerte, hay un número positivo y(f) con la propiedad de
que para todo g E G,
TEOREMA 5 Sean G un subespacio de Haar de C(X) de dimensión n y f E C(X). Una condición
necesaria y suficiente para que 11!1 1= dist (f, G) es que haya un funcional de la forma lit -gil � 11!-AJII +r(f) IIAJ-g[\.
I:;7;¡
A;x; que aniquile a G y satisfaga X¡ E crít (/) y A¡f (x;) > O. Haciendo g=Ah, tenemos que
y(f) [IAJ -Ah\
[ � [\f -Ah[\- llf -Af ll
Demostración El teorema precedente nos da la misma condición necesaria y suficiente cuando n +I
se reemplaza por k. La ecuación ¿�=! A;g(x;)=O no puede ser válida de un modo no � 11!- h[I +llh-Ah[[ - 11!-Af 11
trivial, a menos que k � n +l . Para verificar lo anterior, tome una k � n y utilice la � 11!- h[l +llh-AJ 11 - lit -AJII
propiedad de interpolación de G (lema 4) para elegir una g E G tal que g(x;)= A¡ . En
consecuencia, tendríamosO= I::=l A;g(x,)= ¿�=! AT- illll � lit -hll +llh-!II +11!-AJII - 11!- A/11
=2 11!-hll 11
Unicidad de las mejores aproximaciones
Teorema de la alternancia de Chebyshev
El siguiente resultado se conoce como el teorema de la unicidad fuerte.
LEMA 5 Sea G un subespacio de Haar en C[a, b] de dimensión n. Suponga que tenemos n +I
puntos tales que a � Xo < X¡ < · · · < Xn � b y I:7=o t,.¡g(x;) = O para toda g E G. Si
TEOREMA 6 Sean G un subespacio de Haar de C(X) de dimensión finita y f un elemento de C(X) tal I:7=o \ Ad :ta O, entonces los números A van alternando el signo: A¡ A¡_¡ <O parai= 1,
que \\! 11 = dist (f, G). Hay una constante positiva y (que depende de f) con la propiedad 2, ..., n.
de que para todo g E G, \lf +gil � ll!ll +y[\g[\.
Demostración Para todo j E {1, 2, ...,n} razonamos como sigue. Por el lema 4, hay en G un único
[, elemento gj con la subsecuente propiedad de interpolación:
Demostración Sean la dimensión de G. Por el teorema anterior, haypuntos xo, x 1, ••• , Xn en crít (f)
y coeficientes positivos 0; tales que I:7=o 0,cr, g(x;) =O para toda g E G, donde cr; = gj(x;)=O paraO�i�j-2 yparaj+l �i�n
sgn/(x;). Sea h un elemento de norma 1 en G. Ya que I:7=o 0;cr;h(x;) =O, al menos {
uno de los números cr;h(x;) es positivo. Así, máx;cr;h(x;) > O. Como esta expresión es gj(xj )= 1
continua yla superficie de la esfera unitaria de G es compacta, inferimos que Y tenemos
O= Í:A,gj(x;)=Aj -1gj(xj -1) +Aj. (1)
y= ínfmáxcr;
h i
h(x;) > O
i=O
Ahora bien, gj(xj -i) >O, pues si gj (Xj-t) fuese menor o igual queO, concluiríamos que
Si g E G yg '#O, entonces para algunai, cr;g(x;)/l!g[\ � y. Por consiguiente, gj tiene n ceros, lo que va en contra de la propiedad de Haar. Por otra parte, la ecuación
(1) indica que si alguna Aj es cero, entonces todas son cero, lo que no concuerda con
11! +gll � cr¡f (:x¡) +cr;g(x;) � +y[[gl!. 11 nuestras hipótesis. En consecuencia, la ecuación (1) muestra que Aj y\-t deben tener
signos opuestos. · 11
COROLARIO 5 Si Ges un subespacio de Haar en C(X) de dimensión finita, entonces cada elemento de El siguiente resultado es el teorema de la alternancia de Chebyshev.
C(X) tiene una única mejor aproximación en G.
TEOREMA 8 Sea G un subespacio de Haar en C[a, b] de dimensión n, y sea X un subconjunto cerrado
Demostración Sea g una mejor aproximación a un elemento f de C(X). En tal caso, O es una mejor en [a, b]. Para todo elemento f E C(X), las sigui;nte propiedades son equivalentes:
aproximación de f - g en G. Si h E G yh '# O, entonces, por el teorema precedente, (i) 11! 11 = dist (f, G); es decir; f tiene a O como mejor aproximación en G.
(ii) Hay puntos Xo < X¡ < · · · < Xn de X, tales que f (x;-1)/(x;) = -111112 para
lit - g +h[l � lit -g[\ +y[[hll > lit -g[[. 1111 1 �i� n.
392 Capítulo 6 Aproximación defunciones *6.9 La mejor aproximación: teoría de Chebyshev 393

Demostración Por el teorema precedente, (i) es equivalente a Éste es otro problema de aproximación de Chebyshev, aunque sólo comprende al con­
(üi) hay puntos XQ, ••• , Xn en crít (!) y coeficientes t..o, ... , "-n tales que junto finito de puntos Xk. Después, se elige un punto Xk en X de modo que

lf(xk) - hk(Xk)I = 11! - hkll-


¿ t..;g(x;) = O
n
xo < X¡ < · · · < Xn, para toda g E G y t..¡f(x;) > O.
i=O Este punto se añade a Xk a fin de formar el siguiente conjunto Xk+I , y después se repite
el procedimiento. El vector hk que se obtiene en el k-ésimo paso es por lo general un
Si (iii) es cierto, por el lema 5, los coeficientes t..; deben alternar los signos. Como buen punto de partida en la búsqueda de hk+1 en el paso siguiente.
t..¡f(x;) > O, los números f(x;) también deben alternar sus signos. Por consiguiente, (ii)
es verdad. TEOREMA 9 Si la seminorma inicial 11 111 en el primer algoritmo de Remez es en realidad una
Recíprocamente, si (ii) es cierto, está claro que cada x; es un punto crítico de f, y norma en G, entonces límk-oo 11! - hkll = dist (f, G). La sucesión [hk] tiene puntos de
los signos de f(x;) se alternan. Para precisar, suponga que sgnf(x;) .= (- lf Si (i) es acumulación, cada uno de los cuales es una mejor aproximación def.
falso entonces para alguna g E G, JI! - gJI < JJJJI. Por consiguiente,
Demostración A partir de las definiciones de las normas y de las inclusiones X1 e X2 e · · · tenemos
(- li[J(x;) - g(x;)] ;;; 11! - gJJ < IIJJI = (-1)'.f(x;). que, para 1 � k � i y g E G,

11! - gll1 � 11! - gllk � 11! - glli � JI! - gll-


Así, (-1ig(x;) > O y consecuentemente g debe tener al menos n ceros. Esto contradice
la propiedad de Haar para G. Note que los ceros de g se hallan en [a, b], mas no De esta desigualdad podemos inferir que
necesariamente en X. Es por ello que la condición de Haar se necesita en [a, b]. 1
11! - hk lli � 11! - hkllk � IIJ - hdl; ;;; dist (f, G).

Algoritmos Esto demuestra que la sucesión lihklli está acotada. Puesto que todas las normas son
equivalentes en el espacio G de dimensión finita, la sucesión 11hk 11 está acotada Por
En lo que resta de esta sección examinaremos ciertos problemas numéricos re­ consiguiente, alguna subsucesión de las hk converge a un punto h*. Dada e > O, con­
lacionados con la aproximación de Chebyshev y bosquejaremos algunos algoritmos sidérese una k tal que llhk - h*IJ < e. Tome una i > k tal que llh; - h*II < e. En tales
disponibles. Tomaremos como problema básico minimizar la expresión circunstancias tenemos:
dist u G) ;;; JI! - h* JI � 11! - hk 11 + llhk - h* 11
¿ c;g;f [ ¿ c;g¡(x)[.
n n

A(c) = [[! - = sup [f(x) -


i=l
00
xEX i=l � IJ( xk) - hk(xk)I +e
� 11! - hklli +e
En este problema, las funciones f, g1, g2, ••• , g. se han prescrito en C(X) y lo que
queremos es determinar los vectores coeficientes e = (e¡, c2, ..., c.) que hacen a A(c) ;;; 11! - hdJ; + llh; - h*lli + JJh* - hklli +e
tan pequeña como se pueda. ;;; dist (f, G) + 3&
Entre los algoritmos básicos para resolver este problema hay uno de carácter ite­
rativo que requiere, en cada uno de sus pasos, resolver un problema similar aunque de En vista de que e es arbitraria, concluimos que IIJ - h* 11 = dist (f, G). Así, todo punto
naturaleza más simple. Este algoritmo se conoce como el primer algoritmo de Remez; de acumulación de la sucesión [hk ] es una mejor aproximación de f en G.
enseguida lo describiremos. Nos falta demostrar que la sucesión dk = 11! - hkll"converge a dist(f, G). Esta
Denotemos con G el subespacio generado por {g1, g2, ••• , g.}. En el k-ésimo paso sucesión está acotada y tiene subsucesiones convergentes. Sea d1c; -+ d*. Sea h' un
del algoritmo, se ha dado un subconjunto finito Xk de X. Este subconjunto finito se punto de acumulación de la subsucesión [hk;]. Basándonos en la primera parte de la
utiliza para definir en C(X) una seminorma por medio de la ecuación demostración, sabemos que d* = IIJ - h' 11 = dist (f, G). Esto muestra que la sucesión
[dk] sólo tiene un punto de acumulación, a saber, dist (f, G). En consecuencia, se tiene
la convergencia dk -+ dist (f, G). 11
llf llk = máx
xEX,
lf(x )I.
Es útil advertir que en cada paso del primer algoritmo de Remez se calculan fácil­
En este paso es necesario determinar (con métodos que estudiaremos más tarde) un mente una cota superior y una cota inferior para el número desconocido d* = dist (f, G).
elemento hk de G que minimice la seminorma De hecho, tenemos que

:::; d* -
11! - hk llk - mín 11! - h;IJ.
:::; 1:;¡;:;¡k
394 Capítulo 6 Aproximación de funciones *6.9 La mejor aproximación: teoría de Chebyshev 395

La cota inferior converge monótonamente por abajo hacia d*, mientras que la cota Es más, e;?; O ya que 9�+t = 9k > O y para i � n,
superior converge monótonamente por arriba hacia d*. La cota superior 11! - hk ll,
aunque también converge a d* y es más simple, no siempre lo hace monótonamente. 0;= e;ek("'k /0k - :i..;9;)?; o.
Ahora vamos a examinar una variante de este algoritmo, llamada método de in­
tercambio. En éste, el crecimiento de los conjuntos Xk se restringe, eliminando un Si dividimos la ecuación I: 0;u;= O por¿ 0;, podemos ver que O se expresa como una
elemento viejo cada vez que se añade uno nuevo. Por lo general, se utiliza este método, combinación convexa de uo, ..., Un+! en la que Uk se ha omitido. 11
aunque su validez depende de suposiciones adicionales relativas a las funciones básicas
g¡, g2, ••• , gn. El proceso que desecha un elemento y añade otro se llama intercambio.
SERIE DE PROBLEMAS *6.9
Si el subconjunto inicial X1 contiene n + 1 elementos y si hay un intercambio en cada
paso del algoritmo, entonces cada Xk tendrá exactamente n + 1 elementos. l. Resuelva para c1, c2, li y I; en el ejemplo que se dio al comienzo de esta sección.
Basándonos en el teorema de caracterización de las mejores aproximaciones, sabe­ 2. Encuentre la mejor aproximación de ../i por medio de un polinomio de primer grado en el
mos que en el k-ésimo paso, el origen de JRn se hallará en la cáscara convexa de los n+ I intervalo [O, 1].
vectores: 3. Demuestre que los subespacios de C[O, 1] generados por los siguientes conjuntos son subes­
(2) pacios de Haar:
ek(x) (g1 (x), gz(x), ..., gn (x)) X EXk,
(i) { l,x ,x3} (ii){l,e',e "} (iii){(x+2)- ,(x+3)- 1,(x+4)- 1}
2 2 1

donde ek(x)= f(x) - hk(X). Con hk disponible, se elige el punto al que previamente nos 4. Demuestre que los subespacios de C[-1, 1 J generados por los siguientes conjuntos no son
hemos referido como xk. Es decir, xk es un punto crítico de la función/ - hk . Ahora subespacios de Haar:
uno de los puntos de Xk se reemplaza por Xk, Este intercambio se hace de modo que el (i) {1. x2,x3} (ii){[xi, fx-1[} (iii){e',x+1}
origen de JRn permanezca en la cáscara convexa de los vectores descritos en (2). Así, 5. Considere en el espacio C[O, l] el subespacio IIo de los polinomios de gradoO (es decir, las
el vector funciones constantes). Utilizando las cantidades:
ek(Xk) (g1 (xk ), gz(xk), ..., gn (Xk))
M(f)= máxf(x) y m(f)= mín /(x)
0��1 0��1
reemplazará a uno de los n + 1 vectores del conjunto previo. A continuación presentamos
un teorema que rige el intercambio y nos indica cómo se lleva éste a cabo. describa la mejor aproximación de un elemento/ en C[O, l] por medio de un elemento de
IIo.
6. Sean U-O, u¡, ... , Un n+1 puntos en lRn tales que no es posible escribir O = I:;=O 0;u; con
TEOREMA 10 Sea {Uo, u1, ... , Un+I} un conjunto de n + 2 puntos en JRn. Si O se halla en la cáscara e � O, e ,eO y mín; 0; = O. Demuestre que cada conjunto den vectores que se escoja de
convexa de {Uo, u¡, ..., Un}, entonces para alguna k � n, la aseveración sig ue siendo { Uo, U¡, . . . , Un} es una base de lRn.
cierta cuando uk se sustituye por Un+I· 7. Sea A una matriz den x (n+2). Demuestre que si el sistema
Ax=O x�O x,eQ Xn+z=O xElRn+Z
Demostración EncasodequeseaposibleescribirO = I:;=O 9;u; con9;?; O, I:7=o 9; = 1 y mín; 9; = O,
hágalo y elija k de modo que 9k = O. Es obvio que podemos sustituir uk por Un+I en la es consistente entonces para alguna k < n+2, también lo es el sistema
ecuación O= I:7=o 9;u;.
Ahora suponga que no es posible escribir O= I:7=o 9;u; con 9;?; O, I:;=0 9;= 1, Ax=O x�O x,eQ Xk=O xElRn+z
y mín; 9; = O. Por el teorema de Carathéodory, los vectores Uo, u¡, ..., Un generan un 8. Demuestre que el polinomio cuadrático de la mejor aproximación a la función cosh x en el
espacio de dimensión n, que obviamente es JRn. Por consiguiente, podemos encontrar [ 1,1] es a+bx2, donde b = cosh1-1 y a se obtiene al resolver el siguiente par
intervalo -
lo, ..., A.n tales que Un+! = I:;=O l; u;. Además, existen 9; > O tales que O= I:;=O 9;u;. de ecuaciones para a y 1:
Elija k tal que lk /9k ?; 1¡ /9; para toda i. Para O � i � n, haga 0; = lk9; - l;0k. Así a= 1 +cosht-t b
2

mismo, sea e:.,_1 = ek. Observe que e�= O. Ahora tenemos que senht= 2th
9. Demuestre que la cáscara convexa de un conjunto es convexa y que es el menor conjunto
� n n
convexo que contiene el conjunto original.
¿ 0;u;= ¿9/u; + 9�+1 Un+! = ¿(lk ei- A.;0k)U¡ + 9kUn+l 10. Demuestre que toda bola cerrada {! : [[/ - gff � r} en un espacio lineal normado es
i=O i=O i=O convexa.
n n
11 . Dé un ejemplo de un conjunto convexo cuyo complemento esté acotado.
=A.k ¿9;U¡ - 9k ¿A.;U;+9k Un+!
i=O i=O 12. Dada una línea ax+f7y+e=O en el plano, con a2+ b2 > O, dé una descripción completa
del conjunto de puntos sobre la línea cuyas distancias al origen son un mínimo, utilizando
= A.k(-0k Uk)- 9k(Un+l - A.k Uk) + 9k Un+l = Ü la norma l00 para definir la distancia.
396 Capítulo 6 Aproximación de funciones *6.10 Interpolación en dimensiones m ás superiores 397
13. Seaf una función continua de (x,y) en el cuadrado O � x � I, O � y � I. Describa la Así, N es el conjunto de todas las parejas (x;, y¡) donde x; se elige del primer conjunto
mejor aproximación de f por medio de una función continua en la sola variable x.
y Y¡ del segundo. En otras palabras,
14. ¿Generan la funciones
- {(x,·,Y1
N- ·) .· 1 =
< . =< p, 1 =J
< . =< q}.
go(x, y) = 1 g1(x, y) = x gz(x. y) = y i
(2)

un subespacio de Haar en C(]R.2)? Observe que, en este caso, la notación en la ecuación (2) es más conveniente que la
15. Demuestre que el conjunto de funciones {I,x,x2, ... ,x',f} genera un subespacio de Haar notación en (1). En la figura 6.15 se muestra un ejemplo de la ecuación (2), en donde
sobre [a, b] si/">(x) > O en [a, b]. p = 4 y q= 3. Un arreglo tal de nodos se llama con frecuencia malla cartesiana. Por
conveniencia, hemos numerado los puntos sobre el eje x de izquierda a derecha, y los
16. seaf = aoTo +a1T1 +... +an+1T•.,.1, donde los Tk son polinomios de Chebyshev. Demuestre
que en el espacio rr. la mejor aproximación de f en la norma-sup sobre [-1, !] es aoTo + puntos sobre el eje y de abajo hacia arriba, aunque esto no es necesario.
a1T1 +... +a.T•. Suponga que tenemos un esquema de interpolación lineal para los nodos x 1, x2, ••.
Xp. Éste será un proceso univariado. Queremos pensar en él como un operador lineal P
de la forma
*6.10 Interpolación en dimensiones más superiores (Pf)(x) = ¿f(x;)u;(x), (3)
í= l

Tanto en el pasado como en el presente, el problema de encontrar interpolantes lisos para donde las funciones u; tienen la propiedad cardinal
funciones de varias variables ha sido una cuestión difícil que ha atraído mucha atención.
El caso multivariado muestra algunos rasgos inusuales que no están presentes en el caso U¡(X¡) = O¡¡ (1 � i,j �p). (4)
univariado, haciéndose éstos aparentes cuando el número de variables es tan sólo dos.
En consecuencia, al menos en un principio es muy poco lo que se pierde al restringir el Por ejemplo, en la interpolación polinomial ordinaria, estas funciones u; vienen dadas
análisis al caso bivariado (dos variables independientes). por la fórmula conocida de la sección 6.1:

Problema de la interpolación U¡(X) = II X¡ -X¡


p

j l
=
X - Xj
. (1 � i �p). (5)
El problema central que examinaremos es el siguiente: un conjunto de puntos de pi
interpolación (o nodos) nos es dado en el plano xy. Éstos se pueden denotar con
Note que el operador P se puede extender de manera trivial para que opere sobre funciones
(x¡ ,y¡) (xz,yz) .. . (xn, y.). (1) de dos o más variables. Así, si f es una función de (x, y), podemos escribir:
Suponemos que estos n puntos son diferentes entre sí. Con cada punto (x;, y;) se encuen­
tra asociado un número real c;. Nuestro objetivo es encontrar una función fácilmente (Pf)(x,y) = ¿f(x;,y)u;(x), (6)
computable F que sea lisa, tal que i=l

F(x;, y¡) = e; (1 � i � n).


y
Se sobrentiende que F estará definida en todo JR.2, o al menos en un extenso dominio
que incluya a los nodos. En la descripción precedente, los términos lisa y fácilmente

Effi
computable sólo tienen un significado informal o intuitivo. Yi
Yz
Malla y producto cartesianos

El problema de interpolación que acabamos de describir se puede resolver en oca­
siones por medio de un producto tensorial de métodos de interpolación univariados.
Dispongamos en primer lugar de este caso. El procedimiento se limita a una situación --+--<1>---.....--0-----.... X
X¡ Xz X¡ x,
en la que el conjunto de nodos, que denotamos con N, es un producto cartesiano:

N = {x¡,xz,... ,xp} x {Y1, Yz,... ,Yq }, Figura 6.15 Una malla cartesiana de nodos.
398 Capítulo 6 Aproximación de funciones
*6.10 Interpolación en dimensiones más superiores 399
Puede verse de inmediato que Pf es una función de dos variables que interpola af sobre
Se deja como problema demostrar que la función (P EB Q)f interpola af en todas las
las líneas verticales 0

líneas horizontales y verticales [i , (1 � i � p) y I), (1 � j � q).


L, = { (X¡,y) : -co <y<co } (1 � i � p). (7)
Ejemplo 1 Dé una fórmula para un polinomio en dos variables que tome los siguientes valores:
Suponga que se dispone de otro operador para interpolar en los nodos y 1, y2, ..• , Yq·
Escribimos:
(x, y) (1.1) (2, 1) (4, 1) (5, 1) (1, 3) (2, 3) (4, 3) (5, 3) (1, 4) (2, 4) (4, 4) (5, 4)
(Qf)(y) = ¿/(y,)v,(y), (8)
f(x,y) 1.7 - 4.1 - 3.2 4.9 6.1 - 4.2 2.3 7.5 - 5.9 3.8 - 1.7 2.5
i=l

donde las funciones v, son cualesquiera que convengan teniendo la propiedad cardinal
Respuesta Observe en primer lugar que los nodos forman una malla cartesiana, por lo que el método
V¡(yj) = Oij (1 � i,j � q). (9) del producto tensorial es aplicable. Las funciones u, y v, vienen dadas por la ecuación
(5). En este ejemplo son las siguientes:
Nuevamente, Q se puede extender para que opere sobre funciones bivariadas utilizando
la ecuación x-2 x-4 x-5 1
u1 (x) = - · - · - = --(x- 2)(x -4)(x- 5)
(Qf)(x,y) = ¿/(x,y;)v;(y), (10) l- 2 1-4 1- 5 12
'
i=l
u2(x) = (x . l)(x-4)(x- 5)
l

La función Qf interpola a/ sobre todas las líneas horizontales: 6 �


1
Li = { (x,y¡) :-co < x <co } (1 � i � q). (11) u3 (x) = --(x- l)(x- 2)(x- 5)
6
l
u4(x) = (x - l)(x- 2)(x - 4)
Suma booleana 12
Hay dos operadores de interpolación bivariada muy útiles que se pueden construir y-3 y-4 1
V¡(y)=- · - = -(y-3)(y-4)
a partir de P y Q; son el producto PQ y la suma booleana P EB Q, definidas por 1-3 1-4 6
1
P EB Q = P+Q- PQ. (12) v2(y) =-- (y- l)(y- 4)
2
Se pueden definir fórmulas más detalladas para estos operadores a partir de las defini­ 1
V3(y) = 3(y- l)(y-3).
ciones de P y Q. Así,
La interpolación polinomial es en este caso:
(PQJ)(x,y) = P (Qf)(x,y) = ¿(Qf)(x,,y)u,(x)
i=I
(13) F(x,y) = u¡(x)[l.7v¡(y)+6. lv2(y)- 5.9v3(y)]
p q
= ¿¿ f(x,,yj)vj(y)u;(x). +u2(x)[-4. lv¡(y)-4.2v2(Y)+3.8v3(y)]
i=lj=l (15)
+u3(x)[-3.2v¡(y)+2.3v2(y)- l.7v3(y)]
Dado que vj(yk)u;(xe) = OjkOil, podemos ver sin dificultad que PQJ es una función [ .9v ¡(y)+7.5v2(y)+ 2.5v3(y)]
+u4(x)4
que interpola a/ en todos los nodos (x;, Yj). Para el operador PQ también se utiliza la
notación para el producto tensorial P ® Q. 11
De la misma manera, una fórmula para P EB Q es:

[(P EB Q).f](x,y) = (Pf)(x,y)+ (Qf)(x,y)- (PQJ)(x,y) Producto tensorial

¿¿f(x;, Yj)u,(x)vj(y). Si la función F del ejemplo precedente se escribe como una suma de términos JyÍ ,
p q p q
=¿f(x;,y)u;(x)+¿f(x,Yj)vj(y)- aparecen los siguientes 12 términos:
i=l j=l i=l j=I
(14) 2
1, x, x2 , x3 , y, xy, x2y, x3 y.y , xy2, x2y2, x3y2 . (16)

1:,
400 Capítulo 6 Aproximación de funciones
*6.10 Interpolación en dimensiones más superiores 401
Así, estamos interpolando por medio de un subespacio de dimensión 12 de polinomios
exhibe una aparente dependencia lineal entre las funciones x H xi. En vista de que este
bivariados.La notación apropiada para este subespacio es II3 0 II2. Éste es el producto
conjunto de funciones es linealmente independiente, concluirnos que:
tensorial de dos espacios lineales, y se compone de todas las funciones de la forma
m
k-i
(x,y) H ¿a;(x)b;(y) ¿cijy5 = O (O� i�k).
i=l
i=O

en donde a; E II3 y b; E II2 • (La suma puede tener cualquier número de términos.) No En esta ecuación, Yo puede ser cualquier punto. A causa de la independencia lineal del
es difícil demostrar que una base para este espacio se compone de las funciones en (16). conjunto de funciones
Hay que enfatizar que la teoría recién bosquejada se aplica a funciones cualesquiera YHi (O�j� k)
u¡ y v¡, no sólo a polinomios. Todo lo que se necesita es la propiedad de cardinalidad. (En
concluimos que cij = O para toda i y j.
una teoría abstracta se trabaja directamente con los operadores P y Q, siendo irrelevante
el detalle de su estructura para el análisis.) 11
En el método del producto tensorial de la interpolación polinomial, el caso general
comprende polinomios bivariados del espacio IIp-1 0II q-1, donde p y q son los números
de puntos que aparecen en la ecuación (2). Una base para este espacio está dada por las COROLARIO La dimensión de ITk(lF.2) es i(k+ l)(k + 2).
funciones:
Demostración Podemos arreglar los elementos de la base de II (lF.2) que
(x,y) H xiyi (O� i�p-1,0 �j�q-1). (17) k se dieron en el teorema 1 como
sigue:
En este caso, un elemento genérico del espacio es de la forma: xk
k
x -1 xk-ly
xk-2 xk-2y x k-2y 2
¿ ¿ CijX y .
p-1 q-1
(X,y) H i i

i=Oj=O
xº xºy xºy2
· · · xºI
El grado del términox yi se define como i+j. Así, el espacio IIp-i ©IIq-l tendrá un
i
El número de elementos de la base es por consiguiente:
elemento base de grado p+ q- 2, a saber, x -11-1. Sin embargo, no contendrá todos
P

los términos de grado p+q- 2. Por ejemplo, un término como x t-2 no estará presente.
P
1
El grado de un polinomio en (x, y) se define como el mayor de los grados de los términos 1 + 2 + 3+ ...+ (k + l) = 2(k + l)(k + 2). 11111

que aparecen en él. Aquí denotaremos con IIk(lF.2) al espacio de todos los polinomios
bivariados de a lo más grado k. Un elemento típico de IIk(lF.2) es una función de la Recuerde que en el caso de una variable, IIk se puede utilizar para interpolar en

=
forma: cualquier conjunto dek+1 nodos en R Es natural que esperemos que para dos variables,
¿ ¿ c;/y = ¿
k k-i
II k(lF.2) se pueda utilizar para interpolar en cualquier conjunto den f (k + l)(k + 2)
(x,y) H i c;/yi. (18) nodos. No obstante, un simple ejemplo nos mostrará que esta espectativa no se cumple.
i=O j=O O�i+j�k
Suponga que k = 1, de modo quen = 3. Un elemento genérico de II 1 (JF.2) tiene la
forma:
TEOREMA 1 Una base de ITk(JF.2) es el conjunto de funciones:
Co + C¡X + Czy.
(x,y) H xiyj (O� i + j � k). Si intentamos resolver un problema de interpolación con tres nodos (x;, y¡), esto nos lleva
a un sistema lineal cuyo determinante es:
Demostración Está claro que este conjunto genera IIk(lF.2), por lo que sólo es necesario demostrar que
X
11 X2¡ Y2
es linealmente independiente. Suponga en consecuencia que la función en la ecuación 1 Yt 1 .
(18) es O. Si a y se le asigna un valor fijo, digamos y= Yo, entonces la ecuación
1 X3 Y3
(k-i )
¿
k
En vista de que este determinante representa el doble del área de un triángulo cuyos
¿cijY6 x;=0
i=O j=O
vértices son los tres nodos, el determinante será cero cuando los nodos sean colineales.
En este caso, el problema de interpolación será ( en general) irresoluble.
402 Capítulo 6 Aproximación de funciones *6.10 Interpolación en dimensiones más superiores 403

Geometría
Las consideraciones anteriores indican que la geometría del conjunto N de nodos
determinará si la interpolación por medio de fh(]R2) es posible para N. Por supuesto,
el número de nodos debería ser n = }(k+ l)(k+ 2). Aquí daremos algunos teoremas
relacionados con esta cuestión para aclarar lo que se conoce de este tema. El primero
de ellos se debe a Micchelli [1986a]. �

TEOREMA 2 La interpolación de datos arbitrarios por medio del subespacio I1k(]R2) es posible sobre Figura 6.16 Conjuntos de nodos para interpolación por II2 (JR.2 ).
un conjunto de !(k+ l)(k+2) nodos, si los nodos se hallan sobre líneas Lo, L 1, ••• , Lk
de tal modo que (para cada i) L; contiene exactamente i+1 nodos.
TEOREMA 3 Sean k y d dados, y haga n= (dt)· Sea Z¡, zz, ... , Z n un conjunto de n nodos dados en
JR.d . Si hay hiperplanos H ij de lR. , con 1 � i� n y 1 �j� k, tales que
Demostración Sea N el conjunto de nodos. Asumiendo las hipótesis del teorema, tenemos que #(N n
L¡) = i+1 , en donde el símbolo # se utiliza para significar el número de elementos en
U Hiv
k
un conjunto. Los conjuntos N n L; deben ser ajenos por pares, pues si no lo fuesen,
Zj E {=?- j ;é i (1 � i,j � n), (19)
tendría lugar la siguiente contradicción: v=l

k k
l entonces los datos arbitrarios en el conjunto de nodos se pueden interpolar con polino­
#N < Í:#(NílL;) = L(i+1) = (k+l)(k+2). mios de II k(]Rd).
i=O i=O
2

En virtud de que el número de nodos es igual a la dimensión del espacio II k(JR.2), es su­ Demostración Cada hiperplano es el coojunto de ceros de una función lineal no nula, por lo que podemos
ficiente con demostrar que el problema de la interpolación homogénea tiene únicamente escribir:
la solución O. En conformidad, sea p E II k(]R2) y suponga que p(x, y) = O para cada H g = {z E JR. d : lij(z) =0},
punto (.x, y) de N. Para cada i, sea l; una función lineal que describe a L;:
donde l ij E I11(JR. d). Defina las funciones:
L; = {(.x,y) : l;(x,y) = O} (O� i � k)
II l;j(z)
k
q;(z ) = (1 � i� n).
Note que p2+4 tiene al menos k+1 ceros, a saber, los puntos de N n Lk. El teorema de j=I
Bézout (que citaremos en seguida) nos permite concluir que l k es un divisor de p. Este
argumento se puede repetir, pues (p/id+{i_ 1 tiene al menos k ceros, y lk- l debe de ser Debido a la condición (19), Z¡ no pertenece a ninguno de los hiperplanos H;¡, H;2 , ...,
un divisor de p /l k. Después de k pasos en este argumento se llega a la conclusión de
que pes divisible por l 1l2 · · ·lk. Así,p es un múltiplo escalar de l 1l2 · · ·lk pues pes a
*
H;k, por lo que l g(x;) O para 1 � j � k . Esto demuestra que q;(Z;) O. *
Nuevamente, por la condición (19), sij ;é i,entonces Zj E H;v para alguna v, y por
lo más de grado k. Dado que p se anula en N n Lo y l 1l2 ·· ·lk no, p debe ser O. 111 consiguiente l;v(Zj) y q¡(Zj) son cero. Ahora, si hacemos p¡(Z) = q;(z)/ q¡(Zi) tendremos la
propiedad cardinalp;(Zj) = 8;1. Dadoquep¡ E II k (lR."), tenemos unafórrnula lagrangiana
El teorema de Bézout dice que si p E Tik(lR.2), q E I1m(]R2) y p 2+q2 tiene más de para interpolar una función! en los nodos por medio de un polinomio de grado k:
km ceros, entonces p y q tienen un factor común que no es una constante. En vista de que
n
este teorema se limita a JR. 2, lo mismo ocurre con el teorema 2 . Más adelante veremos
una demostración algorítmica del teorema 2 que no requiere del teorema de Bézout. P(z) =Lf(z;)p;(z). 1
i=l

Ejemplo 2 El conjunto de nodos en la figura 6.16 es adecuado para su interpolación por el espacio En la figura 6.17 se muestra una configuración de nodos que satisface las hipótesis
II 2(lR.2). del teorema 3. Aquí la dimensión es d = 2, el grado es k = 2 y el número de nodos es
Para los espacios de dimensión superior JR. d, se puede dar un teorema íntimamente n=6.
relacionado con el teorema 2 . Recurrimos al problema 5, según el cual la dimensión de El siguiente es un resultado débil relativo a la interpolación polinomial en conjuntos
Tik(]Rd) es (d;k). El siguiente resultado se debe a Chung y Yao (1977]. arbitrarios de nodos.
404 Capítulo 6 Aproximación de funciones *6.10 Interpolación en dimensiones más superiores 405

La ventaja de este algoritmo es que se puede construir paso a paso un polinomio de


interpolación, añadiendo un nuevo nodo de interpolación y un nuevo término a p en cada
paso.
La forma abstracta de. este procedimiento es la siguiente. Sea X un conjunto yf una
función real definida en X. Sea N un conjunto de nodos. Si p es una función que inter­
pola af enN y q es una función que se anula enN, entonces una funciónp* que interpola
aj enNU {�} se puede obtener en la formap* = p + cq, siempre que q@a= O.
�---41<�------....;:..,-------- Lu = Ls2 = L11 Una versión más general de esta estrategia trata con conjuntos de nodos. Sea q una
función de X en lR y sea Z el conjunto de sus ceros. Si p interpola af en N n Z y r
interpola a (f - p) /q sobre N \ Z, entonces p + qr interpola af en N.
El procedimiento que acabamos de delinear se puede utilizar para dar una demos­
tración algorítmica del teorema 2. Para comenzar, elija una Pk E Ilk (JR2) que interpole
L21 = Li, = L•2 af en N n Lk. (Utilice el teorema 4). Procediendo inductivamente hacia abajo, su­
L., = Ls, = L61 ponga que se ha encontrado una Pi en Ilk (JR2) que interpola af en todos los nodos de
LkULk-1U···UL¡ . Vamos a tratar de construir Pi-1 en la forma de Newton:

Figura 6.17 Ilustrando el teorema 3. Pi-1 =Pi + rekek-1 · .. e¡.

TEOREMA 4 El espacio Ilk (JR2) es capaz de interpolar datos arbitrarios sobre cualquier conjunto de Está claro que Pi-1 aún interpolará af en los nodos de LkU Lk-! U ...U L¡, pues el
k + I nodos distintos en lR2. término que se ha añadido a p¡ se anula en este conjunto. A fin de que Pi-! interpole a
f en los nodos de L¡_ ¡, escribimos:
Demostración Si los nodos son (xi, Yi), con O � i � k, seleccionamos una función lineal
f(x) = p¡ (x) + r(x)(Mk-1 · ..l;)(x) X ENílLi-1,
l(x,y) = ax+ by+ c
de donde inferimos que r debería interpolar a (f - p¡)/( Mk-! ...l¡) en N n L¡_ 1. Por
con la propiedad de que los k + I números ti = l(xi, Yi) son diferentes entre sí. (Véase el teorema 4, hay una r E IT¡_ 1 (JR2) que cumple con esta tarea. Por último, observe que
el Prob. 17.) Sif es la función que vamos a interpolar, encontramos p E Ilk(JR) tal que PH E Ilk (JR2), pues r es de grado i - I y ( Mk-1 ...e¡) es de grado k - i + l . Este
p(t¡ ) = f(x¡, y¡). En tal caso p o e E Ilk (JR2 ) y


algoritmo fue descubierto por Micchelli [1986a].
Un hecho interesante es que ningún subespacio de C(JR2) de dimensión n sirve para
( p o l)(Xi, y¡) = p(l(Xi, y¡)) = p(ti) = f(X¡, y¡) interpolar en conjuntos arbitrarios den nodos (salvo el caso trivial en que n = 1). Esto
Se ha dado en llamar función cresta a toda función de laformaf al, con e E II1 (JR2). quizá fue advertido por primera vez por Haar en 1918, dando el siguiente argumento.
Su gráfica es una superficie reglada, pues f o e permanece constante sobre cada línea Suponga dadas n funciones u1, u2 , ... , un en C(JR2). Sean dados n nodos en JR2, digamos
e(x, y) = 11.. El teorema 4 tiene una extensión obvia a JRd. p¡ = (x;, y;). Si queremos interpolar en estos nodos utilizando las funciones base u¡,
tendremos que resolver un sistema lineal cuyo determinante es:

Un esquema newtoniano u¡(p¡ ) u2(p1) u.(p¡ )


, u¡(pz) u2(p2 ) u.(p2 )
Para instrumentar en la práctica cualquier método de interpolación es ventajoso dis­ D=
poner de un algoritmo como el procedimiento de Newton en la interpolación polinomial
univariada. Recuerde que uno de los rasgos del esquema de Newton es que a partir de un u1 (p.) u2(p.) · · · u.(p.)
polinomio p que interpola af en los nodos x¡, x2 , ..• , Xn podemos, añadiendo un término
a p, obtener fácilmente un polinomio p* que interpola af en los nodos X¡, xz, .. . , Xn+I · Este determinante puede ser distinto de cero para el conjunto de nodos suministrados.
En realidad, hacemos Ahora bien, someta a los dos primeros nodos a un desplazamiento continuo en JR2 , de
modo que durante el movimiento los puntos nunca coincidan ni entre ellos ni con los
q(x) = (x - x1)(x - x2) • • • (x - x.) otros nodos, pero que al final del desplazamiento hayan intercambiado sus posiciones
p*(x) = p(x) + cq(x) originales. Por las reglas de los determinantes, el determinante D habrá cambiado de
signo (ya que las filas 1 y 2 se habrán intercambiado). Por continuidad, D asumió el
C = [f(Xn+I) - p(Xn+I)] /q(x.+¡). valor cero durante el desplazamiento continuo recién descrito. Por consiguiente, D será
406 Capítulo 6 Aproximación de funciones *6.10 Interpolación en dimensiones más superiores 407

a veces cero, aun para nodos distintos. El hecho de que dos nodos se puedan mover El siguiente es un algoritmo para computar F(x,y) en el ejemplo anterior:
en JR2 intercambiando lugares sin jamás coincidir es una característica de JR2, JR3, .•• ,
pero no de lR1. Esto explica por qué la interpolación en JR2, JR.3, •.• , se debe abordar de inputn,x,y
un modo diferente que en lR 1• Lo que usualmente se hace es fijar primero los nodos y input (x;,y;,e¡) (1 � i � n)
después preguntar cuáles son los subespacios de funciones interpolantes más adecuados.
for i = 1,2,...,n do
d; = (x-x;)2 +( y-Y;)2
Interpolación de Shepard
forj = 1,2,...,n do
Existe un método sumamente general de este tipo (en el que el subespacio depende
dij = (x;-x¡)2 +(y¡-y¡)2
de los nodos), conocido como interpolación de Shepard, en honor a su creador, Shepard
[1968]. Hágase una lista: end
end

L II d /d .
n n
p; = (x,,y;) (1 � i � n), (20)
F(x,y) = C¡ j ij
de los (distintos) nodos. Vamos a utilizar a p y q para denotar elementos genéricos de JR.2, i=I i=I
fai
lo que hará la extensión a JR3 , JR.4, . • • , conceptualmente transparente. Después, elegimos
una función real$ sobre JR.2 x JR.2 sujeta a la condición única (No se ha hecho intento alguno para hacer eficiente este algoritmo. Contiene muchas
duplicaciones.)
$(p,q) = O si y sólo si p = q, (21) Otra versión del método de Shepard parte de la hipótesis adicional de que$ es una
función no negativa. Después, haga
Dos ejemplos que vienen a la memoria son $(p. q) = JJp - qJJ y $(p,q) = JJp -qjJ2.
n
II ¿ v;(p)
Después establecemos algunas funciones cardinales en exacta analogía con las fórmulas n

de Lagrange de la aproximación univariada. Esto se hace como sigue: v;( p) = $( p,pj) v(p) = w;(p) = v;(p)/v(p). (24)
i=I i=I

II $(p;,p
n fai
$(p,pj)
U¡(p) = (1 � i � n). (22)
j=I
j) Dadas nuestras hipótesis sobre$, tenemos que v;(pj) = O si i *j y v,(p) > O para todos
fai los puntos, con la excepción de p¡, ..., Pi-1, Pi+h ... , Pn· De esto se sigue que v( p) > O
y que w; está bien definida. Por su construcción, w,(p¡) = O ij y O � w;(p) � l. Es más,
Es fácil ver que estas funciones tienen la propiedad cardinal: I;;=l w;(p) = l. El proceso de interpolación está dado por la ecuación:

U¡(p¡) = O ij (1 � i,j � n). n n


F = ¿f(p,)w; = ¿f(p,)v;/v( p). (25)
Esto es una consecuencia de la hipótesis (21). De esto se sigue que un interpolante de f i=I i=l
en los nodos suministrados viene dado por la función:
Este proceso tiene dos propiedades a su favor que no comparte con la versión anterior; a
n saber, si los datos son no negativos, el interpolante F será una función no negativa, y si
F = ¿f (p,)u,. (23) f es una función constante, entonces F = f. Estas dos propiedades ponen en evidencia
i=l que el interpolante F hereda ciertas características de la función que interpola. Por
otra parte, si $ es diferenciable, entonces F se mostrará plana en cada nodo. Esto es
Ejemplo 3 ¿Cuáles son las fórmulas para la interpolación de Shepard cuando JJp- qjj2 se utiliza en
así porque O � w, � 1 y w,(pj ) = O ij, de modo que los nodos son extremos (puntos
lugar de$(p,q)?
mínimos o máximos) de cada w,. As( las derivadas parciales de w; son cero en cada
Respuesta Sean p¡ = (x;, y;), p = (x,y) y nodo, y consecuentemente lo mismo es cierto para F.
Un caso importante de la interpolación de Shepard surge cuando la función$ se da
$(p,p¡) = Jlp-p¡ JJ2 = (x-x¡)2 +( y-y¡)2. por medio de una potencia de la distancia euclidiana:
En tal caso, $(x,y) = JJx -yJJµ (µ > 0).
n n (x-x )2 +(y-y¡)2
F(x, y) = ¿f(x;, y;)
i=I
TI ¡
(x -x¡)2 +(y;-Y¡) 2 •
J=I ;
1111
Aq� x y y pueden ser puntos de lRs. Veremos que $ es diferenciable paraµ > 1, pero
j':ti no para O<µ � l. Es suficiente con examinar la función más simple g(x) = IJxllµ en el

1
408 Capítulo 6 Aproximación de funciones
*6.10 Interpolación en dimensiones más superiores 409
punto cuestionable x = O. La derivada direccional de g en cero se obtiene diferenciando
la función G(t) = lltullµ , dondeµ es un vector unitario que determina la dirección. Dado
que G(t) = ltlµ, la derivada en t = O no existe cuando O< µ � 1, mas paraµ > 1,
G'(O)= O.

til
La fórmula para w; se puede dar de dos formas:

W¡(X ) = il llx -X¡ 11 /


µ
llx - X¡ 11

t
j,,k j;,k

Figura 6.18 Triangulaciones ilegales.


w;(x) = llx -xdl-µ / llx -x¡II-µ

La segunda ecuación se debe utilizar con cuidado, pues la parte derecha de la igualdad El tipo más fácil de interpolación sobre una triangulación es la función lineal por
adopta la forma indeterminada oo/oo en X¡. partes que interpola a una función f en todos los vértices de todos los triángulos. En
Un método local de interpolación multivariada de Franke y Little está concebido cualquier triángulo T; estará prescrita una función lineal:
para que los datos en un nodo influyan muy poco en la función de interpolación en
los puntos alejados de ese nodo. Dado un conjunto de nodos (x;, y¡), con 1 � i ;;i; n, f;(x, y) = a;x + b;y + C¡ (x, y) ET;.
introducimos las funciones:
Los coeficientes en f; están determinados en forma única por los valores prescritos de
g;(x,y) = (1 -r;-1J(x -x;)Z + (y -y;)2): . la función en los vértices T;. Esto puede verse como una aplicación del teorema 2, pues
L1 se puede tomar en dicho teorema como uno de los lados del triángulo, y Lo puede ser
El subíndice '+' indica que cuando la cantidad de dentro del paréntesis es negativa, una línea paralela a L1 que incide con el vértice que no está en L1 •
ésta se reemplaza por O. Esto ocurrirá cuando (x,y) esté alejado del nodo (x;, y¡). El Consideremos la situación que se muestra en la figura 6.19.
parámetroµ influye en la lisura de la función. El parámetro r; controla el soporte de g;. El segmento rectilíneo que une a (x2, y 2) con (x3, y3) es común a los dos triángulos.
Así, g;(x, y)= O, si (x, y) dista más de r unidades de (x;, y;). Este segmento rectilíneo se puede representar como
Sir; se escoge como la distancia de (x;, y¡) al nodo más cercano, entonces g;(x¡, y¡) =
Oij. En este caso, interpolamos una función arbitraria! por medio de la función {t(x2, Y2) + (1 - t)(x3, y3) : O � t � I }.
n
[f(x;, y;)g¡(x, y).
i=I (X¡, J¡)

Triangulación
Hay una estrategia de carácter general para interpolar funciones en JR.2 que comienza
con el establecimiento de una triangulación. Informalmente, esto significa que en (Xi,J¡) (X4, J4)

un principio los nodos se unen para formar triángulos. Al final, se tiene una familia
de triángulos T1 , Ti, ... , Tm . Esta colección de triángulos es lo que consideramos una
triangulación. Deben cumplirse las siguientes reglas:
l. Cada nodo de interpolación deberá ser el vértice de algún triángulo T;.
2. Cada vértice de un triángulo deberá ser un nodo.
3. Si un nodo pertenece a un triángulo, deberá ser uno de sus vértices. (Xi,Y1)
El propósito de la regla 3 es evitar construcciones como las que se muestran en la
figura 6.18. Figura 6.19.
410 Capítulo 6 Apro ximación de funciones *6.10 Interpolación en dimensiones más superiores 411
La variable t puede considerarse como una coordenada para los puntos sobre el seg­ Mínimos cuadrados móviles
mento. La función lineal l1, cuando se limita a este segmento, será una función lineal
con la sola variable t, es decir, Otro procedimiento muy versátil para alisar e interpolar funciones multivariadas es
el método de los mínimos cuadrados móviles. Primero lo vamos a explicar en su forma
a¡(txz + (1 - t)X3)+ b¡(lyz + (1 - t)y3) + C¡ general y después daremos algunos ejemplos específicos.
Comenzamos con un conjunto X que es el dominio de las funciones implicadas.
Por ejemplo, X puede ser IR, IR.2 , o alguno de sus subconjuntos. Después, se da un
o conjunto de nodos {x1,x2, ... , x.}. Éstos son los puntos en los que se han mostrado
(a¡Xz -a¡X3+ b1Y2 - b¡y3)t + (a¡X3 + b¡y3 + C¡) cierta función f. Así, se conocen los valoresf(x;) para1 � i � n. A fin de llevar a cabo
la aproximación, elegimos un conjunto de funciones u1, u2, • • • , um, Éstas son funciones
Esta función lineal está determinada por completo por las condiciones de interpolación reales definidas en X. Por lo general, el número m será pequeño comparado con n.
en (x2, y2) y (x3, y3). Lo mismo se puede decir de la función lineal lz. De este modo En el método de los mínimos cuadrados que nos es familiar, nos es dado un conjunto
l1 y f2 coinciden en este segmento rectilíneo, y la función lineal por partes definida en de pesos no negativos w; � O. Nosotros tratamos de encontrar coeficientes c 1, c2, ..• , cm
T1 U T2 es continua Esto demuestra el siguiente resultado. que minimicen la expresión

TEOREMA 5 Sea {Ti, T2, ..., Tm} una triangulación en el plano. La función lineal por partes que
toma valores prescritos en todos los vértices de todos los triángulos T; es continua. tt n
r
f <X¡) -
m

� CjUj(X¡)
]2
W¡.

Ahora considere el uso de funciones cuadráticas por partes sobre una triangulación. Ésta es la suma de los cuadrados de los residuos. Si escribimos
En cada triángulo T¡, se prescribirá un polinomio de segundo grado:
(f. g) = :EJ(x;)g(x¡)W; 11! 11 = /(jJi¡,
q¡(x, y) = a1x2 + azxy +a3y2 + a.ix + asy + il6- i=l

Serán necesarias seis condiciones para determinar los seis coeficientes. Uno de tales es aplicable la teoría de la aproximación en un espacio con producto interno, y la solución
conjuntos de condiciones consiste en los valores en los vértices y en los puntos medios al problema de la minimización está caracterizada por la condición de ortogonalidad:
de los lados del triángulo. Nuevamente, una aplicación del teorema 2 demuestra que esta m
interpolación es siempre posible en forma única. En realidad, en ese teorema, Lz puede
ser un lado del triángulo, L1 la línea que pasa por los puntos medios que no están en Lz y
f- L
j=I
CjUj l.U¡ (1 � i � m).

Lo una línea que contiene al vértice restante y a ningún otro nodo. (Yéase la Fig. 6.20.)
Mediante un razonamiento similar al del caso anterior podemos ver que la función global Esto nos lleva a las ecuaciones normales:
cuadrática por partes será continua, ya que los tres valores prescritos de la función en el
m
lado de un triángulo determinan a la función cuadrática de una variable en dicho lado.
¿ c¡(uj, u;) = (f. u;) (1 � i � m).
---- ----Lo
j=I

¿En qué difiere el método de los mínimos cuadrados móviles del procedimiento

----
recién descrito? En que ahora se permite que los pesos w; sean funciones dex. Se puede
conservar el formalismo del método de los mínimos cuadrados, aunque la siguiente

..... __ notación puede ser mejor:

----
-
-
-L, (f. g). = ¿f(x;)g(x¡)w¡(x).
i=I

Las ecuaciones normales se deberían ahora escribir en la forma:


m
¿ c¡(x)(u¡, u¡). = (f. u¡).
-Lz

Figura 6.20 Aplicando el teorema 2 . j=l


412 Capítulo 6 Aproximación de funciones *6.1O Interpolación en dimensiones más superiores 413

y la función final de aproximación será: SERIE DE PROBLEMAS *6.10


m l. Dé un algoritmo para determinar si un conjunto N de puntos de 12 se puede expresar, al
g(x) = [ Cj(x)uj(x). igual que en la ecuación (2), como un producto cartesiano. Si la factorización es posible, el
j=I algoritmo deberá proporcionar los factores.
Los cálculos necesarios para producir esta función son enormes cuando m es grande, 2. Para cada una de las siguientes inclusiones, demuestre si es cierta o falsa:
ya que las ecuaciones normales cambian con x. Por esta razón, m no excede de 10 en (a) TI.® Ilm e Ilntm(IR2)
general. (b) Ilk(IR2) C n.@ Tim donde k= máx(n, m)
Las funciones de peso se pueden utilizar para producir efectos convenientes. En (c) IIk(IR2) C rr. ® IIm donde k = mín(n, m)
primer lugar, si w;(x) es "fuerte" en x;, la función g casi interpolará aj en X¡. En el caso 3. Demuestre que dim IIk(IR3 ) = ! (n+ 1 )(n +2)(n + 3). En este caso el espacio consta de todos
extremo, w;(x;) = +oo y g(x¡) = f (x¡). En segundo lugar, si w;(x) decrece rápidamente, los polinomios en tres variables de a lo más grado k.
aproximándose a cero cuando x se aleja de X¡, los nodos lejanos a x; tendrán un tenue 4. Este problema y el que sigue tratan con polinomios en d variables. Etiquete las variables
efecto en g(x¡). con subíndices y póngalas en un vector x:
Una alternativa para w; que realiza estos dos objetivos en un espacio JRd es
x = (xi, xz, ..., Xd) E Id.
2
w;(x) = llx - xdJ- ,
Ahora necesitamos el concepto de multiíndice. Éste es un d-tuplo de enteros no negativos:
en donde se puede utilizar cualquier norma, aunque la norma euclidiana es la usual.
a= (<lt, a2, ... , <ld) E z:.
=
Si el procedimiento de los mínimos cuadrados móviles se utiliza con una· sola
función u1 (x) l , y con funciones de peso como las que acabamos de mencionar, lo Definimos
x« = x�1 x;2 x? ·· -x;'.
que resulta es el método de Shepard. Para ver por qué sucede esto, escriba la ecuación
normal correspondiente, con c1 (x) = c(x) y u1 (x) = u(x) = 1: Esto se llama un multinomio, y es el elemento constructivo básico para los polinomios en d
variables. El orden del multiíndice a se define mediante la ecuación
c(x)(u, u)x = (f, u)x.
[a[= ar +a2 +···+ad.
La función aproximante será:
Observe que lo que se da en llamar el grado del multinomio x« no es otra cosa que [a/.
g(x) = c(x)u(x) = c(x) = (f. u)x/(u, u)x Demuestre que x«xl3 = x«"il . Demuestre que cualquier polinomio en d variables y de grado
;;;; k se puede escribir en la forma:
n / n
¿ca.xª.
= �f(x;)w;(x) ; wj(x).
lttl�k
5. Sea II1 (Id) el conjunto de todos los polinomios en d variables de a lo más grado k. Demuestre
Si w;(x) = llx - x;¡¡-2, entonces después de remover las singularidades w;/ ¿J=I Wj que la dimensión de este espacio es (d;k).
tiene la propiedad cardinal: toma el valor 1 en X; y el valor O en los nodos restantes.
6. Demuestre la aseveración que se hace en el texto, relativa a la propiedad de interpolación del
operador Pe, Q.
Interpolación por medio de multicuádricas
7. Demuestre que la interpolación por II2(1R2 ) no es posible en general en un conjunto de seis
Otro proceso de interpolación multivariada es uno propuesto por R. Hardy [1971] nodos si éstos se encuentran en una elipse, una parábola, una hipérbola o un par de líneas
que utiliza como funciones básicas las llamadas multicuádricas: rectas.
2 + c2 } 1 /2
8. ¿Qué tipo de polinomio bivariado será el adecuado para interpolar en los siguientes conjuntos
Z;(p) = { IIP - Pdl (1 � i � n). de nodos?
Aquí la norma es la euclidiana, y el parámetro e que sugiere Hardy es igual a 0.8 veces
la distancia promedio entre los nodos. Al interpolar con estas funciones, debemos saber • • • • • •
que la matriz de coeficientes (z;(pj)) es no singular. Esto fue demostrado por Micchelli
[1986b]. • • • • • • • • •
Otras referencias sobre la interpolación multivariada son Chui [1988], Hartley
[1976], Micchelli [1986a], Franke [1982], Lancaster y Salkauskas [1986]. • • • • • • • • • •
Algunas referencias sobre el método de interpolación de Shepard son Shepard (a) (b) (e) (d)
[1968], Gordon y Wixom [1978], Newman y Rivlin [1983], Barnhill, Dube y Little
[1983] y Farwig [1986]. Figura 6.21.
414 Capítulo 6 Aproximación defunciones
*6.11 Fracciones continuas 415
9 . Demuestre que una base para II. 0 II,. viene dada por la función *6.11 Fracciones continuas
(x,y)>--+xi/ (O�i�n, O�j�m)
10. Dé las fórmulas para la segunda versión de la interpolación de Shepard utilizando $(p. q) = Muchas funciones especiales que surgen en las aplicaciones de las matemáticas se definen
\\p- q\\;,. Recuerde que esta norma esl\(x,y)\I = máx{\xl, \y\}. por medio de procesos infinitos tales como series, integrales o iteraciones. Uno de estos
11. Se dice que un polinomio en dos variables de la forma procesos infinitos es el de las fracciones continuas. Un ejemplo de fracción continua,
debido a Lambert (1770), es el siguiente:
F(x,y) = LkCijX y i j
X
O�i+j� tan-! x = ---
_:x__z-s--- l( xl <1). (1)
es de a lo más grado k. Si hay un coeficiente Cij "# O con i+ j = k, decimos que F es de 1+
grado k. Demuestre que el producto de un polinomio de grado k en dos variables con un 4x2
3+
polinomio de grado m en dos variables, es un polinomio de grado m+ k en dos variables. 9x2
5+
12. Considere la interpolación de Shepard en dos variables con n nodos, y sea dada la función -16x2-
$ por $(p. q) = IIP - qf ¿Qué espacio polinomial Ilk(]R.2) contiene todas las funciones 7+
9 +···
cardinales? (Dé la menor k.)
13. Sea/ E lli(]R) yl E I11 (]R2). Demuestre que/el E I1k(]R2 ). ¿Se pueden obtener todos los Esto también se puede escribir como:
elementos de ffi(]R2 ) de esta manera?
14. Demuestre que en un conjunto de cuatro nodos siempre es posible interpolar datos arbitrarios _ x x2 4x 29x 2 I6x2
por medio de un polinomio tan 1x------··· l( xJ < 1). (2)
1+3+5+ 7+ 9+
p(x,y) = a+bx + cy+ dxy,
La parte derecha de esta ecuación representa un límite en el siguiente sentido. Si la
siempre que los nodos sean los véruc·es de un rectángulo de lados paralelos a los ejes coor­ expresión en la ecuación (2) se termina después den términos, da lugar a una función!,,
denados.
bien definida:
X x2 4x2
15. Demuestre que siempre es posible interpolar en los vértices de un triángulo por medio de un
(n -1)2 x2
polinomio lineal fn(x) = --- ·· · 2 2).
(n - (3)
p(x,y) = ax+by+ e, 1+3+ 5+ 2n-1
Dé dos demostraciones, una de ellas basada en el teorema 3 .
Ésta se llama eln-ésimo convergente de la fracción continua. La ecuación (2) se define
< 16. Escriba y ponga a prueba un código que lleve a cabo el método de Shepard. El usuario querrá para significar que
especificar los nodos (x¡, y¡), las ordenadas e¡ y una lista de puntos en la que el interpolante
de Shepard se habrá de evaluar. De ser posible, grafique la solución. tan-! X= Iím f.(x) (Jxl < 1) (4)
n-oo
17. Demuestre que si se dan n puntos distintos x, en JRd , entonces hay un vector b tal que los n
números I¡ = (x¡, b) son todos distintos entre sí. (Necesario para el teorema 4. ) Si aceptamos la validez de esta ecuación, tenemos a nuestra disposición un método
18. Si U y V son espacios vectoriales de funciones sobre X y Y respectivamente, entonces U® V alternativo para calcular los valores de la función arco tangente. Que esto sea práctico
consta de todas las funciones w que tienen una representación como sumas finitas o no depende de la rapidez con que la sucesión que aparece en la ecuación (4) converja.
Para juzgar esto numéricamente, calculemos tan-1(1 /v'3) = 7t /6 �0.5235987756 por
w(x,y) = ¿ u,(x)v¡(y) U¡ E U, v¡ E V. medio de la sucesión!,,(!/v'3) paran � 2 . He aquí los resultados:
i=l

Demuestre que si U y V son de dimensión finita, entonces dim(U 0 V) = dim U · dim V. n fn(l/v'3)

.
2 0.519615
19. Demuestre que para todo operador L de la forma 3 0.523892
4 0.523577
Lf = ¿f(x¡)W¡ 5 0.523600
i=l 6 0.523599
las siguientes propiedades son equivalentes: 7 0.523599
(i) Para toda/, mín/(x¡) � Lf � má xf(x¡)
La tabla nos muestra que en el sexto convergente se ha alcanzado una precisión de seis
(Ü) W¡ ;;; Q y¿;;=! W¡ = l.
lugares decimales.
416 Capítulo 6 Aproximación de funciones *6.11 Fracciones continuas 417

Fórmulas recursivas TEOREMA 1 Sean {a.}�1 y {bn}�1 dos sucesiones dadas, Y {A.}�0 y {B.}�0 las
sucesiones
definidas por las fórmulas (9) y (10). Se tiene que
La tarea de evaluar una fracción continua no es tan sencilla como la de evaluar
una serie. En el caso de una serie infinita, digamos [:,1 ak, calculamos las sumas
parciales Sn=[;=! ak por medio de la fórmula Sn+I =Sn +an+I · Consideremos ahora A.
Cn = (n � 1). (11)
el problema análogo en el caso de una fracción continua: Bn

C=��2 ... (5) Demostración La validez de la ecuación (8) ya fue verificada para n = 1, 2 y 3. Ahora suponga que la
b ¡ b 2+b3+ ecuación (8) es verdadera para 1, 2, ..., n -l. En tal caso
Queremos descubrir un algoritmo recursivo para calcular los convergentes sucesivos:
ª
a¡ a2 a3 ª•-I ª• fn (X)=Ín -1
en.----· · ·---. ( 6) ( b. : X)
b ¡+ b z+ b3+ bn -1+ bn
_ An -1 +An -2a./(bn +x)
Para su uso temporal, introducimos las funciones - Bn -1 +Bn -za./(bn +x)

f.(x)=
a¡ a2 a3 ... ªn-1 . ª• (7)
_ An -1(bn +x) +An -zan
- Bn-1(b. +x) +Bn -2an
b¡+b2+b 3+ bn -i+bn +X
_ An -l bn +An-zan +An-!X
Es obvio que -
Bn -l bn +Bn -zan +Bn -!X
c.=fn(O).
_ An +An -!X
- 0

Para obtener f.( x) a partir de fn-I (x) observemos en primer lugar que Bn +Bn -!X

ª Esto demuestra la ecuación (8 ) por inducción. Ahora, por supuesto,


f.(x)=fn -1
( b. : x) ·
A.
Haciendo un cálculo directo, tenemos que c.=fn(O)= . 111111
Bn
a¡ Las fórmulas recursivas aquí desarrolladas constituyen la base de un algoritmo
f1(x)=­x
b1 + muy eficiente. Por ejemplo, los resultados numéricos para tan - 1 (1/ v'3), problema con
a1b2 +a¡x el que comenzamos esta sección, fueron calculados utilizando esta relación recursiva
fz(x)=
b¡b z +az +b¡X con an = (n -1)2 x2 y bn = 2n -1 empezando con a 1 = x y b 1 = l.
a1bzb3 +a¡a3 +(a1b2)x
füx)= b·¡b 2b 3 +a2b 3 +b¡ a3 +(b¡ b2 +a2)x Conversión de series a fracciones continuas

El patrón que aquí emerge sugiere que Muchas funciones especiales que surgen en las matemáticas aplicadas se pueden
desarrollar en fracciones continuas. Algunas fuentes de información son Abramowitz
An +An -IX y Stegun [1964] y los libros de texto Khovanskii [1963], Perron [1929] y Wall [1948].
fn (X) = (n � 1). (8) A continuación indicamos un procedimiento por medio del cual se puede obtener una
Bn +Bn-!X
fracción continua a partir de una serie.
donde
Ao=O, A¡ =a1 TEOREMA2
{An = bn An -1 +an An -2 (9) 00
( n � 2) 1 1 xr x? x;_¡
¿
k=I X
-
k X¡-X¡ + 2-X2 +x3-
x Xn -1 +x.- (12)
Bo = 1, B1 = br
{Bn = bnBn -1 +a.Bn -2 (10)
(n � 2) Demostración La demostración es por inducción, y se deja como un ejercicio al lector. 111
418 Capítulo 6 Aproximación de funciones *6.11 Fracciones continuas 419

Para ilustrar cómo se puede utilizar este teorema, construimos una fracción continua 2. Demuestre que
para la serie de Maclaurin de tan- 1 x: y'x=1+2 ( l+l+ ...
I+ ) '
y V V

1 x3 :r:5 x1
tan- x=x--+---+··· donde v= i(x - 1).
3 5 7
1 1
= -+--+-- +--+···
1 1 <3. Escriba un progama para calcular y'x por medio de la ecuación el problema 2. Calcule v'io,
x-1 -3x-3 5x-5 -7x-7 v'ioo, vTiifü y v!OOOO imprimiendo una tabla con los primeros 50 valores convergentes
en cada caso.
_ (x-1)2 (-3x-3)2 (5x-5)2
- 1 i - 3 3 5 )- (5x-s) +(-7x-7)- <4_ Escriba un programa para calcular tan-1 (1/v3) sin utilizar variables subindizadas, y com­
x- - x- +(-3x )- (-3x- ) +(5x-
pare sus resultados con los que se dan en el texto.
x -x2 -9x2 -25x2
= 5. Demuestre que
l+x2 - 3+-3x2 +5+5x2 - 7-
vb 2 b ..!!:_..!!:_..!!:_ ___
0bserve que si tanto el numerador como el denominador de una de las fracciones que
+a=
2b+2b+2b+
+

componen una fracción continua se multiplican por la misma cantidad, el numerador de 6. Para la fracción continua del problema I , demuestre que
la siguiente fracción componente se verá afectado de la misma manera. (¿Por qué?)
Las ecuaciones (9), (10) y (11) se pueden utilizar para aproximar tan- 1 x para un A.
valor dado de x cuando .=
C A,..¡·
ª"= -(2n - 3)2x2 bn = (-1)"[(2n - 3)x2 - (2n - 1)]
y 7. Para la fracción continua del problema 2, demuestre que
para n ;;:; 2. No obstante, el algoritmo para calcular tan- 1 x a través de la fracción
continua es mucho más complicado que el que se basa en el cómputo de las sumas
parciales en la serie de Maclaurin, y produce la misma sucesión de números. Observe
e_ vA..-- A••1·
que la fracción continua de Lambert (1) para tan- 1 x no es la misma que la que se deriva
de la serie de Maclaurin. Para investigar con mayor amplitud esta cuestión, calculemos 8. Compare dos métodos para calcular los valores de la función
tan- 1 (1/y3), utilizando las sumas parciales en la serie:
f(x ) = [ e_¡i.dt,
n fn( l/v3)
0.577350
2 0.513200 a saber, la expansión en series de Taylor que se da en el problema 6 de la sección 6.7 y la
3 0.526030 fracción continua
4
5
0.522976
0.523767 f(x) = ./ir. - !e-x'
2 2
(..!._!_2.2_�.··).
x+2x x+2x+x
6 0.523551 + +

7 0.523612 9. Demuestre que todo número real en el intervalo O < x < 1 se puede expresar como una
8 0.523595 fracción continua (posiblemente limitada) en la forma:
9 0.523600
10 0.523598 I 1 1
11 0.523599 x= ---···
b¡ b2+bi+
+

12 0.523599
donde cada b, es un entero positivo.
Al comparar esta tabla con la que se produce a partir de la fracción continua (1), podemos
ver que la fracción continua converge más rápido que la serie de este ejemplo. 10. Demuestre que si
a¡ a2 a¡
X=---···
b1+ b2+ b1+
SERIE DE PROBLEMAS *6.11
con todos los a, y b, positivos, entonces los convergentes de la fracción son alternativamente
l. Demuestre que mayores y menores que x .
..!...!...!. 1
!+ !+ !+ ... = 2(V5 -1). 11. Demuestre que f,, es creciente si y sólo si B. > A. utilizando la notación de la ecuación (8).
420 Capítulo 6 Aproximación de funciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 421

12. Cuente el número de operaciones extensas comprendidas en el cómputo de c. a partir de 24. Suponiendo que la siguiente fracción continua converge, encuentre su valor :
A./Bn cuando se utilizan las fónnulas (9 ) y (10).
1 1 1 1 ...
13 . Demuestre que dos convergentes sucesivos cualesquiera de la fracción continua que aparece
en la ecuación (11 ) cumplen con la siguiente ecuación: 6+6+6+6+

a1a2 • +S. Encuentre el valor dex:


( l)n-1 ···a .
� _ An-1 = -
B. Bn-1 BnBn-1
x=I+..!.._..!.._..!.._..!.._ ....
1+2+ 1+2+
14. Utilice el resultado del problema13 para demostrar el teorema del problema10.
26. Encuentre el valor dex:
15. Demuestre que si todos los números b; son positivos y a; = I, entonces para toda n, B. > 1 1 1 ...
min( l, b1). x=2 + .
¡¡:¡¡:4+
16. Demuestre que si b;> O y a;=1, entonces BnBn-1 es una función creciente den.
27 . Si
17. Demuestre que si b; ?;1 = a;, entonces la fracción continua de la ecuación (11 ) converge. 2 4 6 2n
fn(x )=--
18. Encuentre la fónnula recursiva para B. si 1+2+-· n+x···.
3+ ··-
¿cómo obtendría ustedf.+1 a partir def.?
a1 a2
bi+ b2+ Bi+ B2+
28. ¿Cuáles el valor deV6+V6+�?
19. Demuestre el teorema2 de esta sección.
29. Suponga que la fracción continua
20. Demuestre que
X X 2x 3x ...
e'
1-x+I-x+2-x+3-x+4- (x>0)
2x+2x+2x+
21. Demuestre que converge. Determine una expresión cerrada para ella en téminos de x.
1 2 3 ..
1+2+3+ ·= e-1'
22 . Demuestre que las funciones
*6.12 Interpolación trigonométrica y la transformada rápida de Fourier
1 2 3 n
g.(x) = ;¡:;¡:;¡: ... ;
Primero, recordemos los hechos sobresalientes acerca de la interpolación por medio de
se pueden generar recursivamente por medio del siguiente algoritmo: polinomios algebraicos ordinarios. Si n + 1 valores de una función se dan en una tabla

g.(x) = p.(x)/q.(x),
X XQ X¡ Xz Xn
donde 1( )
y Yo y¡ Y2 Yn
po(x)= O, p¡(x)= 1
{
Pn+i (x) = xp.(x)+ (n+1 )Pn-i(x).
entonces hay un único polinomio p de grado ;;;; n que interpola los datos. En otras
y palabras,
qo(x) = !, q1(x) =x p(X)j = Yj 0
( ;;¡;j ;;¡; n). 2( )
{
qn+i(x) = xq.(x)+ (n+ l)qn-1(x).
Los puntosXo,x 1, ••• ,x. se supone que son todos diferentes entre sí, mientras que a los
'23. Escriba un programa de cómputo que evalúe la fracción continua para tan-1 x, tal como se datos Yj no se les impone restricción alguna. El polinomio p se elige del espacio lineal
indica en la ecuación (1 ). Utilice el siguiente enfoque elemental: dadan, compute la función
fn (x) de la ecuación (3 ) comenzando en la parte derecha y fonnando las fracciones adecuadas.
rr., que consta de todos los polinomios de grado ;;¡; n. Una base de rr. se da por medio
Ponga a prueba su programa computando it-1 tan-1(v3) paran= 5,10 ,15,20. de las funciones bk x
( ) =xk para O ;;;; k ;;;; n.
42 2 Capítulo 6 Aproximación de funciones *6.12 Interpolación trig onométrica y la transformada rápida de Fourier 423

Serie de Fourier TEOREMA 1 Dadas las sucesiones reales [ak]�0 y [bk]�1, defina
Cuando se trata de representar fenómenos periódicos el espacio polinomial alge­ 1
braico rr. no es lo apropiado. En ese caso son mucho más convenientes las funciones ba =0 ª-k = ªk b_k = -bk Ck = (ak- b
2
l k).
trigonométricas. No obstante, antes de elegir las funciones trigonométricas básicas de­
bemos conocer el periodo de la función en cuestión. Por conveniencia, supongamos Entonces
que la función que se está interpolando es periódica con periodo 2it. En este caso, las
¿ cki .
n n
funciones 1, cosx, cos2x, ..., y senx, sen 2x, sen3x, ... , son las adecuadas. Uno de i+ ¿(akcoskx+bksenkx)= kx
(10)
los teoremas básicos del análisis de Fourier dice que si f es de periodo 2it y tiene una k=l k=-n
primera derivada continua, entonces su serie de Fourier
Demostración La serie de la derecha se puede escribir como
i+ ¿(akcoskx+bksenkx) (3)
k=I ¡ n
¿ (ak -ibk)( coskx+isenkx). (11)
2 k=-n
converge uniformemente a f. Los coeficientes de Fourier en la serie se calculan por
medio de las fórmulas:
¡
ªk=-
¡n f(t) cos ktdt (4)
Tal como se muestra en el siguiente cálculo, la parte imaginaria de esta serie es cero:

1t -n ¡ n
¡ ¡n ¿ [aksenkx-bkcoskx]
2 k=-n
bk= - f(t)senktdt (5)
1t -n
1" bo ¡"
El susodicho teorema nos asegura que es razonable aproximar funciones con periodo 2it = ¿[a-ksen(-kx)-b_kcos(-kx)J- + ¿[aksenkx-bkcoskx]
2 2 2 k=I
con los senos y co�enos enumerados más arriba. k=l

¡n ¡n
= 2)-aksenkx+bkcoskx] + ¿[aksenkx-bkcoskx] =O
Serie de Fourier compleja 2 k=l 2 k=l
Una extensa porción de esta teoría se puede expresar de manera mucho más elegante
utilizando exponenciales complejas. Recordemos la fórmula de Euler: La parte real de la serie en ( 11) es
/ =cose+isene
¿
l
(6) ¡ n
[akcoskx+bksenkx]
en dondei2 =- 1. La serie de Fourier viene dada por 2 k=-n
n n
f(x) "' ¿ f(k )eilo:
, (7)
1
2
k=I
1
= ¿[a-kcos(-kx)+b-ksen(-kx)J+ i+ ¿[akcoskx +bkcoskx]
2 k=I
k=-oo

donde

f(k )= -
1 ¡n f(t)e- dt.
iJct
(8)
= �+
2
Í)akcoskx+bksenkx].
k=l
1
2 1t -n
Sif es una función real, su serie de Fourier, tal como se expone en la ecuación (3 ), Producto interior, seudoproducto interior y seudonorma
es la parte real de la serie de Fourier compleja que se da en la ecuación (7). En realidad,
lo que tenemos a partir de las ecuaciones (4), (5), (6) y (8) es que Las funciones Ek definidas por Ek (x) = � ( con k = O,± I, ± 2, ... ) forman un

f(k ) = -
1 ¡n f(t)[coskt-isenkt] dt = -1 (ak- ib ) (k � 0). (9)
sistema ortonormal de funciones en el espacio de Hilbert complejo l,i[-1t, 1tJ siempre y
cuando definamos el producto interior como:
2it -n 2 k

1 ¡X f(x)g(x) dx.
Ahora apelamos al siguiente teorema. (f, g) = -
21t -n
42 4 Capítulo 6 Aproximación defunciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 425

Esto significa que (Eb En) = O cuando n "# k y que (Eb Ek) = l. El cálculo que apoya Polinomios exponenciales
esta aseveración cuando n * k es
Un polinomio exponencial de a lo más grado n es cualquier función de la forma
1 n - 1 n i/o; - .
(Ek, E.) = - Ek (x)E.(x) dx = - e e UIXdx
2 re ¡-n 2re ¡-n
¿ C e = ¿ c E (x)= ¿
n n n

P(x),;,, i/o;
C (if.
I ei(k-n)J: 1= k=O
k k k k
k=O k=O
=-I l e'.(k-n)J:dx= ---
n
=0
2re -n 2re i(k - n) x=-n
La última expresión de esta ecuación explica el origen de nuestra terminología, pues
Obviamente, (Eb Ek) = I y las funciones Ek forman una sucesión ortonormal. muestra que Pes un polinomio de grado � nen la variable i'. La interpolación por
Será conveniente utilizar la siguiente notación para el producto interior: medio de polinomios exponenciales se resume en los dos siguientes resultados.

TEOREMA 3 Sea Ek lafunción Ek (x) = �. Entonces {Eo, E1, ... , EN-i} es ortonormal respecto del
N-1
l
(f.g)N = ¿f(2rej/N)g(2rej/N).
---
(12)
N O producto interior (·, ·)N definido por la ecuación (12).
j=

En realidad, esta función no es un producto interior, pues la condición (j,J)N = O no COROLARIO 1 El polinomio exponencial que interpola a unafunción predeterminada! en nodos igual­
implica quef = O. Ella implica tan sólo quef(x) toma el valor cero en cada nodo 2rej/N. mente espaciados Xj = 2rej/N está dado por las ecuaciones:
Las otras propiedades de un producto interior (complejo) sí son válidas. Éstas son:
N-l
(i) (f.J)N � Ü
P= ¿ c Ek k con ck = (j, Ek)N. (14)
(Ü) (f. g)N = (g,j)N k=O
(iii) (a.f+pg,h)N =a.(j,h)N+p(g,h)N
Junto a este seudoproducto interior hay una seudonorma definida por: Demostración Utilizando la fórmula para Ck, calculamos el valor del polinomio exponencial en un nodo
arbitrario, digamos Xv- El resultado es:
= V(J,f)N,
N-1 N-l
Tenemos que 11! IIN = O si y sólo sif(2rej/N) = O para O � j � N - l. L, C E (X ) = L, (J. Ek) Ek(X )
k k v N v
El siguiente teorema desempeña un papel crucial en la interpolación. k=O k=O

TEOREMA 2 Para toda N � 1, tenemos que


N-1 N-1 __
= L, N ¿f(xj)Ek(Xj)Ek(X )
J

k=O j=O
v
1 Si k - m es divisible por N
(Ek, Em)N _
-{ (13)
O de lo contrario. N-l N-l
Demostración La expresión que nos ocupa se puede escribir como:
= ¿J(xj)� Ej(xk)Ev (xk)¿
j=O k=O

(2:) (21) = � I:
N-1
2ni(k-m)/N
� � Ek Em [e r = L,f(xj)(Ev , Ej) N
¡=O ¡=O
j=O
Si k - mes divisible por N, entonces (k - m)/N es un entero y e2ni(k-m)/N = l. En =J(xv), 11
consecuencia, cada sumando es 1 y su promedio es l. Por el contrario, si k -m no es
divisible por N, entonces e2ni(k-m)/N '# 1, y en este caso podemos aplicar la fórmula Ejemplo 1 Utilice el corolario 1 y obtenga una fórmula explícita para el interpolante cuando N= 2.
estándar para la suma de una serie geométrica:
Respuesta En este caso, P es el polinomio exponencial de grado 1 que interpola a f en los nodos O
N-1 .
A N -1 y re. La fórmula (14) nos da:
'\'¡,¡=-
� (11, * 1).
11,-l
P(x) =�[f(O)+J(re)J +�[J(O)+f(re )e-ilt] /'
j=O

El resultado es:
e2ni(k-m) - 1
'Ju = O. 111 =�[f(O)+f(re)] +�[J(O)-J(re)]i". 11
426 Capítulo 6 Aproximación de}unciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 427
COROLARIO 2 Si n < N, entonces el polinomio exponencial I:Z=0 ckEk que mejor aproxima en el La transformada rápida de Fourier hace que el costo del cómputo descienda a una
sentido de los mínimos cuadrados a f sobre el conjunto finito: cantidad mucho más razonable, a saber, N log2 N. La siguiente tabla nos muestra lo
que esto significa para los valores grandes de N, que por lo común aparecen en el
Xj = 21tj/N (O �j � N-1), procesamiento de señales ..
se obtiene para ck = (J, Ek)N· N N2 N log2 N
Demostración Por el teorema 3, las funciones x 1-+ ; constituyen un sistema ortonormal
1a
respecto del 1024 1048576 10240
producto interior definido en la ecuación (12). Para terminar la demostración, utilice el 4096 16777216 49152
teorema 3 de la sección 6. 8. 11 16384 268435456 229375

En el corolario 1, el manejo del lenguaje sugiere que el polinomio exponencial TEOREMA 4 Sean p y q polinomios exponenciales de grado � n - I tales que, par� los puntos
que ahí se describe es único. Para verificar lo anterior, suponga que I;f;:
0 akEk es un
1
Xj = rtj/n, satisfacen:
polinomio exponencial que interpola aj en:co,x 1, •.• ,XN-I (en donde xj = 21tj/N). En
tal caso, p(Xzj) = f(Xzj) q(X2j) = f(X2j+1) (O �j � n-1). (15)
N-1
"[, akEk(xj) = f(xj) (O �j �N-1). Entonces el polinomio exponencial de grado �2n-1 que interpola a f en los puntos
k=O Xo, X¡, ... , X2n-r viene dado por:
Si multiplicamos ambos lados de la ecuación por E.(-xj) y sumamos con respecto aj,
el resultado es: 1 . 1 .
N-l N-1 N-1 P(x) = (1 + e=) p(x) + (1-e=)q(x -1t/n). (16)
2
La L k Ek(xj)E.(-Xj) = "[,J(x¡)E.(-x¡).
2
k=O j=O j=O Demostración Como p y q son de grados � n - I y eúu es de grado n, está claro que P es de
Por la ecuación (12),esto implica que grado � 2n - l. Sólo nos resta demostrar que P interpola a/ en los nodos. Para
O �j � 2n-1 tenemos que:
N-1
L a (E , E )N = (J, En)N.
k k n 1 1
P(x¡) = (1 + E.(xj))p(xj) + (1-E.(xj))q( xj-rt/n).
2
k=O 2
En vista de que (Ek, En)N = 8kn, concluimos que Observe que:
· ·¡ ·· l 1·par
En(x·) en"'J n = e"'1 = {+
1 = ..
ª• = (J, En)N = Cn. -1 ; impar.

De este modo, cuandoj es par inferimos queP(xj) = p(xj) = f(xj), mientras que cuando
Transformada rápida de Fourier j es impar, tenemos que:
Dedicamos el resto de esta sección a los aspectos computacionales de la interpo­
lación trigonométrica. En particular, desarrollamos un algoritmo muy eficiente para P(x¡) = q(xj -rt/n) = q(Xj-1) = f(x¡). 1111

determinar los coeficientes de la ecuación (14), llamado transformada rápida de Fou­


rier. Seguimos la exposición de Stoer y Bulirsch (1980]. TEOREMA 5 Sean los coeficientes de los polinomios descritos en el teorema 4 como a continuación
Defina los coeficientes c0, c1, ••. , CN- I como en el corolario l. Escriba se indica:
n-l
L a. E¡ L YE.
n-1 2n-l
p= j q = I)Ej p=
N-1 j j

(ft.. = e-2"ifN). j=O


j=O
l
j=O
Ck = N "[,J(xj)O,N
j=O Entonces, para O � j �n -I,

De este modo, Ck resulta de evaluar un polinomio de grado N-1 en el punto )..k ; se puede 1 1 ..
calcular con un costo aproximado de N multiplicaciones y N adiciones. En vista de que
YJ. = + -e-'f1'/"Ar'Í
-(J..
(17)
2 � 2
el número de coeficientes Ck por calcular es N, según nuestros cálculos, el costo total de 1 1 ..
la construcción del polinomio exponencial de interpolación es de O(N2) operaciones. Y.j+n = 2ª1 - 2e-gn/n�j (18)
428 Capítulo 6 Aproximación defunciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 429

Demostración Utilizaremos la ecuación (16) y requeriremos una fórmula para q(x - 1t / n): requieren n multiplicaciones para calcular iªj para O � j;;; n-1, y otras n multiplica­
n
ciones para calcular (fe-ij,t/ )pj para O;;;j;;; n-1. (En el último caso, hemos supuesto
n-1 n-1 n-1
n n que los factores f e-ij,t/n ya están disponibles). Dado que el costo de los coeficientes a0,
q (x- ;) = ¿Pj Ej (x- ;) = ¿Pij(x-1t/ )= ¿Pje-i1tj/ Ej(x).
O O a 1, .•. , ª•- l es de R(n) multiplicaciones, y lo mismo se puede decir de los coeficientes
j =O j= j=
Po , P1, ..., Pn-1, concluimos que para P se requiere un costo de a lo más 2R(n)+2n
Con base en la ecuación (16) tenemos que: multiplicaciones.
La desigualdad que figura en el teorema se demuestra por inducción. Considere el
1 1 caso m = O. Se pide interpolar aj en el punto x0 = O con un polinomio exponencial
P(x) = -(1 +E.(x)]p(x)+ -[l -E.(x)]q x--
2 2 ( n Jt) de grado O. La solución es la constante f(0) y no se requiere multiplicación. Por consi­
n- 1 guiente, el enunciado del teorema es cierto para m= O. Procedamos ahora por inducción,
P= � ¿ { (1+E.)ajEj+(1- E.)pje-i1tj/nEj } utilizando la ecuación (19). El cálculo para el paso inductivo (de m a m+1) es
j=O
R(2m+I) = R(2 • 2m );;; 2R(2m)+2 • 2m
n-1
= � ¿ {(aj +Pj e-i:tj/n)Ej+(aj -Pj e-i:tj/n)En+j }. ;;; 2(m2m )+2m+l = (m+1)2m+l. 11111

j=O
Como consecuecia del teorema 6, podemos ver que si N es una potencia de 2, diga­
Las fórmulas para los coeficientes Yj se pueden leer de esta última ecuación. 1111!
mos 2m , el costo de computar el polinomio de interpolación exponencial cumple con la
desigualdad R(N);;; N log2 N. El algoritmo que realiza repetidas veces el procedimiento
Ejemplo 2 Utilice el teorema 5 para encontrar P cuando n= I. que figura en el teorema 4 es la transformada rápida de Fourier.
Res puesta Con las fórmulas (17) y (18) obtenemos: El contenido del teorema 4 se puede interpretar en términos de dos operadores
lineales Ln y Th . Para toda f, sea L.J el polinomio exponencial de grado n- 1 que
1 1 interpola a f en los nodos 21tj/n con O ;;; j ;;; n- I. Sea Th el siguiente operador de
Yo = (ao+Po) Y1 = 2(ao- Po).
2 translación:
(Th f)(x) = f (x+h).
Por consiguiente, P viene dado por:
Con base en el corolario 1 sabemos que
1 1
P = YoEo+y¡E¡ = ( +Po)+ (ao- Po)E¡.
2 ao 2 n-1
Lnf = ¿(f, Ek)nEk,
Si ao y Po se sustituyen por sus valores, llegamos finalmente al resultado del ejemplo 1: k=O

� [f(O)+f(it)]+ � [f(O)-f(it)]eix. Es más, en el teorema 4,


P(x) = 11

P = Lznf P = L nf q = LnT,r¡nf

Análisis Lo que se concluye de los teoremas 4 y 5 es que Lznf se puede obtener eficientemente
a partir de L.J y LnT,r¡nf· Naturalmente, esto es cierto para n= 1, 2, ....
Para llevar a cabo un análisis más amplio, denotemos con R(n) el mínimo número La notación que acabamos de introducir nos permite expresar el teorema 4 en la
de multiplicaciones necesarias para calcular los coeficientes de un polinomio de inter­ agradable forma:
polación exponencial en el conjunto de puntos { 21tj/n : O;;;j;;; n- l}.
1 1
TEOREMA 6 R(2m );;; m2m . Lznf = 2(1+E.)L.J+ 2(1- E.)L,r¡nLnT,r¡nf

Demostración Comenzamos por implantar la siguiente desigualdad: Ahora nuestra meta es implantar una versión del algoritmo para la transformada rápida
de Fourier que calcule LNJ, en donde N= 2m .
R(2n);;; 2R(n)+2n. (19)
Definición Para una función! y un índice N= 2m fijos, definimos
Por el teorema 5, los coeficientes yj necesarios en el polinomio P se pueden obtener a
partir de los coeficientes de p y q con un costo de 2n multiplicaciones. En realidad, se Pk") = Lz.T2k1t/Nf (O;;; n;;; m, O;;; k;;; 2m -n-1). (20)
430 *6.12 Interpolación trigonométrica y la transformada rápida de Fourier
Capítulo 6 Aproximación de funciones 431

Una descripción alternativa de PÍ,n ) es la del polinomio exponencial de grado 2n -1 Dado que para cada n, O� k � zm -n -1 y O�j � 2" -1, el arregloA(n) requiere
que interpola a f de la manera siguiente: N localidades de almacenamiento en memoria. Una manera de llevar a cabo los cálculos
consiste en utilizar dos arreglos lineales de longitud N, uno para guardar a A (n) y el
2rcj 2rck 2rcj otro para guardar aA(•+1> . En el siguiente paso un arreglo contendrá aA(n+I) y el otro a
p(n) ( ) = f ( + n ) (0 �j � 2" -1). (21)
k 2• N 2 A(n+2> . Llamemos C y D a dichos arreglos. El arreglo bidimensional A(n) se guarda en
e mediante la regla
Por el problema 7, el conjunto de nodos (2rck/N)+ (2rcj/2") correspondiente a un valor
de k es ajeno al conjunto de nodos correpondiente a otro valor de k. Una aplicación C(2"k+ j) ,-At> (O� k � zm -n -1, O�j� 2" -1).
directa del teorema 4 nos muestra que
En forma análoga, el arregloA(n+I) se guarda en D mediante la regla
p(n+I) (x) = !(l + /1:'x)p(n) x + !(l _ /l"x )p(n) (x _ �) (22)
k 2 k ( ) 2 k+2•-•-1 2• D(2"+1 k+JJ,....At+l) (O� k � 2m -n-l -1, O�j� 2•+1 - 1).
Podemos ilustrar con un diagrama de árbol cómo se relacionan entre sí los po­
Los factores Z(j) = e-211iiIN se calculan al comienzo y se guardan. Después, utilizamos
linomios exponenciales Ptl. Supongamos que nuestro objetivo es calcular p�3l. En
el hecho de que e-ijtt/z" = Z(j2m-n-1). He aquí el algoritmo para la transformada
conformidad con la ecuación (22), esta función se puede obtener fácilmente a partir de
rápida de Fourier:
P�2) y P\2). Cada uno de éstos, a su vez, se puede obtener a partir de cuatro polinomios
de orden inferior, y así sucesivamente. La figura 6.22 nos muestra las conexiones.
inputm
N ,...
. 2m
pjl) w,.... e-21ti/N
for k = O, 1, 2, ... , N -1 do
Z(k) ,.... ef
C(k ) ,.... f(2rck/N)
end
pjll
for n = O, 1, 2, ... , m -1 do
I'
for k = O, 1, 2, ..., 2m -n-l -1 do
pjºl pjºl P1ºJ p¿ºl pfOI pjº¡ pjºl P¡ºl for j = O, 1, 2, ... , 2•-1 do
u,.... C(2"k+j)
Figura 6.22. V,- Z(j2m -n-I) C(2"k+ 2m-l +j)

D(2"+1 k+j) ,- (u+ v)/2


D(2"+1 k+ j+ 2"),.... (u -v)/2
Algoritmo end
Denote conAt> los coeficientes de Pi"). Aquí O � n � m, O � k � zm-n -¡ y end
O�j� zn -l . Tenemos que
for j = O, 1, 2, ..., N -1 do
C(j),.... D(j)
¿At>E (x) = ¿At>eif•.
2"-1 2"-1
Pk">(x) = ¡ end
i=O i=O
end
Por el teorema 5, las siguientes ecuaciones son válidas: output C(O), C(l ), ... , C(N).

Aki(1;f"ll = ! ri�
Si examinamos el seudocódigo , podemos verificar que la cota m2m impuesta al
>+ e-ij11/2"Ak+
(n) -•-1,1]
2 L ki 2• · número de multiplicaciones se cumple, tal como lo establece el teorema 6. Observe que
en el ciclo anidado que aparece en el código, n toma m valores; después k adopta zm -n-r
(n+I)2• = ! rLA/cj(n) -e-ij1t/Z'Ak+2
Ak,¡+ (n) •-•-1,¡] valores y j asume 2" valores. En realidad, en esta parte del código sólo hay un comando
2
432 Capítulo 6 Aproximación de funciones *6.12 Interpolación tri gono métrica y la transformada rápida de Fourier 433

que incluye una multiplicación, a saber, aquel en el que se calcula v. Este comando se Seudonimación y frecuencia Nyquist
ejecutará un número de veces igual al producto
Cuando se intenta reconstruir una función/ a partir de muestras f(xj), surge la
m X 2 m-n-l X 2 " = m2 m-l
. pregunta acerca de las limitaciones que puede haber en el proceso. Obviamente, un
número finito de muestras no puede proporcionar toda la información contenida en una
Cerca del inicio del código, el cómputo del arreglo Z comprende 2m -1 multiplicaciones. función que puede ser un elemento arbitrario de un espacio lineal de dimensión infinita.
Sin embargo, en cualquier computadora binaria, no se necesitan contar las multiplica­ Así, puede haber dos funciones continuas diferentes que aparenten ser una sola a partir de
ciones por 1/2, pues éstas se logran substrayendo un 1 del exponente del número de la evidencia proporcionada por un número finito de muestras. Este fenómeno se conoce
punto flotante. como seudonimación. Para investigar esta cuestión supongamos quef está representada
por su serie de Fourier:
Ejemplo 3 Sea/ = ¿;;=0 (k + l)Ek. Reconstruya/ por medio de la transformada rápida de Fourier,
utilizando muestras def en ocho puntos igualmente espaciados.
f= ¿ (f,E ) k Ek. (23)
k=-oo

J"
Respuesta Podemos utilizar el algoritmo dado con m = 3. La siguiente es una subrutina o proce­ Aquí hemos utilizado la siguiente notación:
dimiento para calcular los valores de f directamente de la fórmula. 1
Ek (x) = eila: (f,g) = f(x)g(x) dx.
-
21t
inputx
-1t

Por contraste, el polinomio de interpolación exponencial de grado � N - 1 se expresa


z +-- cosx + i sen x
por medio de:
d +-- 8 N-1
fork = 1,2, ... , 7 do P= ¿(f,
k=O
Ek ) NEk. (24)
d+--dz+8-k
Aquí la notación es:
end
N-1
outputd. 1 ""' -
(f,g)N = N ¿_,f(xj)g(xj) Xj = 21tj/N.
j=O
Cuando estos programas se ejecutaron en una máquina de 32 bits, el contenido inicial
del arreglo C fue el siguiente (redondeado a cinco cifras significativas): Para comparar los coeficientes en las ecuaciones (23) y (24), escribimos:

Ca= 36.000 C4 = -4.0000


C5 = -4.0000 + 1.6568 i
(f. Em) N =
( f (J,Ek)Ek , Em ) = f (f,Ek)(Ek, Em) N.
C1 = -4.0000 - 9.6569i k=-oo N k=-oo

C2 = -4.0000 - 4.0000i c6 = -4.oooo + 4.ooooi Por el teorema 2, (Ek, Em) N es cero excepto en aquellos casos en que k-m es un múltiplo
C1 = -4.0000 - l.6569i C1 = -4.0000 + 9.6569i. de N. Así, si tomamos k - m = vN, con v = O, ±1, ±2, ... , obtendremos

El contenido final del arreglo C fue: (J,E )N =


m ¿ (J,
v=-oo
Em+v N).

(1.0000, 2.0000, 3.0000, 4.0000, 5.0000, 6.0000, 7.0000, 8.0000). 11 Escribiendo estos términos en orden decreciente de importancia, tenemos que

El algoritmo precedente sólo presta un servicio didáctico. Los códigos que hay (f,Em) N = (f,Em) + (f,Em+N) + (/, Em-N) + · · ·.
que utilizar en la computación productiva deberían tener refinamientos adicionales. Por Esto nos muestra que el coeficiente de E en la función de interpolación (24) no sólo
m
ejemplo, podemos prescindir del arreglo D con algo de programación adicional. Es tiene el esperado término (J,Em) de (23), sino también los términos que propiamente
más, siempre que el factor Z(j) es +l o -1, el producto Z(j)C(k) se debe programar pertenecen a las frecuencias más altas, (/, Errr±vN) para v = 1, 2, 3, .... Estos términos
simplemente como C(k) o -C(k). Por último, se puede escribir un código más versátil son indeseables y crean distorsiones en la señal reconstruida. La primera de las compo­
para hacer frente a los valores de N que no son potencias de 2. nentes indeseables es (J,EN), que pertenece a, EN en la serie de Fourier. Sin embargo,
Para las funciones f que sólo toman valores reales en los argumentos reales se EN no está presente en la función de interpolación del polinomio (24 ). El término EN
pueden escribir códigos especiales. También se pueden escribir otros códigos para representa a la componente de frecuencia más pequeña que está presente en la serie de
producir series de senos o series de cosenos nada más. Para las distintas ramificaciones Fourier, pero ausente en la función interpolante. Esta frecuencia más pequeña se conoce
de este tema se pueden consultar las referencias que mencionamos al final de esta sección. como la frecuencia Nyquist.
434 Capítulo 6 Aproximación de funciones *6.12 Interpolación trigonométrica y la transformada rápida de Fourier 435

Cálculo de los valores de un polinomio exponencial 7. Demuestre que si k * r, entonces los conjuntos de nodos en la parte derecha de la ecuación
(21) son ajenos entre sí.
La transformada rápida de Fourier también se puede utilizar para evaluar un poli­
8. Establezca la validez de la ecuación (22).
nomio exponencial en un conjunto de puntos distribuido a distancias iguales. Suponga
que dicho polinomio está dado en la forma: 9. La siguiente es una forma equivalente del teorema 5. Demuéstrela
n-1 (J. F.j)1,i = (u¡ +vj)/2
p(x) = L>iEj(x). (j, F.j.,.)2,r = (u¡-Vj)/2
j=O
Uj = (j, F.j) n Vj = e-iftt/n (Tn¡n Í, F.j) n ,
Para evaluar p en los puntos
aquí, T,¡. es el operador de translación definido por (T,¡.f)(x) = f(x +n/n).
21m
t -­ (O� k � n-1). 10. Este problema y los tres siguientes proporcionan una formulación de la transformada rápida
de Fourier en términos de matrices. Fije un índice n y una funciónf. Sean u y v los vectores
n
escribimos Xk = 2/m/n y columna que tienen como componentes a

p(t -Xk) = ¿ ajEj(t-xk) = ¿ aieij(t-x,)


n-1 n-1
u¡=! c:j) Vj = (J, E¡ ). (O �j � n-1).
j=O j=O
Demuestre que v = Au, donde A es la matriz con componentes A¡k = n-1 e-2irijk/•, (0 �
j,k � n-1).
¿ a/i Ek(Xj) = n(g, Ek)n.
n-1

= 1
11. (Continuación) Demuestre que la matriz A sólo tiene n elementos distintos. Demuestre
j=O que la matriz n112A es unitaria. Demuestre que A es simétrica.
donde g es una función tal que 12. (Continuación) Demuestre que !!vi! = n-1/2 !!ul! utilizando la norma euclidiana en C".
g(xj) = aié1 (O �j � n-1). 13. (Continuación) Conserve la notación de los tres problemas precedentes y escriba A = AC•>
De este modo, podemos aplicar la transformada rápida de Fourier a g, obteniendo los para mostrar su dependencia de n. Si u E cz. , haga u' = (uo, uz,..., u1,i-2) y u" =
(u¡,u3, ..., u1,i 1 ). Demuestre que para O � k � n - 1
coeficientes (g, Ek)n. Cuando estos se multiplican por n, tenemos los valores p(t -Xk). -
Algunas fuentes de información sobre la transformada rápida de Fourier son Davis y
(A
(ln)
u)k = f (AC•>u\ + fe-;1cn¡"(AC•> u")t
Rabinowitz (1984], Cooley, Lewis y Welch (1967], Bloomfield (1976], Brigham (1974],
Conte y de Boor (1980], Kahaner [1970, 1978], Lanczos [1966], Kahaner, Moler y Nash (A( )U)n+ k
Zn
= f(AC•>u1 - fe-;.,,1"(AC•)u '\
)1c

(1989], Elliott y Rao (1982], Nussbaumer (1982] y Scheid (1988].


e14. Escriba y ensaye un código apropiado para la transformada rápida de Fourier y compute los
L1� 1
valores de p(x) = = a¡E¡(x), suponiendo queN = 2m y que los coeficientes ªHa fueron
SERIE DE PROBLEMAS *6.12 suministrados.
l. Utilizando la notación del teorema 3 y sus corolarios, demuestre que si un polinomio expo­ 15. Demuestre que sif y g son funciones tales que
nencial g(x) = LZ� 1 akE.(x) torna el valor cero en cada nodo Xj, entonces los coeficientes
ak son todos nulos. f(x¡) = (g,Ej). (Xj = 2nj/n),
2. (Continuación) Con el resultado del problema l, demuestre de otra manera que la función
de interpolación del corolario 1 es única entonces g(Xj) = n(f, Ej) n ,
3. Demuestre que Ek En = Ek.,. y Ek = E-k· 16. Tomando las partes real e imaginaria en una ecuación exponencial apropiada, demuestre que
4. Demuestre que Tk Ej es un múltiplo escalar de Ej. (La notación es la misma que la de la
n -1
ecuación (20).) 1 " 21tjk
L., cos 7 = { 1 Si k divide a n
5. Demuestre quef yf+A.fa son indistinguibles si se muestran en puntos de la formaxj = 21tj/N ; O de lo contrario
cuando k es un múltiplo de N. Así, para detectar todas las componentes de f que tienen j=O
frecuencias � ro, la frecuencia del muestreo debería ser mayor que ro. Éste es otro aspecto n 1
1 - 2d
del efecto de seudonimación. -"L., sen -1- = O.
n n
6. (Seudonimaci6n) Dos funciones pueden parecer una misma si sólo conocemos de ellas j=O
muestras tornadas en puntos discretos. Demuestre que las siguientes funciones parecen ser
idénticas cuando las muestras se toman en los valores enteros de x: 17. Demuestre que el producto interior definido en la ecuación (12) satisface las tres propiedades
f(x) = cos[(n-a.)1tx + �] g(x) = cos[(n +a.)1tX-�]. (i), (ii) y (iii) que siguen de dicha ecuación. ¿Por qué 11 · !IN no es una norma?
6.13 Aproximación adaptativa 437
436 Capítulo 6 Aproximación defunciones
de nudos a otro, y de una aproximación por splines a otra mejor. Este proceso se repite
6.13 Aproximación adaptativa hasta que el spline satisface el criterio de error.
Un rasgo distintivo de una aproximación adaptativa es que el dominio d e la función
se subdivide repetidas veces a fin de obtener ajustes más precisos en subdominios más Algoritmo
pequeños. La aproximación global que de ello resulta se define por pedazas, uniendo Al escribir un algoritmo para este proceso es deseable otorgar una alta prioridad a
las diversas aproximaciones locales antes mencionadas. Está claro que los splines con la eficiencia. Debido a ello, en cada etapa del proceso deberíamos guardar no sólo el
nudos libres son adecuados para este tipo de aproximación. arreglo de nudos en curso:
t = [to, t¡ , ...' tn],
Splines de primer grado
entra un spline de primer
sino también el arreglo de ordenadas correspondientes
Vamos a ilustrar estos principios con un algoritmo que encu
rvalo [a, b]. Se supone que se
grado como aproximación a una función dada! en un inte Y = ÍYo, y¡, . .., Yn], donde y¡ = f(t¡).
l resulta do d e nuestro trabajo ha
ha prescrito una tolerancia para el errore > O, y qu e e
satisfa c la d sigual dad
de ser un spline S de primer grado qu e e e
También debemos guardar el arreglo de desviaciones
lf(x)-S(x)I �e para a�x�b.
(1)

interpole af en los nudos. La máx lf(t¡) -f(.f. ti-!, t¡;x)J


d = [d ¡ , d2, ..., dn], con d¡ = t¡_¡��t¡
El spline S es lineal por pedazos y se elige de manera que
n dos puntos a. y � vi n dada por
función lineal que interpola af e e e

y el arreglo de puntos de desviación máxima e = [e¡, c2, ..., c.] compuesto por los
f(a.) -x) + -R!(�) -(x-a.).
f(f, a., �;x) = -R -$ .,-a.
puntos en los que se dan las desviaciones máximas. Aquí, d¡ es la desviación máxima en
.,-a. el intervalo [tH , t¡] y e¡ es un punto de dicho intervalo en el que ésta se da. En términos

Si se da un conjunto de nudos, digamos de estas cantidades almacenadas, tenemos que:


a = to < t¡ < t2 < · · · < tn = b,
f(.f. t¡_¡, t¡;x) = [Yi-l (t¡-x) + y¡(x-t¡_¡)](t¡ - t¡_1)
se define con la fórmula:
entonces el spline de interpolación de primer grado paraf Jlf - SIJ oo = máx{ d¡ , d2, ..., dn }
f(f, to, t1;x) to�X� t¡
d¡ = lf(c;)-f(f, t¡_¡, t;;c¡)I e ;;; t¡.
ti-1 ;;; ¡
f(f, t¡ , t2;x) t¡ �X� tz
S(x) = { En el n-ésimo paso, los arreglos t, y, d y e estarán disponibles como resultado
del trabajo previo. En ese momento se verifica si la secuencia de nudos propuesta es
eÚ. tn-1, t.;x) tn-1�x�t•. satisfactoria. Si no lo es, se elige un índice i para el que
os logrado nuestro objetivo.
Si S satisface el criterio de error de la desigualdad (1), habrem
Sin embargo, si d; = máx{d1,d2, ... , d.}.
>
llf-SIl oo = máx lf(x) - S(x)I e,
a�;f;b
Como e¡ es un punto de [t¡_1, t¡] en el que la desviación lf(x)-S(x)1 es máxima, podemos
puntos del intervalo. Sea
entonces se ha excedido la tolerancia para el errore uno o más tomar a e¡ como el nuevo nudo (que previamente denotamos con 1;). En el siguiente paso,
1; un punto en el que se da el mayor de los errores, es decir, habrá dos nuevos intervalos en nuestra partición de [a, b], a saber, [t¡_¡, e¡] y [e¡, t¡].
Los datos almacenados con los índices i, i + 1, ... , n se desplazan a la derecha en la
Jf(I;) -S(l;)I = llf-Sll oo· memoria, y t¡ se convierte en e¡ . En otras palabras, los nudos a la derecha del nuevo nudo
Sea i el índice para el que se reetiquetan, al igual que las ordenadas, desviaciones y puntos de desviación máxima,
t¡_¡�1;�t¡. y el nuevo nudo se inserta en el arreglo correspondiente. Después, el intervalo que
contiene al nuevo nudo se divide en dicho punto y se calculan los puntos de desviación
En este intervalo el spline correspondiente no es satisfactorio. De este modo, la diferencia
máxima correspondientes a los nuevos subintervalos. De este modo se va generando
lf(x) -f(f, t¡_¡ , t¡;x)J excede ae en algunos puntos del intervalo [t¡_¡, t¡]. En este caso un conjunto de nudos cuya desviación máxima sobre cada subintervalo cae dentro de la
subdividirnos el intervalo introduciendo a 1; como un nu evo nudo. En vez d e la sola
tolerancia especificada cuando esto es posible. He aquí un algoritmo que hace todo esto
función lineal f(f, t¡-J, t¡; x) en [t¡_¡, t;], ahora tendremos dos funciones lineales, a saber,
a partir de to = a y t 1 = b.
f(.f. t¡_1, l;;x) en [t¡_ 1, 1;] y f(.f.1;, t¡;x) en [1;, t¡ ]. De este modo, pasamos de un conjunto
438 Capítulo 6 Aproximaci6n de funciones 6.13 Aproximaci6n adaptativa 439

input a, b, e, M procedure MAX (f, a, P, e, d)


to <- a; t¡ <- b; Yo <-f(to ); y¡ <-f(t¡) k <-10
call MAX (f, to, t¡, C¡, d¡ )
h .- (f, -a)/k
for n = 1,2,... , M-Ido
seleccionar i tal que d; = máx{d¡ , d2, ..• , dn } for i = O, 1,...,k do
if d; � e exit loop Z; <- f(a + ih)
forj=n,n-1, ... ,i+ldo end
tj+I <- tj for i = 1, 2, ... , k-I do
<- Yj
z; <- \z; - (izk + (k - i)Zo) /k\
Yj+l
dj+I <- dj
end
Cj+I <- Cj
end d .... o
t¡+¡ .... t¡ fori= 1,2, ...,k-ldo
Yi+I <-y¡ ifz; > d then
t¡ <- C¡
d <-Z¡
Y;<-f(c;)
C<-a+ih
call MAX (f, t¡_ ¡, t¡, C¡, d;)
call MAX (f, t¡, t;+1, c;+1, d;+1) endif
end end
output n, (to, t¡, ..., tn ), (yo, y¡, ..., Yn ), (d¡, d2, ... , dn ). retum.

Este algoritmo conúenza con sólo dos nudos, to = a yt1 = b. Lo primero que hace
es deternúnar la desviación máxima d 1 sobre el intervalo [to, t1 ]. Sí d1 es mayor que la En el algoritmo precedente para MAX, hemos almacenado primero f(a +ih) en z;.
Una vez que se han computado zo, z1, ... , Zk se llega a la siguiente ecuación:
tolerancia pernútida e, entonces el punto c1 donde tiene lugar la desviación máxima se
convierte en un nudo. El nudo t1 se reetiqueta t2, y c1 se convierte en t1. Acto seguido,
se calculan las desviaciones máximas sobre [to, t1] y [t1, t2]. Sí cualquiera de ellas excede l(f, a, P;x) = kh(f, -x) + kh(x -a)
Zo Zk

a e, el proceso continúa. Eventualmente se alcanza alguna entre las siguientes opciones:


o todas las desviaciones son inferiores a e (éxito) o el máximo número de pasos (M) es
rebasado (fracaso). Se debe contar con una capacidad de almacenanúento que pernúta donde h = (f, -a)/k. Como p = a+kh, para x = a+ih, tenemos que
M componentes en los arreglos t, y, d y c.
En este algoritmo aparecen tres referencias a una subrutina o procedinúento MAX.
El propósito de l(f, a, p;a+ih) = �(k-i)h + fhih = (iZk +(k-i)zo) /k.
MAX (f, a, p, e, d)
De acuerdo a la línea 8 del algoritmo, la localidad de memoria z; se utiliza para guardar
es calcular el máximo de
\f(x)-l(f, a, P;x)\ lf(a+ih) - l(f, a, p;a+ih)\.
en el intervalo [a., PJ, guardando el valor máximo en d y almacenando el punto en el
que esto ocurre en e. En la práctica, los valores de e y d no se tienen que calcular Ejemplo Pusimos a prueba un programa de cómputo que incorpora el método de aproximación
con una precisión muy alta. Una forma burda de hacerlo es muestreando los valores de adaptativa recién descrito con lafunciónf(x) = y'.ten elíntervalo [O, 1] ycone = 10-2.
\f(x)-l(f, a, p;x)I en, digamos, once puntos a lo largo del intervalo, aceptando uno Como resultado se generaron diez nudos, concentrados cerca de la singularidad en cero
de ellos como el punto buscado. He aquí un algoritmo que hace justamente esto. (es decir, un punto con derivada infinita). Vea la figura 6.23.
440 Capítulo 6 Aproximación de funciones 6.13 Aproximación adaptativa 441

1.0 Caso general


Es posible abstraer los principios que esclarece el algoritmo adaptativo de spline
de primer grado de modo que éstos se apliquen a casos más generales. El ingrediente
fundamental en este proceso es un operador de aproximación local A que actúa sobre una
función/ y un intervalo [a.,�], produciendo una aproximación de/ en dicho intervalo.
Escribimos
A(f, a.,�;x)
para denotar el valor en x de esta función de aproximación. La operación f.(f, a.,�;x)
que se utiliza en el caso del spline de primer grado es un operador de esta índole.
En cada paso de este proceso adaptativa, se dará un conjunto de subintervalos de
[a, b]. Estos intervalos no se traslapan y juntos cubren [a, b]. Si [a.,�] es uno de dichos
subintervalos, decimos que [a., �J es satisfactorio si

lf(x) -A(f, a.,�;x)J � e en [a.,�].

Si todos los subintervalos son satisfactorios, el objetivo se alcanza por medio de una
función global de aproximación G que está constituida por las funciones A(f, a.,�;x) en
.1 .2 los diversos subintervalos. (Observe que no hay nada que garantice que G será continua.)
Figura 6.23 Aproximación adaptativa de spline de grado l . Si un subintervalo [a.,� J no es satisfactorio, se subdivide de alguna manera estándar. Por

n
ejemplo, el punto medio� = !(a.+�) se puede añadir como nudo. Otra posibilidad
es tomar como nuevo nudo un punto� en el que se tenga el peor error en [a., En
cualquier caso, el intervalo (a., �J se sustituye por dos nuevos intervalos [a.,�] y �. �J.
Los diez nudos, los valores d ef y l a desviación máxima fueron Luego el proceso se repite.

nudos valordef desviaciones SERIE DE PROBLEMAS 6.13


0.00 0.000 e l. Escriba y ponga a prueba una rutina adaptativa que utilice funciones constantes por pedazos.
.007
0.000729 0.027 2. Si el procedimiento del problema 1 se aplica a una función monótona creciente, ¿qué cota
.002 inferior se puede fijar al número de subintervalos que serán necesarios? La respuesta deberá
darse en términos def(b) -f(a) y s.
0.049
3. Para la función/(x) = .¡;, demuestre que el máximo de
0.00243
.003
0.0081 0.09 lf(x) - R.(!, a.,�. x)I
.005
0.027 0.16 Se presenta en X = i ( jr3 + ,./a.)2.
.01
0.3 4. ¿Qué sucede si el algoritmo adaptativo se aplica (tal como se describe en el texto) a la función
0.09 f(x) = sen 1 Ox en el intervalo [O, 7t]?
.005
e5. Escriba una rutina para la computadora destinada al procedimiento de la aproximación adap­
0.174 0.417
tativa y aplíquela al ejemplo de esta sección. Haga una gráfica de los resultados con la
.004 computadora.
0.3 0.548
e 6. Modifique el algoritmo adaptativo de modo que se pueda utilizar con splines cúbicos.
.009
0.58 0.762 c7. Modifique el procedimiento MAX de modo que éste utilice el arreglo y. Experimente con
.008 algún otro procedimiento para MAX.
1.0 1.000

Si e se redujese a 10-3, se generarían 32 nudos con este procedimiento adaptativo. 11


Capítulo 7

DIFERENCIACIÓN E INTEGRACIÓN NUMÉRICA

7.1 Diferenciación numérica y extrapolación de Richardson


7.2 Integración numérica basada en interpolación
7.3 Cuadratura gaussiana
7.4 Integración de Romberg
7.5 Cuadratura adaptativa
*7.6 Teoría de Sard de aproximación de funcionales
*7.7 Polinomios de Bernoulli y la fórmula de Euler-Maclaurin

7.1 Diferenciación numérica y extrapolación de Richardson

Si se proporcionan los valores de una función f en ciertos puntos, digamos .to, x 1, ••• ,
x., ¿se puede usar esta información para obtener una estimación de cómo es su derivada
J:
f'(c) o una integral f(x)dx? La respuesta es un Sí rotundo.
Empecemos este análisis comentando que si se parte exclusivamente de los valores
f(Xo), f(x 1), ... , f(x.) es imposible decir mucho acerca de f, a menos que también
sepamos quefforma parte de una familia relativamente pequeña de funciones. Así, si se
permite quef sea una más en la familia de todas las funciones continuas de variable real,
conocer los valores f(x¡) resulta casi irrelevante. La figura 7.1 muestra varias funciones
continuas que tienen los mismos valores en seis puntos.

fz

Figura 7.1 Tres funciones continuas que coinciden en seis puntos.

Por otra parte, si sabemos quefes un polinomio de a lo más grado n, entonces los valores
en n + l puntos determinan completamente af, según vimos en la teoría de interpolación
presentada en la sección 6.1. En este caso recuperamos f exactamente, y podemos

443
444 Capítulo 7 Diferenciación e integración numérica 7.1 Diferenciación numérica y extrapolación de Richardson 445

J;
entonces calcular con absoluta certezaf'(c) o f(x)dx. Sin embargo, en la mayor parte El término de error en la ecuación (3) se puede estimar como sigue:
de las situaciones que se apegan a la realidad, la información que se tiene disponible
no determina completamente a f. y cualquier estimación numérica de su derivada o de /�f''(é,)/ = 0.005lcos�I;;; 0.005.
su integral deberá tomarse con escepticismo, a menos que venga acompañada de alguna
cota para los errores comprendidos. Podemos obtener una cota más precisa usando el hecho de que 1t/4 < � < 1t/4 + h, de
manera que I cos�I < 0.707107. Esto nos proporciona la cota superior 0.0035355. El
Diferenciación numérica error efectivo es
- sen¡+ 0.71063051 = 0.003523729. 11
Ilustramos estos asuntos analizando una fórmula para la diferenciación numérica
que surge de manera directa de la definición en términos de límite de f'(x): El término -(h/2')!"(�) que aparece en la ecuación (3) se llama error de trun­
camiento. Es el error que aparece debido al truncamiento de la serie de Taylor que se
J'(x)
,:::; f(x+h)-f(x) (1) efectúa en alguna etapa del proceso de derivación. En este caso la aproximación que
h se hizo de la fórmula (1) se obtuvo truncando la serie
Para una función lineal,f(x) = ax+b, la aproximación que expresa la fórmula (1) resulta h2 h3
f(x+h) = f(x) + hj'(x) +
exacta; esto es, proporciona el valor correcto def'(x) para cualquier valor de h distinto z!"(x) + 3¡f"'(x) + · · ·,
de cero. También en otros casos la fórmula puede ser exacta, pero esto ocurre sólo de
manera fortuita. Procedemos por lo tanto a hacer una estimación del error asociado a dejando sólo
esta fórmula de diferenciación numérica. El punto de partida es el teorema de Taylor en f(x + h),:::; f(x) + hf'(x).
la forma: Como veremos en un momento, el error de truncamiento y el error de redondeo juegan
h2
f(x+h) = f(x) + hj'(x) + -:¡/'(é,). (2) papeles igualmente importantes en el uso de la fórmula (1) y de otras semejantes.
Un vistazo a la ecuación (3) nos muestra que para calcularf' (x) con precisión, el
En este caso � es un punto en el intervalo abierto entre x y x + h. Para que la ecuación tamaño del paso h debe ser pequeño. Con esto en mente llevemos a cabo un experimento
(2) sea válida, f y f' deberían ser continuas en el intervalo cerrado entre x y x + h, y f" en el que h converge a cero pasando por una sucesión de valores, y con dichos valores
debería existir en el intervalo abierto correspondiente. Un reacomodo de los términos se calculan las aproximaciones correspondientes af'(x). Elegimos f(x) = tan- 1 x y
de la ecuación (2) nos lleva a: tomamos el punto a= /i. El resultado debería serf'(x) = (x2 + 1)- 1 evaluada en /2,
lo cual es 1/3. He aquí un algoritmo para estos cálculos:
J( x + h) - f(x)
J'(x)= L -z:,� "(�)':,•
f (3)
f(x) := tan-! X
La ecuación (3) es más útil que la ecuación (1), debido a que para una clase amplia de input h +- I; a+- /i;M +- 26
funciones, como las mencionadas con anterioridad, se cuenta, además de con la fórmula F1 +-J(a)
numérica básica, con un término que cuantifica el error y que se conoce como término for k = O, I, .. . , M do
de error. Dése cuenta de que el término de error consta de dos partes: una potencia de h
y un factor que contiene cierta derivada de orden superior def Éste último constituye un F2 +- f(a+h)
indicador de la clase de funciones para la cual la estimación del error resulta válida. La d +- F2 +- F1
presencia de h en el término de error hace que toda la expresión converja a cero conforme r +- d/h
h tiende a cero. La rapidez de dicha convergencia depende de la potencia de h. Estas output k, h, Fz, F1, d, r
consideraciones también son válidas para muchas estimaciones de error que se llevan a
cabo en análisis numérico: usualmente siempre habrá una potencia de h y un factor que h +- h/2
nos diga qué suavidad debe tener la función para que la estimación del error se considere end.
válida.
A continuación se muestran los resultados obtenidos con una computadora de 32 bits:
Ejemplo 1 Si se utiliza la fórmula (1) para calcular la derivada def(x) = cosx en x = 1t/4 y con k h F2 F1 d r
h = 0.01, ¿cuál es la respuesta y cuál es su grado de precisión? 4 0.62 X 10-t 0.9755 5095 0.9553 1660 0.0202 3435 0.3237 4954
12 0.24 X 10-3 0.9553 9796 0.9553 1660 0.0000 8136 0.3332 5195
Respuesta Usando una calculadora encontramos que
20 0.95 X 10-6 0.9553 1690 0.9553 1660 0.0000 0030 0.3125 0000
0.70000047 707106781 _ _ 24 0.60 X 10-7 0.9553 1666 0.9553 1660 0.0000 0006 1.0000 0000
,J(x+h;-f(x)
= ��t = 0 71063051. 26 0.15 X 10-7 0.9553 1660
!'(x) 0.9553 1660 0.0000 0000 0.0000 0000
7.1 Diferenciación numérica y extrapolación de Richardson 447
446 Capítulo 7 Diferenciación e integración numérica
Cuando esta expresión se sustituye en la ecuación (7) el resultado es
En cada línea, d se calcula como la diferencia F2 - F¡, y r se calcula como el cociente d/ h.
Debido a la cancelación por sustracción, d tiene cada vez menos dígitos significativos,
hasta que finalmented = O y r = O. El mejor valor para r se obtiene cuando k = 12, J'(x)= f(
x+h)-f(x-h) _}_f_
"' i;). (8)
teniendo 4· dígitos correctos si se redondea a 4 sitios decimales. Para este valor de . 2h 6! (
k observamos que d posee 4 dígitos significativos. Conforme k aumenta, el número
de dígitos significativos en d decrece, y es evidente que r no puede tener más dígitos Una fórmula importante para calcular segundas derivadas se obtiene añadiendo
significativos que d. Así, resulta que el error de redondeo nos impide obtener valores un término más a las ecuaciones (5) y (6) y sumando los resultados. Después de un
precisos cuando h es pequeño. Para tener una mayor precisión en d necesitaríamos más reacomodo de términos y de utilizar el método anterior, obtenemos
precisión en F1 y en Pi, y ello requeriría una mayor precisión en los cálculos básicos.
Podemos utilizar precisión múltiple o llevar a cabo los cálculos en una máquina con f(x + h) - 2f(x) + f(x - h) _ h: (4l
f"(x) = f (I;), (9)
una longitud de palabra mayor. El paso para el cual empeoran las respuestas dependerá h2 12"'
de la longitud de palabra ( o para ser más exacto, el error de redondeo unitario) de la
máquina en particular que se esté utilizando. para alguna /; E (x - h, x + h). Esta fórmula se utiliza con frecuencia en la solución
Las fórmulas de diferenciación numérica tienen su aplicación más importante en la numérica de ecuaciones diferenciales de segundo orden.
solución numérica de ecuaciones diferenciales. Un estratagema común consiste en
reemplazar las derivadas por aproximaciones semejantes a la que se expresa mediante la Ejemplo 2 Tomandof(x) = tan- 1 x y x = /i, use la computadora para aproximarJ'(x). Utilice la
ecuación (1). Con frecuencia la precisión de dichas fórmulas de diferenciación numérica ecuación (8) con un tamaño de paso h que tienda a cero. Recuerde que el valor correcto
se juzga a partir de la potencia de h que aparece en el término de error. Cuanto mayor es 1/3.
sea la potencia de h mejor es la aproximación, ya que h siempre es un número pequeño. Respuesta El siguiente es un algoritmo adecuado:
En esta evaluación, y debido al término O(h), la fórmula (2) tiene un pobre desempeño.
Una fórmula más conveniente es:
f(x) := tan-! X
f(x + h) - f(x - h) (4) input a <- /i; h <- 1; M <- 26
f '(x) �
2h for k = O, 1 . . . , M do
Ésta se deduce de dos casos del teorema de Taylor, a saber: F2 <-J(a+h)
F1 <- f(a-h)
h2 h3 1
f(x+ h ) = f(x)+hf '(x) + 2
J"(x) + 7/ 1 (/;1) (5) d <-F2-F¡
r <-d/(2h)
output k, h, F2, F1, d, r
h2 1 h3 1
f(x - h) = f(x) - hf (x) + !1 (x) - 7/11 (/;2)
I (6) h <- h/2
2
end.
Restando una expresión de la otra, obtenemos:
2 A continuación se muestran algunos de los resultados que proporciona una máquina de
f(x + h) - f(x-h) - h f"'( 1 ) +!"'(/;2)]. (7) 32 bits.
/;
12 [
'
f (x) = "'·
k h F2 Fi d r
Debido al término h2 en el error, éste es un resultado más favorable. Sin embargo, hay 2 0.25 1.0297 2674 0.8611 2982 0.1685 9692 0.3371 9385
que considerar la presencia del término f111 en el error. Este término de error se puede 10 0.9765 X 10-3 0.9556 4199 0.9549 9092 0.0006 5106 0.3333 4351
usar si f111 existe. 18 0.3815 X 10-5 0.9553 1786 0.9553 1535 0.0000 0250 0.3281 2500
El término de error en la ecuación (7) se puede simplificar si hacemos la suposición 26 0.1490 X 10-7 0.9553 1660 0.9553 1660 0.0000 0000 0.0000 0000
adicional de que la funciónf111 es continua en [x - h, x + h]. Tomemos a M y a m como
Una vez más observamos que debido a una cancelación por sustracción se produce
=
los valores mayor y menor respectivamente def'" en [x - h,x + h]. Entoncesf111(/; 1 ),
J"'l/;2), y c [!'"� 1) +f111(/;2)]/2 se encuentran en el intervalo [m, M]. Ya quef es
111 un deterioro pronunciado en la precisión conforme h tiende a cero. Los datos de salida
continua, toma el valor c en algún punto /; en [x - h, x + h]. Por ende, comienzan a exhibir dicho comportamiento en k = 9. Los valores de F1 y de F2 están muy
cercanos uno al otro, y su diferenciad sufre una pérdida severa de dígitos significativos.
111 Eventualmente, conforme h -> O+ , los valores de F1 y de F2 serán idénticos en la
! (/;) = H!"'c1;1) +f"'c1;2)J.
448 Capítulo 7 Diferenciación e integración numérica 7.1 Diferenciación numérica y extrapolación de Richardson 449

máquina, y como valor de la derivada aparecerá un cero. Esto tiene lugar en k = 26. La fórmula de diferenciación final, incluido el término de error, queda como:
En computadoras con diferente longitud de palabra este tipo de comportamiento aparece
para distintos valores de k. 111
IIcx.x-x¡).
n n
!'(Xa.) =¡=Jex¡)ff<x.x) + (n+l /(n+l)<s,J
1 c11)
,=O J=O
La diferenciación numérica de funciones que sólo son conocidas empíricamente es j,;,,.
un procedimiento muy riesgoso, debido a que los errores en los datos serán magnificados Esta fórmula es particularmente adecuada para los casos en que los nodos no están
por el proceso. Esto se puede observar, por ejemplo, en la ecuación (8) . Si se determinan distribuidos uniformemente.
con precisión los puntos de muestra x ± h, mientras que los valores de las ordenadas
f (x ± h) permanecen inexactos, los errores en las ordenadas se multiplicarán por 1/(2h). Ejemplo 3 Muestre explícitamente la expresión que adopta la ecuación (11) en los casos en que
Dado que h será pequeño, la influencia que puedan tener los errores será grande. (Este n=2 ya.=l.
fenómeno no sucede en la integración numérica.) Así, la diferenciación numérica de Respuesta En este caso las tres funciones cardinales para la interpolación de Lagrange son:
datos empíricos debe evitarse o llevarse a cabo con el mayor de los cuidados.
lo (x-x¡) (x-x2)
(x) =
Diferenciación vía interpolación polinomial (xo-x¡)(xo-x2)
(x )
La interpolación polinomial puede utilizarse como punto de partida de un procedi­ Í¡(x) = -.xo (x-x2)
(x¡-Xo)(X¡-X2)
miento general para efectuar integraciones y diferenciaciones numéricas. Suponga que
contamos con n + 1 valores de una función! en los puntos Xo, x 1, .. . , Xn. Un polinomio (x-Xo)(x-X¡)
f2(x) = .
que interpole aj en los nodos x; puede representarse en la forma de Lagrange que co­ (X2 -Xo)(X2 - X¡)
rresponde a la ecuación (9) de la sección 6.1. Al incluir el término de error que aparece Sus derivadas son:
en el teorema 2 de la misma sección obtenemos: 2x-x¡-x2
f�(x) =
(xo-x1)(.xo-x2)
f (x) =tf(x¡)Í¡(x) + (n: 1 /(n+l)(sx)w(x). (10) 2x-XQ - X2
f�(x) =
,=O (X¡-Xo)(X¡-X2)
2x-XQ - X¡
IJ7
En este caso hemos tomado w(x) = =0(x-x;). Derivando los términos que aparecen f�(X) =
(x2-Xo)(xz-x¡)
en la ecuación (1O) llegamos a: Calculando su valor en x1 obtenemos:

º _ X¡ -X2
J'(x) =tf(x;)f((x) + ( : /(n+l\sx)w'(x) + : w(x)-ff¡n+l)(sx). t'o(X¡) -
n 1 (n 1)! (Xo -x¡)(xo-xz)

º 2x¡ -XQ -X3


,=O
t¡' (X¡) -
Si x es uno de los nodos, digamos x =Xa., la expresión anterior se simplifica, dado que (x¡-xo)(x¡-x2 )

w (Xa.) =O, y el resultado es º' (X¡) - _ X¡ -XQ


(x2-.xo)(x2-x¡)
t2

n 1 Por ende, la fórmula de diferenciación numérica, incluido el término de error, es:


J'(Xa.) =¿f (x;)f( (Xa.) + ( n+l)(s,. )w'(Xa.).
n + 1)/
X¡-Xz
f (x¡) =f (xo)
.
,=O 1

(xo-x¡)(xo-x2)
Si se calcula w' (Xa.) , esta ecuación puede a su vez ser objeto de una ulterior simplificación. 2x¡-Xo-X2
Para probarlo observemos que +f(X¡)
(x¡-Xo)(x¡-xz)

X¡-Xo
+ f(x2) (12)
¿ IT<x-xj)
n n
así que (x2-.xo)(x2-X¡)
w' (x) = w'(Xa.) = TI(Xa.-xi).
i=O j=O
fr'i
j=O
+ t1 111(Sx1)(X¡-Xo) X¡-Xz)
( 111
450 Capítulo 7 Diferenciación e integración numérica 7.1 Diferenciación numérica y extrapolación de Richardson 451

Ejemplo 4 Si en el ejemplo 3 se toman nodos uniformemente espaciados ¿cuál es la fórmula que se Escriba la ecuación (15) reemplazando a h por h/2:
obtiene?
L = q,(h/2)+a2 h2 /4 + �h4 / 16+a5h6 /64 + · · .. (16)
Respuesta Tome xa = x1 - h y x2 = x1 + h. De la ecuación (12) obtenemos (con x = x1):
El término principal a2 h2 en la serie correspondiente al error puede eliminarse recu­
J'(x) = f(x-h) ( ;; ) + f(x+h) ( � )-if'"(�) h 2
• rriendo a las ecuaciones (15) y (16), multiplicando la última por 4 y restándole la primera
2 He aquí el resultado de este proceso:
Ésta es idéntica a la ecuación (8) que se dedujo antes. 11 L = q,(h) + a2 h2 + �h4 + a6 h6 + · · ·
4L = 4q,(h/2)+a2h2 + �h4/4 + �h6/ 16 + · ··
Extrapolación de Richardson
3L = 4q,(h/2)-q,(h)-3a 4 h4/4-15�h6/16-..·.
Mostraremos ahora cómo puede usarse, para obtener más exactitud en algunas
fórmulas numéricas, un procedimiento conocido como extrapolación de Richardson. Entonces,
Considere las ecuaciones (5) y (6), a las que se les han añadido términos de orden 4 1 4 6
superior. Suponemos que f(x) está representada por su serie de Taylor: L = q,(h/2)- q,(h)-a4h /4-5a6h /16 -.... (17)
3 3
La última ecuación incorpora el primer paso de la extrapolación de Richardson. Muestra,
001 además, que una simple combinación de q,(h) y de q,(h/2) proporciona una estimación
f(x+h) = "-hk¡(kl(x) (13)
L,k!
k=O de L con una precisión de O(h4).

f(x-h) = ¿ k!1 (-llh ¡(kl(x).


00
k
( 14) Ejemplo 5 Realice de nuevo el cálculo del ejemplo 2, incorporando en esta ocasión la extrapolación
de Richardson.
k=O
Respuesta Un algoritmo adecuado es el siguiente:
Si se resta la segunda ecuación de la primera, todos los términos con un valor par de k
se cancelarán, con lo cual
f(x) := tan- 1 (x)
2 2 input a;-./i;h;-l;M;-30
f(x + h)-f(x- h) = 2hf'(x) + -h3J"'(x) + -h5'f(51(x) + ...
3! 5! for k = O, 1, ..., M do
Un reacomodo de términos nos lleva a: dk;- [f(a + h)-f(a-h)] /(2 h)
h;-h/2
' f(x+h)-f(x-h)
f (x) - -[.!._h2¡(3l(x) + .!._h4¡(5l(x) + .!._h6f7)(x) + . . ·] . end
2h 3! 5! 7!
for k = 1, 2, ..., M do
Esta ecuación tiene la forma: rk;-dk + (dk-dk-1)/3
end
L = q,(h) + a2h2 + �h4 + a5h6 + · · ·, (15) output [k; dk, rk : O � k � M].

donde L representa a f'(x) y q,(h) a la fórmula de diferenciación numérica (4). El A continuación se muestran algunas líneas de los resultados obtenidos:
procedimiento numérico está diseñado para calcular el valor de L. La función q, es tal
que q,(h) puede calcularse para h > O pero no para h = O. Por ello, en nuestro intento
k 4 �
2 0.337 1 9385 0.3333 3480
por determinar el valor de L, sólo podemos hacer que h tienda a cero. Para cada h > O,
4 0.3335 7477 0.3333 3364
el error es proporcionado por la serie de términos a2 h2 + a4 h4 + · · ·. Suponiendo que
8 0.3333 2 825 0.3333 257 1
a2 ;1: O, observamos que el primer término, a2 h2 , es mayor que los demás cuando h
16 0.3320 3125 0.3313 8022
es suficientemente pequeña. Debemos por lo tanto buscar una manera de eliminar el
26 0.0000 0000 0.0000 0000
término dominante a2h2 • Nuestro análisis depende exclusivamente de la ecuación (15)
y se puede utilizar en otros procedimientos numéricos;en particular, en la sección 7.4 Una comparación entre estos datos y los del ejemplo 2 muestra que se han obtenido dos
se utiliza conjuntamente con la regla del trapecio. dígitos más de precisión.
45 2 Capítulo 7 Diferenciación e integración numérica 7.1 Diferenciación numérica y extrapolación de Richardson 45 3
El ejemplo que se acaba de ofrecer resulta artificial, en tanto que ya conocemos 2. Calcule valores adicionales mediante la fórmula
el resultado correcto, y estamos utilizando este conocimiento para determinar qué valor
de la columna tres es el más exacto. En una situación real contaríamos el número de 4k 1
cifras significativas que se han perdido durante el cálculo de d k. Resulta obvio que rk D(n, k) = _ D(n, k-1)- k _ D(n-1, k -1). (19)
4k 1 4 1
no puede tener más cifras significativas que dk . La moraleja en este caso es que NO
se puede suponer que rk aumenta en precisión conforme k aumenta indefinidamente de En este caso k = 1, 2, ..., M y n = k, k + 1, ..., M.
valor. 1111 Observe que D(O, O)= $(h), D(l, O)= $(h/2), y D(I, 1)= 'l'(h). Las cantida­
des D(n, 1) constituyen los elementos de la ecuación (17). De manera similar, D(n, 2)
Probablemente se le ha ocurrido al lector que lo que se hizo con la ecuación (15) corresponde a la ecuación (18), y así sucesivamente. A partir de nuestras hipótesis y
puede hacerse también (con las modificaciones adecuadas) con la ecuación (17). En cálculos es evidente que:
efecto, y en este caso el procedimiento es el siguiente. Tome D(n, 0) = L + O(h2)

ljl(h) = (4/3)$(h/2)-(l/3)$(h), D(n, 1) = L + O(h4)

en la ecuación (17). Entonces D(n, 2)= L + O(h6)


D(n, 3) = L + O(h8).
L = 'l'(h) + b4 h 4 + b5h6 + · · ·
El resultado general, que se demuestra en el siguiente teorema, es:
L = ljl(h/2) + b4 h 4/16 + b6 h6/64 + · · ·.
D(n, k-1) = L + O(h2k ) cuando h-+ O.
Ahora
L = 'l'(h) + b4 h 4 + b5h6 + · .. En este momento nos permitimos enfatizar que este análisis se puede utilizar en
16L = l61j1(h/2) + b4 h + b5h /4 + · · ·
4 6 cualquier proceso numérico que satisfaga la ecuación (15). La ecuación que antecede
a la ecuación (15) sólo proporciona un ejemplo de cómo puede surgir en un proceso
15L = l61j1(h/2)-1j1(h)-3b6 h6/4 -· · ·. numérico específico.
Si la ecuación (15) es correcta, entonces el algoritmo de Richardson es efectivo, en
Entonces, tenemos: el sentido de que las columnas sucesivas en el arreglo de D(n, k) muestran un orden de
16 1 convergencia superior. Este es el contenido del siguiente teorema.
L = -ljl(h/2)--ljl(h)- b5h6/20-· · ·. (18)
15 15
TEOREMA Las cantidades D(n,k) que se definen en el algoritmo de extrapolacióri de Richardson
Se puede repetir el proceso una vez más tomando satisfacen una ecuación de la forma

CjJ(h) = (16/15)1j1(h/2)-(1/15)1j1(h).
D(n, k- 1) = L + ¿Aj k(h/2n)2Í. (20)
en la ecuación (18), de manera que j= k

L = CjJ(h) + c5h6 + cgh 8 + · · ·. Demostración En el caso en que k = 1, verificamos la ecuación (20) usando la definición de D(n , O) y
la ecuación (15):
De forma similar a la anterior encontramos que
D(n, O) = $(h/2n) = L - ¿ a ¡(h/2 ) i.
2
n 2

64 1 j =I
L= -CjJ(h/2)--CjJ(h) -3cah s/25 2 -· · ·.
63 63 Entonces podemos tomar A¡1 = -a2j.
De hecho, resulta que se puede efectuar cualquier número de pasos con el fin de A continuación utilizamos la inducción sobre k. Suponemos que la ecuación (20)
es correcta para algún k -1, y sobre esta base procedemos a demostrar que también es
obtener fórmulas con una precisión cada vez mayor. A continuación se muestra el
algoritmo completo que permite M pasos de la extrapolación de Richardson. correcta para el caso k. De las ecuaciones (19) y (20) tenemos que
l. Elija un valor conveniente de h (digamos h= 1) y calcule
h 2j - h 2j
00
4k 00
l
D(n,k) = - - [L+ '\"""' A - - -
k n ] 4k
( ) [L+ '\"""' A1· k (-) ] .
D(n, O) = $(h/2n) para n= O, 1, ..., M. 4 -1 ¿ ' 2n-l
k
¿ J, 2 -1
i= k j=k
454 Capítulo 7 Diferenciación e integración numérica Z J Diferenciación numérica y extrapolación de Richard.son 455

Esta expresión se puede simplificar y concluir que: Respuesta Se muestran a continuación algunos de los datos de salida que se obtienen al utilizar este
algoritmo en el ejemplo 2.
oo
D(n,k)=L+ ¿Aj,k[4k
4k -4i] h
_ (
)2j
. (21)
l iñ n D(n, O) D(n, 1) D(n, 2) D(n, 3) D(n, 4)
j=k
O 0.39 2 6 991
1 0.348 7 710 0.3341 28 3
Entonces Aj,k+l debería definirse como: 2 0.3371 9 38 0.3333 348 0.3332 819
3 0.334 2 981 0.3333 329 0.3333 328 0.3333 336
4k_4j 4 0.3335 7 48 0.3333 336 0.3333 337 0.3333 337 0.3333 337
A j,k+t = Aj,k[ k_ l ].
4
Observe que este algoritmo proporciona aproximadamente el mismo grado de precisión
Observe que A1:,k+l = O, y por lo tanto la ecuación (21) se puede escribir como: que se obtuvo en el ejemplo 5. Eventualmente también producirá resultados sin sentido
debido a la cancelación por sustracción. 11
D(n, k) = L + L Aj,k+l (h/2 l. n
il
j=k+l
SERIE DE PROBLEMAS 7.1
Las fórmulas correspondientes aD(n, 0) y D(n, k) nos permiten construir el siguiente l. Lleve a cabo con todo detalle la deducción de la ecuación (11).
arreglo triangular
<2. Con el fin de dar una estimación de J'(x), programe el algoritmo que aparece en el texto en
el que se usa repetidamente la extrapolación de Richardson. Ponga a prueba el programa
D(O,O) calculando (i) lnx enx = 3, (ii) tanx enx = sen-1(0.8), y (iii) sen(x2 + ix) enx =O.
D(l,O) D(l,1)
D(2,0) D(2, 1) D(2, 2) <3. Diseñe y ponga a prueba un algoritmo para calcular¡'' (x) utilizando la fórmula (9) junto con
repeticiones del proceso de extrapolación de Richardson.
D(M, O) D(M, 1) D(M, 2) D(M,M) 4. Sea f un polinomio de a lo más grado n. Si se conocen los valores de f en n puntos, ¿se
pueden dar estimaciones confiables de J'(e) o de J:f(x)dx? Sus respuestas dependerán de
Más abajo se presenta un algoritmo que genera este arreglo triangular. En él se e, ay b.
'
alude a una función$ que se debe poner a disposición del código por separado (es decir,
5. Suponga que un proceso numérico se describe como:
mediante un subprograma o procedimiento).

input a ,-y1;h ,- l;M ,- 4 L = �(h) + ¿ ajl'i.


i=l
forn = O,l,...,Mdo
D(n, O) ,_ $(a, h/2n) Explique cómo funciona en esta situación la extrapolación de Richardson. Demuestre para
end este caso un resultado análogo al del teorema que aparece en esta sección.
fork= 1,2,...,Mdo <6. En un caso típico de uso de la fórmula (1), el error de redondeo (debido principalmente a
for n= k, k + 1,...,Mdo cancelación por sustracción) se comportará como a.h-1• Ponga a prueba esta afirmación (y
estime a.) en algunos ejemplos. Para simular los cálculos quizá seria necesario recurrir a un
D(n, k) ,_ D(n, k-1) + [D(n, k-1)-D(n -1,k -1)]/(4k - 1) programa de computadora que use precisión múltiple.
end
7. Para los siguientes casos escriba la forma explícita de la ecuación (11):
end
(a) n =O: ll =O (b) n =1 : ll = O y ll = 1 (c) n = 2: ll =O y ll = 2
output [D(n, k): O � n � M, O � k � n].
8. Con frecuencia la fórmula (9) paraf"(x) se utiliza en la resolución numérica de ecuaciones
diferenciales. Sumando las series de Taylor paraf(x+h) y paraf(x-h), demuestre que el error
Ejemplo 6 Calcule una vez más la derivada de la función del ejemplo 2, utilizando en esta ocasión
el algoritmo de extrapolación de Richardson que se acaba de plantear.
en esta fórmula adopta la forma I:: 2n
1 a2nh . Determine explícitamente los coeficientesª•·
Deduzca también el término de error que aparece en la ecuación (9).
456 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 457

9. Deduzca las siguientes dos fórmulas para aproximar derivadas y además demuestre que 21. Deduzca una fórmula de la forma
ambas son O(h4) exhibiendo los términos de error.
t:' � [A/n+i + Bfn+2+ Cfn+1+ Df,,]/h2.
1
f (x)� [-f(x+ 2h)+ 8/(x+ h) -8/(x - h)+ f(x- 2h)]
I2h En este casofi = f(:xo+ ih).
" 1 22. Deduzca la aproximación
f (x) � [-f(x+ 2h)+ 16/(x+ h) - 30/(x) + 16/(x - h)-f(x-2h)].
12h2
10. Deduzca las siguientes dos fórmulas para aproximar la tercera derivada y sus términos de - 3/(x.) - 4/(Xn-l)+ J(xn-z)
f'(Xn) '""' '
error. ¿Cuál es más exacta? 3xn - 4X -l +Xn-2
n:

111
f (x)� �[f(x + 3h)- 3/(x+ 2h) + 3/(x+h)-f(x)] y demuestre que el término de error es O(h2) conforme h ..... O. En este caso/¡= f(Xo+ ih).

1// 1 c23. (Continuación) Usando esta aproximación genere una fórmula iterativa análoga al método
f (x)� l [f(x + 2h)- 2'f(x + h) + 2/(x-h)-f(x-2h)]. de la secante. Examine su comportamiento numérico en un problema de prueba, y compare
2h los resultados con el método de la secante.
1 l. Siga las instrucciones del problema 10 para las siguientes fórmulas para la cuarta derivada.

/
4l
� � [f(x+ 4h)- 4/(x+ 3h)+ 6/(x+ 2h)-4/(x+ h)+ f(x)]
7.2 Integración numérica basada en interpolación
4l
/ � �[f(x+ 2h)-4f(x + h)+ 6/(x) - 4/(x-h)+ f(x- 2h)].
La integración numérica es el proceso por medio del cual se genera un valor numérico
12. Demuestre que para el caso de la extrapolación de Richardson para la integración de una función sobre un conjunto. He aquí algunos ejemplos de
16 1 integrales que pueden calcularse mediante rutinas de computadoras adecuadas:
D(2, 2) = 'V(h/2)- 'V(h).

12
T5 T5
13. Muestre cómo utilizar la extrapolación de Richardson si se usan x. y x02 en el caso en que (i) e_¡. dx
L = Xn+a¡n-1+a2n-2+a3n-3 + ....
14. Demuestre que
(a) Six.-L = O(n-1), entonces 2x2n-x. -L = O(n-2).
(b) Si Xn - L = O(n- 1 ), entonces x.z -L = O(n-2).
(Ü)
ll sen(xyt!)dx dy

[ [ tan(xy2)dydx
(üi)

1"
(c) Discuta las consecuencias numéricas de las primeras dos partes de este problema. o .2
15. Muestre cómo utilizar la extrapolación de Richardson si
(iv) cos(3cos0)d0.
L = $(h)+ a¡h + aih3 + a5h5 + · · ·.
16. Suponga que L = Iímh-o/(h) y que L - f(h) = C6h6 + c9h9 + · · ·. ¿Qué combinación de Estos problemas de integración no son tratables con las técnicas aprendidas en los cursos
f(h) y f(h/2) proporcionaría la mejor estimación de L? básicos de cálculo. Estas técnicas dependen de encontrar la antiderivada. Por ello, para
e 17. Diseñe y ponga a prueba un algoritmo para aproximar f' y!" y utilice splines cúbicos. encontrar mediante el cálculo elemental el valor de
18. Usando series de Taylor deduzca el término de error para la aproximación
' -3f(x)+4f(x+h)-f(x+2h) [J(x)dx,
/ (X)� .
2h
19. Utilizando la extrapolación de Richardson deduzca una fórmula de diferenciación numérica
de orden h4 para debemos primero encontrar una función F con la propiedad de que F' = f. Entonces
resulta que
f(x+h) -J(x-h) _ 'i..¡m h
/(x) = (x)- �¡{Sl(x)- .... [f(x)dx = F(b)-F(a).
2h 6 120'
4
Diga cuál es el término de error de orden h •
Por ejemplo,
r4 x2dx = !x3ii = t4 -f = 21.
20. Usando desarrollos en serie de Taylor deduzca el término de error para la fórmula:
4
3
¡"(x) � ¡;i.1 íj(x) - 2/(x+ h)+ J(x+ 2h)]. }¡
458 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 459

La función F dada por F(x) = (l/3).x3 es una antiderivada de la función! dada por Ahora, como se mencionó con anterioridad, simplemente escribimos
r.
f(x) = Existen muchas funciones elementales que no poseen antiderivadas sencillas.
Un buen ejemplo de ellas es f(x) = ¡/. Una antiderivada de esta función es:
[f(x) dx � [ p(x) dx = '[,J(x;) [ l;(x) dx.
¿ -=-:-, ...
00 ?'+1 a , a i=O a
F(x) =
k=O De esta manera obtenemos una fórmula que se puede utilizar para cualquier f, y que
tiene la siguiente forma:
(Para saber algo sobre el origen de esta expresión vea la ecuación (3) de la sección 6.7.)
Una estrategia muy poderosa para calcular el valor numérico de la integral [f(x) dx � '[,AJ(x;), (3)
a i=O

[f(x)dx, (1) donde


A; = f.\(x) dx.
consiste en reemplazar f por otra función g que aproxima a f de manera adecuada y es
fácil de integrar. En este caso simplemente nos decimos que a partir de que f � g, se Si los nodos están uniformemente espaciados, una expresión como la que aparece en (3)
deduce que recibe el nombre de Fórmula de Newton-Cotes.
[f(x) dx � [ g(x) dx.
Regla del trapecio
En este momento debería ocurrírsele al lector que los polinomios son buenos candidatos
para el papel de g y, de hecho, g puede ser un polinomio que interpola a f en cierto El caso más sencillo ocurre cuando n = 1 y los nodos son.to = a, x1 = b. Entonces
conjunto de nodos. Es evidente que hay otras formas de obtener una aproximación los polinomios fundamentales para la interpolación son
polinomial de f, por ejemplo, truncando una serie de Taylor. Una vez más, el lector
debería recordar lo que se hizo en este sentido en la sección 6. 7. Por ejemplo, b-x x-a
lo<
x) = b-a l x)=
¡( b-a
·

1 1�
¡ l " 2k n
1
=
x
dx � dx Y como consecuencia de lo anterior,
¡- k! � (2k+ l)k!"
Sin embargo, es deseable tener procedimientos generales que sólo requieran evaluaciones Ao = [ lo(x) dx = !Cb-a) = [ l¡(x) dx = A¡.
del integrando. Los métodos basados en la interpolación satisfacen este deseo. También
se puede recurrir a los splines para interpolar af , y aprovechar que las integrales de éstos
son fácilmente calculables. La fórmula de cuadratura correspondiente es

Integración vía interpolación polinomial


J
tf(x) dx
b-a
� --[J(a)+f(b)].
2
.
Pasamos ahora a ocuparnos de la interpolación polinomial. Suponga que deseamos
calcular la integral que se muestra en (1). Podemos elegir nodos xo, x 1, ••• , x. en [a, b] Esta expresión se conoce como regla del trapecio. Proporciona un resultado exacto
e iniciar un proceso de interpolación de Lagrange, como se hizo en la sección 6.1 . para todas lasf E IT1 (es decir, para los polinomios de grado a lo sumo 1). Más aún, su
Definamos término de error es
n X-Xj
1
= - (b - a)3/" (�).
l;(x)
IT
j=O
x; -Xj
(O� i � n). 12
j;oi donde � E (a, b). Este término se puede calcular integrando el término de error de la
aproximación polinomialf(x)-p 1(x) = J"(�.)(x-a)(x-b)/2, y utilizando el teorema
Éstos son los polinomios fundamentales de interpolación. El polinomio de grado � n del valor medio para integrales. En la sección 7.4 volveremos a encontrarnos con la
que interpola a f en los nodos es: regla del trapecio, donde aparece como parte del método de integración de Romberg.
n Si en el intervalo [a, b] se hace una partición como la siguiente:
p(x) = ¿f(x;)l¡(x). (2)
i=O a= Xo < X¡ < · · · < Xn= b,
460 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 461

entonces se puede aplicar la regla del trapecio a cada uno de los subintervalos. En este Método de los coeficientes indeterminados
caso los nodos no se encuentran necesariamente espaciados de manera uniforme. Es así
como se obtiene la regla del trapecio compuesta, A partir de la manera como se dedujo la fórmula (3) vemos de inmediato que es
exacta para todos los polinomios de grado � n. Por otra parte, suponga que se nos
rb f(x)dx = t' proporciona la fórmula (3) y se nos dice que es exacta para todos los polinomios de
n
(x)dx grado � n. ¿Es correcta la siguiente ecuación?
la � lx;_/
n
l A; = ¡\(x)dx.
::::: ¿(x; -x;-1)[f(xH)+f(x;)].
2 i=I
La respuesta es Sí, y lo constatamos a partir del hecho de que la fórmula (3) debe integrar
(Se genera una regla compuesta cuando se aplica una fórmula de integración sobre correctamente a cualquier fj. Por ende,

¡
un intervalo a cada uno de los subintervalos en que se ha dividido el intervalo.) Tam­
bién aparece la regla del trapecio compuesta si se sustituye al integrando por un spline
¿ A;ej(x;) = A .
b n

interpolante de grado 1; es decir, por una línea quebrada. fj(x)dx =


Con el espaciamiento uniforme generado por h = (b -a)/n y x; =a+ ih, la regla
ª i=O
j

ºif·
del trapecio compuesta adopta la forma: Obviamente, en este caso hemos utilizado dos propiedades esenciales de los polinomios

1 n-1
fundamentales: que fj es un polinomio de grado � n y que f;(xj) =
b
Las observaciones que acabamos de hacer nos permiten llegar a fórmulas como la
f(x)dx::,::; [!(a)+2 ¡=1ca + ih)+ f(b)],
a i=l
(3), mediante el llamado método de coeficientes indeterminados. Para ilustrarlo deduz­
camos la ecuación (5) utilizando este procedimiento. Buscamos una expresión como la

1 n
siguiente:
b
f(x) dx::::: h; "f(a + ih), ( 4) [f(x)dx::::: Aof(O)+A¡f(f)+Azf(l),

donde la doble comilla en la sumatoria indica que el primer y el último término de la suma que será exacta para todos los polinomios de grado � 2. Usando como función de prueba
deben dividirse entre dos. El término de error para la regla del trapecio compuesta es: los polinomiosf(x) = 1, x, y x2, obtenemos, en ese orden:

- � (b - a)h2 f" (1;),


1 1= [c1x =Ao+A1+A2

donde 1; E (a, b). Se obtiene sumando el término de error correspondiente a cada


intervalo y usando el hecho de que existe un punto 1; en [a, b] para el cual f"(1;) = ! =[ xdx = fA1 +A2
(1/n) I:7=J"(1;;), donde!;; E (x;_1, x;) y (1/n) = (b-a)/h; es decir, el valor promedio.

Ejemplo 1 Si en el procedimiento de Newton-Cotes tomamos n = 2 y [a, b] = [O, l], obtenemos la


f= [rdx= !A1+A2.

i.
fórmula
i,
La solución de este sistema de tres ecuaciones simultáneas es Ao = t, A 1 = y A2 =
[!(x) dx::::: gf(O)+ if<f)+ t!O). (5) Ya que la fórmula es lineal, dará entonces lugar a valores exactos de las integrales para
cualquier polinomio cuadrático de la formaf(x) = c0 + c1 x+ c2x2•
Esta fórmula se puede obtener calculando primero los tres polinomios fundamentales
f,
para los nodos O, l. Éstos son:
. Regla deSimpson
f
lo(x) = 2(x - )(x - l) f1 (x) = -4x(x -1) fz(x) = 2x(x - !). Cálculos similares para un intervalo arbitrario [a, b] nos llevan a la conocida regla
deSimpson:
rb f(x) dx::::: b-ar
[
Entonces ª+b
- - (a)+ 4f ( - - ) + f(b)] .
Ao = fo(x)dx = i, la 6 { 2
(6)
A partir de la manera como se dedujo sabemos que la regla de Simpson es exacta para
y así sucesivamente. 11 todos los polinomios de grado � 2. También es, inesperadamente, exacta para todos los
462 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 463

polinomios de grado� 3. (Véase el Prob. 3.) El término de error asociado a la regla de Con el fin de evitar que los términos se repitan, deberemos efectuar los cálculos corres­
Simpson es pondientes al lado derecho de la ecuación, según se indica a continuación:
- 0 (b - a)5¡{4J(1;) , n/2 n/2
9 h
para algún 1; E (a, b). El proceso de derivación de este término de error no se origina en (¡(�)+2 p(x2¡-2)+4 t?(xz;_¡)+ f(xn)]
3
una integración directa del término de error mencionado en el teorema 2 de la sección 6.1.
En lugar de ello procedemos como sigue. Si h = (b - a)/2, la fórmula de integración El término de error para esta fórmula es
numérica adopta la forma:
1
1
a
a+2h
f(x)dx;::;;
h
3 [J(a)+4f(a+h)+f(a+2h)].
para alguna 1; E (a, b).
- 180
(b - a)h4'f(4) (1;),

Usando el teorema de Taylor que presentamos en la sección 1.1, podemos escribir el


lado derecho de la expresión como: Fórmulas de integración general
l
2hf(a)+ 2h J'(a)+ �h
2 3
J"(a)+ �h J'"(a) + 3 OO
4
h ¡( \a)+ ... 5 4 El procedimiento que condujo a las fórmulas de Newton-Cotes se puede utilizar
3 3 · 5! para producir fórnulas de integración más general del tipo
Hagamos ahora:
F(x) = [f(t)dt. 1b
ª
f(x)w(x)dx;:,;; ¿A;J(x¡),
n

i=O
El teorema fundamental del cálculo nos indica que F' = f, y recurriendo al teorema de donde w puede sercualquierfanción de peso. La única modificación necesaria consiste
Taylor podemos escribir el lado izquierdo en la regla de Simpson, como F(a+ 2h) o en reemplazar la ecuación (3) por
32
2hf(a)+2h J'(a)+ �h J"(a)+ �h4j"'(a)+ h / l(a)+ ...
5
A¡ = [ l¡(x)w(x)dx.
3 4
2
3 3 5!

l
Combinando estos dos desarrollos obtenemos
a+2h h 1 5 4
f(x)dx = - [f(a)+4f(a + h)+ f(a+ 2h)] - -h
W
¡< l(a) - ·.·,
Esto se ilustra en el siguiente ejemplo.

Ejemplo 2 Encuentre una fórmula


a 3
lt
de donde se desprende él término de error.
Con frecuencia se utiliza una regla de Simpson compuesta usando un número par
de intervalos. Sean un número par y tomemos:
l _/
1
(x)cosxdx""Ao f(-43 1t)+A¡ f(- n)+Azf(41 1t)+A 3 f(43 1t),
4
que sea exacta para polinomios de grado tres.
X¡=a+ih h=(b -a)/n ( � i� n).
O Respuesta Resulta obvio que un polinomio de grado tres es una combinación lineal de los cuatro
monomios 1, x, x2 , x3. Por esta razón podemos determinar los coeficientes sustituyendo
Entonces,
f(x) = xj (0� j� 3) y resolviendo el sistema de cuatro ecuaciones lineales resultante.
X4 f(x)dx + ·· ·+ r- Í(x)dx Por simetría, Ao = A3 y A1 = A2 ; con ello el trabajo se simplifica:
l f(x)dx =
1'' f(x)dx +
1
b
J,,_,
x,
• .ro
0= 1" lcosxdx = 2Ao+2A1

I: 1
n/2 Xz,
= J(x)dx.
1-:
-

i=l xu-z -41t = x2cosxdx = 2Ao(!n)2 +2A1 (¡n)2.


lt

Al aplicar la regla de Simpson ( 6) en cada uno de los subintervalos se obtiene la siguiente


expresión: La solución es A1 = A2 = -Ao = -A3 = 4/n, y la fórmula resultante es

1 ª
b
f(x)dx;::;;
h
n/ 2
¿V(x2¡-2)+4f(x2¡-1)+J(xu)].
3 i=l l 4
_lt (x)cosxdx"" [-J(-!n)+ f(-±n)+ J(¡n) - J(!n)J
/ ;;
1111
464 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 465

Cambio de intervalos Como consecuencia,


A partir de una fórmula para la integración numérica en un intervalo podemos
deducir una expresión para cualquier otro intervalo mediante un cambio de variable
lineal. Si lá primera fórmula es exacta para polinomios de un cierto grado, lo mismo

f(x)dx-¿AJ(x;) =
b n

i=O
l!
(n+ )
1

¡<n+l) (�z) II<x-x;)dx.
b n

i=O
(11)
será cierto para la segunda. Veamos cómo se lleva ésto a cabo.
Suponga que se cuenta con una fórmula de integración numérica:

t
Si lfn+ll(x)I � M en [a, b], entonces

[f(t) dt � A¡f(t¡).
e i=O
(7)
1
1 a
f(x)dx-Í:AJ(x;)
b n

i=O
I
� --
M

(n + 1).
1
1 ITlx-x;jdx.
b•

a i=O
(12)

todos los polinomios de grado � m. Si se necesita una fórmula para algún otro intervalo,
No nos importa el origen de esta fórmula. Sin embargo, supongamos que es exacta para
Se sabe que la elección de nodos que hace que el lado derecho de esta desigualdad sea
entonces A.(t) recorrerá [a, b]. La expresión explícita de la función A. es
digamos [a, b], definimos primero una función lineal A. de t, tal que si t recorre [e, d], tan pequeño como se quiera es:

b-a ad-be a+b b-a


x·=--+--cos [--]
n+2
(i + l)n
d-c d-c
A.(t) = -t + --. (8) ' 2 2 (O� i � n).

Por otra parte, en la integral


lf(x)dx,
Si el intervalo es [-1, l] estos nodos adoptan la forma simplificada:

X¡ = COS [
hacemos el cambio de variable x = A.(t). Entonces dx = A.1(t) dt = (b - a)(d - c)- 1 dt,
(i + l)rt
] (O� i � n).
(n + 2)
y por lo tanto tenemos:

b _ a (i.- (b)=d
Éstos son los ceros de la función:
f(A.(t)) dt
l f(x)dx =
1

d _ e Ji.-,(a)=c Un+1(x) =
b
sen[(n + 2)9]
(x = cose).
a

b•-a'°'
sene (13)
AJ(A.(t;)).
� d - e¿
n

La función Un+I se conoce como polinomio de Chebyshev de segundo tipo. Tal como se
definió en (13), Un+I (x) no es un polinomio mónico; es decir, su coeficiente principal no
í=O

es l. De hecho, el coeficiente de x<•+l) en Un +l es 2•+1. Por tanto,


b-a " a ad - be
Por ende,

l ª
b

d-c i=O d-c


'°'
f(x)dx � -¿AJ -t¡ + --) .
d-c
(b - (9)
z-(n+l) Un+l = (x - Xo)(x - X¡ ) · · · (x - Xn), (14)
Observe que, ya que A. es lineal,f(A.(t)) es un polinomio en t sif es un polinomio y
con x; = cos[(i + l )rt/(n + 2)). Efectuando el cálculo resulta:
de grado m. En el caso de la regla de Simpson, este procedimiento da lugar a la ecuación
los grados son los mismos. En conclusión, la nueva fórmula es exacta para polinomios

(6) como consecuencia de utilizar A.(t) = (b - a)t + a en la ecuación (5). [ l(x - Xo)(x - X¡)··· (x - Xn)I dx = 2-n .
1
(15)
}_¡

Entonces, con estos nodos y los coeficientes adecuados A;, se obtiene


Análisis de �rror
Para analizar el error comprendido en la fórmula de integración numérica (3), uti­

(x)dx- AJ )
lizamos el término de error asociado con la interpolación polinomial. Recuerde, de la
11-> ta (x; I � , �"-
sección 6.1 (Ec. (13)), que si p es el polinomio de grado � n que interpola a f en
x0, :€¡, • . • , xn, y si¡<n+l) es continua, entonces:
. (16)

f(x) - p(x) = (n+l\�z) TI(x - X¡). TEOREMA Entre los polinomios mónicos p de grado n, aquel para el cual J� ¡ w(x)I dx adopta su
"
(n +
1
mínimo valor es 2-• u•.
1/ (10)
i=O
7.2 Integración numérica basada en interpolación 467
466 Capítulo 7 Diferenciación e integración numérica

SERIE DE PROBLEMAS 7.2


Demostración Primeramente demostramos la relación de ortogonalidad:
J;
el. Escriba un programa de computadora que calcule e-i' dt, sumando una serie de Taylor
[ Um (x)sgn[Un (x)] dx = O (O� m< n). apropiada hasta que los términos individuales estén por debajo de 10-s en magnitud. Pruebe
1 su programa calculando los valores de esta integral para x= O.O, 0.1, 0.2, .. ., 1.0.
Denotemos con I a esta integral. Hagamos el cambio de variable cos 0 = x para obtener 2. Deduzca la fórmula de Newton-Codes para fo1/(x)dx, usando como nodos a O, l, �. l .
[" sen(m+1)0 sen(n+1)0 3 . Demuestre (sin u tilizar el témrino de error) que la regla de Simpson, ecuación (6), sirve para
1= sgn[ } sene de integrar correctamente todos los polinomios cúbicos.
Jo sene sene
4. Mediante un cambio adecuado de variable, obtenga la fórmula (6) partiendo de la (5).
n k+l'�
= 2)-ll J( sen(m+1)0d0 $ = 1t/(n+1) 5. Compruebe que la siguiente fórmula es exacta para polinomios de grado� 4:
k=O k�$

lf(x)d x � 'ef¡j [7/(0)+32/(!)+12/(f)+32/(!)+7/(1)].


= (m+1)- 1 ¿(-ll+1 [cos(m+ l)(k+1)$ -cos(m+ l)k$].
J:f(x)dx que sea exacta
k=O
6. A partir de la fórmula del problema 5, obtenga una expresión para
Sea a. = (m +1)$ + 1t. Entonces (usando Re para denotar la parte real) se obtiene: para todos los polinomios de grado 4.
7. Calcule un valor aproximado de In 2 aplicando la fórmula del problema 5 a:
(m+1)/ = ¿[cos(k+ l)a. + coska.]
¡ dt
1
k=O
Jo i+l·
= ne {¿[i:t(k+l) + e iak
]}
Compare su respuesta con el valor correcto y calcule el error.
{
k=O
¿a(n+2) - iª + eian -1 1
I
8. Calcule fo dx con ocho decimales de precisión usando la serie que aparece en el texto.
= ne _
e111 -1
}
c9. Diseñe un programa de computadora que haga un cálculo aproximado de J:f(x) dr mediante
'Re{(eia - l)(eia(n+2) -eia + e -1)} J: S(x)dx, donde S es el spline cúbico natural que tiene nudos en a+ih, e interpola a/ en
ian
= ia
le -11 2 estos nudos. En este caso O� i � n y h= (b -a)/n. Empezando con la ecuación (7) de la
sección 6.4, obtenga primero una fórmula para

¡,,
En este caso el numerador es

Re { /•n - eia(n+2l} = cos na. -cos(n+2)a. S(;c)dx,



= cos[(n+ l)a. -a.] -cos[(n+ l)a. + a.]
a continuación escriba el subprograma que realiza este cálculo. Someta a prueba su código
= cos(kit -a.) -cos(kit+ a.) = O, usando estas bien conocidas integrales:

donde k = m+ n+2. Para completar la demostración tomemos un polinomio mónico p


de grado n. Se puede expresar como:

7t o
1
(a) - (1+i)-1 dx (b) �
3
l x-1dx.

p = 2-n un+an 1Un 1 + · · ·+aoUo. En ambos ejemplos utilicen= 4, 8, 16. (Véase el Prob. 16 de la Sec. 6. 4.)
- -
Por lo tanto, si usamos la relación de ortogonalidad obtenemos: 10. Encuentre la fórmula
¡ 1 ¡ [t(x)dx � Aof(O) +A¡f(l),
{ IPldx� ¡ psgn[Un]dx=Z- { Unsgn[Un]dx
n

J_¡ }_¡ J_¡


que resulta exacta para todas las funciones de la forma/µ)= ae'+b cos(roc/2).
11. Encuentre una expresióu de la forma
1
= z-n ¡ IUnl dx 11
J_¡
El tema de la integración numérica se puede estudiar más a fondo consultando los
textos de Davis y Rabinowitz (1984], Krylov (1962], y Ghizetti y Ossiccini [1970].
¡z. f(x)dx =A ¡f(O) +A2/(1t),
468 Capítulo 7 Diferenciación e integración numérica 7.2 Integración numérica basada en interpolación 469

que sea exacta para cualquier función que tenga la forma lfn+1l(x)/ < M en [O, l]. Si no se conoce nada acerca de la posición de los nodos ¿qué cota
superior se puede dar para el error? ¿Puede e ncontrar la mejor cota superior?
f(x) =a+ bcosx. 19. Determine la regla de integración numérica compuesta que se apoya en la sencilla regla del
Demuestre que la fórmula resultante es exacta para cualquier función de la forma rectángulo del lado derecho

. [t(x)dx�f(l).
f(x) = ¿[ak cos(2k+ l) x + bk sen kx].
Suponga un espaciamie nto desigual dado por a = xo < x1 < ... < x. = b.
k=O
20. Deduzca la regla compuesta para J:f(x)dx que se apoya en la regla del punto medio:
1 2 . Utilice la interpolación polinomial de Lagrange para deducir la expresión de la forma:

[1cx)dx �Af(D +B!(�)- l 1


f(x)dx� 2f(O).

Proporcione fórmulas tanto para un espaciamiento uniforme como para uno no uniforme de
Transforme la fórmula anterior en una que sirva para integrar sobre [a, b]. los nodos.
13. Usando el polinomio de grado mínimo que interpola af(x) en x1 y x2, deduzca una fórmula
de integración numérica para
3
( x)
dx.
¡
21. (Continuación) La regla del punto medio sobre el intervalo [x¡_¡,x¡¡.¡J se expresa como:
X/+I
f(x)dx = (Xi+I - X¡-¡)f(x¡).
[J -'i-1
No suponga una distribución uniforme entre los elementos de la partición. En este caso Determine la regla del punto medio compuesta sobre el intervalo [a, b], usando un espacia­
X0 < X¡ < X2 < X¡. miento uniforme con h = (b - a)/n, tal que x¡ = a+ ih para i = O, 1, 2, ... , n (con n
14. Deduzca una fórmula para aproximar par).
2 2 . Determine la regla de integración para J:f(x)dx apoyándose en la regla de cuadratura
lf(x)dx, gaussiana

en términos de f(O),f(2),f(4). Esta expresión deberá proporcionar resultados exactos para


Lf(x)dx�f (-�) +! (�).
todaf en fh. 23. Existen dos fórmulas de Newton-Cotes paran= 2 y [a, b] = [O, !], a saber,
15. Determine valores de A, B, y C que hagan que la expresión

l xf(x)dx� Af(O)+Bf(l)+ Cf(2),


lf(x) dx� af(O)+bf(!)+cf(l)

sea exacta para todos los polinomios de grado tan alto como sea posible. ¿ Cuál es el grado lf(x)dx� a.f(i)+M!J+r!C!J.
máximo?
¿ Cuál es la mejor?
16. Deduzca la fórmula de Newton-Cotes para
24. ¿Existe una expresión de la forma
[f(x)dx,
[f(x)� a.[f(xo)+f(x1)J.
usando polinomios de interpolación de Lagrange con nodos en -2, -1, O . Use este resultado
para evaluar la integral cuandof(x) = sen JtX. que integre correctamente todos los polinomios cuadráticos?
17. Usando una serie, calcule 25. Demuestre que si la fórmula
[º-' ce;x) dx.
Lf(x)dx� tA¡f(x¡) (conn par),
con una precisión de siete decimales.
1 es exacta para todos los polinomios de grado n y que si los nodos están distribuidos simétri­
1
f
18. Nuestra intención es utilizar fo p(x)dx como una aproximación de 0 f(x)dx, donde p es camente alrededor del origen, entonces la fórmula resulta exacta para todos los polinomios
un polinomio de grado n que interpola aj en los nodos XO, X¡, .•• , x. en [O, l]. Suponga que de gradon+ l.
470 Capítulo 7 Diferenciación e integración numérica 7.3 Cuadratura gaussiana 471

26. Suponga que n es par. Muestre cómo se puede calcular, con un núnimo de trabajo adicional, donde
la regla de Simpson compuesta con 2n nodos igualmente espaciados, partiendo del caso en
que se cuenta con n nodos igualmente espaciados. ª = v<5+ v11)112 � o.83249 7487o oo9s2
27. En el ejemplo 2 se utilizó la simetría para simplificar los cálculos. Demuestre que Ao = A3
yA1 =A2. � = v(5 -v11);12 � o.37454 14095 53581.
28. Demuestre que los polinomios de Chebyshev de segunda clase se generan recursivamente
mediante Para obtener estos coeficientes se puede utilizar el método de los coeficientes inde­
Uo(x) = 1 U1(x) = 2x terminados. Además es posible demostrar que la fórmula es exacta para polinomios de
{ U.+1 = 2xU. -U.-1 (n f: 1). grado � 5. También se pueden proporcionar fórmulas más complicadas con coeficientes
29. (Continuación) Demuestre la relación de ortogonalidad idénticos. Como ejemplo citamos la siguiente:
1
1 U.(x)U,,.(x)� dx = 6.,,.rr./2.
-1 1 -I1

n i=I
2' ¡ )
f(x)dx � � ¿F (cos ....:..:_re
2n (4)

30. (Continuación) Demuestre que se satisface la siguiente igualdad entre los polinomios de
Chebyshev de primer y de segundo tipo: T'n = nU.-1. en la que F(x) = f(x)../1 -x2• Esta expresión se conoce como fórmula de cuadratura
31. Señale cuál es el término de error para la regla del trapecio y cuál el de la regla del trapecio de Hermite. Resulta exacta para cierto espacio lineal de dimensión 2n, a saber
compuesta.
32. Llene los huecos que se dejaron cuando se realizó el cálculo de los términos de error para la G = {pw : p E l12n-1} w(x) = ( l -xz)-1/2.
regla de Simpson y la regla de Simpson compuesta.
No parece probable que de utilizar esta fórmula se derive un ahorro en el esfuerzo
computacional. (¿Por qué?) Por otra parte, con sólo n evaluaciones de f tenemos una
7.3 Cuadratura gaussiana fórmula que es exacta en un espacio lineal de dimensión 2n. El afán sistemático de
lograr esta meta nos lleva a las fórmulas de cuadratura gaussiana.
En la sección anterior vimos cómo generar fórmulas de cuadratura del tipo

l a
f(x) dx � t
i=O
A¡f(x¡), ( 1)
Cuadratura gaussiana
La teoría puede formularse teniendo en mente fórmulas de cuadratura ligeramente
más generales, a saber:
n
que dan el resultado exacto para polinomios de grado � n. En estas fórmulas la elección
de nodos Xo, x1, ••• , Xn se hizo a priori. Una vez que se fijaron los nodos, los coeficientes
se determinaron de manera unívoca a partir del requisito de que (1) debe ser una igualdad

bf(x)w(x)dx � ¿A¡J(x¡),
i=O
(5a)

donde w es una función de peso positiva que permanece fija. Naturalmente, el caso
para todaf E 11n.
Es natural preguntarse si una elección de nodos para la fórmula (1) puede ser mejor w(x) =
1 tiene una importancia especial. Supongamos que la fórmula (5a) es exacta
que otra. Por ejemplo, puede haber un conjunto particular de nodos para el cual los paraf E rr•. Como aprendimos en la sección anterior, éste es el caso si y sólo si
coeficientes resultantesA; sean iguales unos a otros. SiA; = e para O � i � n, entonces
n
al usar la ecuación (1) se efectúa un menor número de operaciones aritméticas, ya que
ahora adopta una forma más sencilla:
A; =
1a
b w(x)
IT
X-X·
--1 dx.
X
j=O ¡ -Xj
(5b)

l a
f(x)dx � e ti
i=O
(x;). (2)
j•d

En vista de que se cuenta con n + 1 coeficientes A¡ y n + I nodos X¡, sin que exista nin­
guna restricción a priori sobre ellos, sospechamos que se pueden descubrir fórmulas de
(El efecto es el de reducir el número de multiplicaciones de n+ 1 a l.) Las fórmulas del cuadratura como la que aparece en la ecuación (5a) que resulten exactas para polinomios
tipo (2) existen sólo para n = O, 1, 2, 3, 4, 5, 6, y 8. Se conocen como fórmulas de de grado � 2n + 1. Pasamos a demostrar que, en efecto, esto es cierto.
cuadratura de Chebyshev. He aquí la que corresponde a n = 4: Debemos esta idea a Car! Friedrich Gauss (1777-1855), y consiste en usar la posibi­
lidad de poder variar los nodos para hacer que la fórmula de cuadratura (5a, b) sea exacta
para todos los polinomios de grado 2n+ l. A continuación presentamos el teorema que
1
J_1 J(x) dx � HJ(-a.) + !(-�) +f(O)+f( �) + f(a.)], (3)
nos indica dónde colocar los nodos.
472 Capítulo 7 Diferenciación e integración numérica 7.3 Cuadratura gaussiana 473

TEOREMA 1 Tomemos una función de peso positiva w y un polinomio q distinto de cero y de grado donde
n + 1, que es w-ortogonal a IIn en el sentido de que para cualquier p E IIn tenemos que a= 1/V'J,

l q(x)p(x)w(x)dx = O. (6)
y
l !(�)dx � Aof(Xo)+A¡f(x¡)+ · · ·+A4f(x4 ), (8)
Si Xo, x¡, ..., Xn son los ceros de q, entonces lafórmula de cuadratura (5a) será exacta 1

para todaf E II2n+1· donde

Demostración Seaf E II2n+l · Dividaf entre q, obteniendo un cociente p y un residuo r. Entonces


-Xo = X4 = f V5+2,/l.o!7 � 0.90617 98459 38664
f=qp+r (p, r E IIn).
-X¡ t
= X3 = V5 - 2,/J.of7 � 0.53846 9310105683
Por consiguiente,f(x;) = r(x;). Usando la ecuación (6) y el hecho de que la ecuación
(5a ) es exacta para los elementos de IIn, llegamos a que Xz = 0.0
Ao = � = 0.3(0.7 +5vü.7)/(2+51f0) � 0.23692 68850 56189
[fe,dx = [ rwdx = tA;r (x¡) = tA¡f(x;) 11
a a i=O i=O A¡ = A3 = 0.3(-0.7+51f0)/(-2+51f0) � 0.47862 86704 99366
Resulta que las raíces de q son raíces simples y se encuentran en el interior de\ A2 = 128/225 � 0.56888 88888 88889.
intervalo [a, b]. (En particular son reales y no imaginarias.) Esto se deduce de manera
inmediata del siguiente teorema. Usando los nodos y los coeficientes exactos, podemos calcular estos números con el
grado de precisión deseado.
TEOREMA 2 Sea w una función de peso positiva en C[a, b]. Seaf un elemento distinto de cero de Tanto los nodos x; como los coeficientesA; de muchas fórmulas de integración de
C[a, b] que es w-ortogonal a IIn . Entonces! cambia de signo en (a, b) al menos n + I varios tipos se encuentran en manuales, tales como el de Abramowitz y Stegun [1964].
veces. Las tablas ahí incluidas abarcan valores den desde el 1 hasta el 9, al igual que n = 11, 15,
19, 23, 31, 39, 47, 63, 79, 95. Para integrandos con buen comportamiento se obtiene una
Demostración Como 1 E IIn, resulta que J:f(x)w(x)dx = O, mostrando que f cambia de signo al precisión modesta con sólo efectuar algunas evaluaciones de funciones, usando fórmulas
menos una vez. Suponga que f cambia de signo en sólo r ocasiones, con r � n. Escoja gaussianas, y si se quiere aún más precisión basta con utilizar fórmulas de orden superior.
puntos t, de manera que A continuación presentamos un breve seudocódigo para aproximar los valores de
la integral
a = t0 < t¡ < t2 < · · · < t, < t,+1 = b,
lf(x)dx,
y tal que f sólo tiene un signo en cada intervalo
y que además incorpora la fórmula de integración gaussiana con cinco puntos que se
(to, t ¡ ), (t¡, tz), ... , (t,, t,+1). analizó líneas arriba. En esta ocasión cambiamos los intervalos tal como se describió en
El polinomio la ecuación (9 ) de la sección 7.2 y explotamos la simetría de la ecuación (8 ).

p(x) = IJ(x - t;), input


i=l
Xo +- o
tiene la misma propiedad respecto del signo, y por lo tanto J;j(x)p(x)w(x)dx * O. Ya X¡<-0.53846 93101 05683
que p E IIn, esto es una contradicción. 11
Xz f- Ü.90617 98459 38664
Si la función de peso es w(x) = 1 y si el intervalo es [-1, 1], tenemos la misma Wo <- 0.56888 88888 88889
situación que Gauss investigó. Presentamos dos de las fórmulas relacionadas con este W¡ f- 0.47862 86704 99366
caso, las cuales corresponden a n = I y n = 4:
Wz +- 0.23692 68850 56189
u,- ((b- a)xo +ad - bc)/(d - e:)
L f(x)dx � f(-a) +f(a), (7)
S ,_ wof(u)
474 Capítulo 7 Diferenciación e integración numérica 7.3 Cuadratura gaussiana 475

for i = 1, 2do Convergencia y análisis de error


u,... ((b -a)x;+ad -bc)/(d -c) Pasamos ahora a discutir algunas de las características favorables de las fórmulas
v,... (-(b -a)x¡ +ad -bc )/(d -c) de cuadratura gaussiana
S ,... S + w;[f(u)+f (v)] LEMA En una fórmula de cuadratura gaussiana los coeficientes son positivos y, más aún, su
end J:
suma es w(x) dx.
S,... (b -a)S /(d - c)
outputS. Demostración Fije n, y al igual que en el teorema 1 tome un polinomio q de grado n + l que sea
w-ortogonal a rr•. Los ceros de q se denotan con Xo, x1, ••• , x. y son los nodos de la
El cálculo de los coeficientes A; en una fórmula gaussiana se realiza de la misma fórmula gaussíana (5). Para algunaj fija sea p el polinomio q(x)/(x - Xj) . En vista de
manera que se indicó para el caso de las fórmulas no gaussianas, una vez determinados que P2 es de a lo más grado 2n, la fórmula gaussiana para este caso será exacta. Por
los nodos X¡. A su vez, los nodos son las raíces de un cierto polinomio. Este polinomio consiguiente,
depende de n +1 y lo vamos a denotar con qn+l · El polinomio qn+I queda determinado
b n
O< 1 /(x)w(x)dx = LA;/(x;) = Ajp2(xj).
unívocamente mediante dos condiciones: ª i=O

De lo anterior concluimos que Aj > O.


(i) q.+1 es un polinomio mónico de grado n +1
(ii) qn+l es w-ortogonal a rr•. Ya que la fórmula gaussiana es exacta paraf(x) = 1, entonces
La palabra mónico significa que en qn+I el coeficiente de x-+1 es la unidad. La
condición de w-ortogonalidad significa que l w(x)dx=I:,A;
b
11
a i=O

[ qn+I (x)p(x)w(x)dx = O parap E II•. Un notable teorema debido a Stieltjes asegura la convergencia de las fórmulas gaus­
sianas cuando n --+ oo. Fijando w y [a, b] obtenemos una fórmula de cuadratura
gaussiana para cada n E {O, 1, 2, ...}. Podemos ahora escribirlas como:
Estos son los llamados polinomios ortogonales y son de mucha utilidad en varias
ramas de las matemáticas, razón por la que se sabe mucho acerca de ellos. Tal como se [f(x)w(x)dx � I:,A.¡f(x.;) (n � 0). (9)
dijo en la sección 6.8, pueden generarse mediante un algoritmo recursivo. ª i=O

1, y n =2. TEOREMA 3 Si f es continua en [a, b], entonces las aproximaciones proporcionadas por la ecuación
Ejemplo Encuentre la regla de cuadratura gaussiana cuando [a, b] =[-1, 1), w(x) = (9) convergen a la integral conforme n--+ oo.
Respuesta El teorema 5 de la sección 6.8 nos dice que los polinomios ortogona
les pueden deter­
minarse de manera recursiva, tal como se hizo en el ejemplo 2 de dicha sección. Por lo Demostración Sea&> O. El teorema de aproximación de Weierstrass (teorema 8 de la Sec. 6.1) señala
tanto: que existe un polinomio p para el cual if(x)-p(x)I < e en [a, b]. La n-ésima fórmula
qo(x) =1 gaussiana permite integrar p correctamente para cualquier n tal que 2n excede el grado
de p. Usando desigualdades elementales y el lema anterior llegamos a:
q¡(X) =X
q2(x) =x2 - } l[f(x)w(x)dx-I:,A.¡f(x.;)I
ª
q3(X) =x3 - �X.
i=O

b b n n
� 11 f(x)w(x)dx-1 p(x)w(x)dxl +ILAn;P(Xn;) -LA.J(xm)I
Las raíces O y ± J31s de q 3 son los nodos de la fórmula de cuadratura a a i=O i=O

(-fs) /i).
b n

l x)dx� �f +if(O)+�f ( � 1 lf(x)-p(x)lw(x)dx+Í:A.;lp(x.;) -f(x.;)I


a i=O
/<
b n b
Las constantes 5/9 y 8/9 se pueden calcular usando el método de coeficientes indeter­ �e 1 w(x)dx+e LA m =2e 1 w(x)dx 1
minados. (Véase el Prob. 22.) 11 a i=O a
476 Capítulo 7 Diferenciación e integración numérica 7.3 Cuadratura gaussiana 477

TEOREMA 4 Considere unafórmula gaussiana con su término de error: SERIE DE PROBLEMAS 7.3
l. Tome en la ecuación (2),n = 1, a = O, b= l. Encuentre todos los casos de la fónnula que

1a
b n-1
f(x)w(x)dx = ¿AJ(x;) +E.
i=O
resultan exactos para/ E Il3.
2. Resuelva el problema 1 conn = 2.
'3. Diseñe un programa de computadora para verificar si la fónnula de cuadratura de Hermite,
ecuación (4), conn = 4, es exacta para todas las funciones p(x)(l -x 2F 1 12, donde p E II9•
Para unaf E c ¡a, b] tenemos que Basta verificar la fónnula para las diez funciones de prueba Tk(x)(l- x2 )-112, donde Tk es
2n

el k-ésimo polinomio de Chebyshev definido por Tk(x) = cos(kcos-1 x).


4. Deduzca la siguiente regla de cuadratura gaussiana
b
¡c2n) Ct,) z
(2n)! l
E= a q (x)w(x)dx,

donde a< t,<by q(x) = rr7�1(x - x;). l 1


f(x)dx � A-0/(X-O) + A1f(x1) + A2f(x2) + A3f(x3),

donde
Demostración Según el proceso de interpolación de Hermite (Sec. 6.3) existe un polinomio p de a lo
más grado 2n - 1 tal que:
Ao = A2 = i (1 + ! fii) ¡;, 0.34785 48451 37454
(O ;;;í i ;;;í n - 1).
Ai =A3 = t(1- t/ii) ¡:, 0.65214 51548 62546
w- 4V03) ¡:, o.86113 6311594052
p(x;) = f(x;) p'(x;)=J'(x;)
-xo= x2= v
Para esta interpolación la fórmula de error es:
-X¡ = X3 = Vt(3 + 4V03) ¡:, 0.33998 10435 848456.
f(x) - p(x) = ¡( l(r,(x))q2(x)/(2n)!. (10) 5. Verifique si la ecuación (7) es una fórmula gaussiana correcta.
2n

6. Verifique que los nodos en la ecuación (8) son los correctos.


como se señaló en el teorema 2 de la sección 6.3. De esta expresión se concluye que:
7. Podemos determinar un polinomio q de gradon + 1 que sea ortogonal a rr. escribiendo:
b b
11 2n b
q(x) = x•+l + e¡x" + · • · + Cn+l,
l l
2
a f(x)w(x)dx - p(x)w(x)dx = ( n ! a ¡< ) (C,(x))q (x)w(x)dx.
a
2 )
e imponiendo las condiciones J: q(x)x'w(x)dx = O para O � k � n. Con esto se puede
Utilice ahora el hecho de que p es de a lo más grado 2n - 1 para ver que resolver el sistema resultante den+1 ecuaciones conn+1 incógnitas c1, c2, ..• , Cn+t • Prosiga
con este proceso para obtener qs como se necesita en el problema 4. ¿Considera usted que
éste es un buen camino para obtener q?

1 b n-1
p(x)w(x)dx = ¿A;p(x;) = ¿AJ(x;).
n-1
8. (a) Encuentre una expresión de la forma

L
ª i=O i=O
xf(x)dx ¡;, tA¡f(x;),
Más aún, se puede utilizar el teorema del valor medio para integrales para mostrar que

conn = 1, que sea e;cacta para todos los polinomios de grado 3.


[¡<2n)(C,(x))q2(x)w(x)dx = ¡<2n\t,) [ q2(x)w(x)dx. (b) Repita lo anterior con n = 2 y haciendo que la fónnula sea exacta en II5•
9. (a) Determine valores apropiados de A; y de x; para que la fónnula de cuadratura
Este paso requiere que ¡(2nl(C,(x)) sea continua, lo cual se puede inferir de la ecuación
(1O). La fórmula de error deseada se obtiene haciendo las sustituciones ya descritas. 11
1> 2/(x)dx ¡;,
tA¡f(x;),

Las siguientes son referencias adicionales acerca de la cuadratura gaussiana: Krylov


[1962], Davis y Rabinowitz [1984, 1956], Stroud y Secrest [1966], y Abramowitz y sea correcta cuando/ es cualquier polinomio de grado 3. Usen= l.
Stegun [1956, 1964]. (b) Repita lo anterior para cualquier polinomio/ de grado 5, utilizandon = 2.
478 Capítulo 7 Diferenciación e integración numérica 7.3 Cuadratura gaussiana 479

10. Encuentre una fórrnula de cuadratura 18. Si la fórrnula

¡¡ 2
f(x)dx�c ¿f(x,),
¡O
1

i=O
4

xf(x)dx = ¿A¡J(x¡),

-1 i=O es correcta para todaf E !19 (polinomios de grado 9), ¿qué propiedades tiene el polimonio
q de grado 5 del que x0, xi, ..., x.i son los ceros?
que sea exacta para todos los polinomios cuadráticos. 19. Sí la fórrnula
11. (a) Sí la fórrnula de integración [ (x4 - I)f(x)dx = A/(X-O)+ Bf(x1) +Cf(x2),

l f(x)dx�f(a.) +f(-a.), es correcta para todaf que sea un polinomio de grado ;;,; 5, ¿qué propiedades debe tener el
1 polinomio q cuyos ceros son X-O, xi, x2?
20. ¿Cuál de los siguientes polinomios es ortogonal a II2 en el intervalo [O, l], con función
va a ser exacta para todos los polinomios cuadráticos, ¿qué valor de a. deberá utilizarse? de peso w(x) = !? (í) 1 +x, (ii) x - (iii) x2 - 3x +1, (iv) 35x4 - 60x2 + 32x - 3,
!,
Responda la misma pregunta considerando el caso de los polinomios cúbicos y el de los
polinomios de las forrnas (v) x3 - 3x2+x- l .
21. Encuentre u n polinomio distinto d e cero que sea ortogonal a II2 en el intervalo[-1, l], con
(b)f(x) =a+bx+cx3+dx4 (c)f(x) = a+¿b,x2'-1 +cx2n respecto a la función de peso 1+x2.
i=l
22. Considere una regla de integración numérica de la forrna
12. ¿Para qué valores de a. resulta exacta en II3 la siguiente fórrnula?

[f(x)dx�J(a.)+J(2 - a.).
l/(x)dx�Af (-vi) +BJ(O)+Cf (vi).
(a) ¿Cuál es el sistema lineal que debe resolverse si se utiliza el método de coeficientes
indeterminados para encontrar A, B y C ? Calcule A, B, C
13. Demuestre que sí el intervalo es simétrico respecto del origen y que si w es una función par,
entonces los nodos gaussianos serán simétricos y A, = An-i para O ;;:; i ;;:; n. (b) ¿Cuáles son las tres integrales que deben calcularse para determinar A, B y C mediante
la fórmula de Newton-Cotes? Encuentre A, By C .
14. Demuestre que toda fórrnula de cuadratura del tipo 23. Muestre cómo la regla de cuadratura gaussiana

¡ f(x)dx�tA¡f(x,),
b

a i=O
[t(x)dx�it (-vi) +JJ(O)+if (vi),
es exacta en algún subespacio de C[a, b] de dimensión infinita. puede usarse para calcular J:f(x)dx. Utilice este resultado para determinar el valor de

15. Demuestre el recíproco del teorema 1: [r sent


( a) xdx (b)[ dt.
Teorema: Si 0 o t
[t(x)w(x)dx = tA ,f(x¡), 24. Usando el método de coeficientes indeterminados, y suponiendo dados los valores def(O),
f
J'(-1),J" (1), calcule un valor aproximado de 1 x2J(x)dx. Sufórrnuladeberáproporcionar
valores exactos para toda! en II2.
para todaf E I12n+, entonces el polinomio fl;= (x -x¡) es ortogonal a II. en [a, b] respecto
25. Encuentre A, B, y C de manera que la regla de integración numérica de la forma
0
de,11
16. Determine los coeficientes Ao, Ai, y A 2 que hacen que la fórrnula

l
[ xf(x)dx�AJ(- l )+Bf(O)+Cf(+l),
f(x)dx�Aof(O)+A 1f(l)+Aif(2),
sea exacta para todos los polinomios de grado máximo m. ¿Cuál es el valor de m?
26. Encuentre los valores de A, B, y C usando el método de coeficientes indeterminados en la
sea exacta para todos los polinomios de grado 3. siguiente regla, la cual deberá proporcionar resultados exactos para polinomios de grado 2.
f
17. Usando solamentef(O),f'(-1),f" (1), calcule una aproximación a J(x)dx que sea exacta
para todos los polinomios cuadráticos. ¿Es exacta esta aproximación para polinomios de
grado 3?, ¿por qué sí o por qué no?
¡h-3h
f(x)dx�h[Af(O) +Bf(-h) +Cf(-2h)].
7.4 Integración de Romberg
480 Capítulo 7 Diferenciación e integración numérica 481

27. (Continuación) lCómo puede utilizarse una regla de integración numérica como la que En este caso la doble comilla sobre la sumatoria significa que tanto el primer término
aparece en el problema anterior para obtener una regla que permita resolver una ecuación como el último deben dividirse entre dos.
diferencial ordinaria de la forma siguiente?
Ejemplo 1 Si se toma el intervalo [0, 1], ¿cuáles son las fórmulas explícitas para T(l), T(2), T(4) y
x' =f (t, x) x(to) = .xo. T(8)?

28. Encuentre los coeficientes y los nodos de una fórmula de cuadratura gaussiana que adopta Respuesta Usando la ecuación (2) obtenemos:
la siguiente forma:
T(l) = }f(O) + lf(l)
[ x4/(x) dx � Ao/(.xo ) +A¡f(x1).
T(2) = ±f(O) + }1/(f)J + ±f(l)
29. Demuestre que ninguna fórmula de cuadratura gaussiana con n nodos puede ser exacta en
Il2n.
T(4) = lf(O) +!1/(!)+f(1) + f(i)J+ lJ(l)
30. ¿Qué sucede en la teoría de la cuadratura gaussiana si la función w no es positiva? T(8) = fJ(O)+kl/(k)+f(!)+f(Í) +f(f) +f(Í)
31. Use la información proporcionada en la sección 7.2 para encontrar las fórmulas gaussianas +J(i) +1Gl1+ tJ(l) 11
asociadas al intervalo [-1, 1] con la función de peso w(x) = JI - x2. Los problemas 28 y
29 pueden resultar útiles para resolver esta cuestión. Es evidente que si queremos calcular el valor de T(2n), podemos beneficiarnos del
32. Determine los nodos y los pesos para la fórmula gaussiana que aparece a continuación: trabajo que ya se realizó para el cálculo de T(n). Sólo hace falta calcular los términos
que aparecen en T(2n) pero que no están incluidos entre los de T(n). Por ejemplo, de
las ecuaciones anteriores vemos que:
/ if(x)dx � Ao/(.xo ) +A¡f(x¡).
1
T(2) = !T(l) + !1/(!)J
33. Deduzca los valores exactos de los nodos y de los pesos para cada una de las siguientes
fórmulas. También determine el polinomio de mayor grado para el que la fórmula es exacta T(4 )= ! T(2) + !1/(!) +f(!)J
(a) Ecuación (3) (b) Ecuación (7) (c) Ecuación (8). T(8) = 1T(4)+tl/(t)+f(i)+J(j)+J(i)J.

Con h = (b - a)/(2n), la fórmula general asociada a cualquier intervalo [ a, b] es de la


forma siguiente:
7.4 Integración de Romberg
T(2n) = f T(n)+h[f(a + h)+f(a + 3h) + f(a+5h)+ · · ·+f(a+(2n - l)h)],
El algoritmo que a continuación se describe adopta el nombre de Romberg, apellido de
quien por primera vez dio una forma recursiva al método. Supongamos que se requiere o
encontrar un valor aproximado de la integral
!
T(2n) = T(n) + h ¿f(a + (2i - l)h). (3)
i=l

I = tf(x)dx. (1) Demostrarnos la validez de la ecuación (3) escribiendo primero T(2n) en términos de
T(n):
A lo largo de esta presentación tanto la función! como el intervalo [a, b] permanecen T(2n) = !T(n) + [T(2n)- !T(n)].
fijos. Usando la ecuación (2) podemos presentar la expresión entre corchetes de la siguiente
forma:
Regla recursiva del trapecio m
= h ¿ ''J(a+ih) - h ¿ "J(a+2ih) = h ¿f(a+(2i - l)h).
n n

Denotemos con T(n) a la regla del trapecio para/ que usan subintervalos de anchura
T(2n) - T(n) !
h = (b-a)/n. Partiendo de la ecuación ( 4) de la sección 7.2 llegarnos a:
i=O i=O i=l

En vista de que cada término en la segunda sumatoria adopta la formaf(a + 2ih), la


(b-a) t" b -a) .
J(a+/
segunda sumatoria cancela todos los términos de la primera que corresponden a los
T(n) = h t"J(a+ih) = n n
) (2)
términos pares. En la sumatoria resultante el rango de i se obtiene observando que
i=O i=O
482 Capítulo 7 Diferenciación e integración numérica 7.4 Integración de Romberg 483
en la primera sumatoria el primer término impar es f (a + ih), por lo que queremos for n = 1,2,...,M do
que 2i-l = 1, y que el último término impar esf(a+(2n-1)h), porlo cual deseamos que h +- h/2
2i -1 = 2n -l. Con estas consideraciones la ecuación (3) queda justificada.
La integral I, ecuación (1), puede ahora aproximarse usando la regla del trapecio re­ R(n, O) +- !R(n-1, O)+ h ¿i=1 f(a+ (2i -l)h)
zn-1

cursiva. Si se cuenta con 2n subintervalos uniformes, entonces la ecuación (3) suministra for m = 1, 2,...; M do
una regla del trapecio recursiva R(n, m) +- R(n, m -1)+ [R(n, m -1)-R(n-I,m -1)]/W -1)

T(2")= �rc2·- 1 )+ b; a I)(a + (2i -l/;


zn-1 end
ª).
output [R(n, m): O� n� M,O� m� n].
end
i=l

En general sólo se necesita un valor moderado de M, dado que el número de valores


La fórmula anterior se usa en el algoritmo de Romberg. Tomando a R(n, O) como de la función que se requiere es 2M + 1 Un algoritmo más complejo podría incluir un
Algoritmo de Romberg

la estimación correspondiente a la regla del trapecio con 2• subintervalos, tenemos que: procedimiento para detener automáticamente los cálculos una vez que cierto criterio de
error previamente establecido se satisface.
R(O, O)= !(b -a)[f(a)+ f(b)]
1
R(n,0)= !R(n -1,0)+ T �f(a+(2i- I)T)
zn-1
b-a b-a (4) Análisis
Para explicar el origen de la ecuación (5) iniciamos con la fórmula de Euler­
Los valores R(O, O), R(l, O), R(2, 0), ... , R(M, O) se calculan para valores pequeños de M, Maclaurin:
y no hay evaluaciones repetidas de funciones. En lo que resta del algoritmo de Romberg
se deben calcular los valores de cantidades adicionales R(n, m). Todas ellas se pueden
interpretar como estimaciones del valor de la integral L Una vez que se ha calculado el
1 1f(t )dt= -[f(O)+ f(l)]+ ¿A21: [f(2k-ll(O) -¡<Zk-1)(1)]
1 m-1

valor del elemento R(M, O) ya no resultan necesarias más evaluaciones del integrando f.
2

-Az,,/2ml�o),
o � �
Las siguientes columnas del arreglo .R las que corresponden a n � 1 y m � ¡ se generan
utilizando la fórmula:
qonde �o es algún punto entre O y l. Se puede demostrar que la ecuación (6) es válida
R(n, m) = R(n, m -1)+ [R(n,m -1) -R(n-1,m -l)]. (5) para cualquier función! E c2m ¡o,l]. En la sección 7.7 se encuentra uµa demostración
4 1 de esta importante fórmula. Las constantes k!Ak se conocen como números de Bemoulli
1
m_

y pueden definirse mediante la ecuación:


Este cálculo es muy sencillo. Se utiliza para suministrar un arreglo final de la forma:

R(l,O) R(l,1) = ¿Ak�-


e" -1
co
R(O, 0) X

R(2,O) R(2,1) R(2,2)


R(3,O) R(3,1) R(3,2) R(3,3)
k=o

R(4, O) R(4, 1) R(4, 2) R(4, 3) R(4,4) A partir de la fórmula de origen (6) podemos obtener la siguiente en dos pasos: aplique
la ecuación (6) a la función g definida por g(t) = f(x;+ ht) con h = x;+i - x; y, en la
integral resultante, haga el cambio de variable t = (x -X;)/h.
R(M, O) R(M, 1) R(M, 2) R(M, 3) R(M, 4) · · · R(M, M).
A continuación se presenta el seudocódigo para el algoritmo de Romberg calculado por
1 f(x) dx = [f (x;)+ f(x;+1)]
renglones: x, 2
Xi+1
h

+ ¿A2kh 2k [f(2k-l)(X¡) -¡<2k-l)(Xi+1)] (7)


m-1
inputa,b,M

R(O, O) +- (b -a)[f(a)+ J(b)] _ A2mh2m+1¡< 2m) (�¡).


h +-b-a k=I

f
484 Capítulo 7 Diferenciación e integración numérica 7.4 Integración de Romberg 485

En la ecuación (7), en ambos lados de la igualdad, llevamos a cabo la operación que se converge a L Esto demuestra que lím.....00 R(n, O) = L En cuanto a la segunda columna,
indica en la sumatoria ¿7=/ Six¡ = a+ih para O � i � 2" yh = (b-a)/2", entonces: nos damos cuenta de que

¡ 2'-1 R(n, 1) = fR(n, O) - f R(n - 1, O)


� ¿ [f(x¡)+f(xi+1)]
b
f(x) cb: = de donde se obtiene
ª i=O
1ím R(n, 1) = 31¡ _ l¡
3 =L

¿A
m-1 (8) n->oo

+ 2kh
2k
[ (a) -f2k-11(b)]
¡(2k-Il Todas las columnas restantes se pueden analizar de la misma manera. 11
k=I

-A2m (b - a)h2m¡(2ml(�) SERIE DE PROBLEMAS 7.4

para alguna� E (a, b). Al deducir esta ecuación, el término de error se ha manejado l. Deduzca la ecuación ( 7) a partir de la (6).
tal como se describe en el problema 2. La ecuación (8) se interpreta como sigue. El 2. Deduzca la ecuación (8) a partir de la (7) y, en particular, justifique la transformación de
primer término a la derecha corresponde al cálculo de L ecuación (1), mediante la regla
del trapecio, usando subintervalos de tamaño h = (b -a)/2". La ecuación (8) nos dice
2n-l
'lm +
h I ¿J(2m\1;;) a (b -a)h'lm¡('lm l@.
entonces que:
i=O

I = R(n, O)+ c2 h2+ c4h4+ c6h6+ · · ·+ c2m-2 h2m-z+ c2m h2m¡(2ml@, (9) 3. Deduzca la siguiente ecuación, para la cual h = I /2"

4 h) I ¿ 4"3(4-1•) C2n+2h2n+2,
00
donde/ E c2m[a, b] y� E (a, b). La ecuación resulta válida para cualquier h, ylos l = :/ (/, z - T(f, h) -
coeficientes de c2, c4, ••• , c2m son independientes de h. Dado que la ecuación (9) es un 3 n=l
caso especial de la ecuación (15) de la sección 7.1, podemos obtener de inmediato la
ecuación (4) usando el análisis de extrapolación de Richardson de la sección 7.1. donde
2•
Para aprovechar plenamente el algoritmo de Romberg debemos pedir que la función I = [f(x)dx y T(f, h) = h ¿f(ih).
f sea de clase c2m[a, b], con un valor de m tan alto como sea posible. Esta hipótesis i=O
justifica el uso de la fórmula de Euler-Maclaurin e implica que las cantidades R(n, m)
4. Demuestre que la segunda columna en el arreglo de Romberg es el resultado de aplicar la
convergen a la integral def con un error del tipo O(h2m), donde h = (b - a)Z-". ¿Qué regla de Simpson af (Véase la Ec. ( 6), Sec. 7.2.)
sucede si se supone que f sólo es continua?
5. Demuestre por inducción que
TEOREMA Sif E C[a, b], entonces cada columna del arreglo de Romberg converge a la integral I -R(n, m -1) = ah'lm + bh1m+z+ ch'lm+4+ ....
de f Por consiguiente, para cada m,
6. Use el algoritmo de Romberg para calcular R(2, 2) para las siguientes integrales:
i
J�
&
lím R(n, m) = ¡ f(x) cb:. (a) (b)
f ! (x)z
n-oo Ja 1 X Ío ji dx (en términos de it).

Demostración Iniciamos el proceso de demostración en la columna uno, la cual contiene estimaciones 7. Suponga que S(f, h) es una regla de cuadratura para la integral/ en la ecuación (1) y que
trapezoidales de la integral L La regla del trapecio con k subintervalos se puede escribir la serie para el error es c4h4+ c6h6+ · · ·. Combine S(f, h) con S(/, h/3) para encontrar una
aproximación más precisa para L
en la forma:
8. En el algoritmo de Romberg, R(n, 0) es una estimación delf(x) dx en la que se ha usado
k-1
¿ "J(a+ ih) = !h ¿f(a+ ih)+ !h ¿f(a+ ih).
k k
la regla del trapecio con 2" subintervalos. ¿Cuántas evaluaciones def(x) se necesitan para
h calcular R(i,J) para O ;;;; i ;;;; N y O ;;;; j ;;¡; N?
i=O i=O i=l 9. Si la regla del trapecio satisface la ecuación
El lado derecho de esta ecuación representa el promedio de dos sumas de Riemann para
L En vista de que h = (b -a)/k, la máxima anchura de los subintervalos converge a ['f(x)dx = T(f, h)+ c1h+ czh2+ c¡h3+ · ..,
cero conforme k -. oo. Por lo tanto, como consecuencia de la teoría de la integral de
Riemann, ambas sumas de Riemann convergen a L Evidentemente su promedio también en lugar de la ecuación (9), ¿cómo deberíamos entonces modificar la fórmula (5)?
486 Capítulo 7 Diferenciaci6n e integraci6n numérica
7.5 Cuadratura adaptativa 487
10. En el algoritmo de Romberg los elementos en la segunda columna satisfacen para alguna � E (a, b). La idea principal es que si la regla de Simpson en un subintervalo
R(i,1 ) = I + C4ht + C6h� + · · ·, dado no es suficientemente precisa, entonces el intervalo se divide en dos partes iguales
y la regla se vuelve a utilizar en cada una de ellas. Este procedimiento se repite a fin
donde I = lª¡,f(x)dx y h; = (b- a)/2'. Deduzca la fórmula para calcular los elementos de
la tercera columna y el primer término en la serie correspondiente al error. de aproximar el valor de la integral con una misma precisión en todos los subintervalos
considerados. Al final, habremos calculado la integral con n aplicaciones de la regla de
11 . Exprese R(2, 2) en términos de los elementos de la primera columna del arreglo de Romberg.

[a,
Demuestre que R(3, 3) no es una fórmula de Newton-Cotes, pero que R(2,2) sí lo es. Simpson,
c12. Escriba un subprograma que efectúe los cálculos correspondientes al algoritmo de Romberg
para una función! definida sobre un intervalo arbitrario b]. El usuario querrá especificar
el número de filas que desea calcular en el arreglo, y ver el arreglo entero una vez que se
ha calculado. Escriba un programa principal y verifique su subprograma de Romberg en los
1 b n x; n
f(x)dx = ¿l f(x)dx = ¿(S;+e¡) = ¿S¡+¿ e;,
n n

siguientes tres ejemplos:


ª i=l .T;-1 i=l i=l i=l

1
(a)¡ �dx ( b) r
1 cosx - i'
f_1 senx
dx (c) l"°
(xe')-1 dx.
donde S¡ es una aproximación de la integral en el intervalo (x¡_ 1, x¡] y e; es el error local
correspondiente. Sí
Jed � e(x¡ -X;-1)/(b-a),
O X
Las rutinas para estas integrales deberán escribirse evitando pérdidas importantes de dígitos (3)
significativos debidas a sustracción. Además, es común definir una función f en cualquier
punto dudosoxo mediante la ecuación/(xo) = lím,-xt,J (x). Si el límite existe, este método entonces el error total estará acotado por

1 I
garantiza la continuidad de/ en xo. Para el tercer ejemplo haga un cambio adecuado de
variable, tal como lo seríax = 1 / t. Calcule siete renglones en el arreglo de Romberg. En
cada caso imprima el arreglo con un formato que permita observar la convergencia. n n n x; -x;_¡) = &.
�e¡ � � Je;J � � �(
13. Demuestre que la ecuación (3) se deduce de inmediato a partir de la siguiente igualdad: b a

Í: f(a + ih)- Í: J(a + ih) = Í: f(a + ih).


O;ái;á2n O;ái;á2n O;ái;á2n De este modo, el criterio de error local (3) nos coduce a una cota para el error absoluto
i par i impar

/l f(x)dx-ts;/ � &.
b

7.5 Cuadratura adaptativa

Los métodos de la cuadratura adaptativa tienen como finalidad el cálculo de integrales Con base en la ecuación (2), la regla básica de Símpson para el intervalo [u, v] se
definidas tomando en consideración el comportamiento del integrando en forma auto­ describe por medio de:
mática. Idealmente, el usuario sólo tiene que proporcionar el integrando f, el intervalo
[a, b] y la precisión & con que se quiere calcular la integral v 1
1"
f(x)dx = S(u, v)- (v
90 - u)5j< l(�1 ),
4
(4)
lf�)dx.
El programa divide el intervalo en subíntervalos de longitud variable de modo que la
(1)
para alguna �1 E (u, v). Si el intervalo de integración se divide en su punto medio
w = (u+v)/2 en dos subintervalos iguales, se puede calcular un valor más preciso de la
integración numérica sobre los subintervalos produzca resultados de precisión aceptable. integral utilizando la regla de Simpson en cada uno de ellos. He aquí lo que resulta de
En esta sección vamos a desarrollar un método representativo de la cuadratura hacer tal cosa:
adaptativa. Este procedimiento usa en cada subintervalo la regla de Simpson junto con
una estimación del error correspondiente. La regla de Simpson está dada por la ecuación w
[f(x)dx =
( 6) de la sección 7.2: 1 f(x)dx+ [f(x)dx
1 1 1
l ab
f(x)dx = S(a, b)-
90
(b-a)5¡< J(�)
4 = S(u,w) - 90 (w- u)5j<4l(�2)+ S(w, v) - 90 (v-w)5¡<4J(�3 )
b-ar
f
S(a, b) = - - (a)+ 4J (- -) + f(b)]
ª+b ( 2) = s· + s ·· - _!__ (�) s ¡¡<4JC;2)++¡<4J(;3 )J
6 2 90 2
= s·+ s·· - _!__ .-!..(v- u)5j<4l(;)
16. 90 (5)
488 Capítulo 7 Diferenciación e integración numérica 7.5 Cuadratura adaptativa 489

En estos cálculos hemos puesto Observe que sólo se requieren dos nuevas evaluaciones f(y) y f(z) para calcular s• =
s• = S(u,w) S** = S(w,v) S(a, e) y S** = S(c, b) , ya que las cantidades restantes ya se han calculado con anterio­

= �[.f< )(1; )+¡( )(1;3)J,


ridad y ahora se guardan en un formato particular. El proceso que se aplicó al vector en
4 4
¡(4)@
2 (6) (8) se aplicará eventualmente a cada vector que genere el algoritmo.
La siguiente es una descripción del procedimiento que sigue el algoritmo. En
donde 1;2 E (u, w), 1;3 E (w, v) y 1; E (u, v). Al suponer que¡(4) es continua, la ecuación cualquier etapa se tendrá acumulada en una variable í: la suma de las integrales de¡
(6) se justifica. Como es usual con tales fórmulas, el término de error no se puede sobre ciertos subintervalos. Al mismo tiempo, se tendrá una pila de vectores de trabajo
estimar ni acotar a menos que se tenga algún conocimiento de f4). No obstante, en previamente descritos, cada uno de los cuales corresponde a un intervalo sobre el que la
el cómputo automático es imperativo encontrar una manera de estimar la magnitud integral de f aún no se ha calculado satisfactoriamente. Uno de dichos vectores, digamos
de /4l(1;). Esto se logra suponiendo que /4> es constante sobre inte01alos pequeños.
Supongamos, en particular, que en las ecuaciones (4) y (5) ¡(4l(1;1 ) = /4\1;). En tal [u, h, ü, W, v, SJ,
caso los términos en que figura/4l se pueden eliminar multiplicando la ecuación (5) por

¡
16/15 y sustrayendo la ecuación (4) multiplicada por 1/15. El resultado es se toma de la pila. Éste tendrá las siguientes propiedades:
V
1 (7)
u f(x) dx � S*+ S**+ [S*+ S** - S(u,v)]. w=u+h v=u+Zh
15
ü=f(u) W=f(w) v=f(v)
Las bases del método de la cuadratura adaptativa han quedado fija. Suponga que
se quiere calcular numéricamente la integral (1) con una tolerancia prefijadas. Sij<4l S = (ü+4W+ v)h/3.
existe y exhibe variaciones pequeñas, la aproximación correspondiente a la ecuación
(7) será satisfactoria en intervalos pequeños. El algoritmo adaptativo comienza con Después, sustituimos h por h/2 y computamos
la consideración del intervalo [a, b]. Para éste (igual que para otros intervalos que se
considerarán posteriormente) se construye un vector que tiene seis componentes: y = u+ h z = u+ 3h
1
h = -(b-a). (8) Y = f(y) z = f(z)
[a, h,f(a),f(a+ h),f(a+ 2h), S]
2 ru
s· = + 4y+ w)h/3
Este vector contiene la estimación de Simpson S = S(a, b), así como los datos necesarios s•• = cw+ 4z+ v)h/3.
para calcularla por medio de la ecuación
h Queremos saber si S*+ S**, como estimación de J; f(x) dx, satisface el criterio de error,
S = [f(a)+ 4f(a+ h)+ f(a+ 2h)J. que es
3
Ahora calculamos e= a+ h, s• = S(a, e) y s•• = S(c, b). Como ya dijimos, S*+ s••
IS*+ s·· - s¡ � 30sh/(b - a). (10)
es una estimación más refinada de la integral. Para ver si ya es satisfactoria (es decir, Si el criterio (1O) lo satisface, entonces s•+ S**+ (S*+ s•• - S)/15 se añade a í:, y se
cumple con la tolerancias), utilizamos las ecuaciones (7) y (3). Para ello examinamos toma un nuevo vector de la pila para ser procesado. Si S* + S** no aprueba el examen,
la desigualdad dos nuevos vectores se añaden a la pila:
1 (9)
IS*+ s·· - SI <s(2h)/(b - a).
15 [u, h, ü,y, W, S*]
Si ésta se cumple, el número S*+ s••+ [S*+ s•• - SJ/15 se acepta como el valor de la
integral (1) en conformidad con la ecuación (7). Si la desigualdad (9) no se cumple, el z,
[u+2h,h,W, v, S**J.
intervalo se subdivide en dos subintervalos de longitudes iguales, a saber, [a, cJ y [c, bJ,
donde e= (a+b)/2. Para cada uno de dichos intervalos se construyen sendos vectores Acto seguido, se toma otro vector de la pila y se procesa de la misma manera No se
como se acaba de describir. El vector en (8) se descarta, y en su lugar tenemos dos permite que el tamaño de la pila exceda de n vectores, en donde n es un parámetro que
nuevos vectores: fija el usuario. Esto impide que el algoritmo se torne infinito.
A continuación ofrecemos un seudocódigo para este algoritmo. Éste se apega a la
[a, ;,f(a), f(y).f(c),s•] Y=a+h/2
descripción que acabamos de hacer. Se tiene la precaución de guardar cantidades que
pudiesen necesitar se más adelante. Los vectores de la pila de trabajo se denotan con
vO\ v(2) y así sucesivamente. Cada vector tiene seis componentes:
[e, �,f(c),f(z),f(b),s••] z = c+h/2.
v (k) -
- (k) (k)
[v 1 , v2 , • . . , v6(k)l.
490 Capítulo 7 Diferenciación e integración numérica 7.5 Cuadratura adaptativa 49 1

La primera componente, v¡k� siempre representa el punto a la extrema izquierda de un 2. El criterio (3) de error local se utilizó para obtener una cota de error absoluta. Trate de
k
intervalo; vf) es la mitad de la longitud de dicho intervalo; v� � vf� vfl son los valores obtener un criterio para el error local que nos lleve a una cota de error relativo
k


de f en el extremo izquierdo, el punto medio y el extremo derecho de este intervalo;v� l
es el valor que da la regla de Simpson para este intervalo. /[t(x)dx-ts,/ /[t(x)dx/e.
El siguiente es el algoritmo completo.

input a, b, e, n 3. Detennine una aproximación similar a (7) utilizando la regla del trapecio en la forma
ll +- b - a;í: +- O;h +- ll/2; e+- (a+ b)/2;k +- I
[f(x)dv = T(u, v)-i(v - u)3/'@,
a+-f(a); b +- f(b); e+-f(c)
s+-(a+4c+b)h/3
donde
v(ll +- [a, h, a, e, b, S]
f
T(u, v) = (v - u)[f(u)+f(v)].
while 1 � k � n
4. La regla del trapecio compuesta se puede escribir en la forma
h +- vt);z
y+-f(v¡k) + h) I = T,,. - i(v - u)h2J"(�),
s· +- (vt) +4y+v�k))h/3 donde
z +- f(v¡k) +3h) l=[t(x)dx
k
S** +- (vfl+4Hv� l)h/3
k
if [S*+S**-v� J¡ < 30eh/ll then T,,. = � �(u)+2 �f(u+ih)+J(v)].
:E+-:E+S*+S**+ t5[S*+S**-vtl]
k+-k-1 Muestre cómo se pueden combinar T,,. y T2m para obtener una mejor aproximación a L En
este caso m es el número de subintervalos en el intervalo [u, v].
if k � O then output :E; stop
5. La regla de Simpson compuesta se puede escribir en la forma
else
if k � n then output failure; stop I = S2m -
1
(v - u)h4/4'(�),
ISO
ii+-v5(k)
V(k) ,- [v(k) h v(k) - v (k) S*] donde
1 , ' 3 ' y' 4 '
k+-k+ l
l=[t(x)dx
v(k) +- ¡v<k-1) +2h h' v(k- l)• -z' ii' S**]

r ,,. ,,. ]
1 ' 5

3 f(u)+2 �/(X2i-2)+4 �/(x2,-1)+f(v)


endif S2m =
h
end.

En algunos lenguajes de programación y en algunas computadoras es importante guardar y h = (v - u)/(2m), x; = u+ ih (O � i � 2m). Aquí se tienen 2m subintervalos en
en la misma columna, las cantidades que se accesan con mayor frecuencia. En tal caso, el intervalo [u, v]. Muestre cómo se pueden combinar S2m y S4,,. para obtener una mejor
la pila de vectores de trabajo se puede almacenar en un arreglo bidimensional V(I, aproximación a L
k
K) +-v(' ). 6. En la sección 7.4 se derivó la siguiente relación entre la regla del trapezoide sobre [u, v] con
m subintervalos y la regla del trapezoide sobre [u, v] con 2m subintervalos:

"'
SERIE DE PROBLEMAS 7.5 1
T2m = 2.T,,.+h ¿f(Xz¡-1),
e 1. Programe el algoritmo adaptativo y póngalo a prueba con las integrales siguientes:

(b) ¡
i=l

(a) [ x 1 /2dx (1 -x/12 dx (c) [ (1 -x/14 dx. donde h = (v - u)/(2m) y x; =u+ih (O� i � 2m). ¿Podemos utilizar este resultado para
1
establecer un esquema adaptativo?
492 Capítulo 7 Diferenciación e integración numérica
*7.6 Teoría de Sard de aproximación de funcionales 493
*7.6 Teoría de Sard de aproximación de funcionales Teorema de Peano
TEOREMA 1 Si elfuncional de la ecuación (1) aniquila a IIm , entonces para toda/ E cm+1 [a,b]
Un funcional lineal en un espacio lineal es un mapeo lineal de dicho espacio en el campo
escalar (en este libro, lR por lo general). Por ejemplo, si el espacio lineal es C[a, b], un
funcional lineal$ muy importante se define por $(!) = [ K(t)/m+1 \t) dt,

donde K(t) es el núcleo de Peana de$.


$(!)= [f(x)dx fEC[a,b].
Demostración Por el teorema de Taylor con residuo integral
En las aplicaciones numéricas, los funcionales básicos son las evaluaciones numéricas
en puntos. Para una x fija en [a, b], definimos un funcional lineal x por medio de
la ecuación
f(x)= '°'�k!-I
k=O
m
¡(kl(a)(x - al+ r(x)

x(f)= J(x). / E C[a,b]


¡
r(x)= -
¡x¡ <m+l)
(t)(x - rr dt.
Tomando combinaciones lineales de evaluaciones numéricas en puntos, obtenemos fun­ m! a
cionales más versátiles de la forma 'I', definida por: En vista de que$ aniquila a II,., $(!)= $(r). Ahora exprese r en la forma
¡
ljf=¿c¡x¡ es decir ljf(j)= ¿ c¡ f (x¡). (1) r(x) = 1
m.
¡b¡<m i)(t)(x - t): dt.
a
+

i=O i=O
De lo anterior se sigue que
Podemos argumentar de manera convincente que en el trabajo numérico éste es el tipo
más general de funcional que se puede calcular directamente; otros funcionales (tales
$(r)= '
1 ¡b¡ <m+l)
(t)$x[(x - rm dt.
como la integración) deben reemplazarse por funcionales de aproximación como '1'· Es m. a
precisamente esto lo que se hace en las áreas de integración y diferenciación numéricas.
Este último paso requiere que el funcional$ se pase al interior del signo de integración,
En los años de 1940 a 1970, Arthur Sard desarrolló una teoría coherente de la
lo cual se justifica a partir de ciertos teoremas del cálculo que necesitan las hipótesis que
aproximación de funcionales. Esta teoría considera de una manera muy interesante los
hemos asumido respecto de$. 8
splines naturales. El tipo de funcional que aproximaremos está dado por la ecuación:

¡
{ b n }
Si$ y ljf son dos funcionales que coinciden en IIm, entonces su diferencia aniquilará a
m
a.¡(x')/ l (x)dx + ; � ef (Zij) .
i IIm. La diferencia tendrá un núcleo de Peano K, y por la desigualdad de Cauchy-Schwarz
$(!)= � (i)
(2)
<m+n
l$U) - '!'U)I � IIKll2IIJ 112. (4)
Los puntos Z¡¡ se hayan en [a,b] y las funciones a.¡ se supone que son continuas por La norma con subíndice 2 es la norma usual Lz sobre [a,b]. Si en ljf hay parámetros
pedazos sobre [a,b]. El funcional$ se puede aplicar a cualquier/ E cm ¡a,b]. que no están plenamente determinados por la exigencia de que $ - 'I' aniquile a IIm,
Diremos que un funcional$ aniquila a un espacio W si$(!)= O para todaf E W. éstos se pueden elegir de modo que el factor J: K(t)2 dt sea un mínimo. De esta manera,
El núcleo de Peano de un funcional$ tal como en la ecuación (2) es la función obtenemos un funcional 'I' que es una mejor aproximación de$ en el sentido de Sard.
Schoenberg descubrió que tales fórmulas mejores se pueden obtener de una manera más
1 bien simple. A continuación se presenta este importante teorema. En él, $ o L es la
K(t) = 1$x[(x - t):J,
m. composición de$ y L, de modo que($ o L)(J) = $(Lf).

donde Teorema de Schoenberg


(x - tr S� X � t
+= {
(x _ tr
0 SlX<t TEOREMA 2 Sea$ elfuncional lineal que se da en la ecuación (2). Suponga que ciertos nudos se han
prescrito con las siguientes propiedades: a= to < t ¡ < ... < tn = b, con n > m. Entre
y la notación $x indica que el funcional se aplica a (x - t): como una función de x. La
función x';.' (que se obtiene cuando t = O) se llama función de potencia truncada. El
losfuncionales de la fonna I::'=aC¡t¡ que coinciden con$ en IIm , la mejor aproximación
de $ en el sentido de Sard es $ o L, donde L es el operador lineal que produce splines
siguiente resultado se demostró en 1905. naturales de interpolación de grado 2m + 1 en los nudos que se proporcionan.
494 Capítulo 7 Diferenciación e integración numérica *7.6 Teoríade Sardde aproximaciónde funcionales
495

Demostración Sea ,¡f(ie la forma 'I' =I:7=0 c;t; y suponga que para todap E IIm, 'lf(p)=$(p). En tal Ahora podemos establecer la ecuación (5)escribiendo:
caso $-'I' aniquila a IIm. Sea K1 su núcleo de Peano. Si fes un spline natural de grado
2m + 1 en los nudos proporcionados, entonces Lf = f. Dado que los polinomios de grado b

K¡dt = ¡ (K + Kz)2dt =¡ (K2 + 2KK2 + Ki)dt


b b

� m se incluyen entre dichos splines naturales, Lp = p para p E IIm . De este modo, ¡

1
a ·
$- q> oL también aniquila a IIm . Sea K su núcleo de Peano.Vamos a demostrar que
a a
b b b

= K2dt + ¡a Kjdt � ¡a K2 dt.


t[K(t)fdt � t[K1 (t)fdt. (5)
En términos del producto interior para funciones, estos cálculos nos muestran que
(K, K)2 = O y, por la ley de Pitágoras,
El núcleo de Peano del funcional

0=$oL -'I' = ($-'!')- ($-$oL), 1 li= IIK + K2 li = IIKlli + IIK2lli � IIKIJi.


IIKf 11

es K2 = K1 - K, y está dado por Ejemplo Sean

1 $(! )= 1->(x)dx
K2(t) = 10.r[(x -t):J. (6)
m.
'l'if)=c¡f(-1)+czf(0)+c3f(l).
Si {so, s¡ , ..., sn } es una base cardinal de nuestro espacio de splines naturales, entonces Tomando en cuenta sólo funcionales 'I' y que coincidan con 4> en II. encuentre la mejor
s; (t¡)= Oij y L tendrá la forma: aproximación de 4> en el sentido de Sard.
Respuesta En esta situación requerimos el operador de interpolación de splines naturales L. Se
Lf = ¿f(t;)s;. puede verificar que
i=O

· (Lf)(x)=ao+ a¡x + bo(x + l)! + b ¡ (x)! + b 2 (x - 1)!,


Se sigue que 0tiene la forma:
donde
¿!( t;)q>(s¡)-¿ c¡ f(t;)= ¿ y/(t¡).
n n n

0(!)= q,(Lf)-'l'(f)= ao= [-!(-1)+6! (0)-f(l)]/4


i=O i=O i=O
a¡ = [-5f(-1)+6f(O)-f(l)]/4
Así, para K2 tenemos la ecuación:
bo= b 2 = -b¡/ 2 = [f(-1)-2f(O)+f(l)]/4.

K2(t) = 1
1
¿ y¡(t¡ - t):.
n
(7) La mejor fórmula está dada por

1-: (Lf)(x)dx
m. i=O

'lf(f)= q>(Lf)=
Elija una función g tal que g<m+l) = K2. En este caso g<2m+!) = Kt), y ésta es una
función peldaño o spline de grado O. Por consiguiente, g es una función spline de grado = 2ao +4bo+ ib1
2m + 1 con nudos to, t 1, ••• , t.. De hecho, g es un spline natural. Para verificar esto,
observe que por la ecuación (7), K2 (t) = O cuando t � b. Por lo tanto, g<m+ll(t) = O = if(-1)+ if(O)+ if(I). 111
para t � b. Con base en la ecuación 6( ), para t � a � x tenemos que
1 SERIE DE PROBLEMAS *7.6
K2(t) = 1 0.r[(x -trJ.
m. l. Buscamos una fórmula aproximada
Ya que 0aniquila a IIm, K2(t) = g<m+l\t) = O cuando -oo < t � a. !' (x) r::. cof(-I) + c¡f(O) + cz!(I),
Como ges un spline natural, Lg =g. En consecuencia,
donde x es un punto fijo de (-1, !). Encuentre las condiciones necesarias y suficientes que
[ KK2dt = [ Kg<m+lldt
debemos pedir a los coeficientes para que la fórmula sea correcta en II1. Encuentre la mejor
= ($-$oL)(g )=O. f
aproximación en el sentido de Sard. Calcule 1 K(t)2 dt cuando se alcanza el mínimo.
496 Capítulo 7 Diferenciación e integración numérica *7.7 Polinomios de Bemoulli y lafórmula de Euler-Maclaurin 497

2. Para el ejemplo que se da en el texto, encuentre la mejor constante en la fórmula para el error f.
de donde obtenemos B¡(t) = t - Dado que el coeficiente de Bn en la ecuación (1) es
n + 1, siempre podemos resolver para Bn en términos de Bo, B ¡ ,..., Bn-l· El siguiente
J (f) -ljl(/)J � c!!f''l!2.
$ teorema enumera las propiedades de los polinomios de Bemoulli que vamos a necesitar.
3. Encuentre la función de interpolaciónf(f(t;) =t.¡, O ;:¡; i ;:¡; n) que minimiza la integral TEOREMA 1 Los polinomios de Bemoulli tienen las siguientes propiedades:
J,,,'º (!")2 dt, suponiendo queJ" es continua por pedazos.
(i) E,,=nBn-1 (n � 1)
4. Utilice el teorema del núcleo de Peana con el funcional
(ii) Bn(t + 1)- Bn(t) = nf'-l (n � 2)

t
$(!) =J(x + h)-f(x)-(h/2)[3¡' (x)-J'(x-h)],
-k
(x, h fijas)y demuestre que$(!)=(5/12)h3/'11(�), x-h < � < x+ h. (iii) Bn(t) = (;)Bk(O)t "
5. Utilice el teorema de Peano y derive el siguiente resultado para la regla de Slmpson k=O
(iv) Bn(l -t) = (- ltBn(t).
[f(x) dx= i [f(O) + 4/(1 ) +/(2)]--Jo/4l�).
Demostración Vamos a demostrar la ecuación (i) por inducción. El caso n = 1 se verifica a partir del
6. Utilice el teorema de Schoenberg de esta sección para demostrar que !
hecho de que B¡(t) = t - y Bo(t)= l. Ahora suponga que B� = kBk-l para k= I,
2, ... , n- 1 Derivando en la ecuación (1) y utilizando de nueva cuenta la ecuación (1),
!f(2) + if(O) -U(l) - it(3)! ;:¡; #sllJ"!!2- obtenemos

; 1)
n
(n;
n-l
B�(t) = n(n + l)f'- 1 = (n + 1) � (); B k(t). (2)
*7.7 Polinomios de Bernoulli y la fórmula de Euler-Maclaurin
A través de la hipótesis de inducción, la ecuación (2) se puede escribir en la forma:
La validez del algoritmo de integración de Romberg depende de la fórmula de Euler­
Maclaurin, o ecuación (6) de la sección 7.4. Después de establecer algunas propiedades
n-1 ¡) n-l
(n + l)B� +; (n; kBk-l =(n + 1) � (;) Bk.
de los polinomios de Bemoulli, derivaremos dicha fórmula.

Ahora divida por n + 1 y utilice la identidad n!i (";1 ) = (k� 1):


Polinomios de Bemoulli
Los polinomios de Bemoulli constituyen una sucesión infinita con muchas propie­ n-l
¿ ( : ) Bk-I = ¿ ;
n-1 ()
dades útiles. Los primeros polinomios de la sucesión son: B� + Bk.
k l
k=I k=O
Bo(t) = 1 Al cancelar los términos semejantes nos queda la ecuación (i), que es lo que queríamos
B1(t)=t-! demostrar.
i
2 Para demostrar la ecuación (ii), utilice repetidas veces la ecuación (i) hasta obtener
B2(t) = t - t +
B3(t) = t3 - !t2 + f t. B:(t) = n(n- I)Bn-2(t)
s:'(t) = n(n- l)(n-2)Bn-J(t)

t
Se definen por la ecuación:

(n; 1)Bk(t) = (n + l)f'. (1)


Bfl(t) = n(n-1) · · · (n-k + l)Bn_k(t).

Así, la serie de Taylor para Bn es


Recuerde que (:,) = nl/[m!(n-m)!J. Por ejemplo, si n=O, la ecuación (1) señala que
Bo(t) = l. Sin=I, la ecuación establece que 1
Bn(t + h) = �
L., B"(k) (t)h k = � (n)
L., k Bn-k(t)h k. (3 )
k!
Bo(t) + 2B1 (t) = 2t, k=O k=O
498 Capítulo 7 Diferenciación e integración numérica *7.7 Polinomios de Bemoulli y la fórmula de Euler-Maclaurin 499

Sea ahora h = 1 En este caso utilice la identidad La fórmula de Euler-Maclaurin


TEOREMA 2 Si lafunciónf posee 2n derivadas continuas en [0, l ], entonces
G)=(n :k}
I: ci�i [¡ -1)c1) -¡<2k-1Jco)l + R.
1 n-1
1 JCt)dt = !¡jco) +1c1)1 - <2k
y la ecuación (1) para obtener la ecuación (ii):

t G)
O k=O

Bn(t + 1) = Bk(t) = Bn(t) + � G )sk (t)


donde
n
R = - bz ¡<2nl(c,)
(2n)!
(O< E,< 1) y bk = Bk(O)
-
= Bn(t) + nt" 1 . Demostración Tomando como punto de partida la ecuación (i) del teorema 1, tenemos que

Al tomar t =O y h = t en la ecuación (3), se obtiene la ecuación (iii). 1 /


Para derivar la ecuación (iv), utilice la ecuación (ii) sustituyendo t por -t El Bn(t) = - Bn+l (t).
n+ 1
resultado es
Bn(l - t)-Bn (-t) = n(-1r1t-1 Utilizando la integración por partes y esta última fórmula ,escribimos:

= (-l)n-l [Bn (t + 1) - Bn(t)).


Cuando la ecuación anterior se escribe en la forma 10
¡

f(t)dt = 11
0
f(t)Bo(t)dt = B1 (t)f(t)l -
0
1 11 B (t)f'(t)dt.
0
1 (5)

(-l)"B n(t + 1) - Bn(-t) =(-l)"Bn(t) - Bn(l - t) = F(t), Dado que B 1 (1) =!y B 1 (0) =-!,la ecuación (5) se puede escribir en la forma:

reconocemos en ella una ecuación del tipo F(t + 1) = F(t), de donde se sigue que Fes [f(t)dt = i(f( l) +f(O)] - [ B1 (t)f'(t)dt.
periódica con periodo l. Dado que F es un polinomio, debe ser una constante. Por lo
tanto,
(-l)"Bn (t) - Bn (I - t) =Cn. (4) La integral en esta ecuación se puede resolver integrando por partes, siendo el resultado

Ahora derive la ecuación (4) y utilice la ecuación (i):


[f(t)dt = i(f( l) +f(O)] - �[! (1) -J'(O)] +
1
! [ B2(t)f"(t)dt.
(-l)"B:(t) + B�(I - t) = (-l)"nBn-1 (t) + nBn-1 (1 - t) =O.
Este proceso puede continuar. Las fórmulas
Esta última es equivalente a la ecuación (iv). 11
Bn(O) =Bn(l) =bn
LEMA La función G(t) = B2n(t) -B2n(O) no tiene ceros en el intervalo (O, 1).
b3 =bs =hJ = · · · =O,
Demostración Comenzamos por tomar t = O en las ecuaciones (ii) y (iv) del teorema anterior. El
resultado es: previamente mencionadas, son muy útiles. Después de 2n pasos tendremos:
Bn(O) = Bn(l) = (-1)" Bn(O).
En consecuencia, B3(0) = B5(0) =B1(0) =· · · =O .
I
1 f(t)dt = 2l[J(l) + f(O)] -
o
'°' (2k)! [¡(2k-Il(l) -¡(2k- l(O)]
6
n
b2k 1

Ahora suponga que G tiene un cero en (0, 1). Dado que G(O) = G(l) =O , por el
teorema de Rolle sabemos que CY tiene dos ceros en (O, 1). Como B2n-t es un múltiplo +
1 1 1
(t)¡{2n\t)dt.
de G', B2n -i tiene dos ceros en (O, 1). Sin embargo, B2n-i también se anula en O y l , así (Zn)! 0 B2n
que Bí,,_ 1 tiene tres ceros en (O, l). En consecuencia, B2n-2 tiene tres ceros en (0, 1).
Siguiendo la misma línea de razonamiento, llegamos a la conclusión de que Bk, para El último término de esta suma se puede expresar en la forma:
índices impares k< 2n, tiene al menos dos ceros en (0, 1). Por consiguiente, B3 debe
tener dos ceros en (O, 1) y otros dos ceros en O y l . Esto es claramente imposible, ya que b2n ¡¡<2n-n(I) (2n-tl(O) b2n 1 2nl(t)dt.
1
-¡ J=
B3 es un polinomio de tercer grado. 11 (2n)! ¡<
(2n)! o
Capítulo 8
500 Capítulo 7 Diferenciación e integración numérica

teorema, salvo que el residuo


Esto permite escribir la fórmula como en el enunciado del SOLUCIÓN NUMÉRICA DE ECUACIONES
ahora es 1
=
1
!
1 2n
[B2n(t) - b2n]f \t) dt. (6) DIFERENCIALES ORDINARIAS
R (2n) 0
de signo en [O, 1]. Por consi­
Por el lema precedente, la función B2n(t) -b2n no cambia
guiente, es posible aplicar a la ecuaci ón ( 6) el teorem a del valor medio para integrales y 8.1 Existencia y unicidad de las soluciones
escribir en la forma: 8.2 Método de la serie de Taylor
R 8.3 Métodos de Runge-Kutta
1
1 1
R = - /2nl('f:,) [B2n(t) - b2n] dt.
8.4
*8.5
Métodos multipaso
Errores locales y errores globales. Estabilidad
(2n) . 0
8.6 Sistemas y ecuaciones diferenciales ordinarias de orden superior
t = O y t = L tenemos
En vista de que B2n = B'ir.+if(2n + 1) y B2n+ 1(t) es cero para *8.7 Problemas con valores en la frontera
finalmente que 8.8 Problemas con valores en la frontera: Métodos de disparo
b2r, (2n) 8.9 Problemas con valores en la frontera: Métodos de diferencias finitas
=- ¡ ('f:,). 111111

R (2n)! *8.1 O Problemas con valores en la frontera: Colocación


*8.1 1 Ecuaciones diferenciales lineales
8.1 2 Ecuaciones rígidas
SERIE DE PROBLEMAS *7.7
r<-1 tiene como coeficiente
l. Demuestre que el término principal de B.(t) es r' y que el término
a -n/2.
2. Utilice la ecuación i( i) del primer teorema para demostrar que
¡P + zP + ... + rf =[Bp+1(n + 1) - Bp+ 1(0)]/(p + 1). Este capítulo se ocupa de varios tipos de problemas numéricos asociados a las ecua­
ciones diferenciales. El problema central consiste en resolver una ecuación diferencial
3. Demuestre que las funciones B.(x) - B.(O) tienen un cero simple en k cuando n es impar. de primer orden una vez que se conoce un punto por el que pasa la curva solución.
4. Demuestre que los números Bo(O), B2 0( ), B4(0), ... van alternando los signos. Las siguientes secciones se dedican al estudio de sistemas de ecuaciones, así como al
5. Demuestre que paran par, Bn tiene al menos 2 raíces en (0, !), y paran impar tiene al menos de ecuaciones de orden superior y a problemas con valores en la frontera para el caso
una raíz. de dos puntos.

8.1 Existencia y unicidad de las soluciones

Nuestro modelo es un problema de valor inicial presentado en la forma:


x' =J(t,x)
{ (1)
x(to) = xo.
En esta ocasión x es una función desconocida de t que esperamos poder construir a
partir de la información proporcionada en las ecuaciones (1), donde x' = dx(t)/dt. La
segunda de las dos ecuaciones en (1) especifica un valor particular de la función x(t).
La primer ecuación proporciona la pendiente de la curva x en cualquier punto t. Por
supuesto, debe especificarse cuál es la función J con la que se va a trabajar. Podemos
tomar, como un ejemplo concreto,
x' =xtan(t+ 3)
{ (2)
x(-3) = l.

501
502 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.1 Existencia y unicidad de las soluciones 503

Nos gustaría determinar la función x en un intervalo que contenga el punto inicial t 0• Deseamos que se satisfaga mín(a.,�/ M) f: l. Para ello podemos tomara. = l . Entonces
La solución analítica de este problema de valor inicial es x(t) = sec(t + 3), como se M = 4 , y nuestro objetivo se alcanza si hacemos que� f: 4. El teorema de existencia
puede verificar fácilmente. Dado que el valor de sec t se vuelve infinito en t = :bt/2, asegura que existe una solución del problema de valor inicial en el intervalo ltl �
nuestra solución sólo será válida para-rc/2 < t+3 < rc/2. El ejemplo proporcionado mín(a.,MM) = 1. 111
por la ecuación (2) resulta excepcional en el sentido de que posee una solución analítica
sencilla, a partir de la cual se pueden calcular fácilmente valores numéricos. Sin embargo,
la situación típica para problemas del tipo que se presenta en (1) es que no se disponga Unicidad
de soluciones analíticas y que se deban emplear métodos numéricos para calcular sus Puede suceder, aun si/ es continua, que el problema de valor inicial ( l) no tenga
soluciones. una solución única. Un ejemplo sencillo de este fenómeno lo podemos apreciar en el
siguiente problema:
Existencia x' = x2/3
{
x(O) = O.
¿Tendrá solución todo problema de valor inicial que se pueda expresar en la forma
( l)? La respuesta es no, ya que para que tenga solución deben hacerse ciertas suposicio­ =
Resulta evidente que la función cero, x(t) O, es una solución de este problema. Otra
solución es la función:
nes acerca de/, y aun así sólo podemos esperar que la solución exista en una vecindad
l
de t = t0• Considere, como ejemplo de lo que pudiera suceder: x(t) = /.
2
2
x' = I+x Para demostrar que el problema de valor inicial ( l) tiene una solución única en una
{ (3)
x(O) = O. vecindad de t = to es necesario suponer algo más acerca de/. He aquí el teorema usual
que trata este caso.
La curva solución inicia en t = O con pendiente uno; es decir, x'(O) = l. Dado que
la pendiente es positiva, x(t) es creciente en una vecindad de t = O. Por consiguiente, la TEOREMA 2 Sif y a¡/ax son continuas en el rectángulo R definido por (4), entonces el problema de
expresión 1 + x2 también es creciente, y como consecuencia de ello x' es creciente. En valor inicial (1) tiene una solución única en el intervalo que incluye a las t que satisfacen
vista de que tanto x como x' son crecientes y están relacionadas mediante la ecuación it -tol < mín(a.,�/M).
x' = l+x 2, podemos esperar que para algún valor finito de t no exista solución; es decir,
que x (t) =+oo. De hecho esto sucede en t = rc/2, debido a que la solución analítica de En los teoremas I y 2, el intervalo sobre el eje t en el cual se asegura que existe la
(3) es x(t) = tan t. solución puede ser más pequeño que la base del rectángulo donde definimos f(t, x). El
teorema3 es un poco diferente, en el sentido de que nos permite inferir la existencia y la
TEOREMA 1 Sif es continua en un rectángulo R centrado en (to, xa), digamos: unicidad de una solución sobre un intervalo [a, b] dado. (Véase Henrici (1962, pág. 15].)
R = {(t,x): l t -tol �a., Jx -xal ��}. (4) TEOREMA 3 Sif es continua en la franja a � t � b, -oo < x < oo y satisface la desigualdad:
entonces el problema de valor inicial (1) tiene una solución x(t) para Jt - tol �
IJ(t, X¡) -f(t, xz)I �Llx1 -x2I, (5)
mín(a.,�/ M), donde Mes el máximo de IJ(t, x)J en el rectángulo R.
entonces el problema de valor inicial (1) tiene una solución única en el intervalo [a, b].
Ejemplo 1 Demuestre que el problema de valor inicial
La desigualdad (5) se llama condición de Lipschitz en la segunda variable. Para
x' = (t+ senx)2
{ una función de una variable, tal condición simplemente aseguraría que
x(O) = 3.
lg(x1)-g(x2)I �Llx1 -x2I- (6)
tiene una solución en el intervalo-1 �t � l.
Respuesta En este ejemplo tenemosf(t, x) = (t+ senx)2 y (to, xa) = (0,3). En el rectángulo Vemos de inmediato que esta condición es más fuerte que continuidad, dado que si x2
tiende a x1 , el lado derecho de la desigualdad (6) tiende a cero, y esto obliga a que g(x2)
R = {(t,x) : Jtl �a., Jx -3 J ��}. tienda a g(x1). La condición (6) es más débil que tener una derivada acotada. De hecho,
si g'(x) existe en todas partes y no excede a L en valor absoluto, entonces el teorema del
la magnitud def está acotada por valor medio nos permite asegurar que
if(t,x)I �(a.+ 1)2 = M. lg(x1)-g(x2)I = ll@llx1 -x2I �Llx1 -xzl .
Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.1 Existencia y unicidad de las soluciones 505
504

Ejemplo 2 Demuestre que la función g(x) = I:7=1 a;lx - wd satisface una condición de Lipschitz 7. Usando el teorema 1 demuestre que el problema de valor inicial
con la constante L = I:7= 1 lad. x' = tanx x(O) = O,

t t
Respuesta tie ne una solución en el intervalo JtJ < rr./4.
8. Sea/ una función continua de una variable, definida sobre todo JR. Tome M(r) como el valor
lg(x1)-g(x2)I = \ a;lx1 - wd - a;ixz - w;I \ máximo de Jf(x)J para JxJ � r. Si M(r) = o(r) conforme r .... oo, entonces el problema de
valor inicial
x' = f(x) x(O) = O,
= \ ta;{lx1 -wd-lx2-wd}I tie ne una solución sobre todo IR. Demuestre esta aseveración.
9. Demuestre que el problema de valor inicial
w
� ¿)d Jlx1 -wd-lx2- ;IJ x' = t2 + l x(O) = O,
i=l
n tie ne una solución única e n el intervalo JtJ � 0.351.
� ¿ iadlx1 -x2I = Llx1 -x2l-
i=l
11
10. Demuestre que si f(t,x) es una función continua y acotada en el dominio a � t � b,
-oo < x < oo, e ntonce s el problema de valor inicial

x' = f(t,x) x(a) = a.,


SERIE DE PROBLEMAS 8.1
tie ne una solución en el intervalo a � t � b.
l . Encue ntre dos soluciones de l problema de valor inicial
11. Sea R un rectángulo e n e l plano tx definido por Jt- tol � a., Jx- XoJ � p. Sea/ una
I
x' = X /3 x(O) = O. función continua definida e n este rectángulo, que satisface P � a.J/(t,x)J. De muestre que el
problema de valor inicial x' = f(t,x), x(to) = xo tie ne una solución e n el intervalo definido
por Jt- toJ � a..
2. (a) Use el prime r teorema de esta sección para señalar e n qué intervalo existe una solución
de l problema de valor inicial (3). Encue ntre el intervalo más grande posible . 12. Muestre que el problema de valor inicial

(b) Repita e l inciso anterior para el problema de valor inicial (2). x' = 1+x+x2cost x(O) = O,
3. Demuestre que x =-i1/4 y x = 1- t son soluciones d el proble ma de valor inicial:
tie ne una solución e n el intervalo-1/3 � t � I/3.
Zx' = Vt2+4x-t x(2) =-1. 13. Demuestre que el proble ma de valor inicial

¿Por qué esto no contradice al teore ma 2? x' = vÍXi x(O) = O,

4. Resuelva el problema de valor inicialx' = f(t,x),x(O) = O, en los siguie ntes casos esp eciales: tie ne dos soluciones. Explique por qué el teorema 2 no resulta válido e n e ste caso.
(a) f(t, x) = i3 14. D emuestre que el proble ma
(b)f(t,x) = (1- ?)-1/2 x' = tx2¡3 x(O) = J,

(c)/(t, x) = (1+?)-1 tie ne una solución e n el intervalo-2 � t � 2. ¿Hay más de una solución?
(d)/(t,x) = (t+1)-1 15. D emu estre que el proble ma de valor inicial
Use el
5. Resuelva el problema de valor inicial x' = f(t,x), x(O) = O, e n los siguie ntes casos. x' = 2te_, x(O) = O,
1 dx/dt ;é O.
hecho de que dt/dx = (dx/dt)- cuando
(a)f(t,x) =x-
2
tie ne una solución única e n el intervalo -oo < t < oo. ¿Existe n valor es de a. y P en e l
teorema de existencia y unicidad que permitan llegar a esta conclusión?
(b)f(t,x) = 1+x2
(c)f(t,x) = (senx+cosx)-1 16. Sea/(t, x) una función continua e n el rectángulo definido por JrJ � 3, lxl � 4, y suponga
que lf(t,x)I � 7 para todos los puntos e n este rectángulo. ¿Cuál es el intervalo más grande
6. Use e l primer teorema de es ta se cción para mostrar que el problema de valor inicial para el cual el proble ma de valor inicial

x' = yfxi x(O) = O, x' =f(t,x) x(O) = O,

debe tener una solución?


tie ne una solución e n toda la recta re al.
506 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.2 Método de la serie de Taylor 507

17. Encuentre un intervalo para el que podamos asegurar que el problema de valor inicial La serie de Taylor desempeña un papel central en el procedimiento, y la escribimos
de la siguiente forma:
x' = secx x(O) = O,
h2 h3 h4
tiene una solución única. x(t + h) = x(t) + h x'(t )+ 2!x"(t) + 31 x"'(t) + ¡/4l(t) + ... (4)
18. Use cada uno de los teoremas 1, 2 y 3 para señalar dónde tiene solución el siguiente problema,
y luego resuélvalo explícitamente para comparar la teoría con los hechos: Las derivadas que aparecen aquí se pueden calcular a partir de la ecuación diferencial
incluida en (3) . Se obtiene lo siguiente:
x' = x2 x(O) = l.
x" = - sen t- x' cosx + 2t
19. Demuestre que el problema de valor inicial x111 = - cos t -x" cosx + (x') 2 senx+2
x' = 1 + i x(O) = O, x(4l = sent-x'" cosx + 3x'x" senx+ (x') 3 cos.x.
tiene una solución en el intervalo [-1, l]. Demuestre que este ejemplo no satisface las En este punto nuestra paciencia se agota y decidimos usar sólo los términos hasta e
hipótesis del teorema 3. Explique por qué este ejemplo no contradice al teorema 3. incluyendo h4 en la fórmula (4) . Los términos que no hemos incluido inician con
un término en h5 y constituyen colectivamente el error de truncamiento inherente a
nuestro procedimiento. Se dice que el método numérico resultante es de orden 4 . (El
8.2 Método de la serie de Taylor orden del método de la serie de Taylor es n si se utilizan términos hasta e incluyendo el
denotado por h"x(•l(t)/n!.) Observe que al derivar con respecto a t términos tales como
senx, debemos pensar en dicha operación como d{sen[x(t)]}/dt y utilizar la regla de
Al calcular soluciones numéricas de ecuaciones diferenciales rara vez esperamos obtener la cadena para derivar. Esto explica la complejidad de las fórmulas para x", x'", . ..
directamente la solución en términos de una fórmula que haga explícita la dependencia Podríamos llevar a cabo varias sustituciones con el fin de obtener fórmulas para x'',
de x(t) como una función de t. En lugar de ello construimos usualmente una tabla con x'", .. . que no contengan derivadas de x en el lado derecho de la expresión. Esto no
valores de la función, tal como se ilustra a continuación: es necesario si las fórmulas se utilizan en el orden presentado. Por su propia naturaleza
to t1 t2 tm son recursivas.
I 1 1 t3 (1) En las líneas que siguen presentamos un algoritmo para resolver el problema de
XQ i X¡ i X2 i X3 1 • • • 1 Xm
valor inicial (3), comenzando en t = -1 y continuando con pasos de h = 0 .01 . Como
deseamos obtener una solución en el intervalo (-1,1] debemos tomar 200 pasos.
En este caso x; es el valor aproximado que se obtuvo para x(t;), que es como denotamos
el valor de la solución exacta en t;. Con una tabla como la que se muestra en (1) se
puede construir una función de spline, además de otras funciones de aproximación. Sin inputM ._ 200;h ._ O.Ol;t ._ -1.0;x .... 3 .0
embargo, la mayoría de los métodos numéricos para resolver ecuaciones diferenciales output O, t, x
generan primero dicha tabla. for k = 1, 2, ... , M do
Consideramos una vez más el problema de valor inicial x' .... cost- senx+t2
x' =f (t,x) x'' .... - sent -x' cosx + 2t
{ (2)
x(to) = Xo, x'" .... - cos t- x" cosx + (x') 2 senx+2
x(4l .... sen t + ( (x')3 - x"') cos x+3x' x'' sen x
donde f es una función dada de dos variables, y (t0, x0 ) es un punto a través del cual
x .... x + h(x' + �(x" + �(x'" + �(x(4l)))
debería pasar la curva solución. Una solución de (2) es una funciónx( t) tal que dx( t) / dt =
f (t, x(t)) para todaten alguna vecindad de to, y x(to) = xo. t .... t +h
output k, t, x
Ilustración end.

Para poder utilizar el método de la serie de Taylor es necesario suponer que existen ¿Qué se puede decir de los errores en la solución que hemos calculado? En cada
varias derivadas parciales def. Para ilustrar el funcionamiento del método tomamos un paso el error de truncamiento local es O(h5) debido a que no hemos tomado en cuenta
ejemplo concreto: los términos que incluyen h5, h6, • • • de la serie de Taylor. Con ello, conforme h --> O,
x' = cos t- senx+t2 (3) el comportamiento de los errores locales debería ser similar al de Ch5 • Desafortunada­
{
x(-1) = 3 . mente no conocemos el valor de C. Pero comoh = 10-2, entoncesh5 es10- 10• Por esta
508 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.2 Método de la serie de Taylor 509

razón, con algo de buena suerte, el error en cada paso debería ser aproximadamente de Pros y contras
magnitud 10- 10. Después de algunos cientos de pasos, estos pequeños errores podrían ¿Cuáles son las ventajas y las desventajas del método de la serie de Taylor? Primero
acumularse y arruinar la solución numérica. En cada paso (excepto el primero) la aproxi­ el método depende de derivar repetidamente la ecuación diferencial dada (a menos qu;
maciónxk dex(tk) ya contiene errores, y cálculos posteriores no hacen sino aumentar su nuestra intención sea utilizar sólo el método de orden l ). Por consiguiente, la función
magnitud. Estas observaciones deberían hacemos tomar precauciones acerca de aceptar f(t, x) debe tener derivadas parciales en la región del plano tx por donde pasa la cur va
ciegamente todos los dígitos decimales que aparecen en la solución numérica de una solución. Naturalmente, tal suposición no es necesaria para asegurar la existencia de
ecuación diferencial. una solución. Además, la necesidad de llevar a cabo el trabajo de análisis preliminar es
Cuando se programó el algoritmo anterior y se llevó a cabo una ejecución de la un verdadero inconveniente. Por ejemplo, un error que se cometa en esta etapa puede
rutina, la solución en t = 1 fuex200 = 6.42194. He aquí una muestra de los resultados pasarse por alto y permanecer inadvertido. Por último, hace falta programar por separado
proporcionados por el programa de computadora: las diferentes derivadas.
k t X En cuanto a las ventajas, tenemos la sencillez conceptual del procedimiento y su
O -1.000000 3.00000 potencial para obtener una precisión muy alta en los resultados. Así, si podemos obtener
1 -0.990000 3.01400 fácilmente 20 derivadas dex(t), no hay nada que nos impida usar el método de orden 20
2 -0.980000 3.02803 (es decir, usarlos términos con potencias deh hasta h2º). Con un orden tan alto se puede
3 -0.970000 3.04209 obtener la misma precisión usando un paso de longitud más grande, digamos h = 0.2.
4 -0.960000 3.05617 Es evidente que para recorrer el intervalo dado hacen falta menos pasos y que con ello se
reduce el número de cálculos. Por otra parte, los cálculos en cada paso se vuelven más
engorrosos. Entre los problemas del final de la sección se encuentran algunos ejemplos
196 0.960000 6.36566 en los que se puede utilizar el método de la serie de Taylor de orden superior.
197 0.970000 6.37977 En los últimos años han aparecido algunos programas de manipulación simbólica,
198 0.980000 6.39386 que permiten efectuar varios tipos de cálculos matemáticos rutinarios de carácter no
199 0.990000 6.40791 numérico. Con ello el proceso de integrar o derivar expresiones muy complejas pasa a ser
200 1.000000 6.42194 trabajo de la computadora. Naturalmente, estos programas sólo sirven para usarse en una
En una ejecución posterior se integró la ecuación diferencial tomando este valor dexzoo clase muy restringida de funciones, aunque en la práctica esta clase es suficientemente
como la condición inicial y con h = -0.01. El resultado de esta segunda ejecución del amplia como para incluir todas las funciones que se encuentran en el texto típico de
programa fuex200 :::, 3.00000 en t = -0.999999. La concordancia entre este resultado cálculo. Usando estos programas, el método de la serie de Taylor de orden 20, por decir
y el valor inicial original nos lleva a pensar que la solución numérica tiene una precisión algún orden, puede manejarse sin dificultad.
de casi seis cifras significativas, dato que coincide con el número de dígitos mostrados.
En el ejemplo que hemos estudiado no es difícil calcular el error de truncamiento Errores
local en cada uno de los pasos de la solución numérica. Para hacerlo, recordemos que
el término de error en la serie de Taylor (4) tiene la forma Al resolver numéricamente una ecuación diferencial aparecen varios tipos de erro-
res. Éstos se pueden clasificar de manera conveniente como sigue:
1 0<0 <1. (i) error de truncamiento local
E = -- hn+l (n+l\t+0h)
(ii) error de redondeo local
x
n (n+l)!
(iii) error de truncamiento global
Éste es el error que se presenta cuando la última potencia de h incluida en la suma es h". (iv) error de redondeo global
En el ejemplo hemos tomado n = 4 y h = 0.01. Mediante una sencilla aproximación (v) error total
de diferencias finitas se puede calcularx<5l (t + 0h) y llegar a:
El error de truncamiento local es el que aparece en un paso cuando reemplazarnos
s .J4l(t + h) -.J4l(t) = �[x(4l(r + h) -x(4)(t)J. un proceso infinito por uno finito. En el método de la serie de Taylor reemplazarnos \a
E4:::, !._h [ 1
120 serie de Taylor infinita de x(t + h) por una suma parcial. El error de truncamiento
5!
local es inherente a cualquier algoritmo que podamos escoger, y en gran medida es
h

Haciendo un pequeño esfuerzo de programación, esta aproximación de E4 se puede independiente del error de redondeo. Por supuesto, el error de redondeo lo provoca
añadir al algoritmo y calcularse. No darnos más detalles sobre este punto en vista de la limitada precisión de nuestras máquinas de cómputo, y su magnitud depende de la
que éstos se sugieren como un ejercicio de programación (Prob. 27 .) Cuando se añade longitud de palabra de la computadora (o del número de bits en la mantisa de los números
esta característica al programa, los valores de salida muestran que nuestro cálculo de E4 de máquina de punto flotante).
nunca excede, en valor absoluto, de 3.42 x 10- 11• El programa se ejecutó usando doble Si en el método de la serie de Taylor retenemos términos hasta e incluyendo h"
precisión en una computadora similar a la MARC-32. en la serie, entonces el error de truncamiento local es la suma de todos los términos
510 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.2 Método de la serie de Taylor 511

restantes que no se han incluido. El teorema de Taylor nos indica que todos ellos pueden con t en el intervalo [O, 2]. Dé la solución a este problema usando el método de la serie de
comprimirse en un sólo término de la forma Taylor de orden 4. Al consultar una tabla de la función de error

hn+1 (n+l) ;), erf(t) = jii


--
(n + 1)!
x (
21'O e_,.' ds,
obtenemos x(2) � 0.8820813907. (Véase Abramowitz y Stegun (1964, pág. 311].)
para algún punto cercano ;. Decimos que el error de truncamiento local es O(hn+l ).
Este tipo de error está presente en cada paso del proceso de obtención de la solución 4. (Continuación) En el problema 3 fue necesario calcular las derivadas de la función e-<2.
numérica. La acumulación de todos estos errores de truncamiento local genera el error Demuestre que la derivada n-ésima de esta función adopta la forma e-1 P.(t), donde los
2

de truncamiento global. Una vez más, este error estará presente aun si se realizan polinomios P. se determinan recursivamente mediante las fórmulas
todos los cálculos usando aritmética exacta. Éste es un error asociado con el método y
{Po= I
es independiente de la computadora con la que se realicen los cálculos. Si los errores de
truncamiento local son ow+1 ), entonces el error de truncamiento global debe ser OW). Pn+r(t) = P�(t) - 2tP.(t)
Esto se debe a que el número de pasos necesarios para alcanzar un punto arbitrario T, Demuestre por ejemplo, que,
habiendo iniciado en to, es (T - to)/h.
El error de redondeo global es la acumulación de los errores de redondeo local de P4(t) = 12 - 48t2 + 16t4
los pasos anteriores. El error total es la suma de los errores de truncamiento global y Ps(t) = -120t + 160t3 - 32l
del error de redondeo global. Si el error de truncamiento global es OW) decimos que
el procedimiento numérico es de orden n. '5. (Continuación) Sírvase del problema anterior para diseñar un programa de computadora que
calcule la integral del problema 3 utilizando el método de la serie de Taylor de orden 6.
Verifique el código conh = O.O I para ver si se obtiene el valor dex(2) dado en el problema
Método de Euler 3. Imprima una tabla de la función !Jii erf(t) con pasos de O.DI desde t = O hasta t = 2.
El método de la serie de Taylor con n = 1 se llama método de Euler. Su expresión <6. Resuelva el problemadevalorinicialx' = I+x2,x(O) = O en el intervalo [0, 1.56], utilizando
formal es la siguiente: el método de la serie de Taylor de orden 4 con h = O.DI. Use luego el valor calculado
x(t + h) = x(t) + hf(t, x). de x(l.56) como valor inicial para integrar en sentido inverso hasta t = O. Compare los
resultados y explique qué sucedió.
Esta fórmula tiene la obvia ventaja de que no necesita tomar ninguna derivada de f. Sin
embargo, dicha ventaja se neutraliza por la necesidad de tomar pequeños valores de h '7. La ecuación tan-1(x/t) = In v'x2 + t2 define ax de manera implícita como una función de
t. Verifique que esta función implícita es una solución del problema de valor inicial
para obtener una precisión aceptable. Aun así el método es un ejemplo útil y tiene una
gran importancia teórica, en vista de que algunos teoremas de existencia se sustentan en x' = (t + x)/(t -x) x(l) = O.
él. Con relación a dichos teoremas de existencia consulte a Henrici [1962. págs. 15-25].
Prepare una tabla de la función x(t) en el intervalo [O, 2] con pasos de ±0.01. Utilice el
método de la serie de Taylor de orden 4.
SERIE DE PROBLEMAS 8.2
' l. Diseñe y verifique un programa de computadora que resuelva la siguiente ecuación diferen­
cial: x' = x +e'+ tx, con valor inicial x(l) = 2, en el intervalo (1, 3]. Utilice el método de
'8. La función
q,(t) = 1' sen s2 ds,
la serie de Taylor de orden 5 yh = 0.01.
se conoce como integral de Fresnel. Haga una tabla de esta función en el intervalo [O, 10].
'2. Diseñe y verifique un programa de computadora para resolver el siguiente problema de valor Utilice el método de la serie de Taylor de orden 5 con h = O. l. Si es posible, obtenga
inicial: x' = 1 + x 2 - t3, x(O) = - l. Utilice el método de la serie de Taylor de orden 4, mediante la computadora una gráfica de la función.
tomando ah como un número de máquina binario cercano a 0.01. Encuentre la solución en
el intervalo [O, 2]. Explique cualquier fenómeno peculiar que detecte en la solución. '9. (Continuación) Demuestre que las derivadas de la función/(t) = sen t2 son:
'3. Los métodos para resolver problemas de valor inicial también se pueden usar para calcular f•>(t) = P.(t) sen t2 +Q.(t) cos t2,
integrales, tanto definidas como indefinidas. Por ejemplo, podemos calcular
donde P• y Q. se calculan recursivamente mediante
[ e-? ds,
{Po= 1 Qo =0
{
Pn+I = P� - 2tQn Qn+r = Q� + 2t P•.
resolviendo el problema de valor inicial
Use esta información para generar una tabla de Pn y Q. desden = O hasta 6. Modifique
x' = e-<2 x(O) = O, el código en el problema 8 para convertirlo en uno de séptimo orden. Repita lo hecho en el
8.2 Método de la serie de Taylor 513
diferenciales ordinarias
512 Capítulo 8 Solución numérica de ecuaciones
17. Utilizando la ecuación diferencial
0.2. Compare el valor de cp(l 0) obtenido
problema 8, primero con h = 0.1 y luego con h =ma 8.
al usar h = 0.2 con el valor obtenido en el proble x' = x2 +xi x(O) = 1,

e10. La función
y un paso del método de la serie de Taylor de orden 3, calcule x(0.01).
2 9 112 d9
x(t) = L (1- k se n ) , 18. Considere la ecuación diferencial ordinaria
5tx' +x2 = 2 x(4) = l.
a de segundo tipo. Haga una tabla
donde k es un parámetro en [O, l], es una integral elíptic intervalo O ;;; t � ! . Para ello
de esta función para el caso en que k = !,
limitán dos e al Calcule x(4.1) usando un paso del método de la serie de Taylor de orde n 2.
h = 0.01.
utilice el método de la serie deTaylor de orde n 3 con el 9. Escriba un programa de computadora que resuelva el problema de valorinicial
e 11. R esuelva el problema de valor inicial r
x' = +x2+2tt x(O) = 7,
(3t x+x
x, = -- utilizando el método de la serie deTaylor. Se busca una so!u ción en elintervalo-2;;; t;;; 2.
2 2)
x(l ) = -2,
3 (2t + 3tx) Tome los términos hasta e incluyendo h3 • Use un paso de longitud O.O!.
el intervalo [O, 1] con pasos h = -O.O l . c20. Escriba un programa para calcular una tabla de valores para la función
mediante el método de la serie deTaylor de orde n 2 en
Utilice l a funciónimplíc i
Compruebe también la validez
ta i3 x2+
de
tx3
la
+4 =
soluci
O
ón
como
implí
una
cita.
verificación d e l a solu ción calculada.

ado, calcule una tabla de la función diloga·


x(t) = i' sen(u3) du,
e12. Resolviendo un problema de valor inicial apropi
ritmo
f(x) = -1'
o
log(l - t)
t
dt,
Deseamos cubrir el intervalo 2� t� 5 con pasos de longitud 0.05. Hágalo escogiendo un
problema de valor inicial adecuado. Luego calcule la solución numérica usando el método
de la serie de Taylor de orden 3. Estime la precisión de la tabla resultante.
en el intervalo -2 ;;; xi O. (Compare los resultados con lo que se hizo en el proble ma 15 21. Una ecuación integral es una ecuación queincluye entre sus términos una función descono­
cida dentro de unaintegral. He aquí un ejemplo típico de ecuación integral ( conocida como
de la sección 6.7.)

1'
integral de Volterra):
c¡3, Los métodos del cálculo elemental no bastan para obte ner una función que permita calcular
x(t) =
./
los valores de J 1+x3 dx ( que es una integral elíptica). Calcule una tabla de la función cos(s+x(s))ds+e'.

Derivando esta ecuación integral obtenga un problema de valor inicial equivalente para la
f(x) = [ v'Í+t3 dt, función desconocida.
c22. (Continuación) Resuelva la ecuación integral del problema 21 usando el método de la serie
inicial adecuado. Use el método de Taylor de orden 3 en el problema de valor inicial equivalente. Obtenga la solución en el
· en el intervalo O� x;;; 5 resolviendo un proble ma de valor intervalo [O, 3] usando pasos de longitud 0.01.
de la serie deTaylor de orden 3 con h = 1/64.
23. Si se utiliza el método de la serie deTaylor para resolver un problema de valor inicial asociado
r/
14. Verifique que la función x(t) = 4 resuelve el probl
ema de valor inicial
con la ecuación diferencial
x' = cos(tx),
x' = ../x x(O) = O.
¿cuáles son las expresiones parax", i" y x'4>?
Aplique el método de la serie de Taylor de orden 1 y explique por qué la solu ción numérica 24. Seax' = f(t,x). A partir de esta ecuación determine x", x"' y x'4>.
difiere de la solución 12 /4.
c25. Con ayuda de un programa de manipulación simbólica, resuelva el problema de valor inicial
c¡5, Considere el problema de valor inicial i = 1 - xt- 1, x(2) = 2. De muestre que dado por la ecuación (3) en el texto, usando el método de la serie deTaylor de órdenes 4 y 20.
Compare estas soluciones con los resultados numéricos proporcionados en el texto. Haga
-1 una comparación entre estos dos métodos de series deTaylor utilizando diferentes longitudes
J' = (1 - 2x')t del paso h. Determine qué tan grande puede ser h en el método de orden 20 para obtener la
{
x(n) = -nx(n
-l) -1
t (n � 3). misma precisión que el método de orden 4 con h = O. O l.
c26. (Continuación) Repita lo anterior para el problema de valor inicial que aparece en el pro­
a de valor inicial mediante el
Diseñe un programa de computadora que resuelva este problema usando h = 1 y el intervalo blema 7.
método de la serie de Taylor de orden 10. Pru b su program
rela con su solución numérica. c21. Reprograrne el eje mplo del texto e incluya la expresión dada para E4.
e e

[2, 20]. ¿Cuál es la solución analítica del problema? Compá


(Véase Conte y de Boor [1980]. ) c28. Resuelva numéricamente el problema de valor inicial
16. Calcule x(O. l ) resolvie ndo la ecuación diferencial (x'l- 2tt' -x cost = O x(O) = O,
¡ = -tx 2
x(O) = 2, en el intervaloO;;; t � l. (La solución trivial no es la que buscamos en este caso.) ¿Qué
habría hecho si en lugar de (x')2 apareciera (x'f?
con un paso del método de la serie de Taylor de orden 2. (Use una calculadora de mano.)
514 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.3 Métodos de Runge-Kutta 515

8.3 Métodos de Runge-Kutta La ecuación (3) se puede reescribir como:

El método de la serie de Taylor de la sección anterior presenta la desventaja de requerir f f


x(t + h) = x + hf + hf(t + h,x + hj) + O(h3 ).
algún análisis previo a su programación. Por ello, si deseamos utilizar el método de la
serie de Taylor de orden 4 en el problema general Por consiguiente la fórmula para efectuar un avance de la solución es

h h
x' =f(t,x) x(t + h) = x(t) + zl(t, x) + zl(t + h,x + hf(t,x)),
{ (1)
x(to) = Xo,
o su equivalente:
deberemos derivar sucesivamente la expresión de (1) para determinar fórmulas para x'', x(t + h) = x(t) + f(F¡ + F2 ), (4 )
x'", xC4l . Una vez hecho esto, las funciones deberán programarse.
Los métodos de Runge-Kutta evaden esta dificultad, a pesar de que imitan a los mé­ donde
F¡ = hf(t, x)
todos de la serie de Taylor mediante una combinación ingeniosa de los valores def(t, x). {
Ejemplificamos lo anterior mostrando un procedimiento de Runge-Kutta de segundo F2 = hf(t+h,x+F1).
orden. Esta fórmula se puede utilizar repetidamente para avanzar paso a paso en el proceso. Este
procedimiento se conoce como método de Runge-Kutta de segundo orden. También
se llama método de Heun.
Método de Runge-Kutta de segundo orden
Generalmente las fórmulas de Runge-Kutta de segundo orden adoptan la forma
Comencemos con la serie de Taylor parax(t + h):
x(t + h) = x + w1hf + Wzhf(t + ah,x + Phf) + O(h3 ), (5)
2
h h3
.x(t + h) = x(t) + hx'(t) + 21 x"(t) + 31 x (t) + · · ·
"'
(2)
donde w1, w2, a, p, son parámetros a nuestra disposición. La ecuación (5) se puede
reescribir con la ayuda de la serie de Taylor de dos variables como:
A partir de la ecuación diferencial, tenemos:
x(t + h) = x + w¡hf + w2h[f + ahft + Phffx] + O(h3 ). (6)

x'(t) = f Al comparar (3) con (6) observamos que debemos imponer las siguientes condiciones:
x"(t) = Ít +fxx' = Ít +fxf
x"'(t) = !11 +frxf + (Ít +fxj)fx + f(fxr +fxxf) W¡+Wz = �

ect. { WzU = z (7)

En este caso los subíndices denotan derivadas parciales y se ha utilizado repetidamente


w2P = f.
la regla de la cadena para las derivadas. Los primeros tres términos de la ecuación (2)
se pueden escribir ahora como:
f,
Una solución es w1 = w2 = a = p = 1, que corresponde al método Heun de la
ecuación (4). El sistema de ecuaciones (7) posee otras soluciones, como la que resulta
de tomar w1 = O, w2 = 1, a = � = !- La fórmula que se obtiene a partir de (5) se
x(t + h) = x + hf + !h2 (ft +jfx) + O(h3 ) conoce como método de Euler modificado:
(3)
f
=X+ hf + !h íJ + lifi + hffx] + O(h3). x(t + h) = x(t) + F2,

donde x significa x(t) y f representa f(t x), etcétera. Podemos eliminar las derivadas donde
parciales recurriendo a los primeros términos de la serie de Taylor de dos variables (como F¡ =hf(t,x)
se señaló en la sección 1.1) {
f
F1 = hf(t + h,X+ !F¡ ).

f(t + h,X+hj) = f + hft + hffx + O(h2). Compare esto con el método de Euler estándar descrito en la sección 8.2.
516 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.3 Métodos de Runge-Kutta 517

Método de Runge-Kutta de cuarto orden A continuación se muestran algunos de los valores de salida del programa de computadora
basado en este algoritmo:
Resulta muy tedioso deducir las fórmulas de Runge-Kutta de orden superior, y
por lo tanto no lo haremos. Sin embargo, las fórmulas son muy elegantes y se pueden
programar fácilmente una vez que se han deducido. A continuación se presentan las k t X e
expresiones para el método de Runge-Kutta de cuarto orden clásico: O 1.00000 2.00000
l 1.00781 1.98473 l.19E-07
x(t+h) = x(t)+ i(F1+2Fz+2F3+F4), (8) 2 1.01563 1.97016 o.
donde 3 1.02344 1.95623 o.
F1 = hf(t,x) 4 1.03125 1.94293 l.19E-07
F2 = hf(t + !h,x + !F1) 5 1.03906 1.93020 l.19E-07
{
F3 = hf(t+ ih,x+ !F2)
6 1.04688 1.91802 o.
7 1.05469 1.90637 l.19E-07
F4 = hf(t+h,x+F3), 8 1.06250 1.89521 l.19E-07
Esto se llama método de cuarto orden debido a que reproduce los términos en la serie 9 1.07031 1.88452 o.
de Taylor hasta e incluyendo el que incluye a h4• Por consiguiente el error es O(h5).
Además, expresiones exactas para este término de error son conocidas. 249 2.94531 1.86387 7.15E-07
250 2.95313 1.86569 5.96E-07
Ejemplo Proporcione un algoritmo que incorpore el método de Runge-Kutta de orden 4 para
251 2.96094 1.86750 7.15E-07
resolver el siguiente problema de valor inicial:
252 2.96875 1.86932 5.96E-07
x' = t-2(tx-x2) 253 2.97656 1.87115 4.77E-07
{ (9) 254 2.98438 1.87297 5.96E-07
x( l) = 2,
255 2.99219 1.87480 5.96E-07
en el intervalo [l, 3], usando pasos de longitud h = 1/128. 256 3.00000 1.87663 5.96E-07 11
Respuesta Dado que éste es un experimento numérico para medir la efectividad del procedimiento,
se ha elegido un problema con una solución analítica conocida. La solución de (9) se
!
expresa como x(t) = ( + Int)- 1 t. El programa de computadora imprime los valores del
Errores
error. Pasamos ahora a discutir el error de truncamiento en el procedimiento de Runge­
Kutta Descrito burdamente, el error de truncamiento local es el error que surge en cada
input M <-- 256; t <-- 1.0; x <-- 2.0; h<--0.0078125 paso debido sencillamente a que nuestros métodos no pueden tomar en cuenta todos
definef(t, x) = (tx -x 2)/t2 los términos de una serie de Taylor. Este error es inevitable y estará presente aun si los
define u(t) = t/(! + lnt)
cálculos se ejecutan con precisión infinita. En el caso del método de Runge-Kutta de
cuarto orden ( estudiado previamente), las fórmulas incluyen un error de truncamiento
e<--[u(t)-x[ local de orden O(h5). Este orden de error corresponde exactamente al error en el método
output O, t, x, e de la serie de Taylor cuando se incluyen términos hasta h4 en la fórmula de Taylor.
for k = 1,2,... ,M do En el mismísimo primer paso del procedimiento de Runge-Kutta de cuarto orden
F1 <--hf(t,x) se calcula mediante el algoritmo un valor dex(to+h). Por otra parte, existe una solución
correctax*(to + h), que no conoceremos. En este paso el error de truncamiento local es,
F2 <-- hf(t+ ih,x+ iF1) por definición:
F3<--hf(t+fh,x+!Fz) x*(to + h) - x(to + h).
F4<--hf(t+h,x+F3)
x<--x+(F1+2Fz+2F3+F4)/6 La teoría del algoritmo de Runge-Kutta nos indica que este error de truncamiento se
t .... t+h
comporta como Ch5 para valores pequeños de h. En este caso C es un número indepen­
diente de h pero que depende de to y de la funciónx•. Para calcular Ch5 suponemos que
e<-- [u(t)-xf C no cambia conforme t cambia de to a t0 + h. Sea v el valor de la solución aproximada
output k,t, x, e en to + h que se obtiene tomando un paso de longitud h partiendo de t0• Sea u la solución
end. aproximada en to+h que se obtiene tomando dos pasos de longitud h/2 partiendo de to.
518 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.3 Métodos de Runge-Kutta 519

Ambas soluciones se pueden obtener en la computadora. Debido a la suposición que se solución y las denotamos con x(t + h) y x(t + h):
hizo tenemos que
= x(t) + ¿ a;F¡
6
x*(to+h)=v+Ch5
x(t + h) (10)
x*(to + h)=u+2C(h/2)5. i=l

De estas dos ecuaciones se obtiene, mediante una sustracción,


¿ b;F;.
6
x(t + h) = x(t) + (11)
error de truncamiento local= Ch5= (u v)/(1 2-4). i=l
- -
Las cantidades F; se calculan a partir de fórmulas del tipo:
Por consiguiente el error de truncamiento local se puede aproximar mediante u v.
- i-1
Al poner en práctica en la computadora el método de Runge-Kutta, la aproximación
al error de truncamiento puede en ocasiones vigilarse mediante el cálculo de !u vi. F; = hf(t +c¡h,x+ ¿dgFj) (i = 1,2, ... 6). (12)
Esto se realiza con el fin de asegurarse de que el error permanece por debajo de-una j=l

tolerancia previamente especificada. Si no lo hace, la longitud del paso puede disminuirse La fórmula (10) es de quinto orden, mientras que la (11) es de cuarto orden. Su diferencia,
(usualmente a la mitad) para mejorar el error de truncamiento local. Por otro lado; si e= x(t + h)-x(t + h), se puede interpretar como una estimación del error de truncamiento
el error de truncamiento local está muy por debajo de un umbral permitido, entonces la local que resulta de la menor precisión de la fórmula (11). Por consiguiente, e se puede
longitud del paso puede aumentarse al doble. utilizar para monitorear la longitud del paso. Como la fórmula (10) es la de mayor
Como ya vimos en la derivación del método de Runge-Kutta de orden 2, hay ciertos precisión, se utiliza para calcular el valor de salida del algoritmo. Observe que
parámetros que deben seleccionarse. Un proceso de selección similar ocurre al plantear
métodos de Runge-Kutta de orden superior. Como podemos ver, no hay sólo un método 6
de Runge-Kutta de cada orden, sino una familia de métodos. Tal como se muestra en la e= x(t + h) - x(t + h)= ¿(a; b;)F;. (13)
-
siguiente tabla, el número de evaluaciones requeridas aumenta más rápidamente que el i=l

orden de los métodos de Runge-Kutta.


En la tabla siguiente se presentan los valores de los coeficientes.
Número de evaluaciones de la función 2 3 4 5 6 7 8
a; a;-b; C¡ dij
Orden máximo del método de Runge-Kutta 2 3 4 4 5 6 6 16 1
1
135 360
o o
Desafortunadamente esto hace que los métodos de Runge-Kutta de orden superior sean 1
menos atractivos que el método de cuarto orden clásico, ya que su uso resulta más
2 o o 4 4
costoso. 6656 128 3 3 9
3
12825 4275 8 32' 32
28561 2197 12 1932 7200 7296
Método de Runge-Kutta-Fehlberg adaptativo 4
56430 75240 13 2197' - 2197' 2197
En un esfuerzo por diseñar un procedimiento para ajustar automáticamente la lon­ 9 1 439 3680 845
gitud del paso en el método de Runge-Kutta, Fehlberg [1969] recurrió a un método de 5 3
50 50 216' - , 513 ' - 4104
cuarto orden con cinco evaluaciones de la función y a un método de quinto orden con seis 2 2 8 3544 1859 11
evaluaciones de la función. A primera vista esto no parecía ser muy prometedor debido 6 2
55 55 2 -27' • - 2565' 4104' -40
a que su método de cuarto orden requería más cálculos de los valores de la función que el
método clásico. Más aún, en conjunto estos dos métodos necesitarían un total de once Una rutina adaptativa que utiliza las fórmulas anteriores intenta mantener la magni-
evaluaciones de la función. Sin embargo, Fehlberg fue capaz de elegir los parámetros tud del error de truncamiento local, e, por debajo de una cierta tolerancia, 8, establecida
en estos métodos de manera que obtenía dos fórmulas de distinto orden utilizando los previamente. Se busca la solución en un cierto intervalo [a, b] y se proporciona la infor­
mismos puntos para las evaluaciones de la función. Con ello sólo se necesitan seis eva­ mación acerca de un valor inicial dado, x(a)= a.. También se señala una cota superior M
luaciones de la función, y como bono obtenemos además una estimación del error de sobre el número de pasos. Observe que el procedimiento es conservativo, debido a que se
truncamiento local que nos sirve como apoyo para controlar la longitud del paso. El usa el error de truncamiento local en un método de cuarto orden para controlar la longitud
método de Runge-Kntta-Fehlberg es de orden 5 y utiliza dos fórmulas, de órdenes 4 del paso, mientras que la solución numérica se calcula con una fórmula de quinto orden.
y 5 respectivamente. Estas fórmulas proporcionan diferentes valores aproximados de la Más adelante se presenta un algoritmo para llevar a cabo el procedimiento. Debido a
520 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.3 Métodos de Runge-Kutta 521

que el error de truncamiento local es Ch5 cuando se calcula mediante x(t) -x(t), parece Los procedimientos de Runge-Kutta anidados se componen de un par de fórmulas
sensato duplicar la longitud del paso cuando esta duplicación conduce a C(2h)5 <6/ 4. de órdenes p y q (usualmente q = p + 1) que comparten los mismos puntos donde se
Por lo tanto duplicamos el valor de h cuando el error de truncamiento local aparente se evalúan las funciones. En general estos procedimientos ponen a nuestra disposición
encuentra por debajo de 6/128. una técnica eficiente para resolver problemas de valor inicial asociados con ecuaciones
Otra fórmula de uso común para controlar el error por paso es la siguiente: no rígidas. En los últimos años se ha generado un número considerable de fórmulas
que forman parte de los métodos de Runge-Kutta anidados de orden superior. Sobre
h +- 0.9h[6/lelJ 1 /(I+p), estos aspectos encontrará en los problemas algunos ejemplos. A pesar de que se cuenta
con algunos métodos de Runge-Kutta de orden superior con coeficientes complicados
donde p es el orden de la primera fórmula que aparece en el par de fórmulas de Runge­ la clásica fórmula de cuarto orden continúa siendo la más popular a excepción de los
Kutta. (Consulte, por ejemplo, Hull, Enright y Feller [1972] y a Shampine, Watt y esquemas adaptativos. Se puede encontrar información adicional acerca de los métodos
Davenport [1976].) Se utiliza la misma fórmula, tanto para aumentar como para dismi­ de Runge-Kutta en numerosas fuentes, por ejemplo, en Butcher (1987], Fehlberg [1969],
nuir la longitud del paso h. En un caso se vuelve a calcular la longitud de paso que ha Gear [1971], Jackson, Enright y Hull (1978], Prince y Dormand (1981], Shampine y
sido rechazada, en tanto que en el otro se establece una nueva longitud del paso. Gordon [1975], Thomas [1986] y Verner [1978].
En las siguientes líneas presentamos un algoritmo del método de Runge-Kutta
adaptativo: SERIE DE PROBLEMAS 8.3
input a, a, b, h, 6, M 'l. Diseñe un programa de computadora para resolver el problema de valor inicial x' =f(t, x),
t+-a;x +- a con x(to) = Xo, en el intervalo to � t ;;¡ tm o tm � t ;;¡ to. Utilice el método de Runge-Kutta
de cuarto orden. Póngalo a prueba con este ejemplo:
iflag +-1
fork = 1, 2, ... , M do (e'+ I)x' +xe' -x = O x(O) = 3.
d+-b-t
if ldl � lhl then Determine la solución ana/[tica y compárela con la solución calculada en el intervalo -2 ;;¡
t ;;¡ O. Use h = -0.01.
iflag+- O
h+-d 2. Escriba las fórmulas de Runge-Kutta de segundo orden en el caso en que a. = 2/3.
end if '3. Usando diferentes valores de A., tales como 5, -5 o -10, resuelva numéricamente el siguiente
s +-t problema de valor inicial con el método de Runge-Kutta de cuarto orden.
y +-X
compute F¡, Fz, ... , F5 [Ecuación (12)]
x' =A.X+ sent - A.cost x(O) = O.
computex [Ecuación (10)] Compare la solución numérica con la solución anaütica en el intervalo [O, 5]. Tome h = O.O l .
compute e [Ecuación (13)] ¿Cuál es el efecto d e A. sobre l a precisión numérica?
t+-t+h 4. Si se desea resolver mediante el método de Runge-Kutta un problema de valor inicial que
output k, t, x, e atañe a la ecuación diferencial x+ 2tx'+ x:x' = 3, ¿ cuál es la función que debe programarse?
if iflag = O then stop 5. Demuestre que la fórmula de Runge-Kutta (8) es de orden 4 en el caso especial en que/(t, x)
if lel ;;; 6 then es independiente de x. Demuestre que en este caso la fórmula de Runge-Kutta es equivalente
a la regla de Simpson. (Véase la Ec. (6) en la Sec. 7.2.)
h+-2h
t +- s 6. Deduzca el método de Euler modificado, cuya expresión es
h+-h/2
X +-y x(t + h) = x(t) + hf ((t + ;.x(t)+ ;f(t,x(t))).
k+-k-1
else llevando a cabo una extrapolación de Richardson en el método de Euler con pasos de longitud
if lel <6/128 then h+-2h h y h/2.
endif c7_ Programe y ponga a prueba el algoritmo de Runge-Kutta-Fehlberg que se describió en el
end. texto. Use como casos de prueba los ejemplos que aparecen en los problemas 8, 11 y 15 de
la sección 8.2.
522 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.3 Métodos de Runge-Kutta 523
cs. Diseñe y ejecute un programa que resuelva este problema de valor inicial: donde
F1 =hf(t,x)
x' = e"+cos(:c - t) x(l) = 3.
F2 = hf(t+ th. X+ }F1)
Utilice las fónnulas de Runge-Kutta de cuarto orden con h = 0.01. Detenga el cálculo justo F3 =: hf(t+ }h.x+ iF1 +iF2)
antes de que la solución provoque un desbordamiento por exceso.
f4 = hf(t+h,x- F2+2F3 )
9. Deduzca las fónnulas de Runge-Kutta de tercer orden
Fs = hf(t+ fh, x+ i-;F1 + �F2+ �F4)
x(t+h) = x(t)+ !(2F1 +3F2+4F3 ), F6 = hf(t+ ih.x+ �F1 - iFz+ �F3 + tgF4 - ffiFs).

donde
F1 = hf(t,x) <t6. Los coeficientes de la siguiente tabla corresponden al método de Runge-Kutta-Merson. Es­
criba y someta a prueba una rutina adaptativa basada en este método.
{ = hf(t+ th,x+ tF1)
F2
F3 = hf(t+ ih.x+ Ífz). a¡ a;-b; C¡ dij
1 1
Demuestre que para la ecuación diferencial x' = x+t concuerda con el método de la serie 6 is o o
de Taylor de orden 3. 2 o o l
3 3
10. Demuestre que cuando el método de Runge-Kutta de cuarto orden se aplica al problema 3 o - iii3 1
3
1 1
6' 6
x' = :U, la fónnula para generar la solución es
4 lo, l
2 4 1
3 is í
2 3 5 1
x(t+h) = [1+h)..+ }h )...2+ !h ).. + �h t.. ]x(t).
3 4 4
1 f. o. -!,2
1
6 -30

e17. Escriba y pruebe una rutina adaptativa basada en el método de Runge-Kutta-Vemer de quinto
11. (Continuación) Demuestre que el error de truncamiento local en el problema 10 es O(h5).
orden dado por los coeficientes que aparecen en la siguiente tabla. (Vemer (1978]):
e12. Usando el procedimiento de Runge-Kutta adaptativo, resuelva el problema x' = x2, x(O) = 1
en el intervalo [O,2]. Demuestre que la verdadera solución esx(t) = 1/(1-t). ¿Qué sucede a¡ a,-b, C¡ dij
con el algoritmo cerca de la discontinuidad que aparece en t = 1?
so3 641i
33
o o
<¡3, Compare numéricamente el siguiente método, llamado de Runge-Kutta-Gil! de cuarto orden, 2 o o 1
con el método clásico de Runge-Kutta. is is
3 4
E -m
132 1 1
- 12, ;¡
l

i
x(t+h) = x(t) + [F1 - (2 - VZ)F2+(2+V2)F3 + F4], 4 243
1120
891
2240
6
2
9
4 8
- u, 27, 2
si
donde
F1 = hf(t,x)
5 77
160 -no33
3
2 40 4 S6S4
JJ,-TI,- TI, TI
6 73 _..n. 369 72 S380
-73, 12285 269S
F2 = hf(t+ }h.x+ !Fi)
7iiii 700 73' 2!9' - 584, 17S2
{ 7 o 891
8329 9
8
-m, m, 891• -u, v
8716 656 39S20 416 S2
F3 = hf(t+ }f.x+ t(V2 - l)F1 + !(2 - V2)F2)
8 o 2
is
301S 9 4219 S98S S39 693
256 ' - 4' - 78 ' 128 ' - 394' 3328
f4 = hf(t+h,x+ i(2 - V2)F2+ iF3+ i(2+V2)F4).

<¡4_ Considere el problema de valor inicial x' = -loe, x(O) = 1, en el interval0 [O, l], con c¡g_ Los coeficientes de la siguiente tabla corresponden a un par de fónnulas de Runge-Kutta de
diferentes valores para la constante de decaimiento k. Demuestre que la solución analítica orden 6 y 5. (Consulte aPrince y Donnand (1981].) Con ellos escriba y ponga a prueba una
es x(t) = e-1a. Usando k = 5 y varios valores de h, tales como 0.2, 0.4, 0.6, 0.8 y 1.0, rutina adaptativa.
compare el comportamiento del método de Euler con el de Runge-Kutta-Gill (presentado
en el problema anterior). Repita lo anterior usando k = 25. Para resolver este problema a¡ b¡ C¡ dij
correctamente en ·el caso del método de Euler es necesario que se satisfaga la condición 821
10800 864
61
o o
O ;;;; hk ;;¡; 2, en tanto que para el método de Runge-Kutta-Gill hace falta que O ;;;; hk ;;¡; 2.8. l
2 o o 1
iii iii
Éstas son las regiones de estabilidad para este problema cuando se utilizan dichos métodos.
Dado un problema particular y un método, podemos ajustar h para intentar mantenemos 3 19683
ñIB
9841S
321776
2
9 _].
81' 81

dentro de la región de estabilidad, o alternativamente recurrir a un método de orden superior 4 17S273 16807 61S 270 1053
1372' -343, 1372
3
con una región de estabilidad más grande. Tal como lo discutió Thomas [1986], es imposible 912600 'i46iii6 7
usar tales métodos con valores grandes de k. 5 39S
-:ss,
137S 3 3243 S4 S0949 4998
i67'i 7344 5 ssoo• ñsoii• 17875
e15. Recurra a un problema con una solución conocida para comparar numéricamente el método 6 18S 137S 4 26492 72 2808 24206 338
2704 5 - 37125' 55' 2337S' - 37125' 459
clásico de Runge-Kutta con el siguiente método de Runge-Kutta de quinto orden: S408
7 -mo ��¿. -;¡. -;i:, ��i, -¡:. !:
3 37
so
x(t+h) = x(t)+ �F1 + ;&F4+�Fs+ �F6, 8 o iii :�i· -i��. -?t�°i?!, ��11!1;t. -:��. !�:. 0
524 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.4 Métodos multipaso 525

8.4 Métodos multipaso Los coeficientes A, B, C, D, E, se determinan pidiendo que la ecuación (5) sea exacta
siempre que el in:tegrando sea un polinomio de grado � 4. El problema 8 nos indica
El método de la serie de Taylor y el de Runge-Kutta, utilizados para resolver el problema que no se pierde generalidad al suponer que tn = O y h = I, tal como se esboza en la
de valor inicial, son métodos de un solo paso. Se llaman así debido a que no recurren figura 8.1.
a valores previos de x(t) durante el avance de la solución de t, a t + h. Si to, t1, t2, ... ,
t¡ corresponden a los pasos que se toman a lo largo del eje t, entonces Xi+I (el valor
aproximado de x(t¡+¡)) depende sólo dex¡, y no se usan los valores aproximados de X¡_ 1,
X¡_z, .. .,xo.
Se pueden diseñar procedimientos más eficientes si en cada paso se utilizan algunos -4 -3 -2 -1 o
valores previos de la solución. El principio que nos guía se describe en las líneas
t,, _4 ln-J ln-2 ln-1 t, ln+I
siguientes. Deseamos resolver numéricamente el problema de valor inicial:

x1 = f (t,x)
{ (1) Figura 8.1.
x(to) = XQ.
Contamos con puntos o pasos preestablecidos to, t¡, t2, ... , tn sobre el eje t. (No siempre Tomamos como base de � los siguientes cinco polinomios:
estarán igualmente espaciados.) Si denotamos conx(t) a la solución verdadera, al integrar
la ecuación (1) obtenemos
po(t) = 1
p¡(t) = t
1.tn+t
x'( t) dt = x(tn+i) - x(tn),
t, pz(t) = t(t + 1)
y luego
x(t.+1) = x(t.) +
1.tn+t
f (t, x(t)) dt. (2)
p3(t) = t(t + I)(t + 2)
p4(t) = t(t + l)(t +2)(t + 3).
t,

La integral a la derecha se puede aproximar mediante un esquema de cuadratura numé­ Cuando éstos se sustituyen en la ecuación
rico, y el resultado será una fórmula que genera paso a paso la solución aproximada.

[ p.(t) dt = Ap.(0 ) + Bp.(- I) + Cp.(-2) + Dp.(-3) + Ep.( -4),


Fórmula de Adams-Bashforth
Suponga que la fórmula resultante es del tipo siguiente: obtenemos cinco ecuaciones que nos permiten determinar el valor de los coeficientes
A, B, C, D, E. Este sistema de ecuaciones es
Xn+I = Xn + afn + bfn-1 + CÍn-2 + · · · (3)

donde f¡ denota!(t¡, x¡). Una expresión de este tipo se conoce como fórmula de Adams­ A+B+C+D+E = 1
Bashforth. Pasamos a presentar la fórmula de Adams-Bashforth de orden 5, apoyada -B -2C - 3D - 4E=}
en los puntos t¡ = to + ih, para O � i � n, todos ellos igualmente espaciados:
2C + 6D + 12E = i (6)
Xn+I = Xn +
h
[1901fn -2774fn-l +2616.fn-2 -1274.fn-3 +25Ifn-4]• (4) -6D-24E = �
?20
24E = �01
¿Cómo se determinaron estos coeficientes? Empezamos con la intención de apro­

1.
ximar la integral que aparece en (2) de la manera siguiente: Los coeficientes de la fórmula (4) se obtienen mediante sustitución hacia atrás.
t,,.¡ El procedimiento anterior se conoce como método de los coeficientes indetermi­
f(t, x(t)) dt � h[A.fn +Bfn-1 + Cfn-2 +Dfn-3 +Efn-4]. (5) nados. En principio puede usarse para obtener fórmulas similares de orden superior y
,, en otros tipos de situaciones. (Véase Sec. 7.2.)
526 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.4 Métodos multipaso 527
De manera alternativa, podríamos obtener los valores de estos coeficientes desco­ convergerá a un punto fijo de $ bajo las hipótesis apropiadas. En particular, en esta
nocidos partiendo directamente de la ecuación (4), tomando x = Pn y utilizando f = rl,. , situación se puede utilizar el problema 31 de la sección 3.4. Si 1; es el punto fijo de� (y
debido a que ;,;! = f . El resultado es un sistema de ecuaciones similar al que aparece por lo tanto el valor de Xn+1 que buscamos), entonces deberíamos iniciar nuestra iteración
en (6). en un punto zo en un intervalo centrado en I; y en el cual W(z)I < I. Es necesario suponer
que $' es continua En el caso que nos ocupa se tiene que
Fórmula de Adams-Moulton "'( ) - 251 h 8f Ctn+l, z) .
'!'z no
Durante el trabajo numérico las fórmulas de Adams-Bashforth raramente se utilizan az
de manera aislada. Se usan en conjunción con otras fórmulas para aumentar la precisión. Este valor se puede hacer tan pequeño como se desee, disminuyendo la longitud del paso
Con el fin de observar cómo es posible esto, volvamos a la ecuación (2) y supongamos h. En la práctica sólo se necesitan uno o dos pasos de esta iteración para obtener el valor
que se emplea una fórmula de cuadratura numérica que comprende afn+l· La ecuación de xn+l·
(3) adoptará la forma:

Xn+l =x.+ afn+1 + bfn+ cfn-1+· .. (7) Análisis de los métodos multipaso lineales
En lo que resta de esta sección estudiaremos la teoría general de los métodos mul­
El siguiente es un ejemplo de una expresión de este tipo, conodda como Fórmula de tipaso lineales. La estructura de cualquiera de estos métodos es:
Adams-Moulton de orden 5:
ak Xn + ªk-tXn-1 +' '· + lloXn-k = h[bkfn + bk-tÍn-1 +''· + bo.fn-Ú (9)
h
Xn+I = Xn+ [251Jn+l+646f,, - 264fn-l+ 106!,.-z - 19fn-3J. (8)
7ZQ Esto se llama método de k pasos. Deben proporcionarse los coeficientes a; y b;. Al
igual que antes, x; denota una aproximación a la solución en t;, con t; = to+ih. La letra
Esta fórmula también se puede deducir usando el método de los coeficientes indetermi­ f¡ representaf (t;,x;). Suponiendo que ya se conocen los valores de .:to, x 1, •.• , Xn-t, la
nados. Observe que no se puede utilizar directamente para avanzar en la solución, en fórmula (9) se usa para calcular x•. Podemos por consiguiente suponer que ak ;1: O. El
vista de que Xn+I aparece en ambos lados de la ecuación. Recuerde que f¡ representa coeficiente bk pµede ser cero. Si bk = O, se dice que el método es explícito. En este
f (t;, x;), y que por lo tanto los términos que incluyen a!,.+ 1 se pueden calcular sólo des­ caso x. se puede calcular directamente y de manera elemental a partir de la ecuación
pués de que se conozca el valor de Xn+t· Sin embargo, un algoritmo muy satisfactorio (9). Sin embargo, si bk ;1: O, entonces el término J. a la derecha de la igualdad incluye
llamado método predictor-corrector, emplea la fórmula de Adams-Bashforth (4) para la incógnita x., y la ecuación (9) determina el valor de x. en forma implícita Se dice
predecir un valor tentativo de Xn+t, llamémoslo x;+l • y luego recurre a la fórmula de entonces que el método es implícito.
Adams-Moulton (8) para calcular un valor corregido de Xn+t· Es así como en la fórmula La precisión de una solución numérica de una ecuación diferencial está en gran
(8) calculamos el valor de fn+I como f (t.+1, x:+i) usando el valor predicho x;+t que se medida determinada por el orden del algoritmo utilizado. El orden indica cuántos
obtuvo de la fórmula (4). términos de una solución expresada en serie de Taylor se están simulando mediante este
Debido a que inicialmente sólo se conoce el valor de x0, al usar el método predictor­ método. Por ejemplo, se dice que el método de Adams-Bashforth en la ecuación (4) es
corrector se debe emplear un procedimiento especial para dar inicio al proceso. Natu­ de orden 5, debido a que da lugar aproximadamente a la misma precisión que la que se
ralmente, un método de Runge-Kutta resulta ideal para obtener x1, x2, x3, x4. En general obtiene por el método de la serie de Taylor con los términos h, h2, h3 , h4, h5. Se espera
las fórmulas del mismo orden se usan conjuntamente. Por consiguiente, los métodos de entonces que en cada paso de una solución que utiliza la ecuación (4) el error sea O(h6).
Runge-Kutta de quinto orden, como los que aparecen en los problemas 15 a 17 de la En las siguientes líneas se precisará la idea intuitiva de orden.
sección 8.3, se pueden utilizar en combinación con la fórmula de Adams-Bashforth (4) En correspondencia con el método multipaso que se muestra en la ecuación (9),
y la fórmula de Adams-Moulton (8). definimos una funcional lineal L mediante
Se cuenta todavía con otro método que puede utilizarse para obtener el valor de
Xn+t en la ecuación (8). Después de todo, la ecuación señala que Xn+I es un punto fijo de k
cierta transformación; a saber, el que se define mediante Lx = ¿)a;x(ih) - hb;x(ih)]. (10)
i=O

$(z) = �ühfCtn+t, z)+C, En este caso tomamos k = n para simplificar la notación, y suponemos que el primer
valor en la ecuación (9) inicia en t = O en lugar de t =n - k. La operación Lx se puede
donde C comprende a todos los demás términos en la ecuación (8). Por ende, el método realizar en cualquier función x que sea diferenciable. Sin embargo, en el siguiente
de iteración funcional surge como un medio para calcular Xn+¡. La teoría de iteración análisis suponemos que x está representada por su serie de Taylor en t = O. Usando la
funcional, tal como se desarrolló en la sección 3.4, nos indica que la sucesión determinada serie de Taylor para x, L se puede expresar de la siguiente forma:
por la ecuación
Zk+I =$(Zk) (k � O), Lx = dox(O)+d1hx'(O)+d2h2x"(O)+· · ·. (11)
528 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.4 Métodos multipaso 529

Para calcular los coeficientes d; en la ecuación (11) escribimos las series de Taylor para Finalmente, suponga que (iii) es cierta. Entonces en la ecuación (11) se debe tomar
xyx': do = d¡ = · · · = dm= O. Por ende (iii) implica (i). 111
x(ih) = -.-1 JJ)(Q)
¿ (ih)Í
00

El orden del método multipaso en la ecuación (9) es el único número natural m


j=O J.

x'(ih) = I: (i�;
j=O J.
j
x U+l)(O).
tal que
do = d¡ = · · · = dm=O* dm+I·

Luego estas series se sustituyen en la ecuación (10). Al reacomodar el resultado en Ejemplo ¿Cuál es el orden del método descrito mediante la siguiente ecuación?
potencias de h obtenemos una ecuación que adopta la forma que aparece en (11), con
los valores siguientes de d;: Xn - Xn-2 = !h(fn +4J,,_¡ +fn-z).

k
do=¿a;
Respuesta El vector (a0, a1, a2) es (-1. O, 1), y el vector (bo, b1, b2) es (!,
las d; son:
f, i). Por consiguiente,
i=O
do = ao + a¡ + a2 = Ü

d1 = ¿(ia; - b;) d 1 = -bo + (a1 - b1) + (2a2 - b2) = O


i=O d2 = (!a1 - b¡) + (2a2 - 2b2) = O
k (12) d3 = (ia1 - lb1) + (faz - 2b2) = O
d2 = ¿(!i2a; - ib;)
i=O (Í4 = (t¡a¡ - !b1) + c¡a2 - !b2) = Ü
f
ds = ( 1ioª1 - t¡b1) + ( tsª2 - b2) = -·k,

El orden del método es 4. 111


k ij-1
ij
dj = :E ( -:iªi - (j = 1, 2, ...).
i=O } u-1/;) Si otras características se mantienen sin alteraciones, tal vez resulte preferible
usar un método de orden superior en lugar de uno de orden inferior. Si deseamos
Evidentemente, en este caso hemos utilizado O! = 1 e i° = l . generar un método de k pasos de la forma (9) de orden 2k, simplemente escribimos las
2k + 1 ecuaciones:
TEOREMA Las siguientes tres propiedades del método multipaso (9) son equivalentes:
do = di = ... = d2k = o.
(i) do = d¡ = · · · = dm = O.
(ii) Lp = O para todo polinomio p de grado ;;ií m. La ecuación (12) nos indica que éste es un sistema de 2k + 1 ecuaciones lineales homo­
(iii) Lx es O(h
m+I
) para toda x E C"'
+1
• géneas con 2k + 2 incógnitas a; y b; (0 � i ;;ií k). El álgebra lineal elemental nos dice
que este sistema tie ne una solución distinta de la trivial; Dahlquist (19 56] demostró que
Demostración Si (i) resulta cierta, entonces la ecuación (11) tiene la forma
*
existe una solución con ak O (lo cual resulta necesario para poder utilizar el método).
Sin embargo, en la sección 8.5 veremos que, además del orden, se deben tomar en cuenta
m+ m
Lx = dm+I h I X( +l)(Q) + ... (13) otras características del método multipaso. Entre éstas, la principal es la estabilidad,
que se estudia en dicha sección. Dahlquist también demostró que un método de k pasos
Si x es un polinomio de grado ;;ií m, entonces x Ul(t) = O para toda j > m, y por estable , tal como el de la ecuación (9), no puede tener un orden mayor que k + 2.
consiguiente la ecuación (13) nos indica que Lx = O. De lo cual resulta que (ii) se
deduce a partir de (i).
ml
Suponga que (ii) es cierta. Si x E c + , entonces el teorema de Taylor nos permite SERIE DE PROBLEMAS 8.4
escribir x = p + r, dond e p es un polinomio de grado ;;ií m y r es una función cuyas
prim e ras m de rivadas s e anulan en O. En vista de que Lp = O, la ecuación (11) nos l. Deduzca la fórmula de Adams-Moulton de primer orden y verifique que es equivalente a la
regla del trapecio. (Véase la Sec. 7.1.)
lleva a:
Lx = Lr = dm+l�+l ,(m+l)(Q) = O(h
m +I), 2. Verifique que el sistema de ecuaciones en (6) es correcto.
y por tanto de (ii) se deduce (iii). 3. Utilice el método de los coeficientes indeterminados para deducir la ecuación (8).
530 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.4 Métodos multipaso 531

4. Use el método de los coeficientes indeterminados para deducir la fórmula de Adarns­ (c) Repita el problema integrando el polinomio de interpolación de Newton apoyado en
Bashforth de cuarto orden los nodos Xn y Xn-1-
12. (a) Use el método de coeficientes indeterminados para encontrar los valores de A y B en la
h fórmula de Adams-Moulton implícita de segundo orden
Xn+I = Xn+
24 [55f,, - 59fn-1 +37fn-2 - 9fn-J].
Xn+I = Xn +h[Af..1+Bf,,].
5. Deduzca la fórmula de Adarns-Moulton de cuarto orden
(b) Utilice una fórmula de integración numérica para deducir la expresión anterior.
h
Xn+I = Xn + [9fn+I+ 19fn - 5/.-1 +fn-2]. (c) Use una fórmula de interpolación para deducir la expresión del inciso (a).
24
13. (a) Utilice el método de coeficientes indeterminados para deducir una fórmula multipaso de
'6. Diseñe y ponga a prueba un subprograma o procedimiento para utilizar el método de la forma
Adams-Bashforth de quinto orden acoplado con un método de Runge-Kutta de quinto orden. Xn +I = Xn +h[A/.+I+Bf,, + Cf.-iJ.
(Probs. 15 a 17, sección 8.3.) Mantenga sólo los cinco valores más recientes de (t¡, x,). En (b) Repita lo anterior para
la rutina se debe incluir enunciados para la impresión.
'7. Diseñe un programa de computadora que recurra a la rutina del problema (6) y resuelva el Xn+I = Xn +h[Afn +Bf.-1+ Cf.-z].
problema de valor inicial
14. Deduzca una fórmula multipaso implícita basada en la regla de Simpson (que utilice puntos
- x(O) = O, uniformemente espaciados Xn-1, x., x..1) para resolver numéricamente la ecuación diferen­
x' = (t - e ')/(x+e')
cial ordinaria x' =f.
en el intervalo [-1, l]. Use h = 1/238. Compruebe (analíticamente) que la verdadera 15. Se sabe que la fórmula
solución está dada de manera implícita por la ecuación x2 - t2+ 21!' - 2e-' = O. Emplee
esta ecuación en el programa diseñado con el fin de corroborar la validez de la solución h [(5 -A)X/ /
calculada Recurra al método de Runge-Kutta para dar inicio al proceso. Xn+I =(I -A)x.+Axn-1 + n+I+8(1 +A)x.+(5A - llxn/ -I.
J
u

8. Demuestre que si todo elemento de IIm se integra correctamente por la fórmula es exacta para todos los polinomios de grado m o menores, sin importar el valor de A.

[ f(x) dx ;::J
O
t
i=-n
A,f(i),
Determine A de manera que resulte exacta para todos los polinomios de grado m+l. Calcule
Aym.
'16. Encuentre un programa en su biblioteca de programas de cómputo que resulte adecuado para
resolver el problema de valor inicial correspondiente a un sistema de ecuaciones diferenciales

1
lo mismo resulta cierto para la fórmula ordinarias de primer orden. Utilice el programa para resolver este problema:
dx/ dt = sen x+cos(yt) x(-1) = 2.37
Í: A¡f(to+ih).
<o+h n
{ -
f(x) dx ;::J h dy/dt =e "'+ [ sen(yt)]/t y(-1) = -3.48.
to i=-n
Se desea obtener la solución con una precisión de ocho decimales en el intervalo [-1. 4]. La
9. Deduzca la fórmula de Adams-Bashforth de segundo orden, que se expresa como: solución se debe imprimir usando intervalos de longitud 0.1 en el eje t.
(a) Obtenga gráficas de las funciones x(t) y y(t) para -1 � t � 4. Ambas curvas deberán
Xn+I = Xn +h rnfn - ffn-il • aparecer sobre la misma gráfica. Los valores máximo y mínimo de las ordenadas serán 4 y
-4.
(b) Obtenga una gráfica de la curva definida paramétricamente como
'1O. Calcule la solución de
y'= -2x/ y(O) = l.
{(x(t),y(t)): -1 � t � 4}.
en x = 1.0 usando h = 0.25 y el método Adams-Bashforth-Moulton (Prob. 4 y 5) en
conjunción con el método de Runge-Kutta de cuarto orden. Muestre la solución calculada (Los valores de t no aparecerán en esta gráfica.) La curva que se obtiene se llama órbita del
usando cinco dígitos significativos en 0.25, 0.5, 0.75, LO. Compare sus resultados con la sistema de ecuaciones diferenciales original. (Para esta curva también se utiliza la palabra
solución exacta y= 1/(1 +x2). trayectoria.)
11. (a) Usando el método de los coeficientes indeterminados, calcule los valores de A y B en 17. Calcule los coeficientes en un método multipaso de la forma
la siguiente fórmula de Adams-Bashforth. (No haga el cambio a una forma de integración
numérica que le corresponda.) Xn+I = Xn +h[Af,, +Bfn-2+ Cf.-4].
Xn+I = Xn +h[Af,, +Bfn-il- Esta fórmula deberá integrar correctamente una ecuación de la forma x' = f (t, x) para el
caso en que la expresión del lado derecho es de la forma f(t, x) = a+bt+ct2.
(b) Repita el problema en términos de una fórmula de integración numérica correspon­ 18. Con k=2, encuentre un método de orden 4 que adopte la forma de la ecuación (9).
diente.
532 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.5 Errores locales y errores globales. Estabilidad 533
19. Demuestre que el método multipaso de la ecuación (9) esde ordenm siy sólo siLp; =O para Hay dos polinomios asociados con la ecuación (2):
O :;:; i :;:; m y LPm+i 1' O, donde p;(t) = ti y Les la misma que aparece en la ecuación (10).
20. Por medio del cálculo do, di, ... , determine el orden del siguiente método: p(z) = ªkZk +ak-1zk-1 + .. · + a0
{
q(z) = bkzk + bk-ri- 1 + · · · + bo. (4 )
Xn =Xn-3 + f h(/n +3!,,-1 + 3!,,-2 +[n-3),
21. Usando el procedimiento del problema 19, determine el orden del siguiente método: El análisis mostrará que ciertas propiedades deseables del método multipaso dependen
de la localización de las raíces de los polinomios p y q.
Xn = Xn-2 +Zh[n-1, Se dice que el método multipaso definido por la ecuación (2) es convergente cuando
concurren las siguientes circunstancias. Imagine que se calculan soluciones numéricas
22. Considere dados los valores de ao, a1, ...• am y suponga que I::=0 a; ':' O. ¿Existen ne­ del problema (1) usando distintos valores de la longitud de paso. Denotamos con x(h, t)
cesariamente valores de bo, b1, ..., bm que aseguren que el método multipaso que utiliza
estos valores como coeficientes sea de al menos de orden m? (Para responder se necesita un la solución aproximada que se obtiene usando un paso de longitud h. Como es usual, la
teorema o un ejemplo.) solución exacta se denota con x(t). La convergencia en este caso significa que
23. Demuestre que para el método de Euler sucede que do = di = O y di = 1/j! paraj;;; 2.
lím x(h, t) = x(t) (t fijo), (5)
h-.O

*8.5 Errores locales y errores globales. Estabilidad para toda t en un intervalo (to, tm], siempre y cuando los valores de arranque satisfagan
la misma ecuación, a saber,
Los métodos de Adams-Bashforth y de Adams-Moulton son sólo dos ejemplos del uso
de métodos multipaso para resolver un problema de valor inicial de la forma: límx(h,to+nh) =.xo (O� n < k), (6)
h-.O

{x' =f(t,x) (1) y que la función! satisfaga las hipótesis del teorema de existencia básico (Teorema 3 en
x(to) = xo. la Sec. 8.1 ).
El término multipaso se debe al hecho de que para calcular Xn hace falta utilizar los valores
de Xn-I, Xn-2, ... , que corresponden a términos previamente calculados. Pasamos ahora Estabilidad y consistencia
a revisar algunas cuestiones discutidas en la sección precedente.
Otros dos términos que se usan son estable y consistente. El método es estable si
Métodos convergentes implícitos y métodos convergentes explícitos todas las raíces de p se encuentran en el disco z[ � 1 y si cada raíz de módulo uno es
f

simple. El método es consistente si p(l) =O y p'(l) =q(l). Con esto se puede pasar a
Cualquier método multipaso se puede describir mediante una ecuación de la forma: presentar un teorema muy importante.

akXn +ak-!Xn-1 + · · · +aoXn-k = h[bdn + bk-IÍn-1 + · · · + bofn-Ü (2)


TEOREMA 1 Para que el método multipaso de la ecuación (2) sea convergente es necesario y suficiente
Por ejemplo, la fórmula de Adams-Moulton de quinto orden se expresa como sigue: que sea estable y consistente.

Demostración (Necesidad de la estabilidad) Suponga que el método no es estable. Entonces .sucede


- h [251¡ ñot n-1 - 261¡ 19_¡n-4] ·
10§¡n-3 - ñot
Xn -Xn-1 - ñotn + 64§¡ ñotn-2 + ñot (3)
que, o p tiene una raíz A. que satisface [A.[ > 1 o p tiene una raíz A. para la cual [A.[ = 1
y p'(A.) = O. En cualquiera de los dos casos consideramos un problema de valor inicial
En estas ecuaciones, f¡ representa af(t;, x;). Al resolver el problema (1) usando una sencillo cuya solución es x(t) = O:
fórmula como la que aparece en (2), suponemos que los valores de arranque x0, x1, •••
Xk-I, se han calculado mediante algún otro método. A continuación la ecuación (2) se
usa con n = k, k + l, ... , y así sucesivamente. Observe que si bk ;1: O, entonces la {x' =O
(7)
ecuación (2) incluye a la ordenada Xn, con valor aún desconocido, en ambos lados de x(O) = O.
la écuación. En este caso se dice que el método es implícito. Si bk = O, el método es
explícito. En nuestro análisis se supone que x. satisface la ecuación (2). En la práctica El método multipaso obedece a la ecuación
Xn se obtiene mediante iteraciones, iniciando con un valor tentativo proporcionado por
el esquema predictor. akXn +ak-JXn-1 + · · · +aoXn-k = O. (8)
534 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.5 Errores locales y errores globales. Estabilidad 535

Ésta es una ecuación lineal en diferencias, siendo x. = h'J,.• una solución, donde ). es Dése cuenta de que los valores iniciales en esta solución numérica son consistentes con
una de las raíces de p. Si [).[ > 1, entonces para O� n < k tenemos: el valor inicial x(O) = O, lo que se debe a que límh....o (n + k)hy = O para n = O, I, ... ,
k - I. La condición de convergencia establece que lím.....oox. = t, si nh = t. Por lo
[x(h, nh)[ = h[). "[ < h[).[k ..... O (cuando h ..... O). tanto tenemos que lím..... (n + k)hy = t. Por consiguiente concluimos que y = 1, 0
00

p' (1) = q(l), en vista de que lím.....oo kh = O. 111


Con esto se establece la condición (6). Sin embargo, se viola la ecuación (5), debido a
que si t = nh, entonces h = m-1 y La demostración de que la estabilidad y la consistencia unidas implican la conver­
gencia es bastante más complicada. El lector interesado deberá consultar el texto de
[x(h, t)[ = [x(h, nh)[ = m- 1 [).[" -too. Henrici [1962, Sec. 5.3].

Por otra parte, si [).J = 1 y p'().) = O, entonces x. = hn )..• es una solución de (8). La Método de Milne
condición (6) se satisface debido a que si O � n < k, entonces
Con el fin de ejemplificar el teorema anterior analizamos el método de Milne,
Jx(h, nh)J = hn[)..[" = hn < hk -t O (cuando h ..... 0). definido mediante
Xn -Xn-2 = h[tJn + Vn-1 + V,.-2]. (1 2)
La condición (5) no se satisface en vista de que Éste es un método implícito y se caracteriza por los dos polinomios:
1
Jx(h, t)[ = (tn- )n[).[" = t f+ O.
p(z) = z2 -1
Demostración (Necesidad de la consistencia) Suponga que el método definido mediante (2) es conver­
q(z)= fz2+iz+f
gente. Considere el problema
x'=O Observe que las raíces de p son + 1 y -1. Son raíces simples. Además, p' (z) = 2z,
{ (9)
x(O) = l. p' (1) = 2, y q(l) = 2. Por consiguiente, se satisfacen las condiciones de consistencia y
La solución exacta es x = l. La ecuación (2) una vez más tiene la forma (8). Una estabilidad. El teorema nos indica, por lo tanto, que el método de Milne es convergente.
solución se obtiene tomando Xo = x1 = · · · = Xk-I = 1 y luego utilizando (8) para
generar los valores restantes, Xk, Xk+ I,.... Dado que el método es consistente, resulta Error de truncamiento local
que lím..... x. = I. Al usar este resultado en la ecuación (8) obtenemos que ak+ak-1 +
00

... + ao = I, o en otras palabras, p(l) = O. Nuestra siguiente tarea consiste en definir y analizar el error de truncamiento local
Considere ahora el problema de valor inicial que surge al usar el método multipaso (2). Suponga que se usa la ecuación (2) para
calcular Xn, suponiendo que todos los valores previos dexn-I, Xn-2, ... son correctos; es
x' = I decir, que x; = x(t;) para i < n. En esta situación x(t) denota la solución de la ecuación
{ (10) diferencial. Entonces el error de truncamiento local se define como x(t.) - x•. Este
x(O) = O,
error se debe únicamente a que se modeló la ecuación diferencial mediante una ecuación
cuya solución exacta es x = t. La ecuación (8) se convierte en en diferencias. En esta definición no se incluye el error de redondeo; suponemos quex.
se ha calculado con precisión total a partir de la ecuación en diferencias (2). Queremos
akXn +ak-JXn-1 + · · · + aoXn-k = h[bk + bk-1 + .. · + bo]. (11) demostrar que si el método tiene orden m (como se definió en la sección 8.4), entonces el
error de truncamiento local será O(h m+I). Esto no es cierto si no se satisfacen ciertas
Como el método es convergente, la demostración anterior nos indica que es estable. Por condiciones. Lo anterior se debe a que nuestro análisis presupone que f es una función
ende, p(l) = O y p'(l) ;é O. Una solución de la ecuación (11) es x. = (n + k)lr(, con lisa hasta cierto grado y que también lo es la función x(t) que se toma como solución
y= q(l)/p'(l). La sustitución de este dato en el lado izquierdo de (11) da lugar a ·exacta.

TEOREMA 2 Si el método multipaso (2) es de orden m, si x E Cm+2, y si 8f/Bx es continua, entonces,


hy[ak(n+k)+ak_1(n+k-1)+..·+aon]
según las hipótesis del párrafo anterior:
= nhy(ak +ak-1 + · · ·+ao) + lrf [kak + (k - l)ak-I + · · · +a1]
x(t.)-xn = (dm+i/ak)h m+lxCm+l) (tn-k) + O(hm+2). (13)
= nlr(p(l) + hyp'(1)
= lr(p'(l) = hq(l) = h[bk +bk-1 + · · · +bo]. (Los coeficientes dk se definieron en la sección 8.4.)
536 Capítulo 8 Soluci6n numérica de ecuaciones diferenciales ordinarias *8.5 Errores locales y errores globales.
Estabilidad 537
Demostraci6n Basta demostrar la validez de la igualdad en el caso n = k, ya que x. puede interpretarse
como el valor de la solución numérica que inició en el punto tn-k· Usando el funcional
lineal L, ecuación (10) en la sección 8.4, tenemos que
k k
Lx = ¿ [a x(t¡) - hb;x'(t¡)] =¿ [a x(t ) - hb f(t , x(t¡))].
¡
i=O
¡ ¡ ¡ ¡ (14)
i=O

Por otra parte, la solución numérica satisface la ecuación

k
0 = ¿[a¡X¡ - hb¡ f(t¡, X¡)]. (15) tn ln+I ln+l ln+J ln+4

i=O
Figura8.2 El efecto de cambiar las condiciones iniciales.
En vista de que hemos supuesto que X¡ = x(t¡) para i < k, el resultado de restar la
ecuación (15) de la (14) será
palabras, necesitamos entender cuál es el efecto que se produ
(16) ce sobre los valores de las
Lx = ak [x(tk) - xk] - hbk (/(tk ,x(tk)) - f(tb Xk)]. ordenadas de una curva solución como resultado de un cambi
o en un valor inicial. La
figura 8.2 muestra lo que intentamos medir.
Aplicando el teorema del valor medio al último término de la ecuación (16) obtenemos: Considere el problema de valor inicial

óf x1 =f(t,x)
Lx = ak[x(tk) - Xk] - hbk (tk, l;)[x(tk) - xk] {
óx (17) x(O) =s. (19)
=[ak - hbkF] [x(tk) - Xk ].
Suponga que óf/óx, denotada en este caso por fx, es continua y satisface la condición
donde F = óf (tb 1;)/óx para alguna 1; entre x(tk) y Xk, Recordemos ahora que de acuerdo fx(t, x) � ).. en la región definida por O � t � T y -oo < x < oo. La solución de (19)
con la ecuación (13) de la sección 8.4, si el método que se usa es de orden m, entonces es una función de t, pero con el fin de mostrar su dependencia respecto del valor inicial
Lx tendrá la forma: s, la denotamos por x(t;s). Defina u(t) = óx(t;s)/ós. Podemos obtener una ecuación
Lx =dm+1hm+l x (m+l)(to) + O(hm+z). (18) diferencial-la ecuación variacional-para u, derivando respecto de s la ecuación (19).
El resultado es:
Al combinar las ecuaciones (17) y (18) obtenemos la ecuación (13). En esta situación u1(t) =fx(t,x)u
podemos ignorar el término hbkF en el denominador (Prob. 8). 1111 { (20)
u(O) = l.
Ejemplo Determine explícitamente la solución u en el caso del
siguiente problema de valor inicial:
Error de truncamiento global
Deseamos ahora establecer una cota para el error de truncamiento global asociado {x' =x2
al proceso de resolución numérica de una ecuación diferencial. En cualquier etapa x(O) =s. (21)
del proceso, digamos en tn, denotamos con Xn a la solución calculada en ese punto.
Supongamos que todos los cálculos se han efectuado con precisión absoluta; es decir, Respuesta En este caso f(t, x) =x2 y fx =2x. Por lo
tanto la ecuación variacional es:
no aparecen errores de redondeo. Por supuesto, la solución verdadera en tn, x(t.), difiere
de la solución calculada Xn, debido a que ésta última se ha generado usando fórmulas {U1 =2xu
que aproximan series de Taylor. La diferencia x(t.) - x. es el error de truncamiento u(O) = l. (22)
global. No es simplemente la suma de los errores de truncamiento locales que fueron
surgiendo en puntos anteriores. Para comprobarlo debemos darnos cuenta de que cada La solución de la ecuación (21) es x(t) =s(I - st)- 1 Por
• consiguiente la ecuación (22)
paso de la resolución numérica debe utilizar como valor inicial el valor aproximado se convierte en:
de la ordenada que se calculó en el paso previo. En vista de que dicha ordenada ya u'(t) =2s(I - str 1 u(t)
{
incluye un error, el proceso numérico lo que hace es tratar de seguir una curva solución u(O) =1,
equivocada. Debemos por consiguiente iniciar el análisis viendo qué tanto difieren dos cuya solución es:
curvas solución si se inicia el proceso con diferentes condiciones iniciales. En otras u(t) =(1 - st)-2. il
538 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.6 Sistemas y ecuaciones diferenciales ordinarias de orden superior 539

TEOREMA 3 Sifx � 11., entonces la solución de la ecuación variacional (20) satisface la desigualdad SERIE DE PROBLEMAS *8.5
Ju(t)J � ,!J, para t � O. 1. Tomando en cuenta el contenido del teorema 1 de esta sección estudie los siguientes métodos
multipaso:
Demostración De la ecuación (20) tenemos que (a) Xn -Xn-2 = 2hf.-1
,1 /u=fx =11. -a.(t), (23) {b) Xn -Xn-2 = h(jfn-1 - �f.-z + Vn-3
(c) Xn -Xn-1 = h(}fn + *f•-l -f;¡!,,-2 + Mn-3)
en la cual a.(t) � O. Al integrar la ecuación (23) obtenemos:

l
2. Se dice que un método es débilmenteinestab e l sip tiene un cero 11. tal que 11. ;,e !, 111.I = !, y
q(11.) < 11.p'(11.). Demuestre que el método de Milne, dado en la expresión (12), es débilmente
ln [uJ = 11.t - a.('t) d't = 11.t -A(t), inestable.
3. Demuestre que todo método multipaso en el que p(z) = t - 1- 1 y ¿k=o b; = 1, resulta
donde A(t) denota la integral indicada. Dado que t � O, A(t) � O y como consecuencia estable, consistente, convergente y débilmente estable.
ln [uJ � 11.t. Por lo tanto [uJ � r!"', ya que la función exponencial es creciente. 111 4. Determine las características numéricas del método multipaso cuya ecuación es:
TEOREMA 4 Si la ecuación (19) se resuelve tomando como valores iniciales a s y a s+ 8, las curvas Xn + 4.:Cn-1 -5Xn-2 = h[4fn-1 + 2fn-2].
solución en t difieren a lo más en [8[1!-1•
5. ¿Existe alguna razón para desconfiar del siguiente esquema numérico para resolver i =
Demostración Usando el teorema del valor medio, la definición de u y el teorema anterior, obtenemos: f(t,x)?
Xn -3Xn-1 + hn-2 = h[fn + 2!,,-1 + fn-2 -2fn-J).
a
Jx(t;s)-x(t;s+8)1 = l x(t,s+08)[ l8J Explique su respuesta
as

= [u(t)[ [8[ ;; [8[1!-1• 11 6. ¿Cuál de los siguientes métodos multipaso es convergente?


(i) Xn -Xn-2 = h(f,, -3fn-l +4/n-z)
TEOREMA 5 Si ios errores de truncamiento local en t1, t2, ... , tn no exceden en magnitud a 8, entonces (Ü) Xn -hn-1 +xn-2 = h(f,, -f.-1)
el error de truncamiento global en tn no excede al valor de8(f!WI - l)(i?J' -1)-1• (Üi) Xn -Xn-1 -Xn-2 = h(f,, -fn-1)
(iv) Xn -3Xn-l + 2.:cn-2 = h(fn +/n-1)
(v) Xn -Xn-2 = h(/n -3fn-l + 2!,,-2)
Demostración Suponga que los errores de truncamiento con valores 81 , 82, ... están asociados con
la solución numérica en los puntos t1, t2, • • • • Al calcular x2 se tenía un error 81 en la 7. Se dice que un método multipaso es fuertemente estable sip(l) = O, p' (1) ;,e O, y todas las
h
condición inicial, y según el teorema 4 el efecto de esto en tz es a lo más [81 [/ . A demás raices dep satisfacen la desigualdad lzl < l. Demuestre, utilizando el teorema l, que
esto se añade el error de truncamiento en tz. Por consiguiente, el error de truncamiento un método fuertemente estable es convergente. Demuestre también que para cualquier valor
de A. un método fuertemente estable resolverá el problema .:e' = A.X, x(O) = l, sin introducir
global en t2 es a lo más: errores debido al crecimiento exponencial.
[81 li?J' + JM
8. Demuestre que
El efecto de este error en t3 no es (por el teorema 4) mayor que Ahm+l + O(hm+2)
= �hm+l + O(hm+2)
/J B-Ch B
([81[1!" + [82[)r?-il.
A esto hay que agregar el error de truncamiento en t3. Siguiendo este proceso encontra­
mos que el error de truncamiento global en tn no es mayor que 8.6 Sistemas y ecuaciones diferenciales ordinarias de orden superior
L J8 [i•- )lJt � 8 L e
n

k=l
k
k
n-1

k=O
k)..h -1
= 8(f!WI - l)(i'h -1) . • La forma estándar de un sistema de ecuaciones diferenciales de primer orden es:

X�= f1(t, X1,X2, .. . ,x.)


TEOREMA 6 Si los errores de truncamiento local en la solución numérica son O(lt11+1 ), entonces el
error de truncamiento global es O(hm). � = fi(t, X¡, Xz, ..., Xn)
{ (1)
Demostración En el teorema 5 tome una 8 de O(hm+l ). Dado que e'- -1 es O(z), y nh = t, encontramos
que al usar la fórmula del teorema 5 el orden decrece en una unidad. 11 X� = fn(t, X1, .:Cz, ..., X0).
540 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.6 Sistemas y ecuaciones diferenciales ordinarias de orden superior
541
En este sistema hay n funciones x1, x2, • • • , Xn por detenninar. Todas ellas dependen Se sobreentiende que todas las derivadas son respecto a t: y(') = diy/ dt;. Después,
de una variable independiente t, y la notación X¡ denota la derivada dx¡/ dt. Un ejemplo introducimos nuevas variables X¡, x2, ... , Xn de acuerdo con las siguientes definiciones:
concreto es el siguiente sistema, en el que hemos escrito x y y en vez de x1 y x2:
X¡=y Xz=y1 X3=y11 ••• Xn=/•-l).
x' =x+4y-é
{ (2) Las nuevas variables satisfacen el siguiente sistema de ecuaciones diferenciales de primer
y' =x+y+2e1.
orden:
x( =x2
La solución general del sistema (2) es:
X�=X3
x = 2ae -2be- - 2/
31 1
xi=x4
{ (3)
y=ae3t+be-1+ ie1.

en donde a y b son constantes arbitrarias. Obviamente, la supuesta solución se puede


verificar derivando y sustituyendo en el sistema (2). Advierta que el del ejemplo es un X� = f(t, X¡, Xz, X3, •• ,, Xn),

¡
sistema lineal en las funciones incógnitas x y y. Este sistema tiene la forma que presenta la ecuación (5).
En todo problema físico bien definido que tenga presumiblemente una solución Para resolver ecuaciones diferenciales con ayuda de un software fácilme
nte ase­
única, el sistema de ecuaciones diferenciales vendrá acompañado de condiciones auxi­ quible, casi siempre es necesario convertir el problema en un sistema tal
como (5).
liares que sirven para determinar las constantes arbitrarias que figuran en la solución Ilustramos el proceso con dos ejemplos.
general. Así, si el sistema (2) estuviese acompañado por las condiciones iniciales
Ejemplo 1 Convierta el problema de valor inicial
x(O) = 4 y(O) = 5/4,
(sen t)y'"+ cos(ty)+ sen(t2+y")+ (y' )3 = log t
la solución sería y(2) = 7
x = 4e31+2e-1 -2e1
{ ( 4) y'(2) = 3 (6)
y 2e3t - e-1 + ié.
=
y"(2) = -4
El problema de valor inicial para el sistema general en (1) se compone de las n
ecuaciones diferenciales junto con un valor inicial prescrito para t, digamos t = to, y la en un sistema de ecuaciones diferenciales de primer orden de valores iniciales.
especificación del valor que tendrá cada función X¡ en t0•
Respuesta Introducimos nuevas variables X¡, x2, x3 como sigue: X¡ == y, x2 == y', x3 == y". El
sistema de ecuaciones que rige a X = (x1, x2, x3l es:
Notación vectorial
x; = X2
El sistema (1) se puede reescribir convenientemente en notación vectorial. Sea X el
vector columna cuyas componentes son x1, x2, • • • , x,,. Estas componentes son funciones {X�== X3
(7)
de t. Por consiguiente, X es un mapeo de IR (o un intervalo de IR) en IR". De igual manera, xi == [log t - Xi - sen(t2+ x3) - cos(tx1 )]/ sen t
sea F el vector columna que tiene como componentesf1 ,!2, . . . ,f•. Cada una de éstas es
una función cuyo dominio es 1R•+I (o algún subconjunto), de modo que Fes un mápeo Las condiciones iniciales en t == 2 son X= (7, 3, -4/.
de IR"+1 en IR". Ahora podemos reescribir el sistema (1) en la forma 11
Los sistemas de ecuaciones de orden superior se pueden tratar de manera semejan
X'= F(t,X). te,
(5) tal como se ilustra en el siguiente ejemplo.

Un problema de valor inicial para el sistema (5) también incluiría valores numéricos para Ejemplo 2 Convierta el siguiente en un sistema de ecuaciones de primer
orden:
el vector X(t0), donde to es el valor inicial de t.
Toda ecuación diferencial de orden superior se puede convertir en un sistema de (x'' )2+tt!+y' == x' - x
ecuaciones de primer orden. Suponga que se nos da una ecuación diferencial en la forma { (8)
y'y'' - cos(xy)+ sen(tx'y) == x
/•l = f(t, y, y'. y", ...'/•-ll). Las condiciones iniciales se omiten en este ejemplo.
542 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.6 Sistemas y ecuaciones diferenciales ordinari
as de orden superior 543
Respuesta Con la introducción de nuevas variables x1 =x, x2=:r!, X3=y, X4=y', el problema
inputt <-l;x <-3;y <-1; h <- ---0.I;M <-30
se puede reescribir de la siguiente manera:
output O, t, x, y
x\ =x2 for k=I, 2, ... ,M do
x' .:-x+J---t3
=(xz --- X¡ --- X,¡ --- ti'3) 1/l
{� (9) y' <-y+x3 +cost
X�= X4
x" <-x' +2yy' --- 3t2
X�=[x¡ --- sen(tx2X3)+cos(x¡X3)]/ X4
y" <-y' +3x2:r! --- sen t
x"' <- :r!'+2yy" + 2(y')2 --- 6t
11
y"' <-y" +6x(x')2+3x2 x" --- cos t
X <-x+h( :r! + fh(X11+fh(:r!")))
Método de la serie de Taylor para los sistemas de ecuaciones de primer orden y f- y+h( y'+ ih(y" + fh(y111)))
Es posible aplicar a los sistemas de ecuaciones de primer orden el método de la t <-t+h
serie de Taylor que se analizó en la sección 8.2. Para cada variable escribimos la serie output k, t, x,y
de Taylor truncada de la siguiente manera: end.

h2 h3 hn
X¡(t+h)=x;(t)+hx/(t)+ -¡xi'(t)+ -1 x;"(t)+ · · ·+1xl")(t),
2. 3. n.

o en notación vectorial, curva-y 12


10
h2 h3 hn 8
X(t+h)=X(t)+hX'(t)+2!X" (t)+ X"'(t)+· . ·+ x<nl (t). (10)
3! n! 6
4
Las derivadas que aparacen aquí se pueden obtener de la ecuación diferencial. Por lo eje-t -1
general estas derivadas se tienen que calcular en un orden específico cuando se emplean
en un programa de cómputo. Debemos estár seguros de que las cantidades que se van a
utilizar en uno de los pasos estén disponibles como resultado de pasos anteriores. -4
-6
Ejemplo 3 Escriba el algoritmo para la serie de Taylor de orden 3 para el siguiente problema de -8
curva-x -10
valor inicial. Utilice !h!=0.1 y calcule la solución en el intervalo ---2 � t � l.
-12
-14
x'=x+y2 ---t3 x(1)=3
{ (11)
y'=y+x3+cost y(l)=l.
Figura 8.3 Curvas de solución para el ejemplo 3.
Respuesta Las derivadas de orden superior que se necesitan son:

x"=x'+2yy ' --- 3t2 La solución numérica correspondiente a la instrumentación de este algoritmo en
la computadora no la daremos aquí. Lo que sí mostramos en la figura 8.3 son las
y" =y'+3x 2x' ---sent gráficas de las funciones x(t) y y(t) hechas por una computadora. En virtud de que
las rutinas de graficación no se han estandarizado, no tiene caso mostrar el programa de
x"'=x" +2yy" + 2(y')2 --- 6t
cómputo con que se obtuvieron las gráficas. Baste advertir que por lo general hay que dar
y"'=y" +6x(x')2 +3x2 x" :.... cos t al graficador automático dos arreglos, digamos {t; : O � i � m} y {x; : O � i � m}, a
partir de los cuales debe graficar los puntos (t;, x¡) en una malla cartesiana. Por lo general
A continuación proporcionamos un algoritmo adecuado para llevar a cabo el cómputo. se pueden dar órdenes al graficador para que conecte dichos puntos con líneas rectas.
Por consiguiente, es importante que los puntos se ordenen teniendo esto en mente. Lo
544 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.6 Sistemas y ecuaciones diferenciales ordinarias de orden superior 545

usual es, por supuesto, to < t1 < · · · < tm. Si los puntos en la gráfica son suficientemente La programación de una rutina que lleve a cabo el procedimiento se deja como ejercicio de
cercanos entre sí, la curva se verá lisa, no como una sucesión de segmentos rectilíneos. cómputo para el lector. Se pueden proporcionar fórmulas similares para el método de
11 Runge-Kutta-Fehlberg que expusimos en la sección 8.3.
Los métodos multipasos también se pueden extender a los sistemas de ecuaciones.
Desde un punto de vista teórico, no hay pérdida de generalidad si se supone que A manera de ejemplo, proporcionamos la forma vectorial del método predictor-corrector
las ecuaciones que forman el sistema (1) no contienen explícitamente a la variable t. de Adams-Bashforth-Moulton (4) y (8) de la sección 8.4:
Introduciendo una nueva variable x0 =t, podemos escribir el sistema en la forma:
1
X*(t + h)=X(t) + 7 0 [190IF(X(t)) - 2774F(X(t - h))
xf = f;(xo, X¡, ... , Xn). + 26I6F(X(t - 2h))- 1274F(X(t - 3h)) + 251F(X(t - 4h))]
La ecuación diferencial para la nueva variable es xó = l. Por medio de este artificio, h
X(t + h) = X(t) + [251F(X*(t + h)) + 646F(X(t))
podemos escribir el sistema de ecuaciones (5) como 720
(12) - 264F(X(t - h)) + I06F(X(t - 2h)) - 19F(X(t - 3h))].
X'=F(X),
Como en el caso de una sola ecuación, se pueden utilizar procedimientos de un solo
sin que t figure explícitamente en la ecuación. Aquí X = (Xo, X¡, ..., xni. Se dice que paso, como el método de Runge-Kutta de quinto orden (problema 15 a 17 de la sección

¡
un sistema con la forma (12) es autónomo. 8.3) para suministrar los valores de arranque

Ejemplo 4 Convierta el problema de valor inicial del ejemplo 1 en un sistema en el que t no figure X(to + h) X(to + 2h) X(to + 3h) X(to +4h).
de manera explícita.
Respuesta Sean x1, x2, x3 como en el ejemplo l. Tome x0 = t. El nuevo sistema es SERIE DE PROBLEMAS 8.6
e I. Escriba un programa para la computadora que resuelva el siguiente problema de valor inicial
xb = 1 valiéndose del método de la serie de Taylor. Incluya términos en h, h2, h3 y continúe la
solución hasta t = l. Sea h = O.O!
x; =x2
(13) { x1 =t+x2 +x2
1 1 X¡(-1) = 0.43
X� =X3
x� = t2-x¡ +xf X2(-l) = -0.69.
xi = [logxa - � - sen(X5 + x3) - cos(xQX1)]/ sen xa
<2. (Un problema de desafío) Siga las instrucciones del problema 1 para el siguiente problema
y la condición inicial es X = (2, 7, 3, -4) 7. 11 de valor inicial:
{x; = senx1 +cos(tt2) x1 (-l) = 2.37
x� = 1- sen(tt1)
1 x2(-l) = -3.48.
Otros métodos para los sistemas de ecuaciones diferenciales de primer orden Dada la singularidad en t = O, la programación de xf, x!{ y xt se deberá hacer con mucho
El procedimiento de Runge-Kutta para sistemas de ecuaciones diferenciales de cuidado.
primer orden es más fácil de escribir cuando el sistema es autónomo, es decir, cuando 3. Encuentre la solución general del sistema:

¡
tiene la misma forma que la ecuación (12). En su forma vectorial, las fórmulas clásicas x' = 3x -4y +e'
de Runge-Kutta de cuarto orden son: { I
y =x-y-e.t
h
X(t + h)=X(t) + (F1 + 2F2 + 2F3 + F4), (14) 4. Escriba un sistema de ecuaciones diferenciales de primer orden autónomo que sea equiva-
6 lente a {
x -sen(x ) +ex
111 "
t r
+2tcosx=25
donde x(O) = 5 x'(O) = 3 x"(O) = 7.
F1 =F(X)
5. Escriba la ecuación diferencial ordinaria de tercer orden
F2 = F(X + f hF¡) xm +2x" -x' -2x=e'
{
F3 = F(X + !hF2) x(8) = 3 x'(8) = 2 x" (8) = l.

F4 = F(X + hF3). como un sistema de ecuaciones de primer orden autónomo.


546 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.7 Problemas de frontera
547

6. Convierta el sistema de ecuaciones diferenciales ordinarias de segundo orden 12. Escriba el siguiente sistema de ecuacio nes diferenciales ordinarias de orden superior como
un sistema de ecuaciones de primer orden:
x" -x'y = 3y'xlogt
{ y\"l = /t(t,Yt, y;,. .. 'y\•-t))
y" - 2x:y' = 5x'y sent
y�•l = /i(t,Y2,Y� · · · ,Yr-tl)
en un sis tema de ecuaciones de primer orden en el que t no figure explícitamente.

7. Escriba
y''+yz = O y(O) = l y'(O) =O yt¡ =J,,.(t,Ym,Y'.. ... ,yt-tl) .
{ con {
+
i 2yz = 4 z(O) = 3
13. Convierta el siguiente sistema de ecuaciones diferenciales de ord en superior e n un sistema
como un sistema de primer orden con condiciones iniciales . Haga uso de la notación vectorial. de ecuaciones diferenciales de primer ord en en el que t no figure explícitamente :

cg_ Resuelva numéricamente el sistema de ecuaciones diferenciales x"' - 5tx"y" +ln(x') z = O


{ y" - sen (ty) +7tx" = O
x; = (-1 - 9c2 +12sc)x¡ + (12c2+9sc)x2 x1(0) = -12 z' +16ty' - e'zx' = O.
{
Xi = (-12s2 +9s)x1 + (-1 - 9s2 - 12sc)x2 x2(0) =6
14. Resuelva la ecuación diferencial ordinaria x" +192x = O, con x(O) = 1/6 yx' (0) = O,y
en dond e c = cos 6tys = sen 6t. Integresobre el intervalo[O, lO]co n incrementosh = 0.01. grafique la solución sobre el intervalo [O,5]. Esto correspond e a un sistema de una masa
Verifique que la solución correcta es unida a un resone no amoniguado.
15 . Escriba los métodos de Euler, de Euler modificadoyde Heun para un sist ema de ecuaciones
X = e-131( s- 2c) que tenga la forma de la ecuación (12) .
{ t
x2 = e-t3'(2s+c). e16 . Escriba yponga a prueba una subrutina o procedimiento para el algoritmo adaptativo de
Runge-Kutta-Fehlberg que sea capaz de manejar sistemas de ecuaciones diferenciales ordi­
narias de primer orden.
¿Es satisfactoria la comparación de la solución que usted computó con la solución verdadera?
Este ejemplo se debe a Lambert [1973]. e 17. Escribayponga a prueba una subrutina o procedimiento para el método de Adains-Bashforth­
Moulton de quinto orden acoplado con el método de Runge-Kutta de quinto ord en (problemas
9. Escriba un sistema de ecuaciones de primer orden autó nomo que sea equival ente a 15 a 17 de la sección 8.3 ) que sea capaz de manejar sistemas de ecuaciones diferenciales
ordinarias de primer orden.
x"' - [senx1/ +e '
x']2 +cosx = o
{
x(O) = 3 x' (0) = 4 x'' (0) = 5.
*8.7 Problemas de frontera
10. Suponiendo que se tiene disponible un programa para la computadora que resuelve el pro­
blema de valor inicial para un sistema de ecuaciones de primer orden, explique cómo se En las secciones precedentes hemos considerado varios métodos para resolver el pro­
puede resolver numéricamente el siguiente problema: blema de valor inicial. Por ejemplo, el problema de valor inicial

{
x" =xcost+e'x' +3r+7
x(l ) = 5 x'(l ) = 9.
{ x" = f(t, x, x')
x(a) = a x' (a) = p.
(1)

e11. Escriba un subprograma o procedimiento que dé un paso de longitudh en el procedimiento de se puede escribir en la forma de un sistema de ecuaciones diferenciales de primer orden
Runge-Kutta de cuarto orden. Hágalo con la capacidad suficiente para manejar un sis tema de haciendo x1 = x y x2 = x':
20 o menos ecuaciones diferenciales. Po nga a prueba el programa resolviendo el siguiente
sistema en el intervalo 1 � t � 2. Utilice h = -O.Ol.
X¡ = xz X¡ (a) = a
{
x' = x-2 +log y +t
2 � = f(t, X¡, xz) xz (a) = p.
(2)

{ y ' = e1 - cosx + (sent)x - (xy)-3 El sistema (2) se puede resolver paso a paso con alguno de los métodos que ya hemos
x(2) = -2 y(2) = l. descrito.
548 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8. 7 Problemas defrontera
549
No obstante, la situación sería muy diferente si el problema en (1) se cambiase por Este ejemplo es apenas distinto del problema en (4),
mas si
valores en la frontera a la solución general (5), obtenemos tratamos de imponer los
el par de ecuaciones contra­
dictorias:
= a. =r
J'=f(t,x,x')
{ (3)
x(a) x(b) 3=B 7=-B. (9)
La diferencia estriba en que las condiciones que se especifican aluden a dos puntos Así, el problema (8) no tiene solución.
distintos, t = a y t = b. Los procedimientos paso a paso para el problema de valor Los teoremas de existencia de soluciones para el problema
inicial no son de utilidad en el caso del sistema (3), pues la solución numérica no puede en la frontera en dos puntos, tienden a ser más bien complicado (3), es decir, de valores
s. Remitimos al lector al
comenzar sin un complemento íntegro de valores iniciales. En (3) tenemos un típico libro de Stoer y Bulirsch [19 80] y al de Keller [1968]. El siguie
nte es un resultado muy
ejemplo de un problema de valores en la frontera en dos puntos. Tales problemas son elegante que se encuentra en Keller [1968, pág. 10 8].
por lo general más difíciles de resolver que los problemas de valor inicial.
He aquí un ejemplo de un problema de valores en la frontera en dos puntos que se TEOREMA 1 El problema de valores en lafrontera
puede resolver sin trabajo numérico:
= f(t,x)
=
J'
J' -x {
{ (4) x(O)= O x(l) = O.
x(O)= 3 x(D= 7.

o � t � I, -oo < X < OO.


tiene solución única si a¡/ax es continua, no negativa
y acotada en la franja infinita
En primer lugar, podemos encontrar la solución general de la ecuación diferencial, que es

x(t)= A sent+Bcost. (5) Ejemplo 1 Demuestre que el siguiente problema de valores


en la fronter a en dos puntos tiene una
solución única:
Después, podemos determinar las constantes A y B de manera que las condiciones en la x" = (5x+sen 3x)l
x(O) = x(l)= O.
frontera se satisfagan. De este modo {

3 =x(O)=A sen O+B cos O = B Respuesta Hagamos uso del teorema l. Tenemos
{ (6)
7=x(!)=A sen!+Ecos! =A.

y la solución de (4) es ! =(5+3 cos 3x)e1•


x(t)= 7 sent+3 cost. (7)
Esta función es continua en la franja O � t � I, -oo < x < oo. Es más, está acotada
El lector encontrará más ejemplos de esta índole en los problemas al final de esta sección. superiormente por Se y es no negativa, pues 3 cos 3x � - 3. Por consiguiente, las
La técnica que acabamos de ilustrar no es efectiva cuando la solución general de hipótesis del teorema 1 se satisfacen. 11
la ecuación diferencial en (3) se desconoce. Nuestro interés se centra en los métodos
numéricos que permiten acometer cualquier problema de valores en la frontera en dos
puntos. Cambios de variables

Aunque el teorema 1 se aplica a un caso especial, hay ocasiones en que un problema


Existencia más general se reduce a este caso específico por medio de un simple cambio de variables.
Para ello, comenzamos por cambiar el intervalo correspondiente a t. Suponga que el
Antes de abordar los métodos numéricos consideramos conveniente hacer algunos problema original es
comentarios acerca de la cuestión de la existencia. En general, no podemos asegurar
x(a) = a. = �-
x" =f(t,x)
que exista una solución (3) por la sencilla suposición de que f es una función decente. { (10)
El siguiente es un ejemplo muy simple que apoya esta afirmación: x(b)

donde x = x(t). Aquí lo que se necesita es un cambio de variable t = a+ (b - a)s.

t:0�=-; = 7.
(8) Advierta que s = O corresponde a t = a, y s = I a t = b. Por consiguiente, definimos
x(it) y(s) = x(a+ls) con A.= b- a. En tal caso y'(s) = A.X'(a+ls) y y"(s) = l2x"(a+ls).
550 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8. 7 Problemas de frontera 551

Además, y(O) = x(a) = a. y y(l) =x(b) = �- De este modo, si x es una solución de Para reduci r un problema de valores en la frontera en dos puntos:
(10), y es una solución del problema de valores en la frontera:
y"=g(t,y)
y11 (s) =12f(a+ 1s, y(s)) {
{ (11) y(O) = a. y(l) = �-
y(O)=a. y(l)=�-
recíprocamente, si y es una solución de (1 1), la función x(t) = y((t-a)/(b-a)) es una a un problema homogéneo, simplemente sustraemos de y una función li neal que toma
solución de (10). los valores a. y � en los puntos O y l. He aquí el teorema.

TEOREMA 2 Considere los siguientes problemas de valores en la frontera en dos puntos: TEOREMA 3 Considere los siguientes problemas de valores en la frontera en dos puntos:

x11=f(t, x) {y"--g(t,y)
(i) { (ii)
x (a)=a. x (b)=�
y(O) = a. y(l) = �

en donde
(ii)
f" =
g(t,y)
y(O)=a. y(l)=� (iiii) {
z" = h(t, z)
z(O) = O z(l) = O,

donde
g(p, q) = (b-a/f(a+ (b-a)p, q).
h(p, q) = g(p, q+a.+(�-a.)p).
Siy es una solución de (i i), entonces lafanción x definida por x(t) = y((t-a)/(b- a))
es una solución de (i). Es más, si x es una solución de (i), entonces y(a+ (b-a)t) es Si z es una solución de (i ii), entonces lafancióny(t) = z(t)+a.+(�-a.)t es una solución
una solución de (ii). de (ii). Es más, siy resuelve (ii), entonces z(t)=y(t)- [a.+$-a.)t] resuelve (iii).

Demostración Se trata de una simple verificación: Demostración Nuevamente se trata de una verificación di recta:
ª_ª
x (a)=y
(b - a ) =y(O)=a. y(O) = z(O)+a.+(�-a.) O = a.
y(l) =z(l)+a.+$-a.) l =�
b-a
x(b)=y =y(l)=�
(b-a) y"(t)=z"(t) = h(t, z(t)) = g(t, z(t)+a.+$-a.)t)
t-a 1 =g(t, y(t)). 11
x'(t) = y' (b-a) b-a
Ejemplo 3 Demuestre que el siguiente problema tiene una solución única:
t-a -- 1
)=
11 11

X (t y (b-a) (b- a) 2 x'' = [5x-lOt+ 35+sen(3x-6t+2l)]é


{
x(O)=-7 x(l) = -5.
= g (t-a ( ))
t- a -1
b-a' Y b-a (b-a)2
Respuesta En vi sta de que en este problema los valores en la frontera no son homogéneos, no es
t-a t-a 1 posible aplicar de inmediato el teorema l. Para obtener un problema equivalente de
(b-a)2J (a+(b-a\_ ,y
= a (b-a )) (b- a)2 valores O en la frontera, cambiamos la variable dependiente como en el teorema 3. Sea
= f(t, x(t)) 11
z(t) = x(t)-l(t) l(t) = - 7+2t.
Ejemplo 2 Aplicando el teorema 2, podemos ver que los si guientes problemas de valores en la
frontera en dos puntos son equivalentes: En tal caso,
x11 = sen(tt)+x2
{ z" = x"=[5x-lOt+ 35+sen(3x-6t+21)]e1
x(l) = 3 x(4) = 7.
={ 5(z+l)-lOt+ 35+sen[3(z+l)-6t+21]}e1
y"=16 { sen[(4 s+ l)y]+y2} 1111
{
y(O)=3 y(l)= 7. = {5z+sen 3 z}l.
552 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.7 Problemas de frontera 553
Los valores en la frontera de la nueva variable z son: TEOREMA 4 Sea f una función continua de (t,s), con O;; t ;; l y -oo < s < oo. Suponga que en su
dominio
z(O) = x(O) -f(O) = - 7 + 7 = O lf(t,sr) -f(t,s2) I ;;; klsr-sr1- (k < 8)
z(l) = x(I) -f(I) = -5 -(-5) = O. En tal caso, el problema de valores en la frontera en dos puntos

Tal como se muestra en el ejemplo 1, el problema de valores en la frontera para z tiene x"=f(t,x)
{ (15)
una solución única. Por consiguiente , el problema para x tiene también una solución x(O) = x(l) = O
única. 1111
tiene una solución única en C[O, l ].
Ejemplo 4 Convierta el siguiente problema de valores en la frontera en dos puntos en uno de valores
cero en la frontera, en el intervalo [O, 1]: Demostración (Bosquejo) Basándonos en el problema 10, sabemos que el problema que se plantea en
(15) es equivalente a la ecuación integral:
x"=x2 +3- t2 +xt
{ (12)
x(3) = 7 x(5) = 9. x(t) = [ G(t, s)f(s,x(s)) ds, (16)
Respuesta Por el teorema 2, un problema equivalente es:
en donde G es la función de Green del problema 6. La ecuación integral (16) tiene
y"=g(t,y) la forma x = F(x), donde F es la operación definida por la integral . Haciendo uso del
{ (13)
y(O) = 7 y(l ) = 9, teorema de la transformación de contracción de Banach en el espacio C[O, 1], concluimos
que F tiene un único punto fijo y que cada una de las ecuaciones (15) y (16) tiene solución
con única. 11
g(t, y) = 4J(3 + 2t,y) = 4[y2 + 3 - (3 + 2t)2 + y(3 + 2t)].
Ejemplo 6 Demuestre que el siguiente problema tiene una solución única:
Por el teorema 3, otro problema equivalente es

{ z" = h(t, z)
(14)
{
x" = 2exp(tcosx )
x(O) = x(I) = O
(17)
z(O) = O z(l) = O
Respuesta Aquí,f(t, s) = 2exp(tcoss). Por el teorema del valor medio ,
con h(t, z) = g(t, z + 7 + 2t). Al expresar h con detalle tenemos:
lf(t, s¡) -f(t,s2)I = 1 t(t,s3)[ ls1 -s2I­
h(t, z) = 4[(z + 7 + 2t)2 + 3-(3 + 2t)2 + (z + 7 + 2t)(3 + 2t)].

Ahora podemos resolver (14) para z y obtener la solución de (13) de la ecuación La derivada que aquí necesitamos satisface la relación

y(t) = z(t) + 7 + 2t. [ti= l 2exp(tcoss)(-tsens)I;; 2e< 5.437 < 8.


La solución de (12) se obtiene entonces de Por el teorema 4, el problema de valores en la frontera en dos puntos (17) tiene una única
solución. 11
t-3
x(t)=y (-2- )
SERIE DE PROBLEMAS *8.7
Ejemplo 5 Suponga que hemos calculado la solución z(0.5) = 8.2 para el problema de valores en l. Resuelva el problema de valores en la frontera en dos puntos x" = x, x(O) = 1, x(l) = l .
la frontera (14). ¿Cuál es la solución correspondiente al problema (12)?
2. Determine todos los pares (a.,�) para los que el problema;:" = x, x(O) = a., x(l) = � tiene
Respuesta Claramente, y(0.5) = z(0.5) + 7 + 2(0.5) = 16.2 y 0.5 = (t -3)/2 implica que t = 4. solución .
La respuesta es x(4.0) = 16.2. De este modo, por ejemplo, 3. Haga lo mismo que en el problema 2para el problema x" = -x, x(O) = a., x(n) = �-
4. Resuelva el problemax" - 2x' +x = O, x(O) = a.,x(l) = �. ¿Hay pares (a.,�) para los que
x(4) = y(0.5) = z(0.5) + 8. 11 no existe solución?
554 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.7 Problemas defrontera 555
5. Dé un ejemplo en el que haya más de una solución para el problema de valores en la frontera 12. Demuestre que el siguiente problema tiene solución única:
en dos puntos del tipo (3) del texto.
6. Demuestre queelproblemade valores en lafronteraendospuntos x" =f(t),x(O)=x(l) =O x" = tan-1 x+2 x+cos t
se resuelve por medio de la fórmula: { .
x(O)=x(l) = O.

x(t) = [ G(t,s)f(s)ds, 1 3. Resuelva el problema de valores en la frontera

en donde {x"=x2
s(t - 1) si O;;ís;;ít;;í1 x(O)=2/ 3 x(l) = 3/ 8 .
G(t, s)={
t(s - 1) si O;;ít;;ís;;íl.
1 4. (Continuación) Resuelva el problema (1 3) cuando las condiciones en la frontera se sim­
La función G se conoce como función de Green para este problema. plifican a x(O) = O, x(l)=l. Consulte a Davis [1962].
7. Considere los siguientes problemas de valores en la frontera: 1 5. Resuelva el problema de valores en la frontera
x" = f(t, x, x') {x"=x'
(i) {
x(a)=a. x(b)=� x(O) = 1 x(l) = 2 - v'Í.
i'=irf(a+th,x,h-1i)
(ii) { 1 6. Demuestre que si x es una solución de la ecuación diferencial x" = f(x), también lo es y,
x(O) = a. x(l) = �. donde y(t)=x(t+e).
donde h =b - a. Demuestre que si x es una solución de (ii), entonces la función y(t) = 1 7. Demuestre que el siguiente problema tiene solución única:
x((t - a)/h) es una solución de (i).
8. Ejemplifique el teorema 2 con el problema de valores en la frontera {i'=! expG(t+l) cos(x+7 - 3 t)} (-1;;ít;;í1)
x(-1) = -10 x(l) = -4.
x"=t+x2 - 3 x'
{
x(3) = a. x(7)=�- 1 8. Encuentre un problema de valores en la frontera en dos puntos de la forma
Este problema es equivalente a este otro: z" = h(s, z) z(O) = z(l) = O
x" =48+6 4t+16x - 12 x' 2
que sea equivalente al siguiente problema:
{
x(O) = a. x(l) = �.
x" = cos(x2t2) x(3)=5 x(7)=12.
9. Utilice el teorema 1 para demostrar que el siguiente problema de dos puntos tiene solución
única: 19. Suponga que v y w son dos funciones de t con las siguientes propiedades:
x" = cos(tx)
{
x(O) = 1 x(l) = 4. v" = cos t+ve1+v't 2 v(l) = 5 v(3) = 42
10. Demuestre que el problema de valores en la frontera w"=cos t+we'+w't 2 w(l)=8 w(3) = 9.

x"=f(t,x) ¿ Qué función resuelve el siguiente problema de valores en la frontera en dos puntos?
{
x(O) = O x(l) = O.
x" = cos t+xe'+x't2 x(I) = 7 x(3) = 20
es equivalente a la ecuación integral

[
20. (Un problema de elección múltiple) (a) El problema de valores en la frontera en dos puntos
x(t) = G(t, s) f(s, x(s))ds, x"=-4x x(O) = 1 x(1t/2) = -1

en donde G es la función de Green del problema 6. es un ejemplo que: (i) no tiene solución; (ii) tiene exactamente dos soluciones; (iii) tiene
exactamente una solución; (iv) no tiene solución que se pueda expresar en términos de las
1 1. Demuestre que el siguiente problema de valores en la frontera en dos puntos tiene una funciones elementales; (v) tiene más de una solución. (b) Repita lo anterior para el problema
solución única: de valores en la frontera en dos puntos:
x" = (r+5) x+sen t
{
x(O)=x(l)=O . x" = -4x x(O)=1 x(1t/2)=2.
556 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.8 Problemas defrontera: métodos de disparo 557

21. Considere el problema de valores en la frontera en dos puntos: La solución de este problema de valor inicial la denotaremos con Xz. Nuestro propósito
x(O) = x(l) = O. es escogerz de modo que xz(b) = P. Escribimos
x" = f(t,x)

¿Para cuál función/ podremos estar seguros de que la solución es única? =


$(z) Xz(b) - p,
(i) f(t,x) = 12(1 +x2 )- 1; (ii)f(t,x) = tsenx;
(iii) f(t,x) = (tan t)(tanx); (iv)/(t,x) = t/x; (v)f(t,x) = x113 • de modo que nuestro objetivo es simplemente resolver paraz la ecuación$(z) = O. En
22. Considere el problema de valores en la frontera en dos puntos: este caso son aplicables los métodos que se consideraron en el capítulo 3 para resolver
una ecuación no lineal. Por ejemplo, además de la iteración funcional, podemos recurrir
x" =f(t,x) al método de la bisección, al método de la secante o al método de Newton. El costo
{
x(O) =x(l) =0· de calcular el valor de la función$ es muy elevado, pues cada valor de$(z) se obtiene
resolviendo numéricamente un problema de valor inicial.
¿Para cuál función/ podremos estar seguros de que la solución es única?
1
(i) f(t, x) = r}; (ii)f(t, x) = t(tan- x); (iii)f(t, x) = tx. ;
413

(iv)f(t,x) = log(l+x2); (v)f(t,x) = JtxJ.


Método de la secante
23. Demuestre que six(t) es una solución de Recordemos cómo se aplica el método de la secante para resolver una ecuación
$(z) = O. Con dos valores de$(z) disponibles, digamos$(z1) y$(z2), suponemos que$
x" (t) = f(t, x(t)) es lineal. Valiéndonos de la ecuación de la línea recta que pasa por los puntos (z2,$(z2))
{ x(a) = a x(b) p,
= y z( 1,$(z1)), tenemos que
entonces y(s) =x(a + (b - a)s) es una solución de
$(z1) -$(z2)
$(z) -$(z2) = ( ) (z - zz).
y"(s) = (b - a)2f(a + (b - a)s, y(s)) z1 - z2
{
y(O) = a y(l) = p,
Si escogemos Z3 de modo que $(z3) = O, obtenemos la fórmula:
y por ende z(s) = y(s) - [a+ (J3 - a)s] es una solución de
Z2 -Z¡
{
z"(s) = (b - a/f(a + (b - a)s, z(s)+a+ (P - a)s) Z3 = z2 - ( _ ) $(zz). (3)
z(O) = O z(I) = O $(z2) $(zi)

Este procedimiento se puede repetir para obtener una sucesión de valoresz1,z2, ..• , Zn

8.8 Problemas de frontera: métodos de disparo


con
Zn =Zn -1 -
( Zn-1 -Zn-2 ,¡, -
) Z
$(Zn-I) _ $(Zn-z) 'Y
( n 1).
Consideremos el siguiente problema de valores en la frontera en dos puntos:
Esta ecuación define el método de la secante ( véase la Sec. 3.3). Cuando se han obtenido
x" =f(t,x,x') varios valores dez para los que$(z) es próximo a cero, podemos detener este proceso
{ (1) y utilizar la interpolación polinomial para tener una mejor estimación. La manera en
x(a) = a. x(b) = p. que esto se debería realizar es la siguiente: suponga que$(z1),$(z2), ... ,$(Zn ) son muy
pequeños. Sea p un polinomio que interpola a la tabla
Una manera natural de atacar este problema es conjeturando el valor inicialx'(a) a fin de
resolver el problema de valor inicial relacionado. Hecha la suposición podemos integrar
la ecuación para obtener una solución aproximada, con la esperanza de que x(b) = p. De $(z1) $(z2) $(zn)
no ser así, podemos alterar el valor de x'(a) que hemos supuesto y comenzar de nuevo. Z¡ Zz Zn
Este proceso se llama disparo, y hay varias formas de hacerlo de manera sistemática.
Denotemos con z el valor conjeturado de x'(a), de modo que el correspondiente
problema del valor inicial es El polinomio p tiene la propiedad de que p($(z¡)) = Z¡ para toda 1 � i � n. La siguiente
estimaciónZn+I se determina por medio de la ecuación p(O) = Zn+I· Este procedimiento
x" =f(t,x,i) hace las veces de una aproximación de la función inversa de $por medio del polinomio
{ (2) p. Su éxito depende de que $ tenga una inversa diferenciable en alguna vecindad de la
x(a) = a. x'(a) = z.
raíz. Esto a su vez requiere la hipótesis de que la raíz en cuestión sea simple.
558 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.8 Problemas de frontera: métodos de disparo 559

Función lineal figure explícitamente, definimos .to = t, x3 = X¡,� = �- De este modo el sistema de
ecuaciones diferenciales de valores iniciales es:
El método del disparo que acabamos de bosquejar puede resultar muy costoso
desde un punto de vista computacional, por lo que es importante considerar técnicas que r=l 'o(a)=,
resulten más económicas. Obviamente, toda información acerca del valor correcto x' (a) xí = x3 x¡(a) = a
se debe aprovechar. Asimismo, se pueden resolver los problemas de valor inicial con un � = x4 x2(a) = a
paso de longitud muy grande, pues la alta precisión se desperdicia esencialmente en las (8)
primeras etapas del método de disparo. Sólo cuando �(z) es próximo a cero se deben X3 =f(Xo, X¡, X3) X3(a) = Ü
utilizar incrementos pequeños. � = f(Xo, X2, X4) X4(a) = l .
Hay una clase de problemas ,en los que el método de la secante proporciona la
Con este sistema podemos alimentar el programa de la computadora para resolver el
solución exacta en un soio paso. Este es ei caso en que � es una función iineai. Esto problema del valor inicial. Los valores aproximados de las funciones discretas x 1 (t¡) y
ocurre cuando la ecuación diferencial es lineal. En dicho caso, el problema de valores xz(t¡)paraa = to;;;; t¡;;;; tm = bconviene almacenarlos en la memoria de la computadora
en la frontera en dos puntos tiene la forma: como arreglos unidimensionales. Después, el valor de A. se puede calcular por medio de
{ x'' = u(t) + v(t)x + w(t):i
(4)
la ecuación (7). Finalmente, la solución y se puede computar en cada valor de t que se
quiera con la ecuación (6).
x(a) = a x(b) = �-
TEOREMA 1 Si el problema lineal de valores en la frontera en dos puntos (4) tiene una solución,
A continuación vamos a suponer que las funciones u, v y w son continuas en el intervalo entonces, o x 1 es una solución, o x¡(b)-x2(b) "#- O (y en este caso y es una solución).
[a, b]. Suponga que ya hemos resuelto dos veces la ecuación diferencial en (4) con dos
condiciones iniciales diferentes, habiendo obtenido las soluciones x 1 y x2. Digamos Demostración Sean y0, y1 y y2 soluciones de los siguientes problemas de valor inicial:

y; = u + VJo + wyb Yo(a) = a Yb(a) = O


{x1(a) = a r¡(a) = z1
(5)
x2(a) = a �(a) = zz. y� = vy¡ +wyí y 1 (a) = 1 YÍ(a) =O
Ahora forme una combinación lineal de X¡ y x2:
yf = VJ2 +wy� Y2(a) =O y�(a) = 1
Según la teoría de las ecuaciones diferenciales lineales de segundo orden (en particular,
y(t) = A.X¡(t) + (1- A.)xz(t), (6) del siguiente teorema 3), la solución general de la ecuación diferencial en (4) es:

donde A. es un parámetro. Se puede verificar fácilmente que y es una solución de la Yo + c¡y¡ + c2y2,
ecuación diferencial que satisface la primera de las dos condiciones en la frontera; es
decir, y(a) = a. Escogemos A. de modo que y(b) = �- Así, en donde c1 y c2 son constantes arbitrarias. Podemos ver de inmediato que las funciones
x¡ y x2 en (5) son casos especiales de la solución general dados por:
� = y(b) = h1(b) + (1-A.)xz(b) X¡ = Yo +Z1Y2 X2 = Yo +Z2Y2- (9)

y Como hemos supuesto que el problema en (4) tiene una solución, existen c y c tales que
1 2
A. = � -Xz(b) . (7)
X¡(b) -xz(b) a= Yo(a) + c¡ y¡(a) + c2 y2(a)
Al desarrollar en una computadora estas ideas para el problema lineal (4) podemos � = Yo(b) + c¡ Y1(b) +cz yz(b).
obtener x1 y x2 simultáneamente. Así, los dos problemas del valor inicial que debemos
resolver se pueden especificar de la siguiente manera: La primera de estas ecuaciones se reduce a c1 = O, de modo que inferimos la existencia

{
de una c2 tal que
x" =f(t, x. x')
� = Yo(b) + C2Y2(b). (10)
x" = f(t,x,x')
x(a) = a x'(a) = O
{
x(a) = a x'(a) = 1, *
Si x¡(b) -x2(b) O, entonces la función y definida por las ecuaciones (6) y (7) es una
solución de (4). Si x 1 (b) -x2(b) = O, entonces de las ecuaciones (9) deducimos que
Y2(b) = O. Entonces la ecuación (10) nos dice que y0(b) =�y la ecuación (9) que xi es
donde f(t, x, x') = u(t) + v(t)x + w(t)x'. La solución de la primera es x1 y la de la una solución. 1
segunda es x2. Para producir un sistema de ecuaciones de primer orden en el que t no
560 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.8 Problemas de frontera: métodos de disparo 561

Método de Newton En los dos subintervalos resolvemos dos problemas de valor inicial para obtener dos
la frontera en dos funciones x1 y x2:
Regresemos al problema más general (no lineal) de valores en
veamo s cómo se aplica el métod o de Newton.
puntos correspondiente a la ecuación (1), y i¡'=f(t,x¡,X¡) X¡(a)=a x;(a)=zr (a�t �c)
Recuerde que Xz es una sol u ción del proble ma
x!f.=f(t,xi,�) x2(b)=P �(b)=z2 (c�t �b)
{x1=f(t,Xz, X�)
(11)
xz(a) = a x�(a) = z. Advierta que z1 y z2 son parámetros a nuestra disposición. La función x1 sólo se necesita
en el intervalo [a, c] y x2 sólo en el intervalo [e, b]. La solución numérica de x2 seguirá
Queremos elegir z de modo que su curso en la dirección decreciente de t.
$(z) = xz(b) - P = O.
Los parámetros z1 y z2 ahora se deben ajustar hasta que la función definida por
pedazos
x1 (t) a5.t5.c
- -
La fórmula de Newton para la función $ es: x(t) = {
x2(t) e�t � b
$(z.) (12)
Zn+l = Zn - $ (znf se convierta en una solución del problema. De este modo, requerimos continuidad de x
'
y i en el punto c:x1 (c)-x2(c) = O y i¡(c)-�(c) = O. Estas dos condiciones se han de
a z todas las ecuaciones en (11): satisfacer con una hábil elección de z1 y zz. Normalmente esto se hace con el método
Para determinar$', derivamos parcialmente con respecto
de Newton en dimensión 2, como en la sección 3.5.
ax;= i}[_I!!_ a¡ ax�+ a¡ ax,_ El disparo múltiple con k subintervalos comprende k subfunciones, cada una de
+ las cuales se obtiene resolviendo numéricamente un problema de valor inicial. Los
az at az axz az ax� az (13)
{ valores iniciales de estas k subfunciones forman un conjunto de 2k parámetros. En cada
a ,
a
(a) = rzx,Ca) = l. uno de los k - I puntos de división interior del intervalo es obligatorio que la función
a?. o global y su primera derivada sean continuas. Esto trae consigo 2k - 2 condiciones. Hay
le v = axz/az, esto se con- dos condiciones adicionales para los extremos del intervalo, de modo que el número de
Con cierta simplificación.e introduciendo una nueva variab condiciones es igual al número de parámetros. El sistema de ecuaciones no lineales que
vierte en de ello resulta se resuelve iterativamente, por ejemplo, con el método de Newton para
v" = fx, (t, Xz, x�)v+fr. (t Xz, x�)v
1

: (14) dimensiones superiores.


{ = l.
v(a) = O v (a) Gran parte de los programas que se tienen disponibles para los problemas de valores
Este conjunto de ecuaciones se reconoce como un problema de valor inicial. La ecuación en la frontera en dos puntos están escritos para sistemas de ecuaciones diferenciales
diferencial en (14) se denomina prim era ecuación variacional. Se puede resolver paso ordinarias de primer orden
a paso junto con (11). Al final, v(b) estará disponible y tendremos: X1 =F(t,X),

ax,(b) donde X = (x1, x2, .•. , x.l y F = (!1,h, ... ,J,,f. Con mucha frecuencia se permite
v(b) = = $ '(z). que las condiciones en la frontera sean muy generales. Por ejemplo, algunos códigos
oz
permiten que las condiciones en la frontera sean de la forma
Esto nos permite utilizar el método de Newton -la ecuación (12)- para encontrar una
raíz de$. G(X(a), X(b)) = O,

Disparo múltiple donde G = (g1, g2, ... , g.l. Algunos programas requieren que el usuario suministre la
disparo múltiple. Aquí matriz jacobiana J de F, que es la matriz den x n con componentes lij = af¡/axj.
Una forma más elaborada del método del disparo se llama
el intervalo [a, b] en varios subintervalos para
la estrategia básica consiste en dividir bir lo que se haría Ejemplo Suponga que un programa del tipo recién descrito se utiliza con el problema
ma global por pedaz os. Tratem os de descri
tratar de resolver el proble
[e,
si el intervalo se subdividiera en sólo dos partes, [a, e] y
b].
{x" = tx + cos x'
El problema original es el mismo de antes, a saber;
x(3)+x'(5) = 7 x' (3)2x(5) = 10
{i' = J(t,x,x')
x(a) = a x(b) = P ¿Cómo son F, G y J?
562 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.8 Problemas de frontera: método
s de disparo 563
Respuesta Sean x1 = x y x2= x'. Ahora podemos expresar el problema en la forma 4. Muestre cómo se puede utilizar el método del
disparo para resolver un problema de
en la frontera en dos puntos del siguiente tipo, en
x; = x2 x¡(3)+x2(5) - 7= O el que las constantes et, � y cij estánvalores
dadas.
{
�= tx¡ + COSXz Xz(3)2 x¡ (5) - 10= O x"= u(t) +v(t)x +w(t)x'
{ cux(a) +c12x'(a)= a.
Se puede leer directamente las funciones F y G de las ecuaciones. La función jacobiana
c21x(b) +c22x'(b)=�-
está dada por
J(t, X)= 11 '5. Escriba un algoritmo para el método del dispa
ro. Resuelva con dicho método el siguie
[� -s;nx2] problema de valores en la frontera en dos puntos : nte

Ecuaciones lineales de segundo orden x"= e'+xcost- (t+ l)x'


{x(O)= 1 x(l)=
3
Citamos en este lugar dos importantes teoremas provenientes de la teoría general
de las ecuaciones diferenciales lineales de segundo orden. La referencia estándar para Advierta usted que el problema es lineal. Utilice el método de Runge-Kutta de orden 4 con
tales cuestiones es Coddington y Levinson (1955]. un incremento h= 0.01.
6. ¿Cuál es la primera ecuación variacional correspondiente a la siguiente ecuación diferencial
TEOREMA 2 Si u, v y w son funciones continuas en el intervalo cerrado [a, b], entonces para todo lineal?
par de números reales a y a' el problema de valor inicial x" =a(t) +b(t)x +c(t)x'.
7. ¿Cuál es la primera ecuación variacional corres
:r!'= u+vx+w:r! pondiente a la siguiente ecuación diferencial?
{
x(a) = a :r!(a) = a' x"= cos(tt) + sen(t2x')
tiene una solución única en [a, b]. ¿Se puede resolver numéricamente y por separado la
primera ecuación variacional, o se tiene
que resolver simultáneamente con la ecuación en x" ?
TEOREMA 3 Toda solución de la ecuación (no homogénea) 8. Demuestre que si x1 y x2 son soluciones de x" = u(t)
iniciales x1(a) = x2(a) = a., .i¡(a) = O y x�(a) = + v(t)x +w(t)x' con las condiciones
primer problema variacional de la ecuación (12). 1, entonces x2 - x1 es la solución del
x"-vx-wx'= u (15)
9. Demuestre que si resolvemos un problema lineal de
valore
se puede expresar en laformaxa+c¡X¡+czxz, donde xo es cualquier solución particular método de Newton para $, y calculamos $' por medio s en la frontera en dos puntos con el
de (15), y x1 y x2 constituyen un conjunto linealmente independiente de soluciones de la el resultado es el mismo que se da en las ecuaciones (6) de la primera ecuación variacional,
y (7).
ecuación (homogénea) 10. Demuestre que la función$ es lineal en el caso de
una ecuación diferencial lineal.
x"-vx-wx'=O 11. Resuelva el problema
x"=-9x
{
SERIE DE PROBLEMAS 8.8 x(O) =1 x(it/6)= 5.
l. Valiéndose de la solución verdadera, encuentre explícitamente la función$ en el caso: encontrando primero la solución x, del problema

x"=-9x
:(o�:; x(I) =3. {x(O) =1 x (O) =
{ // ' z
2 Determine la solución verdadera y encuentre explícitamente la función$ en el siguiente caso: y después ajustando z de modo que x,,(it/6)= 5. Descri

{
x(it/3)= 5. ba cómo se alteraría el resultado si
x"= -(x')2x- 1 12. Encuentre explícitamente la función$ en el siguie
nte caso:
x(l)= 3 x(2)= 5.
x"= -2t(x')2
{
x(O) =1 x(l) =1 + ¡
Resuelva el problema de valor en la frontera sirviéndose de$.
3. Resuelva analíticamente el problema de valores en la frontera en tres puntos:
Utilizando$, resuelva el problema de valores en la frontera.
{X111= -e1 +4(t+ 1)-J
2 13. Si x, es la solución del problema de valor inicial x" = x, x(O) = O, x'(O) = z, ¿cuál es el
x(O)=-1 x(l)= 3-e+21n 2 x(2)= 6- e +21n3. valor de x,(1)?
564 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias
8. 9 Problemas defrontera: método
s de diferenc iasfinitas 565
1 4. Para el problema de valores en la frontera en dos puntosx'' =x, conx(O) = O y x(l) = 17, Divida el intervalo [a, b] en los puntos a
¿cuál es la función $(z)? = to, t , t2, ..., tn+I = b. Estos puntos
no necesitan estar igualmente espaciados, pero ¡
15. Si x, es la solución del problema de valor inicial x" = -x, x(O) = 5, x' (O) = z y si en la práctica usualmente lo están
realidad, si los puntos no están distribuid . En
$(z) = x,( ¡t/ 2)- 3, ¿cuál es $'(z)? os uniformemente, es necesario
versiones más complicadas de las fórmulas ( ) introducir
1 6. Cuando resolvemos el siguiente problema de valores en la frontera en dos puntos: 1 y (2). De este modo, por simplicid
suponemos que ad,

x" - 37t"x' = 95
{
x(6) = 1 x(12) = 2,
t¡ = a+i h o:;;i:;;n+l
(4)
h= (b-a)/(n+l).

sirviéndonos del método del disparo con base en el método de la secante, obtenemos dos Denotamos con y¡ el valor aproximado de x(t;
). La versión discreta de (3) es
pares de números (Zi,x,,(b)) para i = 1, 2, digamos (4, 5) y (2, 9). ¿Cuál problema de valor
inicial hay que resolver para la siguiente iteración de este procedimiento?
Yo = a
17. Con relación a la discusión del problema lineal de valores en la frontera en dos puntos, -2
demuestre que se debe dar a c1 y c2 los va lores e¡ = O y c2 = [J3-yo(b)]/n(b). { h (Yi-t- 2 y¡ + Y;+¡) = f(t¡, Y;, (2h)-1(Yi -
+I Yi-1)) (1 :;; i:;; n) (5)
1 8. (Continuación) Demuestre que si yz(b) = O, entonces el problema de valores en la frontera = p.
no es resoluble para cualquier par (a.,�). Yn+I
e 19. Escriba un algoritmo para resolver el problema lineal de dos puntos tal como se describe en
el texto. Remítase a las ecuaciones (4) a (8). Escriba un código de propósito general con El caso lineal
base en este algoritmo. Las funciones u, v y w deben ser sumínistradas por el usuario en En la ecuación (5) las incógnitas son y¡, 2, •.•
forma de subrutinas. Y , , y hay n ecuaciones por resolver.
Si f depende de y¡ de un modo no lineal, las ecuac Yn
c20. (Continuación) Ponga a prueba el código del problema 19 con el siguiente ejemplo: iones serán no lineales y, en general,
difíciles de resolver. Pese a todo, supongamo
u(t) = e,-¡, v(t) = t2+ 2, w(t) = sen t, a= 2.6, b = 5.1, a.= 7.0, � =-3. s que f es lineal en x y
x. En tal caso es
de la forma:
2 1. Demuestre que el siguiente procedimiento resuelve el problema (4) de valores en la frontera f(t, .x, x') = u(t)+ v(t)x + w(t)x'.
en dos puntos siempre que existe una solución. Resuelva dos problemas de valor inicial (6)
El sistema (5) es ahora un sistema lineal de ecuac
iones, que se puede escribir en la forma:
x;' = u+vx¡+wx; X¡(a) = e,. x; (a) = O
{
x.!/. = vx2+w� X2(a) = O x�(a) = l .
Yo=a
Entonces: ox1 e s l a solución, oxi+ c.x2 con e = [J3-x1(b)J/x2(b) e s l a solución. { (-1- hw¡)y¡_¡+ (2 + h 2v¡)y¡+
f (-1 + hw¡)Ji+I = -h2u ¡ ( 1 :;; i:;; n)
f
22. Demuestre que el problemax" =x, x(a) = a,x(b) =� siempre tiene una solución única. (7)
(Suponga que a ;t b.) Yn+t = p.
Hemos escrito u ¡ = u(t;), V¡ = v(t¡), etcétera.
Ahora introducimos las abreviaturas:
8.9 Problemas de frontera: métodos de diferencias finitas
a¡ =-1-fhwi+l
Otro enfoque del problema de valores en la frontera en dos puntos consiste en discretizar
el intervalo correspondiente a t, y después utilizar fórmulas de aproximación para las
d¡ = 2+h v¡
2

derivadas. Las siguientes fórmulas son especialmente útiles: C¡=-i+fhw¡


1
x'(t) = (2h)- [x(t+h)-x(t-h)]- (1/6)h x"'(�) (1) b¡ = -h2u ¡,
2

x"(t) = h-2 [x(t + h)- 2x(t)+x(t- h)]- (l/1 2)h x( l (t) de modo que el sistema de ecuaciones tiene el siguie

1 r ·fi 1
(2) nte aspecto:
2 4

Ecuaciones diferenciales de segundo orden


d¡ C¡
a ¡ dz c2
b¡- ªºª
Suponga que el problema que se quiere resolver es el siguiente: ª2 d3 C3
b2

{ x" = f(t, x, x')


jl 1 (8)
(3) ª•-2 dn-1 Cn-1 Yn�l J
x(a) a
= = p. bn-l
ª•-t d,.
x(b)
Yn bn- c.p
566 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias
r!
8.9 Problemas de frontera: métodos de diferencias finitas 567
Como los elementos que no se muestran son ceros, el sistema es tridiagonal y se Por otra parte, la solución discreta satisface las ecuaciones
puede resolver por medio de un algoritmo especial de Gauss. Advierta que si h es muy
pequeño y V¡ > O, la matriz del sistema es diagonalmente dominante, pues
h-2( yi-! - 2y¡+y;+J) = U¡+V¡y¡+W;(2h)-1 (Yi+I- y¡_¡). (12)
2
\2+h v¡I > II +!hwd +\1-!hw¡I = 2.
Si sustraemos la ecuación (12) de la ecuación (11) y escribimos e; = x;-y¡, el resultado es
Aquí debemos suponer que !hw¡\
1 �1, ya que en este caso los dos términos 1 ±!hw;
h-2(e¡_¡- 2e¡+e¡+¡)=V¡e¡+W¡(2hr1 (e;+¡- ei-!) + h ;,
2
son no negativos. En lo que sigue supondremos que V¡ > O y que h es suficientemente g (13)
pequeño como para que I khwd < l.
donde
Más adelante será necesaria la siguiente desigualdad: 4 111
g; = (1/12)x( )('t;)- (1/6)x (�¡). (14)
\d;I- lcd - laí-t l = 2+h v¡ - (1-!hw;)- (1+!hw¡)
2 2
Después de agrupar los términos y multiplicar por-h , tendremos una ecuación similar
2
(9) a la ecuación (7), a saber:
=h v;.
(-1-!hw;)e;-1+(2+h2 v;)e;+(-1+ !hw;)e;+i = -h4 ;. g (15)
Convergencia
Vamos a demostrar que cuando h se aproxima a cero, la solución discreta converge a Sirviéndonos de los coeficientes que introdujimos previamente, podemos escribir esto
la solución del problema de valores en la frontera. Para saber que la solución al problema último en la forma:
de valores en la frontera a¡_¡e¡_¡+d;e;+c;e;+¡=-h4g;. (16)
x" = u+vx+wx' Sea 11.= 11e 11 oo y elija un índice i para el cual
{ (10)
x(a)=a. x(b)=�
es única, recurrimos a un teorema de Keller (1968, pág. 11] que conduce a tal conclusión !e;!= lle lloo =11..
bajo las hipótesis de que u, vy w pertenecen a C[a,b] yv> O. Por lo tanto, estas premisas
se asumen. El teorema de Keller es el siguiente: Aquí e es el vector e=(e 1, e2, ... ,e.). Inferimos ahora de la ecuación (16) que
4
TEOREMA El problema de valores en la frontera ld;I led �h !gd +\cd le;+d + la;_¡\ le¡_¡¡,

x"=f(�x,x') y recurriendo a la ecuación (9):

{C¡¡X(a)+C¡zx'(a) = C¡3 4
ld;!11.�h llglloo + !cd11.+ la;-1'11.
c21x(b)+c22x'(b) = C23 4
11.( ldd - !cd - ! a¡_¡I)�h 1igllco
tiene sólo una solución en el intervalo [a,b] siempre que:
h2V¡A.�h4 llglloo
(i) f y sus primeras derivadas parciales fr, fx, fx, sean continuas en el dominio
D=[a,b]xlR.xlR. !le!loo �h2[ llglloo / ínf v(t)]
(ii) Ir> O, l!xl�M, lfx,I�M sobre D
Por la ecuación (14), !lglloo � !lx(4l¡¡ co /12+!lx111!!00 /6. La expresión entre paréntesis
(iii) len\+ lc12I > O, lc21I+ lc22I > O, len\+\c2¡\ > O, c¡¡c¡2 �O�c21c22
angulares es una cota independiente de h. Podemos ver de este modo que lie lloo es O(h2)
cuando h -+ O.
Denotamos con x(t) a la verdadera solución del problema, y con y¡ a la solución
discreta. Advierta que y¡ depende de h. Vamos a estimar el valor de lx;- y¡ 1 y a mostrar
que converge a cero cuando h __, O. Aquí, por supuesto, X¡ denota a x(t;). SERIE DE PROBLEMAS 8.9
Con la ayuda de las fórmulas (1) y (2) podemos ver que x(t) satisface el siguiente l. Resuelva el problema de valores en la frontera en dos puntos
sistema de ecuaciones para 1�i�n:
{x" +2x' + lOt = O
h -2(x¡ _¡- 2x¡+x¡+I)- (1/12)h2xf4l('t¡) x(O) = 1 x(l)=2
(11)
=U¡+V¡X¡+W¡[(2h) -1 (X - X¡_¡ ) - (1/6)h2x (�¡)].
111
¡+¡ parax(!), valiéndose del método de diferencias finitas con h = !-
568 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.10 Problemas de frontera: colocación 569

2. Muestre las modificaciones que hay que hacer a las ecuaciones lineales (7) para hacer frente de colocación, los vectores u, w y Vj son funciones con un dominio común. Lo que se
a condiciones en la frontera de la forma: precisa es que las funciones w y r;=l CjLVj coincidan en n puntos prescritos:
cux(a) +c12x' (a)+c¡3 = c21x(b)+C2zX (b)+c23 = O.
1

¿
j I
cj(Lvj)(t ) =w(t )
¡ ¡ (1 � i � n). (4)
3. Utilice el teorema de Keller para demostrar que el problema de valores en la frontera (10) =
tiene una solución única, a condición de que las funciones que figuran como coeficientes
sean continuas y v > O. Éste es un sistema de n ecuaciones lineales a partir del cual podemos calcular el valor de
e 4. Escriba un programa de propósito general para la computadora que resuelva problemas los n coeficientes 9. Desde luego, las funciones Vj y los puntos t¡ se deben escoger
lineales de valores en la frontera en dos puntos, por medio del método de diferencias finitas, de modo que la matriz con componentes (Lvj)(t¡) sea no singular.
con apego a su descripción en el texto. Permita que el usuario suministre a, a., b, � y n y las
funciones u, v y w como en las ecuaciones (3), (4) y (6).
Problemas de valores en la frontera de Sturm-Liouville
c5_ (Continuación) Ponga a prueba el programa del problema 4 con los siguientes ejemplos:
x" Veamos cómo trabaja este método con un problema de valores en la frontera de
(i) { =-X Sturm-Liouville:
x(O) = 3 x(1t/2) = 7
{ X11 = 2e1 -X
u"+pu'+qu=w
{
(ii) u(O) = O u(l) = O. (5)
x(O) = 2 x(l) = e+cos 1 Aquí las funciones p, q y w son conocidas y se supone que son continuas en el intervalo
Las soluciones son: (i) x(t) = 7 sen t+3 cos t (ii) x(t) = e'+cos t. [O, l ]. La función u es desconocida; también ella está definida en [O, l ], y esperamos
Calcule los errores correspondientes a las soluciones numéricas en estos dos casos. que sea dos veces continuamente diferenciable. Este problema se torna en un ejemplo
del esquema recién bosquejado si definimos el operador L como sigue:

*8.10 Problemas de frontera: colocación


Lu = u" +pu' +qu. (6)
Buscamos una solución en el espacio vectorial:
El método de colocación proporciona una estrategia muy útil para acometer diversos V={u E C2 [0, l]: u(O)=u(l)=O}. (7)
problemas en la matemática aplicada. Antes de adentrarnos en los detalles daremos una
descripción general de este procedimiento. Suponga que tenemos un operador lineal Por consiguiente, si escogemos nuestro conjunto de funciones básicas {v 1,
L (como, por ejemplo, un operador integral o un operador diferencial) y que queremos v2, •.. , v.} de V, las condiciones homogéneas en la frontera se satisfarán automática­
resolver la ecuación mente. Un conjunto de funciones que se sugiere es el conjunto (doblemente indizado):
Lu=w. (1) Vjk(t) = tj(l - t/ (j f; l, k f; !). (8)
En esta ecuación, w es conocido y u desconocido. Diversos métodos aproximativos para Podemos verificar rápidamente que
resolver la ecuación (1) comienzan seleccionando algún conjunto de vectores básicos
{v 1, v2, .•. , Vn} y en seguida tratan de resolver la ecuación (1) con un vector de la forma V¡k = jVj-1,k - kvj,k-1 (9)
v1; = j(j - l )vj-2.k - 2jkvj-1,k-l + k(k - l )vj,k-2 (10)
U= C¡V¡ + C2V2 + · · · + CnVn, (2)
Con base en las ecuaciones (9) y (10) es muy fácil escribir la función Lvjk· Si se toman
En vista de que L es un operador lineal, n funciones del conjunto descrito en la ecuación (8), y sin puntos t¡ se escogen en [O, 1],
podemos tratar de resolver las ecuaciones de colocación (4) y obtener una solución
n
aproximada del problema (5).
Lu=¿cjLVj
j =I
E-splines cúbicos
y la ecuación (1) nos lleva a Tal vez una mejor selección de funciones básicas para estos problemas sea un
n
¿cjLVj=w (3) �onjunto de E-splines. Al describir cómo se pueden utilizar los B-splines con ventaja,
j=l tomamos como problema modelo uno ligeramente más general, a saber:
Porlo general, es imposible resolver el sistema (3) para los coeficientes c 1, c2,••. , c•. u"+pu'+qu=w
{ (11)
No obstante, quizá podamos hacer que la ecuación (3) sea casi cierta. En el método u(a)=a u(b) = �-
570 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias
*8.JO Problemas de frontera: colocación 571

A fin de que nuestras funciones básicas tengan dos derivadas continuas, sólo conside­
En la figura 8.5 se muestra la gráfica de la función E. El lector debería verificar que B
ramos E-splines E} con k � 3. Para hacer más sencillas las cosas, tomemos k = 3. es en realidad unE-splines cúbico.
También, tomemos los nudos a distancias iguales: t;+1 - t¡ = h y usémoslos como pun­
tos de colocación. Sea n el número de funciones básicas que utilizaremos (y el número
de coeficientes que hay que precisar). Para determinar n coeficientes debe haber un
total de n condiciones. En vista de que dos de estas condiciones corresponden a los
extremos del intervalo, a saber,

¿ c¡vj(a) = a L CjVj(b) = �, (12)


j=l j=l

deben haber n - 2 condiciones de colocación:

¿ cj(Lvj)(t;) = w(t;) (1 ;;í i ;;í n - 2), (13) -2 -1 o 2


j=l

Estas consideraciones nos llevan a definir: Figura S.S.

h = (b-a)/(n-3) (14) Al calcular (Lvj)(t¡) se necesitan la primera y la segunda derivadas de Vj. Estas
t¡ = a+(i- l)h (i = 0,±1,±2, ...) (15) derivadas se obtienen fácilmente de las ecuaciones (16) y (17). Un programa para la
computadora que lleve a la práctica el método de colocación haciendo uso de los E­
Los nudos t¡ que están en [a, b] son a= t¡ , t2, ... , tn-2 = b (como se podrá comprobar). splines cúbicos deberá incluir algunos subprogramas para calcular B(t), B' (t) y B" (t).
Estos nudos son los puntos de colocación. Algunos nudos fuera del intervalo [a, b] son En tal caso, las componentes de la matriz (Lvj)(t;) se podrán calcular eficientemente.
necesarios para definir los E-splinesE]. La disposición de los nudos se muestra en la Esta matriz será en bandas, pues cada función Vj tiene un soporte pequeño. Cualquier
figura 8.4. rutina de propósito general que se destine para el uso productivo, deberá explotar la
dispersión de la matriz de los coeficientes.
a b



¡ ¡
L2 L¡

to
¡ ¡ 1
I¡ 11 /3
• •
ln-4 fn-3
¡ 1
ln-2 lit-{

tn
¡
t,, +i
• SERIE DE PROBLEMAS *8.10
<1. (a) Programe un código de propósito general para resolver con el método de colocación
problemas de valores en la frontera en dos puntos de la fonna:
Figura8.4.
u"(t) + p(t)u' + q(t)u(t) = w(t)
{
u(a) = a u(b) = �

¡
Los E-splines cúbicos de interés para nosotros son aquellos que no son idéntica­ El usuario deberá especificar: (i) las funciones p, q y w; (ii) los números reales a, a, b y �
mente cero en [a, b]. Éstos sonE:2, B:1 , B5, By, ... , B!_3 . En conformidad, definimos con a < b;, (iii) n, el número de funciones básicas que se van a utilizar; (iv) las funciones
Vj = BJ_3 para 1 ;;íj ;;í n. básicas v; y sus derivadas vf, v;'. El programa deberá generar los n -2 puntos de colocación
En vista de que los nudos están separados por distancias iguales, las funciones Vj t¡ para 1 � i � n - 2 con un espaciamiento uniforme en el intervalo [a, b], incluyendo
los extremos. Después, formará un sistema de ecuaciones lineales de n ecuaciones con n
se pueden obtener a partir de un soloE-spline que denotamos con B y definimos de la incógnitas c1, c2, ... , c. como sigue:

t
siguiente manera:
(t + 2)3 /6 en[-2,-1]
c¡(Lv¡)(t;) = w(t;)

. .
(1 � i � n - 2)
[1 + 3(t + 1) + 3(t + 1)2 - 3(t + 1)3]/6 en [-1,0]
B(t) = ¡ (16) ¡=!

B(-t) en [O, 2]
o en otra parte. ¿ c v¡(a) = a ¿ c¡v¡(b) = �-
1
1=! 1=!
Entonces, como se puede verificar fácilmente,
(t-z
vj(t) = B -- -j + 2
) (17)
En este punto, para calcular los coeficientes e¡ el programa podrá llamar a otro programa que
resuelva sistemas de ecuaciones lineales. Por último, la solución aproximada u = I:;=I c¡v¡
h
se pondrá a prueba evaluando u y el residuo Lu-w en 2n-5 puntos uniformemente espaciados
572 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuaciones diferenciales lineales 573

en [a, b]. Éstos últimos incluirán los puntos de colocación (en donde los residuos deben ser TEOREMA 2 Si una matriz de n x n tiene un conjunto de vectores propios V ¡ , V2 , ..• , v. linealmente
cero), así como los puntos medios entre los puntos de colocación consecutivos. independientes, con AV; = l;V;, entonces el espacio de soluciones de la ecuación
(b) Ponga a prueba el programa escrito en la parte (a) resolviendo X' = AX tiene una base X; = t-11 V; con 1 � i � n.
u"+ (sen t)u' + (r + 2)u = e'-
3

{
u(2.6) = 7 u(5.l) = -3. Demostración El conjunto {X1,X2, ...,X.} es linealmente independiente, pues de I;;=I c;X; = O se
infiere que I;;=I c;t-"Vi = O, c;i!-11 = O y c; = O para 1 � i � n.
Utilice E-splines cúbicos con nudos uniformemente espaciados. Los puntos de colocación Para demostrar que el conjunto considerado genera al espacio de soluciones de
deberían ser los nudos en [a, b].
X' = AX, considérese una solución arbitraria X. Como elemento de 1.n o en, el vector
de valores inicialesX(O) es una combinación lineal de V¡ , V2, • • • , Vn , digamos:
*8.11 Ecuaciones diferenciales lineales
X(O) = L= C¡ V¡,

{
Consideramos ahora sistemas de ecuaciones diferenciales lineales con coeficientes cons­ i l

(n )
tantes. Los sistemas se supone que son autónomos, lo cual significa que la variable inde­ Sea Y= I;;= I c;X¡. En tal caso:
pendiente t no está presente explícitamente. Tales sistemas tienen el siguiente aspecto:
n n n
x; = a11X1 + a12X2 + ... + a¡nXn Y'= ¿c;Xf = ¿c;l;l11 V¡ = ¿c;l¡1AV¡=A ¿c;X; =AY.
XÍ = az¡X¡ + a22x2 + ... + a2nxn i=l i=l i=l i=I
(1)
De esta manera, tanto X como Y son soluciones de la ecuación diferencial, y ambos
x� = a.¡x¡ + a.2x2 + ... + aMxn tienen el mismo valor inicial: Y(O) = X(O). (¿Por qué razón?) Por el teorema de
unicidad para el problema de valor inicial, concluimos que Y = X o, en otras palabras,
En notación vectorial y matricial esto simplemente es:
que X= I;;=l c;X;. 1111

X'=AX; (2)
Si A tiene la propiedad que se menciona en el teorema 2, entonces hay una matriz
donde X = (x1, Xz, ... , x.l y X' = (X¡, x�, ..., x�l. no singular P, cuyas columnas son los vectores V¡, V2, . • . , v•. Al traducir la ecuación
AV¡ = A¡ V¡ a la notación matricial obtenemos lo siguiente:
Valores y vectores propios AP=PA (4)
Tratemos de resolver este sistema con un vector de laformaX(t) = t-1 V, donde V
es un vector constante. Al sustituir esta solución tentativa en la ecuación (2), obtenemos: en donde A es la matriz diagonal con los valores 1 1 , 12, • . • , An sobre la diagonal.
Considere el cambio de variables (dependientes) descrito por X= PY. Como Pes no
'}..!1 V = ;tAV. (3) singular, podemos recuperar Y a partir de X. Ahora bien, el vector Y tiene las siguientes
propiedades:
Por consiguiente, si Y'= p- 1x' = p- 1 AX = p- 1APY = AY. (5)
AV=AV,
entonces la función vectorial t- V es en realidad una solución de la ecuación (2). Hemos
1 Por esto, la ecuación diferencial para Y es mucho más fácil de resolver que la que
corresponde a X, pues A es una matriz diagonal. Las ecuaciones individuales en el
demostrado lo siguiente:
sistema Y' = AY no están enlazadas, y se pueden resolver por separado.
TEOREMA 1 Si'}.. es un valor propio de la matriz Ay si V es el correspondiente vector propio, entonces
X(t) = t-1 V es una solución de la ecuación X' = AX. Ejemplo 1 Resuelva el problema de valor inicial X' = AX cuando
l l
[fl.
o
El teorema 1 indica que para resolver la ecuación diferencial X' = AX, debemos
tener algún conocimiento de los valores y vectores propios de A. Es más, la teoría acerca
A= O [ O O
O -1
] X(O) =
O
de las matrices similares nos mostrará cómo simplificar un sistema de ecuaciones dife­
renciales lineales por medio de un cambio de variables. Nos ocuparemos de inmediato Respuesta La matriz A - U es
de estas cuestiones. 1-1 O 1
En el siguiente teorema se describe la mejor situación posible respecto de la ecuación [ o -/1, o ]'
X'=AX. O O -1-A
574 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuaciones diferenciales lineales 575

y su determinante es el polinomio característico de A: Para cerciorarnos de que la serie correspondiente a eA converge, tomemos cualquier
norma en en y utilicemos la norma matricial subordinada para matrices de n x n corres­
(1 - 11,)(-11,)(-l - A.). pondiente. El resto de nuestra serie se puede estimar como sigue:
Las raíces del polinomio son los valores propios de A, y son 7,..1 = 1, 7,..2 = O y 7,..3 = -1.
Para cada uno de ellos podemos encontrar un vector propio resolviendo la ecuación 1/�fiA ll � �fiiiA ll � �fiiiAIJk (8)
k k

AV¡ = A.¡ V¡. Al tomar estos vectores como columnas de la matriz P obtenemos:
La última expresión es el resto de la serie exponencial ordinaria cuando z = IIA 11- Así,

[i
O 1]
= 1 O . el resto de la serie correspondiente a eA converge a O cuando m -+ oo. (Este argumento
P O -2 supone conocida la completitud del espacio de matrices den x n con la norma que se ha
especificado.)
Después encontramos que Si tes una variable real, entonces tA=At, y nuestra definición da como resultado:
l]6 . f
-1 =
[i
o
1 ¿11 = fAk. (9)
p o -! k=O

Si Y=( y1, y2, y3/, entonces el problema de valor inicial para Y es Y' = AY donde La derivación de la serie con respecto a t y la subsiguiente simplificación nos dan:
º]
[i :!_¿11 =A¿\t. (10)
o
A=P-1A = o o . dt
P O -1
TEOREMA 3 La solución del problema de valor inicial
Por consiguiente, tenemos que
X' =AX
Y =y
[J],
{
X(O) prescrita
Yi = o¡ Y(O)=P-1X(O)=
es X(t) = ¿\tX(O).
{Y3Í = -y3
y su solución es Demostración Con base en la fórmula X= eA1 W, con W = X(O), tenemos de inmediato que
Y1 = 8/ Y2 = 7 Y3 = -3e-t.
{X' =AeA1 W =AX
Como X=PY, la solución correspondiente para X=(xi, x2, x3l es 11
X(O)=eAº W = W.
8/ - 3e-1 X2= 7 X3 = 6e- •
1 11
Matrices diagonales y diagonalizables
X¡=

Exponencial de nna matriz Para que el resultado precedente sea práctico es necesario que el exponencial de la
Hay un método muy elegante para resolver sistemas de la forma X' =AX. Este matriz se pueda calcular de manera eficiente. Analicemos primero el caso en que la matriz
método hace innecesaria toda referencia a los valores propios de A hasta el momento de A es diagonal. Si A =diag(A. , A.2, ..., A.n), entonces Ak= diag(7,..f, :i..t ..., A.!), como se
calcular las soluciones numéricamente. Comenzamos por definir la exponencial de una ¡ consiguiente, para una A con tales características,
puede verificar fácilmente. Por
matriz.
At
e- ¿ k! di•ag(7,..k1 , �k, ••• , :i..k.)
= �f
Definición Si A es una matriz cuadrada, escribimos: k=O

¿\=I+A+ tiA2 + f!A3 +···. (6) = diag(e" 11, ?21, ••• , i•1). (11)

Esta definición se origina al sustituir la variable compleja z por una matriz en la serie En este caso especial, la solución de la ecuación diferencial X' = AX tiene como
estándar componentes:
e4= 1 +z+ + J¡ t + . ...
tiz2 (7) X¡(t) = e"1 X¡(Ü) (1 � i � n).
1
576 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuaciones diferenciales lineales 577
El análisis que acabamos de presentar es extensible sin más al caso en que A no Un bloque de Jordan se puede escribir en la forma:
es diagonal, sino diagonalizable. Esto último significa que A es semejante a una matriz
diagonal; es decir, que hay una matriz diagonal A y una matriz no singular P tales que J('J., k) = 'J.h +Hk, (13)
P- 1AP = A. Si esto es verdad, el cambio de variable X= PY transforma la ecuación
diferencial X' = AX en Y' = AY, tal como se muestra en la ecuación (5). La condición donde Ik denota a la matriz identidad de k x k , y Hk denota a una matriz de k x k de la
inicial X(O) se convierte en Y(O) = P- 1 X(O) y la solución es: forma:
O 1 O O O O

X= PY = P(t'1P- 1X(O)) = P diag(/1 1, /21, ••• , t"•1)P- 1 X(O).


O O 1 O O O
(12)
o o o o o o
Hk = (14)
Bloques de Jordan o o o o l o
Hemos postergado hasta este momento el análisis del caso en que A no es diago­ o o o o o l
nalizable. Esto significa que C" no tiene una base constituida de vectores propios de A. o o o o o o
Dos ejemplos de este comportamiento son los siguientes:

W'l
El resultado de multiplicar un vector por Hk es fácil de ver. Tenemos:

�2
A. O 1 O ··· 00
](A., 3) = [O "-1 O] Ü Ü �2 �3
](�2) = [� 1 . O O 1
o o A. Ü Ü �3 �4
�]
o o o

l
=
: ·
(15)
Ü iJ �k�I
Consideremos con detenimiento J(A., 3). Ya que la matriz es triangular superior, sus /
o o o J
�k
valores propios son los elementos sobre la diagonal. En consecuencia, su único valor �k
propio es A., y al escribir en forma completa la ecuación J(A., 3)X = U tenemos: o o o o o o
Es evidente que Hf V = O, pues cada aplicación de Hk a V elimina una componente. De
A.X¡ +X2 = A.X¡ esta manera Hk es nilpotente; en efecto, Hf = O. Este hecho es de utilidad al calcular
e41 cuando A es un bloque de Jordan. Tenemos:
{ A.X2+X3 = A.X2
A.X3 = A.X3. e()J,+H,)t = /!..l,�,t
( t ) (tH )j
Esto implica claramente que x2 = x3 = O y que la única solución es de la forma = � 'J. .lk j � . k
L., , j=O L., J.,
X=$, O, Oi. Esta solución forma un espacio unidimensional. En otras palabras, los j=O J.
vectores propios de ](A., 3) generan un espacio unidimensional en JR3 o en IC3• Para t2 ¡k-1
=i!1 [Ik +tHk + Hf+···+ - Ht 1] (16)
cada k � 2 hay matrices de la forma J(A., k), y todas ellas tienen la propiedad que hemos zi. (k l)!
observado en el caso de ](A., 3). Estas matrices se llaman bloques de Jordan. El teorema
más importante al respecto es el siguiente: La serie concluye como se muestra, debido a que la k-ésima potencia de H (al igual
k
que las potencias subsiguientes) son O. Observe que en el cálculo precedente hemos
utilizado un caso válido de la fórmula ¿\+B = e4 e9. (Véase el Prob. 13.)
TEOREMA 4 Toda matriz cuadrada es semejante a una matriz diagonal por bloques que tiene bloques
de lardan sobre la diagonal.
Resolvamos ahora la ecuación diferencial X' = AX cuando A es un bloque de
Jordan, digamos A = '}.Jk + Hk. La solución se obtiene aplicando el teorema 3 y la
ecuación (16); ésta es:

[
La forma especial que se menciona en el teorema se llama forma canónica de
Jordan de la matriz. He aquí algunos ejemplos de matrices de 3 x 3 en su forma 2 ¡k 1
X(t) = e'1tX(O) = it h +tHk + t Hk +· · ·+ _- Hk- X(O).
¡]
canónica de Jordan: zi. (17)

º] º]
l)! k

º] º]
(k

7 O
[O 5 O
5 1
[O 5 O
º] [5O 5O 1
o 1
[o o o [5O 51 1 . Ejemplo 2 Resuelva el problema de valor inicial X' =AX cuando

º ] �O) =
O O 3 O O 3 O O 5 o o o O O 5 3 1 o
O 3 1 O
A= [o o 3 1
La primera de estas matrices tiene tres bloques de Jordan, mientras que la segunda, la
tercera y la cuarta tienen dos. La quinta de ellas es en sí misma un bloque de Jordan. o o O 3 [!]
578 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuáciones diferenciales lineales 579

Respuesta La matriz A es de la forma 3I4 + H4. La solución, dada por la ecuación (17), es Ejemplo 3 Utilizando la anterior matriz C, resuelva el problema de valor inicial Y' = CY con las

1 l
condiciones iniciales Y(O) = (3, 2, 8, 4, ll.
X(t) = e31 (l + tH4 + !t2H¡ + it3H¡)X(O) Respuesta Los dos sistemas no enlazados son

º] [y¡]
=?[í]+.,[i]+wm+wm
7 +5t + I.5t2 +1.5t3
mi=¡¡
1
5 1
O 5
Y2
YJ
valor inicial [n

5 +3t +4.5t2 [j] =


[� �][�;]
valor inicial [ 1]
= e3t. 11
3+9t Aplicando el método que se ilustró en el ejemplo 2,obtenemos las siguientes soluciones:
9

Solución del problema con generalidad absoluta


[f:J =e51(J+tH3+it2Hf)
[!] [!] [!] [�]
=e5' +te5' +ire5
1

Estamos en posibilidad de describir la solución del sistema de ecuaciones -dife­ 3+2t+4t2


renciales X' = AX con entera generalidad, teniendo como punto de partida la forma
= 1 2+8t es'.
canónica de Jordan de A y la transformación de semejanza que la origina. Suponga que
�8
P- 1AP=C,

en donde C es la forma canónica de Jordan de A. Sabemos que el cambio de variables


[�;] = e '(I+tH2)
7
[ 1] 1]
= e11 [ +te11 [�] = [ t t ] e11. 1111

X = PY nos lleva a la ecuación diferencial Y' = CY. (En relación con esto vea la En la teoría de la ecuación diferencial X' =AX, la exponencial e41 se conoce como
ecuación (5) más arriba.) Esta ecuación diferencial, Y' = CY, se puede dividir en matriz fundamental de la ecuación. Hemos visto que dicha exponencial es la clave para

º]
bloques no empalmados. Para ver esto, considere un ejemplo como: resolver el problema de valor inicial asociado con la ecuación diferencial. Si contamos

[i
con la forma canónica de Jordan C de A y conocemos la transformación de semejanza
1 O O
5 1 O O
P- 1AP= C,
C= O 5 O O
O O 7 1
podemos entonces cambiar las variables por X = PY, resolver la ecuación Y' = CY y
O O O 7
regresar a X, obteniendo finalmente:
Las ecuaciones diferenciales son: X= PY = Pé1Y(O) = Pec1P- 1X(O). (18)
y¡= 5y¡ +Y2 Por otra parte, conocemos otra forma de la solución,a saber,X = e41 X(O). Al comparar
y�= 5yz +y3 esta solución con la ecuación (1 8), concluimos:
y�= 5y
3 ¿.1 = PeCtp-1.
y�= 7y4+y5
y�= 7y5 Esto se puede ver como una manera de calcular la matriz fundamental.

Está claro que el grupo formado por las tres primeras ecuaciones se puede resolver por
separado, al igual que el grupo formado por las dos últimas. El caso general es análogo a Problema no homogéneo
éste, pudiéndose ver que cada bloque de Jordan en C da lugar a un conjunto de ecuaciones Los principios que hemos establecido se pueden aplicar al problema no homogéneo
diferenciales que no se enlaza con las ecuaciones restantes. Con cada bloque de Jordan
se obtiene parte de la solución, como en la ecuación (17). X' =AX+W, (19)
580 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias *8.11 Ecuaciones diferenciales lineales 581

donde W puede ser una función vectorial de t. Consideremos en primer lugar el caso en Respuesta Las ecuaciones individuales son
que A es diagonalizable. En esta situación una transformación de semejanza p- 1AP=A
produce una matriz diagonal A. El cambio de variable X=PY transforma la ecuación x; =5x1 +x2+t2
(19) en �=5x2+x3+t
Y'=AY+P- 1 W. (20)
x� =5x3 + sent
Éste es un conjunto de n ecuaciones no enlazadas, de las cuales un caso típico tendría la
forma: El procedimiento que aquí se recomienda para resol ver las ecuaciones es comenzar por

L
r¡\t)=1..r¡(t)+g(t). (21) abajo siguiendo un orden inverso. Esto da como resultado:

La solución de esto es x3(t)= e51 {9+ e- s sensds}

L
5

1 51 5
e-i.sg(s) ds]. = (9+ 1
r¡(t)= ¿., [ri(O)+ (22) - sent- cost

L
26 ) e 26 26

Ejemplo 4 Resuelva la ecuación X' =AX+ W cuando {


x2 (t)= e51 7 + e- '[x3(s)+sJ ds}
5

º] [fl
t2 1 10
= (7+ - ) e51+1 9+ 1 te51
A= [oO o1 O w- [ t ] X(O)= 25 262 3: ( 26)
O O 2 sent 2 1 -1
+-( 12 sent+t cost)- -t-

l
262 5 25
Respuesta El sistema comprende las siguientes ecuaciones individuales no enlazadas:
{
X¡ (t)= e51 5+ e- 5'[x2(s)+s2 ] ds}
x; =t2
� =x2+t = (5+-
74 51
263)
1
e + 7+ - - - (lQ ,1 1
25 262 )
te- + - 9+ - r
1 .2 51
2 ( 26)
e

Xj =2x3 +sent 2 1 1
- -( 55 sent+37 cost)- -t2- - t 11
263 5 25
Las soluciones, obtenidas con la ayuda de la ecuación (22), son
El cómputo de la exponencial de matriz e4 es una tarea que se debería abordar con
pleno conocimiento de los escollos posibles. Recomendamos al lector el artículo de Mo­
X¡(t)=5+ ls2ds=5+ft3 ler y van Loan [1978]. Su investigación indica que el siguiente procedimiento de cuatro
pasos debe dar buenos resultados en la mayoría de los casos:
x2 (t)=e'[7+ Le-'sds] =8e'-t-l ( i) Sea j el primer entero positivo tal que IIA11 /'i � 1/2.

l
( ii) Si se da un margen de tolerancia e para el error relativo, elija como p al primer
entero positivo tal que 2P-3 ( p+1) � 1/ e.
x3 (t)= e21 [9 + !
e- 2s sens ds] = �e21 - � sen t - cos t 11111
( iii) Compute e-4/2; con base en la serie de Taylor truncada rf= ¿�=O l/k !.
( iv) Eleve al cuadradoj veces el valor ¿!/zi computado en el paso ( iii), hasta obtener
Si en la ecuación X'=AX+ W la matriz A no es diagonalizable, podemos utilizar e4 = (eAfzi/
la forma canónica de Jordan y un cambio de variables para dividir el problema en El valor calculado para e4 en el paso ( iv) es ¿\+E, donde E es una matriz que satisface la
subsistemas no enlazados. De este modo, basta con ejemplificar el procedimiento con desigualdad IIEII/IIAII � e. Esta conclusión es el corolario 1 de la referencia citada.
un único bloque de Jordan.
SERIE DE PROBLEMAS *8.11
Ejemplo 5 Resuelva la ecuación X'=AX+ W cuando
1. Encuentre la solución general del sistema X'=AX cuando
5 1
A= [O 5 1
O O 5
º] w- [ t2 ]
t
sent
X(O)= [;] A= [-i � -t].
3 O 1
582 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.12 Ecuaciones rígidas 583

2. (Continuación) Encuentre la solución de la ecuación en el problema I sujetándose a la 19. Haga una suposición en cuanto a la matriz inversa der! y entonces demuestre que usted está
condición inicial Xo = (-1, 4, 7/. en lo correcto. Advertencia: En general, ¡+a ;=r! e8.

· [ J"
3. Encuentre la solución general del sistema 20. Resuelva X'= AX cuando

A= -1 4O -33]
x\ = 3x1 -5x2 5
y X(O) = [ 51 .
xf = 2x1 +x2. 1 -2 1 3

4. Demuestre que para toda matriz A den x n,r! es no singular. Advertencia: No suponga que 21. Concluya el ejemplo 4.
/•0 =r!I para todas las matrices A y B den x n. (Véase el siguiente problema.)
+B
22. Demuestre que toda matriz que no es diagonalizable es el límite de una sucesión de matrices
5. Demuestre con un ejemplo que / = r!I no siempre es cierto. diagonalizables.
1
6. Demuestre que si A=p- BP, entoncesr! = p-1/P. 23. (Continuación) Considere un sistema lineal X' = AX, X(O) = V, en donde A no es
7. Demuestre con detalle cómo se utilizan la estimación en la ecuación (8) y un argumento de diagonalizable. Si B es una matriz diagonalizable próxima a A, ¿qué se puede decir acerca
completitud para determinar la convergencia en la ecuación (6). de la solución de Y' = BY, Y(O) = V?
8. Utilice inducción sobre k para demostrar que si V¡, V2, ... , Vk son vectores propios correspon­ 24. Demuestre que detr! = e"A, donde A es una matriz den x n y tr A es la traza de A, es decir,
dientes a k valores propios distintos de una matriz, entonces{Vi, V1, ..., Vk} es linealmente la suma de los elementos sobre la diagonal de A.
independiente. 25. Para una matriz A den x n, sea [Al = I;;=t I:;= 1 iaifl· Demuestre que [r![ ;i; n - I+e lAI .
9. Demuestre la ecuación (10) derivando la serie parar!'.
26. Aunque en general leª ;= /•0, lo que sí se cumple es quer!•0= Iim,_00 ¡/lkeB/kf
10. Utilice el resultado del problema 6 para demostrar directamente el resultado de la ecuación
(12), es decir, sin hacer un cambio de variable.
11. Sea B una matriz den x n y sean V¡, V2, ... , Vk vectores de lR" tales que V¡ ;= O, BV¡ = O,
BV2 = V¡, ...,BVk = Vk-1· Utilice inducción sobrekpara demostrar que{V1, V1, ..., Vk} 8.12 Ecuaciones rígidas
es linealmente independiente. ¿Qué tan gr-ande puede ser k?
12. Encuentre las condiciones exactas que debe cumplir una matriz de orden 2 a fin de que su En un sistema de ecuaciones diferenciales ordinarias la rigidez está relacionada con una
forma canónica de Jordan tenga sólo un bloque de Jordan.
fuerte disparidad entre las escalas temporales de las componentes del vector solución.
13. Demueste quer!•0 =r! e8 si y sólo si AB = BA. (Véase el Prob. 5.) Algunos procedimientos numéricos que en general funcionan satisfactoriamente, cuando
14. Demuestre que si A y B son diagonalizadas por la misma transformación de semejanza (es se usan para tratar ecuaciones rígidas, muestran una eficiencia muy raquítica. Esto sucede
decir, PAP- 1 y PBP- 1 son diagonales), entoncesAB = BA. cuando la estabilidad en la solución numérica se logra únicamente con una longitud de
paso muy pequeña.
15. Demuestre que la solución del sistema lineal
Las ecuaciones rígidas surgen en una amplia variedad de situaciones. Por ejemplo,
X'=AX+ V(t) X(O) = W al controlar un vehículo espacial se espera que la trayectoria no tenga alteraciones brus­
cas, pero, en caso de que se detecten desviaciones respecto de la trayectoria de vuelo

l
está dada por programada, de inmediato se puede hacer las correcciones necesarias. Otro sitio donde
X(t)=i'W+i' e-AsV(s)dl- aparecen estos problemas es en el monitoreo de procesos químicos, donde puede ha­
ber una gran diversidad de escalas de tiempo para los cambios físicos y químicos que
.t:lxplique qué se quiere significar con la integración indefinida que aquí aparece. tienen lugar. En la teoría de circuitos eléctricos los problemas rígidos surgen debido a
que, sobre el comportamiento generalmente suave del circuito, se pueden superponer
16. ¿Cuál es la solución del problema de valor inicial X'= AX cuando X se ha especificado en
un punto to diferente de O? transitorias con escalas de tiempo del orden de un microsegundo.
17. Demuestre que la matriz fundamental para el sistema
Método de Euler
X'=AX con A=[-� J] Usando el método de Euler en un sencillo problema modelo se pueden ejemplificar
las dificultades numéricas que comúnmente aparecen. El método de Euler es el método
es
1 2e-41+3e' -6e-41+6e' de Taylor de orden 1, y para el problema de valor inicial
5[ -e- 41+e' 3e-4t+2e'] ·
{x1 =J(t,x)
18. Demuestre que laj-ésima columna de la matriz fundamental es una solución del problema (1)
de valor inicial X' = AX, X(O) = [lj, donde U¡ es elj-ésimo vector unitario estándar. x(to) = xo
584 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.12 Ecuaciones rígidas 585

consiste en utilizar la ecuación Esto da lugar a


Xn+I = (1-hlr 1x•.
Xn+I = Xn+hf(tmXn) (n � O) (2) (9)
Por lo tanto en el n-ésimo paso tendremos:
Considere ahora el resultado que se produce al usar el método de Euler en el siguiente n
problema de prueba: Xn =(1-h1,,)- . (10)
x' = A.X
{ (3) En el caso en que 1,, sea negativa, nuestra condición de que la solución numérica imite el
x(O) = l. comportamiento de la solución verdadera se convierte en:
El método de Euler proporciona la siguiente solución numérica:
ll-hll- 1 <1. (11)
Xn+I = Xn +hA.Xn = (1+hl)xn X() = 1. (4)
Esto obviamente es cierto para todos los valores (positivos) de h.
De este modo la solución aproximada en el n-ésimo paso es:
Sistemas de ecuaciones diferenciales
Xn = ( l+h!,,)". (5)
Consideraciones similares también son válidas para los sistemas de ecuaciones
Por otra parte, la solución exacta de la ecuación (3) es: diferenciales. Una vez más recurrimos al principio que señala que un buen método
numérico debe comportarse adecuadamente cuando se usa en casos de prueba lineales
x(t) = ¿.:_ (6) que se consideren sencillos. (Recuerde que este principio se utilizó en la sección 8.5 para
concluir que la estabilidad y la consistencia son características esenciales de métodos
Si 1,, <O, la solución que aparece en la ecuación (6) decae exponencialmente. Conforme multipaso lineales que se consideren aceptables.) A continuación presentamos un caso
t tiende a infinito, la solución evoluciona hacia el estado estacionario de O. La solución de prueba sencillo consistente en un sistema de dos ecuaciones diferenciales:
numérica que se muestra en la ecuación (5) tenderá a O si y sólo si 11+hAI < l. Esto nos
obliga a escogerh > O de manera que 1+hl > -1, y como 1,, < O, debemos imponer la x' = ax+�y x(O) = 2
{ (12)
condición h <-2/l. y'=�x+ay y(O) = O.
Por ejemplo, si l = -20, deberemos tomar h < 0.1, a pesar de que la solución
que intentamos rastrear es extremadamente plana (y prácticamente cero) en el lapso La solución de este sistema es:
inmediato al instante inicial, t = O, donde x = l. Observamos que x(t) = e-201 �
2.1 x 10-9 para t � l . Por consiguiente, la solución numérica debe avanzar con x(t) = /a+!l)t + e<a-P)t
{ (13)
pequeños pasos en la región donde la naturaleza de la solución indica que se pueden usar y(t) = /a+!l)t- /a-P)t.
pasos largos. Este fenómeno es uno de los aspectos de la rigidez. Una función como
e-201, que decae a cero casi inmediatamente (es decir, con una pendiente negativa muy Si se usa el método de Euler para calcular una solución numérica de las ecuaciones (12),
pronunciada), se llama transitoria, debido a que su efecto físico es de corta duración. las fórmulas para generar la solución son:
Esperamos que el seguimiento numérico de una función transitoria requiera un paso de
longitud pequeño hasta que el efecto de la transitoria sea despreciable; después de ello, Xn+l = Xn +h(a x.+PYn) XQ =2
{ (14)
Yn+I =Yn+h$xn+ay.)
un buen método numérico debería funcionar adecuadamente con un paso de longitud
grande. El método de Euler no satisface esta espectativa. Yo = O.
Las soluciones de estas ecuaciones en diferencias son:
Método implícito de Euler Xn = (I+ah+�h)"+ (I +ah-Ph)"
{ (15)
Yn = (1+ah+�h)" - (1+ah-�h)".
Por contraste con lo anterior, el método de Euler implícito sí satisface el criterio
mencionado. El método de Euler implícito se define mediante la ecuación:
El caso que nos interesa queda delimitado mediante la condicióna <p < O. Según
Xn+I =Xn+hf(tn+I, Xn+t) (n � 0). (7) este supuesto, las soluciones que aparecen en las ecuaciones (13) decaen exponencial­
mente a cero. Para que las soluciones numéricas en las ecuaciones (15) imiten este
Cuando este método se usa en el problema de prueba presentado en la ecuación (3), se comportamiento necesitamos que
obtiene lo siguiente:
Xn+I = Xn +hA.Xn+I X() = l. (8) 11+ah+�hl<1 ll+ah-�hl<L (16)
586 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias 8.12 Ecuaciones rígidas 587

Las desigualdades que aparecen en (16) resultan equivalentes a la condición En este caso el decaimiento exponencial corresponde a µ < O. Para que el método
multipaso se comporte adecuadamente en dichos problemas, nos gustaría que las raíces
0 < h < -2/(<H �), de$ se encontraran en el interior del disco unitario, siempre que suceda que h > o y
'Re(').,) < O. Esta propiedad se llama A-estabilidad.
en vista de que a. < � < O. Para ver lo que puede suceder, suponga que a. =-20 y que El método de Euler implícito que aparece en la ecuación (7) es A-estable, tal como
� = -19. Nuestras soluciones resultarán entonces combinaciones de e -391 y e -1• La se muestra en la ecuación (11). El método del trapecio implícito, definido mediante
primera de éstas es una función transitoria, que después de un corto intervalo de tiempo
es despreciable si se compara con e -1• Aun así, es un hecho que la transitoria controlará Xn - Xn -1 = !h(fn +fn_¡) (23)
la longitud de paso permitible a lo largo de toda la solución numérica.
también es A-estable, debido a que el polinomio es
Métodos multipaso lineales. Caso general
$(z) = z - I - '},.,h(f z+f ),
Examinemos el método multipaso lineal de la sección 8.5 en el caso general. Nues­
tro fin es averiguar qué propiedades adicionales debe tener para que funcione satisfac­ y su raíz es z = (2 +Ah)/(2 - Ah); fácilmente vemos que cuando h > O y 'Re('},.,) < O,
toriamente en el caso de nuestra ecuación de prueba (3). El método general adopta la esta raíz está dentro del disco unitario.
forma: Un teorema importante, demostrado por Dahlquist (1963], señala que un método
multipaso lineal A-estable debe ser un método implícito, y que su orden no puede ser
akXn+ak-!Xn -l + · · ·+ aoXn-k = h(bdn+bk-!Ín-1+ · · ·+ bofn-k). (17) mayor que dos. Este resultado impone una restricción severa sobre los métodos A­
estables. Con frecuencia la regla del trapecio implícita se usa en los casos de ecuaciones
Cuando ésta se usa en el problema de prueba obtenemos: rígidas debido a que presenta el mínimo error de truncamiento entre todos los métodos
multipaso lineales y A-estables.
akXn+ªk-!Xn -1+ · · · +aoXn-k = hA.(bkXn +bk-!Xn -1+ · · · +boXn -k). (18)
Región de estabilidad absoluta
De este modo nuestra solución numérica resolverá la ecuación en diferencias lineal
homogénea: Todo método multipaso posee una región de estabilidad absoluta. Ésta es el con­
junto de números complejos ro tales que las raíces de p - roq se encuentran en el interior
(ak - Mbk)xn + (ak-1 - h').,bk-l)xn-1 +...+ (ao - hA.bo) Xn -k = o. (19) del disco unitario. De las discusiones anteriores se concluye que un método funcionará
adecuadamente en un problema de prueba x = AX si ').,h se encuentra en la región de
Las soluciones de esta ecuación serán combinaciones de ciertas soluciones básicas del estabilidad absoluta. También nos damos cuenta de que un método es A-estable si y sólo
tipo Xn = r", donde r es una raíz del polinomio si su región de estabilidad absoluta incluye la mitad izquierda del plano.

$(z) = (ak - hA.bk)t +(ak-1 - hA.bk-1)/-1+ · · ·+ (ao - hAbo). (20) Ejemplo ¿Cuál es la región de estabilidad absoluta para el método de Euler?

Dése cuenta de que el polinomio definido en la ecuación (20) es de la forma$ = p- '},.,hq, Respuesta El método de Euler se define mediante la ecuación
donde p y q son los polinomios que resultaron útiles en la sección 8.5, a saber,
Xn - Xn -1 = hfn -1·
p(z)=akt+ªk-1!-1+ · · ·+a1z+ao (21)
Por lo tanto, p(z) = z - 1, q(z) = 1 y $(z)= z - I - ro, donde ro= Ah. Ahora la raíz
q(z) = bkt+bk-1!-1 + · · ·+b1z+bo (22) de$ es z = I +ro. Para que todas las raíces de$ queden en el interior del disco unitario
necesitamos que I +ro < 1. Éste es el disco de radio uno en el plano complejo con
f f

centro en -1. 11
A-Estabilidad
Si A < O en el problema de prueba (3), la solución decae exponencialmente. Para En vista de que la A-estabilidad es una restricción muy severa, aun cuando los
que la solución numérica obtenida a partir del método multipaso planteado en la ecuación métodos no posean esta propiedad, se siguen utilizando en problemas rígidos. Una
(17) refleje este comportamiento es necesario que todas las raíces del polinomio$ en la vez hecho esto tenemos la esperanza de que ro = ').,h se encuentre en la región de
ecuación (20) se encuentren en el disco Jz[ < l. Para valores complejos de A, digamos estabilidad absoluta correspondiente al método. La cantidad ').., está asociada con la
A=µ+iv, la solución del problema de prueba es: ecuación diferencial que se está resolviendo. Para el caso de una sola ecuación lineal, A
es el coeficiente de x en la ecuación. Para una sola ecuación no lineal, A puede ser una
x(t)= e M = e µ'e ivt= e µ'(cosvt+i senvt). constante que surge de aproximar localmente a la ecuación mediante una ecuación lineal.
588 Capítulo 8 Solución numérica de ecuaciones diferenciales ordinarias
8.12 Ecuaciones rígidas 589
Para un sistema de ecuaciones lineales, digamos X' = AX, 11. puede ser cualquiera de '4. Ponga a prueba el método del punto medio implícito
los valores propios de A. Por ello la cantidad que consiste en h veces cada valor propio
de A deberá encontrarse en la región de estabilidad absoluta del método que se utiliza Xn - Xn-1 = hf(tn-1 + !h, !(xn+Xn-1)),
En el caso de sistemas de ecuaciones no lineales podemos considerar la posibilidad
de aproximar localmente el sistema dado mediante sistemas lineales y el uso de los aplicándolo a la ecuación x' = A.X, con 71. < O, a fin de determinar si su desempeño frente a
criterios anteriores. Usualmente esta idea es imposible de llevar a cabo, y por ende la problemas rígidos será el adecuado.
única estrategia confiable para el caso de problemas rígidos difíciles consiste en recurrir 5. Determine si el siguiente problema es rígido:
a la regla del trapecio. Algunos de los mejores códigos en uso para el problema de
valor inicial se esfuerzan por detectar la rigidez a lo largo de los pasos que conducen a {x" = -20x' - I9x
la solución, y procuran además emprender alguna acción adecuada cuando aparece la x(O) = 2 x'(O) = -20.
rigidez. Para tener más detalles, el lector puede consultar a Gear [1971], Shampine y
Allen [1973], y Shampine y Gordon (1975]. En general los métodos de orden superior 6. Considere el método multipaso
poseen regiones más pequeñas de estabilidad absoluta, y ante la presencia de la rigidez,
estos códigos adaptativos ceden ante métodos de orden inferior que poseen regiones de Xn+ClXn-1 - (1+a)Xn-2 = kh[-af,, +(4+3alfn -il,
estabilidad absoluta más favorables. Determine a de manera que el método sea estable, consistente, convergente, A-estable y de
segundo orden.
Ecuaciones no lineales 7. Verifique que las ecuaciones (15) generan la solución de las ecuaciones (14).
Con el fin de apreciar la relevancia de las consideraciones anteriores en lo que toca a 8. Encuentre la región de estabilidad absoluta de la regla del trapecio implícita que se define
los sistemas de ecuaciones no lineales, centremos nuestra atención en un sistema típico, en la ecuación (23).
que suponemos autónomo: 9. Cierta reacción química se describe mediante ei siguiente sistema rígido:
X'= F(X'). 2
( 4)
x; = -I000x1 +x2 X¡(O) = 1
En este caso X es una función vectorial de t que tiene n funciones componentes x1, {
x2, .•• , x•. En el lado derecho de la ecuación se tiene una función F: lR" -+ lR". Esta xf = lOOOx1 - 2x2 x2(0) = O.
función tiene funciones componentes, que denotamos conf¡. La matriz jacobiana de
Fes la matriz J = (lij) con lij = 8f¡/axj . En un punto Xo la forma linealizada de la
Demuestre que x1 decae rápidamente mientras que x2 decae lentamente. Dicho sistema es
difícil de resolver debido a que es necesario utilizar una longitud de paso muy pequeña.
ecuación ( 2 4)es: ro. Demuestre que las dos relaciones de desigualdad (16) son equivalentes aO < h < -2/(a+�)
X' = F(Xo)+ J(Xí;)(X - Xo), (25) en el caso en que a < � < O.
donde J(Xo) indica el valor de J en X0• La ecuación (25) es una ecuación diferencial
lineal y los valores propios de la matriz J(Xo) juegan un papel en la teoría. Si resulta
que la ecuación (24) es rígida en la vecindad de Xí;, estos valores propios satisfacen las
desigualdades:
'R.e(A.¡) � 'R..eA.( 2) � • • • � 'R.eA.( n) < O
y 'R..e(11.1 ) es mucho más pequeña que 'R.e(11..).
Si un método multipaso va a funcionar adecuadamente en dicho tipo de problema,
entonces h11.1 deberá estar en la región de estabilidad absoluta de dicho método. Si las
11.1 fueran conocidas, dicha información podría utilizarse para elegir apropiadamente el
valor de h.

SERIE DE PROBLEMAS 8.12


l. Encuentre la región de estabilidad absoluta para el método implícito de Euler definido por
la ecuación (7).
2. Determine si la ecuación x"-= (57 + sen t)x es o no es rígida.
'3. Resuelva la ecuación diferencial del problema anterior con las condiciones inicialesx(O) = 1,
x'(0) = -./57. (Se puede utilizar la transformación de Riccati para obtener un par de
ecuaciones equivalentes sobre las cuales aplicar el software disponible.)
Capítulo 9

SOLUCIÓN NUMÉRICA DE
ECUACIONES DIFERENCIALES PARCIALES

9.1 Ecuaciones parabólicas: Métodos explícitos


9.2 Ecuaciones parabólicas: Métodos implícitos
9.3 Problemas sin dependencia temporal: Métodos de diferencias finitas
*9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz
*9 .5 Ecuaciones diferenciales parciales de primer orden; curvas características
*9.6 Ecuaciones de segundo orden cuasi-lineales; características
*9.7 Otros métodos para los problemas hiperbólicos
9.8 Método de mallas múltiples
*9.9 Métodos rápidos para la ecuación de Poisson

Este capítulo nos introduce al tema de la solución numérica de ecuaciones diferenciales


parciales. Los cálculos numéricos que surgen en esta área son de tal magnitud que fácil­
mente pueden agotar los recursos de las más grandes y veloces computadoras. Debido a
la inmensa carga de cómputo que usualmente se requiere para resolver ecuaciones dife­
renciales parciales, esta rama del análisis numérico es una de las que actualmente cuenta
con más amplios programas de investigación. Conforme vayamos considerando varios
problemas representativos y los procedimientos disponibles para resolverlos, se hará
evidente por qué los requerimientos en cuanto a almacenamiento y tiempo de cómputo
(aun si se usan supercomputadoras) son tan grandes.

9.1 Ecuaciones parabólicas: Métodos explícitos

Iniciamos con una típica ecuación diferencial parcial de tipo parabólico.

Ecuación de calor
Una ecuación de este tipo es la ecuación de calor, también conocida como ecuación
de difusión. Si se eligen adecuadamente las unidades para las cantidades físicas, la
ecuación de calor tendrá la siguiente forma:
U:a; + Uyy + Uzz = u,. (1)

En esta ecuación u es una función de x, y, z y t. La notación u, denota íJu/Bt, U:cc


representa í32u/ax2 y así sucesivamente. La ecuación (1) describe la temperatura u en
el tiempo t en la posición (x, y, z) en un cuerpo tridimensional. El valor de u en el punto

591
592 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales
9.1 Ecuaciones parabólicas: Método
s expl ícitos 593
(x, y, z. t) lo denotamos con u(x, y, z, t). Por lo tanto u es una función real de cuatro Método de diferencias finitas
variables reales.
Al igual que en la teoría de ecuaciones diferenciales ordinarias, un problema físico Una de las estrategias más importantes para reso
lver numéricamente problemas
planteado adecuadamente nunca consta de sólo una ecuación diferencial parcial; debe como el que aparece en (2) es usar el método
de diferencias finitas. En su primera
etapa consiste en discretizar el dominio de la mane

{
haber además un número suficiente de condiciones en la frontera para poder determinar ra siguiente:
una solución única del problema. A continuación tomamos como problema modelo
la ecuación de calor (1) en su versión unidimensional, junto con algunas condiciones � =jk j � o
{
auxiliares: x; = ih O��
i n+l (3)
U = U1
,:x (t � Ü Ü $ X $ 1)
u(.x, O)= g(x) (O� x�1) Las variables t y x tienen diferentes longitudes de paso, denotadas por k y h, respecti­
(2) vamente. En vista de que x recorre todo el intervalo [O, l ], sucede que h = 1/(n+1).
u(O, t) = a(t) (t � O)
Nuestro objetivo consiste en calcular soluciones aproximadas de la función solución u
u(l, t) = b(t) (t � 0). en los llamados puntos de la malla (xi,�).
El siguiente paso en este proceso es elegir algunas fórmulas sencillas para apro­
El sistema (2) modela la distribución de temperatura en una barra de longitud uno, cuyos ximar las derivadas que aparecen en la ecuación diferencial. Algunas fórmulas básicas
extremos se mantienen a temperaturas a(t) y b(t) respectivamente (Véase la Fig. 9.1). familiares que se pueden utilizar son las siguientes:
Suponemos que las funciones g, a y b son datos del problema. Más aún, la función g
describe un perfil de temperatura inicial. La función u es una función de (.x, t); no existe 1
dependencia respecto de y o de z. La figura 9.2 muestra el dominio en el que se busca f/ (x) ¡:::: -¡/f(x+h) -f(x)]
(4)
conocer u(x, t); es un subconjunto del plano determinado por las variables x y t. 1
J'(x) ¡::,: Zh [f(x+h) -f(x -h)] (5)

-e )
1
J"(x) ¡:::: ¡;.[f(x+h) -2f(x)+f(x -h)] (6)
�X
Naturalmente, se cuenta con muchas otras fórmulas
como las anteriores, cada una de las
o cuales aporta diferente grado de precisión.
Acto seguido sustituimos el problema planteado en
2) por una versión discretizada
en la que se han utilizado las ecuaciones (4) y (6). En (
Figura 9.1 Barra de longitud uno. vista de que estos dos problemas
tendrán soluciones diferentes, usamos otra letra, para
v, el problema discreto:
1
¡;.[v(x+h, t) -2v(x, t)+v(x - h, t)] = 1k[v(.x, t+k) -v(x, t)].
(7)
Para simplificar la notación tomamosx = x; y t = t
j en la ecuación (7) y luego abreviamos
v(x;, tj) con Vif. El resultado es
a(t) b(t)
1 1
¡;.(V;+l,j - 2V¡j+V;-¡.j) = k(V4j+l -Vij). (8)
Cuando j = O en la ecuación (8), todos los términos que ahí aparecen son conocidos,
con excepción de V¡¡. De hecho, la distribución de la temperatura inicial, g, señala que

g(x;) = u(x;, O) = v;o.


=+-----'--l� X
En otras palabras, conocemos el valor correcto de u ( y de v) en el nivel de t que corres­
ponde a t = O . Por ello los valores de vn pueden calcularse a partir de la ecuación (8).
g(x) Con este fin, la ecuación se escribe en la forma equivalente:

Figura 9.2 Dominio de la solución. V4j+I = ¡;.(V;+l,j -2V4j+Vi-1,j)+V;,j


Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.1 Ecuaciones parabólicas: Métodos explícitos
594 595
Análisis de estabilidad
La ecuación (9) define el proceso numérico y se puede interpretar usando la notación
común de matrices y vectores. Denote con "Vj el vector de valores en el tiempo t == jk.

Vi,j+l inputn,k,M
h +- I/(n+ 1)
a(/) U;-t,j I U;,j V¡+t,j
b(I) S <- k/h 2
W¡ +- g(ih) (O� i � n+ 1)
t t- o
output O, t, (wo, W¡, ... , Wn+1)
forj = 1, 2, ... ,M do
X vo +- a(jk)
g(0
Vn+l +- b(jk)
Figura 9.3 Malla típica fori=1,2, ... ,ndo
V¡ <- SW;-¡ + (1-2s)w¡ + SW;+1
end
o usando la abreviatura s = k/h2, t t-jk
outputj, t, (vo, V¡, ... , Vn+i)
Vi.j+l = SVi-J,j + (1- 2s)vij + SVi+l,j (9) (w¡, w2, ..., Wn) <- (v¡, v2, ..., Vn)
end.
Mediante la ecuación (9) la solución numérica puede avanzar paso a paso en la
dirección t. En la figura 9.3 se presenta una muestra de un conjunto típico de cuatro puntos Por consiguiente,
de la malla que se incluyen en la ecuación (9). Dado que la ecuación (9) proporciona [Vtjl
explícitamente los nuevos valores vij+I en términos de los valores previos v;-t,j, Vij, Vzj
V;+1,j, el método basado en esta ecuación se llama método explícito. Yj = . . (10)
Es necesario enfatizar que aun si la computación de valores sucesivos de Vij se Vnj
lleva a cabo con absoluta precisión, la solución numérica diferirá de la solución analítica
La ecuación (9) se puede escribir como:
de la ecuación diferencial parcial. Esto se debe a que la función v es una solución de
un problema diferente, a saber, de la ecuación en diferencias análoga a la ecuación
diferencial. De hecho, debemos esperar una diferencia muy grande debido a la baja YJ+1 =A"Vj (11)

JJ
precisión de las fórmulas de aproximación que se utilizan en la diferenciación. en donde A es la matriz de n x n dada por
l-2s s o
Algoritmo s 1-2s s
El algoritmo para llevar a cabo los cómputos del método explícito anterior com­ A=I O s 1-2s (12)
prende dos etapas: inicio del proceso y solución. En este caso el número de puntos x; de
la malla en [O, 1 J es n+ 2, la longitud de paso en la variable t es k, y M es el número o o o
de pasos que se deben tomar en el eje t.
Se recomienda al lector que programe el algoritmo y que lleve a cabo los experi­ Observe que voj = Vn+I.j =O, ya que a(t) = b(t) =O. Por lo tanto cada línea horizontal
mentos numéricos descritos en el problema 1. Los experimentos de este tipo conducen a sólo incluye n valores desconocidos.
la conclusión de que no todos los pares de longitudes de paso (h, k) serán satisfactorios. Alcanzada esta etapa, el argumento puede continuar a lo largo de dos caminos
Un análisis posterior a la presentación del algoritmo mostrará porqué esto es cierto. diferentes. El primero depende del hecho físico de que la temperatura en la barra tenderá
Analizaremos el caso particular en que a(t) =b(t) = O. a cero conforme t -+ oo, debido a que los extremos se mantienen a temperatura cero.
596 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales
9.1 Ecuaciones parabólicas: Método
s explícitos 597
Debemos por lo tanto insistir en que la solución numérica también tienda a cero conforme donde B es la matriz de n x n
t--+ oo. Dado que V;+i =AV¡, resulta que:

Jj
[ 2 -1 O
V¡=AV;-1 =A2 V;-2=...=AÍVo
-1 2 -1
Según un teorema de la sección 4.6, las siguientes dos condiciones son equivalentes: B = O -1 2
(14)
(i) límj-co NV=O para todos los vectores V
(ii) p(A) < 1
o o o
Recuerde que p(A) es el radio espectral de la matriz A. Por lo tanto el parámetro s=k/h2 Los valores propios t...; de A se relacionan con los
valores propios µ; de B a través de la
deberá escogerse de manera que p(A) < l. ecuación
Se puede llegar a la misma conclusión sin recurrir al problema físico de la distribu­
ción de temperatura. En su lugar se puede hacer el análisis de los errores de redondeo A.;=1 -sµ;.
que se producen durante el proceso de cómputo numérico. Suponga que en cierto paso Basta entonces con calcular los valores propios de B.
(podemos suponer que en el primero) se produce un error. Entonces, en lugar del vector
Vo tendremos una perturbación de dicho vector, llamémosla Yo. El método explícito
dará lugar a vectores V¡=Ai Yo, y el error en el j-és imo paso será: LEMA Sea x=(sen0, sen 02 , . .., sen 0n f. Si 0 =
jn/(n+1) , entonces x es un vector propio
de B que corresponde al valor propio 2- 2cos0.
V¡ -V¡=AÍVo -AiVo = AÍ(Vo -Yo)

Para asegurar que el error decaerá conforme j --+ oo debemos una vez más pedir que Demostración Sea Bg= 28ij -8;+1.j -8;-i,j, donde B = (Bg) y 8ij es la delta de Kronecker. Por lo
p(A) < l. tanto, si 2�i�n - 1, entonces
Más adelante se tocará el tema del cálculo de los va ol res propios. Por lo pronto
baste saber que los valores propios de A son n

(Bx) ; = ¿(28if -8;+1,j -8;-1,j) Xj


j1t j=I
Aj=l - 2s(l -cos0j) 0j= (l�J�n) . (13)
n+l =2 x; -Xi+I -X¡_¡
Para que p(A) sea menor que 1 necesitamos que =2seni0 -[sen(i+1)0+sen(i - 1)0]
-1 < 1 - 2s(l -COS0j) < l. = 2seni0 - 2seni0 cose
=(2- 2cos0) seni0
Esto resulta cierto si y sólo si s < (1 -cos Sj) -1• Dado que s es positivo, la máxima
= (2- 2cos0) x;.
restricción sobre s tiene lugar cuando cos Sj =-1. En vista de que ej tendrá un valor
muy cercano a re cuando j=n, debemos pedir que s � 1/2.
Resum ei ndo: para que el algoritmo anterior sea estable es necesario suponer que Aquí se ha hecho uso de la conocida igualdad sen(a.+�) +sen(a. -�) =2sen a. cos �.
s = k/h2 � 1/2. Si i= 1 ó i=n, podemos usar el mismo cálculo siempre y cuando se tome x0 = O y
La restricción tan severa dictada por la condición k � h2/2 hace que el método Xn+I=O. La fórmula x ; = seni0 automáticamente nos da xo = O, y la ecuación xn+l = O
sea muy lento. Por ejemplo, si h=0.0 1, entonces el máximo valor permisible de k es será cierta si sen(n+1)0 = O o (n+1)0 =}1t para algún entero j. Para los dos casos
5 x 10-5. Si deseamos calcular una solución para O �t � 10, entonces el número de especiales (i=1 e i =n) resulta lo siguiente:
1
pasos en el tiempo será x 106 y el número de puntos de la malla deberá ser superior
a 20 mi l ol nes. De manera que la elegancia y la sencillez del método explícito van (Bx) ¡ = 2 x¡ -xz=2 x1 -xz -XQ = (2- 2cos0) x¡
acompañadas de una ineficiencia inaceptable.
Para completar el análisis anterior es necesario demostrar que los valores propios de (Bx) n = 2 xn -Xn-1 = 2xn -Xn+I -Xn-1 = (2- 2COS S) Xn
A son los propuestos en la ecuación (13) . Empezamos observando que la A que aparece
en la ecuación (1 1) puede escribirse como: Juntando las n ecuaciones anteriores tenemos que

A =l-sB
Bx=(2- 2cos0) x. 11
598 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.2 Ecuaciones parabólicas: Métodos implícitos 599

Análisis de estabilidad: Método de Fourier SERIE DE PROBLEMAS 9.1


La cuestión de la estabilidad en los procedimientos numéricos para resolver ecua­ el. Usando el algoritmo correspondiente al método explícito encuentre una solución
del siguiente problema de conducción de calor: numérica
ciones diferenciales parciales surge en casi todos los problemas que usan el tiempo como
variable independiente. Esto es natural, dado que puede ser de interés conocer las solu­ Ux,: =u,
ciones en intervalos largos de tiempo. El método utilizado en las líneas precedentes para { u(x, 0) = sen 1tX
analizar la estabilidad en el método explícito es conocido como método matricial. Otro u(O, t) =u(l, t) =O
método, adjudicado a von Neumann, puede llamarse método de Fourier. La idea de este
procedimiento consiste en tratar de encontrar la solución de la ecuación en diferencias En el primer experimento use h = O.I, k = 0.005125 y M = 200. Compare la solución
finitas que adopta la forma: calculada con la solución exacta u(x, t) = exp{-it2 t) sen{1tX). En el segundo experimento
cambie el valor de k por 0.006 y el de M por 171.
Vjn = e9°flhenJ,.k 2. Demuestre que para unan fija, la condición de estabilidad en el algoritmo explícito es:
(
(i=v-1). (15)

(Hemos usado j en lugar de i como el primer subíndice para que no se confunda con el s< l+cos;:;:¡
1t )-1 .
número complejo i =v-t.) Una vez que se ha hecho esto, mediante una elección ade­
cuada de A., se examina el comportamiento de la solución conforme t -+ oo, o n -+ oo. Paran = 10, ¿qué valores de k resultan satisfactorios?
Obviamente, dicho comportamiento depende del factor rfnk = (t?-")n de la ecuación 3. Demuestre que la función
(15). Si lt?-" J > 1, esta solución no está acotada. Y como cualquier solución numé­
¿
N
rica eventualmente se verá contaminada por todas las soluciones extrañas indeseables,
u(x, t) = Cn exp(-n2it2t) sen n1tX
esta solución no acotada terminará dominando a la solución verdadera, la cual decae
n=l
exponencialmente.
Procedemos ahora a analizar el método explícito dado por la ecuación (9). (Supo­ resuelve el problema de conducción de calor u"" = u, con las siguientes condiciones en la
nemos implícitamente que en este caso k > O.) Al sustituir la solución tentativa (15) en frontera:

{
la ecuación (9) obtenemos:
u(x, 0) = ¿ Cn sen n1tX
eiJJlh/n+l)U = se i(j-l)flhenU + (1 _ 2s) eiJJlhr+sei (j+l)flhenU.
u(O, t) = ��'. t) = O
Después de eliminar el factor e i1Jlhr, el resultado es: 4. Confirme que hacen falta aproximadamente 107 puntos de la malla para lograr la estabilidad
cuando h = 10-2 y O� t � I O. ¿Cuáles son los números correspondientes para el caso en
t?-" = se- i\lh+ 1- 2s+se i flh que h = 10-4 7
= 2scos �h+ 1- 2s
= 1- 2s(l - cos �h) 9.2 Ecuaciones parabólicas: Métodos implícitos
= 1-4s sen2 (�h/2) (16)

{
En esta sección continuamos nuestro estudio del problema modelo de la conducción de
Aquí hemos usado las muy conocidas igualdades: calor. Recuerde que

e i6 =cos9+isen9 1- cose = 2 sen2 (9/2). Uxx = Ut (t?; Ü O� X� 1)


u(x, O) = g(x) (O� x� 1) (1)
Recuerde que s = k/h2, donde k y h son las longitudes de paso en t y en x, respectiva­
u(O, t) =u(l, t) = O (t?; 0).
mente. De la ecuación (16) resulta evidente que t?-" � 1 (mientras que � sea real). Para
asegurar la estabilidad necesitamos que t?-" ?; -1, lo cual lleva a la restricción Al igual que en la sección 9.1, reemplazamos las derivadas por aproximaciones, y usamos
v(x, t) para denotar la solución del problema discreto. La ecuación en diferencias finitas
s sen2 (�h/2) � 1/2. que vamos a considerar es la siguiente:

Dado que sen2 (�h/2) puede tomar valores cercanos a 1, para que se satisfaga la condición
¡;z[v(x h, t)- 2v(x, t) + v(x- h, t)] = ¡[v(x, t) - v(x, t - k)].
1 1
+ (2)
de estabilidad se necesita que s� 1/2.
600 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.2 Ecuaciones parabólicas: Métodos implícitos 601

Usando la notación planteada en la sección 9.1, la expresión anterior se transforma en: Dado que éstos evidentemente satisfacen la condición 1.; > 1, entonces los valores
propios de A-1 se encuentran en el intervalo (0, 1), y de ahí concluimos que el método
1 1
¡;z[v;+I.i -2 v¡¡ + v;- 1.¡] = k[vif - vi;¡-¡]. (3) propuesto es estable para todos los valores de h y de k. Este método en ocasiones se
llama método completamente implícito.
Esta ecuación parece diferir sólo superficialmente de la ecuación (7) de la sección 9.1,
pero de hecho requiere un tipo diferente de algoritmo para resolverse. Observe que tres Algoritmo
de los términos de la ecuación (3) hacen referencia a ven el nivelj(t) y sólo un término
hace referencia a v en el nivelj -1 (t -k). Si se conoce el valor de ven los puntos de Podemos ahora formular un seudocódigo que corresponda al método completa­
la malla en el nivel j - 1, entonces los valores en el nivel} se pueden calcular a partir mente implícito. Este programa recurrirá a otras dos rutinas, una de las cuales propor­
de la ecuación ( 3), pero sólo a través de resolver un sistema de ecuaciones. Por lo tanto ciona valores iniciales g(x). La otra rutina se llama TRI; su propósito es resolver un
reescribimos la ecuación (3) de la siguiente forma, usando s = k / h2: sistema tridiagonal de ecuaciones lineales. El seudocódigo proporcionado al final de la
sección 4.3 resulta adecuado en este caso. En dicha rutina los elementos diagonales se
-SVi-1,j+(1+2s)Vif - SVi+l,j = Vi,j-1 (1 � i � n). (4) etiquetan d¡, d2, ... , dn. Los elementos pertenecientes a la diagonal secundaria superior
son c1, c2, .•. , c._ 1, y los elementos de la diagonal secundaria inferior son a 1, a2, .•• ,
Al igual que antes, tome a Vj como el vector ª•-l. Los números del lado derecho son b1, b2, ... , bn, y X¡, x2, ... , x. representa la
solución. Por consiguiente:
Vz¡ TRI(n, a, d, e, b;x)
Vj = toma como entrada n, a, d, e, by da como salida el vector x. En este ejemplo se asignan
[VJjl
Vnj
valores constantes a los elementos a, d y c. En lugar de b usaremos los valores iniciales
v; = g(ih). La rutina TRI proporciona el siguiente valor del vector v, el cual sustituye
De este modo la ecuación (4) representa un sistema den ecuaciones que determinan el al valor previo. Las entradas diagonales d; sufren modificaciones durante el uso de la
vector Vj, suponiendo evidentemente que ya se conoce Y¡-1· Dicho sistema de ecuacio­ rutina TRI y deben por lo tanto reinicializarse en cada paso de tiempo.
nes adopta la forma:
AV¡=V¡-1 (5) inputn,k,M
en donde A es la matriz de n x n h ,- 1/(n+1)
1 +2s -s o o S <- k/h2
-s 1 +2s -s o for i = 1, 2, ..., n do
A= o -s 1+2 o (6)
V¡<-g(ih)
¡
end
o o o 1 +2s
t ,_ o
Formalmente la solución de la ecuación (5) está dada por output O, t, (v,, v2, .•. , v.)
. V¡=A-1V -1, ¡ for i = 1, 2, ..., n -1 do
C¡ <- -S
de donde obtenemos:
a;<- -s
Y¡ =r 1 (A-1 V¡-2)=A-'(A-1(A-1 Vj_3)) = "·=A-jVo, end
Se conoce el vector V0 en vista de que incluye los valores iniciales u(ih, O). Con el for j = 1, 2, ..., M do
mismo razonamiento que se usó en la sección 9.1, llegamos a que la condición para for i = l, 2, ..., n do
que el algoritmo sea estable es p(A-1) < l. Usando la matriz B de la ecuación (14) que
d;<-1+2s
aparece en la sección 9.1, resulta que
end
A= I+sB. call TRI (n, a, d, e, v; v)
El lema de la sección 9.1 nos indica que los valores propios de A son t ,_ jk
outputj, t, (v¡, Vz, ..., v.)
1.; = 1+2s(l -cos0;) 0; = � (1 �- i �-n) (7)
end.
n+l
602 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales
9.2 Ecuaciones parabólicas: Métodos implícitos 603
Método de Crank-Nicolson Análisis
Es posible combinar el método implícito con el explícito y obtener una fórmula Los errores en los puntos de la malla se definen mediante la ecuación:
más general que incluye un parámetro 9. Dicha fórmula viene a ser:
eij = u(x;, tj)-v(x;,lj) (13)
0 1-0
h2(V;+J.j- 2vij+V¡_¡.j) +-¡;r-(Yi+l,j-1- 2vi, j -1+Yi-l,j-1) A continuación usaremos las abreviaturas Uij y Vij para u(x;,tj) y v(x;, tj), respectivamente.
1
(8) Por lo tanto Y ij = U ij- eij. Pasemos al!ora a analizar el método explícito para la
= k(Vij- V;, j -1) ecuación de calor unidimensional (el usado en la sección anterior) en lo que respecta a
sus propiedades de convergencia. La ecuación que define este método es:
Vemos de inmediato que cuando 9 = O, esta fórmula proporciona el esquema explícito
que se discutió en la sección previa. (Véase la ecuación (8) de la sección 9.1.) Cuando Yi.j+l = s(v;-1, j-2vij+v;+i)+v;, j (14)
9 = 1, la expresión se reduce al esquema implícito ya discutido. El caso especial 9 = 4 Esta es la ecuación (9) de la sección 9.1, y como es usual, s = k/h2• En la ecuación (14)
conduce a un procedimiento numérico bautizado con el nombre de sus inventores, John sustituya v por ú- e, y obtenga:
Crank y Phyllis Nicolson.
En las siguientes líneas investigaremos con más detalle el método de Crank-Nicol­ U ;,j+l- e;,j+l = s(u;-1,j-2uij+u;+I.j)+Uif
son. La fórmula pertinente en este caso se escribe como sigue, donde como de costumbre
todos los puntos nuevos (que corresponden aj) se han colocado a la izquierda, mientras - s(e;-1, j-2eif+e;+i.j)- e;j
que los puntos viejos (que corresponden aj- 1) se han puesto a la derecha.
Esto se puede reacomodar en la forma:
-SVi-l, j+(2+2s)V;j- SVi+l,j = SVi-l, j -1+(2- 2s)Vi,j-1+SVi+l,j-l (9)
e;, j+I = se;-1,j+(1-2s)eij+se;+1, j
Una vez más se ha hecho la identificación s = k/h2• Al igual que antes, se usa el vector - s[ui-1.i-2uif+u;+i,¡]+[u;,¡+1- u;¡] (15)
V¡ con entradas Yij para 1 � i � n. La ecuación (9) adopta la forma vectorial
Para simplificar los términos (que en esta expresión están entre corchetes), recurrimos a
fórmulas previamente establecidas en el caso de la diferenciación numérica, a saber,
(21+sB) V¡ = (21-sB) V¡-1 (10)
1 h2
donde B es la misma de antes, a saber, la ecuación (14) de la sección 9.1. Usando un !" (x) = - [f(x+h)- 2f(x)+f(x-h)]- -¡(4l('é,) (16)
h2 1 2
razonamiento similar concluimos que la estabilidad del método queda asegurada si 1 k
g'(t) = -[g(t+k)-g(t)]- -g"(,) (17)
k 2
p[(2J+sB) -1(21-sB)] < l. (11)
Usando estas fórmulas obtenemos de la ecuación (15) lo siguiente:
Siµ¡,µ2, . .. ,µ. son los valores propios de B, la restricción (11) se convierte en: e;,¡+1 = se;-1,¡+(1-2 s)e;,j+se;+I, j

1c2+sµr 1 c2-sµ;)J < 1 (12) - s [h2 un (X¡,lj)+ �; U=x('é,;, tj)] (18)

En vista de queµ; = 2(1- cos 9;), sucede que O <µ; < 4. Un poco de álgebra muestra
que la desigualdad (12) es correcta. Por consiguiente el método de Crank-Nicolson es + [kur(x;,lj)+�uu(X¡,t j)].
estable para todos los valores del cociente s = k/h2 •
Por supuesto, la estabilidad no es el único criterio que se usa para elegir la longitud Usemos ahora el hecho de que sh2 = k y un = u1• Con estas igualdades la ecuación
de paso h y k en estos métodos. En general, cuanto más pequeñas tomemos a h y a k, mejor (18) se puede expresar como:
será la concordancia en el comportamiento entre el sistema discretizado y la ecuación
diferencial original. Lo que se necesita es un teorema que garantice que la solución e;,j+l = se;-1, j +(1-2s)e;, j +se;+l.j
v(x, t) del problema discreto converja a la solución u(x, t) del problema original cuando
h -+ O y k -+ O. Dicho resultado es el contenido del siguiente teorema. -kh
2 [ 1 u=(�;,lj)- s urr(X¡,tj)] . (19)
12 2
604 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.2 Ecuaciones parabólicas: M étodos implícitos 605

Limitemos a (x, t) al conjunto compacto S = {(x, t) : O � x � 1 y O � t � T}. Se pueden usar fácilmente estos métodos con sólo recurrir a dos rutinas que manejen
Tomemos ahora: sistemas tridiagonales, es decir, que hagan lo siguiente:
M = � máx fu= (x, t)[ + máx fu,i(x, t)[i (20) (i) cálculo de y = Tx
1
donde los máximos se calculan sobre todo el conjunto S. Definimos también un vector (ii) despejar x de la ecuación Tx = b
de error:
e1¡
E¡= [ j
e2¡ SERIE DE PROBLEMAS 9.2
l. Demuestre que si r > O, entonces
e.¡
y tomamos
IJE¡JJ co = máx fegf• P [(I+rB)- (1-rB)j
1
= I1-q
+ q'
Finalmente, suponemos que 1-2s � O. Entonces, a partir de la ecuación (19), deducimos donde
lá,iá,n

que:
q = 4rsen ( 2n: 2)
[e�¡+1 I � sfei-1,¡[ + (1 - 2s)Je¡.¡[ +sfe¡+1,¡I + kh2M
2

2. Demuestre que la condición de estabilidad para el método definido por la ecuación (8) es la
� sJJE¡ffco + (1 - 2s)JJE¡[fco +s[JE¡Jf +kh M desigualdad s � (2 - 46i- 1 si O � 9 < ! , pero que si sucede que ! � 9 � 1, entonces no
(21) existe restricción para los valores de s.
2

= l[E¡[J 00 +kh2M.
00

Dado que el lado derecho de la ecuación (21) no incluye i, resulta lo siguiente: 3. Lleve a cabo un análisis de convergencia en el caso del método completamente implícito.
<4. Use el método completamente implícito para resolver el siguiente problema de conducción
� f[E¡fJ co +kh2M � fJE¡-if[ co +2kh2M � · · · de calor en el cuadrado unitario:
� ffEo[[ oo + (j + l)kh M.
2

En vista de que el proceso para obtener la solución v(x, t) principia con los valores
U:a = Ur
=
iniciales correctos, obtenemos E 0 = O, y por consiguiente:
{ u(x, O) (x - i1),t
u(O, t) = u(!, t) = O

fJE¡Jf �jkh M.
2 Valores que se sugieren: n = 20, M = 50, k = 0.05.

Tomemos ahorajk = t, de manera que IIE¡Jf 00 representa el error máximo en los puntos <5. Escriba y pruebe un programa que ejecute el procedimiento de Crank-Nicolson en el caso
00

de la malla en el nivel t. Entonces, y debido a que t � T, del siguiente problema:

fJE¡[[ co ;;:; Th M = O(h ).


2 2 { - ==
u:a a.u, f(x) W<x<L 0<0

Por ello, y conforme h -> O, los errores máximos en cualquier nivel t fijo convergen
u(x, O) g(x) W<x<Q

a cero con la rapidez de h2, siempre y cuando tomemos s = kjh2 � 1/2 y que las
u(O, t) = u(L, t) = O W<0

funciones u= y uu sean continuas.


<6. Compare los métodos explícito, implícito y de Crank-Nicolson, usando dos rutinas que
incluyan operaciones con sistemas tridiagonales. Póngalas a prueba aplicándolas al problema
1 de la sección 9.1.
A manera de resumen, señalamos que se han discutido tres métodos para calcular 7. Generalice el algoritmo que se presentó en esta sección para que se puedan tomar en cuenta
Resumen

la solución numérica del problema de conducción de calor en una dimensión: condiciones en los extremos semejantes a las que aparecen en el problema.

explícito "\0+1 = (l - sB)"Vj


Método Ecuación matricial U.a; = ur (t � 0 0 �X� I)

implícito (I +sB)Vj = °\0-1


u(x, O) = g(x) (O �X� 1)
¡
=
Crank-Nicolson (2I +sB) Vj = (2! - sB) "\0-1
u(O, t) a(t) (t;;,; O)
=
u(I,t) b(t) (t � 0)
606 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.3 Problemas sin dependencia temp
oral: Métodos de diferenciasfinitas
607
9.3 Problemas sin dependencia temporal: Métodos de diferencias finitas Primeramente se genera una red de puntos de la malla sobre
el cuadrado IT.
La ecuación de Laplace en dos variables es una típica ecuación diferencial parcial para (x;,yj)=(ih,jh) (O��j�n+l) h = I/(n+I).
la cual el tiempo no es una de las variables: (4)
U:cx+Uyy=O (1) Observe que para ambas variables se utiliza la misma longit
ud de paso. A continuación
la ecuación diferencial (1) en el punto de la malla (x¡, Y¡) es reemp
lazada por su análogo
En esta ecuación u es una función de (x, y). Un problema físico concreto que se modele en diferencias finitas en el mismo punto, que es:
con la ecuación (1) deberá también incluir la especificación de la regiónQ en el plano
X'j donde se busca la solución, y además se impondrán condiciones en la frontera para
h-2[vi-l.j - 2vij + V;+i,j] +h-2[V4j-l - 2v¡j + V4j+il=O
u (los valores que u o su derivada en la dirección normal deben tomar ·en la frontera de
Q). Al referirnos a una región Q en 1.2, suponemos queQ es un conjunto abierto. Su
frontera se denota mediante 8Q, y su cerradura con IT. Por consiguiente, IT =Q U an. o
4Vij - Vi-1,j - Vi+l.j - Vi,j-1 - V4j+I = 0.
(5)
Problema de Dirichlet En este caso se busca que vij aproxime a u(x¡, Jj). Se usa una letra distinta
queremos establecer una distinción entre dos problemas diferentes: debido a que
El problema de Dirichlet aparece con frecuencia en el estudio del calor, la elec­ primero, el problema
discreto (es decir, la ecuación en diferencias finitas), y
tricidad y de muchas otras ramas de la física. En su versión bidimensional se toma una segundo, el problema continuo
región abiertaQ en 1.2 . También se da una función g definida en la frontera deQ. Acto (es decir, la ecuación diferencial parcial original).
seguido se busca una función u que sea continua en la cerradura IT, que satisfaga la Los valores de Vij se conocen en el caso en que i=O ó n+ I y cuando
j=O ó n+ I,
ecuación de Laplace enQ, y que sea igual a g en la frontera. Esto se resume escribiendo: debido a que éstos son los valores en la frontera correspondientes a
este problema (tal
como fueron dados por la función g). Por lo tanto, en la ecuación (5)
se pueden conocer
u:cx +Uyy=O enQ algunos términos vif, mientras que otros permanecen como incógn
itas. Esto significa,
{u(x,y)=g(x,y) sobre 8Q (2) de hecho, que estaremos resolviendo un sistema no homogéneo de
_ ecuaciones lineales
como consecuencia de que todos los valores conocidos se habrán colocad
u continua sobreQ. o a la derecha.
Con el fin de tomar un caso sencillo hacemos n=3. Se tiene entonces
una ecuación del
Si se imponen ciertas condiciones leves sobreQ y si g es continua, se puede entonces tipo (5) para cada punto interior de la malla. Éstos se muestran en la figura
4 mediante
demostrar que el problema de Dirichlet tiene una solución única. puntos gruesos.
Con el fin de presentar algunas técnicas numéricas vamos a considerar el problema
de Dirichlet sobre un cuadrado. Este problema se puede resolver mediante las técnicas
analíticas de separación de variables y de series de Fourier. Sin embargo, para otras
regiones se requieren los métodos numéricos que se discuten aquí y en la siguiente
sección. También debe enfatizarse que aun si se puede dar una solución en la forma

y

de una serie infinita, en ocasiones puede ser preferible una solución numérica que incluya l -= Y,
una discretización del problema.
En el problema que presentamos la región es el cuadrado unitario abierto:
Yi 1---.--+--t----¡
Q= {(x,y):O<x<1, O<y< l}.
Por el momento la función en la frontera ges arbitraria. Sus valores deben proporcionarse Y2 L--.1---+---..p---
a través de una subrutina del programa de computadora.
Y1 f-----,1,..__
, _+--t--,..¡
Diferencias finitas
Un enfoque para encontrar la solución numérica del problema (2) recurre a las
O=h X
aproximaciones por diferencias finitas de las derivadas. Se puede usar una fórmula ya � X¡ X2 X3 x, = 1
familiar que aparece en la sección 9.2, a saber:
Figura 9.4 Malla sobre el cuadrado unitario.
J"(x)=h-2 [J(x +h) - 2f(x) +J(x - h)] + O(h2). (3)
608 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.3 Problemas sin dependencia temporal: Métodos de diferencias finitas 609

Las cantidades desconocidas en este problema se pueden ordenar de muchas maneras Algoritmo
(correspondiendo a los distintos ordenamientos de los puntos de la malla). Elegimos el El sistema de ecuaciones será ralo debido a que cada ecuación tendrá a lo más
conocido como ordenamiento natural: 5 incógnitas (hay a lo más 5n valores distintos de O de un total de n2 términos). Los
procedimientos iterativos .como los que se discutieron en la sección 4.6 pueden ser muy
V= [v11, V2 ¡, V3¡, V12, V22, V32 , V¡3, V23,V33]. eficaces en esta situación. Los valores en la frontera conocidos son:

Igualmente, las nueve ecuaciones lineales se pueden ordenar de muchas maneras. Deci­ Vij =g(x,, Yj) cuando i ó j son O ó n + l. ( 6)
dimos ordenarlas mediante la asociación de la ecuación (5) con su punto central (x¡, Yj) y
luego acomodando las ecuaciones de la misma manera en que ordenamos los puntos. Al Por consiguiente, en este algoritmo el conjunto total de elementos Vij como O � i,
haber colocado a la derecha todas las cantidades conocidas, el resultado es el siguiente: j � n + 1, consta de (n + 2)2 elementos. Para ilustrar lo anterior proponemos usar
el método iterativo de Gauss-Seidel. Para utilizar este procedimiento, la ecuación (5)
4vn - v2 1 - V12 =v¡o +vo1 asociada con el punto (x,, Yj) se escribe como:
4V2¡ - V11 - V3¡ - Vzz =vzo
V¡j =(Vi-1,j +V;+l,j +V4j-l +V4j+1)/4. (7)
4V3¡ - V2¡ - V32 =V30 +V4¡
- -
4v12 vu v22 v13 - =voz Esta ecuación se usa para actualizar el valor de Vij, Cuando se usa esta ecuación el valor
4v22 - Vz¡ - V¡z - V32 - V23 =0 que se obtiene en el lado derecho reemplaza el del viejo valor de vg, Si tenemos cuidado
4v32 - v31 - v2 2 - V33 =V4z de usar la ecuación (7) sólo cuando 1 � i,j � n, entonces en la actualización únicamente
participarán puntos interiores de la malla. Los puntos en la frontera de la malla sólo
4vu - v12 - v23 =VQ3 +V¡4
aparecerán en el lado derecho de la ecuación (7). El plan general para efectuar el cálculo
4V2 3 - Vzz - V13 - V33 =Vz4 es el siguiente:
4V33 - V32 - V23 =V43 +V34
l . Ponga los valores en la frontera en los Vij adecuados.
Este sistema tiene laformaAv =b, en donde la matrizA es de 9 x 9. De los 81 elementos 2. Asigne valores iniciales adecuados en los puntos interiores.
sólo 33 son diferentes de cero. A continuación presentamos la matriz de coeficientes: 3. Lleve a cabo M pasos de la iteración de Gauss-Seidel.

º]
[-i j]º [ �]º
o o Un fragmento de seudocódigo de la primera tarea es:
4 -1
o
º]
[ -1 4 -1 -1

] [-i ]
O -1 -4 o � o fori=0,1, ... ,n+ ldo
-1 O 4 -1 o ViQ =g(x¡, O)
A=
º º
1 [ O -1 O [-1 4 -1 -1 O
V/,n+l =g(x¡, 1)
O -1

] ]
O O -1 O -1 4

�]
o
[
-1 O 4 -1 vo; =g(O, y;)
o [ O -1 O [-1 4 -1 Vn+l,i =g(l, y¡)
� o O O -1 O -1 4
end.
En esta matriz se ilustra la estructura de bloque esencial. Podemos escribir, utilizando
una notación obvia: El seudocódigo para la tercera tarea es:
T -I O
A= [ -I T -I ] for k =1, 2, ..., Mdo
O -1 T forj =1, 2, ... , ndo
Tomando como modelo el caso especial anterior, pasemos ahora al caso general, donde fori=1, 2, ... , ndo
n puede ser cualquier entero. El número de puntos interiores de la malla es n2, y hemos Vij =(v,-1,j +Vi+l,j +V4j-l + v,,j+i)/4.0
asociado a cada uno de estos puntos un valor desconocido Uij = u(x;, Yj). Se supone end
que la función u será una solución de la ecuación (2). Después de la discretización
nos quedamos con un sistema lineal de ecuaciones que determinan los valores de las n2 end
cantidades desconocidas vu, donde 1 � i � n y 1 � j � n. end.
610 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 611

Observe que los ciclos en este algoritmo se hacen cargo de actualizar al vector v en el 5. En el problema modelo, con n2 puntos interiores de la malla, ¿cuántas ecuaciones serán ho­
orden elegido (el orden natura[). mogéneas en general? ¿Cuántas ecuaciones tendrán en su lado izquierdo cinco coeficientes
Para tomar un caso concreto usamos la función g dada por la fórmula: distintos de cero? ¿Cuántas ecuaciones tendrán en su lado izquierdo cuatro coeficientes dis­
tintos de cero? ¿Cuántas tendrán tres coeficientes distintos de cero? ¿Cuál es el número
preciso de coeficientes distintos de cero en la matriz?
g(x, y)= 10-4 senh(31t.t) sen(3ny).
6. Encuentre la solución analítica del problema de Dirichlet sobre el cuadrado unitario cuando
los valores en la frontera son cero, excepto para u(x. O) = sen 47tX. Use el método de
En el programa de computadora esta función se usa sólo para los puntos en la frontera separación de variables y las series de Fourier.
del cuadrado. Pero como g es armónica, entonces g es también la solución del problema.
Por ello es posible calcular la solución aproximada vij y compararla con la solución c7. Programe el ejemplo del texto y vea si su computadora genera resultados similares a los ya
citados.
verdadera u(x¡, yj)= g(x¡, yj). Tomamos n= 18, por lo que la matriz A es de 324 x 324.
Esta matriz no se almacena en la computadora en vista de que el método de Gauss-Seidel cs. Modifique los programas dados de manera que pueda emplear el método SOR (sobrerrela­
no lo requiere así. En lugar de ello usamos la ecuación (7) y necesitamos sólo el vector jación sucesiva) en lugar del método de Gauss-Seidel.
v, el cual tiene 324 componentes Vij (O � i � 18 y O � j � 18). Después de 200
iteraciones se encontró que el error satisface la desigualdad:
*9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz
lvij - u(x¡, Yj)I < 0.0042.
Los métodos de Galerkin se utilizan profusamente en problemas en los que se requiere
SERIE DE PROBLEMAS 9.3 determinar una fanción que juega el papel de incógnita. Naturalmente, las ecuaciones
diferenciales y las ecuaciones integrales caen en esta categoría. Comenzamos con una
l . Sea Ti/2 el operador laplaciano: v'2u = u"" + Uyy . Demuestre que un problema de la forma
presentación abstracta de cómo los principios se aplican a cualquier problema lineal. A
continuación ilustramos su funcionamiento con un ejemplo numérico mediante el cual
{'1 u=f enn
2
resolvemos el problema de Dirichlet sobre un rectángulo.
u= o sobrean

puede resolverse mediante los siguientes tres pasos: (i) Encuentre una g tal que v'2g = f. Método de Galerkin
(ii) Usando -g para los valores en la frontera, resuelva el problema de Dirichlet enn. (iii)
Para obtener u añada g a la función obtenida en el paso (ii). Suponga que nos enfrentamos con un problema de la forma
2. (Continuación) Describa un problema de Dirichlet equivalente a
Lu=f, (1)
'v2 u = (6 - 3x2) seny-y cosx enn
{ en el cual L es un operador lineal, f es una función d�da, y u es una función que será
u= o sobrean
determinada a partir de la ecuación. En el método de Galerkin elegimos un conjunto
de fanciones básicas o fanciones de prueba u¡, u2, ... , u•. Acto seguido intentamos
3. Una manera de ordenar los puntos en el plano es mediante un ordenamiento lexicográfico.
Este tipo de orden es el que se usa en un diccionario, en el cual colocamos primero todas resolver la ecuación (1) usando una combinación lineal adecuada de dichas funciones
las palabras que comienzan con "a". Entre ellas se establece un orden según la segunda básicas. Tomando
n
letra. En los casos en que haya coincidencia en la segunda letra usamos la tercera, y así
sucesivamente. Por lo tanto, en el plano, el orden lexicográfico se define como: U= ¿cjUj
j =I
(x, y) � (u, v) si (x < u) o (x = u y y � v).
y usando la linealidad de L, obtenemos:
¿Cuál es la matriz que corresponde al problema modelo si los puntos de la malla y sus
ecuaciones se ordenan lexicográficamente? n
¿cjLUj=J (2).
e4. Programe el procedimiento que se delineó en el texto para resolver el problema de Dirichlet j =I
sobre un cuadrado. El número de puntos, el número de iteraciones y la frecuencia de la
impresión deberán controlarse por parámetros cuyos valores puedan cambiarse fácilmente.
Los valores en la frontera deberán ser proporcionados por un subprograma. Someta su En una situación típica esta ecuación es inconsistente, debido a quef en general no estará
programa a prueba usando: en el espacio vectorial generado por las funciones Luj. Por lo tanto resolvemos de manera
g(x,y) = 4.xy(x-y)(x+y).
aproximada la ecuación (2) y en consecuencia obtenemos una solución aproximada de
la ecuación (1). Se puede resolver aproximadamente la ecuación (2) siguiendo una
Compare las soluciones de los problemas continuos con las de los discretos. amplia variedad de criterios, dando lugar cada uno de ellos a una diferente solución
612 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 613

aproximada de u. El enfoque más natural es elegir c,, c , ..., c. de manera que alguna
2 Este problema se puede interpretar como uno de la forma Lu = f; simplemente definimos
norma se minimice: L y f mediante las ecuaciones:
¿
n
CjLUj - f 11 = mín (3) vzu
Lu= [
u\aQ]
j =I f(x, Y) = [ x 2 �y 2 ] (9)
Éste es un problema de mejor aproximación. Estamos aproximando a f con el elemento
más cercano en el subespacio generado por las funciones Lu¡. Gracias a que se cuenta La notación u¡ S denota la restricción de la función u al conjunto S. Representa una
con una técnica de proyección ortogonal, esto es relativamente sencillo de hacer en un operación lineal, ya que
espacio con producto interno.
Una forma muy general de obtener una solución aproximada de la ecuación (2) es (a.u+ �v) 1 S = a.(u IS)+ �(v IS).
seleccionar un conjunto de funcionales lineales $1, $2 ,... , $ne imponer la condición:

$¡ (t ¡=I
c¡Lu¡ - f) = O (1 � i � n) (4)
Para usar el método de Galerkin es necesario elegir un conjunto adecuado de fun­
ciones básicas. En el problema que nos ocupa escogemos funciones ui, u2, ... , un
que satisfacen la parte homogénea del problema. Es decir, elegimos u; de manera que
v2 u¡ = O en Q. Se dice que tales funciones son armónicas en Q. Disponemos de
La linealidad de los funcionales nos permite transformar esta expresión en: una amplia variedad de funciones armónicas en virtud de que tanto la parte real como
la imaginaria de cualquier función analítica de una variable compleja son funciones ar­
mónicas. Las primeras funciones que son potencias de la variable t nos proveen de un
¿ $;(Lu¡)c¡ = $;(!)
n
(1 � i � n) (5)
conjunto adecuado de polinomios armónicos.
j=l

La ecuación (5) es un sistema de n ecuaciones lineales con n incógnitas e¡. Si los zº = 1


funcionales son los correspondientes a la evaluación numérica en puntos, definidos por:
z1 =x+iy
Mv) = v(x¡) (1 � i � n), (6)
z2 = (x2 -y2)+ (2xy)i
entonces el método delineado arriba se llama colocación. Todas las presentaciones de
la estrategia anterior se llamarán métodos de Galerkin. El método de Galerkin clásico z3 = (x3 - 3xy2)+ (3x2y - l)i
es un caso particular de la ecuación (5) en un espacio de Hilbert, donde Mv) = (u¡, v). z4 = (x4 - 6x2y2 + y4)+ (4x3y - 4xy3 )i
Por consiguiente, las ecuaciones que se deben resolver en este caso son:
Z: = (x5 - 10x3y2+ 5x/)+ (5x4y - 10x2y3 + y5 )i
¿c¡(u;,Lu¡) = (u¡J) (1 � i � n). z6 = (x6 - 15x4y2+ 15x2y4 -y6 )+ (6x5y - 20x3y3 + 6xy5)i.
j=l

En la sección 8.10 se usó el método de colocación para resolver problemas relacionados Dado que nuestro problema es simétrico respecto de los ejes coordenados y del origen,
con ecuaciones diferenciales y valores en la frontera en dos puntos. Procedemos ahora a elegimos las partes reales e imaginarias de t que posean las mismas simetrías. Esto nos
ilustrar el uso del método de Galerkin para el caso del problema de Dirichlet. El ejemplo limita a la parte real de t para k par. De esta manera, si tomamos n = 4, podríamos
que se ha seleccionado también se puede resolver usando separación de variables y series usar como funciones básicas:
de Fourier.
u¡(x,y)=l
Problema de Dirichlet u2(x, y)=x2 -y2
Considere un rectángulo abierto en el plano, definido como U3(x, y)=X4 - 6x2y2+ y4
Q = {(x,y): lxl < l. IYI < 2}. (7) u4(x, y) = x 6 - 15x 4y2+ 15x2y 4 -y6.
Buscamos una función u, definida en Q, tal que:
Con esta elección de funciones básicas resulta evidente que la función u = [J:1 c¡u¡
v2 u = Ü enn satisface automáticamente la igualdad v2 u = O, y que los coeficientes e¡ deberían
{ u(x, y) = x2+y2 sobre an
(8)
escogerse de manera que las condiciones en la frontera se satisfagan aproximadamente.
614 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 615

La ecuación que se debe resolver de manera aproximada es: Finalmente, se puede intentar minimizar la cantidad

¿ 9uj(x, y)=l-+I sobreoQ ¿ 9u(j x;,y;)-(x¡ +yf)


4 4
(10) ¡� 1
(13)
j=I . ='="" j=I

Debido a las simetrías, basta considerar la parte de oQ que se encuentra en el primer Esto requiere utilizar la solución minimax de un sistema sobredeterrninado de m ecua­
cuadrante. ciones lineales con 4 incógnitas. Para valores grandes de m este procedimiento simula
Con el fin de ilustrar el método de colocación elegimos cuatro puntos sobreoQ, a la minimización de la norma uniforme:
saber,(O, 2),(1, O),(1, 1) y(1, 2). Insistimos en que la ecuación(10) sea válida justo en
esos cuatro puntos. Esto nos lleva al siguiente sistema de ecuaciones lineales:
4
máx 1¿9uj(x,y)-(l- +I) (14)
1 -4 16 -64
1 J 1 1 Cz _ 1
4 [C¡l (x,y)Eíin j=l

[1 0 -4 ] [] Este problema o su análogo discreto(13), puede resolverse con el algoritmo de Remez


0 C3 - 2 (véase la Sec. 6.9). Cuando se minimiza la expresión(13), usando el mismo conjunto
1 -3 -7 117 C4 5 de 76 puntos que se usó en la solución por mínimos cuadrados, el valor de ces:
La solución aproximada de este sistema es: c = (1.8072, -0.7950, -0.0400, 0.003692/

e=(1.8261,-0.7870,-0.04348, 0.004348/. y la desviación máxima entre los 76 puntos es 0.033. El esfuerzo adicional invertido en
obtener la solución mediante este método difícilmente se justifica con la mejora marginal
Por lo tanto, la discrepancia más grande entre ¿J=1 CjUj y la función x2 +y2 sobre la en cuanto a precisión. En todo caso, sería mejor aumentar el número de funciones básicas.
frontera del rectángulo es aproximadamente 0.074.
En el ejemplo anterior, reteniendo el conjunto de funciones básicas, procedemos
ahora a "resolver" la ecuación(10) usando otro enfoque. Para ello elegimos un conjunto
Ecuación de Poisson
de m puntos(x;, y;) sobre la frontera deQ e intentamos minimizar la expresión Es frecuente encontrar problemas con valores en la frontera donde aparece la ecua­
ción de Poisson. Un ejemplo típico sería el siguiente:
2

(11) {'i72w =! enQ


j j(X¡,y¡)- (x¡ +yf)
� � CU
m [
4
w=g sobrean
(15)
l
Una manera de atacar el problema es separarlo en dos problemas más sencillos, a saber:
con respecto a Cj. Este procedimiento incluye como un caso especial al método de
colocación, ya que podríamos haber usado m=4. Pero al tomar más puntos podemos {'i72v=0 enQ {'i72 u =! enQ
simular la minimización del cuadrado de la norma L2•
V= g SObreoQ u=o sobreon

1 una vez que se han encontrado u y v, la solución del problema original es w = u+v. Estos
2

[tCjUj(x,y)-(;('+1)] dxdy. (12) dos problemas tienen la ventaja de que cada uno de ellos tiene una parte homogénea.
¡= ! Dicha característica se explota en el método de Galerkin. Por ello, al resolver el problema
donde aparece u, se puede elegir funciones básicas que valgan cero en la frontera den.
íiO

A modo de demostración práctica de este enfoque escogemos 76 puntos igualmente Si u1, u2, .•. , un poseen esta propiedad, lo mismo sucede para una combinación lineal
espaciados en la porción dean que corresponde al primer cuadrante. La minimización · arbitraria de ellas. Acto seguido tomamos u = ¿J= 1 CjUj y tratamos que la expresión
de la expresión(11) se convierte en un problema matricial de mínimos cuadrados que 'i72u = f resulte correcta mediante la elección adecuada de los coeficientes 9. Esto
consta de 76 ecuaciones y 4 incógnitas. El resultado de este cómputo es: conduce a la ecuación:
L Cj 'i7 Uj = f.
n

c =(1.8216,-0.7811,-0.04458, 0.004052/
2
(16)
j=I

La desviación máxima entre los 76 puntos es 0.049. Los 76 puntos utilizados fueron Como sucede en este tipo de casos, ninguna elección de coeficientes logrará que la
(1, i/25) para O ;;; i ;;; 50 e(i/25, 2) para O ;;; i ;;; 24. ecuación sea correcta, y por lo tanto se deberá buscar una solución aproximada.
616 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.4 Problemas sin dependencia temporal: Métodos de Galerkin y de Ritz 617

Método de Rayleigh-Ritz El cálculo anterior indica que


Otra estrategia para resolver el problema

v u =! enQ
2
(-v2 u, u) = J h(uxi + (uy)2]dxdy. (21)
{ (17)
u=o sobrean El valor de esta integral ciertamente es no negativo y lo único que queda por aclarar es
es el método de Rayleigh-Ritz, el cual se discutirá a continuación. Se mantiene fija si puede ser O para una función u que no sea la función cero. Sí el valor de la integral
la regiónQ, y trabajarnos en un espacio con producto interno V, cuyos elementos son es O, entonces Ux = uy = O en Q. Por lo tanto, u es al mismo tiempo una función de
funciones u tales que uxr y uyy son continuas enQ y satisfacen la igualdad u(x, y) = O en y exclusivamente y una función de x exclusivamente. Por consiguiente u debe ser una
la frontera deQ. Se supone que f es continua en n. Por ende la solución al problema constante en la regiónQ. Pero en cuanto el etemento de V, debe valer cero enan. De
deberá estar en el espacio V. El producto interno en V se define mediante la ecuación: esto se concluye que u = O. 11

(u, v) = j1 u(x,y)v(x,y)dxdy (18)


En vista de que el operador -v2 es definido positivo y simétrico en V, se puede
definir un nuevo producto interno mediante la siguiente fónnula:

TEOREMA El operador-'::12 es autoadjunto y definido positi vo en el espacio con producto interno V. [u,v]=(-v u,v) =
2
J L(UxVx+UyVy )dxdy. (22)

Demostración La propiedad de ser autoadjunto ( o simétrico) se expresa mediante la ecuación: Este nuevo producto interno induce una nonna en el espacio V vía la ecuación:

(-v2u, v) = (u, -v2v) (19) lllulll = [u, u] 1 •


1 2

Para demostrar la ecuación (19) necesitaremos del teorema de Green en el plano, que Cuando usarnos el método de Rayleigh-Ritz lo que se hace es elegir funciones básicas
nos dice que para funciones decentes y regiones también decentes: u¡, u2, •.. , u. en el espacio V, y se intenta determinar c¡, Cz, .•. , c. de manera que
r;=l CjUj esté tan cercana como sea posible de la verdadera solución con la norma
j L(Px+Qy )dxdy = fan (P dy-Qdx).
Dado que se dispone de la herramienta propia de los espacios con producto
111 · 111-
interno sabemos que las ecuaciones normales determinan los valores de los coeficientes
Cj. Así, sí u es la verdadera solución, se debe satisfacer la condición de ortogonalidad
Usando el teorema de Green y el hecho de que u y v toman el valor cero enan, podemos siguiente:
llevar a cabo el siguiente cálculo:
u - ¿cjUj .Lu; (1 � i � n).

( v2u, v) =j k(uxr +uyy)vdxdy


j=I

Esto conduce de inmediato a las ecuaciones:

=j L [(UxV)x + (UyV)y - UxVx - Uy Vy]dx dy


¿ Cj[Uj, U¡] = [u, u¡].
1
(1 � i � n)

=
0
(uxv dy-uy vdx)- j L(uxvx+Uyvy )dxdy
j=l

j
Estas ecuaciones se pueden simplificar usando la definición (22) y la relación
L(UxVx+Uy Vy )dxdy
[u, u¡] = (-V u, U¡) = (-f. U¡).
=- 2
(1 � i � n)
En ia última expresión de este cálculo las funciones u y v aparecen de fonna simétrica, El resultado es el conjunto de ecuaciones normales:
y por lo tanto
(v2u, v) = (u, v2 v).
¿ Cj[Uj, U¡] = -(f. U¡)
(20)
(1 � i � n). (23)
Para comprobar que -v2 es definido positivo debemos demostrar que si u E V y u ,¡; O, j =I
entonces
(-v2u, u)> Ü Dése cuenta de que la función desconocida u no aparece en el sistema (23).
618 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.5 Ecuaciones diferenciales parciales de primer orden; curvas características 619

El método del elemento finito se ha convertido en un tema tan amplio que se aconseja
al lector que consulte la literatura especializada en el terna. Puede consultar, por ejemplo,
a Becker, Carey y Oden [1981], Mitchell y Wait [1977], Oden [1972], Oden y Reddy
[1976], Strang y Fix [1973], Vichnevetsky [1981], Wait y Mitchell [1986], y Zienkiewicz
y Morgan [1983].

SERIE DE PROBLEMAS *9.4


l. Demuestre que si w es una función analítica de z (con w = u+ iv y z = x + iy), entonces u y
v son funciones armónicas.
2. Tome t' = Un + ivn. Demuestre que Un y Vn se pueden generar recursivamente mediante las
fórmulas:
Uo =1 Vo = Q Un+l = XUn - yvn Yn+l = XVn + JUn
3. (Continuación) Demuestre que para valores pares de n, Un y Vn tienen las propiedades:
Figura 9.5 Una triangulación adecuada.
u.(-x, y) = u.(x, -y) = u.(x, y) vn(-x, y) = vn(X. -y) = -vn (X, y)
Método del elemento finito 4. Demuestre que el problema de Dirichlet definido mediante las ecuaciones (7) y (8) tiene una
solución que satisface la condición de simetría mencionada en el problema anterior.
Cuando en el método de Galerkin se usan funciones básicas que son polinomios
por pedazos, el procedimiento se conoce como método del elemento finito. Como 5. En general el problema de Dirichlet para la ecuación de onda no se puede resolver. Para
ilustrar lo anterior demuestre que no existe una función que satisfaga uxy = O en el cua­
ilustración del uso de esta estrategia se supone que la región n es de forma poligonal y drado unitario y que tome los siguientes valores en la frontera: u(x, O) = x, u(O, y) = y, y
se somete a una triangulación, tal como se ilustra en la figura 9.5 u(I,y) = l.
Una funcional lineal de (x,y) es una expresión que adopta la forma ax+ by+ c. 6. Demuestre que si u0 + ivo es una función analítica, entonces lo mismo resulta cierto para
Este tipo de función puede definirse para cada triángulo mediante la asignación de los u. + iv., donde estas funciones se generan mediante las fórmulas:
valores que toma la función en cada uno de los vértices. La función lineal a pedazos que
se genera de esta manera es continua, debido a que en cualquier triangulación que se Un+! = XUn - yvn Vn+l = XVn + JUn
haya realizado adecuadamente los triángulos comparten lados. Por ello no se permiten <7. Programe los ejemplos dados en el texto para demostrar que son correctos. (Por supuesto,
triangulaciones como la que se muestra en la figura 9.6. En este caso las funciones habrá diferencias que surjan por el hecho de usar computadoras con distintas longitudes de
lineales a pedazos que se obtienen mediante la asignación de valores en los vértices de palabra.)
cada triángulo pueden no ser continuas. 8. Deduzca las expresiones para las funciones básicas u4(x, y) y u5(.x, y).

d e
*9.5 Ecuaciones diferenciales parciales de primer orden; curvas características

Al igual que en la teoría de las ecuaciones diferenciales ordinarias, las ecuaciones dife­
renciales parciales de orden superior se pueden reemplazar por sistemas de ecuaciones
a de primer orden. Los siguientes ejemplos mostrarán cómo se puede llevar a cabo esto.
b
Sistemas de primer orden
Figura 9.6 Una triangulación inadecuada.
Ejemplo 1 Transforme la ecuación de calor unidimensional considerada en la sección 9.1
La regla a la que se someten las triangulaciones adecuadas es que cualquier punto
que sea vértice de algún triángulo debe también ser vértice de cada triángulo al que U;o: =U1 (1)
pertenezca. En la figura 9.6 el punto e es uno de los vértices de 6.abe y pertenece
también a 6.dbc sin que sea vértice de éste último. en un sistema de ecuaciones de primer orden.
620 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.5 Ecuaciones diferenciales parciales de primer orden; curvas características 621
Respuesta Usando la variable v == u. obtenemo s un sistema equivalente En este ejemplo la ecuación (9) se puede simplificar usando la ecuación (7). El resul­
{Vx - Ut == 0 (2) tado es:
dy
u.-v=O 11 ttt
=c (10)
Las soluciones de la ecuación (10) son líneas rectas con pendiente
c en el plano xy. A
Ejemplo 2 Muestre que la ecuación de calor tridimensional través de cualquier punto dado (x0, y0) en el plano pasa exactamente una
de estas líneas
características, y su ecuación es:
U;a + Uyy + Uzz = U1 (3)
Y - Yo = c(x - xo). (11)
se puede tratar de la misma forma.
¿Cuál es la utilidad de las curvas características? Suponga que el pr
Respuesta Usando las variables u(l) = u, i2l = u., u(3l = Uy, u(4l = Uz, la ecuación de este ejemplo oblema que se
quiere resolver no es la ecuación diferencial que aparece en (7), sino
se transforma en el siguiente sistema equivalente de ecuacio nes diferenciales de primer un problema con
una condición auxiliar. Un ejemplo de lo anterior es:
orden:
u(%2l + u(3y l + u(z4l - ut(ll = O u. + cuy =O
uill = ui2l { (12)
(4) u(x, 0)= f(x),
{ (
uyll = u(3l
donde! es una función dada. Para calcular la solución en cualquier punto (Xo, y0) primero
uin == u(4) 11 deterruinamos la curva característica que pasa por dicho punto , y luego seguimo s la
curva hasta un punto de la forma (x, 0). En dicho punto se cono ce la solución, a saber,
Ejemplo 3 Repita lo anterior para la ecuación diferencial parcial de segundo orden general con dos u(x, 0) = J(x), y a lo largo de la curva la solución no cambia de valor, pues es una
variables independientes, que se expresa como: constante. Por lo tanto, u(xo, yo) toma el mismo val or quef(x) en tanto que (x, O) esté
F(x, y, u, u., Uy, U;a, U.y, Uyy) = o (5) sobre la curva característica que pasa por (Xo, y0). En nuestro ejemplo estas curvas so n
líneas rectas. La figura 9.7 ilustra esta situación.

{
Respuesta Esta ecuación es equivalente al siguiente sistema de ecuaciones de primer orden:
F(x, y, u, V, w, v., Vy, Wy)
Ux =V
=o
(6) (Xo, Yo)
Uy =W.
1
curva característica
Curvas características Y - Yo = c(x - Xo)

Procedemo s ahora a analizar el concepto de curvas características, o característi­


cas simplemente, para el caso de las ecuacio nes diferenciales parciales. Un tipo de curva
característica para una ecuación dada es una curva sobre la cual la solución toma un valor --1----------------------1>--------o� X
constante. Para ilustrar esta posibilidad c onsidere la siguiente ecuación de primer orden
(x, 0)
(que guarda un parentezco cercano con la ecuación de o nda de segundo orden):
u.+CUy == 0. (7) Figura9.7.
La condición de que (x, O) esté sobre la curva característica dada por la ecuació
Tome en el plano xy una curva que corresp onde a la gráfica de la función y = y(x). A lo n
(11) consiste en:
largo de esta curva lo s valo res de u dependen exclusivamente de x, u(x, y(x)). Suponga
que sobre esta curva la expresión anterior es una constante. Ento nces se debe satisfacer O - Yo = c(x - xa). (13)
la siguiente condición: Por consiguiente, x= Xo - c- 1yo y
d dy
O= u(x, y(x))=u. + uy º (8) u(xo, Yo)= f(xo - c- 1Yo).
ttt ttt (14)
Por lo tanto la curva que estamos buscando es una solución de la ecuación diferencial La ecuación (14) nos da la solución del problema original (12). Por supuesto , podemo s
ordinaria: expresarla simplemente como u(x, y) = J(x - c- 1 y). Se verifica de inmediato que esta
dy - -� (9) función satisface la ecuación (12).
(tt Uy
A continuación presentamos otro ejemplo que ilustra el uso de curvas características.
622 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.5 Ecuaciones diferenciales parciales de primer orden; curvas características 623

Ejemplo 4 Resuelva el siguiente problema mediante el método de características: Para generar una tabla de x(s), y(s), u(s) iniciando en s = O, se puede integrar numéri­
camente el sistema. No resulta difícil verificar que esta tabla aportará puntos solución
u,,+y11y= O
{ (15) de la ecuación diferencial parcial (20). De hecho,
u(O , y)= f(y).
a(x(s), y(s), u(s))ux(x(s), y(s)) +b(x(s), y(s), u(s))uy (x(s), y(s))
Respuesta Ésta es una ecuación diferencial parcial cuya solución se busca en todos los puntos del
plano xy, con la condición de que los valores que la función solución toma en el eje = x' (s)u,,(x(s), y(s)) + y'(s)11y(x(s), y(s))
y están dados. Si seguimos el mismo procedimiento que antes, la ecuación diferencial d
ordinaria que describe las curvas características será: = dsu(x(s), y(s)) = c(x(s), y(s), u(s)).
U (En este cálculo las comillas indican diferenciación respecto de s.)
dy =--=y.
- x
dx
(16) Si los valores de u(x, y) han sido dados a lo largo de alguna curvar (¡que no sea
Uy una curva característica!), entonces en principio se puede comenzar en cualquier punto
La solución que pasa por (x0, Yo) es: der, integrar el sistema (21), y obtener valores adicionales de u(x, y) a lo largo de los
arcos. (A modo de ayuda para entender estas ideas vea la figura 9.8.) Los arcos que se
Y =Yoi'-xo. (17) obtienen con este proceso son curvas características de la ecuación (20).

La intersección de esta curva característica con el eje y tiene lugar en y = y0e-xo. Por
lo tanto incluimos que
u(xo, Yo) = f(yoe-xo) (18)
curva característica
es la solución. Naturalmente, esta expresión se puede escribir como:

u(x, y) = J(ye-x). (19)

Se verifica directa y fácilmente que ésta es la solución del problema planteado por la
ecuación (15). 11

Se invita al lector a que intente resolver algunos de los problemas, por ejemplo, los
problemas l(a) hasta l (c), que son de un nivel elemental..
r
Teoría general de las curvas características Figura9.8.
La teoría general de las curvas características debería abarcar ecuaciones más ge­

f
Ejemplo 5 Determine las ecuaciones diferenciales ordinarias que definen las curvas características
nerales y no tratar a las variables x y y de manera asimétrica. Más aún, no esperamos
asociadas con la siguiente ecuación:
que la solución sea constante a lo largo de una curva característica; sólo pedimos que
satisfaga alguna ecuación diferencial ordinaria a lo largo de una característica. sen(x2 + r)u,, + (3x + r)uy = i'"l
Considere la ecuación:
Respuesta Según la teoría general, el sistema debería ser
au,,+bUy = c, (20)
en la que permitimos que a, b y c sean funciones de x, y y u. Suponga que se conoce x' = sen(x2 + r) y'= 3x+1 u'= i'"l (22)
el valor de la función en un punto (xo, yo). Este podría ser el resultado de cálculos an­ Dado que a y b no involucran a u en este ejemplo, las curvas características (en el plano
teriores o de un valor en la frontera que se ha asignado. Indicaremos a continuación xy) pueden obtenerse integrando solamente las primeras dos ecuaciones que aparecen
cómo se pueden obtener valores adicionales de la solución de (20) a través de la integra­ m� m
ción de algunas ecuaciones diferenciales. Considere el siguiente sistema de ecuaciones
diferenciales ordinarias con condiciones iniciales: Ejemplo 6 Considere la ecuación diferencial parcial

{t'�
du 6u,, + xuy = y
�=b =c
ds ds (21) Dado que u(3, 3) = 4, ¿qué valor de u(15, 21) se obtiene al seguir una curva caracterís­
y(O) = Yo u(O) = UQ = u(xo, Yo) tica?
624 Capítulo 9 Solución numérica de ecuaciones diferen *9.5 Ecuaciones diferenciales parciales de primer orden; curvas características
ciales parciales 625

Respuesta La curva característica que pasa a través del punto inicial está determinada por el pro­ Respuesta Las ecuaciones de las características son:
blema de valor inicial:
x1=x u' =xy
uy
y' =x u' =y
{y'=
x' =6 {
{x(O) =Xo y(O) =3/.xo u(O) =6
{x(O) =3 y(O) =3 u(O) =4
Al integrar estas ecuaciones obtenemos Dado que
: (xy)' = x'y+xy' = xy+x =xy(l +u)= u'( l + u),
uy
x=6s+3 se puede integrar respecto de s y obtener
y=3s 2+3s+3
xy = u+!u2+c. (25)
u =s3+ !s + 3s+4.


2

Tomando s =2 concluimos que x =15 , y=21, u=24. Utilizando las condiciones iniciales encontramos que e = -21. De la ecuación(25) se
puede despejar u y obtener:
Ejemplo 7 Use el método de características para encontrar una solución del problema de valor inicial u = -1+ J43+2x y 1111

6u, +xuy = y Existe otra forma de interpretar nuestro trabajo en los ejemplos anteriores. Tomemos a
r como un parámetro que describe puntos sobre la curva de datos r. Al igual que antes,
{ u(x, y) =4 cuando x = y s es el parámetro que describe puntos sobre cualquiera de las curvas características.
Respuesta Procedemos a encontrar
las curvas características que pasan por el punto (x, Y) =(,; r), Suponemos ques =O para los puntos sobre r. (Véase la figura 9.9.)
r ;; 6 . Resolviendo el sistema

{x' =6 y' =x u' =y


x(O) =r y(O) =r u(O) =4
obtenemos:
x=6s+r
y=3s 2+ rs+r (23)
{
u=s3 + !rs2 + rs +4.
Si (x, Y) es un punto dado en el plano, usando las primeras dos ecuaciones en(23) tratamos
de determinar el punto(,; s) correspondiente. El resultado de este cálculo es:

r =6 - ,/(x- 6) 2+ 12(x - y)
{
s =(x-r)/6
Figura9.9.
Con los valores de r y des disponibles se puede calcular el valor de u en (x,y) usando la
tercera ecuación en(23). Así, por ejemplo,
si (x, y) =(15,21) , entonces(,; s) =(3,2) Y El punto marcado con 0 corresponde a r =4 y s =2.
u = 24, tal como sucedió en el ejemp •
lo 6.
En la misma forma se pueden describir otros puntos en el plano usando coordenadas
Ejemplo 8 Resuelva el problema
de valor en la frontera: (,;s). No es necesariamente cierto que se pueda asignar valores de r y de s a todo
punto en el plano. Además, puede suceder que se toquen las curvas características
xu,+ yuuy =xy correspondientes a dos valores distintos de r. En ese caso el punto de intersección no
{ u(x (24) tendrá una descripción única en términos de (r,s). Si la curva de datos r no es una curva
, y) =2xy cuando xy =3
característica, y si las funciones coeficiente a, b, y e son lisas, los puntos cercanos ar
usando el m étodo de características. tendrán coordenadas únicas(,;s).
Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.6 Ecuaciones cuasilineales de segundo orden; características 627
626

Usando r y s de la manera que se acaba de esbozar, podemos describir nuestro trabajo 7. Resuelva, usando el método de características, el siguiente problema:
de la siguiente forma Las funciones (,; s) H x(,; s), y(,; s), y u(r, s) están determinadas u,+uy=u 2
por las ecuaciones diferenciales: {
u(x, y)=y sobre la rectax +y= O
{ax
-=a
oy
=b
ou
-=c
8. Resuelva el siguiente. problema de valores en la frontera mediante el método de caracterís­
as os as ticas. Explique las dificultades que pueden aparecer.
x(,; O)= f(r) y(,; O)= g(r) u(,; O) = h(r). u,+2Uy=U
{
u= 1 cuandoy=2x
Suponemos que r está dada paramétricamente por:
9. Resuelva el siguiente problema usando el método de características:
X=f(r) y= g(r).
uu,+uy= l
{
u= r sobre la curvax= ,:Z y=2r
La integración de las tres ecuaciones diferenciales genera tres funciones que representan
en forma paramétrica a una superficie: 10. Con el método de características resuelva:
u,+2uy=y
x =x(,;s) y= y(r, s) u= u(r, s). {
u = ,:Z sobre la circunferencia x = cos r y = sen r
Obviamente, esta superficie contiene a la curva espacial: 1 1. Considere la ecuación diferencial parcial au, + bu y = O, donde a y b son funciones de x
exclusivamente. Encuentre la ecuación de la curva que pasa por (xo, yo) y sobre la cual los
valores de u permanecen constantes.
r·: x=f(r) y= g(r) u= h(r).

Por consiguiente, hemos encontrado una superficie que resuelve la ecuación diferencial
parcial original y que contiene una curva espacial dada, f*. Observe que r es una *9.6 Ecuaciones cuasilineales de segundo orden; características
proyección de f* sobre el plano xy.
Vamos a analizar en esta sección la ecuación

SERIE DE PROBLEMAS *9.5 au,:;c + buxy + CUyy + e= O. (1)


l. Use el método de características para resolver los siguientes problemas: Permitimos que a, b, e y e sean funciones de x, y, u, u x y 11y. Una ecuación de este tipo

(a)
u,+xuy=0
{u(O, y) = f(y) (b)
u,+2uuy=0
{u(O, y) = f(y) (c)
{ xu, + 2yuy= O
u(I,y)=f(y)
se dice que es cuasilineal. Al igual que en el estudio de las curvas características de las
ecuaciones de primer orden, nos preguntamos acerca del comportamiento de la función
solución a lo largo de una curva en el plano xy.

2. Encuentre el valor de u(l7, 3) dado que:


Curvas características
u,+yuy= O Sea C una curva en el plano xy con ecuaciones paramétricas:
{u(l8, 3e) = krc/2
x = x(s) y= y(s) (s E lR.)
3. Verifiqueque la función obtenida al buscar una solución en el ejemplo 8 resuelve el problema
dado. .La notación tradicional p = Ux y q = Uy simplificará nuestro trabajo. Nosotros con­
sideramos x, y, p, q y u indirectamente como funciones de s. Por derivación directa,
4. Encuentre la solución de la ecuación diferencial del ejemplo 6 sabiendo que u= e' seny tenemos que:
sobre la curvay = x 3• Explique cómo se puede superar las dificultades numéricas. Encuentre
u(7, 5) utilizando el hecho de que el punto (7, 5) está sobre una curva característica que pasa
por (1, 1). dp _ opdx opdy
+ = u,,x' + Uxyy' (2)
ds - OX ds oy -;¡;
5. Explique, en el marco de la teoría general, por qué las funciones solución para las ecuaciones
(7) y (15) toman un valor constante a lo largo de las curvas características. dq oqdx oqdy
= + = u,:yx' + UyyY1 (3)
6. Demuestre que la función que aparece en el ejemplo 7 no es única.
ds OX ds oy -;¡;
628 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.6 Ecuaciones cuasilineales de segundo orden; características 629

Con base en la ecuación (2), podemos resolver para uxx: Esta clasificación de las ecuaciones se ilustra muy bien con tres de ellas, las cuales
son bien conocidas y nos servirán como model o:
d dp ds dyds dp dy li
u = ( p -uxyy') /x' = -u = -u ( 4)
:a: ds dsdx xy ds dx dx xydx· Nombre Forma ó.
a b
Tipo c

De manera semejante, con base en la ecuación (3) tenemos:


calor U:,:x-Uy =O 1 O o O parabólica
U:,:x-Uyy =O 1 O -1 4 hiperbólica
(dq - dq -
onda
d d Laplace Uxx+Uyy=O 1 O 1 -4 elíptica
UYY = UxyX') /y' = q s -Uxy IÍX � = U IÍX
d s dy dy xydy .
(5)
ds d s dy
Ejemplo 1 Clasifique la siguiente ecuación en cuanto a su tipo:
Las ecuaciones (4) y (5) son válidas a lo largo de la curva C. Si las expresiones que
acabamos de deducir s e sustituyen e n la ecuació n (1), el resultado es: (x+y)uxx+ (1+x 2)Uyy =O.

a
• dy (dq
dx
( -uxydx) +buxy + c dy-uxydy) +e =O
dx
(6) Solu ci ón El discriminante de la ecuación es:

ó.(x,y ) = -4(x+ y)(l + x2).


Cuando la ecuación (6) s e multiplica por dy/dx, el resultado es:
En el dominio, donde x+y > O, la ecuación es elíptica. E n el d omino donde, x+y < O,
dpdy_ dy
2
dy c dq_ la ecuación es hiperbólica, y en la recta x + y = O es parabólica.
a [ u ( ) ]+bu + [ u }+/Y =O . (7) 1111
dxdx xy dx xydx dx xy dx
Ejemplo 2 Encuentre las curvas características correspondi entes a la ecuació n:
Agrupan do términos en la ecuación (7) tenemos:
YUxx+(x+/)uxy +xyUyy =O (10)
2
-u [a (dy) dy dy
-b�+c]+/p +/q + e =0. (8) Solu ción La ecuación diferencial que describe a las curvas características es la ecuació n (9). E n
xy dx dx dxdx dx dx

La curva C, que hasta ahora no ha sido especificada, se ha de escoger de modo que


est e caso se trata de:
(dy)2
y dx - (x+/) l+xy = O
d
(11)
el término uxy desaparezca de la ecuación (8). D e est e modo, C queda descrita por la
ecuació n dif erencial: El discriminante es:
(dy) -bdy + c =O.
2
a -;¡; (9)
dx ó. = b2 - 4ac = (x + y2 )2 - 4x/ =(x -y2)2
Una curva C de este tipo se le llama curva característica de la ecuación diferencial (1).
Dado que ó. > O (excepto en la curva x =y2 ), la ecuación diferencial parcial (10) es hi­
perbólica, y para las curvas características hay que resolver dos ecuaciones diferenciales
Clasificación ordinarias, a sab er:

En virtud de que la ecuació n (9) es una ecuació n cuadrática en dy/dx, la naturaleza dy _ b±/&_ ( x+y2)±1x-/l
de las curvas características está determina da por el discriminante: -;¡;-z;-- 2y (12)

Suponga que x > y2. La primera ecuación, la correspondiente al signo +, es:


ó.Eb2-4ac
dy X
Si ó. > O para cierto valor (x, y, u), se dice que la ecuación diferencial es hiperbólica ahí. =
dx y'
E n cambio, si ó. = O, la ecuación se dice que es parabólica, y si ó. < O, se dice que es
elíptica. Esta clasificación puede variar de un punto a otr o en el plano xy y depender y tiene como solución a la familia de hipérbolas y2 - x2 =a.. La segunda ecuación, la
también de la solución u, ya que está permitido que a, by e dependan de x, y, u, Ux Y correspondiente al signo -, es:
uy , En el caso lineal, las funcio nes coeficiente a, b y c dependen únicamente de x y y, dy
=y
simplificándose con ello la clasificación. dx
630 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.6 Ecuaciones cuasilineales de segundo orden; características 631

y tiene como solución a la familia de curvas exponenciales y = pe<. Cuando x < y2 La versión simplificada de la ecuación (13), escrita para ambas curvas características, es:
estos dos casos se invierten. Cuando x = y2, la ecuación (10) es parabólica y la curva
característica es de nuevo la solución de la ecuación diferencial ordinaria dy/dx= y. 11
+v1 = -e/a cuando�= v2
dp dq
{ dx dx dx
(17)
-+v2- = -e/a cuando - = v1
Algoritmo dp dq dy

Ahora volvamos a la ecuación (8) y supongamos que la curva C es una curva


dx dx dx

característica. La pendiente dy/dxcumple sobre C con la ecuación (9), de modo que la Para resolver las ecuaciones (17) se puede utilizar un método de diferencias finitas. Las
ecuación (8) se reduce a: ecuaciones que hay que resolver son versiones discretizadas de las ecuaciones (15):
a--+c -+e- = O
dp dy
(13)
dq dy

y(A) - y(B¡ ) _ V¡ (A)+v1(B1)


dxdx dx dx
Vamos a indicar ahora mismo cómo se puede utilizar localmente la ecuación (13) para x(A) - x(B1 ) - 2 (18)
calcular una solución numérica cuando se trate de una ecuación hiperbólica. En tal caso,
habrá dos curvas características que coinciden en un punto dado (xo, yo). Considere la y(A) -y(B2) _ v2(A)+v2(B2)
(19)
situación que se muestra en la figura 9.10, en la que se exhiben dos curvas características x(A) - x(B2) - 2
que pasan por el punto A.
A fin de simplificar la notación, introducimos las funciones v1 y v2 que aparecen al y versiones discretizadas de las ecuaciones (17):
resolver la ecuación cuadrática (9):
p(A) - p(B2) v¡ (A)+V¡ (B2) [q(A) - q(B2)
V¡ = (b+./S.)/(2a) +[ ]
{ (14) x(A) - x(B2) 2 x(A) - x(B2)]
Vz = (b- .fi,_)/(2a).
= - [(e/a)(A)+(e/a)(B2)] (20)
1
2
Las dos curvas características se determinan con las ecuaciones diferenciales:
p(A) - p(B¡) [v2(A)+v2(B1) [q(A) - q(B1)
+ J
(15) x(A) - x(B¡ ) 2 x(A) - x(B1) ]
= Vz
dy dy
= v¡
dx dx 1
=- [(e/a)(A)+(e/a)(B1)] (21)
La ecuación (13) se puede simplificar utilizando el hecho de que la funciones v1 y v2 que 2
figuran en la ecuación (14) satisfacen las siguientes relaciones:
A y B I son en este caso puntos sobre la curva característica dy/dx= 'v1, mientras que
v1 +v2 = b/a v1 v2 = c/a (16), A y B2 son puntos sobre la curva característica dy/dx= v2. La fórmula para calcular
u(A) es:
p(A)+p(B 1)]
u(A) = u(B1)+ [ [x(A) - x(B1)]
2
(22)
dy = U¡
+[ � ] [y(A) - y(B1)].
q(A) q(B¡)
dx

dy = Uz
dx Ésta es la diferencia finita análoga a la ecuación:

du = u.dx+uy dy = pdx+qdy,

ya que p =u.y q = uy. Observe que en las ecuaciones (18) a (22) se utilizan en forma
sistemática los valores promedio de las funciones a lo largo de diversos arcos.
Ahora suponga que conocemos los valores de x, y, u, p y q en los puntos B1 y B2.
En tal caso las ecuaciones (18) a (22) nos permiten determinar los nuevos valores x(A),
Figura 9.10 Curvas características AB1 y AB2• y(A), u(A), p(A) y q(A). Esto en sí puede ser una fuente de dificultades, en virtud de que
632 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.6 Ecuaciones cuasilineales de segundo orden; características 633

las ecuaciones son no lineales. En la práctica, esto se resolvería por lo general aplicando
y
algún método iterativo. He aquí el perfil de un procedimiento de esa naturaleza:
l . Comience haciendo una conjetura acerca de los valores correctos dex(A), y(A),
u(A), p(A) y q(A). Dichas suposiciones pueden ser simples perturbaciones de
valores recientes de estas funciones, digamos en B 1 .
2. Calcule v1 (A), v2(A) y (e/a)(A) apoyándose en los más recientes valores de
x(A), y(A), p(A), q(A) y u(A).
3. Vuelva a calcularx(A) y y(A) con las ecuaciones ( 18) a (19). Después calcule
de nuevo p(A) y q(A) con las ecuaciones (20) a (21). Por último vuelva a
calcular u(A) con la ecuación (22). Repita el paso 2 en caso de que los nuevos
valores difieran radicalmente de los valores previos. 08 v v v v v v • ... x
Los valores estimados de las cantidadesx(A), y(A), etc., en el paso 1, se pueden obtener
fácilmente por medio de ciertas formas no tan precisas de las ecuaciones (18) a (21). Por Figura 9.11.
ejemplo, podemos reemplazar los valores promedio que figuran en dichas ecuaciones
por los valores en B 1 y B2. Hecho lo anterior, las ecuaciones (18) a (19) son lineales y
se pueden resolver fácilmente para producir los valores iniciales de esta iteración. Esta
tarea tiene como resultado las siguientes fórmulas:
A
y(B2) - y(B 1 )+x(B¡)v¡ (B¡) - x(B2)v2(B2)
( =:....c....cc..-.:.....;....�������
xA)
V¡ (B¡) - V2(B2)
y(A) = y(B ¡ ) + v 1(B 1 )[x(A) -x(B ¡ )]
R = p(B2) - p(B ¡ )+ V¡(B2)q(B2) - v2(B ¡ )q(B 1 )

S = (e/a)(B2)[x(A) - x(B2)l - (e/a)(B 1 )[x(A) - x(B 1 )] B1 B2

q(A) = (R - S)/[v¡ (B2) - v2(B 1 )J

1
Figura 9.12.
p(A) = p(B2) - (e/a)(B2)(x(A) - x(B2)] - v1(B2)[q(A) - q(B2)]

Si la ecuación cuasilineal ( 1) es de hecho lineal, entonces a, b, c, ti, v1 y v2 son fun­


ciones de x y y exclusivamente. La función u y sus derivadas no aparecerán en las seis f
!
en donde se utiliza el valor n = 8. En vista de que q = u, = -e, en este ejemplo las
ecuaciones (17) toman la forma siguiente:
funciones anteriores. En tal caso, las ecuaciones (18) y (19) se pueden resolver con­
+lq -q = O
dp
juntamente para x(A) y y(A). Después de lo cual, las ecuaciones (20) y (21) se pueden cuando dy = - 2
resolver conjuntamente para p(A) y q(A). { rb rb rb
dp dq dy
- - 2- - q = O cuando - =2
rb rb rb
Ejemplo 3 Escriba un código informal para resolver el siguiente problema con valores en la frontera
aplicando el método de las características: Ahora sea h = I/(n - 1). Éste es el espaciamiento entre los puntos discretos Xj en el
intervalo [O, l ]. Refiriéndonos a la figura 9.12, podemos ver que si B¡ = (x, y), entonces
{Ux,: -4Uyy -Uy=0 B2 = (x+ h, y) y A = (x+ y+ h).q,
En estos términos, podemos prescindir de las ecuaciones (18) y (19). En las ecua­
u(x, O) = f(x) uy (x, O) = g(x) (O � x � 1)
ciones (20) y (21) utilizamos e = -u, = -q. Después de las simplificaciones, se
Solución Seleccionamos n puntos Xj distribuidos a distancias iguales en el intervalo [ O, 1] y cal­
convierten en:
culamos la solución numérica en los puntos de intersección de las curvas características p(A)+ (2+ �) q(A) = pB
( 2) + (2 - �) q(B2)
que se originan en xj. La ecuación (14) nos proporciona los resultados v1 = 2 y v2 = -2,
{
ya que ti = 16. Las ecuaciones diferenciales de las curvas características son dy/rb = 2
y dy/rb = -2. Estas curvas son líneas rectas, tal como se muestra en la figura 9.11, p(A) - (2+ �) q(A) = p(B1) - (2 - �) q(B )1
634 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.6 Ecuaciones cuasilineales de segundo orden; características 635

La solución de este par de ecuaciones lineales es: en la ecuación diferencial (1). Suponga que las nuevas variables se introducen a través
de las ecuaciones:
I; = l;(x, y) T\ = TJ(X, y).
p(A) = �[p(B1)+p(B2)]+ (1 - �) [q(B2) - q(B1)] (23)
El efecto de este cambio·en la ecuación diferencial
q(A) = {p(B2) -p(B1)+ (2 - �) [q(B2)+q(B1)]} / (4+ �)
auxx+buxy+ cuyy+e = O. (24)
La fórmula (22), convenientemente simplificada, reza: se puede determinar después de calcular
h
Ux = U¡;/;x+ �TJx
h
u(A) = u(B1 )+ [p(A)+p(B1)]+ [q(A) +q(B1)]
4 2
Uy = U¡;/;y+ �T]y
El siguiente es un algoritmo para este procedimiento:
U;r;x = U¡;/;;r;x+u1;1;/;;+Zls T],/;x+ �TJ:r:x+ �1;/;xTJx+� TJ;
11 11

inputn Uxy = U¡;/;xy+U¡;i;/;y/;x+Zls T\y/;x+ �T\xy+ �i;/;yT]x+� T\yTJx


11 11

h +- 1/(n - 1)
Uyy = u1;/;yy+lle1;/;;+Ui;11 T\y/;y+ �T]yy+ �l;/;yT]y+�11 TJ;
forj = 1, 2, .. ., n do
Xj +- (j - l )h Al sustituir estas expresiones en (24), obtenemos:
Yj +- O
Uj +-j(Xj) u1;1;[al;;+bl;,l;y+el;;]+u1;11[2a/;,TJ,+b/;x TJy+b/;yT\x+2c/;7T]y]
(25)
Pj +-f'(xj) +�11 [alJ;+bl]yT]x+CTJ;J+f = O
(Jj +- g(Xj)
En a, b, e y e también hay que hacer las sustituciones apropiadas. Se muestran todos los
output Xj, Yj, Pj, (Jj, Uj términos en los que figuran segundas derivadas, conteniendo f los términos restantes.
end (Véase el Prob. 8.) Ya que nuestro interés por ahora se centra en el caso hiperbólico,
for i = 1, 2, .. . , n do supondremos que la ecuación cuadrática:
y¡+- ih
a)..2 +b1..+c = O
for j = 1, n - ido
Xj +- Xj+h/2 tiene dos raíces reales, a saber, (-b±/E.)/(2a), en donde el discriminante t:J. = b2 -4ac
p +- [pj+Pj+il/2+(1 - h/8)[qj+l - qj] es positivo. Si elegimos una transformación de coordenadas de modo que
q +- [Pj+l -Pj+(2 - h/4)(qj+l +(Jj)] /(4+h/2)
Uj +- Uj+h(p+pj)/4+h(q+(Jj)/2 1;,/l;y = (-b +.fi.)/(2a)
Pj +-p TJ,/TJy = (-b - .fi.)/(2a),
qj +- q
output Xj, Yj, Pj, (Jj, Uj entonces la ecuación diferencial (25) se simplifica como sigue:
end U¡;11 [2a/;x T]x+b(/;xT]y +/;yT]x )+2c/;yTJy ]+f = O. (26)
end.
1
Ésta es la forma canónica de la ecuación hiperbólica. Las curvas descritas al hacer

Un enfoque alternativo de las características l;(x, y)= constante TJ(X, y) = constante, (27)
Hay otro enfoque de la teoría de las características, el cual parte de la cuestión de si son las curvas características. Estas curvas resuelven las mismas ecuaciones diferen­
un cambio de variables, digamos de (x, y) a (I;, r¡), puede conducir a una simplificación ciales que se obtuvieron en la ecuación (9), como se puede comprobar fácilmente.
636 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9. 7 Otros métodos para los problemas hiperbólicos 637
Ejemplo 4 Encuentre la región en la que la ecuación donde J es el jacobiano de la transformación:

Uxx -yUyy = Ü (28) J = 1 i;, i;y


T], T]y
¡.
es hiperbólica, y determine un cambio de variables que reduzca la ecuación a su forma Concluya por último que si el jacobiano no se anula, la ecuación diferencial
tipo. no cambia de
canónica.
8. Demuestre en la ecuación (25):
Solución El discriminante es b2 - 4ac = 4y, y la ecuación (28) es hiperbólica en el semiplano
superior. Para encontrar el cambio de variables, hay que resolver las ecuaciones dife- f =e+a�i;.a+au�l]xr+b�i;xy+b�T]xy+c�i;w+cu�Tlw·
renciales: 9. Demuestre que la forma canónica de la ecuación diferencial del ejemplo 4 es:
�x/�y = (-b+ ,/b2 - 4ac)/(2a) = y 112
16�� +� +�=o.
TJx/TJy = (-b - ,/b2 - 4ac)/(2a) = -y 112 '10. Escriba un código general para resolver el siguiente problema hiperbólico utilizando el
método de las características:
Podemos tomar como soluciones a:
auxr+buw+cu,+duy = O
{
1
� =x+2y ¡2 T] = X - 2y l /2_ u(O, y)= f(y) u,(O, y)= g(y) (O �y�1).
Suponga que a, b, e y d son constantes que satisfacen ab < O. Considere puntos espaciados
En términos de las nuevas variables, la ecuación (28) se convierte en: a distancias iguales en el eje y dentro del intervalo O �y� l.
11. Complete los detalles en la derivación de las fórmulas previas al ejemplo 3.
2
4ui;11 + _ (ui; - �) = O. 111 12. Desarrolle las soluciones que se dan en el ejemplo 3.
� T]
13. Verifique la última ecuación del ejemplo 4.

SERIE DE PROBLEMAS *9.6


l. Demuestre que si b = O y ac < O, la ecuación diferencial (!) es hiperbólica y sus curvas *9.7 Otros métodos para los problemas hiperbólicos
características son soluciones de la ecuación dy/dx = ka·
2 2 Desarrollaremos en primer lugar algunos métodos de diferencias finitas para los sistemas
2. Demuestre que si e = -a y b > 4a , la ecuación diferencial (1) es hiperbólica y en cada
punto del plano xy las curvas características que inciden con él son perpendiculares entre sí. hiperbólicos de ecuaciones diferenciales parciales lineales de primer orden. Comenza­
mos con una sola ecuación acompañada de una condición inicial:
3. Encuentre una ecuación diferencial parcial de segundo orden cuyas curvas características
sean xcosa.+y sena.=O y x2 +y2 =�- {Ur = Cl.Ux
4. Clasifique las siguientes ecuaciones como hiperbólicas, parabólicas o elípticas: u(x, O) = f(x) (-oo<x<oo), (1 )
(i) yuxr+xu,,+Uw+u+ u, =O
en donde a es una constante (real). Conocida la solución en la línea t = O, es natural
(ii) xyu,,+e'u,+yuy = O
que se busque extenderla a otras líneas t = k, t = 2k, etc., a través de un método de
(iii) 3uxr+Uxy+Uw+2yu +7 =O avance, donde k es el incremento de la variable t.
5. Encuentre la región en donde la ecuación xy2 u,, = Uw es hiperbólica. Determine su forma
canónica y el cambio de variables con el que se simplifica. Método de Lax-Wendroff
6. Verifique que las curvas a lo largo de las cuales i;(x, y) o T](X, y) se mantienen constantes son
curvas características como se definen en la ecuación (9). Suponga que la solución u es continuamente diferenciable cualquier número de
veces en ambas variables x y t. Por el teorema de Taylor:
7. Después de hacer el cambio de variables correspondiente a la ecuación (23), la ecuación (24)
se convierte en la ecuación (25). Ésta última tiene la forma: k2 k3
u(x, t+ k) = u+ ku 1+
a.ui;; +�u;� +yu��+e= O.
21 urr+ 3tm+ · · · (2)

Se sobreentiende que en la parte derecha de la ecuación, u y sus derivadas se evaluarán


Demuestre que en el punto base (x, t). Asimismo, la serie se debería concluir en algún punto, suminis­
�2 - 4a:y = (b - 4ac)i,
2
trándose un término de error adecuado.
638 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales
*9. 7 Otros métodos para los problemas hiperbólicos
639
Dado que la función u ha de ser solución de (1), tendremos que u, = a.ux , u" =a. 2 ux:r Después de sustituir esta solución tentativa en la ecuación (5) y simplifi
y así sucesivamente. (En el problema1se pide una demostración formal de este hecho.) car, tenemos:
De esta manera, en la ecuación (2) podemos escribir:
t-k =1 -4s2+ e1llh (2s2 +s) + e-,]lh (2s2 -s)
(ka.)2
u(x, t+k) = u+ka.ux + 21 ux:r +
(ka.)3
u= + · · · (3) =1-4s2+ s(e'Jlh -e-•Jlh) + 2s2(e11lh + e-•Jlh)
31
= l -4s2+2is senph +4s2cosph
Si queremos diseñar un procedimiento numérico que tenga una precisión de segundo
orden en la magnitud del incremento, la serie (3) se puede truncar en el término ux:r . Hemos utilizado la relación deEuler:
En tal caso, las derivadas en la parte derecha de la ecuación (3) se pueden reempla­
zar por aproximaciones en diferencias finitas de segundo orden. Sea h el incremento e'Jlh = cosph +i senPh .
correspondiente a la variable x. La fórmula que efectúa un avance de la solución es:
Para que haya estabilidad requerimos quele'""� 11. Un pequeño cálculo nos lleva a la
v(x+h,t)-v(x-h,t) igualdad:
v(x,t+k)=v(x,t) + ka. [ ] lt-kl 2 =1 -16s2sen2 8 1( -4s 2 sen2 8 - cos2 8) (6)
2h
donde 8 = Ph/2. Ahora la condición de estabilidad es:
k 2a. 2 v(x + h, t)-2v(x, t) + v(x-h,t)
+ [ ]
2 h2
1 -4s2sen2 8 - COS2 8 � Ü. (7)
de modo que El valor mínimo de la expresión de la izquierda se alcanza cuando 8 = rr/4, y es
no negativo si lsl � 1/2. Así, el requisito para que haya estabilidad ( una condición
v(x,t + k) = (2s2+ s)v(x + h,t) + (1- 4s2)v(x,t) + (2s2 - s)v(x -h,t), (4) necesaria) es quekla.l� h.

dondes = (a.k)/(2h). El método que engloba la ecuación (4) es el método de Lax­ Sistemas de ecuaciones
Wendroff. Hemos cambiado a la letra ven virtud de que la solución de la ecuación (4)
no siempre es una sólución de la ecuación (3). Ahora considere un sistema hiperbólico de ecuaciones y suponga que tiene la forma:
Obviamente, no hay ningún obstáculo para deducir métodos de orden superior a
partir de la ecuación (3). En el problema2 se pide que se infiera un método de tercer U,=AUx. (8)
orden utilizando estos principios.
Aquí U es un vector de funciones, digamos u(l), u(Z), • . • , u(m). Cada una de las com­
ponentes es una función de (x, t). La matriz A es de m x m, y para que el problema
Análisis de la estabilidad sea en realidad hiperbólico, A debe tener m valores propios reales y distintos. La forma
En el problema modelo que se da en la ecuación 1( ), la solución se puede escribir vectorial del método de Lax-Wendroff es el análogo de la ecuación (4):
inmediatamente. Ésta es:
u(x,t) = f(x + a.t). V(x,t+k) = V(x,t) + (!) A[V(x+h, t)- V(x -h,t)]
(9)
Cuando se introducen puntos malla (jh,nk) y se define Vjn = v(jh,nk), la ecuación (4) + ( ;:2 ) A2[V(x + h,t)-2V(x,t) + V(x -h,t)]
adopta la siguiente forma:

de modo que:
Vj,n+I = (2s2+ s)Vj+l.n + (1- 4s2)Vjn + (U - s)Vj-1.n, (5)

V(x,t + h) = (,A)(2,A + l)V(x + h,t) + (I - (2,A)2)V(x, t)


en dondes = (ka.)/ (2h). Se puede hacer un análisis de la estabilidad utilizando el
método de Fourier de la sección9 . l . Para ello, debemos encontrar una solución de la +(,A)(2,A - l)V(x -h,t)
ecuación 5( ) que tenga la forma:
donde, = k/ (2h). Sin entrar en detalles, diremos que este método numérico es estable
si y sólo si cada valor propio;\. de A satisface la desigualdadkili� h; es decir, el radio
Vjn = iF> ¿i).k
h
(i = v-1).
espectralp(A) de A debería satisfacer la desigualdadkp(A) � h.
640 Capítulo 9 Solución nu mérica de ecuaciones diferenciales parciales *9.7 Otros métodos para los problemas hiperbólicos 641

Método implícito de Wendroff Análisis de errores


El análisis que acabamos de ofrecer corresponde a aquellas ecuaciones diferenciales Vamos a demostrar que el error por truncamiento en el método de Wendroff es

=
para las que sólo se han suministrado valores iniciales. Si la variable x está limitada a O(h2 +k 2 ). El significado preciso de esta afirmación requiere una explicación. Nuestra
un cierto intervalo, que podemos considerar que es el [O, 1], entonces un problema ecuación diferencial es de la forma Lu = O, con L definida como Lu u, - a.ux. Por
debidamente planteado asignará valores a todos los puntos de la frontera de la región la ecuación (10), el operador de diferencias finitas que reemplaza a L en el proceso
descrita por las condiciones O � x � l, t ;:;; O. En este caso, se pueden utilizar métodos numérico es de la forma:
numéricos implícitos con la ecuación diferencial en (1). Como es de esperar después 1 a.
(A+B) - (C+D),
de los desarrollos vistos en la sección 9.2, de los métodos implícitos se pueden obtener 2 2
mejores propiedades de estabilidad. Uno de ellos lleva el nombre de su autor, Wendroff.
donde A, B, C y D están dados por:
Primero lo escribiremos en una forma que sugiere su origen:

(Au)(x, t) = k-1[u(x, t +k)- u(x, t)]


� ( Vj.n+¡ -Vj,n+Vj +J.n+J -Vj +J.n )
(Bu)(x, t) = k-1[u(x+h,t+k) -u(x+h,t)]
=i (
k k
(10)
Vj +l,n -Vjn Vj +l,n+ -Vj.n+I (Cu)(x, t) = h-1 [u(x+h, t)- u(x,t)]
+ \ )
h
(Du)(x, t) = h-1 [u(x + h,t + k) - u(x,t +k)].
Lo que podemos ver son promedios de las diferencias finitas de primer orden utilizadas
para representar derivadas. El error por truncamiento de este método es O(h2 +k2). Utilizando las diferencias centrales:

Análisis de la estabilidad (Au)(x,t) = u,(x, t + !k) +O(k2 )


Antes de emprender un análisis de la estabilidad, escribimos la ecuación (1O) en la (Bu)(x, t) = uc(x +h, t + !k) +O(k2)
forma:
(Cu)(x,t) = ux(x + fh. t) +O(h2)
Vj,n+I(1 +r) +Vj +l,n+I(1- r) = Vjn(l - r) +Vj +J ,n(I+r), (11)
en donde r = a.kjh. Después buscamos una solución de la ecuación (11) de la forma:
f
(Du)(x, t) = ux(x+ h,tk) +O(h2).

No estamos diciendo que para toda u suficientemente lisa


Vjn = /i;,h¿iick
y sustituimos esto último en la ecuación (11). Hechas las simplificaciones del caso { L- �(A+B) +ice+D)} U= O(h2 +k2 )_
obtendremos:
/k(l +r)+eu eiP\I-r) = I-r+eillh (I+r).
Esta ecuación se demostrará sólo para aquellas funciones que satisfacen la ecuación
En consecuencia: diferencial. Por consiguiente, en la prueba suponemos que Lu = O, de modo que lo
único que nos queda por demostrar es:
eu = [l +e')lh +r(ei�h - 1)]/[1 +ei�h - r(e'Jlh- 1)]. (12)
(A+B)u- a.(C +D)u = O(h2 +k2 ).
Para que k'kl � 1, es necesario y suficiente que:

\1 + ei�h +r(e11lh - 1)[ � \1 + e'Jlh - r(e1llh- 1)\. LEMA El error por discretización en el mét odo de Wendroff es O(h2 +k2).
(13)

Al recurrir al problema 6, encontramos que una condición equivalente es: Demostración Por el teorema de Taylor y la ecuación diferencial, tenemos:

(1 +cos�h)(rcos�h- r) + (sen�h)(rsen�h) � O. (14) f


A = uc(x,t) + kuu(x, t) +O(k2)
La parte izquierda de la ecuación es O, y el método es estable para toda a., k y h. = a.ux(X. t) + fa.2 kurc(x, t) +O(k2 ).
642 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales *9.7 Otros métodos para los problemas hiperbólicos 643

Al sustituir x por x + h en la última ecuación obtenemos: (16) en términos de las funciones Wj que se seleccionaron. En el método de Galerkin (al
igual que en otros métodos semejantes), lo que se busca es una solución aproximada de
B = a.ux(x + h, t) + ia.2 kuxx(x + h, t) + O(k2) la ecuación (17). Al mismo tiempo, se deben tomar en cuenta las condiciones iniciales
y en la frontera en (15). Para simplificar, supongamos que cada función básica wj se
= a.u,(x, t) + a.huxx(x, t) + O(h2) + !a.2kuxx(x, t) + O(hk) + O(k2) anula en O y en l. En tal caso las condiciones homogéneas en la frontera se satisfarán
automáticamente con la solución tentativa (16). Después, tomamos el producto interior
Análogamente, para C y D tenemos: de w; con ambos lados de la ecuación (17) para 1 � i � n. El resultado es:

C = ux(x, t) + !hux,: (X, t) + O(h2) n


¿[v¡(t)(wj, w;) - a.vj(t)(w1, w;)] = O (1 � i � n) (18)
D = ux(x, t + k) + !hu,:c (x, t + k) + O(h2) j=l
= ux(x, t) + ku,:(x, t) + O(P) + !hux,: (x, t) + O(hk) + O(h2)
En este caso la notación para el producto interior es (f, g) = f01 f(x)g(x) dx. La ecuación
= ux(x, t) + a.kuxx(x, t) + O(k2) + !hux:c(x, t) + O(hk) + O(h2). (18) es un sistema den ecuaciones diferenciales homogéneas lineales en las n incógnitas
Vj. Queremos señalar que es sumamente ventajoso escoger un sistema {w1, w2, ..., w.}
Por consiguiente: que sea or tonormal en el intervalo [O, l]. Suponiendo que éste es el caso, la ecuación
(18) tiP11e la forma:
A+ B - a.(C + D) = O(P) + O(hk) + O(h2) V' =AV, (19)
1
= O(h2 +k2). donde V= (v 1, v2, .•. , v.l y A es una matriz den x n cuyos elementos son:

Métodos de Galerkin aij = a.(w1, w;) .


Los métodos de Galerkin también se pueden aplicar a problemas hiperbólicos.
Vamos a ilustrar una manera de hacerlo con una sola ecuación diferencial de primer Ahora la condición inicial en (15) es

{
orden acompañada por condiciones tanto iniciales como en la frontera:
¿ Vj(O)wj(X) = g(x)
n

Ut = UUx (20)
u(x, 0) = g(x) (O� x � 1) (15) j=l
u(O, t) = u(l, t) = O (t > O) Quizá esto sea de nuevo imposible de satisfacer de manera exacta, en cuyo caso podemos
Comenzamos por seleccionar algunas funciones básicas de x, digamos W¡, w2, ... , w•. escoger Vj(O) de modo que la ecuación (20) se satisfaga en la medida de lo posible,
Queremos resolver el problema con una función de la forma: digamos en la norma L2. En vista de que las funciones w,, forman un sistema ortonormal
(según lo acabamos de suponer), esto significa que:

¿ vj(t)wj(x).
n
u(x, t) = (16) vj(O) = (g, wj). (21)
j =l
La ecuación (20) nos proporciona las condiciones iniciales para la solución del sistema
Las funciones v1, v2, ••• , Yn se encuentran a nuestra disposición para asistirnos en (19). Como ya vimos en la sección 8.11, la solución del sistema es:
la solución de este problema. Cuando la función propuesta en (16) se sustituye en la
ecuación diferencial, el resultado es:
V(t) = /
A
V(O).
¿[v1(t)wj(x) - a.vj(t)w1(x)] = O. (17) Un sistema ortonormal adecuado que consta de funciones que se anulan en O y en 1 es:
j =l
Como usualmente sucede cuando se sigue esta estrategia, no esperamos que la ecuación wj(x) = r 1 !2 sen rcjx.
(17) sea consistente. En otras palabras, no esperamos encontrar funciones Vj que ha­
gan verdadera la ecuación. La razón subyacente, por supuesto, es que la solución del Se puede construir un segundo sistema aplicando el procedimiento de Gram-Schrnidt a
problema con valores en la frontera quizá no se pueda expresar al formar la ecuación la sucesión de funciones x H (x2 - x)xj , en donde j = l. 2, ..., n.
644 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.8 Método de mallas múltiples 645

SERIE DE PROBLEMAS '9.7 Ejemplo ilustrativo


l. Demuestre con toda formalidad que si u, = a.u,, entonces para toda n = O, 1, 2, ... Considere el siguiente problema con valores en la frontera en dos puntos:
anu n
nO U
-=a.­
u"(x) = f(x)
O!" íJxn { ( l)
u(O) = u(l) = O.
Hágalo también en el caso vectorial. Este ejemplo es sólo ilustrativo; el verdadero poder de la estrategia de las mallas múltiples
2. Deduzca un método de aproximación de tercer orden a partir de la ecuación (3). surgirá cuando comencemos a aplicarla a las ecuaciones diferenciales parciales.
3. Cubra todos los detalles del argumento que conduce a las ecuaciones (6) y (7) y a la condición Si se elige un incremento h, podemos discretizar el problema (1) en la forma usual:
de estabilidad k[a. [ ;;; h.
h-2(Vj-l - 2Vj + Vj+l) = Íj (1 �j � n). (2)
4. Lleve a cabo un análisis de la estabilidad del siguiente procedimiento numérico para la
ecuación (1):
1 a. Hemos adoptado en este caso las siguientes definiciones:
:¡¡(v¡,n+I - Vj,n-1) = 2h(Vj+1.n - Vj-1,n),
h = I/(n + 1) Xj = jh Vj � u(xj) fi = J(xj) vo = V n+l = O
5. Investigue la estabilidad del método de Euler para la ecuación (1):
No es difícil resolver directamente el sistema de ecuaciones (2) de n x n, mas como
a.k nuestro propósito es mostrar lo que necesitaremos para resolver ecuaciones diferenciales
Vj.n+I = Vj,n + h (Vj+l,n - Vj-1,n).
2 parciales, preferimos resolver el sistema (2) con un método iterativo, y elegimos para
ello el procedimiento de Gauss-Seidel. Evidentemente, un método iterativo producirá
6. Sean u y v dos números complejos, digamos u = x + iy y v = a + ib. Demuestre que las rápidamente una solución satisfactoria si se proveé con un buen vector como punto de
siguientes desigualdades son equivalentes: partida. Una manera de obtener un punto de partida para el problema en cuestión, es
(i) [u+v[;;;[u-v[ (ii) xa+yb;;;o
resolver el mismo problema en una malla burda. As� podemos imaginar el sistema (2)

/¡l
Infiera la ecuación (14) a partir de lo anterior.
escrito con un incremento h muy grande. Este sistema tendrá menos ecuaciones, pero
7. Demuestre que en el método de Wendroff el ténnino principal en el error de truncamiento es: éstas tendrán la misma estructura El sistema de ecuaciones tiene la forma:
1 '
12
' (X, t)
-(a.h- - Cl.3 k-)ux:cr
[ 2 -1 Q .. ·
-1 2 -1 . . · O
ºJ [V¡JVz ¡-h2
-h2fz
Ü -1 2 Ü V3 = -h2ÍJ
cs. Programe el método de Lax-Wendroff correspondiente a la ecuación (4). Suponga que la ... . . .. .. ..
solución numérica se va a calcular en el segmento rectilíneo definido por ·a ;;; x ;;; b y . . .
t = T, en donde a, b y T son valores prescritos. Evidentemente,/ y a. son también valores Ü Ü Ü 2 Vn -h2!,.
prescritos. El usuario querrá asignar un valor a los incrementos.
'9. (Continuación) Ponga a prueba el programa que escribió en el problema 8 con el siguiente En consecuencia, este sistema también se puede resolver con la iteración de Gauss-Seidel.
problema: u, = 2u,, con u(x, O) = (1 - x)2 . Tome h = 0.02, k = 0.01, a = 1, b = 2 y Si decidimos hacerlo por este camino, vamos a querer comenzar con un buen vector,
T = l. Compare la solución numérica con la solución exacta. que podremos obtener recurriendo a una malla aún más burda, y así sucesivamente. Por
consiguiente, el lugar privilegiado para comenzar es la más burda de todas las mallas,
que es el caso más simple del sistema (2), a saber, n = I. En este caso, h = 1/2 y hay
sólo una ecuación en el sistema. La solución de esta última es:
9.8 Método de mallas múltiples
VQ = Ü V¡ = -if(l/2) V2 = Q.
El método de mallas múltiples para resolver numéricamente una ecuación diferencial
tiene como base la discretización y aproximación de derivadas por medio de fórmulas de Ahora estamos preparados para pasar a una malla más fina. Para ello dividimos h por 2,
diferencias finitas. El rasgo distintivo de este método es que utiliza diversas mallas sobre sustituimos n por 2n+ l y erigimos el nuevo sistema de ecuaciones. De este modo, n = 3
el dominio, las cuales varían de burdas afinas. Una solución numérica sobre una malla y h = I/4. Denotemos temporalmente con w al vector implicado en este nuevo sistema.
burda se puede calcular rápidamente, pero tendrá una precisión moderada. No obstante, Utilizaremos a v para asignar valores iniciales adecuados a las componentes w0, w1, w2,
puede servir como punto de partida de una solución iterativa sobre una malla más fina w3, w4. En la figura 9.13 mostramos la relación entre v y w. La asignación de valores
Aunque éste es sólo un aspecto de la estrategia de las mallas múltiples, comenzamos al vector w, con base en la información que trae consigo el vector v, se puede llevar a
mostrando cómo opera con un ejemplo muy simple. cabo de diversas maneras. Lo usual es utilizar un simple esquema de interpolación. Para
646 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.8 Método de mallas múltiples 647

ilustrar este aspecto, copiaremos algunos valores de v en w en donde sea conveniente, iteraciones de Gauss-Seidel que se llevarán a cabo con cada malla. La transferencia
y utilizaremos promedios para las componentes restantes. Se utilizarán las siguientes de información de v a w se llama fase de interpolación. Para el paso general del
cinco ecuaciones: algoritmo, utilizamos las fórmulas:
Wo = Vo Wz = V¡ W4 = Vz
W¡ = (vo +v¡)/2 w3 = (v¡ +vz)/2 Wz¡ = Vj w2¡-1 = (v¡-t +vj)/2. (3)
Hecho lo anterior, descartamos al viejo vector v, y lo reemplazamos por w. Después,
con el vector inicial v recien construido, llevamos a cabo algunas iteraciones del método En el seudocódigo, el ciclo que comienza en "for p = 1, 2, ... , k do" ejecuta k pasos de
de Gauss-Seidel. Formamos en este caso una nueva malla reduciendo a h a la mitad y la iteración de Gauss-Seidel. Así, la ecuación (2) se resuelve para la j-ésima incógnita,
cambiando a n como corresponde. Después de ello, se repite el proceso. llegándose a lo si guiente:

• • • • •
Wo W¡ Wz W3 W4
VJ = (vJ-l + VJ+t - h2fJ)/2. (4)



• •
VQ Vz
Esta fórmula se utiliza para actualizar cada v¡, y todo el proceso iterativo se lleva a cabo
o 1 1
2 ;¡ k veces.
Tal como se sugiere en el problema 1, es posible simplificar el proceso de interpo­
Figura 9.13. lación que genera a w a partir de v y después reemplaza a v por w. El código se escribió
sólo para fines didácticos, pero se puede utilizar para realizar experimentos, especial­
mente con problemas para los que la solución es conocida, pues en tales casos se puede
inputm, k
examinar la diferencia entre la solución real y la solución numérica. Esto se llevó a cabo
h +- I/2; n +- I en el caso f(x) = cosx, para el que la solución del problema con valores en la frontera
va+- O; vz +- O; v1 +- -(I/8)f(h) en dos puntos es:
for i = 2,3 ... ,mdo u(x) = - cos x+x(cos 1- 1)+ l. (5)
h +- h/2; n +- 2n+ I
Haciendo m (el número de refinamientos de la malla) igual a 6 y k (el número de
forj = O,I,... ,(n+ 1)/2do iteraciones de Gauss-Seidel) igual a 3, encontramos una discrepancia próxima a 10-3
Wzj +- Vj entre el valor calculado y la solución real. El valor de h en la última malla es 1/64, y
end h2 � 2 X 10-4•
forj = 1,2,...,(n+ 1)/2do
WzJ-1 +- (11¡-1 +V¡)/2
Amortiguamiento de errores
end
forj = O,I,...,n+Ido Otra componente mayor del método de las mallas múltiples es el tránsito progresivo
y sistemático de mallas finas a burdas. Esta dirección es justamente la contraria de la
Vj +- W¡ que acabamos de explicar, en la que la información de una malla burda se pasaba hacia
end arriba, proporcionando de este modo una base para las iteraciones sobre una malla más
for p = I,2,... ,kdo fina La razón para introducir posteriormente mallas más burdas en el cálculo es que los
forj = I,2,... ,ndo errores de baja frecuencia tienden a ser amortiguados eficientemente en las iteraciones
2
asociadas con una malla burda. E inversamente, los errores de alta frecuencia tienden
Vj +- [Vj-1 +Vj+I - h f(jh)]/2 a ser amortiguados de manera eficiente en las iteraciones sobre una malla fina. La
end estrategia de las mallas múltiples aprovecha esta importante característica, pudiéndose
end decir que éste es el por qué del éxito del método.
output (v¡) Un simple experimento numérico con la ecuación diferencial ( 1) nos mostrará
el amortiguamiento de los errores con diferentes frecuencias. Considere el problema
end. homogéneo;
En el seudocódigo, f es la función que figura en el problema original (1). El {u"= O
(6)
número de mallas que se utilizan (incluyendo la primera) es m, y k es el número de u(O) = u(I) = O,

1�
648 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.8 Método de mallas múltiples 649

=
cuya solución es obviamente u(x) O. Resolvamos este problema con la iteración de
Gauss-Seidel descrita por la ecuación (4) haciendof = O en esta ecuación y comenzando
con una función sinusoidal:
.8
vj = sen(!: ) (O�j�n+I)
1
Aquí n ( al igual que en los casos anteriores) es el número de nodos interiores en el .6

=
intervalo (0, 1). Este número controla la fineza de la malla. En este experimento, ;,.,
o
el vector v se puede considerar como el error, pues la solución del problema es u O.
El parámetro p controla la frecuencia del error inicial. A continuación proporcionamos .4
un seudocódigo que ejecuta k iteraciones utilizando cuatro frecuencias predeterminadas.
La norma del vector se calcula al final de cada iteración de Gauss-Seidel. .2

input n, k, p¡, P2, p3, p4


for p= p¡, p2, p3, p4 do 20 40 60 80 100
for j= O, 1, ... , n+1 do Ejex
Vj = sen((jprr,)/(n+ 1))

end Figura 9.i4 Reducción del error en 100 iteraciones.


for i= 1, 2, ... , k do
forj= I, 2, ..., n do y la parte derecha de la igualdades b =-h2:{j. Por consiguiente, la matriz de iteración es:
Vj = (Vj-I +Vj+I)/2
o l o o
! o l
end o
p¡= llvlloo= má x1:;,j:;,n
G::l- D- 1 A= O
i ! o o
output p, i, p;
end o o o. o
end.
Está claro que
Cuando este programa se ejecutó con los valores n = 63, k = 100 y p = 1, 4, G=l-iA. (8)
7 , 16, se obtuvieron los resultados que se muestran en la figura 9.14. Es obvio que los
errores de alta frecuencia son rápidamente amortiguados por la iteración, mientras que Por el lema de la sección 9.1, los valores propios de A son:
los errores de baja frecuencia son apenas aminorados. jrc
µj = 2-2 cos ( l�j�n). (9)
n+l
Análisis
El vector propio correspondiente a µj es:

_(
Acudamos al método de Jacobi para analizar el efecto reductor de las iteraciones
sobre los errores. Cuando se utiliza la iteración de Jacobi con un sistema Ax = b, la jrc jrc 2 jrc n
fórmula de iteración es v(¡)- sen-- ,sen-- , ...,sen-- ) , ( 10)
n+1 n+1 n+1
x(k+I)= ([ -D- 1A)ikJ +D- 1 b, (7)
Por la ecuación (8), los valores propios Aj de la matriz de iteración G son:
donde D es la diagonal de A. En el ejemplo de esta sección, la matriz A correspondiente
a la ecuación (2) es: tv1 = l-!µ·1 = cos jrc. ( I:::;j:::;n)
--
2 -1 O O 2 n+l
-1 2 -1 O
Por consiguiente, el radio espectral de la matriz de iteración es:
A=I0 -1 2 0
7t
1 7t ) 2 = 2

o o o p(G) = cos - 1- - ( -
7t �
2, 1- - h2.
n+l 2 n+l 2
650 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.8 Método de mallas múltiples 651

Ahora podemos extraer algunas conclusiones. Primero, dado que p(G) < 1, la Después de algunas iteraciones del método de Gauss-Seidel sobre la ecuación ( 12),
iteración de Jacobi será convergente, de acuerdo con el teorema 5 de la sección 4.6. tendremos un vector ei-1. Por medio de un proceso de interpolación, que ya hemos
Segundo, notamos que para valores pequeños de h, el radio espectral es casi 1, lo cual analizado, obtenemos un vector e;. Con este último actualizamos vi por medio de la
implica que en las mallas más finas la convergencia será muy lenta. Tercero, podemos operación:
utilizar los vectores propios de A en la ecuación (10) para entender por qué se amortiguan vi +-vi +l
los errores. Los vectores vU) son también vectores propios de G y constituyen una base
para IR". En consecuencia, cualquier error que esté presente en la solución numérica debe Este procedimiento se llama esquema de corrección por medio de la malla burda.
(l) (2l
de ser una combinación lineal de v , v , ... , y(•). Para los fines que aquí perseguimos,
será suficiente considerar una sola componente del error, digamos v U> . Obviamente la
k-ésima iteración sobre v(j) con G dará como resultado 1,.JvW , y como jAj j < 1, esto Algoritmo del V-ciclo
convergerá a O cuando k -+ oo. Pero la fuerza del efecto de reducción será mayor en Nuestro objetivo final es describir lo que se conoce en el algoritmo de mallas
cuanto jAj I sea menor. Los valores pequeños de jAj I están asociados con j en la parte de múltiples como un ciclo V (al que en adelante llamaremos V-ciclo). Este ciclo recibe su
enrnedio del dominio 1 � j � n, mientras que paraj � 1 o j � n tenemos: jAj j � l. nombre del diagrama en la figura 9.15, el cual describe el curso de los cómputos:

Restricción y corrección por medio de la malla


El proceso de mallas múltiples contendrá muchos pasos en los que los resultados
obtenidos con una malla se trasladan a otra para el siguiente conjunto de cálculos. Ya o o
hemos visto cómo proceden los cálculos hacia arriba, de una malla burda a otra más o o
fina. Supongamos que, al proceder hacia abajo, se tiene disponible una solución vectorial o o
aproximada vi del sistema (2). En vez de llevar a cabo las iteraciones con el sistema (2) o
y el valor en curso de h, preferimos descender a una malla más burda para realizar esta
tarea, agilizándose de este modo el proceso. Nuestro objetivo es refinar vi añadiéndole Figura 9.15.
una corrección conveniente. Si e; es la corrección y denotamos con Ai a la matriz del
sistema (2), entonces queremos que e; sea una solución de la ecuación
Cada círculo en el diagrama denota un bloque de cómputos realizados en una malla.
i(vi +/) =l (11) El cálculo comienza en la malla más fina. Después de un pequeño número de iteraciones,
el residuo r se habrá calculado, en cuyo caso el control pasa a una malla más burda, en la
Aquí f representa a la función f en la malla en curso. Ahora escribimos la ecuación que se procesará una ecuación de la formaAz = r. El proceso se repite, avanzando "hacia
anterior en la forma: abajo" a través de una serie de mallas hasta que se obtiene un sistema de ecuaciones
Ai/ =/-Aivi = ri, sobre la malla más burda. Este sistema se resuelve por lo general de manera exacta, pues
consta de un número muy pequeño de ecuaciones, tal vez una. En la parte ascendente
donde ri es el vector residual engendrado por la solución aproximada vi . El sistema del diagrama la información se traslada a mallas más finas a través de procesos de
kei = ri se debe resolver pasando a una malla burda y utilizando ahí unas cuantas interpolación, llevándose a cabo iteraciones adicionales.
iteraciones del método de Gauss-Seidel. En la malla más burda tendremos un sistema A fin de dar una descripción formal del V-ciclo, primero numeramos las mallas
de ecuaciones: g1 , g1, •.. , gm , donde g 1 denota la malla más burda y gm la más fina. Sobre la malla gi
Ai-l ei-1 = ri-1 _ (12) se prescribe una matriz Ai . El problema que queremos resolver es Amvm = ¡m, versión
El vector ri- I se obtiene de ri por medio de una transferencia elemental de información discreta sobre la malla más fina del problema dado con valores en la frontera. El vector
de una malla fina a otra más burda. Una forma de hacerlo es escribiendo: ¡m es un dato con el que se alimenta a la máquina. Los demás vectores sucesivos f se
computarán para i = m - 1, m - 2, ..., l. Los pasos a seguir en el V-ciclo son los
i-1
lj = rzti (13) siguientes:
l. Haga i igual a m y ponga en ¡m los datos del problema con valores en la
Un método más refinado, el cual utiliza toda la información que hay en ri, está dado por frontera. Ponga en vm la mejor conjetura que tenga disponible.
el �romedio ponderado:
2. Aplique k veces un método iterativo al sistema Aivi = f, comenzando con
i-1
= ¡r2j-l
1 i 1 i + 1 i
+ zr2j (14) la vi en curso. Calcule el residuo: ri +- ¡i - kvi . Aplique un operador de
rj ¡r2j+l·
restricción R;f- 1 +- Ri. Reduzca i en una unidad.
Sin importar qué fórmulas se utilicen, este proceso se conoce como restricción. 3. Si i = 1, continúe en el paso 4. Si i > 1, continúe en el paso 2.
652 Capítulo 9 Solución numérica de ecuaciones diferencia/es parciales 9.8 Método de mallas múltiples 653

4. Resuelva A 1 v 1 = J1 de manera exacta. Wj <- f/ -[vj_ 1 - 2vj +0+il/h2 (1�j�n)


1
5. Añada 1 a i. Aplique un operador de extensión E; y añada el término de (1 < ·< n-1)
,i - .
Jj ;- W2¡ =) = 2
corrección: vi<-vi +E;vi -l _ Aplique k veces el método iterativo al sistema
t,
A;v; = comenzando con el vector vi en curso.
h<-2h
n <- (n -1)/2
6. Si i = m, envíe v" a la salida y deténgase. Si i < m, continúe en el paso 5.
end
En breve daremos un seudocódigo para aplicar el V-ciclo en el método de las mallas vl = -f(l/2)/8
múltiples. (Para ahorrar espacio, utilizarnos una notación abreviada para los ciclos.) En
for i = 2, 3, ..., m do
la malla g¡, el incremento h es igual a 2-i. Se utiliza un área de trabajo temporal w para
guardar cantidades intermedias. El operador de restricción que se utiliza en el código h <- h/2
es el más simple de todos: por lo cual se copian las componentes con índice par en el n<-2n+l
vector correspondiente a la siguiente malla más burda, como en la ecuación (13). Todo Wzj ,-v;-1 (O�j�n;l)
lo demás en el código concuerda con el algoritmo que acabamos de bosquejar. Se utiliza
el método iterativo de Gauss-Seidel. Si esto le interesa, puede guardar en este algoritmo Wzj-1 <- [vj:¡ +vJ- 1 ]/2 (1�j�n; l )
los elementos del vector vj en un arreglo bidimensional tal como V(J, I) <- vj, de modo vJ<-vJ+wj (O�j�n+l)
que las columnas del arreglo correspondan a los valores en la malla en sus distintos for p = 1, 2, ..., k do
niveles. 2
vj <- [vj_ 1 +vJ+i -h J/J/2 (1�j�n)
El seudocódigo se utilizó en varios experimentos numéricos con el problema modelo
end
{
previamente mencionado:
U
11
= COSX end
u(O) = u(!) = O output v'j' (O�j�n+l)

En la ecuación (5) se encuentra la solución de este problema. Por ejemplo, hacemos Recnento de operaciones
m = 7, lo que corresponde a h = I / 128 en la malla más fina. Se utilizaron varios
valores de k para determinar el efecto de este parámetro en el error. Aquí con error nos Examinemos el V-ciclo tal como está expuesto en el código para hacer una es­
referimos a: timación del costo computacional en el algoritmo de mallas múltiples. Contemos las
operaciones aritméticas que hay en él.
máx lu(xj) -vjl,
O;;éj;;én+I En la parte descendente del proceso se utilizan m mallas diferentes. En la malla gi
hay 2¡ puntos, zi incógnitas y zi ecuaciones. En el método de Gauss-Seidel se necesitan
en donde u es la solución exacta, Xj = jh y vm es la solución aproximada sobre la malla más cuatro operaciones para actualizar una variable. Por lo tanto, en cada malla utilizaremos
fina que produce el algoritmo cuando h = 2-m. Cada vez que el número de iteraciones 4k2; operaciones en la iteración. El cálculo del residuo ocupa 5 · zi operaciones, mientras
de Gauss-Seidel se incrementó en una unidad el nuevo error fue aproximadamente igual que el operador de restricción ninguna. Así, en la i-ésima malla se realizan (4k+ 5)zi
a dos quintas partes del error anterior. Esto fue cierto para 3�k�8. Los subsiguientes operaciones. El total para las m mallas es:
incrementos de k produjeron reducciones menos dramáticas del error, con factores de m
reducción aproximadamente iguales a 0.6, 0.7, ... , 0.9.
¿(4k+5)ZÍ � (4k+5)2m+l = (8k+10)2m .
i=l

inputm, k Un recuento similar para la parte ascendente del V-ciclo arroja un total de aproximada­
n ,- 2m -1 mente (8k+4)2m operaciones. Por consiguiente, el ciclo completo comprende cerca de
h <-1/(n+1) l 6(k+1)2m operaciones.
¿Cuáles serán los correspondientes números para un problema bidimensional como,
vj<-O;J/<-0 (l�i�m.O�j�n+l)
por ejemplo, v2u = f(x, y) en el cuadrado unitario? Cada ecuación en la discretización
JT ,_ !Uhl (1�j�nl que nos es familiar incluye cinco incógnitas, y la actualización de cada una de ellas con el
for i = m, m -I, ..., 2 do procedimiento de Gauss-Seidel ocupa cerca de seis operaciones. El número de variables
for p = 1, 2, ... , k do en la i-ésima malla es igual a (zi)2 , pues ahora son dos las variables. De este modo,
2 podemos ver que la consecuencia más importante en nuestro recuento es el cambio de
vj <- [vj_ 1 +vJ+I - h f/]/2 (1�j�n) 2m a 4m _ El factor que multiplica a 4m será un poco mayor que 16(k +1), pero seguirá
end siendo lineal en k.
654 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.9 Métodos rápidos para la ecuación de Poisson 65 5

Las observaciones precedentes nos muestran que el esfuerzo computacional es una Problema modelo
función exponencial de m (el número de mallas) y una función lineal de k (el número
El problema modelo se describe como sigue:
de iteraciones predeterminadas). Esta conclusión es válida para cualquier número de
dimensiones. Q = {(x, y): 0 < x < 1, 0 <y< l}
{ uxx +Uyy=J(x,y) enQ ( 2)
SERIE DE PROBLEMAS 9.8 u(x,y)=Oenan

l. En la fase de interpolación se computa w a partir de v y después se reémplaza v por w. Emprendemos una discretización haciendo:
Encuentre un código eficiente para hacer esto, utilizando sólo el arreglo v.
h=l/(n+l) X¡=ih Yj =Jh (O� i, J � n+1).
'2. En el texto se menciona un experimento numérico diseñado para poner de manifiesto la
reducción de errores de diferentes frecuencias. Repita el experimento.
Después, una manera de tratar el problema (2) que nos es familiar introduce
'3. En el texto se expone un experimento numérico para resolver el problema modelo sobre una
sucesión de mallas más finas. Repita el experimento. Vij ::,; u(x¡, Yj) Íif = f(x¡, Yj).
'4. Repita el experimento numérico que se expone en el texto utilizando el algoritmo del V-ciclo.
Una versión discretizada de nuestro problema es la siguiente:
'5. Programe el algoritmo del V-ciclo para el siguiente problema bidimensional:
h-2(v¡+J,j -2 vij+vi-1)+h-2(v;,j+I -2 vif+vi.j-1) = A (3)
Ux, + U y = f(X, y) Q<X< J Ü<y< l
{ u(x, y) y O En la ecuación (3), el dominio de las variables i yj es { 1, 2, ... , n}. La mayoría de los
= en la frontera.
términos de la ecuación (3) son desconocidos, pero por las condiciones en la frontera
Ponga a prueba su programa paraf(x, y) = 2x(x - 1)+2y(y - !). La solución exacta es necesitamos:
u(x, y)= xy(l - x)(l - y). VOj =Vn+I,j =V¡Q=V;,n+I =Ü. (4)
'6. En el primer código de esta sección, ajuste los ciclos de modo que vo yvn+I (que se mantienen La forma tradicional de proceder en esta coyuntura es resolver el sistema (3) con un mé­
constantes) no se estén copiando de un lado al otro. todo iterativo. Aquí hay n2 ecuaciones y n2 incógnitas. El esfuerzo computacional para
'7. Realice algunos experimentos numéricos con el primer código de esta sección a fin de resolver este sistema utilizando, digamos, sobrerrelajamiento sucesivo, es O(n3 log n).
determinar si hay un valor óptimo para k, el número de iteraciones de Gauss-Seidel. La propuesta alternativa que incluye transformaciones rápidas reducirá este esfuerzo a
O(n 2 logn).
'8. Generalice los códigos de esta sección de modo que se les pueda aplicar al problema u"(x) =
f(x), u(a) =ay u(b) = �-
Transformada sinusoidal rápida de Fourier
Se buscará una solución del sistema (3) con la siguiente forma:
9.9 Métodos rápidos para la ecuación de Poisson
Vif=2)kj sen ik$ (O� i,j � n+l), (5)
k=l
La ecuación de Poisson en dos variables es:
donde$=rc/(n+1). En este caso los números Vkj son incógnitas cuyo valor queremos
U;o:+Uyy = j(x, y). (1) determinar. Ellos representan la transformada senoidal de Fourier de la función v. Una
vez determinados los números Vkj, la transformada senoidal rápida de Fourier sirve para
En un problema característico de la física que incluya a esta ecuación, buscaríamos una calcular vij eficientemente.
función u que satisficiera a la ecuación (1) en una región abierta Q y que cumpliese Cuando las Vij de la ecuación (5) se sustituyen en la ecuación (3), el resultado es:
algunas condiciones predeterminadas en la frontera den (que denotamos con BQ). La
función f está definida enn. Í:)kj [sen(i+l)k$-2 sen ik$+sen(i-l)k$]
Recientemente se han resuelto problemas de esta índole con algoritmos muy rápidos, k=I
aplicando el análisis de Fourier. Estos novedosos métodos se valen de la transformada (6)
rápida de Fourier. Aquí expondremos un ejemplo ideal para ilustrar las innovaciones +¿senik$[vk.j+l -2vkj +vk.j-1] = h2fu.
que condujeron a estos nuevos algoritmos. k=I
656 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales 9.9 Métodos rápidos para la ecuación de Poisson 657

Para simplificar la primera sumatoria utilizamos la identidad trigonométrica que se ex­ no se satisfarán a menos que agreguemos dos ecuaciones:
pone en el lema 2 (más adelante). Al mismo tiempo, introducimos la transformada
senoidal defg :
¿ vk senik$ = ¿ vk.n+l senik$= O
n n
(O�i�n + 1) (9)
f¡¡ = ¿Jk} senik$. k=l
o
k=l
k=l

El resultado es: Ahora la ecuación (9) afirma que los vectores

(vio, v20, ... , vn.o)


tvk} (-4senik$) (sen ;$)
(v1.n+t, v2,n+t, ...• í\n+1l
2

k=l
(7) deben ser ortogonales a las filas de una matriz que es (por el lema 1) no singular. Por
consiguiente, tenemos que definir:
¿ senik$(v1<,¡+1 -
n n
+ 2vkj + vk.¡-1) = h2 ¿Jk} senik$
Vko = vk.n+t =O
k=l k=l
(1 � k � n).
Por el lema 1 (más adelante), la matriz con componentes sen ij$ es no singular. Por
consiguiente, podemos deducir de la ecuación (7) que: LEMA 1 La matriz A de (n -1) x (n -1) y componentes

• (- 4sen2 k$ ) + Vk,j+l
• · • 2+: 1 2
- 2V + Vk,j-1 = h Jkj· (8) ªki = (2/n) / sen n (1� k � n -1, l �j� n -1)
kjrc
Vkj 2 kj

Todo parece indicar a primera vista que la ecuación (8) es un sistema de n2 ecuaciones con es simétrica y ortogonal. En consecuencia, A2 = l.
n2 incógnitas ligeramente distinto del original. No obstante, una inspección minuciosa
revela que en la ecuación (8) k se puede mantener fija, y el sistema resultante de n Demostración Calculemos un elemento arbitrario de A2.
ecuaciones se puede resolver directamente con suma facilidad, pues es tridiagonal. Por
consiguiente, para una k fija, las incógnitas en (8) forman un vector kvrc ·v
"""" akvav¡ = (2/n) """"
n-l n-l
A2kj = L., L., sen - sen L!:.
(vki, vk2, ... , vkn)
n n
=! v�
( -) j)rc
= (1/n) � [cos v k n j rc -cos v k + ]
(
en lR". El procedimiento que acabamos de utilizar separa el sistema original que consta de n
n2 ecuaciones, enn sistemas con n ecuaciones cada uno de ellos. Un sistema tridiagonal v=l
den ecuaciones se puede resolver con O(n) operaciones (de hecho, se requieren menos de
= (ljn)Re ;(eiv$ _ eive )_
[n-l l

10n operaciones). De este modo, podemos resolver n sistemas tridiagonales a un costo (10 )
de 10n2 operaciones. La transformada senoidal rápida de Fourier utiliza O(n2 log n)
operaciones cuando se aplica a un vector con n componentes. Por consiguiente, la carga
computacional completa en el método rápido de Poisson es O(n2 log n). donde$= (k -j)rc/n y 8 = (k +J)rcjn.
Si k = j, entonces$ = O y 8 = 2k rc/n. Además, 8 no es un múltiplo de 2rc, ya que
1�k � n -l . debido a ello, en este caso:
Detalles adicionales
Aún debemos comentar algunos detalles en el análisis precedente. En primer lugar, , einíl -1
Akk = (ljn)Re [n - -.- -] =1
observe que a partir de la ecuación (5), las condiciones en la frontera 8 e' -I

VQj = Vn+l.j = Ü (O�j�n+l) Aquí hemos notado que eine = ei2k� = l.


Si k "'j, ni$ ni 8 es un múltiplo de 2rc, y la serie geométrica de la ecuación (iO) se
se satisfarán automáticamente sin necesidad de imponer restricción alguna a los coefi­ puede sumar con la fórmula usual. El resultado es:
cientes Vkj. No obstante, las demás condiciones en la frontera
/'o/
At = (1/n)Re [ eit _-1l - eiª -1
- l
J
einS

V¡Q = Vi,n+l = Ü
Capítulo 10
658 Capítulo 9 Solución numérica de ecuaciones diferenciales parciales

e l. De este modo, At =O. PROGRAMACIÓN LINEAL


in $ = inB =
Sik-j es par, tambiénk+j es paryen este casoe
Por el contrario, si k-j es impar, también k+j es impar. En este caso, i* =e
ina =-1.

De esta manera, lo que queremos demostrar es: Y TEMAS RELACIONADOS


[ -2
Re--- --
é$-1 eí8 -1
=0
-2 ] (11)
*10.l Convexidady desigualdades lineales
*10.2 Desigualdades lineales
Para probar lo anterior, note en primer lugar que para z * O, 10.3 Programación lineal
10. 4 El algoritmo símplex
Re m =Re[�] =Re[zl/izl2-

Después aplique este resultado a z = e


i$ -1, obteniendo

1 cos$-1 cos$-1 1
Re[ $ ] = = =- °
ei-1 (cos$-1)2+sen2$ 2-2cos$ 2
Esto es cierto en particular para$ = 8, de modo que los dos términos en la parte izquierda *10.1 Convexidad y desigualdades lineales
de la ecuación (11) son idénticos. 1B

LEMA 2 sen(A +B) -2sen A+ sen(A -B) = -4 sen A sen2 ! La teoría de las desigualdades lineales mantiene un estrecho paralelismo con la más
conocida teoría de las ecuaciones lineales. En este capítulo desarrollaremos los conoci­
mientos básicos en este tema e indicaremos algunas de sus aplicaciones.
Demostración Utilice las siguientes identidades trigonométricas:

sen(A ±B) = sen A cosB ± cosA sen E Conceptos básicos

1 -cos 2A = 2sen2 A Todos los vectoresy las matrices que se utilizan en este tema son reales (no com­
plejo), pues la teoría hace un uso esencial de la estructura de orden de la recta real. Si x
11 yy son dos puntos (vectores) en R", escribimos:

x� y siy sólo si x¡ � y¡ (1 � i � n).

Análogamente, definimos x � y, x > y o x < y comparando las componentes correspon­


dientes de los dos vectores. Cabe señalar que x > y no es lo mismo que (x� y & x * y).
* *
(La razón es que x y no significa que x¡ y; para toda i; sino más bien, que x; y; *
para alguna i.)
Un sistema de m desigualdades lineales débiles en n variables se puede escribir
como:
Ax�b, (1)

donde A es de m x n, x de n x 1y b de m x l . Las desigualdades individuales de este


sistema son:
a¡¡X¡ +a¡zXz + · · · +a;nXn � b; (1 � i � m)

A¡x� b¡,

659
*10.1 Convexidad y desigualdades lineales 661
660 Capítulo 10 Programación lineal y temas relacionados
l relativa a esta Con base en la figura 10.l se puede ver que si se invierten las desigualdades en el sistema
donde A¡ es i-ésimo vector fila de la matriz A. Una pregunta esencia (2), el sistema que resulta de ello es inconsistente. Asimismo, haciendo algunos cambios
de su consist encia. La pregun ta es: ¿hay un vector x tal que
clase de sistemas es la algorit mo para muy simples a la matriz de coeficientes, podemos exhibir un sistema con un conjunto
mos dispon er de un
Ax ;:;; b? Si el sistema es consistente, nosotros querre solución no acotado. (Por ejemplo, al sustituir -3 con -1 en la tercera desigualdad.) La

¡
desigu aldade s lineale s con sistema s más
encontrar sus soluciones. Es posible considerar gráfica también nos muestra que el conjunto solución es convexo, un hecho que vamos
generales: a fundamentar de inmediato. (La teoría básica de los conjuntos convexos se puede
¿a,jX¡;:;; b¡ (1 � i � m1) consultar en la sección 6.9.)
He aquí algunos teoremas relativos a los conjuntos solución.

t
¡=1

TEOREMA 1 El conjunto solución de un sistema de desigualdades lineales es un conjunto convexo.


aijXj > b ¡ (m¡ + 1 � i � m),
¡=! Demostración El conjunto solución correspondiente a una desigualdad arx � � es convexo, como lo
pero por simplicidad sólo consideraremos el sistema (1). muestra el cálculo:
un ejemplo muy
Para darnos una idea de lo que debemos esperar consideremos ar(9x + (1 - 9)y) = ear x + (1 - 9)ary � 9� + (1 - 8)� = �.
sencillo en el que n = 2 y m = 3:
donde x y y son dos de sus elementos. El conjunto solución de un sistema de desigualda­
X¡ +Xz;:;; 2 des lineales es la intersección de los conjuntos solución de las desigualdades individuales
X¡ - x2 � -1 (2) que lo forman. Este conjunto también es convexo, pues la intersección de una familia
{
de conjuntos convexos es a su vez un conjunto convexo. 11
-3x¡ +x2;:;; -6
Para cada conjunto S de un espacio vectorial hay un conjunto convexo mínimo que

u -:] [::] � [=ll


o lo contiene. Dicho conjunto es la cáscara convexa de S y se suele denotar con co (S).
TEOREMA 2 (Teorema de separación l) Sea X un conjunto en R" cerrado y convexo. Si p es un punto
que no está en X, entonces para algún punto v ;: O tenemos:
Los puntos que satisfacen x 1 +x2 ;:;; 2 se encuentran de un lado de la recta x 1 +x2 = 2. Al
(v,p) < ínf(v,x)
graficar esta línea y las otras dos que se originan en el sistema (2), podemos determinar el xEX
conjunto de puntos que lo resuelven (al que en adelante llamaremos conjunto solución).
Este conjunto es el triángulo que se muestra en la figura 10.1. Demostración Como p no está en X, O no está en el conjunto trasladado
X - p == {x- p:x EX}.
X1
Aplique ahora el lema 2 de la sección 6.9 al conjunto X -p. Al examinar la demostración
de dicho lema, nos daremos cuenta de que hay un vector v ;: O con la propiedad

- Xz 2: -1 (v,x -p) � (v, v) (x EX).


Lo cual nos conduce a:
2
(v,p) � (v,x) - llvll (x EX). 11
I> X¡ El teorema de separación, tal como se ha demostrado, es cierto en los espacios de
Hilbert, y algunas de sus versiones son válidas en espacios más generales. En seguida
citamos una de sus aplicaciones geométricas. Se define un semiespacio cerrado en lR"
como un conjunto de la forma
{x: (a,x);:;; t.},
donde a E lR", A. E lR, y a* O.
TEOREl\ilA 3 Todo conjunto convexo y cerrado de R" es la intersección de todos los semiespacios
Figura 10.1. cerrados que lo contienen.
662 Capítulo I O Programación lineal y temas relacionados *I O. I Convexidad y desigualdades lineales 663

Demostración Sea X un conjunto convexo y cerrado. Es obvio que X está


contenido en la intersección Demostración La demostración es por inducción sobren. Sin = l , el conjunto convexo es un intervalo
de tod os l o s semiespacios cerrados que l o co ntienen. Para la inclusión inversa, suponga cerrado y acotado. Los puntos extremos son precisamente los extremo s del intervalo, y
que p es un punto que no está en X. Por el teorema de separació n, hay un vector v,;,. O es obvio que el teorema es cierto en este caso.
tal que: Ahora suponga que el teorema es cierto para dimensi ones menores que n, y sea K
(v, p)< ínf(v, x) un conjunto convexo y compacto en un espacio de dimensión n. Sean E el c onjunto de
xEX puntos extremos de K y H la cáscara convexa de E. Queremos demostrar que H = K.
Haciendo Dado que K es convexo y E e K, tenemos que H e K. Como K es cerrado, H e K.
A.= ínf(v,x) Falta demostrar que esta última inclusión no es propi a Suponga que p es un punto
xEX de K \ H. Haciendo un desplazamiento (x H x - p), podemos suponer que p = O.
podemos ver que Como O � H, el teorema de las desigualdades homogéneas (teorema 3 de la sección 6.9)
X e {x: (v,x) � A.} implica que hay un vector v tal que (v, u) < O para toda u E H. Sea

1111
y nos encontramos ante un semiespacio que no contiene a p. c = sup{ (v,x):x E K}.
y cerrado y Y un conjunto
TEOREMA4 (Teorema de separación II) Sean X un conjunto convexo
convexo y compacto (en lR" ). Si X y Y no se intersec an, entonce s hay un vector v E JR" Como O E K, tenemos que c � O, y como K es compacto, este supremo se alcanza en
algún punto. Esto significa que el conjunto
tal que:
ínf (v,x) > sup(v, y) K' = {x E K: (v,x) = c}
xEX yEY

Demostración En primer lugar, vamos a demostrar que el conjunto Z = X - Y e


s cerrado. Sea Zk E Z
es no vacío. El conjunto K' también es compacto, convexo y de dimensión n - I, pues
de Z? Haga Zk = Xk - Yk, con Xk E X y
se halla sobre un hiperplano. Por hipótesis de inducción, K' tiene al menos un punt o
y sup nga que -+ z. ¿E s z un elemento
o Zk
E Y. En tales extremo z. Vamos a demostrar que z también es un punto extremo de K. Suponga que
Yk E Y. Por compacidad de Y, hay una subsucesión convergente Yk, -+ y z = 9z1 + (! - 9)z2, con O< e< 1 y z; E K. En tal caso:
z C m X es cerrad o , z + y E X. P o r consiguiente,
circunstancias, Zk, -+ z y Xk, -+ +y. o o

z EX- Y. e= (v, z) = 9(v, Z¡) + (! - 9)(v, z2) � 9c + (1- 9)c = c.


Cabe señalar que O � X- Y, pues la igualdad O = x - y (con x E X y y
E Y)
m , un ráp cálculo nos
implicaría que X y Y tienen un punto en co mún. A simi s o ido
Por consiguiente, (v, z 1) = (v, z2) = c, y Z; E K'. Pero z es un punto extremo de K',
de separación
muestra que Z es convexo. En consecuencia, podemos aplicar el teorema por l o que z1 = z2• Esto demuestra que z E E. En consecuencia, (v, z) < O � e; una
I a Z, concluyendo que hay un vector v tal que: contradicción. 11
(v, O)< ínf (v, x- y) La importancia de lo s puntos extremos en los problemas de optimización proviene
xEX,yEY del hecho de que al buscar el mínimo de una función lineal en un conjunto convexo y
compacto, podemos limitar la búsqueda a sus puntos extremos. He aquí el resultado
Si e denota al ínfimo de la desigualdad, tenemos que (v, x- y) � s parax E X y y E Y. formal:
Esto nos lleva de inmediato a la desigualdad que se afirma en el enunciado del teorema.
11 TEOREMA 6 Sea K un conjunto en lR" convexo y compacto y seaf una función lineal sobre lR". El
máximo y el mínimo de f en K se alcanzan en los puntos extremos de K.
Puntos extremos
Demostración Sea
Un punto extremo de un conjunto convexo K es un punto x E K que no puede
c = sup{f(x):x E K}.
escribirse en la forrnax = 9y + (1 - 9)z con O< e< 1, y E K, z E K y y* z. En otras
palabras,x no es un punto interior de algún segmento rectilíneo contenido en k. Una En vista de que f es continua y K es compact o, el conjunto
definición equivalente es la siguiente: x es un punto extremo de un conjunto convexo
K, si K \ {x} es convexo. Por ejemplo, los vértices de un cubo son sus únicos puntos K' = {x E K:f(x) = c}
extremos. Lo s puntos extremo s de una esfera sólida son los puntos de su frontera.
El siguiente teorema es la versión para dimensiones finitas del teorema de Krein­ es no vacío. Este conjunto es además convexo y compacto. En consecuencia, por el
Milman. (Con relación a este último, vea, po r ejemplo, Royden [1968].) teorema de Krein-Milman, K' po see un pun to extremo z. Por un razonamiento similar
al de la demostración del teorema de Krein-Milman, concluimos que z es un punto
TEOREMA 5 Todo conjunto convexo y compacto en un espacio de dimensión n es la cerradura de la extremo de K. La demostración para el mínimo de f en K se sigue al considerar el
cáscara convexa del conjunto de sus puntos extremos. máximo de -f. B
664 Capítulo 1O Programación lineal y temas relacionados *10.2 Desigualdades lineales 665
El teorema precedente es válido para todo conjunto convexo y compacto en cual­ 20. Demuestre que en JR• la cáscara convexa de un conjunto abierto es abierta.
quier espacio topológico lineal localmente convexo. También es cierto para todo fun­
21. Demuestre con un ejemplo que la cáscara convexa de un conjunto cerrado no es necesaria­
cional continuo y convexo. Tal como se ha enunciado, el teorema de Krein-Milman mente cerrada
es cierto en cualquier espacio topológico lineal localmente convexo. En el caso de la
22. Para un subconjunto X de un espacio lineal de dimensió!!..V,osiblemente infinita, sea H. el

LJ:1
dimensión finita no es necesario tomar la cerradura. Vea, por ejemplo, Holmes [1972, conjunto de todos los puntos que se pueden escribir como 2...,� 1 8;x;, con 8; i;; O, }:;=1 8;=
pág. 82]. 1 y x;EX. Demuestre que Hn es convexo, y que éste conjunto es co (X).
23. Denotemos con xy al segmento rectilíneo que une a los puntos x y y en JR". Dado un conjunto
SERIE DE PROBLEMAS *10.1 Xo, defina X1, X2, ..., Xk con la igualdad Xk+I = U{xy: x EXk, y E Xk}. Demuestre que
X2•+1 = co (Xo).
1. Demuestre que todo conjunto convexo y cerrado es la intersección de todos los semiespacios
abiertos que lo contienen. Un semiespacio abierto es un conjunto de la forma {x : (a, x) > "'}.
2. Demuestre que pEco(X) si y sólo si OEco(X - p). *10.2 Desigualdades lineales
3. Demuestre que si S y T son conjuntos convexos. entonces 1,,S, S + T y S - T son convexos.
(El conjunto S + T se define como el conjunto de todas las sumas s+I, dondesES y tE T.)
Sea X un espacio vectorial sobre el campo de los números reales. Un funcional lineal
4. Demuestre que si L es un mapeo lineal y K un conjunto convexo, entonces L(K) es convexo.
(El conjunto L(K) se define como el conjunto de todos los puntos L(x), donde xEK.) es un mapeo lineal de X en R Una desigualdad lineal es un enunciado de la forma
f(x) � a, en donde f es un funcional lineal. Una sola desigualdad de este tipo tiene
5. Demuestre que
CO(A.S) = A.CO(S) co(S + T) = co(S) + co(T). como conjunto de soluciones un semiespacio {x:f(x) � a}. Aún más interesantes son
los sistemas de desigualdades lineales, f¡(x) � CL; (i E !), donde I es un conjunto de
6. Sea X un conjunto convexo y cerrado en un espacio de Hilbert. Demuestre que si p rf. X, índices no necesariamente finito.
�EX y ¡¡p- �11 = dist(p, X), entonces (p - �. x - �) � O para todaxEX.
7. Sea U un coajunto compacto en lRn. Demuestre que si el sistema de desigualdades linea­
les (u,x) > O, con u en U, es inconsistente, entonces el sistema contiene un subsistema Sistemas de ecuaciones homogéneas
inconsistente de a lo sumo n + 1 desigualdades.
Comenzamos con un conocido teorema del álgebra lineal que atañe a los siste­
8. Demuestre que si K es un conjunto convexo y cerrado de un espacio de Hilbert, entonces mas de ecuaciones lineales homogéneas, y después pasamos a uno análogo relativo a las
para cada punto p rf. K hay un único punto kEK lo más cercano a p. desigualdades. Denotamos con!° al espacio nulo de un funcional!:
9. Demuestre que el mapeo p >-> k definido en el problema 8 es no expansivo. De esta manera,
si (p i , k1) y (p2. k2) son dos parejas de mapeos, entonces llk1 - k2II � IIP1 - P2ll- f° = {x E X:f(x) = O}
10. ¿Puede un conjunto acotado tener un complemento convexo?
Así mismo, l(f1,f2, •.• Jm) representa al espacio generado por el conjunto
11. Demuestre que si los conjuntos X; son convexos, entonces co(X1 U · · · U Xk) es el conjunto {!1 .f2 , .•. ,
fm},
de todas las combinaciones convexas =l 8;X; en que X;E X;.
r:
12. Demuestre que la cerradura de un coajunto convexo es convexa. TEOREMA 1 (Dependencia lineal) Para todo conjunto defuncionales lineales, las siguientes
propie­
13. Sean K un conjunto convexo, p un punto interior de K y q cualquier punto de K. Demuestre dades son equivalentes:
que si O< 8< 1, entonces 8p + (1 - 8)q es un punto interior de K. (iJ f :J n¡=i f?
º

14. Demuestre que si el sistema de desigualdades (u,x) > O para u E U es consistente, también (ii) f E l(f¡, h, ...,Ím)
lo es el sistema (u, x) > O para u Eco( U).
15. Demuestre que si S y T son compactos y convexos, también lo es co(S U T). Demostración La implicación (ii) =} (i) es muy fácil de demostrar. Sif =
¿�=l A¡f¡ y x E íl1:i ffl,
16. Demuestre que si X es un conjunto de JR• acotado, entonces para toda p entoncesf¡(x) = O para toda i y por endef(x) = O.
Para la recíproca, procedemos por inducción sobre m. Sea m = 1 y suponga que
sup{IIP -xll:xE X}= sup{IIP -xll:xEco(X)}.
f :) fi. Sif1 = O, entonces Ji°= X. En consecuencia,!º = X y f = O. En este caso
º

17. Demuestre que si U es un conjunto convexo y compacto y el sistema (u. x) > O es inconsis­ concluimos quef E l(f1 ). Sif1 ,t:: O, tome un punto y tal quefi(y) = 1 y un punto
tente (u E U), entonces lo mismo es cierto para el sistema (u, x) > O, con u en el conjunto arbitrario x de X. Tenemos quef1[x - f¡(x)y] = f¡(x) - f¡(x)f¡(y) = O, de modo que
de puntos extremos de U. x - f1(x)yEfi°, Por hipótesis, x - f1(x)y Ef. Por consiguiente,f(x) -f¡(x)f(y) =
O
18. Demuestre que todo conjunto convexo en el plano es la unión de todos los triángulos que of = f(y)f¡, de modo quef E l(f¡).
tienen sus vértices en él. Para el paso inductivo, suponga que el teorema ya se demostró para un entero
19. Sea X un subconjunto finito de JR• con al menos n + 2 puntos. Demuestre que X se puede my que
escribir en la forma X1 U X2 teniendo co(X 1) n co(X2) = O. !° :J n¡;tJ;°.
temas relacion ados *10.2 Desiguald ades lineales 667
666 Capítulo JO P rogr amación line al y
o e X. Si denotamos la restricci ón a Y con l a Como O E C, tenemos que k ;;;; O. Si k < O, elija una u E C tal q ue k ;;;; (v, u) < O.
Sea Y == fm+i· Se trata de un sub espaci d
Para toda t positiva tene mos tu E C. Si t es sufici entemente grande , tendre mos que
notación f\Y, tendre mos:
(f\Y) º :J nf=1 ( .fi\Y) (v, tu) < k, lo que constituye una contradicción. Por consigui ente, k = O y

P or hipótesis de inducción, m
(v,f) < O ;;;; (v, u)
f\Y == 2)-¡.fi\Y, para u E C. Se sigue que f(v) < O ;;;;f¡(v), y (i) es falso. 11
i=l El teorema de Farkas tiene la siguiente formulación en términos de vectores y
las '/e . Ah r tenemos dos ecuaciones eq uivalentes, (f - matrices.
eligiendo convenientemente
o a
a,
· Utilizando el caso m == l de este teorem
¡

I:;=1 t..;f¡)\Y == O y (f -I:;=1 1..;f¡)° :) fm+i TEOREMA 3 !.As siguientes propiedades son equivalentes par a toda matriz A y todo vector c:
concluimos q ue:
(i) P ara toda x, si Ax � O, entonces crx � O.
m

f - I>¡f¡ == A.m+tÍm+l•
i=l
(ii) Par a alguna y, y� O y c=Ary.
11
para alguna A.m+l · Sistemas consistentes y sistemas inconsistentes

Desigualdades lineales
A continuación p resentamos un análogo no homogéneo del teorema anterior. E n
es lineales. En él hacemos uso de la siguiente terminología: un sistema de desigualdades f¡(x) � a.;
e teorem a p ara desigualdad
Pasemos ahora al análogo exacto de est acios: se dice que es consecuencia de otro sistema g;(x) ��¡, si cada solución del segundo
vez de los espacios nulos de es
tos funcionales, utilizamos los semiesp también lo es del primero. De este modo:
¡+ == {x E X:f(x) � O}. {x: g;(x) �� ¡ para toda i} e {x:f¡(x) � a.; para toda i}
do
fz, . . . , fm, consideramos el cono genera
En vez del espacio lineal generado por f1 , TEOREMA 4 (Teorema no homogéneo de Farkas) Si una desigualdad lineal f (x) �a. es consecuen­

{t
por ellos: cia de un sistema consistente de desigualdades lineales

C{f¡,f2, ....fm}=
�o}.
t..;f¡: t..; g;(x) � �¡ (1 ;;;; i;;;; n),
,=l
lentes p ara los funcionales li­ entonces, p ara un a colección 8; �O adecuada, tendremos que
son propied ades equiva
TEOREMA2 (Farkas, 1902) Las siguientes n n
neales f, f¡:
Ci)r :) nf=,K
f = ¿8;g; y ¿8;�¡ �a.
i=l i=l
(ii) f E C(f1.f2, ... .fm)
Demostración Considere el sistema
suponga q ue
Demostración Si (ii) es verdad, entonces (i)
se sigue con facilidad. Ciertamente , g¡(X) - A.�¡� 0 (t..> 0). (1)
m Si un par (x, 1..) resuel ve el sistema (1), ento nces g¡(x) � A.�¡ y g;(x/1..) � �¡. Según
f = 'Et..¡f¡ nuestra hipótesis,f(x/1..) � a.. Por consiguiente,
i=l
O. f (x) - 1..a. � O. (2)
para toda i, y es ob vio tambiénf(x) �
con t..;� O. Si x E n7=¡Jt, entonces f¡(x) �O mostración b ajo la hipótesi s de que
una de
Para la implicación inversa, daremos da. Esto nos muestra que la desi gualdad (2) es una consecuenci a del sistema (1). Ahora
li al d l forma f(x) == (v, x) para una v apropia considere el sistema
X == iR". Todo funcion al ne es e a
p ,
, ....fm ). Por el teorema de se aración
Suponga que f r/:. C, donde C es el cono C(f1,f2
g;(x) - A.�¡ �O (t.. �O). (3)
hay un vector v tal que: Si (2) es una consecuen cia de (3), la forma homogénea del teorem a de Farkas es aplicable,
(v,f) < ínf (v, u) concluyéndose que :
uEC

¿ 8¡(g;; -�,) + 8o(O; 1)


n
Sea U; -a.)= (8 ¡ �0),
k=ínf(v,u)
uEC i=l
668 Capítulo JO Programación lineal y temas relacionados *10.2 Desigualdades lineales 669
donde(!;-a.) denota simplemente el par considerado como un vector. Esta conclusión Como en este cálculo x puede ser cero, tenemos que (y, b) < O. Falta verificar que
se puede escribir en la forma: A Ty � O. Sí esto último es falso, entonces para algún índice u, (A ryla. < O. Sea x el
n n vector con coordenadas Xj = AOa.j . Entonces,
!= ¿0¡g¡ a.= ¿e¡�¡-0o � ¿9¡�¡.
i=l i=l T
i=l (y,Ax) = _¿(A y )jXj =A(A TY)a. -+ -oo (conforme A ....., +co)
i=l
Éste es el enunciado que queremos demostrar. Sin embargo, aún no hemos tenninado, ya
que puede suceder que (2) no sea consecuencia de (3) aunque sí!o sea de (1), como ya se Para alguna 'J... apropiada, debemos tener en este caso:
demostró. En tal caso, hay una solución de (3) que no resuelve ni (1) ni (2). Tal solución
es un par (u;:l) con 1 = O, o de lo contrario resolvería (1) y por ende (2). De este
(y, Ax) < (y, b),
modo, g¡(u) � O> f(u). Por hipótesis, hay un vector v tal que g¡(v) � �i- Seleccione
un número positivo). tal quef(u + 1v) < Aa.. Esto es posible porque cuando 1 l O, la lo que constituye una contradicción. Por consiguiente, y es una solució
parte derecha se aproxima a O mientras que la parte izquierda se aproxima al número
n de (5). 11
negativo f(u). Tenemos una contradicción entre las hipótesis, pues f(u/1 + v) < a y TEOREMA 7 Si el sistema
g¡(u/'J... + v) � g;(v) � �¡. 11 Ax�b x�O (6)
es inconsistente, entonces el sistema
Formas matriciales y vectoriales
La versión matricial y vectorial del teorema precedente es la siguiente: Ary �0 b ry < O y�O (7)
es consistente.
TEOREMAS Si el sistema
Ax�b
Demostración Sí (6) es inconsistente, también
es consistente, y el sistema
rx<a.
Ax�b c
Ax+z=b x�O z�O (8)
es inconsistente, entonces el sistema
es inconsistente, ahora bien, podemos escribir (8) de la siguiente manera:
Ary=c y"?.O

[:]�O.
/b � a.
[A I] =b (9)
es consistente.

TEOREMA 6 Si el sistema Por el teorema (6), el sistema


Ax=b x�O (4 )
T
�O bry< O
es inconsistente, entonces el sistema [� ]y (10)
Ar y � 0 bry � O (5)
es consistente. Este último es el sistema (7 ) enmascarado. 11
es consistente.
SERIE DE PROBLEMAS *10.2
Demostración Si (4) es inconsistente, entonces l. Demuestre que para cualquier matriz A de m x n, alguno de los siguientes sistemas
= {Ax:x � O} consistente, pero no ambos: es
b1K (i) Ax = 0 X ;;; 0 X ;é 0
(ii) ATy > o.
Como K es cerrado y convexo, podemos aplicar el teorema de separación de la sección
10.1, concluyendo que hay un vector y tal que 2. Demuestre que para cualquier matriz A de m x n, alguno de los siguientes sistemas es
consistente, pero no ambos:
(y, b) < ínf(y,Ax) (i) Ax � Ü X ;;; 0 X ;é Ü
x�O T
(ii) A y >O y >O.
;;; ;;;
670 Capítulo 1 O Programación linealy temas relacionados 10.3 Programación lineal 671

(Nota: éste es conocido como el teorema de Ville, 1938.) Recordamos al lector que si x=(x 1, x 2, •.. , x.)7 , entonces la desigualdad vectorial
3. Sea P.= {x E IR":x f: Oy :z::;;=1 x1=l}. Demuestrequepara toda matrizA dem x n, o x O significa X¡ O para cada iE{1, 2, ... , n}. De la misma manera, la desigualdad
Ax f: Oparaalguna x E P. oATy;; Opara alguna y E Pm.
4. Con la notación delproblema 3, demuestrequepara toda matrizA de m x n, Ax�b

máx mín lAx ;; mín máx lAx.


significa que
xEPn. yEPm yEPm xEP 11

¿aijXj�b¡ para toda iE{l,2, . ..,m}.


5. Si U es la matriz dem x n constituida exclusivamente por unos, demuestre que para toda j=l
x E Pn y toda y E Pm,
/(A-W)x =/Ax-1,. Pasemos a describir alguna terminología de uso común. En nuestro problema el
conjunto factible es el conjunto
6. (El teorema minimax de la teoría de juegos) Demuestreque
K={x ElR":Ax�b, x;;; O}.
máx mín lAx=mín máx lAx.
xEPn. yEPm yEPm xEP11
El valor del problema es el número
7. Demuestreque si las desigualdades Ax f: b no tienen solución, entoncespara alguna y sucede
lo siguiente: y;;; O, Ary=O y bry=l. v= sup{crx:x EK}.
8. Demuestre que si la desigualdad Ax ;;; b no tiene soluciones no negativas, entonces las Un punto factible es cualquier elemento de K. Una solución o punto factible óptimo
desigualdades ATy � Oy bry> O tienen una solución no negativa. es cualquier x E K tal que crx = v. La función x 1-+ crx = I:J=l CjXj es la función
9. Demuestre que si el sistema Ax =O, x ;;; O, x * O es inconsistente, entonces el sistema objetivo. En vista de que el problema está enteramente determinado por los datos A, b, e,
ATy< O es consistente. nos referimos a él como el problema (A, b, e).
!O Demuestre que si el sistema Ax ;;; O, x ;;; O, x * O es inconsistente, entonces el sistema
Ary< O, y y;;; O es consistente. Técnicas de conversión de problemas
11. Demuestreque si el sistema Ax =O, x> O es inconsistente, entonces el sistema Ax � O es
consistente. Casi todo problema relativo a la optimización de una función lineal con variables
sujetas a desigualdades lineales se puede convertir al formato de la programación lineal.
12. Demuestrequepara toda matriz den x (n + 1), el sistemaAx;;; O, x * O es consistente.
Hacerlo requiere a menudo alguna de las siguientes ideas:
13. Demuestrequeparatoda matrizA dem x n, el sistema Ax> O es consistente siy sólo si el
sistemaAry =O, y> O es inconsistente. (i) Si lo que se quiere es minimizar crx, el problema es el mismo que maximizar
-?x.
14. Encuentre una condición necesariay suficienteparaque el conjunto
(ii)To.da restricción de la forma arx;;; � es equivalente a -arx ;g; -�.
K={x E IR":Ax;; b}
(iii)Toda restricción de la forma arx= � es equivalente a elx ;g; �, -arx ;g; -�.
sea acotado. (iv) Toda restricción de la forma ¡ar xi ;g; � es equivalente a arx ;g; �, -arx � �.

-
15. Demuestreque alguno de los signientes sistemas es consistente, mas no ambos: ( v)Si la función objetivo incluye una constante aditiva, ésta no tiene ningún efecto
(i) Ax=b sobre la solución. De este modo, el máximo de crx + � se logra en el mismo
(ii) AT y=O bT y=1 punto que el máximo de crx.
(vi) Si un problema no requiere que una variable Xj sea no negativa, podemos

[ - ;;;
reemplazar Xj por una diferencia entre dos variables que se requiere que sean
103 Programación lineal no negativas, digamos, Xj=Uj vj.
Ejemplo Convierta el siguiente en un problema de programación lineal en forma estándar:
El término programación lineal no se refiere a la programación de una computadora
sino a la planeación de un negocio o de un proyecto económico. Se ha asignado a este Minimizar: 7x1-x 2 +x 3 -4
término un significado técnico específico: quiere decir encontrar el valor máximo de
X¡ +Xz X3 2
una función lineal de n variables reales sobre un conjunto poliédrico convexo en JR" .
Elegimos la siguiente forma estándar del problema: 3x¡ +4x2 +x3=6
Restricciones:
Problema (Problema de la programación lineal) Sea e EIR", b EIR y A E IRmx •. Encuentre el
m lx1 -2t2 +3x3 J � 5
valor máximo de crx sujeto a las restricciones x EIR", Ax�by x;;; O. X¡;;; Ü, Xz�Ü
67 2 Capítulo JO Programación lineal y temas relacionados 10.3 Programación lineal 673

Respuesta Sean u1 = x¡, u2 = -x2 y u3 - u4 =x3. Ahora tenemos: Si la igualdad se cumple en este caso, entonces x y y son soluciones de sus respectivos
problemas.
Maximizar: -7u1 -u2 -u3 + u4
-U¡ + U2 + U3 - U4 ;:¡; -2 Demostración Los puntos x y y satisfacen
3u¡ -4u2 +u3 -u4;:¡; 6
x;;;o Ax;:¡; b yfO -Ary;:¡; -c.
-3u¡ +4u2 -u3 +u4;:¡; -6
Restricciones:
u¡ + 2u2 + 3u3 - 3u4;:¡;5 De ahí que
CT ;:¡; (ATylx =lAx;:¡;/b = bTy
X
-u¡ - 2u2 - 3u3 + 3u4;:¡;5
Los valores v¡ y v2 de los dos problemas deben por consiguiente satisfacer
u¡ f O, u2 f O, u3 f O, u4 f O
11 CT ;:¡;V¡;:¡; bT
X y

Un problema (A, b, e) de programación lineal puede o no tener solución. Para -bTy;:¡; Vz;:¡; -CT . X
comenzar, el conjunto factibleK puede que sea el conjunto vacío, en cuyo caso no hay
solución alguna. Si el conjunto factible no es ni vacío ni acotado, puede suceder que la Si CTX= bT , está claro que CT = V¡ = bT y = -Vz.
X ill
función objetivo no tenga cota superior enK. En este caso v = + oo y no hay solución y

El teorema precedente se utiliza con frecuencia para estimar el valor v1 de un


alguna. Si K es vacío, v = -oo y tampoco hay solución. Si K es no vacío y acotado, problema de programación lineal. Si se conoce un punto factible x, y se conoce un
entonces hay al menos una solución. Esto se debe a que en este caso K es compacto punto factible del problema dual, entonces crx ;:¡; v1 ;:¡; br define un intervalo
(cerrado y acotado en JR"), y la función objetivo (que es continua) alcanza su supremo y

que contiene a v1.


y

enK.

!
TEOREMA 2 Si un problema de programación lineal ysu dual tienen puntosfactibles, entonces ambos
Problema dual problemas tienen solución, siendo el valor de una solución el negativo de la otra.
Podemos asociar a cualquier problema (A, b, c) de programación lineal otro pro­
blema (-Ar , -e, -b). Este problema se llama problema dual del original. Por ejemplo, Demostración De acuerdo con el teorema 1, es suficiente con demostrar que hay unax y una y tales que
el problema
XfÜ Ax;:¡; b yfO - AT ;:¡; -c
y CT f br .
X
Maximizar: 3x1 - 2x2 y

7x1 +x2;:¡; 18 Ciertamente, un par (x, y) de este tipo nos proporciona una solución x para el problema
-3x 1 +5x2;:¡; 25 original, y una solución y para su dual. Nuestra tarea es demostrar que el siguiente
Restricciones: sistema de desigualdades lineales es consistente:
6x1 -x2 ;:¡; 13

tiene el siguiente problema dual:


X¡ f O, X2 fÜ
[_�T -} ][;] ;:¡;
T
[-i] [;] f [�]-

Maximizar: - 18y1 - 25y2 - 13y3 Supongamos que el sistema es inconsistente y tratemos de deducir una contradicción.
-7y¡ + 3y2 - 6y3;:¡; -3 Por el teorema7 de la sección 10.2, el siguiente sistema es consistente:
Restricciones: { -y¡ -5y2 +y 3;:¡; 2
Y1 f O, Y2 f O, Y3 f O
AT O
[ O -A
-cJ
b
u
[ ]>
� = O
[º]
La relación entre un problema de programación lineal y su dual es el tema de la teoría
de la dualidad. A continuación desarrollamos algunos de sus resultados sobresalientes. [bI' -cT 0] [�] < 0
TEOREMA 1 Si x es un puntofactible del problema de programación lineal (A, b, c), y si y es un punto
factible del problema dual (-Ar , -c, -b), entonces
CrX;:¡;lAx;:¡; bry.
[�] fo.
674 Capítulo 10 Programación lineal y temas relacionados 10.4 El algoritmo símplex 615

En las fórmulas anteriores u y v son vectores y¡,., una constante. Supongamos que (u, v, A) Demostración Si x y y son soluciones, entonces por los teoremas 1 y 2,
satisface a este sistema. En tal caso
lb=bTY=lAx=CTX=XTC.
Aru-A.e�O - Av+A.b�O brU- CrV < Ü
u�O v�O A,� o. Esto nos da la ecuación l(b -Ax)= O. Como y � O y b -Ax � O, concluimos que
y¡(b¡ - (Ax);)= O para cada i. De este modo, (Ax); = b; siempre que y; > O. La otra
1
Si A > O, entonces A-1 v es factible para el problema (A, b, e) y A.- u lo es para condición se alcanza con un argumento de simetría.
el problema dual, (-A r, -e, -b ). En consecuencia, por el teorema 1 tenemos que A la inversa, suponga que y¡(b; - (Ax);) = O y x;(c; - (Ary);) = O para toda i.
cr(";..- 1 v);; br (";..- 1 u) y br u - crv � O, lo que constituye una contradicción. Tenemos que:
bry=lb=lAx=xTATy=XTC=CTX.
Si";.. = O, entonces Aru � O � Av. Tomando un punto factible x del primer
problema y un punto factibley del problema dual, contradecimos una desigualdad previa: Por el teorema 1, x y y son soluciones de sus respectivos problemas. 11111

cr v;; (A yf v=lAv;;O;; (A ulx= (Ax);; u b=b u


r r ur r r
11
SERIE DE PROBLEMAS 10.3
TEOREMA 3 Si un problema de programación lineal o su dual tiene solución, también el otro la tiene. l. Convierta los siguientes problemas en las formas de programación lineal estándar y dual:
(a) Minimizar: 3x1 +x2 - 5xi + 2
Demostración Como el dual del dual es el problema original, sólo es necesario demostrar uno de los Restricciones: X¡ � x2 x2 � O 4x3 - x1 � O x1 +x2 +x3= O
dos casos. Suponga que el problema dual (-A , -e, -b ) tiene una solución yo. En este (b) Minimizar: lx1 +x2 +xi l
r

caso el sistema de desigualdades Restricciones: x1 - x2= 5 x2 - xi= 7 x1 � O x¡ � 2


(c) Minimizar: lxd - lx2I
- bry�-b yo
r
-Ary;;-c y�O Restricciones: x1 +x2 = 5 2x1 + 3x2 -xi � O xi � 4

es inconsistente. El sistema que se obtiene al omitir la tercera desigualdad es, por razones
obvias, consistente. Escribamos el sistema inconsistente en la forma: 10.4 El algoritmo símplex

[�r]Y� [�] bry;;brYo· A través de distintas técnicas estandarizadas todo problema de programación lineal puede
transformarse en uno de la forma siguiente:
Aplicando el teorema no homogéneo de Farkas de la sección 10.2, concluimos que el
sistema Forma estándar (Segundaforma estándar) Maximice cr x sujeto a las restriccionesAx=by x�O, en
donde X E in, e E in , b E im y A E imxn .
[A I] [:] = b [xr ur ] [�] �b yo
r

[:] [�]
� Conceptos básicos
es consistente. Por consiguiente, Recuerde que la expresión crx define a la función objetivo. Queremos notar que
si un problema de programación lineal tiene restricciones de la forma
Ax + u=b xr e�brYo x�O u�o.
Ax�b,
Se sigue que
Ax;;b CT X�bryo X� 0. entonces, con la introducción de un vector u�O ( cuyas componentes se llaman variables
de holgura), podemos escribir:
Por el teorema 1, x es una solución del problema original. 11111
Ax+u= b,

TEOREMA 4 Sean x y y, respectivamente, puntos factibles de un problema de programación lineal obteniéndose de esta manera la segunda forma estándar que acabarnos de ver.
y su dual. Estos puntos son soluciones de sus correspondientes problemas si y sólo si Para un problema en la segunda forma estándar, el conjunto factible es
(Ax);= b; para cada índice i tal que y¡> O y (Ary)¡= e¡ para cada índice i tal que
X¡ >Ü. K = {x E in:Ax = b, x � O}.
s 10.4 El algoritmo símplex 677
676 Capítulo JO Programación lineal y temas relacionado
Demostración Sea E el conjunto de puntos extremos de K. Para cada x E E, l(x) C {1, 2, ... , n}, de
Para cada x E K, definimos el conjunto de índices para los que las componentes de x
modo que I: E -+ 2 { I,2.....n}. (La expresión 2s denota a la familia formada por todos los
son positivas como sigue:
subconjuntos del conjunto S.) La transformación I definido de esta manera (sobre E) es
uno a uno. Para convencernos de esto tomemos x, y E E con x * y. En tal caso:
l(x) = {i: 1 � i � n, y X¡ > O}.

Las columnas de la matriz A se denotan con A1, A2, ... , A•. La ecuación b = Ax = ¿x;A; = L x;A;
i=l iEl(x)

L y;A¡.
Ax = b
b =Ay = ¿y;A¡ =
i=I iEl(y)
se convierte en n
¿x;A; = b. Sil(x) = l(y) fuese cierto, el conjunto {A;: i E l(x)} no sería linealmente independiente.
i=l La posibilidad de mapear inyectivamente al conjunto E en 2 { I,2.....n} nos demuestra
Ahora podemos enunciar un importante teorema. que el número de elementos de E no puede ser mayor que 2". 1111
El algoritmo símplex de Dantzig [1948] consta de dos partes. En la primera, se
TEOREMA 1 Sea x E K. Las siguientes propiedades de x son equivalentes: determina un punto extremo inicial xOl de K. En la segunda, a partir de xOl , se genera
(i) x es un punto extremo de K. una sucesión de puntos extremos de modo que la función objetivo se incremente con
(ii) {A;: i E l(x)} es linealmente independiente. cada punto generado. Denotemos la sucesión con Jll, x(2l, .... Se sigue que cTJI) <
cT}2l< .... Si el problema no tiene solución, esto se descubre durante el desarrollo del
Demostración Suponga que (ii) es cierto. Vamos a demostrar que (i) también es cierto. Sea x = algoritmo. Si el problema de programación lineal tiene solución, el algoritmo produce
eu +(1-8)v, donde u E K, v E K y O< e< l. Para cada i rf. l(x) tenemos que: un punto extremo x(kl que lo resuelve; es decir, maximiza a la función objetivo.

O= X¡= 8u; +(1-8)v¡. Forma abstracta

Si recordamos que u; ;;; O y v; ;;; O, llegamos a la conclusión de que u¡ = v; = O para Vamos a describir en su forma abstracta la segunda parte del algoritmo. Asumimos
i rf. l(x). Tenemos en consecuencia que: la siguiente hipótesis:

Suposición (Suposición de no degeneración) Cada punto extremo del conjunto factible K tiene
O= Au -Av = ¿(u; - v;)A; = ¿ (u¡ - V¡)A;. exactamente m componentes positivas.
i=l iEl(x)
Suponga que x es un punto extremo de K. Por el teorema anterior, el conjunto
de K.
por (ii), concluimos que u; = v;. Por consiguiente, x es un punto extremo {A;: i E l(x)} es linealmente independiente. En consecuencia, por la hipótesis de no
Ahora suponga que (i) es cierto. Si degeneración, se trata de una base de Rm . (Es por esto que en la literatura se refieren a

L W¡A;
x como puntofactible básico.) Debe haber coeficientes Dij tales que:

L D;jAi
= O,
iEl(x) Aj = (1 �j � n).
iEl(x)
para toda i rf. l(x), haga w; = O. Obviamente,
Si i rf. I(x), simplemente hacemos Dij = O. Por consiguiente:
L (X¡± A.W¡)A¡ = b. n
iEl(x)
Aj= ¿DgA;
i=l
Dado que x; > O para cada i E l(x), podemos elegir una A i: O suficientemente pequeña
para que x; +1cw; > O y x; - A.W¡ > O para i E I(x). En tal caso u = x+lw y v = x - lw
son dos puntos factibles. Como x = �(u+v) y x es un punto extremo de K, concluimos A = ADT.
que u= v y que w = O, con lo cual qÜeda demostrado (ii). 111
Defina
d = Dr c,
COROLARIO El conjunto factible K sólo tiene un número finito de puntos extremos.
678 Capítulo 1O Programación lineal y temas relacionados 10.4 El algoritmo símplex 679

donde e es el vector que aparece en la función objetivo. Observe que D y d dependen Por el teorema 1, es suficiente con demostrar que el conjunto
de x, y que cambiarán a lo largo del algoritmo.
Para todo índice q i I(x) y toda A. E lR {A;: i E l(x)U {q} \ {p}}
n n
es linealmente independiente. Suponga que
b = Ax = ¿x;A;+A.Aq-11. ¿D;q A;
i=l í=l L p¡A¡+P A = o conpp = O.
L (X¡- A.D +A.O; )A¡
q q
n
iE/(x)
= iq q
i=l Si P q = O, entonces la ecuación se reduce a

=¿Y;A; ¿M; = ü.
i=l iEI(,:)

Por lo tanto, La independencia de {A;: i E /(x)} implica quep; = O para i E l(x). Por consiguiente,
Ay = b,
todas lasp¡ son cero en este caso. Podemos pasar en consecuencia al caso en quepq ;:: O.
donde y = x- 11.Dq + 11.dq . En este caso Dq denota a la q-ésima columna de D. Nuestro Por homogeneidad, podemos suponer quepq = -1. Nuestra ecuación ahora se lee:
propósito es por ahora elegir q y A. de modo que y sea un punto extremo de K (es decir,
y � O) y CTy > CTX. Aq = ¿ p¡A; con PP=O
En vista de que q i l(x), Dqq = O y Xq = O. En consecuencia, Yq = A.. Como y iEl(x)
tiene que ser un punto factible, necesitamos que A. � O. Ahora calcule:
También tenemos:
L C¡X¡- A. L C¡D; +A. L C¡O¡ ¿ D; Aí = L D; A;.
n n n n

C y=
T
q q
Aq = q q
i=l i=l i=l i=l iEl(x)

=c x-11.cT Dq +A.cq
T
De la independencia lineal de {A;: i E /(x)} inferimos quep¡ = D;q , No obstante, esto
=CT X+A.(Cq- dq) no puede ser cierto, puespP = O y Dpq > O, como ya lo habíamos señalado. Por lo tanto,
pq debe de ser cero. Hemos demostrado que y E K y es un punto extremo.
Para incrementar el valor de la función objetivo debemos elegir q de modo que cq > dq . Nos resta un detalle por demostrar; a saber, que si e ;;;; d, entonces x es una solución.
Si e � d, no hay q alguna que satisfaga esta condición y el cálculo termina: x es una Sea u un punto factible. Entonces Ax = b = Au = A(DTu). Se sigue que x = Dru,
solución. De lo contrario, lo usual es elegir q de modo que cq - dq sea lo más grande pues Ax y ADTu son combinaciones lineales de {A;: i E l(x)}. En este caso tenemos la
posible. De ahora en adelante, q representa un valor fijo. condición cT u � dr u=cTDu=cr x, que queríamos demostrar.
Debemos elegir A. de modo que A. > O e !(y) tenga a lo sumo m elementos. Por
definición, sabemos que !(y) C l(x) U {q}. Como l(x) tiene exactamente m elementos, Ejemplo Vamos a mostrar cómo trabaja el algoritmo símplex en un caso concreto. El problema

{
seleccionamos A. de modo que uno de los términos x; - 11.D;q sea cero y los demás que se va a considerar es el siguiente:
mayores o iguales a cero. Observe primero que si D;q � O para 1 � i � n, entonces
y E K para toda A.> O. Por la fórmula precedente (para cTy), podemos ver que en este Maximizar: F(x) = X¡ +2x2+X3
caso lími.-oo cTy = +oo. En consecuencia, no hay solución y la función objetivo no X¡ +Xz+X5 = 1
está acotada en K. Si D;q > O para uno o más valores de i, podemos considerar que A. se Restricciones: x1 +x3 +X4+ xs =1
incrementa a partir del valor cero. Al principio, x;-11.D;q > O para i E l(x). Algunos de
estos términos son decrecientes, y cuando alguno de ellos se vuelve cero, tomamos la A. X¡ � O, (1 � i � 5)
correspondiente. Formalmente,
Solución Los datos son:
A. = mín { �;/ X¡ > 0, D;q > O}
A= [
1 1 O O 1
1 O 1 1 1]
b=
[ i] CT = (1, 2, l , O, 0).
Habiendo determinado plenamente a y de esta manera, queremos verificar que se trata
de un punto extremo. Sea, en primer lugar, A.= xp /Dpq , donde pes tal que Xp > O y Comenzamos con x = (O, 1, O,!, Of e l(x)={2, 4}. Observe que {A2,�} es una base
Dpq > O. En tal caso, de JR2 • En consecuencia, por el teorema 1, x es un punto extremo del conjunto factible,
I(y) e l(x)U {q} \ {p}. o un punto factible básico.
680 Capítulo JO Programación lineal y temas relacionados
10.4 E l algoritmo símplex 681

º]
Cada columna de A es una combinación lineal de A2 y A4. De hecho tenemos que Por consiguiente tenemos:
A1 = A2 + A4, A2 = A2, A3 = A4, A4 = A4 y As = A2 + A4. Por consiguiente, la

º]
matriz D es
o o o o Maximizar: F(x) = (6, 14,O,O, o/ x
1 1 O O 1 2 1 1 O 12
D= [O O O O O . [
2 3 Ü 1 0 X= 15
[21]
Restricciones:
1 O 1 1 1 {
o o o o o x � (:,x:x3�x4,�d � 0
El vectordT es una combinación lineal de las filas D; de D:
Nuestro primer vector será x = (O,O,12,15,2 ll. Todos estos datos se compendian en
dr = ,rD = ¿ c;D; = D1 +2D2 +D3 = (2,2,O,O, 2f la primera tabla.
i=l 6 14 o o o o
El vector e - d viene dado por: 2 1 1 o o 12
c-d= (-1,O, 1,O,-2/; 2 3 o 1 o 15
q = 3 y sólo una componente es positiva. El vector x = ')..,Dq ( en donde Dq denota la
q-ésima columna de D) es:
7 o o 1 21
o o 12 15 21
x - ')..,Dq = (O,1,O, l, o/ - ')..,(0,O,O,1, o/ = (O,1, O,1 - "'· o/.
Cada paso del algoritmo símplex comienza con una tabla. El primer renglón contiene
Tomamos').., = 1; el vector y es: coeficientes que corresponden a la función objetivo F. El valor en curso de F(x) = cTx
y = x - Wq+ 1cd3 = (O, l,1,O,O/. se despliega en la esquina superior derecha. Los m renglones siguientes de la tabla repre­
sentan un sistema de ecuaciones que engloban las restricciones de igualdad. Recuerde
Ahora repetimos el proceso con y en el lugar de x. Sin entrar en detalles, diremos que que se puede efectuar operaciones elementales con los renglones en este sistema sin
en el siguiente paso d = (3,2, l, l. 3f. Como e � d, y es una solución y F(y) = 3. fl alterar el conjunto de soluciones. El último renglón de la tabla contiene al vector x en

¡
curso. Observe que F(x) = cTx se calcula fácilmente utilizando el primero y el último
Método tabular renglón. La tabla precendente es de la siguiente forma general:
En la práctica el método símplex se suele llevar a cabo con una tabla en la que se
exhiben los datos. La tabla se va modificando en los pasos sucesivos conforme a ciertas CT o F(x)
reglas. Ilustramos esta forma de organizar el algoritmo con un pequeño ejemplo: A I b
Maximizar: F(x) = 6x¡ +14x2 x ( no básico) x ( básico)
2x¡ +Xz � 12
2x¡ +3x2 � 15 Reglas para las tablas
Restricciones:

¡
X¡ +7Xz � 21 Las tablas que se utilizan en el método símplex deben satisfacer cinco reglas, a
saber:
x1 � O, x2 � O
1. El vector x debe satisfacer la restricción impuesta por la igualdad Ax = b.
Al preparar el algoritmo símplex introducimos variables de holgura y reescribimos el 2. El vector x debe satisfacer la desigualdad x � O .
problema como sigue:
3 . Hay n componentes de x ( denominadas variables no básicas) que son cero. Las
Maximizar: F(x) = 6x1 +14x2 +Ox3 +Ox4 +Oxs m componentes restantes son por lo general distintas de cero y se denominan
2x1 +x2 +x3 = 12 variables básicas. (Aquí n y m corresponden a los valores asociados con el
problema original, antes de la introducción de las variables de holgura.)
2x¡ +3Xz +X4 = 15
Restricciones: 4. Cada una dejas variables básicas figura en un solo renglón de la matriz que
x¡+7xz +xs = 21 define las restricciones.
X¡ � O, X2 � O, X3 � O, X4 � O, X5 � O , 5. La función objetivo F se debe expresar sólo en términos de las variables no
básicas.
682 Capítulo 1O Programación lineal y temas relacionados 10.4 El algoritmo símplex 683

Ilustración reanudada ahora x 1 es la variable que se convertirá en básica. Por consiguiente, mantenemos fijo
En la primera tabla del ejemplo anterior las variables básicas son x 3, x4 y x5• Las en cero el valor de X5 y dejamos quex 1 se incremente tanto como sea posible. Se aplican
variables no básicas son x1 y x2. Podemos ver en el acto que la tabla cumple con las las siguientes restricciones:
cinco reglas. 0 � X3 = 9 - (13/7)X¡
En cada paso examinamos la tabla en curso para ver si el valor de F(x) se puede
0 � X4 = 6 - ( l l/7)X¡
incrementar convirtiendo una varible no básica en básica. Podemos ver en el ejemplo
que si x 1 o x2 se incrementan ( ajustando x3, x4 yx s en compensación), el valor de F(x) 0 �7X2 = 21 - X¡.
también se incrementa. En vista de que el coeficiente de x2 es mayor que el coeficiente Éstas nos llevan a
de x 1 en F, los incrementos unitarios de x2 acrecentarán a F(x) más rápido que los
incrementos unitarios de x 1• Por consiguiente, mantenemos fijo en cero el valor de x 1 X¡� 63/13 X¡� 42/11 X¡� 21,
y permitimos que x2 se incremente tanto como sea posible. Se aplican las siguientes La nueva variable básicax 1 puede crecer hasta42/11 , y los nuevos valores dex3, x4 yx 2
restricciones: se calculan con base en la tabla o a partir de las ecuaciones restrictivas recién expuestas.
0 �X3 = 12- Xz
El nuevo vector x es:
0 �X4 = 15- 3x2 · x = (42/11. 27;11, 21;2, o, of
0 �X5 = 21 - 7Xz Ahora las variables no básicas son X4 y xs. Para satisfacer la regla 5 utilizamos la
Éstas nos dicen que sustituciónx1 = (7/11)(6 - x4). En tal caso,
X1 � 12 X2 � 5 X1 � 3 . F(x) = 6x1 -2xs +42
La más restrictiva d e ellas e s la desigualdad x2 � 3 , que sólo nos permite aumentar el = (42/11)(6 - x4)- 2xs +42
valor de x2 hasta 3 . Los valores de x3, x4 y xs se obtienen con las tres desigualdades =- (42/1 l)x4- 2xs +714/11
restantes. En consecuencia, el nuevo vector x es
No es necesario terminar la tercera tabla, ya que los coeficientes de F son negativos.
X = (0, 3, 9,6, 0/. Esto significa que lax en curso es una solución, pues ninguna de las variables no básicas
x4 yxs se puede convertir en básica sin disminuir el valor de F(x). Por consiguiente, en
Las nuevas variables básicas sonx 2,x3 yx4. Ahora debemos determinar la siguiente tabla el problema original el valor de máximo es F(42/11, 27/11) = 630/11 .
en conformidad con las cinco reglas anteriores. Para satisfacer la regla 5, advertimos
que x2 = (21-x5)/7. Cuando se hace la sustitución en F, encontramos una nueva forma Resumen
para la función objetivo:
Basándonos en este ejemplo y en las explicaciones dadas, podemos resumir el
F(x) = 6x¡ +14x2 trabajo que hay que desarrollar con cada tabla como sigue:
= 6x 1 +14 (21 - xs)/7 = 6x 1 - 2xs +42 1 . Si todos los coeficientes de F ( es decir, el primer renglón de la tabla) son �O,
entonces el vector x en curso es la solución.
Para satisfacer la regla4 , se aplican algunos pasos de la eliminación gaussiana ( opera­ 2 . Elija la variable no básica que tenga el coeficiente positivo más grande. Esta
ciones elementales con los renglones), utilizando a7 como el elemento pivote; todo esto variable se convierte en una nueva variable básica. Llámela Xj.
con el propósito de eliminar a x2 de todas menos de una de las ecuaciones. Al terminar 3 . Divida cada b¡ por el coeficiente aij que tiene la nueva variable básica en ese
este trabajo, el paso ! llega a su fin. El paso 2 comienza con la segunda tabla, que es: renglón. El valor que se asigna a la nueva variable básica es igual a el menor
de dichos cocientes. Por ejemplo, si bk/ akj es el menor, hacemos Xj = bk / akj,
6 O O O -2 42 4 . Utilizando a akj como elemento pivote, engendre ceros en la columna j de A
aplicando algunos pasos de la eliminación gaussiana.
13/7 O O -1/7 9
11/7 O O -3/7 6 Estimación del costo
7 O O 21 En las aplicaciones prácticas del algoritmo símplex hay un enorme abismo entre
O 3 9 6 o los límites teóricos de su costo y el costo real. La cota superior para el número de pasos
en el algoritmo símplex es el coeficiente binomial

(;).
La situación que se presenta es similar a la que había en un principio. Las variables no
básicas sonx1 y x5• Cualquier incremento de xs disminuirá el valor de F(x), por lo que
684 Capítulo 10 Programación lineal y temas relacionados
10.4 El algoritmo símplex 685
pero en la práctica lo usual es que dicho número de pasos no sea mayor que 2m. Aun en
un problema de modestas dimensiones, digamos cuando n = 300 y m = 100, el valor 6. Resuelva el siguiente problema utilizando el méto
do de las tablas:
del coeficiente binomial es astronómico. De hecho, si utilizamos la fórmula de Stirling
(Prob. 1), tenemos que Maximizar: F(x) = 6x1 + 14x2
X¡+Xz � 12

00
(3100) = � ::,; 4x 10s1_ Restricciones:
2x1 +3x2 � 15
200!100!
X¡+ 7x2 :<,; 21
Otros algoritmos {X¡ S Ü Xz S Ü X¡ ?,; Ü
En 1984 Karmarkar anunció un nuevo algoritmo para la programación lineal (Kar­
Cambie la segunda desigualdad por 2x1 +3x2 15 y
s
repita la solución.
markar (1984]). Se afirma que este nuevo algoritmo es superior al algoritmo símplex
cuando el número de variables es superior a 15,000.
El costo del algoritmo de Karmarkar es una función polinomial del tamaño del
problema, mientras que el costo del algoritmo símplex es una función exponencial de
dicho tamaño. Esto en sí mismo no significa que el nuevo algoritmo sea mejor, pero es
un signo alentador. Un algoritmo previo, debido a Khachian, también tiene una función
de costo de tamaño polinomial, pero el algoritmo nunca ha competido con el método
símplex en virtud de que los pasos sucesivos requieren una precisión cada vez mayor.

SERIE DE PROBLEMAS 10.4


l . Todo el mundo debería conocer la fórmula de Stirling, la cual nos da una estimación del
valor de n ! , a saber:
n!�&[;J".
Utilice este medio para derivar la fórmula de aproximación:

n! �[ n ]"[n-m]m
V�
(n) =
m m!(n - m)! � ;=-;¡:; -;;¡- ·
2. Utilice el problema 1 para verificar que

n��) �4x 1081•

3. Resuelva el siguiente problema utilizando el método súnplex recién delineado y unas tablas
como las presentadas en esta sección:
Maximizar: F(x) = 2x1 - 3x2
2x1 +5x2 � 10
Restricciones: { x1 + 8x2 ;:; 24
xi s Ox2 s O
4. Considere la descripción que se hace del algoritmo súnplex en esta sección. Demuestre que
si x es una solución, entonces e � d.
5. (a) Vuelva a resolver el primer ejemplo de esta sección utilizando una tabla
(b) Vuelva a resolver el segundo ejemplo de esta sección utilizando el algoritmo súnplex.
RESPUESTAS Y SUGERENCIAS

Problemas 1.1
2. Tome 5 = ie 4. s =2 6. 1/1001 8. Tome 8 =a 10. Continua 12.f(O) = !
16. Sugerencia: Usen veces el teorema de Rolle 20. Jxl < 0.0144 24. n > 2m -1 26. n =12
29. Sugerencia: dr /dx =x'(I +Inx) 30. [1 + !(x -1t) 2]/e 32(a). (sen ! )/48 � 0.009988
34. n =21

Problemas 1.2
l. Sugerencia: (i) Si Inf(x) es creciente, también lo esf(x). (ii) Sif'(x) > O, entonces! es creciente. (iii)
lnx se define como J; t- 1 dt 8. k =4 17. Sugerencia: Use el teorema del valor medio y suponga que F
es una función continuamente diferenciable. 19(a). o(x1) 20. 8 < n 23. eh =1 + O(h) 25. O(X"+1 )
30. [-(� -1)± ,j(x3 -1) 2 -4e'(cosx -1)]/(2e") 32. Sugerencia: Escribax =y-&sen yy considere
el comportamiento de y -a sen y cuando y -+ +oo y cuando y -+ -oo. Use el teorema de la función implícita
para la segunda parte de este problema. 33. dy/dx =I/(x +y -I)

Problemas 1.3
l. 2[1, 1, 1, 1, . ..] - !(2, 4, 8, 16,.. .] ll(a). [-1, 1, -1, 1, ...], [2, 4, 8, 16, ...], [1, 4, 12, 32, . . .]
ll(b). Un = (1 +./2i)", Vn =(I -./2i)" 13(a). Xn+I =n!x¡

Problemas 2.1
3. 5x10- 1 2 6. (n-1)2-24 12.error relativo =8x2-29 14. Sí 17. 232 -29 20.errorabsoluto =2-22
28(b). l/(1 +224) 32. Sí

Problemas 2.2
l. 5 bits 5. -2 sen2(�x) lO(a). l/(vx2 +1 + x) lOG). Sugerencia: Ésta es la función sen h- 1x.
21. Jxl ;?; v7/3 25. -!x2(3 + !x(7 + ix(15 + �x))) 26(a). Sugerencia: Vea el problema 19 de la
sección 1.2 26(b). !

Problemas 2.3
l. Xn =A(9/10)" +B(l l/10)" donde A = 1 y B = O 3. Sugerencia: A partir de la definición deberá ser
capaz de demostrar que Jln(x)J � l. 4. Sugerencia: Determine si En (x) es creciente o decreciente como
función den. 6(a). a.x/(x -1) 6(c). x cotx 6(d). x 15. Sugerencia: Los números IYn(l)I deberán
crecer rápidamente. Tal vez sea usted capaz de demostrar una desigualdad semejante a IYn O)/Yn-1 (l)I > n.

Problemas 3.1
3. Sugerencia: Considere primero el caso [ao, bo] = [O, 1] y piense acerca de la representación binaria de
00

la raíz. Respuesta: r = a0 +(bo -a0) ¿)n 2-n 7. No necesariamente 8. n > 1 + [1og(bo -ao) -
n=I
loga]/(log 2) 10. 1.9 ll(a). 2-n+2 ll(b). z-n+l

Problemas 3.2
2. l.39174520027 3. Xn+I = !(xn +q/xn) 5. Sugerencia: Considere la serie de Taylor paraf(r +en)-
7. 1/y 13. Xn+I = i(2xn +R/x;) 16. 33 pasos 19. C =1 -f'(sn )/f'(Xo), S =1

Problemas 3.3
7. 5 8(a). l.391745200271
688 Respuestas y sugerencias Respuestas y sugerencias 689

Problemas 3.4 Problemas4.4


O, ) o 12. No 16. 171 20. Sugerencia: Repase la demostración de la desigualdad dada, y encuentre las
1. e= la - bl/(l -1.) 4(b). 1/2 4(d). v'3/2 9.f(f,) = O,J"(f,)= f'Cf, *
+ !O+ ,/1 + 4p) condiciones para que se dé la igualdad. 21. IIAll co= 10 28. K00 (A)= n2n-I 41(b). K2 (A)= 2
12. Sugerencia: Dése cuenta de que Xn+I =
7991 31. Sugerencia: Escoja
x =
0.423853
sta:
26.
Respue
orden
X ,
Primer
,jp
19. Cuarto orden 23(a). Primer orden 23( d ).
n

cual IF'(x)I < 1.. 33. Xn+l = g(xn)


). de tal forma que IF'(r)i <). < 1, y un intervalo centrado en r en el
Problemas4.5
7. Es falso. Encuentre el contraejemplo.
donde g(x) = - ln(j - !x )
2

Problemas4.6
Problemas4.2 10. La desigualdad del triángulo es falsa. 1 4. Sugerencia: Considere (x, Ax) y (Ax, x).
9. Algoritmo (2): !n(n + 1) mult./div., !n(n- 1) suma/resta. 12. L= [ ::

e�J
for i = 1, 2, ..., n do
Problemas5.1
[o a/l11 6. m(n2 + 1) 1 5. Sugerencia: Considere las matrices de la forma [ � �]
17. xq, = (bp, - :z=;:( ap,q1 x'1i ) / ap,q,
U=
O (b- al2i/l11)/l22}
1
º]
29. L = [ 3 1O O , D= [ O -1 O
2
end
o º] 32.L=[! �} 1 U= [
·
0.8944i
Problemas5.2
0.4472
_0_4472 _0_8944¡]
. El
5. Sugerencza: teorema de Gerschgonn . 27. No mvertible.
. .
-2 5 1 O
31. Sugerencia: La matriz unitaria en el ejemplo 1 de esta sección debe servir.
O -3

35. =
L u �}, U= [ �
;}
[º º] [_
1 5 _2
[' 00] [" º]
Problemas5.3

1 [15} 45. LU= [� �][� ;} 9.t=(u,x)/(x,x) 16.A=QRdondeQ= O O 1 , R= O -4]


38.L= 4 2 O , U= O 3 2 41. X= ,/f.5 3 1 O O O O
O 3 2 O O 3
ll o o o º]
O 1 O O O
24. Sugerencia: Recuerde que dos matrices G y H son equivalentes por filas si existe una matriz F no singular
para la cual G= FH.

51. L= O 2 1 O O Problemas5.4
O 4 2 1 O l(b). P= [5], D= [5 O], Q= 25
[2 1]
l 2
1
4 0 0a.l

Problemas4.3
1
-1
O
1
O
0 0
º]-1 1 O
0 1 3 -2
-3] 8. Sugerencia: Calcule la seudoinversa de la matriz A= [ i �]
l [
l(c). x = [1. 2, O, l] ' A= [ O 1 1 O ¡ O O -4 1
T
Problemas 5.5
3
o o o 1
3 2 1 O O -8 -3
1 o o
O O 1 O , = O 1 O O , = [ O 1 -1 -1
º] 3 o 1
2]
3. Sugerencia: Use inducción para mostrar que det(A - U)= (- lhn (1.). Para reducir el determinante de
A - U, desarróllelo alrededor de los elementos de sun-ésima columna. 4. Sugerencia: Es posible dar una
demostración directa, o puede uno usar el problema 3 de esta sección y el teorema de Cayley-Hamilton. 6.
PA= LU donde p= [ O 1 O O L O 1 O U
l O O i ! 4, -2 ± 4i 19. 5n3 /6
1 O O O -t
1 1
! O O O -!
3(a). (PA)¡i = apJ 3(c). (P- ¡
1) i = B; i 10. 1
[
2 -4 -2
1 -1] 17. PA = LU donde P =[º º]
O
1
O 1 ,
1 O O
Problemas6.1
l(a). 5-1.5 (x-3) l(c). 10+34(x-3)+5(x-3)(x- 7) 18. p(x)+2x(x+ l)(x- l)(x-2) 20.Sugerencia:
3 -1 6 Imite la demostración del teorema 3 de esta sección. 22.-i(x + 2)( 5x - 3)
P
1 o o 3 2 -l
L= [ 2 1 O] , U= [ O 4 3 1 20. Si e= O entonces x 1= 1, xz= 2 . Problemas6.3
-3 i1 O O � 2. Sugerencia: Añada un término adecuado al polinomio del problema I de esta sección.
for i= 1, 2, ..., n do for i= 1, 2, ... , n do
23. x; ;- bp,/ap,i 29. det( A )= 12 36. 40. in(n2 - 1) Problemas6.4
6. Sí 8. a=c = d= 7, b= 2, e=-3 13. a=-5, b=-26, c=-27, d= 9 30. a=b= 3, c= 1
xq, <- bp,/ ap,q,
end end
Respuestas y sugerencias 691
690 Respuestas y sugerencias
Problemas 8.6
1. X(l.O)=[0.30213,0.39052f 3. Sugerencia: Intente con funciones de la forma e1, te1, y t2e1. Respuesta:
Problemas 6.6
lemas 2, 4 y 5 de esta sección. la solución general es de la forma x=Ae' + Bte' + Ct2 et , y=De' +Ete' +Ft2 e'
6. Sugerencia: Resulta útil consultar los prob
5. X= [x2,X3, -2x3 +x2 +2x1 +e'4f,X(8)=[3,2, 1, 8f.
Problemas 6.7
15. radio = 1
4. O 6. (2/ fa) I:aC-l ix2" /[k!(2k + 1)]
+1
Problemas 8.7
: Tome z=1 - cos x. 36. - I;':':0(-xi +1
/(k + 1)! l. Solución general de la formax=Ae' +Be-' 3. Todos los pares (a.,�) para los cuales a.=-�.
19. Sugerencia: Hay varios errores. 35. Suger
encia
39. -hf"'(�) 40. A= -1, B = 4, C = -5, D = 2.
5. Sugerencia: Considere el problema 3 de esta sección.

Problemas 8.8
Problemas 6.8 � en
función sen t - 'M deberá tener un máximo en un punto l. �(z)= z - 3 4. Sugerencia: Tome x 1 de manera que resuelva la ecuación diferencial con condiciones
1. Sugerencia: Haga un esbozo de la gráfica. La condiciones deberán determinar a�
magnitud en rc/2. Estas iniciales tales que c ¡ ¡X¡ (a)+c12x1 (a)=a.. Tomex2 como una solución de la ecuación diferencial que satisface
(O, rc/2) y deberá tener un mínimo de la misma las condiciones iniciales x1(a) = -C¡z y Xi(a) = c ¡ ¡. Considere xr + lx2 . 11. z = 15 13. Sugerencia:
(e) resulta muy eficiente.
y a 1. 18. Sugerencia: El orden (a),(d),(c),(b), Multiplique por x la ecuación diferencial e integre.
Problemas 6.11 ción.
considere el punto 1/x. 19. Sugerencia: Use induc Problemas 8.9
1. Sugerencia: Tome x igual a la fracción continua y l.x(l /2)=19/8=2.375
n. 24. -3 + víO 26. v's 30. -x + v'x + 1
2
21. Sugerencia: Use el problema 20 de esta secció
35. Tome z=1 - cosx. Problemas 8.11
5. Sugerencia: Considere e'-', e8' y éA+B)t_
Problemas 7.2
8. 1.4626514 12(a). A= B=1/2
2. f01 f(x) dx = t(J(O) +3f(l/3) + 3f(l/3) +
f(l)] Problemas 8.12
14. A= C =1/12,B=22/12 9. Solución analítica: x1 (t)=(IOOOe- 10011 + e-1)/1001, x2(t) = (-l OOOe- 10011 + IOOOe-1)/1001

Problemas 9.2
Problemas 7.3
+ 1//3)/2. 9(b). Ao = A2 = 7/25, A1 = 8/25, 3. Sugerencia: En alguna etapa de su análisis deberá tener una ecuación vectorial (J +sB)Ej = Ej-I - q,
1. f0 f(x)dx = Hf(s) + f(l - s)] dondes = (1
1

tJ(x)dx=2f(O) + V"(l) donde Cj es un vector que incluye componentes de la forma f k2uu(x;, 'tj) + tzsh4u:r.w:C�,, lj).
Xo = -x2 = -jffj, X¡ = O 12. a.=1 ± 1//3 17.
26. A= C = 8/3, B = -4/3. Problemas 9.4
l. Sugerencia: Use las ecuaciones de Cauchy-Riemann.
Problemas 7.4
1. I=[81S(f, h/3) - S(f, h)J/80 - (l/90)c6h
6
+... 10. J=R(i, 2) + (1/20)c6h? +. . . Problemas 9.5
2. Sugerencia: El ejemplo del texto resultará útil. 6. Sugerencia: Al calcular (r, s) cuando (x, y) está dado,
Problemas 8.1
l. Sugerencia: Intente con x = et'", o dése cuenta
de que la ecuación es separable. 2. !ti � ! 4(a). aparecen dos soluciones de la ecuación cuadrática.

X= it4 Problemas 10.2


4. Sugerencia: Inicie con míny lAx � máxx lAx 6. Sugerencia: Si la desigualdad del problema 4 en
4(d). x=ln(t + 1) 5(a). x=(3t) l/3
esta sección es estricta, tome entonces a A como un número entre las dos cantidades. Use el problema 5 y
aplique el problema 3 a la matriz A - A.A.
Problemas 8.2
x(O.l )=1.98 18.x(4.l )=1.0049125
6.x(l.56)=0.224 x 106 no permite quex(O)= O 16. 2
D2= f,r+2fati +¡ frr
24. x" =(f, +Jf,)2f = D f +fxDf,dondeD=fr+Jfr,
2

Problemas 8.3 t)
F =hf(t+ ih, x+ iF1 ) 4.f(t, x) =(3 -x)/(x+2
2. x(t+h)=x(t) + !(F¡ +3F2),donde F1=hf(t, h) y 2 2
6. Sugerencia: Suponga que el término de error es Ch •

Problemas 8.4
= -1/12 15. A= l ,m=3
11.A =3/2,B= -1/2 13.A =5/12,B=8/12, C
T
BIBLIOGRAFÍA

Abreviaturas

ACMCOM Communications of the Association for Computing Machinery


ACMJ Joumal of the Association for Computing Machinery
ACMTOMS Transactions on Mathematical Software of the Association for Computing Machinery
AMM American Mathematical Monthly
ANSI American National Standards Institute, Inc.
AMS American Mathematical Society
AT Joumal of Approximation Theory
IEEE Institute of Electrica! and Electronic Engineers
IMANA lnstitute for Mathematics and /ts Applications Joumal on Numerical Analysis
MAA Mathematical Association of America
MOC Mathematics o/Computa/ion
NM Numerische Mathematik
SIAM Society for Industrial and Applied Mathematics
SIAMNA Joumal of Numerical Analysis of the Society for Industrial and Applied Mathematics
SIAMREV Review of the Society for Industrial and Applied Mathematics
ZAMP Zeitschriftfiir angewandte Mathematik und Physik

Abramowitz, M.• y I. A. Stegun, "Abscissas and weights for Gaussian quadratures of high order'', Joumal Research
National Bureau of Standards 56, 35-37, 1956.
Abramowitz, M., y I. A. Stegun (eds.), Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical
Tables, National Bureau of Standards, (reimpreso en Nueva York: Dover, 1965.), 1964.
Ahlfors, L. V., Complex Analysis, Nueva York, McGraw-Hi!l, 1966.
Aiken, R. C. (ed.), StijJComputation, Nueva York, Oxford University Press, 1985.
Alexander, J. C., y J. A. Yorke, "Toe homotopy continuation method: Numerically implemented topological procedures",
Transactions AMS 242, 271-284, 1978.
Allgower, E., y K. Georg, "Simplicial and continuation methods for approxirnating fixed points and solutions to systems
of equations", SIAMREV 22, 28-85, 1980.
Allgower, E., y K. Georg, Numerical Continua/ion Methods, Nueva York, Springer-Verlag, 1990.
Allgower, E. L., K. Glasshoff y H.-0. Peitgen (eds.), Numerical Solution of Nonlinear Equations: Lecture Notes in
Mathematics 878, Nueva York, Springer-Verlag, 1981.
ANSI/IEEE, "IEEE standard for binary floating-point arithmetic", IEEE Std. 754-1985, Nueva York, IEEE, 1985.
ANSI/IEEE, "A radix independent standard for floating-point arithmetic", IEEE Std. 854-1987, Nueva York, IEEE, 1987.
Ames, W. F., Numerical Methods for Partía/Dijferential Equations, Nueva York, Acaderrúc Press, 1977.
Atkinson, K., Elementary Numerical Analysis, Nueva York, Wtley, 1985.
Axelsson, O., "A generaiized conjugate direction method and its application on a singular perturbation problem", En
Numerical Analysis: Lecture Notes in Mathematics 773, Nueva York, Springer-Verlag, 1980.
Ayoub, R., "Euler and the zeta function", AMM 81, 1067-1086, 1974.
Aziz, A. K. (ed.), Numerical Solution ofDijJerential Equations, Nueva York, Van Nostrand, 1969.
Aziz, A. K. (ed.), Numerical Solutions of Boundary Value Problems for OrdinaryDijferential Equations, Nueva York,
Academic Press, 1974.
Babuska, I., M. Prager y E. Vitasék, Numerical Processes in Dijferential Equations, Nueva York, Wiley-Interscience,
1966.
694 Bibliografía Bibliografía 695

Bailey, P. B., L. F. Shampine y P. E. Waltman, Nonlinear Two-Point Boundary-Value Problems, Nueva York, Academic Brigham, E. O., The Fast Fourier Transform, Englewood Cliffs, N.J., Prentice-Hall, 1974.
Press, 1968.
Brophy, J. F., y P. W. Smith., "Prototyping Karmarkar's algorithm using MATH/PRDTAN'', Directions 5, 2-3, Houston,
Bale, J., y D. J. Newman, Complex Analysis,Nueva York, Springer-Verlag, 1982. IMSL Corp.• 1988.
Bames, E. R., "A variation on Karmarkar algorithm for solving linear programming problems", Mathematical Program- Bunch, J. R., y D. J. Rose (eds.), Sparse Matrix Computations. Nueva York, Academic Press, 1976.
ming 36, 174-182, 1986.
Bamhill, R., y A. Riesenfeld, Computer Aided Geometric Design, Nueva York, Academic Press, 1974. Burden, R. L., y J. D. Faires, Numerical Analysis, 4!! ed., Boston, PWS-Kent, 1989.
Barnhill, R., R. P. Dube y F. F. Little, "Properties of Shepard's surfaces", Rocky Mtn. J. Math. 13, 365-382, 1983. Burrage, K., A specialfamily of Runge-Kutta methods for solving stiffdifferential equations, BIT 18, 22-41, 1978.
Bamsley, M., Fractals Everywhere,Nueva York, Academic Press, 1988. Butcher, J. C., The Numerical Analysis of Ordinary Differential Equations: Runge-Kutta and General Linear Methods,
Barrodale, I., y C. Phillips, "Solution of an overdetermined system of linear equations in the Cbebyshev norm", ACMTOMS Nueva York, Wtley, 1987.
1, 264-270, 1975.
Byrne, G. D., y C. A. Hall (eds.),Numerical Solutionof Systems ofNonlinear Algebraic Equations,Nueva York, Academic
Barrodale, L, y F. D. K. Roberts, "Solution of an overdetermined system of equations in the l1 norm", ACMCOM 17, Press, 1973.
319-320, 1974. Byrne, G., y A. Hindmarsh, "Stiff ODE solvers: A review of current and coming attractions", Joumal Computational
Barrodale, I., F. D. K. Roberts y B. L. Ehle, Elementary Computer Applications, Nueva York, "Wiley, 1971. Physics 70, 1-62, 1987.
Bartels, R. H., "A stabilization of the simplex method", NM 16, 414-434, 1971. Cash, J. R., Stable Recursions, Nueva York, Academic Press, 1979.
Bartels, R., J. Beatty y B. Barsky, An Jntroduction to Splines for Use in Computer Graphics and Geometric Modeling,
Los Altos, Calif., Morgan Kaufmann, 1987. Ceschino, F., y J. Kuntzmann, Numerical Solution of Jnitial-Value Problems, Englewood Cliffs, N.J., Prentice-Hall, 1966.

Bartle, R. G., The Elements of Real Analysis, 2!!. ed., Nueva York, Wiley, 1976. Cheney, E. W., Introduction to Approximation Theory,McGraw-Hill, (reimpreso en Nueva York, Chelsea, 1982), 1966.
Becker, E. B., G. F. Carey y J. T. Oden, Finite Elements: An Introduction, vol. 1, Englewood Cliffs, N.J., Prentice-Hall, Cheney, W., y D. K.incaid, Numerical Mathematics and Computing, 2!!. ed., Pacific Grove, Calif., Brooks/Cole, 1985.
1981.
Cherkasova, M. P., Collected Problems in Numerical Analysis, Nueva York, Walters-Noordhoff, 1972.
Bell, E. T., Men of Mathematics,Nueva York, Simon & Schuster, 1975.
Birkhoff, G., y R. E. Lynch, Numerical Solution of Elliptic Problems,Filadelfia, SIAM, 1984. Childs, B., M. Scott, J. W. Daniel, E. Denman, y P. Nelson (eds.), Codes for Boundary Value Problems in Ordinary
Dijferential Equations: lecture Notes in Computer Science 76, Nueva York, Springer-Verlag, 1979.
Bloomfield, P., Fourier Analysis o/Tune Series: An Introduction,Nueva York, Wtley-Interscience, 1976.
Chow, S. N., J. Mallet-Paret y J. A. Yorke. "Finding zeros of maps: Homotopy methods that are constructive with
Blum, E. K., "Numerical Analysis and Computation: Theory and Practice,Read.ing, Mass., Add.ison-Wesley, 1972. probability one", MOC32, 887-899, 1978.
Bodewig, E., "Sur la méthod de Laguerre pour 1' approximation des racines de certaines équations algébriques et sur la Chui, C. K., "Multivariate splines", SJAM Regional Conference Series in Mathematics 54, 1988.
critique d'Hermite", Nederl. Acad. Wetensch. Proc. 49, 911-921, 1946.
Boisvert, R. F., S. E. Howe, D. K. Kahaner y J. L. Springmann, "Guide to available mathematical software", Center for Chung, K. C., y T. H. Yao, "On lattices admitting unique Lagrange interpolations", SIAMNA 14, 735-743, 1977.
Computing and Applied Mathematics. Gaithersburg, Md, National Institute of Standards and Technology, 1990.
Cline, A. K., " Scalar and planar valued curve-fitting using splines under tension",ACMCOM 17, 218-220, 1974a.
Boisvert, R. F., y R. A. Sweet, "Sources and development of mathematical software for elliptic boundary value problems",
En Sources and Development of Mathematical Software (J{. Cowell, ed.), Englewood Cliffs, N.J., Prentice-Hall, Cline, A. K., "Six subprcgrams for curve-fitting using splines under tension", ACMCOM 17, 220-223, 1974b.
1982.
Cline, A. K., C. B. Moler, G. W. Stewart y J. H. Wtlkinson, " An estímate for the condition number of a matrix", SIAMNA
Borwein, J. M., y P. B. Borwein, "Toe arithmetic-geometric mean and fast computation of elementary functions", SIAM­ 16, 368-375, 1979.
REV 26, 351-366, 1984.
Coddington, E. A., y N. Levinson, Theory of Ordinary Differential Equations, Nueva York, McGraw-Hill, 1955.
Botha, J. F., y G. F. Pinder, Fundamental Concepts in the Numerical Solution of Differential Equations, Nueva York,
"Wiley, 1983. Cody, W. J., "Toe construction of numerical subroutine librarles", SIAMREV 16, 36-46, 1974.
Boyce, W. E., y R. C. DiPrima, Elementary Differential Equations and Boundary Value Problems, Nueva York, Wiley, Cody, W. J., "Floating-point standards-theory and practice", En Reliability in Computing,99-107, Nueva York, Academic
1977. Press, 1988.
Braess, D., Nonlinear Approximation Theory, Nueva York, Springer-Verlag, 1984.
Cody, W. J., J. T. Coonen, D.M. Gay, K. Hanson, D. Hough, W. Kahan, R. Karpiski, J. Pa!mer, F. N. Ris y D. Stevenson, "A
Bramble, J. H. (ed.), Numerical Solution of Partial Differential Equations, Nueva York, Academic Press, 1966. proposed radix-and wordlength-independent standard for floating-point arithmetic", IEEE Micro, 4, 86-100, 1984.
Brenan, K. E., S. L. Campbell y L. R. Petzold, Numerical Solution of Jnitial-Value Problems in Differential-Algebraic Cody, W. J., y W. Waite, Software Manual for the Elementary Functions, Englewood Cliffs, N.J., Prentice-HalL 1980.
Equations, Nueva York, Elsevier Science Publisbing Co., 1989.
Brent, R. P., "Fast multiple precision evaluation of elementary functions", ACM], 23, 242-251, 1976. Coleman, T. F., y C. van Loan, Handbookfor Matrix Computations, Filadelfia, SIAM, 1988.

Briggs, W. L., A Multigrid Tutorial,Filadelfia: SIAM, 1987. Collatz, L., Functional Analysis and Numerical Mathematics, 3!!. ed., Nueva York. Academic Press, I 966a.
696 Bibliografía Bibliografía 697

1966b.
Collatz, L., The Numerical Trea tment ofDifferential Equations, Nueva York, Springer-Verlag, Delves, L. M., y J. Mohamed, Compu tational Methods far Integral Equatio ns, Nueva York, Cambridge University Press,
1985.
numerical solution ofelliptical
Concus, P., G. H. Golub y D. P. O'Leary, "A generalized conjugate gradient method forythe Rose, eds.), Nueva York,
partial differential equations", En Sparse Ma trix Co mputations (J. R. Bunch D. J., Dennis, J. E., Jr. y R. B. Schnabel, Numerical Methods for Unconstrained Optimization and Nonlinear Equat ions,
Englewood Cliffs, N.J., Prentice-Hall, 1983.
Academic Press, 1976.
1966. Dewdney, A. K., "Computer recreations: Random ·walks that lead to fractal crowds", Scientific Amer
Conte, S. D., ''Toe numerical solution oflinear boundary value problems", SIAMREV 8, 309-321, 1988.
ican, Diciembre,

ill,
Conte, S. D., y C. de Boor, Elementary Numerical Analysis, � ed., Nueva York, McGraw-H 1980 Dieudonné, J., Fou ndations ofMo dem Analysis, Nueva York, Academic Press, 1960.
IEEE 55,
Cooley, J. W., P. A. Lewis y P. P. Welch, "Historical notes on the fast Fourier transform", Proceed
ings o f the

1675-1677, 1967. Dongarra, J. J., C. B. Moler, J. R. Bunch y G. W. Stewart, LINPACK Users Guide, Filadelfia, SIAM, 1979.
Coonen, J. T., "Underflow and the denormalized numbers", Co mpu ter14, 75-87, 1981. Duff, L S., A. M. Erisman y J. K. Reid, Direct Methods for Sparse Matrices, Nueva York, Oxford University Press, 1986.
Cooper, L., y D. Steinberg, Metho ds and Applications ofLinear Programming, Filadelfia, Saunders, 1974. Durand, E., "Solutions Numériques des Équations Algébriques", (2 vols.) París, Mason, 1960.
Cullum, J., y R. A. Willoughby (eds.), Large Sea/e Eigenvalue Problems, Amsterdam, Elsevier, 1986. Eaves, B. C., "A short course in solving equations with PL homotopies", SIAM-AMS Proceedings
9, 73-144, 1976.
Curry, J. H., L. Garnett y D. Sullivan, "On the iteration of a rational function: Computer experiments with Newton's Eaves, B. C., F. J. Gould, H.-0. Peitgen y M. J. Todd (eds.), Homotopy Methods and Glo bal Convergen
ce, Nueva York,
method", Communica tions in Mathematical Physics 91, 267-277, 1983. Plenum, 1983.

Dahlquist, G., "Convergence and stability in the numerical integration ofordinary differential equations", Ma th. Scand. Eggermont, P. P. B., "Noncentral difference quotients and the derivative", AMM95, 551-553, 1988.
4, 33-35, 1956. Elliott, D. F., y K. R. Rao, Fast Transforms: Algorithms, Analyses, Applicatio ns, Nueva York, Acadernic Press, 1982.
Dahlquist, G., "A special stability problem for linear multistep methods", BIT3, 27-43, 1963.
Engels, H., Numerical Quadrature and Cubature, Nueva York, Academic Press, 1980.
Dahlquist, G., y A. Bjorck, Numerical Met hods, Englewood Cliffs, N.J., Prentice-Hall, 1974. Epperson, J. F., "On the Runge example", AMM4, 329-341, 1987.
Daniel, J. W., "The conjugate gradient method for linear and nonlinear operator equations", SIAM.NA 4, 10-26, (véase Evans, D. J. (ed.), Software fo r Numerical Lvfathematics, Nueva York, Acadernic Press, 1974.
también S!AlñNA 1 (1970) 277-280), 1967.
Daniel, J. W., y R. E. Moore, Compu tation and Theory in Ordinary Differential Equatio ns, San Francisco, Freeman, 1970. Fadeev, D. K., y V. N. Fadeeva, Computatio nal Methods ofLinear Algebra, San Francisco, Freeman, 1963.

Dantzig, G. B., "Programming in a linear structure", Washington, D. C., U. S. Air Force, Comptroller's Office, 1948. Farwig, R., "Rate ofconvergence ofShepard's global interpolation formula", MOC 46, 577-590, 1986.

Dantzig, G. B., Linear Programming and Extensions, Princeton, N.J., Princeton University Press, 1963. Fatun!a, S. O., Numerical Methods for Initial Value Problems in Ordinary Differential Equations, Nueva York, Acadernic
Press, 1988.
Davis, H. T., Introductio n to No nlinear Differential and Integral Equations, Nueva York, Dover, 1962.
Fehlberg, E., "Klassische Runge-Kutta Formeln fünfter und siebenter Ordnung rnit Schrittweitenkontrolle", Co mputing
Davis, P. J., Interpola tio n and Approximation, Nueva York, Dover, 1982. 4, 93-106, 1969.
Davis, P. J., y P. Rabinowitz, "Abscissas and weights for Gaussian quadratures ofhigh order", Joumal Research Natio nal Feldstein, A., y P. Tumer, "Overflow, underflow, and severe loss of significance in floating-point addition and subtraction",
Bureau Standards 56, 35-37, 1956. IMAJNA 6, 241-251, 1986.
Davis, P. J., y P. Rabinowitz, Metho ds ofNumerical lntegration, z<!. ed., Nuev-a York, Academic Press, 1984. Ficken, F. A., ''The continuation method for functional equations", Communications P ure & Applied Mathematics 4,
435-456, 1951.
de Boor, C., "CADRE: An algorithm for numerical quadrature", En Mathematical Software (J. R. Rice, ed.), Nueva York,
Acadernic Press, 1971. Flehinger, B. J., "On the probability that a random integer has initial digit A",AMM13, 1056-1061, 1966.

de Boor, C., ''Total positivity ofthe spline collocation matrix", Indiana University Jo umal ofMathema tics 25, 541-551, Forsythe, G. E., "Generation and use oforthogonal polynornials for data-fitting with a digital computer", SIAM Joumal
1976. 5, 74-88, 1957.
de Boor, C., A Practica/ Gu ide to Splines, 2'!. ed., Nueva York, Springer-Verlag, 1984. Forsythe, G. E., M. A. Malcolm y C. B. Moler, Computer Met hods for Mathematical Co mputations, Englewood
Cliffs.
N.J., Prentice Hall, 1977.
de Boor, C., y G. H. Golub (eds.), Recen/ Advances in Numerical Analysis, Nueva York, Acadernic Press, 1978.
Forsythe, G. E., y C. B. Moler, Co mputer Solution ofLinear Algebraic Systems, Englewood Cliffs, N J., Prentice-Hal
1967. l,
de Doncker, E., e I. Robinson, "An algorithm for automatic integration over a triangle using nonlinear extrapolation",
ACMTOMS 10, 1-16, 1984.
Forsythe, G. E., y W. R. Wasow, Finite-Dif.ference Met ho ds for Panial Differential Equations, Nueva York, Wi!ey, 1960.
Dejon, B., y P. Henrici (eds.), Constructive Aspects ofthe F undamental Theory ofAlgebra, Nueva York, Wiley, 1969.
Foster, L. V., "Generalizations ofLaguerre's method: Higher order methods", S!AMNA 18, 1004-1018, 1981.
Dekker, K., y J. G. Verwer, Stability of Runge-Kutta Methods far Stiff Nonlinear Different ia/ Equations, Amsterdam,
Elsevier Science, 1984. Fox, L., The Numerical Solu tio n ofTwo-Point Boundary-Value Problems in Ordinary Dif.ferential Equatio ns, Nueva York,
Oxford University Press, 1957.
Dekker, T. J., "Finding a zero by means ofsuccessive linear interpolation". En Constructive Aspects ofthe Fundamental
Theo rem o fAlgebra (B. Dejon y P. Henrici, eds.), Nueva York, Wtley-Interscience, 1969. Fox, L., Numerical Solu tio n ofOrdinary and Partía/ Differential Equatio ns, London, Pergamon, 1962.
698 Bibliografía
Bibliografía 699
Fox, L., An [ntroduction toNumerical Linear Algebra, Nueva York, Oxford University Press, 1964. Gill, P. E., G. H. Golub, W. Murray y M. A. Saunders, "Methods for modifying matrix factorizations", MOC 28, 505-535,
Fox, L., Biographical M emoirs of Fellows of the Royal Society: James Hardy Wilkinson 1919-1986, vol. 33, Londres, 1974.
Royal Society, 1987. G!adwell, J., y R. Wait, A Survey of Numerical Methods for Partial Differential Equations, Nueva York, Oxford University
Fox, P. A., A. D. Hall y N. L. Schryer, "Framework for a portable library", ACMTOMS 4, 177-188, 1978. Press, 1979.
Francis, J. G. F., "Toe QR transformation: A unitary analogue to the LR transformation", Partes 1 y 2, Computing Joumal Glatz, G., "Stabile Deflationsalgorithmen bei der numerischen Berechnung von Polynomnullstellen", Zeitschrift far
A ngewandte Mathematik und Mechanik 58, T416-T418, 1978.
4, 1961.
Glieck, J., Chaos, Nueva York, Vtldng Press, 1987.
Franke, R., "Scattered data interpolation: Tests of sorne methods", MOC 38, 181-200, 1982.
Goldstine, H. H., A History ofNumerical Analysisfrom the 16th Through the 19th Century, Nueva York, Springer-Verlag,
Fritsch, F. N., y R. E. Carlson, "Monotone piecewise cubic interpolation", SIAMNA 17, 238-246, 1980. 1977.
Fr6berg, C. E., lntroduction toNumerical Analysis, 2� ed., Reading, Mass., Addison-Wesley, 1969. Golub, G. H. (ed.), Studies inNumerical Analysis, Washington, D. C., MAA, 1984.
Gaffney, P., "When things go wrong . . . ", Report BSC87/l, Bergen, Noruega: IBM Bergen Scientific Centre, 1987. Golub, G. H., y D. P. O'Leary, "Sorne history of the conjugate gradient and Lanczos methods",
SIAMREV 31, 50-102,
1989.
Galeone, L., "Generalizzazione del methodo di Lagnerre", Calco/o 14, 121-131, 1977.
Golub, G. H., y C. F. van Loan, Matrix Computations, 2�. ed., Baltimore, Johns Hopkins University
Garbow, B. S., J. M. Boyle, J. J. Dongarra, y C. B. Moler, Matrix Eigensystem Routines, EISPACK Guide Extension, Press, 1989.
Nueva York, Springer-Verlag, 1972. Gordon, W. J., y J. A. Wixom, "Shepard's i;nethod of 'metric interpolation' to bivariate and multivariat
e interpolation",
Math. Comp. 32, 253-264, 1978.
García, C. B., y F. J. Gould, "Relations between several path-following algorithms and local and global Newton methods",
S1AMREV22 , 263-274, 1980. Gourlay, A. R., y G. A. Watson, Computational Methods for Matrix Eigenvalues, Nueva York, Wiley, 1973.
García, C. B. y W. L Zangwill, "Finding ali solutions to polynornial systems and other systems of equations", Mathematical Greenspan, D., lntroductoryNumerical Analysis of Elliptic Boundary Value Problems, Nueva York, Harper & Row, 1965.
Programming 16, 159-176, 1979a.
Gregory, J. A. (ed.)., The Mathematics ofSurfaces, Nueva York, Oxford University Press, 1986.
García, C. B., y W. L Zangwill, "An approach to homotopy and degree theory", Mathematical Operations Research 4, Gregory, R. T., Error-Free Computation, Huntington, Nueva York, Krieger, 1980.
390-405, 1979b.
Gregory, R. T., y D. Karney, A Collection of Matrices for Testing Computational Algorithms, Nueva
García, C. B., y W . L Zangwi!l, Pathways to Solutions, Fixed Points, and Equilibria, Englewood Cliffs, N.J., Prentice-Hall, York, Wiley, 1969.
Haar, A., "Die rninkowskische Geometrie und die Anniiherung an stetige Funktionen",
1981.
294-311, 1918.
Mathematische Annalen 78,
Gardner, M., Mathematical Puzzles and Diversions, Nueva York, Simon & Schuster, 1961.
Haber, S., "Numerical Evaluation of Multiple Integrals", SIAMREV 12, 481-526, 1970.
Gautschi, W., "Recursive computation of certain integrals", ACMJ 8, 21-40, 1961. Hackbusch, W., y U. Trottenberg (eds.), Multigrid Methods: LectureNotes in Mathematics 960, Nueva
York, Springer-
Gautschi, W., "Computational aspects of three-term recurrence relations", SIAMREV 9, 24-82, 1967. Verlag, 1982.
Gautschi, W., "Computational methods in special functions", En Theory and A pplications of Special Functions (R. Askey, Hageman, L. A., y D. M. Young, A pplied Jterative Methods, Nueva York, Acadernic Press, 1981.
ed.), Nueva York, Acadernic Press, 1-98, 1975. Hammerlin, G., (ed.),Numerical lntégration, Nueva York, Birkhliuser-Verlag, 1982.
Gautschi, W., "Families of algebraic test equations", Calco/o 16, 383-398, 1979. Harnming, R. W.,Numerical Methods for Scientists and Engineers, Nueva York, McGraw-Hill, ·¡973.
Gautschi, W., "How and how not to check Gaussian quadrature formulae", BIT 23, 209-216, 1983. Hardy, R. L., "Multiquadric equations of topography and other irregular surfaces", Joumal Geophysica
l Research 76,
1905-1915, 1971.
Gautschi, W., "Questions of numerical condition related to polynomials", En Studies inNumerica! Analysis (G. H. Golub,
ed.), 140-177, Washington, D. C., MAA, 1984. Hartley, P. H., "Tensor product approximations to data defined or rectangle meshes in n-space", Computer
Joumal 19,
348-352, 1976.
Gear, C. W.,Numerical lnitial Value Problems in Ordinary Differential Equations, Englewood Cliffs, N.J., Prentice-Hall,
1971. Heller, D., "A survey of parallel algorithms in numerical linear algebra",S1AMREV20, 740-777, 1978.
Gekeler, E., Discretization Methods for Stable lnitial Value Problems: LectureNotes in Mathematical 1044, Nueva York, HennJ!I, M. A., y L. M. De!ves (eds.), Production and Assessment ofNumerical Software, Nueva York,
1980. Acadernic-Press,
Springer-Verlag, 1984.
Gentleman, W. M., "Implementing Clenshaw-Curtis quadrature", ACM] 15, 337-342, 1972. Henrici, P., Discrete Variable Methods in Ordinary Differential Equations, Nueva York, Wiley, 1962.
George, A., y J. W. Liu, Computer Solution of Large Sparse Positive Definite Systems, Englewood Cliffs, N.J., Prentice­ Henrici, P., Error Propagation for Difference Methods, Nueva York, Wtley, 1963.
Hall, 1981.
Henrici, P., Elements ofNumerical Analysis, Nueva York, Wiley, 1964.
George, A., J. W. Liu y E. Ng., "User guide forSPARSPACK: Waterloo sparse linear equations package", Computer Science Henrici, P., A pplied and Computational Complex Analysis, (3 volúmenes) Nueva York, Wtley, 1974.
Dept. Report CS-78-30 (revisado en 1980), Waterloo, Canadá, University of Waterloo, 1980.
Hestenes, M. R., Conjugate Direction M ethods in Optimization, Nueva York, Springer-Verlag, 1980.
Gerald, C. F., y P. O. Wheatley, A ppliedNumerical Analysis, � ed., Reading, Mass., Addison-Wesley, 1989.
Hestenes, M. R., y E. Stiefel, "Methods of conjugate gradient for solving linear systems", Joumal ResearchNational
Ghizetti, A., y A. Ossiccini, Quadrature Formulce, Nueva York, Acadernic Press, 1970. Bureau ofStandards 45, 409-436, 1952
700 Bibliografía Bibliografía 701
Keller, H. B., "Global homotopies and Newton methods", En Recent Advances in Numerical Analysis
Hetzel, W. C., (ed.), ProgramTest Methods, Englewood Cliffs, N.J., Prentice-Hall, 1973. H. Golub, eds.), 73-94, Nueva York, Academic Press, 1978. (C. de Boor y G.
Hildebrand, F. B., lntroduction to Numerical Analysis, 21 ed., Nueva York, McGraw-Hill, 1974.
Kernighan, B. W., y P. J. Plauger, The Elements of Programming Style, Nueva York,McGraw-Hill, 1974.
Hindmarsh, A., "LSODE y LSODEI: Two initial value ordinary differential equations solvers", ACM Special Interest Group
in Numerical Methods Newsletter 15, 10-11, 1980. Khovanskii, A. N., The Application of Continued Fractions and their Generalizations to Pivblems in Approximation
Hirsch, M. W., y S. Smale, "On algorithms for solvingf(x) = O" , Communications of Pure and Applied Mathematics Theory, Groningen, Noordhoff, 1963.
32, 281-312, 1979. Kincaid, D. R., y T. C.Oppe, "A parallel algorithm for the general LU factorization", Communications Applied Numerical
Holmes, R. B., A Course on Optimiza/ion and Best Approximation, Nueva York,Springer-Verlag, 1972. Methods 4, 349-359, 1988.
Horn, R. A., y C. R. Johnson, Matrix Analysis, Nueva York, Cambridge University Press, 1986. Kincaid, D. R., yT. C.Oppe, D.M. Young, "ITPACKV 2D user's guide", Center for Numerical Analysis Report CNA-232,
Hough, D., "Applications of the proposed IEEE 754 standard for floating-point arithmetic", Computer14, 70-74; 1981. Austin, Tex., University ofTexas en Austin, 1989.
Householder, A. S., The Theory of Matrices in Numerical Analysis, Nueva York,Blaisdell. ( Reimpreso en Nueva York, Kincaid, D. R., J. R. Respess, D.M. Young y R. G. Grimes, "ITPACK 2C: A Fortran package for solving large sparse
Dover, 1974.), 1964. linear systems by adaptive accelerated iterative methods", ACMTOMS 8, 302-322, 1982.
Householder, A. S., The NumericalTreatment of a Single Nonlinear Equation, Nueva York, McGraw-Hill, 1970. Kincaid, D. R., y D,. M. Young, "Survey of iterative methods", En Encyclopedia of Computer Science
Belzer, A. G. Holzman y A. Kent, eds.), 354-391, Nueva York, Dekker, 1979. andTechnology (J.
Hull, T. E., W. H. Enright, B. M. Fellen, y A. E. Sedgwick, " Comparing numerical methods for ordinary defferential
equations", SIAMNA 9, 603-637, 1972. Kline, M., Mathematical Thought from Ancient to Modem Times, Nueva York, Oxford University
Press, 1972.
IMSL, IMSL Library Reference Manual, Houston, IMSL, Inc., 1990. Knuth, D. E., The Art of Computer Programming: Seminumerical Algorithms, vol. 2, Reading,
Mass., Addison-Wesley,
Isaacson, E., y H. B. Keller, Analysis of Numerical Methods, Nueva York, Wtley, 1966. 1969.
Jackson, K. R., W. H. Enright, y T. E. Hull, "A theoretical criterion for comparing Runge-Kutta formulas", SIAMNA 15, / Knuth, D. E., "Mathematical typography", Bulletin AMS 2, 337-372, 1979.
618-641, 1978.
Jacobs, D. (ed.), Numerical Software-Needs and Availability, Nueva York, Academic Press, 1978. Koopmans, T. C. ( ed.), Activity Analysis of Production and Allocation, Nueva York, Wiley, 1951.
Jain, M. K., Numerical Solution of Differential Equations, 21 ed., Nueva York, Wiley, 1984. Krogh, F., "VODQ/SVDQ/DVDQ: Variable order integrators for the numerical solution of ordinary differential equations",
Jet Propulsion LaboratoryTechnicalBrief NP0-11643, Pasadena, Calif., California Institute of Technology, 1970.
Jenkins, M. A., y J. F.Traub, "A three-stage algorithm for real polynomials using quadratic iteration", SIAMNA 7, 545-566,
1970a. Krylov, V. I., Approximate Calculation of lntegrals, (Traductor al inglés, A. Stroud) Nueva York,Macmillan, 1962.
Jenkins, M. A., y J. F. Traub, "A three-stage variable-shift iteration for polynomial zeros", NM 14, 252-263, 1970b.
Kuhn, H. W. y A. W.Tucker ( eds.), " Linear inequalities and related systems", Annals of Mathematical Studies, Princeton,
Jennings, A., Matrix Computations for Engineers and Scientists, Nueva York, Wtley, 1977. N.J., Princeton University Press, 1956.
Jerome, J. W., "Approximate Newton methods and homotopy far stationary operator equations", Constructive Approxi- Lakshmikantham, V., y D. Trigiante, Theory of Difference Equations, Numerical Methods and Examples,
Nueva York,
mation 1, 271-285, 1985. Academic Press, 1988.
Johnson, L. W., y R. D. Riess, Numerical Analysis, 21. ed., Reading, Mass., Addison-Wesley, 1982. Lambert, J., Computational Methods in Ordinary Dijferential Equations, Nueva York, Wiley, 1973.
Joyce, D., "Survey of extrapolation processes in numerical analysis", SIAiv!REV 13, 435-490, 1971.
Lancaster, P., "Error analysis for the Newton-Raphson method", NM 9, 55-68, 1966.
Kahan, W., " Laguerre's method and a circle which contains at least one zero of a polynomial", SIAMNA 4, 474-482, 1967.
Lancaster, P., y K. Salkauskas, Curve and Surface Fitting, Nueva York, Academic Press, 1986.
Kahaner, D., "Matrix description of the fast Fourier transform", IEEETransactions Audio and Electroacoustics AU-18,
422-450, 1970. Lancaster, P., y M. Tismenetsky,Theory aj Matrices, 21 ed., Nueva York, Academic Press, 1985.
Kahaner, D., "Toe fast Fourier transform by polynomial eva!uation", ZAMP 29, 387-394, 1978. Lanczos, C., Discourse on Fourier Series, Edimburgo: Oliver and Boyd, ! 966.
Kahaner, D., C. Moler y S. Nash, Numerical Methods and Software, Englewood Cliffs, N.J., Prentice-Hall, 1989.
Lapidus, L., y W. E. Schiesser, Numerical Methods far Differential Equations, Nueva York, Academic
Kaps, P., y P. Rentrop, " Generalized Runge-Kutta methods of order four with step size control for stiff orclinary clifferential Press, 1976.
equations", NM 33, 55-68, 1979. Lapidus, L., y J. Seinfield, Numerical Solution of Ordinary Differential Equati�ns, Nueva York, Academic
Press, 1971.
Karmarkar, N., "A new polynomial-time algorithm for linear programming", Combinatorica 4, 373-395, 1984. Laurie, D., "Automatic numerical integration over a triangle", Technical Report, Pretoria, Sudáfrica,
Center forMathematical Sciences, 1978. National Research
Karon, J. M., " Computing improved Chebyshev approximations by the continuation method", SIAMNA 15, 1269-1288,
1978.
Lawson, C. L., y R. J. Hanson, Solving Least Squares Problems, Englewood Cliffs, N.J., Prentice-Hall, 1979.
Keller, H. B., Numerical Methods forTwo-Point Boundary-Value Problems. Waltham, Mass., Blaisdel, 1968.
Lawson, C. L., R. J. Hanson, D. R. Kincaid y F. T. Krogh, "Basic linear algebra subprograrns for Fortran usage",
Keller, H. B., Numerical Solution ofTwo-Point Boundary Value Problems, Filadelfia, SIAM, 1976. ACMTOMS 5, 308-323, 1979.
Keller, H. B., " Numerical solution of bifurcation and nonlinear eigenvalue problems", En Applications of Bifurcation
Theory (P. Rabinowitz, ed.), 359-384, Nueva York, Academic Press, 1977. Levin, M., "An iterative method for the solution of systems of nonlinear equations", Analysis 2, 305-313, 1982.
702 Bibliografía Bibliografía 703

Li, T. -Y., "Solving polynomial systems", Mathematics Intelligen cer 9, 33-39, 1987. Nashed, M. Z., ( ed.), Generalized lnverses and A pplication s, Nueva York, Academic Press, 1976.
Lieberstein, H. M., A Course in Numerical Analj,sis, Nueva York. Harper & Row, 1968. Nazareth, L., "Homotopy techniques in linear programming", A lgorithmica, 1989.
Linear, P., Theore tical Nu merical A nalysis, Nueva York. Wiley, 1979. Nerinckx, D., y A. Haegemans, "A comparison of nonlinear equation solvers", Joumal Computing and Applied M athe­
. matics 2, 145-148, 1976.
Longley, J. W., Least Squares Computations Using Orthogonalization M ethods, Nueva York. Dekker, 1984
olatio n , Reading, Mass., Addison-We sley, 1983. Newman, D. J., y T. J. Rivlin, "Optima! universally stable interpolation", Analysis 3, 355-367, 1983.
Lorentz, G. G., K. Jetter y S. D. Riemenschneider, Birkhofflnterp
Luenberger, D. G., Introduction to Linear and Nonlinear Programming, Reading, Mass., Addison-Wesley, 1973. Nielson, G. M., "Sorne piecewise polynomial alternatives to splines under tension". En Compute, Aided Geometric
Design (R. E. Barnhill y R. F. Riesenfeld, eds.), 209-235, Nueva York. Academic Press, 1974.
Lyness, J., "AUG2 Integration over a triangle", Mathematics and Computer Science Report ANUMCS-TM-13, Argonne, Nievergelt, J., J. G. Farrar y E. M. Reingold, Computer Approaches to Mathematical Problems, Englewood Cliffs, N.J.,
m., Argonne National Laboratory, 1983. Prentice-Hall, 1974.
Lyness, J. N., y J. J. Kaganove, "Comments on the nature of automatic quadrature routines", ACMTOMS 2, 6 5-81. 1976. Noble, B., y J. W. Daniel, Applied Linear Algebra, 3!!. ed., Englewood Cliffs, N.J., Prentice-Hall, 1988.
Machura, M., y R. Sweet, "Survey of softwarefor partial differential equations", ACMTOMS 6, 461-488, 1980. Nussbaumer, H. J., Fast Fourier Transform and Convolution Algorithms, Nueva York, Springer, 1982.
MacLeod, M. A., "Improved computation of cubic natural splines with equi-spaced knots", MOC 27, 107-109, 1973.
Oden, J. T., Finite Elements of Nonlin ear Continua, Nueva York, McGraw-Hill, 1972.
Mandelbrot, B., The Fractal Geometry of Nature, Nueva York. Freeman, 1982.
Oden, J. T., y J. N. Reddy, An Introduction to the Mathematical Theory of Finite Elements, Nueva York, Wiley, 1976.
Marden, M., Toe Geometry of the Zeros of a Polynomial in a Complex Variable, Providence, RJ., AMS, 1949.
Oppe, T. C., y D. R. Kincaid, "Parallel LU-factorization algorithms for dense matrices", En Supercomputing, (E. N.
Marden, M., Geometry of Polynomials, Providence, R.I., AMS, 1966. Houstis, T. S. Papatheodorou, y C. D. Polychronopoulos, eds.), Lecture Notes in Computer Science 297, 576 -594,
Nueva York, Springer-Verlag, 1988.
Marsden, M. J., "An identity for spline functions with applications to variation-dimi.nishing spline approximation", AT3,
7-49, 1970. Oppe, T. C., W. D. Joubert y D. R. Kincaid, "NSPCG User's guide, version LO, packagefor solving large sparse linear
McCormick, S. F., Multigrid Methods, Filadelfia, SIAM, 1987. systems by various iterative methods", Centerfor Numerical Analysis Report CNA-216, Austin, Tex., University of
Texas en Austin, 1988.
McKeenman, W. M., "Algorithm 145: Adaptive numerical integration by Simpson's rule", ACMCOM 5, 604, 1962. Orchard-Hays, W., A dvanced Linear Programming Computing Techniques, Nueva York. McGraw-Hill, 1968
McNamee, J. M., "Numerical differentiation of tabulated functions with automatic choice of step-size", lntemational Ortega, J. M., Numerical Analysis: A Second Course, Nueva York, Academic Press, (reimpreso en Filadelfia, SIAM,
Joum al Numerical M ethods Enginnering 21, 1171-1185, 1985.
1990 ), 1972.
Meinguet, J., "Refined error analysis of Cholesky factorization", SIAMNA 20, 1243-1250, 1983.
Ortega, J.M., Introductio n to Parallel and Vector So/ution of Linear Systems, Nueva York, Plenum, 1988.
Meyer, G. H., "On solving nonlinear equations with a one-parameter operator embedding", SIAMNA 5, 739-752, 1968.
Ortega, J. M., y W. C. Poole, An Introduction to Numerical M ethods for Differential Equations, Marchfield, Mass., Pitman,
Micchelli, C. A., "Algebraic aspects of interpolation", En Approximation Theory (C. de Boor, ed.), Proceedings of 1981.
Symposia in Applied Mathematics 36, 81-102, Providence, R.I., AMS, 1986a
Ortega, J. y W. C. Rheinboldt, Iterative Solution of Nonlinear Equations in Severa/ Variables, Nueva York, Academic
Micchelli, C. A., "Interpolation of scattered data: Distance matrices and conditionally positive definite functions", Press, 1970 .
Constructive Approximation 2, 11-22, 1986b.
Osborne, M. R., "On Nordsieck's method for the numerical solution of ordinary differential equations", BIT 6, 51-57,
Micchelli, C. A. y T. J. Rivlin (eds.), Optima/ estimation in approximation theory, Nueva York, Plenum, 1977. 1966.
Mickens, R. E., Dijfere nce Equa tions, Nueva York. Van Nostrand-Reinhold, 1987. Ostrowski, A. M., Solution of Equations and Systems of Equations, 2!!. ed., Nueva York, Academic Press, 1966.
Miranker, W. L., Numerical M ethods for Stiff Equations and Sing ular Perturbation Problems, Boston, Reidel, 1980. Paddon, D. J., y H. Holstein, Multigrid Methods for Integral and Differential Equations, Nueva York, Oxford University
Press, 1985.
Mitchell, A., Computat ional Methods in Partía/ Differential Equations, Nueva York, Wtley, 1969.
Parlett, B. N., "Laguerre's method applied to the matrix eigenvalue problem", M ath. Comp. 18, 464-485, 1964.
Mitchell, A. R., y R. Wait, The Finite Element M ethod in Partial Differential Equations, Nueva York. Wtley, 1977.
Parlett, B. N., The Symmetric Eigenvalue Problem, Englewood Cliffs, N.J.• Prentice Hall, 1981.
Moler, C. B., y C. F. Van Loan, "Nineteen dubious ways to compute the exponential of a matrix", SIAMREV20, 801-836,
1978. Parter, S. (ed.), y Large Sea/e Scientific Computation, Nueva York. Academic Press, 1985.
Moore, R. E., M ethods and Application s of lnterval Analysis, Filadelfia, SIAM, 1979. PCGPAK, "PCGPACK User's guide, version 1.2", New Haven: Scientific Computing Associates, Inc., 1984.
Moore, R. E., Computational F unctional Analysis, Nueva York, Wtley, 1985. Peitgen, H., y P. Richter, The Beauty of Fractals, Nueva York, Springer-Verlag, 1986.
Morgan, A., "A homotopyfor solving polynomial systems", Applied Mathematical and Computation 18, 87-92, 1986. Peitgen, H.-0., D. Saupe y F. V. Haeseler, "Cayley's problem and Julia sets", Mathematics lntelligencer 6, 11-20, 1984.
Morgan, A., Solvin g Polynomial Systems Using Co ntinuation for Engineering and Scientijic Problems, Englewood Cliffs, Pentose, R., "A generalized inversefor matrices", Proceedi ngs Cambridge Phi/. Society 51, 406-413, 1955.
N.J., Prentice-Hall, 1987.
Pereyra V., "Finite difference solution of boundary value problems in ordinary differential equations", En Studies in
Moses, J., "Symbolic integration: Toe stormy decade", ACMCOM 14, 548-560, 1971. Numerical Analysis (G. H. Golub, ed.), 243-269, Washington, D. C., MAA, 1984.
NAG, NAG Fortran Library Manual, Downers Grove, Ill., NAG, Inc., 1990. Perron, O., Die Lehre von Kettenbrüche n, Leipzig, Teubner, reimpreso en Nueva York, Chelsea, 1929.
704 Bibliografía Bibliografía 705

Rivlin, T. J., The Chebyshev Polynomials, Nueva York, Wtley, segunda edición, 1990, 1974.
Pete rs, G.. y J. H. Wilkinson, "Practical problems arising in the solution of polynomial equations", IMAJNA 8, 16-35,
1971. Roache , P., Computational Fluid Dynamics, Albuque rque, He rmosa, 1972.
Phillips, G. M., y P. J. Taylor, Theory and Applications of Numerical Analysis, Nue va York, Academic Press, 1973. Roberts, S., y J. Shipman, Two-Point Boundary Value Problems: Shooting Methods, Nue va York, Else vier, 1972.
Pickering, M., An lntroduction to Fast Fourier Transform Methods far Partía/ Differential Equations, With Applications, Rockafellar, R. T., Convex Analysis, Prince ton, N.J., Princeton University Press, 1970.
Nue va York, Wiley, 1986.
Rose , D. J., "A simple proof for partial pivoting", AMM 82, 919-921, 1975.
Pickove r, C. A., "A note on chaos and Halley's methods", ACMCOM (11) 31, 1988.
Rose, D. J., y R. A. Wtlloughby (eds.), Sparse Matrices and Their Applications, Nueva York, Plenum, 1972.
Piessens, R., E. deDoncker-Kapenga, C. W. Übe rhube r, y D. H. Kahaner, QUADPACK: A Subroutine Package for Automatic
Jntegration, Nue va York, Springer-Ve rlag, 1983. Rosenbloom, P. C., ''Toe method of steepest desee n!", En Numerical Analysis (J. H. Curtiss, ed.), "Symposia in Applied
Mathe matics", VI, 127-176, 19.56.
Powers, D., Boundary Value Problems, Nue va York, Academic Pre ss, 1972.
Roy, M. R., A History of Computing Technology, Englewood Cliffs, N.J., Prentice-Hall, 1985.
Prage r. W. H., Applied NumericalLinear Algebra, Englewood Cliffs, N.J., Prentice-Hall, 1988.
Royden, H. L., Real Analysis, 2�. ed., Nueva York, Macmillan, 1968.
Prenter, P., Splines and Variational Methods, Nueva York, Wiley, 1975.
Rozema, E. R., "Romberg integration by Taylor se ries", AMM 94, 284-288, 1987.
Prince , P. J., y J. R. Dormand, "High order embedded Runge -Kutta formulre", J. Comp. Appl. Math. 1, 67-75, 1981.
Saaty, T. L., Modem Nonlinear Equations, Nueva York, Dove r, 1981.
Pruess, S., "Properties of splines in tension", AT 17, 86-96, 1976.
Salamin, E., "Computation of 1t using arithmetic-geome tric mean", MOC 30, 565-570, 1976.
Pruess, S., "An algorithm for computing smoothing splines in tension", Computing 19, 365-373, 1978.
San der, L. M., "Fractal growth", Scientific American, (1) 256, 94-100, 1987.
Rabinowitz, P., "Applications of linear programming to numerical analysis", SIAMREVlO, 121-159, 1968.
Schechter, M., "Summation of divergen! series by compute r", AMM 91, 629-632, 1984.
Rabinowitz, P. (ed.)., Numerical Methods for Nonlinear Algebraic Equations, Londres, Gordon and Breach, 1970.
Scheid, F., Numerical Analysis, Nue va York, McGraw-Hill, 1988.
Raimi, R. A., "On the distribution of first significant figure s", AlvIM16, 342-347, 1969.
Schendel, U., Introduction to Numerical Methods far Para/le/ Computers, Nueva York, Wiley, 1984.
Rall, L. B. (ed.), Error in Digital Computation, Nueva York, Wiley, 1965.
Schnabel, R. B., y P. D. Frank, "Tensor methods for nonlinear equations", SIAMNA 21, 815-843, 1984.
Ralston, A., A First Course in Numerical Analysis, Nueva York, McGraw-Hill, 1965.
Schoenbe rg, I. J., "Contributions to the problem of approximation of equidistant data by analytic functions", Quarterly
Ralston, A., y C. L. Meek (e ds.), Encyclopedia of Computer Science, Nueva York, Pe trocelli/Charte r, 1976. Applied Mathematics 4, 45-99 y 112-133, 1946.
Ralston, A., y P. Rabinowitz,A First Course in Numerical Analysis, Nue va York, McGraw-Hill, 1978. Schoe nbe rg, I. J., "On spline functions", En Inequalities (0. Shisha, ed.), 255-291, Nue va York, Academic Press, 1967.
Rand, R., Computer Algebra in Applied Mathematics: An lntroduction to MACSYMA, Boston, Pitrnan, 1984. Schoenberg, I. J., Mathematical Time Exposures, MAA, 1982.
Redish, K. A., "On Laguerre 's method", lnt. J. Math. Educ. Sci. Technol. 5, 91-102, 1974. Schultz, M. H., Spline Analysis, Englewood Cliffs, N.J., Prentice-Hall, 1973.
Reíd, J. K. (e d.),Large Sparse Sets ofLinear Equations, Nueva York, Academic Press, 1971. Schumaker, L. L., "Fitting surfaces to scatte red data", En Approximation Theory JI (G. G. Lorentz, C. K. Chui y L. L.
Rheinboldt, W. C., Methods for Solving Systems of Nonlinear Equations, CBMS Serie s in Applied Mathe matics 14, Schumake r, eds.), 203-268, Nue va York, Academic Press, 1976.
Filadelfia, SIAM, 1974. Schumaker, L. L., Spline Functions, Nueva York, Wiley-Interscie nce, 1981.
Rheinboldt, W. C., "Solution fie lds of nonlinear equations and continuation methods", SIAMNA 17, 221-237, 1980.
Schweikert, D. G., "An interpolation curve using splines in tension", Joumal Mathematics & Physics 45, 312-317, 1966.
Rheinboldt, W. C., Numerical Analysis of Parameterized Nonlinear Equations, Nueva York, Wiley, 1986.
Scott N. R., Computer Number Systems and Arithmetic, Englewood Cliffs, N.J., Prentice-Hall, 1985.
Rice, J. R., Approximation of Functions, vals. 1 y 2, Reading, Mass., Addison-Wesley, 1964, 1969. Shampine , L. F., y R. C. Allen, Numerical Computing: An lntroduction, Filadelfia, Saunders, 1973.
Rice, J. R., "Expe riments on Gram-Schmidt orthogonalization", MOC 20, 325-328, 1966.
Shampine, L. F., y C. Baca, "Error estimators for stiff differential equations", Joumal Computing & Applied Mathematics
Rice, J. R., "SQRARS: An algorithm for least squares approximation", En Mathematical Software (J. R. Rice, ed.), Nue va II, 197-208, 1984.
York, Academic Pre ss, 1971a.
Shampine, L. F., y C. W. Gear, "A use r's view of solving stiff ordinary differential equations", SIAMREV 21, 1-17, 1979.
Rice, J. R. (ed.), Mathematical Software, Nue va York, Academic Press, 1971b.
Shampine, L. F., y M. K. Gordon, Computer Solution of Ordinary Differential Equations: The lnitial Value Problem, San
Rice, J. R., "Software for numerical computation", En Research Directions in Software Technology 16 (P. Wegner, ed.), Francisco, Freeman, 1975.
688-708, Cambridge, Mass., MIT Press, 1979.
Shampine, L. F., H. A. Watts y S. M. Davenport, "Solving nonstiff ordinary differential equations-The state of the art'',
Rice, J. R., Matrix Computations and Mathematical Software, Nueva York, McGraw-Hill, 1981. SL4MREV18, 376-411, 1976.
Rice, J. R., Numerical Methods, Software, and Analysis, Nue va York, McGraw-Hill, 1983. Shepard, D., "A two-dimensional interpolation function for irregularly spaced data", Proceedings 23rd, National Confe­
rence ACM, 517-524, 1968.
Rice, J. R., y R. F. Boisvert, Elliptic Problem Solving Using ELLPACK, Nueva York, Springe r-Verlag, 1985.
Skeel, R. D., "Equivalent forms of multistep formulas", MOC 33, 1229-1250, 1979.
Rice, J. R., y J. S. White, "Norrn_s for smoothing and e stimation", SIAMREV 6, 243-256, 1964.
Skee l, R. D., "Effect of equilibration on residual size far partía! pivoting", SIAMNA 18, 449-454, 1981.
Richtmey e r, R. D., y K. W. Morton, Difference Methods for lnitial Value Problems, Nue va York, Wiley, 1967.
Bibliografía 707
706 Bibliografía

Bul/etin AJJ1S 4, 1-36, 1981. Traub, J. F., Iterative Methods for the Solution of Equations, Englewood Cliffs, N.J., Prentice-Hall, 1964.
Smale, S., "Toe funda mental theorem of algebra and complexity theory",
Moler, Matrix Eigensystem Routines-EISPACK Traub, J. F., 'Toe calculation of zeros o f polyno mials and analytic functions", En Mathematical Aspects of Computer
Smith, B. T.. J. M. Bo yle, B. S. Garbow, Y. Ikebe, V. C. Klema y oC.rk,B.Springer Science, Proceedings Symposium Applied Mathematics 19, 138-152, Providence, R.I., AMS, 1967.
Guide, 2� ed., Lecture Notes in Compute r Science 6, Nu eva Y -Verlag, 1976.
N u eva York, Oxford University Press, 1965. Trustrum, K., Linear Programming, Lo ndres, Routledge and Kegan Paul, 1971.
s,
Smith, G. D., Numerical Solution of Partía/ Dijferential Equation
(también, Nueva York, Springer-Verlag), Tumer, P. R., 'Toe distribution of leading significant digits", IMANA 2, 407-412, 1982.
Smith, K. T., Primer of ModemAnalysis, Belmont, Calif., Bogden and Quigley,
1971. van der Corput, J. G., "Sur l' appro ximation de Lagnerre des racines d' une équa tion qui a toutes ses racines réelles",
ation", IEEE Transactions Computing 34, 274-278,
Heder/. Acad. Wetensch, Proc. 49, 922-929, 1946.
Sorenson, D. C., "Analy sis of pairwise pivoting in Gaussian e!imin
1985. Vandergraft, J. S., lntroduction to Numerical Computations, Nueva York, Academic Press, 1978.
1975.
Steinberg, D. L, Computational MatrixAlgebra, Nueva York, McGraw-Hill, Varga, R. S., Matrix Iterative Analysis, Englewood Cliffs, N.J., Prentice-Hall, 1962.
Hall, 1974.
Stembenz, P. H., Floating-Point Computations, Englewood C!iffs, N.J., Prentice- Vemuri, V., y W. J. Karplus, Digital Computer Treatment of Partial Dijferential Equations, Englewood C!iffs, N.J.,
Different ial Equation s, Nueva York, Springer-Verlag, 1973. Prentice-Hall, 1981.
Stetter, H. J.,Analysis of Discretization Methods for Ordinary
ss, 1973.
Vemer, J. H., "Explicit Runge-Kutta methods with estirnates of the local truncation error", SIAMNA 15, 772-790, 1978.
Stewart, G. W., Introduction to Matrix Computations, Nueva York, Academic Pre
ev Y o rk, Springer- Verlag, 1980. Vichnevetsky, R., Computer Methods for Partía/ Dijferential Equations, vol. 1, Elliptic Equations and the Finite Element
Stoer, J., y R. Bulirsch, Introduction to NumericalAnalysis , N u a
Method, vol. 2, Initial Value Problems, Englewood Cliffs, N.J., Prentice-Hall, 1981, 1982.
ridge Press, 1986.
Stra ng, G., Introduction toApplied Mathematics, Wellesley, Mass., Wellesley-Camb Vo n Rosenberg, D. U., Methods far the Numerical Solution of Partial Dijferential Equations, Nuerva York, American
s, N.J., Prentice Hall, 1973. Elsevier, 1969.
Strang, G., y G. Fix, AnAnalysis of the Finite Element Method, Englewood Cliff
Grave, Calif., Brooks/Cole, 1973. W achspress, E. L., Iterative Solution of Elliptic Systems, Englewood Cliffs, N.J., Prentice-Hal!, 1966.
Street, R. L., The Analysis and Solution of Partía/ Dijferential Equations, Pacific
Wacker, H. G.(ed.), Continuation Methods, Nueva York, Academic Press, 1978.
Stroud, A. H., "Error estirnates for Romberg quadrature", SIAMNA 2, 480-488, 1965.
N.J., Prentice-Hall, 1971. Wait, R., y A. R. Mitchell, Finite ElementAnalysis andApplications, Nueva York, Wiley, 1986.
Stroud, A. H., Approximate Calculation of Mu/tiple Integrals, Englewood C!iffs,
Equations, Nueva York, Springer-Verla g, Wall, H. S., Analytic Theory of Continued Fractions, Princeton, van Nostra nd, 1948.
Stroud, A. H., Numerical Quadrature and Solution of Ordinary Differential
1974. Waser, S., y M. J. Flynn, Introduction toArithmetic far Digital Systems Designers, Nueva York, Holt, Reinhart, & Winston,
, N.J., Prentice-Hall, 1966. 1982.
Stroud, A. H., y D. Secrest, Gaussian Quadrature Formulas, Englewood Cliffs
Subbotin, Y. N., "On piecewise-polynomial approximation", Mat. Zametcki 63-70, 1, (traducción, 1967, Mathematical Wasserstrom, E., "Numerical solutions by the continuation method", SIAMREV 15, 89-119, 1973.
Notes l, 41-46), 1967. Watkins, D. S., "Understanding the QR algorithm", SIAMREV24, 427-440, 1982.
al equations", Report TN/LA-109,
Swarztrauber, P. N., "Efficient subprograms for the solution of elliptic partial differenti Watso n, L. T., "A globally convergen! algorithm for computing fixed points of C2 maps", Applications in Mathematical
Boulder, Colo., National Center for Atrnospheric Research, 1975. Computing 5, 297-311, 1979.
Computations (G. Rodrigue, ed.), Nueva
Swarztrauber, P. N., "Vectorizing the FFT's parallel computations", En Parallel Watson, L. T., "Numerical linear algebra aspects of globa lly co nvergent ho motopy methods", SIAMREV 28, 529-545,
York, Academic Press, 1982. 1986.
H. Golub, ed.), 319-370, Washington,
Swarztrauber, P. N., "Fast Poisson solvers", En Studies in NumericalAnalysis (G. Watson, L. T., S. C. Billups y A.·P. Margan, "HOMPACK: A suite of codes for globally convergent homotopy algorithms",
D. C., MAA, 1984. ACMTOMS 13, 281-310, 1987.
Hilbert matrix", Oxford Quarterly
Taussky, O., "A remark concerning the characteristic roots of finite segments o f the Weaver, H. J., Applications of Discrete and Continuous Fourier Analysis, Nueva York, Wiley, 1983.
Joumal Mathematics 20, 82-83, 1949.
Taussky, O., "How I became a to rchbearer for matrix theory",AMM 95, 801-812, 1988. Wedin, P. A., "Perturbation bounds in connectio n with the singular value decomposition", BIT 12, 99-111, 1972a.
Taylor, J. R., An Introduction to Error Analysis, Nueva York, University Science Boo ks, 1982. Wedin, P. A., "Perturbation theory for pseudoinverses", BIT13, 217-232, 1972b.

Tewarson, R. P., Sparse Matrices, Nueva York, Academic Press, 1973. Wendroff, B., Theoretical NumericalAnalysis, Nueva York, Academic Press, 1966.
Werner, W., "Polynomial interpolatio n: L agrange versus Newton", MOC 43, 205-217, 1984.
Tho mas, B., 'Toe Runge-Kutta metho ds", Byte, Abril, 191-210, 1986.
National Bureau Standards 65, Westfall, R. S., Never at Rest: A Biography of Isaac Newton, Nueva York, Cambridge University Press, 1980.
Todd, J., "Computational problems concerning the Hilbert matrix", Joumal Research
19-22, 1961. Whitehead, G. W., Homotopy Theory, Cambridge, Mass., MIT Press, 1966.
Todd, J., Survey of Numerical Analysis, Nu eva York, McGraw-Hill, 1962. Whittaker, E., y G. Robinson, The Calculus of Observations, �- ed., Londres: Blackie and Son, (reimpreso en Nu eva
York, Dover, 1967), 1924.
Todd, J., Basic Numerical Mathematics, vol 2, Nueva York, Academic Press, 1978.
sy stems of equations", En Tapies in Wilkinson, J. H., Rounding Errors inAlgebraic Processes, Englewood Cliffs, N.J., Prentice-Hall, 1963.
Todd, M. J., "An introduction to piecewise linear homotopy algorithms for solving
Numerical Analysis (P. R. Tumer, ed.), Lecture Notes in Mathematics 965, 147-202, Nueva York, Springer-Verla g, Wtlkinson, J. H., The Algebraic Eigenvalue Problem, Oxford: Clarendon Press, 1965.
1982.
ÍNDICE DE MATERIAS
708 Bibliografía

linear interpolation", Technical Computer Science Department


Wilkinson, J. H., "Two algorithms based on successived Univer
Report STAN-CS-67-60, Stanford, Calif., Stanfor sity, 1967.
Analysis (G. H. Golub, ed. ), 1-28, Washington, B
Wilkinson, J. H., "The perfidíous polynomial", En Studies in Numerical A
D. C., MM. 1984. A-estabilidad, 586 splines E, aplicaciones de, 353
II: Linear Algebra, Nueva York, Springer-
Wilkinson, J. H., y C. Reinsch (eds.), Handbookfor Automatic Computation A-ortogonal, 214 splines B, integral de los, 346
Verlag, 1971. A-ortonormalidad, 213 E-splines, propiedades de los, 344
Willoughby, R. A. (ed.), StiffDijferential Systems. Nueva York, Plenum, 1974. acotamiento, 14 E-splines, cúbicos, 569
splines E de grado O, B9(.x), 342
Wimp, J., Computation with Recurrence Relations, Boston, Pitman, 1984. actualización, 149, 609
, Filadelfia: SIAM, 1986. Adams-Bashforth, fórmula de: splines B de grado !, B¡(.x), 343
Wouk, A. (ed.), New Computing Environments: Parallel, Vector, and Systolic de cuarto orden, 530 Bairstow, método de, 99
elliptic type", Tesis doctoral, Cambridge,
Young, D. M., "Iterative methods for solving partía! difference equations of orden 5, 524 algoritmo del, l O l
Mass., Harvard Univer sity, 1950. base ortonormal, 373
Adams-Bashforth-Moulton, sistema de,
ic Press, 1971.
Young, D. M., Iterative Solution o/Large Linear Systems, Nueva York, Academ 545 Bernoulli, números de, 368, 483
1 y 2, Reading, Mass., Addison-Wesley,
Young, D. M., y R. T. Gregory, A Survey of Numerical Mathematics, vols. Adams-Moulton, fórmula de: Bernstein, polinomios de, 296
(reimpreso en Nueva York, Dover, 1988), 1972. de cuarto orden, 530 Bessel, desigualdad de, 374
iterative methods", Linear Algebra
Young, D.M., y K. C. Jea, "Generalized conjugate acceleration of nonsymmetrizable de orden 5, 526 Bessel ],,, funciones de, 26. 55, 56
and lts Applications 34, 159-194 , 1980. Aitken, aceleración de, 236 bibliotecas de software matemático, 8 I
Young, D. M., y D. R. Kincaid, "Norms of the successive overrela xation method and related methods", Computation algoritmo de ciclo V, 651 Birkhoff, interpolación de, 3 I 4
Center Report TNN-94 , Austin, Tex., Univers ity ofTexas en Austin, 1969. algoritmo QR desplazado, 280 bisección, método de, 63
93, 660, 1986. algoritmo símplex, 675 bola unitaria (esfera), 166
Young, R. M., "A Rayleigh popular problem", AMM
York, Wuey, 1983. algoritmo, véase seudocódigo
Zienkiewicz, O. C., y K. Morgan, Finite Elements and Approximation, Nueva amortiguamiento de errores, 64 7 e
1988.
Zwillinger, D., Handbookof Differential Equations, Nueva York, Academic Press, análisis de cálculos extensos, 38 cambio de intervalos, 464
análisis de errores, 464, 641 cancelación por sustracción, 446, 447
cuadratura gaussiana, 470 características, 627
iteración funcional, 86 características, enfoque alternativo, 634
método de bisección, 59 caracterización de las mejores aproxima-
método de la secante, 79 ciones, 382
análisis de estabilidad, 595, 638, 640 Carathéodory, teorema de, 386
aplicaciones de los splines B, 353 cáscara convexa, 385, 661
aproximación adaptativa, 436 · Cauchy, criterio de, 85, 176
aproximación de f"(x), fórmula de, 446 Cauchy-Schwarz, desigualdad de, 105, 493
aproximación de f'(.x), fórmula de 445 cero (raíz) simple, 23, 68
Richardson, extrapolación de, 450 ceros (raíces) de las funciones, cálculo de
aproximación de Sard, sentido de, 493 los, 57
aproximación, mejor, 369 ceros (raíces) de los polinomios, cálculo
aproximación por truncamiento (redondeo de los, 91
por defecto) con n-dígitos, 6 ceros (raíces) múltiples, 24
aritmética de la computadora, 29 Chebyshev, aceleración de, 202
armónica, 613 Chebyshev, algoritmo de, 206
arreglo de nudos, 4 37 Chebyshev, fórmulas de cuadratura de, 4 70
arreglo de ordenadas, 437 Chebyshev, polinomio de segundo tipo,
atracción, cuenca de, I 08 465
autónomo, 572 Chebyshev, polinomios de, 292, 376
710 Índice de materias Índice de materias 711

Chebyshev, solución a las ecuaciones cuadratura gaussiana, 47O, 471 ecuación variacional, 537 escala, 149
lineales, 387 cuasi-interpolación, operadores de, 359 ecuaciones de segundo orden cuasi­ espacio lineal normado, 175
Chebyshev, teorema de la alternancia de, cuenca de atracción, 108 lineales, 627 espacio nulo, 22
296, 391 curvas características, 614, 620, 627, 635 ecuaciones diferenciales de segundo orden, espectro (sp), 246
Chebyshev, teoría de, 381 curvas de nivel, 212 564 esquema newtoniano, 404
Cholesky, factorización de, 129, 136, 158 curvatura, 330 ecuaciones diferenciales lineales, 572 estabilidad, 532, 533, 598
algoritmo de, 137 ecuaciones diferenciales ordinarias de estable, 533, 596
coeficiente binomial, 297 D orden superior, 539 estado estacionario, 584
colocación, 569, 612 definida no negativa, 142 ecuaciones diferenciales parciales, 591 estructura diagonal, 129
columna unitaria diagonalmente domi- definida positiva, 125, 197 ecuaciones diferenciales parciales, clasifi­ estructura triangular inferior, 130
nante, 207 deflación (reducción), 95, 244, 280 cación de, 628 estructura triangular superior, 130
combinaciones convexas, 385 dependencia lineal, 665 ecuaciones diferenciales parciales de Euler, fórmula de, 422
condicionamiento, 52 derivada, 2 primer grado, 619 Euler-Maclaurin, fórmula de, 496, 499
conjugado, 99, 196, 231 derivadas de los E-splines, 346 ecuaciones diferenciales parciales elípticas, Euler, método de, 117, 510, 583
conjunto crítico, crít(f), 383 desbordamiento por defecto, 33 628 Euler modificado, método de, 515, 521,
conjunto factible, 116, 671, 675 desbordamiento por exceso, 33 ecuaciones diferenciales parciales hiperbó- 583
consistente, 533, 660, 673 descenso más rápido, 209, 212 licas, 628 evaluación de funciones, 46
continua, 2 descomposición en valores singulares, 264, ecuaciones en diferencias, 20, 22, 51 evaluaciones numéricas en puntos, 492
contracción iterada, 90 265 ecuaciones en diferencias estables, 25 exceso en la fila i, 164
convergencia, 566 descomposición LU (factorización), 132 ecuaciones lineales de segundo orden, 562 exponencial de una matriz, 574, 581
cuadrática, 12, 69 desigualdades lineales, 659, 665, 666 ecuaciones no lineales, 72, 588 exponente, 30
lineal, 12 desplazamiento del origen, 279 ecuaciones rígidas, 583 extrapolación, 199
orden de, 87 desviación, 369 elemento pivote, 143
diferencia dividida, propiedades de la, 309 eliminación gaussiana básica, 143 F
sucesiones, 9-12
superlineal, 12 diferenciable, 2 eliminación gaussiana: factor, teorema del, 92
convergencia de polinomios de interpola- diferenciación vía interpolación polino- con pivoteo de fila escalada, 149 factorización QR, 257, 275
ción, 295 mial, 448 en sistemas permutados, 148 Francis, algoritmo de, 275
convergencia lineal, 12 diferenciación numérica, 443, 444 eliminación hacia adelante, 149 factorización QR con desplazamiento, 279
convergencia superlineal, 12 diferencias divididas, 303, 305 épsilon de la máquina, 37 algoritmo, 280
convexidad, 384, 659 diferencias divididas con repeticiones, 319 equilibración, 180 factorizaciones LU, 129, 132
convexo, 384 diferencias divididas de orden superior, equilibración de columnas, 160, 181 factorizaciones ortogonales, 250
corrección de la malla, 650 306 equilibración de filas, 181 factorizaciones PA = LU, 152
cota inferior, máxima (mci), 14-15 distancia de una función a un espacio equivalencia unitaria, 274 Farkas, teorema de, 667
cota superior, mínima (mes), 14 splines, 362 error absoluto, 42 Farkas no homogéneo, teorema de, 667
cotas a posteriori, 224 división sintética, 14, 93 error de redondeo global, 510 fase de factorización, 149
cotas inferiores, 14 Doolittle, factorización de, 133 error de redondeo local, 510 algoritmo de, 151
cotas superiores, 14 algoritmo de, 134 error de redondeo unitario, 34-36 fase de solución, 149
Cramer, regla de, 311 dualidad, teoría de la 672 error de truncamiento, 445, 507, 517 algoritmo de, 152
Crank-Nicolson, método de, 602 error de truncamiento local, 509, 517, 535 Fibonacci, sucesión de, 19, 56
Cresta, función de, 404 E error en la interpolación polinomial, 291 fila unitario diagonalmente dominante, 207
criterios para concluir, 60 ecuación característica, 191, 233 error de truncamiento global, 510, 536 .fi(x), 34-36
Crout, factorización de, 133 ecuación de difusión, 591 error relativo, 42 fi(x 0 y), 35, 224
mínimos cuadrados, móviles, 411 ecuación de la primera variación, 560 error relativo, análisis del, 38 forma canónica, 635
cuadrados, mínimos, problemas de los, ecuación de onda, 619 error total, 510 forma cuadrática, 125
256 ecuación de calor, 591, 620 errores, 509, 517, 603 forma estándar, 671
cuadrados, mínimos, teoría de los, 369 ecuación integral, 513 errores de redondeo, 29, 509 forma estándar, segunda, 672
cuadratura, fórmulas de, 471 ecuación normal, 257, 372, 378, 411, 617 errores globales, 532 fórmulas recursivas para las fracciones
cuadratura adaptativa, 486 ecuación parabólica, 591, 599, 628 errores locales, 532 continuas, 416
712 Índice de materias Índice de materias 713

Fourier,método de, 598 Halley,método de,76 interpolación,método de,local multiva- esquema de corrección de,651
Fourier,series de,422 Herrnite, interpolación de, 313 riado, 408 malla cartesiana, 397
Fourier,series de,complejas, 422 Herrnite, fórmula de cuadratura de, 471 interpolación, problemas de,396 mallas múltiples, ciclo V para,651
Fourier, transformada rápida de,421,426 herrnitiano,197,243 interpolar, 285 mallas múltiples,ejemplo de,645
algoritmo de, 431 Hessenberg, matriz de, 276 inversa,122 mallas múltiples,ejemplo de amortigua-
Fourier sinusoidal, transformada rápida de, Hessenberg, forma superior de, 276 inverso aproximado,179 miento de errores, 647
655 Hessenberg superior,reducción a la forma invertible,123 mantisa,30
fracciones continuas, 415 de, 276 involución, 261 MARC-32,30
fractal, 109 Heun, método de,515 inyectivo, 26 Marsden,identidad de,351
Fresnel, integral de,367, 511 Hilbert,matriz de, 54,380 iteración funcional, 82,526 matrices diagonalizables, 575
Frobenius, norma de,173 homotopía,111 matrices diagonalmente dominantes
función/aplicación contractiva,83 Homer, algoritmo completo de,96 J (predominio diagonal), 156
función de error, erf(x), 15, 366,511 Horner,método de, 14 Jacobi, método de, iteración de,186, 189, matrices de iteración:
función de interpolación, la más suave algoritmo de, 41,93,287 198 de Gauss-Seidel,198,208
posible, 329 Householder, factorización QR de, 257, Jordan, bloques de,576 de Jacobi,198, 208
función de peso,463,471 259 Jordan, forma canónica de, 576 de Richardson,198, 208
función dilogarítmica, 367,512 Householder, transformaciones de,257 Julia, conjunto de, 108 de SOR, 199, 208
función entera, 295 de SSOR, 199, 208
función inversa,557 I K matrices particionadas subdivididas,125
función lineal,492, 558,665 idempotente,273 matrices semejantes, 191,242
Karmarkar,algoritmo de, 116,684
función objetivo,116,671,675 matriz asociada,282
inconsistente, 611, 661,673 Kepler,ecuación de, 59, 88
función de potencia truncada, 492 matriz de descomposición,187
indeterminación, 33 Kolmogorov, teorema de la caracterización
funciones básicas, 569 matriz defectuosa, 240
inestabilidad numérica,50, 52 de, 383
funciones cardinales,289, 449 matriz desplazada A - l, 238
inestable, 26, 50 matriz elemental, 123
funciones continuas,13 ínfimo (ínf), 14 L
funciones explícitas,15 matriz fundamental,579
integración mediante interpolación polino­ Lagrange,fórmula de interpolación de, matriz jacobiana,72, 561,588
funciones implícitas, 15, 71 mial, 458 289,317 matriz identidad, 222
funciones multicuádricas, 412 integración numérica basada en interpola­ Lagrange,interpolación de,289,313, 449 matriz monomial, 127
funciones trascendentales superiores,365 ción, 457 Lagrange, polinomio de,289 matriz normal,248
integral coseno, 367 Lagrange, polinomios de interpolación de, matriz simétrica,120
G integral elíptica,512 289 matriz unitaria,242,261
Galerkin,método de, 611, 642 de segundo tipo,512 Laguerre,iteración de,102 Maclaurin,series de, 364,418
Gauss-Jordan,método de, 165 integral seno, 365 algoritmo de, 102 mejoramiento (refinamiento) iterativo,178
Gauss-Seidel,método de, 186, 194, 511, integrales exponenciales,55 Laplace, 606 menor principal,136
646,650 intercambio,394 Lax-Wendroff, método de, 637 método completamente implícito, 601
Gerschgorin,teorema de, 245 interpolación baricéntrica, fórmula de,303 Legendre,polinomios de,376 método convergente, 532
gradiente conjugado precondicionado,218 interpolación de splines,323 Leibniz,fórmula de,311 método de bipartición,60
algoritmo de, 216, 220 interpolación en dimensiones superiores, ley pitagórica generalizada,374 método de bisección, 59
Gram, matriz de,378 396 límite, 1 algoritmo de, 61
Gram-Schrnidt modificado, algoritmo de, interpolación en la forma de Newton, linealmente independiente sobre un método de intercambio,394
254 polinomios de, 287 conjunto, 349 método de diferencias finitas,564,593,
Grarn-Schmidt,proceso de, 251, 375 interpolación por medio de multicuádricas, linealización, 67 606
algoritmo de,252 412 Lipschitz,condición de, 503 método de la potencia,231,234
Green,función de, 554 interpolación polinominal, 285 método de la potencia inversa, 237
interpolación trigonométrica, 421 M método de la potencia inversa con despla-
H interpolación,fase de, 647 mal condicionado, 52,54,171 zamiento, 238
Haar, subespacio de,389 interpolación,matriz de, 354 malla burda, 645 método de la secante, 77, 557
714 Índice de materias Índice de materias 715

algoritmo de, 78 Newton, método de diferencias divididas ordenamiento natural, 608 problemas hiperbólicos, 637
método de la secante, orden de convergen­ de, 316 órdenes de convergencia, 87 problemas mal condicionados, 49, 52
cia, 80 Newton, forma de, del polinomio de cuadrática, 12 problemas sin dependencia temporal, 606,
método de los coeficientes indeterminados, interpolación, 286 lineal, 12 611
461, 524 Newton, fórmula de interpolación de, 320 orden a, 12 proceso univ�ado, 397
método de mallas múltiples, 644 Newton, iteración de, para polinomios, 96 superlineal, 12 producto Jt, 13
método de predicción-corrección, 526 Newton, método de, 65, 107, 115, 560, ortogonal, 211, 250, 373 producto cartesiano, 396
método del elemento finito, 618 algoritmo, 66, 309, 311 ortogonalidad, condición de, 617 producto escalar, 195, 214, 232, 616
método del gradiente conjugado, 209, 215 Newton-Cotes, fórmula de, 459 ortonormal, 250, 373 producto escalar, espacio con, 251, 371
algoritmo, 215 Newton-Raphson, iteración de, 65 producto PQ, 398
nilpotente, 577 p producto tensorial, 399
método directo para el cálculo de valores
propios, 232 no singular, 123 Parseval, identidad de, 379 producto tensorial, notación P ® Q para el,
método explícito, 527, 532, 591, 594 nodos, selección de, 294 Peano, núcleo de, 492 398
método implícito, 527, 532, 599 nodos, geometría del conjunto de, 402 Peano, teorema de, 493 programación lineal, 116, 659, 670
método matricial, 598 norma ponderada, 173 Penrose, propiedades de, 270 propiedad cardinal, 397
norma f1, 166, 172 pérdida de dígitos significativos, 43 propiedades de las matrices, 122
método multipaso de k-pasos, 527
norma 22 2, 166 permutación, 163, 309 punto de atracción, 108
método multipaso lineal, 527, 586
norma oo, 166, 172 permutación, matriz de, 148 punto extremo, 662
método SOR, 196
norma euclidiana, 166, 196, 232 permut�r,ión, vector de, 131 punto factible, 116, 671
métodos de aproximación no interpolato-
norma matricial asociada, 167 pivote, 143 punto factible básico, 677
rios, 359
norma matricial subordinada, 168 pivoteo, 146 punto factible óptimo (solución), 671
métodos de continuación, 111
normas, 165 pivoteo de la fila proporcionado, 150 punto fijo, 83
métodos de la dirección conjugada, 213 punto flotante, aritmética de, 31
normas matriciales, 166 pivoteo por filas, 143, 148
métodos de disparo, 556 punto flotante, análisis del error de, 35
normas vectoriales, 165 pivoteo por filas escalados, 151
métodos de un solo paso, 524 punto flotante, números de, 29
notación científica normalizada, 30 pivoteo total, 160
métodos directos, 185 Poisson, ecuación de, 615 punto flotante normalizado, 31
notación O, 10, 12
métodos iterativos, 185 polinomio característico, 21, 233, 574 puntos de desviación máxima, 437
notación o, 10, 12
métodos multipaso, 524, 529 polinomio mónico, 293, 465, 474
notación vectorial para las ecuaciones
métodos numéricos implícitos, 640 polinomio pérfido, 56 R
diferenciales, 540
métodos rápidos para la ecuación de polinomios exponenciales, 425, 434 radio de convergencia, 364
número de condición, 52, 54, 168
Poisson, 654 número de condición de la matriz, 169 polinomios fundamentales de interpola- radio espectral, 191
Milne, método de, 535 número de máquina, 31 ción, 458 raíces cuadradas, cálculo de, 70, 89
módulo, 231 números de máquina próximos, 32 polinomios ortogonales, 474 raíces cúbicas de la unidad, 108
módulo de continuidad, 360 Nyquist, frecuencia de, 433 precisión de la máquina, 36, 37 raíces de las ecuaciones, 59
módulo (de un número complejo), 196 precisión, doble, 31 ramas, 16
muestras, 433 o precisión extendida, 31 Rayleigh-Ritz, método de, 616
multi-índice, 413
O mayúscula, fúnciones y sucesiones, 10 precondición, 218 recuento de operaciones (ops), 154, 653
multinomio, 413 primera ecuación variacional, 560 redondeo, 6
o minúscula, funciones y sucesiones, 10,
multiplicación anidada, 13, 14, 93, 287 problema de valores en la frontera en dos redondeo, análisis del error por:
12
multiplicadores, 143, 151 operaciones elementales, 121 puntos, 548 Gauss, algoritmo de, 225
multiplicidad de un cero, 92 operaciones elementales con filas y problema de Dirichlet, 606, 612 redondeo a n cifras decimales, 6
columnas, 281 problema extremal, 399 redondeo hacia arriba (por exceso), 6, 33
N operaciones extensas, 154 problema discreto, 607 reducción de dominio, 46
n-ésimo convergente, 415 operador de desplazamiento, 21 problema dual, 672 reflexiones, 257
Neumann, serie de, 176 operador de diferencia lineal, 21 problema modelo, 569, 655 región de estabilidad absoluta, 587

1
Neville, algoritmo de, 312 operador de traslación, 429 problema no homogéneo, 579 regla compuesta, 460
: regla de la cadena, 507
Newton, método para polinomios de, 96 optimización, 663 problemas bien condicionados, 49, 54
Newton, método complejo de, 107 orden del método multipaso, 529 problemas de frontera, 547, 556, 564, 568 regla del punto medio, 469
716 Índice de materias Índice de materias 717
regla del rectángulo del lado derecho, 469 serie de potencias,364 multimallas, ciclo para, 652, 653 sistemas indeterminados. 268
regla del trapecio, 459 series armónicas, 49 multimallas, ejemplo de, 646 sistemas lineales, 119
compuesta, 460 seudoproducto interno,423 multiplicación anidada, 14 sistemas ortogonales, 373
recursiva, 480 seudocódigo: Newton, algoritmo de, 66 sistemas ralos (dispersos), 185
regla pitagórica, 251, 371 algoritmo de la secante, 78 Newton, algoritmo de, función implícita, sistemas triangulares, 132
regla recursiva del trapecio, 480 algoritmo QR desplazado, 280 71 sobrerrelajación sucesiva, 196
Remez, primer algoritmo de,392 aproximación adaptativa 436 Newton, método polinominal de, 96 solución mínima, 268, 269
representación de los enteros, 31 aproximación derivada: problemas con valor en la frontera: solución numérica de ecuaciones diferen-
residuo, 2 diferencia central, 434 método explícito, 595 ciales ordinarias, 501
restricción, 349,650 diferencia hacia adelante, 432 método implícito, 601 soporte, 342
restricción de f a K, 349 Richardson extrapolación, 437 método de las características, 634 SOR hacia adelante, 199
Riccati, transformación de, 588 Bairstow, algoritmo de, 101 Richardson, extrapolación de, 189 SOR hacia atrás, 199
Richardson, extrapolación de,443,-450 bisección, algoritmo de, 61 Richardson, iteración de, 189 spline cúbico natural,327
algoritmo de, 452 Chebyshev, aceleración de, 206 Romberg, extrapolación de, 482, 483 spline de grado k,323
Richardson, método de iteración de, 188, Cholesky, factorización de 137 Runge-Kutta, método de, 514 splines de primer grado, 436
198 cuadratura ajustable, 490 Runge-Kutta-Fehlberg, método de, 520 spline natural de grado superior, 333
Richardson, teorema de extrapolación de, cuadratura gaussiana de cinco puntos, solución de Ax = b dado PA = LV, 153, spline tenso, 330
450 473 154 splines cúbicos, 325
algoritmo de, 451 descenso más inclinado, 212 solución de yTA = el dado PA = LU, splines de tensión (rígidos), 330, 333
Ritz, método de, 611 diferencias divididas, 288, 308, 316 154 splines naturales, teoría de grado superior,
Romberg, integración de, 480 eliminación gaussiana básica, 146 solución del sistema tridiagonal, 159 333
algoritmo de, 482 en sistemas permutados, 148 sustitución progresiva, 131 Steffensen, método de, 74, 75, 82
Runge, función de, 296 eliminación gaussiana mediante pivoteo sustitución progresiva en sistemas Stirling, fórmula de, 684
Runge-Kutta, métodos de, 514 por filas escaladas (fase de factoriza­ permutados, 131 Sturrn-Liouville, problema con valor en la
adaptativo, 518 ción), 151,152 sustitución regresiva, 130 frontera de, 569
anidado,521 eliminación gaussiana mediante pivoteo Taylor, método de la serie de, 507 sucesión acotada, 25
de cuarto orden, 516 por filas escaladas (fase de solución), Taylor, método de la serie de, para suma booleana (?-r:fJ Q),398
de quinto orden, 519 152 sistemas, 543 suposición de no degeneración, 677
Runge-Kutta, procedimiento de, para extrapolación, 206 seudoinversa. 267 suprayectivo, 26
sistemas,544 factorización de Doolittle, 134, 135 seudonimación, 433 supremo (sup), 14
Runge-Kutta, procedimientos anidados de, factorización general LV, 134 seudonorma, 423 sustitución progresiva, 131
521 Furier, transformada rápida de, 431 Shepard,interpolación de, 406 en sistemas permutados, 131
Runge-Kutta-Fehlberg, método de, 518 Gauss-Seidel, iteración de 194 simétrico y definido positivo, 137, 209 sustitución hacia atrás, 131, 149
Runge-Kutta-Gill, método de, 522 gradiente conjugado precondicionado, Simpson, regla de, 485, 461 sustitución regresiva para sistemas permu­
Runge-Kutta-Merson, método de, 523 221, 222 sistema binario, 30 tados, 131
Runge-Kutta-Verner, método de, 523 Gram-Schmidt, algoritmo de, 253 sistema decimal, 30 sustracción de cantidades casi iguales, 43
Gram-Schmidt modificado, algoritmo sistema ortonormal, 373
s de, 254,255 sistemas tridiagonales, 158 T
Sard, teoría de,de aproximación de Horner, algoritmo de,94, 288 sistemas consistentes, 667 traspuesta, 120
funcionales, 492 Horner completo, algoritmo de, 96 sistemas de ecuaciones, 119,639 Taylor, fórmula de, de la forma f(a+ h, b +
Schoenberg, teorema de, 493 iteración del gradiente conjugado,215, sistemas de ecuaciones diferenciales, 585 k), 5
Schoenberg-Whitney, teorema de, 355 216 sistemas de ecuaciones diferenciales de Taylor, fórmula de, de la forma f(x + h),5
Schur,factorización de, 242 Jacobi, iteración de, 190 primer orden, 539 Taylor, método de la serie de,506
Schur, teorema de, 242 Laguerre, algoritmo de, 105 sistemas de ecuaciones homogéneas,665 Taylor, método de la serie de, para siste-
Schwarz, desigualdad de, 371 método de la potencia, 235 sistemas de ecuaciones no lineales, 72 mas, 542
selección de nodos, 294 método iterativo,escalamiento,190 sistemas de primer orden,619 Taylor,polinomio de, 322, 364
semiespacio, 661 multimallas, ejemplo de errores dismi- sistemas equivalentes, 144 Taylor, series de, 364
senx, aproximación, 49 nuidos,648 sistemas inconsistentes, 268, 667 Taylor, teorema de:

También podría gustarte