7512-Resumen de Las Clases

RESUMEN DE LAS CLASES DE
ANLISIS NUMRICO
ndice general
Prlogo
1. Errores en los mtodos numricos

1.1. Una definicin de Anlisis Numrico . . . . .
1.2. El concepto y las fuentes de error . . . . . . .
1.2.1. Introduccin . . . . . . . . . . . . . .
1.2.2. Concepto de error . . . . . . . . . . .
1.2.3. Fuentes de error . . . . . . . . . . . .
1.3. Error absoluto y error relativo . . . . . . . . .
1.4. Propiedades de los algoritmos . . . . . . . . .
1.5. Errores . . . . . . . . . . . . . . . . . . . . . .
1.5.1. Error inherente . . . . . . . . . . . . .
1.5.2. Error de redondeo . . . . . . . . . . .
1.5.3. Error de truncamiento/discretizacin .
1.5.4. Errores por overflow y underflow
1.6. Propagacin de errores . . . . . . . . . . . . .
1.6.1. Propagacin del error inherente . . . .
1.6.2. Propagacin del error de redondeo . .
1.6.3. Propagacin de los errores inherentes y
1.7. Grfica de proceso . . . . . . . . . . . . . . .
1.8. Perturbaciones experimentales . . . . . . . . .
1.8.1. Estimacin del nmero de condicin .
1.8.2. Estimacin del trmino de estabilidad
1.9. Inestabilidad en los algoritmos . . . . . . . .
1.9.1. Cancelacin . . . . . . . . . . . . . . .
1.9.2. Acumulacin del error de redondeo . .
1.9.3. Aumento de la precisin . . . . . . . .
1.10. Diseo de algoritmos estables . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
de redondeo
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
2. Sistemas de Ecuaciones Lineales

2.1. Introduccin . . . . . . . . . . . . . . . . . . . .
2.2. Definiciones . . . . . . . . . . . . . . . . . . . .
2.3. Matrices triangulares . . . . . . . . . . . . . . .
2.4. Eliminacin de Gauss y sustitucin inversa . . .
2.5. Factorizacin LU . . . . . . . . . . . . . . . . .
2.6. Mtodo de Cholesky . . . . . . . . . . . . . . .
2.6.1. Matrices simtricas y definidas positivas
2.6.2. Algoritmo de Cholesky . . . . . . . . . .
2.7. Condicin de una matriz . . . . . . . . . . . . .
2.8. Refinamiento iterativo de la solucin . . . . . .
2.9. Errores de los mtodos directos . . . . . . . . .
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
2
2
3
3
4
5
9
9
10
12
14
15
15
16
16
17
18
18
20
21
21
22
22
23
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
25
26
27
30
32
32
33
33
36
37
Anlisis Numrico I
NDICE GENERAL
2.10. Mtodos iterativos . . . . . . . . . . . . . . . . . . .
2.10.1. Mtodos estacionarios . . . . . . . . . . . . .
2.10.2. Convergencia de los mtodos estacionarios . .
2.10.3. Mtodos no estacionarios . . . . . . . . . . .
2.10.4. Convergencia de los mtodos no estacionarios
2.10.5. Aspectos computacionales . . . . . . . . . . .
2.11. Errores de los mtodos iterativos . . . . . . . . . . .
2.12. Notas finales . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
39
40
43
45
50
53
53
56
3. Ecuaciones no Lineales
3.1. Introduccin . . . . . . . . . . . . . . . . . . . .
3.2. Mtodo de la biseccin . . . . . . . . . . . . . .
3.3. Mtodo de la falsa posicin o regula falsi . .
3.4. Mtodo de las aproximaciones sucesivas o punto
3.5. Mtodo de Newton-Raphson . . . . . . . . . . .
3.6. Anlisis del error . . . . . . . . . . . . . . . . .
3.7. Mtodos de convergencia acelerada . . . . . . .
3.8. Mtodo de Steffensen . . . . . . . . . . . . . . .
3.9. Notas finales . . . . . . . . . . . . . . . . . . .
. . .
. . .
. . .
fijo
. . .
. . .
. . .
. . .
. . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
57
58
59
59
62
64
65
67
67
4. Interpolacin de curvas
4.1. Introduccin . . . . . . . . . . . . . . .
4.2. Mtodo de Lagrange . . . . . . . . . .
4.3. Mtodo de Newton . . . . . . . . . . .
4.4. Interpolacin baricntrica de Lagrange
4.5. Interpolacin de Hermite . . . . . . . .
4.6. Interpolacin por splines . . . . . .
4.7. Notas finales . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
69
69
69
73
76
77
81
85
5. Mejor aproximacin y ajuste de funciones

5.1. Mejor aproximacin . . . . . . . . . . . . . .
5.1.1. Introduccin . . . . . . . . . . . . . .
5.1.2. Error y normas . . . . . . . . . . . . .
5.1.3. Mtodo de los cuadrados mnimos . .
5.2. Ajuste de funciones . . . . . . . . . . . . . . .
5.2.1. Introduccin . . . . . . . . . . . . . .
5.2.2. Aproximacin por mnimos cuadrados
5.2.3. Polinomios de Legendre . . . . . . . .
5.3. Notas finales . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
87
87
87
88
89
93
93
93
96
97
6. Diferenciacin e integracin numrica

6.1. Diferenciacin numrica . . . . . . . . . . . . . . . .
6.1.1. Diferencias progresivas, regresivas y centradas
6.1.2. Aproximacin por polinomios de Taylor . . .
6.1.3. Extrapolacin de Richardson . . . . . . . . .
6.1.4. Notas finales . . . . . . . . . . . . . . . . . .
6.2. Integracin numrica . . . . . . . . . . . . . . . . . .
6.2.1. Frmulas de Newton-Cotes . . . . . . . . . .
6.2.2. Frmulas cerradas de Newton-Cotes . . . . .
6.2.3. Frmulas abiertas de Newton-Cotes . . . . .
6.2.4. Cuadratura de Gauss . . . . . . . . . . . . . .
6.2.5. Integrales mltiples . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
99
99
99
103
104
108
109
109
110
119
120
122
- ii -
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
PRELIMINAR
Curso 008
Anlisis Numrico I
6.3. Notas finales
ndice general
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
7. Ecuaciones diferenciales ordinarias

7.1. Ecuaciones diferenciales ordinarias con valores
7.1.1. Introduccin . . . . . . . . . . . . . .
7.1.2. Condicin de Lipschitz . . . . . . . . .
7.1.3. Problema bien planteado . . . . . . . .
7.1.4. Mtodos de Euler . . . . . . . . . . . .
7.1.5. Mtodos de Taylor de orden superior .
7.1.6. Mtodos de Runge-Kutta . . . . . . .
7.1.7. Mtodos de paso mltiple . . . . . . .
7.2. Ecuaciones diferenciales ordinarias con valores
7.2.1. Introduccin . . . . . . . . . . . . . .
7.2.2. Mtodo del tiro o disparo lineal . . . .
7.2.3. Diferencias finitas . . . . . . . . . . . .
7.3. Mtodo de los elementos finitos . . . . . . . .
7.4. Notas finales . . . . . . . . . . . . . . . . . .
Curso 008
PRELIMINAR
iniciales . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
de contorno
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
125
125
125
126
127
127
130
130
133
135
135
137
139
141
142
- iii -
Anlisis Numrico I
0. Prlogo
Prlogo
Esto no pretende ser un libro sobre Anlisis Numrico ni algo que se le parezca. Simplemente es un resumen, incompleto, de las clases dadas en el mbito de la Facultad de Ingeniera,
durante los aos 2005 y 2006, orientadas originalmente a la parte prctica y luego reconvertidas
como clases tericas durante el primer cuatrimestre de 2007.
El objetivo es dar una gua de los temas y enfocar a los alumnos en las cuestiones ms
importantes del Anlisis Numrico que suelen aplicarse en el mbito de la ingeniera. No intenta
ser un manual ni un libro de texto, sino simplemente servir como ayuda-memoria a la hora de
repasar lo visto en clase. Textos y libros existen por doquier y algunos de ellos se refieren en la
bibliografa, a los cuales no busca reemplazar. Es ms, muchas de las demostraciones se deben
buscar en esos textos.
Al mismo tiempo, algunos temas que no suelen incluirse en los libros tradicionales se han
desarrollado con mayor o menor fortuna. Dos ejemplos de ello son el Mtodo de Interpolacin
Baricntrica de Lagrange, una forma alternativa de construir los polinomios interpolantes de
Lagrange, y una aproximacin al Mtodo de los Gradientes Conjugados para resolver sistemas
de ecuaciones lineales en forma iterativa. El primero de ellos no figura en ningn libro conocido
y es una interesante alternativa para desarrollar en una computadora, tal como refieren quienes
publicaron el mtodo, los matemticos Jean-Paul Berrut (Dpartment de Mathmatiques, Universit de Fribourg) y Lloyd N. Trefethen (Computing Laboratory, Oxford University).
El segundo, en realidad, aparece en varios libros dedicados al mtodo de los elementos
finitos, pero no siempre en los textos de Anlisis Numrico. Por ejemplo, recin en la sptima
edicin del libro Anlisis Numrico de Burden & Faires se lo incluye como parte importante
del libro. En otros textos ni siquiera se menciona, a pesar de ser uno de los mtodos iterativos
ms importante para resolver sistemas ralos de ecuaciones lineales, sobre todo en los ltimos
aos, gracias al desarrollo de las computadoras personales. Para las clases, tanto tericas como
prcticas, la base que se us es la publicada por Jonathan Richard Shewchuk (School of Computer
Science, Carnegie Mellon University), que es de libre disponibilidad en la web, y muy buena desde
el punto de vista de la interpretacin y comprensin del mtodo.
El resto de los temas corresponde a los que tradicionalmente se dan en los cursos de
Anlisis Numrico I de la facultad y en la mayora de los cursos afines en Argentina y el resto
del mundo.
Finalmente, este resumen no sera posible sin la ayuda de todos los docentes que han
intervenido e intervienen en el curso 008 de Anlisis Numrico I de la Facultad de Ingeniera de
la Universidad de Buenos Aires. Sus observaciones y crticas a las clases prcticas y tericas han
servido para delinear los temas y tratar de lograr la mejor manera de explicarlos. Espero haberlo
conseguido.
Rodolfo A. Schwarz, Buenos Aires, agosto de 2007.
Curso 008
PRELIMINAR
-v-
Anlisis Numrico I
Captulo 1
Errores en los mtodos numricos

1.1.
Una definicin de Anlisis Numrico
Es usual que el anlisis numrico est asociado estrictamente a la siguiente definicin

general: Es el estudio de los errores de redondeo. De acuerdo con Lloyd Trefethen (vase [12]),
profesor en la universidad de Oxford, esta definicin es errnea. Entiende que si esta percepcin
es correcta, resulta poco sorprendente, entonces, que el anlisis numrico sea visto como una
asignatura aburrida y tediosa. Es cierto que los errores de redondeo son inevitables, y que su
anlisis es complejo y tedioso, pero no son fundamentales. Al analizar varios libros dedicados
al tema, encuentra que los captulos iniciales siempre estn referidos al error de redondeo o
sus temas asociados: precisin, exactitud, aritmtica finita, etc. Veamos algunos ejemplos de la
bibliografa disponible en espaol:
Burden & Faires, Mtodos Numricos (2005): 1. Preliminares matemticos y anlisis del
error.
Gonzlez, Anlisis Numrico, primer curso (2002): 1. Errores en el clculo numrico.
Curtis & Wheatley, Anlisis numrico con aplicaciones (2002): 0. Clculo numrico y computadoras (0.5 Aritmtica por computadoras y errores).
Nakamura, Mtodos numricos aplicados con software (1992): 1. Causas principales de
errores en los mtodos numricos.
Ramrez Gonzlez y otros, Clculo Numrico con Mathematica (2005): 1. Introduccin al
Clculo Numrico. Errores.
Maron & Lopz, Anlisis Numrico, un enfoque prctico (1998): 1. Algoritmos, errores y
dispositivos digitales.
Quintana y otros, Mtodos numricos con aplicaciones en Excel (2005): Captulo 1. Definicin de error.
Esto ayuda a que los alumnos tengan una percepcin equivocada del objeto principal de
la materia. Para evitar esto, Trefethen propone una definicin alternativa:
Anlisis numrico es el estudio de los algoritmos para resolver problemas de la matemtica continua.
Para l la palabra clave es algoritmo. De hecho, en Wikipedia podemos encontrar esta
definicin:
Curso 008
PRELIMINAR
-1-
Anlisis Numrico I
1.2. El concepto y las fuentes de error
El anlisis numrico es la rama de la matemtica que se encarga de disear algoritmos

para, a travs de nmeros y reglas matemticas simples, simular procesos matemticos
ms complejos aplicados a procesos del mundo real ;
cuya referencia es justamente, Lloyd (Nick) Trefethen! Y, segn l, el principal objetivo del
anlisis numrico es disear algoritmos para aproximar valores desconocidos (no lo conocido de
antemano), y hacerlo en forma rpida, muy rpida.
Por esa razn, este captulo tiene por objeto desmitificar la influencia de los errores al
aplicar mtodos numricos, y en particular, la influencia del error de redondeo como fuente
bsica de los problemas en la utilizacin de algoritmos para resolver problemas matemticos,
an cuando la existencia de los mismos debe llevar a tenerlos en cuenta en determinados casos
en los que no se los puede soslayar. Para ello, empezaremos viendo los errores que intervienen en
cualquier procedimiento o clculo numrico.(Para un anlisis ms detallado acerca del estudio
de los errores y la estabilidad de los algoritmos, vase [5].)
1.2.
1.2.1.
El concepto y las fuentes de error

Introduccin
Tal como dijimos en la definicin de anlisis numrico, su objetivo principal no es analizar

en detalle los errores que intervienen en el cmputo de cantidades. Pero s es uno de los puntos en los cuales cualquier matemtico (o de otra rama de la ciencia o tecnologa asociada a
la matemtica) que se dedique a desarrollar algoritmos deber ser un especialista en el tema.
Por qu? Simplemente, porque sus algoritmos sern utilizados para resolver problemas que seguramente no tengan una solucin analtica o que la obtencin de esa solucin est fuera de los
alcances del usuario de ese algoritmo. Por ejemplo, es usual que los ingenieros utilicen programas
que resuelven estructuras por el mtodo de los elementos finitos para dimensionar determinadas
piezas o establecer las formas definitivas de las mismas, afn de optimizar el uso de los materiales
o para darle ciertas caractersticas especiales a la estructura. Si bien es posible que varios de
esos problemas puedan ser resueltos con modelos analticos, lo ms probable es que esos modelos
analticos slo tengan una definicin general (an cuando sea compleja) en forma de ecuaciones
diferenciales o de sistemas de ecuaciones diferenciales, tanto ordinarias como en derivadas parciales. An cuando existen mtodos de resolucin analticos (simblicos) para las ecuaciones
diferenciales, las condiciones de borde de un problema particular puede hacer intil la bsqueda de soluciones analticas o simblicas. Por lo tanto, el nico camino viable para obtener una
respuesta al problema planteado es la aplicacin de un mtodo numrico.
Y si no contamos con una solucin analtica, cmo sabremos si los resultados obtenidos
sirven? Esta es una de las razones por las cuales los analistas numricos deben ocuparse de
analizar qu tipos de errores afectan a los algortimos que desarrollan y hasta qu punto son
responsables de los posibles errores en los resultados que se obtendrn por aplicaciones de los
mismos. Pero debe tenerse en cuenta que, por otro lado, estos algoritmos deben ser adems
rpidos (de convergencia rpida) y que sern aplicados en computadoras, algo que no suele
remarcarse con debida propiedad, que, por supuesto, estn sometidas a limitaciones propias.
El problema de los errores en los clculos no es propiedad del siglo XX (o XXI) y de
los que sigan. Desde los inicios de la matemtica y de las ciencias asociadas, es un problema
que interes e interesa a todos los involucrados. Como ejemplo, tomemos un tpico mtodo de
interpolacin que se ensea en cualquier curso, el de los polinomios de Lagrange. La frmula para
-2-
PRELIMINAR
Curso 008
Anlisis Numrico I
obtener los polinomios es:

n
Y
Pn (x) =
n
X
fj lj (x); lj (x) =
j=0
(x xk )
k=0
k6=j
n
Y
(1.1)
(xj xk )
k=0
k6=j
El propio Lagrange adverta en su poca, que su mtodo no era totamente confiable,

pues muchas veces los resultados obtenidos no eran correctos. De todos modos, el mtodo suele
estudiarse como una herramienta terica a pesar de que tiene las siguientes desventajas:
1. Cada evaluacin de p(x) requiere O(n2 ) sumas/restas y multiplicaciones/divisiones.
2. Aadir un nuevo par de datos xn+1 ; fn+1 requiere recalcular todo de cero.
3. El clculo es numricamente inestable.
En tanto que las dos primeras se refieren a la eficiencia del algoritmo para obtener el
polinomio, la ltima est estrictamente relacionda con los errores que pueden aparecer por las
operaciones de clculo involucradas en el procedimiento. Esto ltimo se hizo muy evidente al utilizar las computadoras como elemento de clculo. En consecuencia, para analizar cuan inestable
(y/o mal condicionado) es el algoritmo, debemos analizar cmo se propagan los errores. Veremos
a continuacin el concepto y la definicin de lo que denominamos error.
1.2.2.
Concepto de error
La palabra error suele llevar a interpretaciones confusas segn quien la exprese. En el

lenguaje coloquial de uso diario, el concepto de error est relacionado con falla o mal hecho.
Una expresin como el error fue ... suele asociarse con la causa que produjo un resultado no
aceptable o equivocado, y que por lo tanto, debe ser evitado o enmendado para que al hacer de
nuevo el clculo (o cualquier otra cosa), el resultado obtenido sea aceptable o correcto.
En cambio, en el mbito del anlisis numrico (y en general, en las ciencias e ingeniera), el
trmino error est relacionado especficamente con la incertidumbre de los datos de ingreso como
de los resultados obtenidos, sin que esto signifique que los resultados sean equivocados. Dicho de
otra manera, no pone en duda la confiabilidad del mtodo en s, sino que analiza el grado de
incertidumbre de los valores numricos. En la ingeniera esto es de particular relevancia, puesto
que los datos que utilizamos provienen de mediciones en campo, estimaciones probabilsticas,
hiptesis y modelos matemticos simplificados, o de la experiencia profesional. Rara vez se cuenta
con datos con validez exacta. Sin embargo, si una leve modificacin de estos datos produce
resultados considerablemente diferentes que no reflejan la realidad, estamos ante la presencia
de un problema que s puede objetar el procedimiento utilizado. Es decir, el procedimiento es
inestable o mal condicionado, conceptos diferentes.
Para analizar cuan confiable es un procedimiento o algoritmo, se vuelve necesario el
estudio de los errores que afectan los clculos y las operaciones que intervienen en dicho algoritmo,
y cmo se propagan hasta afectar los resultados que ste entrega.
1.2.3.
Fuentes de error
Las fuentes de error que analizaremos son las siguientes:
Error inherente: Es el error de los datos de entrada que puede estar dado por la precisin
en la medicin de los datos, por la representacin numrica, por provenir de clculos previos,
etc.
Curso 008
PRELIMINAR
-3-
Anlisis Numrico I
1.3. Error absoluto y error relativo
Error de redondeo/corte: Es el error debido estrictamente a la representacin numrica

utilizada y est asociado a la precisin usada en los clculos, generalmente una calculadora
o una computadora.
Error de truncamiento/discretizacin: Es el error que aparece al transformar un procedimiento infinito en uno finito, por ejemplo, transformar una serie de infinitos trminos
en una funcin finita, o de usar una aproximacin discreta para representar un fenmeno
continuo.
Error del modelo matemtico: Es el debido a las simplificaciones e hiptesis introducidas para definir el modelo matemtico que representa el problema fsico.
Error humano y/o de la mquina: Es el error que se produce por la intervencin
humana, ya sea por una mala transcripcin o interpretacin incorrecta de los datos originales, por programas de computacin mal hechos y/o fallas en el diseo, implementacin
o configuracin de programas o computadoras.
La ltima fuente de error suele ser asociada al concepto coloquial de error. Desde la
ptica del anlisis numrico, los dos ltimos errores estn fuera de su alcance, si bien no deben
ser despreciados a la hora de evaluar los resultados obtenidos, en particular, el debido al modelo
matemtico.
1.3.
Error absoluto y error relativo
Empezaremos por analizar las frmulas ms sencillas de error. Supongamos que obtenemos de alguna forma (por ejemplo, una medicin) cierto valor m.
Sabemos que el valor exacto
de dicho valor es m. Como conocemos ese valor m podemos definir dos tipos de errores:
1. Error absoluto: ea = m m;
2. Error relativo: er =
mm
ea
=
(siempre que m 6= 0).
m
m
Generalmente, el error relativo es una medida mucho ms representativa del error, especialmente cuando |m| >> 1. Cuando |m| 1, entonces ambos errores coinciden. En la prctica
suele ser poco probable conocer el valor m, por lo que no podemos calcular ea ni er . Entonces,
cmo sabemos qu error estamos teniendo? Si no conocemos la solucin del problema pareciera
que no hay forma de saberlo.
Partamos de no conocer m y de que el valor m
fue obtenido por medicin usando un
instrumento cuya precisin1 es em (por error de medicin). Si tomamos el concepto de error
absoluto podemos obtener una idea del valor de m. En efecto, tenemos que:
em = ea = m m
m=m
+ ea ;
que podemos generalizar a:
em = ea = m m
m=m
ea ;
si tenemos en cuenta que el valor de ea puede ser positivo o negativo. As, una forma ms general
de escribir el error absoluto y el relativo es:
1. |ea | = |m m|;

m m
|m m|
|ea |
=
2. |er | =
=
.

m
|m|
|m|
1
En este caso, precisin se refiere a la unidad ms chica que el instrumento puede medir.
-4-
PRELIMINAR
Curso 008
Anlisis Numrico I
Como hemos supuesto que ea = em , sabemos cual es nuestro error absoluto, pero seguimos
sin saber cul es nuestro error relativo. Tenemos dos posibilidades para obtener m:
m=m
+ ea o m = m
ea ,
y entonces el error relativo sera:
er =
ea
ea
|ea |
|ea |
o er =
|er | =
o |er | =
.
m
+ ea
m
ea
|m
+ ea |
|m
ea |
Resulta, entonces, ms conveniente definirlo como:

er =
|ea |
,
|m|
cuando se conoce m
y ea .
1.4.
Propiedades de los algoritmos
Hemos dicho que el anlisis numrico se ocupa de estudiar algoritmos para resolver problemas de la matemtica continua. Dado que estos algoritmos son una aproximacin al problema
matemtico, resulta evidente que los resultados obtenidos estarn afectados por alguno de los
errores mencionados. Y cmo en muchas ocasiones los datos de entrada de ese algoritmo tambin
tienen errores, la pregunta que surge inmediatamente es: cmo sabemos si los resultados que
arroja el algoritmo son confiables? La pregunta no tiene una nica respuesta, depende del tipo
de error que analicemos o que tenga mayor influencia y de las caractersticas del problema
matemtico. Pueden tenerse varias aproximaciones acerca de un algoritmo, a saber:
1. Una primera aproximacin a una respuesta sera analizar cuan sensible son los resultados
que arroja un algoritmo cuando los datos de entrada se modifican levemente, o sea, cuando
sufren una perturbacin. Un anlisis de este tipo tiene dos formas ser encarado, por un
lado, estudiando la propagacin de errores (en ingls, forward error ), es decir, perturbar
los datos de entrada y ver qu consecuencia tiene en el resultado. Pero tambin se puede
estudiar de manera inversa, partir de una perturbacin en los resultados, y analizar que
grado de perturbacin pueden sufrir los datos de entrada, metodologa que se conoce como
anlisis retrospectivo (en ingls, backward error ). En ambos casos estamos estudiando la
influencia del error inherente.
2. Una segunda aproximacin puede ser analizar el algoritmo con diferentes representaciones
numricas en los datos de entrada y estudiar qu ocurre con los resultados, utilizando la
misma representacin. Este caso estudiamos la incidencia del error de redondeo.
3. Finalmente, y tal vez el ms sencillo de todos, una aproximacin puede ser analizar qu
ocurre cuando se requiere truncar un procedimiento o discretizar el dominio de nuestro
problema matemtico. Este tipo de anlisis puede que requiera solamente de un trabajo
algebraico ms que numrico, aunque suele mezclarse con el error de redondeo.
El primer caso, el anlisis de la propagacin de los errores inherentes, permite establecer
si el problema est bien o mal condicionado. Si al analizar un pequeo cambio en los datos (o
perturbacin) el resultado se modifica levemente (o tiene un pequeo cambio) enonces estamos
ante un problema bien condicionado. Si, por el contrario, el resultado se modifica notablemente
o se vuelve oscilante, entonces el problema est mal condicionado. Si ste fuera el caso, no hay
forma de corregirlo cambiando el algoritmo (como se ver despus) pues el problema est en el
modelo matemtico.
Curso 008
PRELIMINAR
-5-
Anlisis Numrico I
1.4. Propiedades de los algoritmos
Definicin 1.1. Un problema matemtico (numrico) se dice que est bien condicionado si pequeas variaciones en los datos de entrada se traducen en pequeas variaciones de los resultados.
Observacin 1.1.1. Un problema mal condicionado puede ser resuelto con exactitud, si realmente es posible, solamente si se es muy cuidadoso en los clculos.
Observacin 1.1.2. Si f representa al algoritmo real y f al algoritmo computacional, y
x a la variable real y x a la variable computacional, entonces el error en los resultados se
puede definir como:
|f (x) f (x )| |f (x) f (x )| + |f (x ) f (x)| + |f (x) f (x )| .
|
{z
} |
{z
} |
{z
}
condicin
estabilidad
truncamiento
Veremos ms adelante que las pequeas variaciones en los datos de entrada estn
asociadas al problema en cuestin. No es posible a priori definir cuantitativamente cuando
una variacin es pequea y cuando no lo es. El anlisis de los errores inherentes es importante
para establecer la sensibilidad del modelo numrico a los cambios en los datos, puesto que rara
vez los datos de entrada estn exentos de error.
El segundo caso es el que suele ser un dolor de cabeza para los analistas numricos. Si
analizamos un algoritmo ingresando los datos con diferentes representaciones numricas, esto es,
con diferente precisin, y los resultados no cambian demasiado (salvo por pequeas diferencias
en los decimales), entonces estamos en presencia de un algoritmo estable. Caso contrario, el
algoritmo es inestable.
El ltimo caso est asociado a procedimientos o algoritmos basados en series o iteraciones
infinitas, y suelo combinarse con alguno de los otros errores, como veremos ms adelante. En
consecuencia, lo que debe buscarse de un algoritmo es que sea estable. Qu significa esto en
la prctica? Supongamos (una vez ms, supongamos) que En mide un cierto error cometido en
el paso n de un algoritmo. Podemos expresar este error en funcin del error inicial, que puede
tener una de estas dos expresiones:
1. Error con crecimiento lineal: En c n E0
2. Error con crecimiento exponencial: En cn E0
Es evidente que el primer error es controlable, en tanto que el segundo, no. Puesto que
es imposible que no haya errores al trabajar con un algoritmo, lo que se debe buscar es que el
error siga una ley lineal (como en el primer caso) y no una ley exponencial. A partir de esta
comprobacin se desprende la siguiente definicin:
Definicin 1.2. Un algoritmo se considera estable cuando la propagacin de los errores de
redondeo es lineal o cuasi-lineal.
En cambio, un algoritmo que propaga los errores en forma exponencial es inestable.
Una de las razones principales de analizar la propagacin de los errores de redondeo
es conseguir que un algoritmo sea estable. Sin embargo, debemos tener bien presente que un
algoritmo estable en ciertas condiciones puede volverse inestable en otras, por lo que muchas veces
no existe el algoritmo universal. Dado que la estabilidad (o la inestabilidad) es una propiedad
exlusiva del algoritmo, si un problema se vuelve inestable podemos, muchas veces, corregirlo
cambiando el algoritmo inestable por otro estable. (Sin embargo, nunca hay que olvidar que un
problema puede volverse mal condicionado para determinadas condiciones de base, lo que hace
ms complejo el anlisis.)
Veamos un ejemplo que muestra la inestabilidad de un algoritmo. Tomemos la siguiente
integral definida:
Z 1
xn
yn =
dx;
0 x + 10
-6-
PRELIMINAR
Curso 008
Anlisis Numrico I
Figura 1.1: Curvas de las distintas funciones.

con n = 1; 2; . . . ; 34.
Es fcil ver que las primeras integrales analticas son relativamente fciles de obtener (por
ejemplo, para n = 1 o n = 2). En efecto, si queremos hallar y1 podemos hacer:

Z 1
x
11
1
1
y1 =
dx = x|0 10 ln(x + 10)|0 = 1 10 ln
;
10
0 x + 10
y1 = 1 10 ln(1, 1) = 0, 0468982019570.
Pero si queremos obtener y15 la situacin ya no es tan sencilla. Desarrollemos un algoritmo
que nos permita obtener los valores de yn sin tener que integrar o que al menos utilice aquellas
integrales fciles. Para un n > 1 cualquiera podemos decir que:
Z 1 n
Z 1
Z 1
x + 10 xn1
x + 10 n1
yn + 10 yn1 =
dx =
x
dx =
xn1 dx
x + 10
0
0
0 x + 10
1
1
yn + 10 yn1 =
yn = 10 yn1
n
n
Si queremos calcular y1 necesitamos obtener y0 que tambin resulta muy sencillo pues:
Z 1
1
y0 =
dx = ln (x + 10)|10 = ln (11) ln (10)
0 x + 10
y0 = ln(1, 1) = 0, 0953101798043.
Para analizar si el algoritmo arroja resultados confiables, empezaremos por calcular algunos valores. Habamos calculado el valor de y1 en forma analtica, por lo tanto, tenemos un valor
de comprobacin. Por otro lado, por las caractersticas del problema sabemos que 0 yn 1.
xi
y las graficamos, podemos ver que el rea bajo esas
Si definimos las funciones fi (x) =
x + 10
funciones es menor a 0,1
2 = 0, 05. En la figura 1.1 se pueden ver representadas algunas de estas
curvas.
Para comprobar la eficacia del algoritmo hemos utilizado dos programas de computacin
r
r
muy conocidos: el MathCAD
y el MS Excel
. Con el primero hemos calculado las yi en forma
Curso 008
PRELIMINAR
-7-
Anlisis Numrico I
1.4. Propiedades de los algoritmos
Tabla 1.1: Clculo de los yi

i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
-8-
Analtico
0,0468982019567514000
0,0310179804324860060
0,0231535290084732900
0,0184647099152671080
0,0153529008473289370
0,0131376581933772860
0,0114805609233700040
0,0101943907662999780
0,0091672034481113700
0,0083279655188863120
0,0076294357202277880
0,0070389761310554600
0,0065333156125223285
0,0060954153033481685
0,0057125136331849920
0,0053748636681500880
0,0050748927302638440
0,0048066282529171250
0,0045652964181971910
0,0043470358180281100
0,0041486894387665300
0,0039676510668801740
0,0038017502007634874
0,0036491646590318034
0,0035083534096819780
0,0033780043647186900
0,0032569933898501480
0,0031443518157842460
0,0030392404628472014
0,0029409287048613280
0,0028487774675157640
0,0027622253248423658
0,0026807770546066550
0,0026039941598158087
r
MathCAD
0,04689820195675065
0,031017980432493486
0,023153529008398455
0,018464709916015454
0,015352900839845474
0,013137658268211921
0,011480560175023635
0,010194398249763648
0,009167128613474629
0,008328713865253717
0,007621952256553738
0,00711381076779595
0,005784969245117427
0,013578878977397152
-0,06912212310730485
0,7537212310730486
-7,478388781318721
74,83944336874276
-748,3418021084802
7483,468021084803
-74834,63259180041
748346,3713725496
-7483463,670247235
74834636,74413903
-748346367,4013903
7483463674,052364
-74834636740,48662
748346367404,902
-7483463674048,985
74834636740489,89
-748346367404898,9
7483463674048989
-74834636740489890
748346367404898800
PRELIMINAR
r
MS Excel
0,04689820195675
0,03101798043248
0,02315352900857
0,01846470991435
0,01535290085650
0,01313765810168
0,01148056184036
0,01019438159642
0,00916729514693
0,00832704853072
0,00763860560192
0,00694727731410
0,00745030378206
-0,00307446639198
0,09741133058647
-0,91161330586469
9,174956588
-91,69401033
916,9927348
-9169,877348
91698,8211
-916988,1656
9169881,699
-91698816,95
916988169,5
-9169881695
91698816953
9, 16988 1011
9, 16988 1012
9, 16988 1013
9, 16988 1014
9, 16988 1015
9, 16988 1016
9, 16988 1017
Curso 008
Anlisis Numrico I
analtica y con el algoritmo dado; con el segundo, slo con el algoritmo. En la tabla 1.1 se tienen
los resultados obtenidos.
r
Podemos ver que los primeros valores obtenidos con el algoritmo, tanto en MathCAD
r

como en MS Excel , resultan una buena aproximacin. Los problemas aparecen para y12 y
siguientes. Detengmonos a analizar los resultados obtenidos a partir de y12 .
En el caso particular de este ltimo, el error empieza a ser considerable, comparando
con los resultados anteriores. En los siguientes valores se obtienen algunos resultados realmente
curiosos. Ya hemos visto que los valores de yn , o sea, las reas bajo las curvas, estn limitados
superiormente por 0, 05. Adems podemos ver que yn > yn+1 , es decir, que las reas bajo la
r
curva van disminuyendo a medida que crece n. Si miramos los obtenidos con MS Excel
, el y13
es mayor que el y12 , algo que no es posible segn lo visto antes. Y el y14 es, negativo! El rea
r
bajo la curva no puede ser negativa. Con los resultados obtenidos con el MathCAD
ocurre
algo similar. Para este programa, y14 da mayor que y13 , y el y15 da negativo, ambos resultados
ncorrectos.
A partir de estos valores, los resultados se vuelven oscilantes (cambian de signo), y mayores que uno (yn > 1 para n = 17; 18; . . . ; 34), algo que por el tipo de curva no es posible,
como ya vimos. En consecuencia, resulta evidente que el algoritmo tiene algn problema para
calcular los valores de yn cuando n 12, por lo que no nos sirve para obtener el y34 . An cuando
no tuviramos el resultado exacto, mirando la curva nos daramos cuenta que hay un diferencia
muy grande entre el valor real y el obtenido con el algoritmo. Ms an, el error que estamos
teniendo no sigue una ley lineal sino una ley exponencial (se va multiplicando por 10), lo que
dice claramente que el algoritmo analizado es inestable.
Este ejemplo nos muestra cmo un algoritmo mal diseado nos puede entregar resultados
que inicialmente son bastante aproximados pero que en pasos posteriores son incorrectos, y por
lo tanto, intiles.
Definicin 1.3. Un algoritmo debe ser diseado procurando que sea bien condicionado y estable.
Observacin 1.3.1. Un algoritmo inestable a la larga da resultados incorrectos, por ms que
est bien condicionado.
Es por eso que debemos desarrollar algn tipo de anlisis que nos permita detectar si un
algoritmo est bien condicionado o no y si es estable o no. Empezaremos por analizar algunos
tipos de error.
1.5.
Errores
1.5.1.
Error inherente
Este suele ser el error ms fcil de entender. Es el que est relacionado directamente con
los datos de entrada o de base. Dado que estos datos suelen provenir de mediciones, clculos
anteriores, proyecciones estadsticas, etc., el valor numrico de los datos no es exacto sino que
est asociado a un intervalo de validez. Cuando se mide una longitud con una cinta mtrica con
divisiones hasta el centmetro, el error por la apreciacin del instrumento es un centmetro o
medio centmetro (5 mm). Es decir, si mide 145,01 m, en realidad, se est diciendo que el valor
es 145, 01 0, 01 o 145, 010 0, 005. Lo mismo ocurre si los datos se obtienen por un clculo
anterior o una estimacin estadstica. En esos casos, el error se obtiene por otros mtodos.
Veamos un ejemplo. Supongamos que tenemos las siguientes cantidades, a = 3, 0 0, 1 y
b = 5, 0 0, 1 y queremos hallar z = a + b. lo que deberemos hacer es:
z = (3, 0 0, 1) + (5, 0 0, 1)
Al efectuar esta operacin obtendremos cinco resultados posibles: 7,8; 7,9; 8,0; 8,1 y 8,2.
Es decir, z est en el intervalo [7,8; 8,2], o, lo que es lo mismo, z = 8, 0 0, 2. As cualquier
resultado obtenido dentro del intervalo dado se puede considerar correcto.
Curso 008
PRELIMINAR
-9-
Anlisis Numrico I
1.5. Errores
Este muestra la sencillez del anlisis cuando las operaciones son pocas (en esta caso,
una). Sin embargo, si el algoritmo es ms complejo, hacer las n combinaciones posibles de operaciones con los datos de ingreso puede ser imposible y nada prctico. De ah que el anlisis de la
propagacin de los errores inherentes es la forma ms conveniente para establecer la incidencia
de los mismos en los resultados finales. Ms adelante vermos la diversas formas de analizar esta
propagacin.
1.5.2.
Error de redondeo
Antes de analizar el error de redondeo, veremos la manera de representar un nmero segn

la forma adoptada. A partir de esta representacin se entender cual es la verdadera incidencia
del error en los clculo efectuados con ayuda de una computadora.
Representacin numrica
Para empezar, supongamos el siguiente nmero: 43 . En el sistema decimal suele representarse como 1, 3333 . . . . Una forma alternativa es:

4 1
3
3
3
3
+
+
+
+
+ . . . 101 = 1, 3333 . . . ;
=
3
10 102 103 104 105
o sea, un nmero que slo puede representarse con una serie de infinitos trminos, algo imposible
desde el punto de vista prctico. Su nica forma de expresin exacta es simblica. Una calculadora, por ejemplo, slo puede representarlo en forma numrica (en base diez, como la escrita
arriba) y, por ende, la nica representacin posible es finita2 . En consecuencia, debe truncarse
esta serie en n trminos. Por ejemplo, una representacin posible es:

4 1
3
3
3
+
+
+
101 = 0, 1333 101 = 1, 333.
=
3
10 102 103 104
Podemos ver que esta representacin est formada por un coeficiente (0,1333), una base
(10) y un exponente (1). Esta forma de representacin se conoce como representacin de coma
(punto) flotante. Una generalizacin de esta representacin se puede escribir como:

d1
d1
d1
d1
d1
e
f l(x) = 0, d1 d2 d3 . . . dt1 dt 10 =
+
+
+ . . . + t1 + t 10e .
10 102 103
10
10
La forma normalizada es que d1 sea distinto de cero (1 d1 9) y que los restantes di
estn comprendidos en el siguiente intervalo: 0 d1 9, para i = 2; 3; 4; . . . ; t. Tambin se
limita el exponente e, con dos valores, I < 0 y S > 0, por lo que se cumple que I e S. As,
podemos hallar el mximo numro a representar, que es 0, 99 . . . 99 10S 10S , y el ms chico,
0, 10 . . . 00 10I = 10I1 .
Una vez definida la forma de representar los nmeros, pasemos a definir nuestra precisin,
que significa cuantos trminos di usaremos, esto es, el t que vimos, y el exponente e de la base.
Para complicar ms las cosas, las calculadoras y fundamentalmente, las computadoras,
usan una representacin numrica con base 2. Esto trae ventajas y desventajas. Por ejemplo,
puesto que se usa base 2, los di slo pueden valer 0 o 1, con excepcin del d1 , que vale siempre
1. Esto facilita la representacin de los nmeros y las operaciones. Pero las desventaja es que
slo los nmeros que pueden representarse como sumas de 21i resultan exactos. Veamos cmo
funciona esto.
Supongamos que tomamos nuestro sistema de representacin binario para representar
nuestro nmero inicial, 43 . Tomemos que la cantidad de trminos, t, sea 8 y dejemos por un
2
Distinto sera el caso si se usara base 3. Entonces
- 10 -
4
3
sera igual a 1,1; una representacin exacta.
PRELIMINAR
Curso 008
Anlisis Numrico I
momento libre de restricciones el exponente e. Entonces, tendremos lo suguiente:

1 1
1
1
4
2 = 0, 6640625 2 = 1, 328125;
0, 10101010 2 =
+ +
+
3
2 8 32 128
nmero parecido al buscado pero no igual. Esto nos muestra que existe una limitacin cuando
utilizamos una computadora (o una calculadora) para representar nmeros que no tienen una
representacin directa en base binaria. Asociada a esta limitacin, la de poder representar slo
una cantidad finita de nmeros, surge el error por corte o redondeo.
Error por corte/redondeo
Volvamos a nuestro sistema decimal tradicional. Supongamos ahora que nuestros nmeros
se pueden representar de la siguiente manera:
f l(x) = (0, d1 d2 d3 . . . dt dt+1 dt+2 . . .) 10e .
Si nuestra precisin elegida es t, entonces debemos recortar el nmero definido arriba, pues no
podemos representar los di para i > t. En consecuencia, tenemos dos alternativas bsicas para
efectuar dicho recorte:
1. Corte: Ignorar los dgitos di cuando i > t.
2. Redondeo: Sumar 1 a dt si dt+1
corte si dt+1 < 10
2 .
10
2
e ignorar los restantes di para i > t + 1, o aplicar
Esto nos permite obtener una cota del error absoluto para ambos casos:
t
10 10e para corte
eA =
1
t 10e para redondeo.
2 10
Y como definimos el error absoluto, tambin podemos definir un lmite para el error
relativo, que ser:
1. Corte: er
10t 10e
= 101t .
0, 1 10e
2. Redondeo: er
1
1 10t 10e
= 101t .
e
2 0, 1 10
2
Al valor 101t lo identificaremos con la letra , y resulta ser importante porque nos da
una idea del error relativo que cometemos al utilizar una representacin de coma flotante. Suele
denominarse como unidad de mquina o unidad de redondeo. El negativo del exponente
de suele llamarse tambin cantidad de dgitos significativos.
Dgitos de guarda
Supongamos el siguiente caso. Tomemos el nmero 0,1425 que debe ser redondeado a tres
dgitos significativos. Aplicando el criterio anterior rpidamente obtenemos que el resultado es
0,143 pero, es correcto este redondeo? Por qu no redondear a 0,142; si est a medio camino
de ambos? Supongamos que hacemos la operacin 2 0, 1425, cuyo resultado es 0, 2850, qu
pasa con la misma operacin si el nmero est redondeado? Evidentemente da diferente puesto
que la operacin es 2 0, 143 cuyo resultado es 0, 286. La diferencia entre ambos es 0, 001 que es
justamente la unidad de redondeo. Esto se vuelve an ms importante cuando se tiene la resta
de nmeros similares (a b con a b). De ah que la mayora de las computadoras actuales (y
los programas) trabajen con lo que se conoce como dgitos de guarda, es decir, ms precisin
que la mostrada en forma normal en pantalla. Pero este ejemplo sirve adems para desarrollar
otra forma de redondeo.
Curso 008
PRELIMINAR
- 11 -
Anlisis Numrico I
1.5. Errores
Redondeo exacto
Tal como dijimos, el nmero 0, 1425 est mitad de camino de ser redondeado a 0, 143
como a 0, 142. Este problema ha llevado a desarrollar el concepto de redondeo exacto, que
consiste en redondear todos los nmeros que terminan en 5 de manera de que el ltimo dgito
significativo sea par. En consecuencia, aplicando este criterio, 0, 1425 se redondea a 0, 142 y no
a 0, 143. El criterio va de la mano del dgito de guarda y debera ser el redondeo normal.
(Para ms detalles respecto a dgitos de guarda y el redondeo exacto, vase [3].)
1.5.3.
Error de truncamiento/discretizacin
Este error surge de aproximar procesos continuos mediante procedimientos discretos o

de procesos infinitos mediante procedimientos finitos. Como ejemplo del primer caso suele
tomarse la diferenciacin numrica como forma de aproximar el clculo de una derivada en un
punto (o su equivalente, la integracin numrica), en tanto que para el otro, el ejemplo ms es
usual es la utilizacin de mtodos iterativos para resolver sistemas de ecuaciones lineales.
En general, este error est asociado al uso de la serie de Taylor para aproximar funciones,
de modo que estimar una cota del error no conlleva una dificultad mayor. Sin embargo, en l
suelen interactuar el error inherente y/o el de redondeo, con lo que muchas veces su influencia
no es bien advertida o es muy reducida. Para ello veamos un ejemplo tpico.
Supongamos que queremos calcular una aproximacin de f 0 (x0 ) para una funcin continua, pues no es posible obtener la derivada en forma analtica o resulta muy difcil. Por lo tanto,
usaremos un entorno del punto x0 para calcular f 0 (x0 ) utilizando solamente f (x). Para ello nos
valdremos de la serie de Taylor. En efecto, para cualquier punto distante h de x0 tendremos:
f (x0 + h) = f (x0 ) + f 0 (x0 )h + f 00 (x0 )
h2
h3
h4
+ f 000 (x0 ) + f 0000 (x0 ) + . . . .
2
6
24
Entonces podemos despejar f 0 (x0 ), que resulta ser:

f (x0 + h) f (x0 )
h
h2
h3
00
000
0000
f (x0 ) =
f (x0 ) + f (x0 ) + f (x0 ) + . . . .
h
2
6
24
0
Si nuestro algoritmo para aproximar f 0 (x0 ) es:

f (x0 + h) f (x0 )
,
h
el error que cometemos en la aproximacin est dado por:

2
3
0
00

f
(x
+
h)
f
(x
)
h
h
h
0
0
000
0000
f (x0 )
= f (x0 ) + f (x0 ) + f (x0 ) + . . . .

h
2
6
24
El trmino de la derecha es el denominado error de truncamiento, pues es lo que se trunc
a la serie de Taylor para aproximar el valor buscado. Este error suele asociarse tambin con la
convergencia (o la velocidad de convergencia), que suele representarse como O(n) (generalmente,
como O(hn )), siendo n el parmetro que determina la velocidad o la convergencia. En nuestro
caso, y dado que h generalmente es menor a 1, podemos decir que la aproximacin es del tipo:
f 0 (x0 ) =
f (x0 + h) f (x0 )
+ O(h),
h
que indica que el error que se comete es proporcional a h. (Est claro que adems estn los
trminos con h2 , h3 , etc., pero como h < 1 entonces h2 << h, h3 << h2 , etc., la influencia de
stos es mucho menor y despreciable.)
- 12 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Supongamos por un momento que todas las derivadas f <i> (x0 ) = 0 para i 3. Entonces
tendremos que:

0
f (x0 ) f (x0 + h) f (x0 ) = h f 00 () con [x; x + h],
2

h
con lo cual, si conociramos f 00 (), podramos acotar el error que estamos cometiendo por desh
preciar el trmino f 00 (x0 ).
2
Como ejemplo, apliquemos este algoritmo para obtener la derivada en x0 = 0, 45 (f 0 (0, 45))
de la funcin f (x) = sen(2x). Como verificacin tomemos el valor analtico de la derivada en
cuestin: f 0 (0, 45) = 2 cos(2 0, 45) = 5, 97566. Para calcular la aproximacin tomemos
h = 0, 1. As, tendremos.
f 0 (0, 45) =
f (0, 55) f (0, 45)

sen(2 0, 55) sen(2 0, 45)
=
= 6, 18034.
0, 1
0, 1
En la tabla 1.2 podemos ver los resultados obtenidos para distintos h.

Tabla 1.2: Valores de f 0 (x0 ) en funcin de h
h
101
102
103
104
105
106
107
108
109
1010
1011
1012
1013
1014
1015
1016
f 0 (x0 )
-6,18033988749895
-6,03271072100927
-5,98172474217345
-5,97627391137889
-5,97572532307633
-5,97567042914804
-5,97566494175972
-5,97566438553798
-5,97566451876474
-5,97566607307698
-5,97566995885756
-5,97544236313752
-5,97633054155722
-5,99520433297584
-5,88418203051333
-8,32667268468867
Error
2, 04676 101
5, 70464 102
6, 06041 103
6, 09582 104
6, 09936 105
6, 09966 106
6, 12277 107
5, 60549 108
1, 89282 107
1, 74359 106
5, 62937 106
2, 21966 104
6, 66212 104
1, 95400 102
9, 14823 102
2, 35101
Si observamos con atencin, veremos que el algoritmo utilizado aproxima muy bien el
108
obtenemos una
valor buscado hasta h = 108 . Si estimamos la cota de error con f 00 (x0 )
2
valor muy parecido al error indicado en la tabla 1.2:
f 00 (0, 45)
108
= 6, 09975 108 (5, 60549 108 ).
2
Sin embargo, a partir de h < 108 el error vuelve a crecer. En la figura 1.2 se puede ver
como evoluciona el error:
Si analizamos en detalle, vemos que la tendencia del error de truncamiento es lineal (en
escala logartmica) pero para h < 108 el error aumenta y no sigue una ley determinada. Este
empeoramiento de la aproximacin se debe a la incidencia del error de redondeo, es decir, la
unidad de mquina pasa a ser ms importante que el error de truncamiento. Es por eso que
Curso 008
PRELIMINAR
- 13 -
Anlisis Numrico I
1.5. Errores
Figura 1.2: Evolucin del error del algoritmo.
no siempre el utilizar una mejor precisin ayuda a mejorar los resultados finales. En este
tipo de problemas, es conveniente que el error que domine los clculos sea el de truncamiento/discretizacin.
1.5.4.
Errores por overflow y underflow
Asociados a la represenatcin numrica existen otros dos tipos de errores. Son los denominados errores por overflow y por underflow. Estos errores surgen por las limitaciones de
nuestro sistema para representar nmeros muy grandes (overflow) o muy chicos (undeflow).
Es usual que los manuales del usuario de una calculadora indiquen el nmero ms grande (y
el ms chico) que puede ser representado. Por ejemplo, las calculadoras Casio de la dcada de
los 80 no podan representar n! si n > 69 pues el nmero ms grande que podan representar
era 9, 999999999 1099 (69!=1, 71122452428141 1098 y 70!=1, 19785716699699 10100 ). Algo
similar ocurre con los nmeros muy chicos.
Un error muy comn es olvidarse que en los clculos intermedios pueden aparacer
nmeros muy grandes o muy chicos, fuera del rango de nuestra representacin numrica, que
vuelven a un algoritmo intil. Por ejemplo, supongamos que nuestro sistema de representacin
numrica en una calculadora represente solamente losnmeros entre -10.000 y -0,0001; y entre
0,0001 y 10.000. Si queremos obtener el resultado de 1012 50, como 1012 = 10.201 > 10.000
y no lo puede representar, indicar un error por overflow, es decir, nmero ms grande que el
mximo a representar, y cortar la ejecucin del algoritmo.
El error por underflow es parecido. En este caso, el problema es no poder representar
un nmero muy pequeo, por lo que lo define como
pcero (0). Si modificamos levemente el ejemplo anterior, y queremos obtener el resultado de 0, 01 0, 0062 , como 0, 0062 = 0, 000036 <
0, 0001 y no le es posible representarlo, har 0, 0062 = 0, 0000 y la operacin quedar como
0, 01 0, 0 = 0, 01 = 0, 1.
La diferencia entre ambos es que el error por overflow no pasa desapercibido, mientras
que el underflow s, y en consecuencia, suele ser ms peligroso.
- 14 -
PRELIMINAR
Curso 008
Anlisis Numrico I
1.6.
Propagacin de errores
Hemos visto varios ejemplos que nos mostraron en forma evidente la incidencia que pueden
llegar a tener los errores en los resultados que entrega un algoritmo, particularmente, el error
de redondeo. Veremos a continuacin la propagacin de dos de los errores ms problemticos, el
inherente y el de redondeo.
1.6.1.
Propagacin del error inherente
Supongamos que tenemos un problema numrico tal que podemos expresarlo como X
Y (X), siendo X un vector de <n , que corresponde a los datos de entrada, e Y un vector de <m ,
que corresponde a los resultados. Podemos escribir entonces que:

y1 (X)
x1
y2 (X)
x2

X . Y (X) = . ,
.
.
.
.
ym (X)
xn
donde yi (X) : <n <; Y (x) : <n <m .
es decir, una aproximacin
Por otra parte, supongamos que en lugar de X conocemos X,
de X; podemos definir que exi = xi x
i , que tambin conocemos. Y nuestra ltima suposicin es
que las yi (X) pertenecen a C (X), lo que nos permite desarrollar Y (X) en una serie de Taylor
alrededor de X:
h
i
y2 (X);
. . . ; ym (X)
y1 (X);

+
+T X X
.
Y (X) = Y X
(X X)
[x1 ; x2 ; . . . ; xn ]
Podemos
suponer ahora que exi = xi x
1 para i [1, n] es muy pequeo, y que por eso

T X X es despreciable, con lo que nos queda:

n
X
yi X
=
yi (X) yi X
(xj x
j ) para i = 1; 2; . . . ; m,
xj

j=1
que por analoga a exi podemos expresar como:

n yi X
X
exj ; para i = 1; 2; . . . ; m,
eyi =
xj
j=1
que nos da el error de yi en funcin de del error de xj . Esta expresin es muy til porque nos
permite obtener o determinar el error de un resultado si conocemos el error de los datos de
entrada, es decir, cmo se propagan los errores inherentes. Veamos algunos ejemplos:
1. Suma: Hagamos y (x1 ; x2 ) = x1 + x2 , entonces tendremos:
ey = ex1 +x2 =
y (
x1 ; x
2 )
y (
x1 ; x
2 )
ex1 +
ex2 ,
x1
x2
o sea,
ey = 1 ex1 + 1 ex2 ey = ex1 + ex2 .
El error relativo ser:
ery =
ey
ex1
ex2
ex + ex2
= 1
=
+
.
y
x1 + x2
x1 + x2 x1 + x2
Sabemos que ex1 = x1 erx1 y ex2 = x1 erx2 , por lo que podemos escribir:
ery =
Curso 008
x1 erx1
x2 erx2
x1
x2
+
=
erx1 +
er .
x1 + x2
x1 + x2
x1 + x2
x1 + x2 x2
PRELIMINAR
- 15 -
Anlisis Numrico I
1.6. Propagacin de errores
2. Producto: En este caso tenemos y (x1 ; x2 ) = x1 x2 , entonces:

ey = x2 ex1 + x1 ex2 .
El error relativo para el producto ser:
ery =
ey
x1 ex2
x2 ex1
+
= erx1 + erx2 .
=
y
x1 x2
x1 x2
Hasta aqu no pareciera haber problemas. Sin embargo, raramente se conoce el error con
su signo, de ah que lo que se busca es una cota del error, no el error en s mismo. En ese caso,
las expresiones del error relativo se modifican levemente:

|x1 |
|x2 |
erx1 +
erx2 .
|x1 + x2 |
|x1 + x2 |

2. Producto: ery = erx1 + erx2 .
1. Suma: ery =
A partir de este razonamiento es que la suma es una operacin mal condicionada cuando
se da que |x1 | |x2 | y x2 < 0 es decir, la suma algebraica. Suponiendo que erxi r se tiene:
ery =
|x1 | + |x2 |
r.
|x1 x2 |
lo que hace que ery crezca en forma incontrolada, pues el coeficiente siempre es mayor a uno,
puede ser mucho mayor que 1 si x1 x2 es muy chico.
Analizaremos ahora la propagacin del error de redondeo.
1.6.2.
Propagacin del error de redondeo
Supongamos ahora que en nuestro problema no tenemos errores inherentes. Por lo tanto,
para X Y (X) : <n <m slo tendremos errores de redondeo debido al algoritmo utilizado.
Sea P (X) nuestro algoritmo para obtener Y (X). Si no hubieran errores por redondeo, entonces
Y (X) = P (X), pero lo que en realidad obtendremos es Y (X) = P (X), es decir que podemos
escribir que:
#
"
p
X
Y (X) = Y (X) + E(X) yi (X) = yi (X) 1 +
Fi,k (X)k ,
k=1
con |k | , y donde los Fi,k son los factores de amplificacin.
1.6.3.
Propagacin de los errores inherentes y de redondeo

Ya hemos visto la expresin para calcualr la propagacin de los errores inherentes, que
es:
eyi =
n
X
yi (X)
j=1
xj
exj
=
n
X
yi (X)
j=1
xj
exj .
Como adems tendremos P (X) en vez de Y (X), entonces:

eyi
= epi =
n
X
pi (X)
j=1
xj
exj ,
y el error relativo ser:
pi (X)
x
j
j=1
xj
erxj ,
pi (X)
Pn
erpi =
- 16 -
PRELIMINAR
Curso 008
Anlisis Numrico I
en consecuencia, el coeficiente que afecta a erxj ser el nmero de condicin del problema, que se
define como :
Pn pi (X)
x
j
j=1
xj
.
Cpi =
pi (X)
Del mismo modo, tendremos el trmino de estabilidad, que se define como:
= pi (X)

yi (X) pi (X)
p
X
k Te =
Fi,k (X)
k=1
p
X
k
Fi,k (X)
=
k=1
p
X
Fi,k (X).
k=1
Si suponemos que erxj r, entonces, tendremos:

er
= Cp r + Te ,
yi
que ser el error relativo total.

Finalmente, si suponemos ahora que r
= , entonces tenemos:
Cp + Tei
,
eryi
= (Cpi + Tei ) = Cpi i
Cpi
y podemos decir que un algoritmo es estable si:
Cpi + Tei
Te
> / > 1 1 + i > / > 1,
Cpi
Cpi
es decir, un algoritmo es estable si los errores de redondeo no tienen gran incidencia en el error
Te
del resultado o al menos son del mismo orden que los errores inherentes (1 + i
= 2). Sin
Cpi
embargo, esta afirmacin debe tomarse con cuidado. Dado que lo que se analiza es la relacin
Te
Te
, debe tenerse en cuenta que si Cp >> 1 y
1 entonces Te >> 1, por lo que es posible
Cp
Cp
que el algoritmo sea inestable.
1.7.
Grfica de proceso
Una forma de obtener los coeficientes Cp y Te es mediante la grfica de proceso. sta

consiste en un diagrama de flujo que representa grficamente todo el proceso de una operacin
dada, permitiendo el anlisis de los errores relativos y de redondeo que intervienen en l. No se incluyen en esta grfica los errores debidos a truncamiento/discretizacin, que deben ser analizados
en forma separada.
En las figuras 1.3 y 1.4 se pueden ver las grficas de proceso de la suma y el producto.
Analicemos brevemente los errores inherentes y de redondeo en ambos casos. Si nos fijamos
en la grfica de la suma,
y tomamos una cota superior para los errores relativos inherentes de x
e y, por ejemplo, |erx | ; ery < |r|, entonces el coeficiente Cp se puede escribir como:
Cp =
|x| + |y|
|x + y|
que es el mismo resultado obtendido antes para la suma.

Algo similar se obtiene para el producto.
La ventaja de este mtodo es que facilita el anlisis del error de redondeo al introducirlo
en cada operacin, permitiendo el clculo del trmino de estabilidad (Te ). Segn estas grficas,
en ambos casos el Te es igual a 1.
Sin embargo, esto que parece muy til, puede convertirse en algo muy difcil de desarrollar
cuando se tiene un algoritmo con miles de pasos, como puede ser la resolucin de un sistema de
ecuaciones lineales mediante un mtodo directo. Analizar millones de operaciones mediante la
grfica de proceso puede ser una tarea imposible. Por lo tanto, debemos buscar otra manera de
obtener ambos coeficientes.
Curso 008
PRELIMINAR
- 17 -
Anlisis Numrico I
1.8. Perturbaciones experimentales
Figura 1.3: Suma.
Figura 1.4: Producto.
1.8.
Perturbaciones experimentales
Supongamos que queremos estudiar la condicin o la estabilidad de un algoritmo con miles

de pasos. Ya dijimos que hacer la grfica de proceso puede ser una tarea imposible. Entonces,
cmo hacemos para saber si dicho algoritmo est bien condicionado o es estable? Veamos. Para
empezar, estudiemos cmo obtener una aproximacin de la condicin del problema. Puesto que
la condicin viene dada por la propagacin (o no) de los errores relativos inherentes, busquemos
la manera de obtener en forma numrica una estimacin del coeficiente de condicin, o sea, del
Cp . En el mismo sentido, el trmino de estabilidad, Te est relacionado con la propagacin de
los errores de redondeo. Busquemos tambin algn procedimiento que nos permita obtener una
estimacin de dicho coeficiente.
1.8.1.
Estimacin del nmero de condicin

Partamos de la expresin final del error relativo de un resultado:
er = Cp r + Te
- 18 -
PRELIMINAR
Curso 008
Anlisis Numrico I
y supongamos por un momento que no tenemos errores de redondeo, es decir, despreciamos Te .

En consecuencia, lo que tendremos es:
er = Cp r Cp =
er
r
Y con esto podemos estimar valor del Cp . Cmo lo hacemos? Perturbando los valores de
los datos de entrada. La idea es la siguiente: se toman los datos de entrada (x, y, etc.), y se aplica
el algoritmo a analizar, obteniendo el resultado correspondiente. Luego se perturban los datos
de entrada, es decir, se les incorpora un error. Con estos datos de entrada, se vuelve a calcular
un resultado, que seguramente diferir del anterior, pues los datos no son iguales. Este ltimo
paso se puede hacer varias veces introduciendo distintas perturbaciones (errores) a los datos de
entrada.
Una vez obtenidos los distintos valores de los resultados, tomamos el resultado sin perturbar como resultado exacto, con el cual vamos a calcular los errores relativos de los otros
resultados perturbados. Con cada uno de stos obtendremos diferentes eri . Como adems tendremos diferentes ri , lo que obtendremos finalmente son diferentes Cpi . Como hemos supuesto
que los errores de redondeo son despreciables, todos los Cpi deberan ser similares, con lo cual
tendremos una estimacin de la condicin del problema, es decir, estimamos un Cp . Con esta
estimacin podremos establecer si el problema est bien o mal condicionado.
Veamos un ejemplo. Tomemos la siguiente funcin para calcular sen(x):
f (x) = x
x3
x5
x7
x9
+
+
,
6
120 5040 362880
funcin obtenida a partir del truncamiento de la serie de MacLaurin. Con ella calculemos sen( 4 )
y luego perturbemos el dato de entrada.
El primer resultado lo obtenemos con x = 4 :
f

4
=
4

3
4
6

5
4
120

7
4
5040

9
4
362880
= 0, 70711
Perturbemos ahora x haciendo x1 = x (1 + 0, 001) (r1 = 0, 001), y calculemos f (x1 ):

f
(1 + 0, 001) = 0.70655
4
Introduzcamos una nueva perturbacin, esta vez haciendo x2 = x (1 0, 001) (r2 = 0, 001), y
calculemos f (x2 ):

f
(1 0, 001) = 0.70766
4
Ahora calculemos los dos Cp . Para el primer caso tenemos:
Cp =
0, 70711 0, 70655
1
= 0, 78571
0, 70711
0, 001
Para el segundo caso tenemos:

Cp =
1
0, 70711 0, 70766
= 0, 78509
0, 70711
0, 001
Si calculamos el Cp en forma analtica obtenemos:

f (x)
d f (x)
Cp =
=
=1
x
dx

2
4
2

4
4
24

6
4
720

8
4
40320
cos

4
Cp 0, 78540
Esto demuestra que la estimacin del Cp es muy buena y que el problema est bien
condicionado, pues Cp < 1.
Curso 008
PRELIMINAR
- 19 -
Anlisis Numrico I
1.8. Perturbaciones experimentales
1.8.2.
Estimacin del trmino de estabilidad
Para obtener una estimacin del trmino de estabilidad, seguiremos un esquema similar
al visto para el nmero de condicin. Partamos nuevamente de la expresin final para el error
realtivo:
er = Cp r + Te
Ahora consideremos como hiptesis que los errores inherentes son despreciables, por lo que podemos decir que el error relativo es:
er = Te .
El error relativo est definido como:
er =
por lo tanto podemos escribir:
y y
,
y
y y
= Te .
y
Al calcular el valor de y con dos precisiones diferentes t y s, (s = 101s y t = 101t ),

y asumiendo que t > s, obtenemos los siguientes errores relativos:
ert =
y yt
y ys
= Te t ; ers =
= Te s .
y
y
Si restamos ert a ers tenemos:

ers ert =
yt ys
= Te (s t ),
y
de donde despejamos Te :
Te =
yt ys
.
y (s t )
Como el valor de y no lo conocemos, tomamos yt en su lugar. En consecuencia, la expresin

queda:
Te =
yt ys
.
yt (s t )
Esta expresin nos permite obtener una estimacin del Te calculando dos aproximaciones
de y, yt y ys , con diferente precisin, utilizando el mismo algoritmo.
Como ejemplo, utilicemos el mismo algoritmo del caso anterior. Calculemos el valor de
sen 4 con tres precisiones distintas: s = 4; t = 8 y u = 15. Para cada caso tendremos:
ys = 0, 706; yt = 0, 7071068 y yu = 0, 70710678293687. Con estos valores calculamos los Te ,
tomando como valor de referencia yu . As, obtenemos los siguientes valores:
Tes =
yu ys
0, 70710678293687 0, 706
=
= 1, 565;
yu (s u )
0, 70710678293687 (103 1014 )
Tet =
yu yt
0, 70710678293687 0, 7071068
=
= 0, 241.
yu (t u )
0, 70710678293687 (107 1014 )
Si analizamos un poco los valores obtenidos, vemos que en el primer caso el error de
redondeo se amplifica, puesto que el Te es mayor que 1. En cambio, en el segundo, la situacin
es muy buena porque los errores se mantienen acotados, no se amplifican (Te < 1). Podramos
decir que calcular el valor de y con ms precisin mejora el resultado final, pero hemos vistos
que no siempre esto es cierto.
- 20 -
PRELIMINAR
Curso 008
Anlisis Numrico I
1.9.
Inestabilidad en los algoritmos
Como hemos dicho, el principal objetivo del anlisis numrico es obtener algoritmos que
estn bien condicionados y sean estables. Hasta ahora nos hemos referido a los principales errores
que afectan a los algoritmos y hemos analizado los distintos errores y su propagacin, segn sea
el caso. Adems, hemos visto que la condicin de un problema es independiente del algoritmo,
en tanto que la estabilidad es una propiedad el mismo. Es por eso que el anlisis numrico
se concentra ms en estudiar cmo hacer que un algoritmo sea estable ms que en analizar su
condicionamiento, aunque en algunos casos este ltimo anlisis sea muy importante, como por
ejemplo, para resolver sistemas de ecuaciones lineales.
La mayora de los libros y cursos de anlisis numrico hacen hincapi en varios conceptos
para obtener un algoritmo estable. Alguno de stos son:
1. La resta de dos nmeros muy similares (cancelacin) siempre debe ser evitada.
2. El problema del error de redondeo es su acumulacin.
3. Aumentar la precisin en los clculo mejora la exactitud de los resultados.
Segn N. Higham (vase [5], cpitulo 1), estos conceptos son en realidad malos entendidos,
y desarrolla algunos ejemplos que muestran lo contrario. Veamos alguno de ellos.
1.9.1.
Cancelacin
En su libro, Higham presenta el siguiente caso. Supongamos que debemos hacer la siguiente operacin:
1 cos(x)
f (x) =
,
x2
con x = 1, 2 105 y con cos(x) = c redondeado a 10 dgitos significativos, con un valor de
c = 0, 9999999999;
de manera que
1 c = 0, 0000000001.
10
10
Al calcular f (x) = 1c
se obtiene f (x) = 1,4410
10 = 0, 6944 . . ., resultado evidentenente
x2
incorrecto pues es claro que 0 f (x) 1/2 para todo x 6= 0.
Al analizar la cota del error relativo para la resta x
= a
b, donde a
= a(1 + a) y
b = b(1 + b) obtiene:

x x
aa + bb
|a| + |b|

max(|a| , |b|)
.
x =

ab
|a b|
La cota del error relativo de x
es muy grande cuando |a b| << |a| + |b|. Por lo tanto, afirma
que una resta con esta condicin da preeminencia a los errores iniciales.
Tambin afirma que la cancelacin no siempre es mala, por varias razones. La primera
es que los nmeros a restar pueden ser libres de error. La segunda, que la cancelacin puede ser
una seal de un problema intrnsecamente mal condicionado y, por lo tanto, inevitable. Tercero,
los efectos de la cancelacin dependen del contexto en que se efecta. Si x >> y z > 0, la
resta en la operacin x + (y z) es inocua.
Curso 008
PRELIMINAR
- 21 -
Anlisis Numrico I
1.9. Inestabilidad en los algoritmos
1.9.2.
Acumulacin del error de redondeo
Desde que se cre la primera computadora, la acumulacin del error de redondeo ha

sido uno de los dolores de cabeza de los especialistas, como se puede ver en esta frase: La
extraordinaria rapidez de las actuales mquinas significa que en un problema tpico se realizan
millones de operaciones con coma (punto) flotante. Esto quiere decir que la acumulacin de
errores de redondeo puede ser desastrosa. Para Higham esta afirmacin, si bien cierta, no es
del todo correcta o est mal enfocada. En muchas ocasiones la inestabilidad est dada por la
incidencia de unos pocos errores de redondeo y no por la acumulacin de millones de ellos. Un
ejemplo en ese sentido est dado por el algoritmo del ejemplo inicial, en el cual el error est
dado por el redondeo de yn1 , que se propaga a medida que el valor es cada vez ms chico. Otro
ejemplo es el clculo de e usando su definicin:

1 n
f (n) = lm 1 +
,
n
n
tomando n finito pero lo suficientemente grande. En la tabla 1.3 se pueden los resultados para
r
distintos n obtenidas en MS Excel
.
Tabla 1.3: Valores de f (n) y diferencia con e.
n
101
102
103
104
105
106
107
108
109
1010
1011
1012
1013
1014
1015
f (n)
2,593742460100000
2,704813829421530
2,716923932235590
2,718145926824930
2,718268237192300
2,718280469095750
2,718281694132080
2,718281798347360
2,718282052011560
2,718282053234790
2,718282053357110
2,718523496037240
2,716110034086900
2,716110034087020
3,035035206549260
|e f (n)|
1, 24539 101
1, 34680 102
1, 35790 103
1, 35902 104
1, 35913 105
1, 35936 106
1, 34327 107
3, 01117 108
2, 23553 107
2, 24776 107
2, 24898 107
2, 41668 104
2, 17179 103
2, 17179 103
3, 16753 101
Como podemos observar, a medida que n aumenta, mejora la aproximacin de e. Sin

embargo, eso ocurre slo para n < 108 . Cuando n 109 la aproximacin se vuelva cada vez
peor, como es el caso de n = 1015 . Al igual que en el ejemplo ya citado, el problema es la
imposibilidad de representar correctamente n1 cuando n es muy grande y, en consecuencia, un
solo error de redondeo incide negativamente en el resultado obtenido.
1.9.3.
Aumento de la precisin
El caso anterior muestra tambin que el aumento de la precisin para no siempre significa
una mejora en los resultados obtenidos. Es usual que cuando la nica fuente de error es el
redondeo, la forma tradicional de corregir esto es aumentar la precisin y ver qu ocurre con los
resultados, comparando cuntos dgitos coinciden en los resultados original y con mayor precisin.
Pero en el caso de trabajar con un problema mal condicionado, el aumento de la precisin
no resulta en una mejora en los resultados. En ese caso, es muy posible que los resultados
- 22 -
PRELIMINAR
Curso 008
Anlisis Numrico I
obtenidos no tengan ningn dgito en comn. Un ejemplo tpico es el siguiente. Supongamos que
resolvemos el siguiente sistema de ecuaciones lineales:
4
10
2
x
4
1 =
.
1
1
x2
3
Si utilizamos dos precisiones diferentes para resolver el sistema, una con cuatro decimales
y otra con tres, obtenemos los siguientes vectores [x]:

x1
0, 01
x1
1, 0001
=
con tres decimales,
=
con cuatro decimales.
x2 1
2
x2 2
2
Vemos que el aumento de la precisin nos da un resultado completamente distinto para la
primera componente y por consiguiente, no son comparables. Este un tpico caso de una matriz
considerada como mal condicionada y que debemos transformarla para obtener resultados
mejores. As, si intercambiamos filas tenemos:

1
1
x
3
1 =
,
4
10
2
x2
4
la solucin que obtenemos es:

x1
1, 0
=
x2
2, 0
cualquiera sea la precisin utilizada y que corresponde a la solucin correcta.
Es evidente que el aumento en la precisin de los coeficientes no mejora los resultados.
Este es un caso especial de matrices cuya solucin merece un estudio ms detallado que se ver
en Sistemas de Ecuaciones Lineales.
1.10.
Diseo de algoritmos estables
El anlisis de los errores y, fundamentalmente, de la propagacin de estos errores, nos

ayuda a obtener algunos lineamientos para disear algoritmos estables, si bien no hay recetas
simples para ello. La mejor recomendacin es estar alerta en obtener un algoritmo estable cuando
se lo disea y no concentrarse solamente en otras cuestiones, como el costo computacional o la
posibilidad de su paralelizacin.
En su libro, Higham da una serie de lineamientos, entre los cuales se destacan los siguientes:
1. Evitar la resta de cantidades con errores.
2. Minimizar el tamao de las cantidades intermedias relativas al resultado final. La razn
es que si las cantidades intermedias son demasiado grandes, el resultado final puede ser
consecuencia de una resta daina. O visto de otra manera, cantidades grandes tapan los
datos iniciales y en consecuencia, se pierde informacin.
3. Es ms ventajoso escribir una expresin que actualice la informacin como
valornuevo = valorviejo + pequea correccin
si la pequea correccin se puede calcular con muchos dgitos significativos 3 . Muchos
de los mtodos numricos se expresan de esta forma, como por ejemplo, el mtodo de
Newton-Raphson, el mtodo del Gradiente Conjugado para resolver sistemas de ecuaciones
3
Sin embargo, Higham mismo reconoce que no es necesario operar con muchos dgitos significativos para
obtener buenos resultados utilizando este procedimiento. Vase [6]
Curso 008
PRELIMINAR
- 23 -
Anlisis Numrico I
1.10. Diseo de algoritmos estables
lineales, los mtodos para resolver ecuaciones diferenciales ordinarias. Un ejemplo clsico
es el mtodo del refinamiento iterativo de la solucin para un sistema de ecuaciones lineales
de la forma Ax = B, en el que se calcula el residuo r1 = B A
x1 , y con l un valor 1
resolviendo A1 = r1 , para luego mejorar el resultado obtenido con la iteracin x
2 = x
1 +1 .
4. Usar transformaciones bien condicionadas.
Una recomendacin importante es que se revisen los resultados intermedios, es decir, los
que se generan durante el procedimiento de clculo. Esta prctica era muy comn en los inicios
de la computacin electrnica. Wilkinson, el padre del anlisis de la propagacin de errores, gan
una gran experiencia respecto a la estabilidad numrica gracias a ese tipo de revisin. Es irnico
que con las grandes facilidades que se tienen hoy para rastrear los pasos de un algoritmo (ventanas
mltiples, herramientas grficas, impresoras rpidas), a veces se obtengan menos resultados que
en esa poca en las cuales slo se contaba con papel y lmparas (vlvulas).
- 24 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Captulo 2
Sistemas de Ecuaciones Lineales

2.1.
Introduccin
Una de las caractersticas fundamentales del uso de las computadoras es la dificultad

para trabajar con mtodo simblicos. Si bien hoy existen varios programas que trabajan con
matemtica simblica (Mathematica, Maple, MathCAD), no es lo ms usual y mucha veces
la capacidad de esos programas se ve excedida por las demanadas ingenieriles en cantidad de
clculo. Ms de una vez la necesidad de obtener un resultado en el menor tiempo posible hace
imperioso contar con algn mtodo que estime el valor en forma numrica.
Buena parte de los problemas ingenieriles de la actualidad hacen un uso intensivo de
sistemas de ecuaciones lineales, usualmente definidos como Ax = B. En particular, el uso extendido de programas que aplican el mtodo de los elementos finitos o de las diferencias finitas
es un ejemplo de ello. En esos programas, como los de anlisis estructural, el ncleo principal del programa es la resolucin de sistemas de ecuaciones lineales de grandes dimensiones
(1.000 1.000, 10.000 10.000, etc.). En este tipo de problemas no resulta muy eficiente invertir
la matriz de coeficientes para hallar la solucin del sistema. Tambin la aplicacin de mtodos
de regresin mltiple requieren la solucin de sistemas de ecuaciones lineales, algo usual en estadsitica. Podemos decir, entonces, que en ingeniera el uso de sistemas de ecuaciones lineales
es una prctica habitual.
Por lo tanto, uno de los temas ms importantes del anlisis numrico es el estudio de la
resolucin de estos sistemas de ecuaciones. Si bien conocemos mtodos muy precisos (exactos)
para resolver sistemas de pequeas dimensiones, el problema es analizar cmo resolver sistemas
de grandes a muy grandes dimensiones.
Del lgebra lineal sabemos que podemos obtener la solucin de Ax = B si hacemos
1
x = A B, pero obtener la inversa de A no es una tarea sencilla, ms si la matriz no sigue un
patrn determinado o si est mal condicionada, concepto que estudiaremos ms adelante.
Como introduccin y repaso, veremos primero algunas definiciones para luego estudiar
varios mtodos que resuelven un sistema de ecuaciones sin invertir la matriz de coeficientes de
manera muy eficiente y para distintas condiciones.
2.2.
Definiciones
Empezaremos dar algunas definiciones relacionadas con las matrices.
Definicin 2.1. Una matriz que tiene la misma cantidad de filas que de columnas (A es de n n
dimensiones) se denomina matriz cuadrada.
Para que una matriz pueda tener inversa debe ser necesariamente cuadrada.
Definicin 2.2. Una matriz cuyo determinante es no nulo (det(A) 6= 0) se denomina matriz no
singular.
Curso 008
PRELIMINAR
- 25 -
Anlisis Numrico I
2.3. Matrices triangulares
Definicin 2.3. Una matriz A cuadrada tiene inversa, es decir, existe A1 , si A es una matriz
no singular.
A partir de esta ltima definicin podemos decir que un sistema de ecuaciones lineales
tiene solucin nica si la matriz A del sistema Ax = B es cuadrada y no singular.
Definicin 2.4. Se denomina rango de un matriz al nmero de filas que son linealmente independiente.
Por lo tanto, el rango de una matriz cualquiera siempre es menor o igual al nmero de
filas (rango(A) nmero de filas). De esto ltimo se puede inferir que una matriz A de n n
dimensiones es no singular si su rango es n (rango(A) = n). Si el vector B se puede escribir como
combinacin lineal de las columnas de la matriz A y la matriz A es singular, entonces existen
infinitas soluciones para el sistema.
2.3.
Matrices triangulares
Una matriz triangular es aquella que slo tiene coeficientes no nulos en la diagonal principal y por encima o por debajo de ella. Hay dos tipos: la matriz triangular superior, generalmente
denominada U, y la matriz triangular inferior, denominada L. Estas matrices son muy convenientes cuando se deben resolver sistemas de ecuaciones lineales puesto que permiten una rpida
obtencin de los resultados sin la necesidad de invertir la matriz de coeficientes A. Estos dos
tipos de matrices dan lugar a dos mtodos muy utilizados: la susticin inversa, para matrices U,
y la sutitucin directa, para matrices L.
Por ejemplo, para el primer caso, una matriz U de 4 4 tiene la siguiente forma:
u11 u12 u13 u14

0 u22 u23 u24
0
0 u33 u34
0
0
0 u44
Para resolver un sistema U x = B basta con empezar por la ltima fila para obtener x4 y
luego ir reemplazando este valor en las ecuaciones anteriores, es decir, hacer:
b4
u44
b3 u34 x4
u33
x4 =
x3 =
..
.
bi
xi =
Pn
j=i+1 uij xj
uii
Esta forma de resolver el sistema de ecuaciones lineales se denomnina sustitucin inversa.

Cuando la matriz es triangular inferior el procedimiento para rsolver Lx = B es:
x1 =
x2 =
b1
l11
b2 l21 x1
l22
..
.
xi =
bi
Pi1
j=1 lij xj
lii
En este caso, el mtodo se denomina sustitucin directa.

- 26 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Cualquiera de estos mtodos es sencillo de aplicar y evita tener que invertir la matriz
de coeficiente de un sistema de ecuaciones lineales, lo que facilita la resolucin del mismo. En
consecuencia, los mtodos directos se basan en transformar la matriz de coeficientes original no
triangular, en una nueva matriz de coeficientes triangular.
2.4.
Eliminacin de Gauss y sustitucin inversa
El mtodo de eliminacin de Gauss es un mtodo directo muy efectivo que transforma

la matriz de coeficientes original en una matriz triangular superior y luego aplica el mtodo de
sustitucin inversa para obtener la solucin del sistema dado. Para ello se basa en la propiedad
que tienen las matrices de que la misma no cambia si se reemplaza una de las filas por una
combinacin lineal de las restantes filas. El procedimiento en lneas generales es:
Se fija la primera fila de la matriz A.
Se tranforman las filas siguientes de manera de que el coeficiente ai1 se anule, es decir, se
utiliza el coeficiente a11 de la diagonal principal como pivote.
Se fija la siguiente fila, se fija el pivote en la diagonal principal y se repite el paso anterior.
Se contina hasta que la matriz queda transformada en una matriz triangular superior.
Se aplica la sustitucin inversa para hallar los xi .
Por ejemplo, supongamos que tenemos la siguiente matriz A de dimesniones n = 4, con
su vector independiente B, genramos la matriz ampliada:
a11
a21
A=
a31
a41
a12
a22
a32
a42
a13
a23
a33
a43
a14
a24
a34
a44
|
|
|
|
b1
b2
.
b3
b4
Para obtener la nueva segunda fila operamos de la siguiente manera:

1. Calculamos el coeficiente m21 :
m21 =
a21
a11
2. Luego calculamos los coeficientes a2i y b2 :

a22 = a22 m21 a12
a23 = a23 m21 a13
a24 = a24 m21 a14
b2 = b2 m21 b1
y as sucesivamente para el resto de las filas, con lo que otenemos la nueva matriz ampliada:
a11
0
A=
0
0
a12
a22
a32
a42
a13
a23
a33
a43
a14
a24
a34
a44
|
|
|
|
b1
b2
,
b3
b4
y los correspondientes m31 y m41 .

Curso 008
PRELIMINAR
- 27 -
Anlisis Numrico I
2.4. Eliminacin de Gauss y sustitucin inversa
3. El siguiente paso es repetir los pasos 1 y 2, es decir, calcular un nuevo coeficiente m, el m32
y los nuevos coeficientes. Operando sucesivamente de esta forma obtendremos finalmente
la siguiente matriz ampliada :
a11 a12 a13

0 a23 a23
A=
0
0 a#
33
0
0
0
a14
a24
a#
34
a+
44
| b1
| b2
,
| b#
3
+
| b4
y los correspondientes m42 y m43 .

4. Finalmente, para obtener el vector x debemos hacer:
b+
4
a+
44
x4 =
#
b#
3 a34 x4
x3 =
a#
33
b2 a23 x3 a24 x4
a22
b1 a12 x2 a13 x3 a14 x4
a11
x2 =
x1 =
La expresin general para la transformacin de la matriz es la siguiente:

aij = aij mil alj ,
para los coeficientes de la matriz A, y:
bi = bi mil bl
para los coeficientes del vector de trminos independientes (B), con mil = aailll .
Este procedimiento es muy til puesto que se conoce exactamente la cantidad de pasos
que deben efectuarse, es decir, el mtodo tiene un cantidad finita de pasos, inclusive si el sistema
a resolver cuenta con varios vectores B. En ese caso, basta con transformarlos conjuntamente
con la matriz A.
Con este procedimiento, es posible conocer el costo computacional del mtodo, es decir,
establecer cuanto tiempo lleva todo el proceso. Una forma de estimar este costo de transformacin
de la matriz en triangular superior es mediante la siguiente expresin que cuenta las operaciones
realizadas (sumas, restas, multiplicaciones y divisiones). Para la transformacin de la matriz A
ampliada con el vector B en una matriz triangular superior tenemos la siguiente cantidad de
operaciones:
n1
X
2
n2 7
[(n k) + 2 (n k) (n k + 1)] = n3 +
n.
3
2
6
k=1
A su vez, para la susticin inversa tenemos esta cantidad de operaciones:

1+
n1
X
[2 (n k) + 1] = n2 .
k=1
En consecuencia, si se suman ambos valores, tenemos que el costo de efectuar la eliminacin de Gauss es:
2 3 3 2 7
n + n n;
3
2
6
- 28 -
PRELIMINAR
Curso 008
Anlisis Numrico I
es decir, proporcional a n3 .
Conviene tener presente que esta estimacin es aproximada, pues no se han tenido en
cuenta otros costos difciles de evaluar como son el manejo de las prioridades de memoria, la
forma de guardar los datos, etc. Sin embargo, esta estimacin sirve para establecer que a medida
que la dimensin de la matriz aumenta, el costo es proporcional al cubo de la misma, es decir,
el aumento del tiempo empleado en resolver el sistema completo (el costo computacional)
es potencial y no lineal. Es por ello que resolver un sistema de 1.000 1.000 insume un costo
proporcional a 1.000.000.000 operaciones.
Un problema que puede surgir en este mtodo es si alguno de los elementos de la diagonal
principal al ser transformados se anulan. Si esto ocurriera, de acuerdo con el algoritmo anterior,
el procedimiento se detendra y en consecuencia no podra obtenerse solucin alguna. En estos
casos se aplican versiones ms desarrolladas, denominadas Eliminacin de Gauss con Pivoteo
Parcial (EGPP) o Eliminacin de Gauss con Pivoteo Total (EGPT).
En el primer caso, lo que se hace es primero intercambiar las filas, reordenndolas de
manera tal que el coeficiente nulo quede fuera de la diagonal principal, y luego se contina con
el algoritmo tradicional. Veamos un ejemplo. Supongamos el siguiente sistema:
x1 + x2 x3 = 1
x1 + x2 + 4x3 = 2
2x1 x2 + 2x3 = 3.
Armemos el sistema ampliado para aplicar el mtodo de Eliminacin de Gauss. Entonces
nos queda:
1 1 1 | 1
1 1 1 | 1
1 1
4 | 2 0 0
5 | 1 .
2 1 2 | 3
0 3 4 | 1
Como vemos, la transformacin de la matriz nos deja nulo el coeficiente a22 de la segunda
fila, lo que nos impide seguir operando. Para poder seguir debemos intercambiar las filas dos y
tres, en consecuencia tendremos:

1 1 1 | 1
1, 2667
x1
0 3 4 | 1 x2 = 0, 0667 .

x3
0 0
5 | 1
0, 2000
El intercambio entre las fils 2 y 3 evit que el procedimiento se detuviera. Pero tambin
es posible que valores muy chicos en los coeficientes de la diagonal principal generen un problema
en la mecnica del sistema. Por ejemplo, consideremos el siguiente sistema:
0, 03x1 + 58, 9x2 = 59, 2
5, 31x1 6, 10x2 = 47, 0;
que debe ser resuelto con una precisin de solamente tres dgitos y aplicando corte en vez de
redondeo. Si aplicamos Eliminacin de Gauss tendremos:

0, 03
58, 9
|
59, 2
;
0
10400 | 10300
pues al hacer los clculos obtenemos que:
m21 =
5, 31
= 177 a22 = 6, 10 177 58, 9 6, 10 10400 10400
0, 03
b2 = 47, 0 177 59, 2 47, 0 10400 10300.
Curso 008
PRELIMINAR
- 29 -
Anlisis Numrico I
2.5. Factorizacin LU
As, la solucin del sistema es:

x1
x2

30, 0
=
,
0, 990
Pero si resolvemos el sistema anterior con precisin infinita, el resultado que obtenemos

x1
10
=
,
x2
1
es:
lo que nos indica que el resultado anterior es incorrecto. Esta diferencia est dada por el coeficiente
0, 03 en la diagonal principal. Si reordenamos el sistema original tenemos:
5, 31x1 6, 10x2 = 47, 0
0, 03x1 + 58, 9x2 = 59, 2;
y si utilizamos la misma precisin, resulta:

5, 31 6, 10 | 47, 0
;
0
58, 9 | 58, 9
puesto que al hacer los clculos obtenemos:
m21 =
0, 03
= 0, 005649 0, 005 a22 = 58, 9 0, 005 (6, 10) 58, 9 + 0, 030 58, 9
5, 31
b2 = 59, 2 0.005 47, 0 = 59, 2 0, 235 58, 9.
La solucin del sistema es:
x1
x2

10
,
=
1
resultado que coincide con el obtenido con precisin infinita.

Es por eso que el mtodo de Eliminacin de Gauss con Pivoteo Parcial (EGPP) se usa
tambin cuando alguno de los coeficientes de la diagonal principal es muy chico con respecto a
los dems coeficientes de la matriz.
En el caso del pivoteo total se efecta no slo un reordenamiento de las filas sino tambin
de las columnas, lo que complica an ms el procedimiento.
Ambos casos insumen un mayor costo computacional que resulta muy difcil estimar
puesto que no se trata de contar operaciones aritmticas como en la estimacin anterior, si bien
se considera que una comparacin es equivalente a una suma/resta.
2.5.
Factorizacin LU
El mtodo de eliminacin de Gauss es un mtodo muy potente. Sin embargo, no siempre

es conveniente su utilizacin. Supongamos por un momento que para resolver un determinado
problema debemos resolver el sistema de ecuaciones en forma anidada. Es decir, cada nueva
solucin depende del resultado obtenido
en un paso anterior, o sea, cada vector B depende de la
<i>
<i1>
solucin anterior (B
=f x
).
Si queremos resolver estos sistemas nos encontraremos con la desventaja de que en cada
paso tendremos que recalcular la matriz triangular superior, lo que significa un costo computacional muy grande, tal como vimos en el punto anterior. Por lo tanto, deberamos buscar un
mtodo que nos evite repetir dichos clculos.
Un mtodo muy eficiente para estos casos es la descomposicin o factorizacin LU. sta
consiste en descomponer la matriz A original en el producto de dos matriz: una triangular inferior
(L) y una triangular superior (U ), para armar el siguiente sistema:
Ax = LU x = B con A = LU.
- 30 -
PRELIMINAR
Curso 008
Anlisis Numrico I
De esta forma obtenemos dos sistemas de ecuaciones:

Ly = B
Ux = y
En el primer caso, para obtener la solucin intermedia y, aplicamos la sustitucin directa,
y en el segundo, la sustitucin inversa. Vemos que en este mtodo el vector B no es transformado
en ninguno de los sistemas resueltos, que es lo que estbamos buscando. Pero cmo se obtienen
las dos matrices triangulares?
En el caso de la matriz triangular superior, la forma ms sencilla de obtenerla es aplicar
el mismo algoritmo que el utilizado para eliminacin de Gauss, lo que significa que el costo
computacional es similar (pero no igual, puesto que no debe transformarse al vector B ). Nos
falta la matriz L. Pero esta matriz es muy sencilla de obtener. Planteemos el esquema para
obtener los coeficientes de la matriz L partiendo que los elementos de la diagonal principal son
iguales a 1 (lii = 1):
a21
a21
l21 u11 = a21 l21 =
=
= m21
u11
a11
a31
a31
=
= m31
l31 u11 = a31 l31 =
u11
a11
... ... ...
l31 u12 + l32 u22
a32 l32 u22 = a32 l31 u12 = a32 m31 a12 = a32
|
{z
}
a32
l32
a32
u22
a32
a22
= m32
Como vemos, la matriz L es una matriz triangular inferior compuesta por los coeficientes
de la diagonal principal iguales a 1 (lii = 1) y los coeficientes por debajo de la diagonal principal
iguales a los coeficientes mij del mtodo de eliminacin de Gauss (lij = mij ). Es decir, las
matrices tienen la siguiente forma:
1
0
0
...
0
m21
1
0
...
0
..
.
.
.
.
.
.
L= .
.
.
.
0
mn1,1 mn1,n2
1
0
mn1
. . . mn,n2 mn,n1 1
y
1 a12 a13 . . . a1n

0 a a . . . a
22
23
2n
U = 0 0 a33 a3n
..
..
..
..
..
.
.
.
.
.
0 0 . . . 0 ann
donde los aij son los coeficientes transformados del mtodo de Eliminacin de Gauss.
Obtenidas L y U , la solucin del sistema se obtiene aplicando, primero, la sustitucin
directa para hallar el vector y y luego, sustitucin inversa para hallar x. Para el primer caso se
aplica el siguiente algortimo:
y 1 = b1
y2 = b2 l21 y1
..
.
i1
X
y i = bi
lij yj
j=1
Curso 008
PRELIMINAR
- 31 -
Anlisis Numrico I
2.6. Mtodo de Cholesky
puesto que los coeficientes lii son iguales a uno (lii = 1).
Como dijimos, obtenido y, se aplica la sustitucin inversa para obtener el vector x solucin
del sistema. El algoritmo es:
yn
xn =
unn
yn1 un1,n yn
xn1 =
un1,n1
..
.
n
X
yi
uij xj
xi =
j=i+1
uii
Como vemos, en ningn caso hemos modificado o transformado al vector B, por lo que
una vez que obtenemos las matrices U y L, podemos resolver los distintos sistemas aplicando
sustitucin directa primero e inversa despus. Este mtodo se conoce como Mtodo de Doolittle.
Ahora nos quedara analizar el costo computacional del mtodo. Sin embargo, dado que
hemos utilizado el mtodo de eliminacin de Gauss para obtener las matrices U y L, el costo para
este mtodo es muy similar al de dicho mtodo. En consecuencia, la ventaja est principalmente
en no tener que repetir la triangulacin de la matriz A para cada sistema con un B distinto.
Al obtener la matriz U mediante Eliminacin de Gauss podemos tener el mismo problema
ya visto: que un coeficiente de la diagonal principal se haga nulo en los pasos intermedios. En
ese sentido, valen las mismas aclaraciones respecto al Pivoteo Parcial y al Pivoteo Total. Es por
eso que suele decirse que existe un par de matrices L y U que cumplen con:
P A = LU,
donde P es una matriz de permutacin.
2.6.
2.6.1.
Mtodo de Cholesky
Matrices simtricas y definidas positivas
Antes de analizar un caso particular de factorizacin de matrices conviene recordar la

definicin de un algunos tipos de matrices. En primer lugar, se dice que una matriz es simtrica
cuando dicha matriz es igual a su transpuesta, es decir:
A = AT .
Otro tipo de matriz es la conocida como definida positiva1 . En este caso se debe cumplir
que:
xT Ax > 0 para todo x 6= 0.
Es de notar que lo que se impone para que una matriz sea definida positiva es que el
escalar resultante de la operacin xT Ax sea no nulo y mayor que cero. En general demostrar esto
resulta muy engorroso, por lo que suelen utilizarse algunos procedimientos alternativos. Para ello
veamos los siguiente conceptos.
Definicin 2.5. Una primera submatriz principal de una matriz A es la que tiene la forma:
a11 a12 . . . a1n

a21 a22 . . . a2n
Ak =
..................
ak1 ak2 . . . akn
1
Algunos autores exigen que A sea simtrica y definida positiva. Sin embargo, en principio, se puede decir que
no es necesario que una matriz sea simtrica para que sea definida positiva.
- 32 -
PRELIMINAR
Curso 008
Anlisis Numrico I
para alguna 1 k n.
Teorema 2.1. Una matriz simtrica A es definida positiva si y slo si sus primeras submatrices
principales tienen determinante positivo.
Teorema 2.2. La matriz simtrica A es definida positiva si y slo si la eliminacin de Gauss sin
pivoteo puede efectuarse en el sistema Ax = B con todos los pivotes positivos.
Corolario 2.2.1. La matriz simtrica A es definida positiva si y slo si A puede factorizarse en
la forma LDLT , donde L es una matriz triangular inferior con coeficientes iguales a uno en la
diagonal principal (lii = 1) y D es una matriz diagonal con coeficientes positivos (dii > 0).
Corolario 2.2.2. La matriz A es simtrica y definida positiva si y slo si A puede factorizarse
en la forma LLT donde L es una matriz triangular inferior con elementos no nulos en su diagonal.
2.6.2.
Algoritmo de Cholesky
Con el ltimo corolario se puede efectuar una factorizacin de la matriz A conocida como
mtodo o algoritmo de Cholesky. En efecto, si la matriz A es simtrica definida positiva, es
posible obtener una matriz S que cumpla:
SS T = A.
Veamos como podemos obtener esta natriz a partir de la factoriziacin LU . De acuerdo
con el corolario 2.2.1, la matriz simtrica A puede ser factorizada como LDLT . Si adems es
definida positiva,
En consecuencia, podemos obtener
entonces los coeficientes de D sonpositivos.
sin problemas D, con lo cual tenemos A = L D DLT . As nuestra matriz A puede ser
expresada como:

T
T
A=L
| {zD} | DL
{z } = SS .
S
ST
Finalmente, las expresiones para obtener esta matriz S son:

"
sii = aii
i1
X
#1/2
s2ik
#
"
i1
X
1
aji
sjk sik ,
y sji =
sii
k=1
k=1
con j > i.
Este mtodo es mucho ms eficiente puesto que slo debemos calcular y guardar una
sola matriz, a diferencia de la factorizacin LU en la que debo calcular y guardar dos matrices,
si bien algunos algortimos permiten guardar ambas matrices en una sola. Adems, el mtodo
Cholesky no aumenta considerablemente el costo computacional que analizamos en los puntos
anteriores, por ms que deban extraerse n races cuadradas.
Este mtodo es muy aplicado en programas estructurales que aplican el mtodo de los
elementos finitos, dado que la matriz de coeficientes es una matriz simtrica y definida positiva.
De todos modos, tiene las mismas desventajas vistas para los otros mtodos cuando la dimensin
de la matriz es cada vez ms grande.
2.7.
Condicin de una matriz
Uno de los puntos a tener en cuenta es qu error cometemos al resolver un sistema

de ecuaciones lineales mediante un mtodo directo. Una forma de conocer el error de nuestro
vector solucin x sera analizar el algoritmo utilizado con ayuda de la grfica de proceso. Este
procedimiento resulta un tanto engorroso y largo, adems de poco prctico. Una segunda manera
podra ser analizar lo siguiente: puesto que nuestro sistema se puede expresar como Ax = B, una
Curso 008
PRELIMINAR
- 33 -
Anlisis Numrico I
2.7. Condicin de una matriz
forma alternativa es x = A1 B. Si definimos a N = A1 , nos queda x = N B. Si desarrollamos

esta expresin para cada componente de x nos queda:
xi =
n
X
nij bj .
j=1
Armemos un algoritmo que tenga la siguiente forma:

sj
xi
= nij bj ;
n
X
=
sj .
j=1
Analicemos los errores en cada paso. Para el primero tenemos:

esj
= bj enij + nij ebj = bj eij + nij ej

bj enij + nij ebj
+ j = ernij + erbj + j = erij + erj + j .
=
nij bj
ersj
Con el error relativo podemos recalcular el error total de sj :

esj = bj eij + nij ej + nij bj j .
Para el segundo paso tendremos:
exi
n
X
esj =
j=1
erxi
n
X
esj
j=1
xi
n
X
(bj eij + nij ej ) +
j=1
n
X
k=2
n
X
nij bj j ,
j=1
n
n
n
X
(bj eij + nij ej ) X nij bj j X
k =
k .
+
+
xi
xi
j=1
j=1
k=2
Esta ltima expresin la podemos escribir tambin como:

erxi =
n
n
X
nij bj (erij + erj + j ) X
k .
+
xi
j=1
k=2
Si reordenamos los trminos tendremos:

erxi =
n
X
nij bj
j=1
xi
(erij + erj ) +
n
X
nij bj
j=1
xi
j +
n
X
k .
k=2
De esta forma se puede decir que el error relativo de xi es:

erxi
n
X
Cpj (erij + erj ) +
j=1
n
X
T ej j ,
j=1
con
nij bj
nij bj
y T ej
+ 1.
xi
xi
Hemos encontrado para cada xi la expresin del error relativo, o mejor dicho, una idea
aproximada del error. Pero, en la prctica, sirve esto? Todos los clculos son engorrosos y adems
hemos partido de un algoritmo no del todo prctico, pues hemos dicho que invertir la matriz no
es conveniente. Entonces, qu hacemos?
Supongamos que hemos resuelto nuestro sistema Ax = B con un algoritmo cualquiera y
que en consecuencia hemos obtenido una solucin x
. Lo que nos interesa conocer es una cota del
Cpj =
- 34 -
PRELIMINAR
Curso 008
Anlisis Numrico I
error absoluto, kx x
k, o del error relativo,
kx x
k
, en alguna norma, por ejemplo, la norma
kxk
infinito.
Como, en principio, no conocemos el resultado exacto de x, lo que podemos hacer es
calcular lo siguiente:
R = B A
x,
donde R lo denominamos residuo. Si nuestra solucin x
fuera la solucin exacta, entonces nuestro
vector R debera ser nulo. Sin embargo, en la prctica, siempre obtendremos un vector R no
nulo, debido a la propagacin de los errores de redondeo o a la propagacin de los errores
inherentes y de redondeo. Si hubisemos utilizado un mtodo iterativo habra que agregar los
errores por truncamiento. De todos modos, qu conclusiones podemos sacar conociendo R?
Veamos el siguiente ejemplo.
Supongamos la matriz A y el vector B dados a continuacin:

1, 2969 0, 8648
0, 8642
A=
;B =
.
0, 2161 0, 1441
0, 1440
Supongamos tambin que usando un determinado algoritmo hemos obtenido las siguientes
soluciones:

0, 9911
0, 0126
x
1 =
; x
2 =
.
0, 4870
1, 0182
Entonces, tendremos:

R = B A
xi =
107
107

.
Por lo tanto, tendremos que kRk = 108 . Podemos decir que el residuo es muy chico.
Sin embargo, la solucin correcta es:

2
.
x=
2
Es decir, el error cometido es del mismo orden de la solucin, o sea, 107 veces el residuo!
Es importante tener en cuenta que cualquiera sea el algoritmo utilizado, no podemos
esperar sino un residuo pequeo o muy pequeo, lo que significa que este residuo R por s solo
no nos sirve de mucho para estimar el error que hemos cometido al obtener x
.
Cmo se relaciona, entonces, este residuo con el error en x
? Veamos. Escribamos el
residuo como:
R = B A
x = Ax A
x = A (x x
) .
es decir:
xx
= A1 R.
Elijamos cualquier norma vectorial, por ejemplo, la infinita. Entonces tendremos:

kx x
k = A1 R A1 kRk .
Esto nos da una cota del error absoluto en trmino de A1 . Usualmente el error relativo
kAk
1
es ms significativo que el absoluto. Como kBk kAk kxk implica que kxk
kBk
, tendremos
que:

kAk
kRk
kx x
k
A1 kRk
= A1 kAk
.
kxk
kBk
kBk
Esta expresin nos permite establecer que el residuo por s mismo no nos alcanza para
estimar el error de nuestro vector solucin x
, sino que tambin debemos conocer algunas

caractersticas de la matriz A. En particular, vemos que el error relativo de x
depende de A1 kAk.
Curso 008
PRELIMINAR
- 35 -
Anlisis Numrico I
2.8. Refinamiento iterativo de la solucin
2
A este nmero
lo denominaremos condicin de A y lo expresaremos como cond(A) o (A) .
1
Tanto A como kAk son nmeros (son normas de las
matrices) por lo tanto para que el error
1

relativo de x
no sea muy grande, el producto de A kAk debiera ser cercano a uno, es decir:
1
A kAk = (A) > / > 1.
Si la matriz es no singular debe cumplirse que:

1 = kIk = A1 A (A),
que puede considerarse el lmite inferior, en tanto que si la matriz A es singular (no existe A1 ),
(A) = , que puede ser considerado el lmite superior. As, puede decirse que el nmero de
condicin da una idea de cuan cerca est la matriz de ser singular, o lo que es lo mismo, de que
el sistema no tenga solucin o que sean infinitas.
Una conclusin interesante es que si la matriz A del sistema est mal condicionada,
pequeos desvos en el residuo R pueden llevar a grandes desvos en x
, es decir, si definimos que
kxk = kx x
k, entonces puede darse que kxk >> 1, algo que no es aceptable.
2.8.
Refinamiento iterativo de la solucin
Hemos visto en los puntos anteriores que los mtodos directos pueden resolver muy bien
un sistema de ecuaciones lineales, con excepcin de un sistema con la matriz de coeficientes A
mal condicionada. An as, existe la posibilidad de obtener una solucin aceptable, dentro de
cierto rango. Al analizar el error cometido, introdujimos el concepto del vector residuo, que
denominamos R, y que obtuvimos de la siguiente manera:
R = B A
x.
Como vimos, con ese vector residuo podemos calcular el error de nuestra aproximacin x
respecto de nuestra solucin exacta x, pues tenemos que:

B A
x = Ax A
x = A (x x
) = A = R,
| {z }
y, en consecuencia, resolviendo este nuevo sistema de ecuaciones podemos obtener nuestro valor
. Dado que hemos definido que = x x
, entonces podemos decir que:
x=x
+ ,
y con ello hemos obtenido nuestra solucin exacta. Sin embargo, esto no suele ocurrir al primer
intento, de manera que lo que obtendremos en realidad es una nueva aproximacin de nuestra
solucin, que llamaremos x
. Para sistematizar esto, digamos que
x
= x1 ; R1 = B Ax1 ; A1 = R1 ,
por lo que tendremos:
x
= x2 = x1 + 1 .
El paso siguiente es obtener R2 y 2 , en forma anloga a 1 . En consecuencia, tendremos
que
x3 = x2 + 2 = x1 + 1 + 2 = x
+ 1 + 2 .
2
En este caso hemos utilizado la norma infinito, por lo tanto se obtiene el (A). Podra haberse usado la
norma eucldea y obtener el 2 (A).
- 36 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Si generalizamos, tenemos que la solucin exacta se puede obtener con la expresin

x=x
+
n
X
i ,
i=1
es decir, que a la solucin aproximada le sumamos todos los errores para obtener la solucin
exacta. Por supuesto, es imposible efectuar infinitas interaciones, por lo que es imprescindible
establecer algn criterio de corte. Un criterio puede ser cortar las iteraciones cuando kRk k T ol,
pero vimos que esto no asegura que el error sea pequeo. Otro crietrio, tal vez ms acertado, es
interrumpir las iteraciones o clculos cuando kk k T ol, que tiene en cuenta el error de x
.
Este procedimiento que obtiene la solucin de nuestro sistema sumando los errores, se
conoce como mtodo del refinamiento iterativo de la solucin y ha cobrado gran desarrollo en los
ltimos aos, pues pueden obtenerse buenos resultados con matrices mal condicionadas. Suele
decirse que para obtener una buena solucin, los sistemas Ai = Ri deben resolverse con mayor
precisin que el sistema original. Si hemos resuelto el sistema Ax = B en simple precisin,
entonces debe usarse doble precisin para resolver cada uno de estos sistemas. Esto no es del
todo cierto, ya que pueden obtenerse buenos resultados usando la misma precisin, tal como
ha demostrado N. Higham (vase [6]). Pero existe otra cuestin. Cuando conviene aplicar este
mtodo?
Supongamos (una vez ms) que obtenemos la aproximacin x
. Con esta solucin, podemos
obtener el vector residuo mediante
R1 = B A
x.
Si realizamos los clculos utilizando una precisin de t dgitos, podemos demostrar que
kR1 k 10t kAk k
xk .
Para saber si el mtodo es convergente, podemos obtener una aproximacin o estimacin
del nmero de condicin de A. Para ello vamos a obtener el vector 1 segn vimos arriba, es
decir, haciendo
A1 = R1 .
Entonces, podemos escribir lo siguiente:

xk = 10t k
xk (A),
k1 k kx x
k = A1 R1 A1 kR1 k A1 10t kAk k
con lo cual podemos estimar (A) mediante
(A)
k1 k t
10 .
k
xk
Como hemos dicho, este mtodo permite obtener buenos resultados inclusive con matrices
mal condiciondas. Sin embargo, si (A) > 10t , el sistema est tan mal condicionado que debe
modificarse la precisin original usada en la obtencin de x
para obtener un resultado aproximado
aceptable.
2.9.
Errores de los mtodos directos
Hemos visto que el hecho de obtener un vector residuo pequeo no es garanta para inferir
que el resultado obtenido tiene un error tambin pequeo. Analicemos el sistema en una forma
ms detallada. Supongamos ahora que tanto la matriz A como el vector B tienen pequeas
perturbaciones que llamaremos A y B respectivamente, y que nuestra solucin sea x
. Entonces
tendremos:
(A + A)
x = B + B.
Curso 008
PRELIMINAR
- 37 -
Anlisis Numrico I
2.9. Errores de los mtodos directos
Podemos escribir que

A
x + A
x = B + B,
A
x + A
x = B + B.
Sabemos que x = x
+ x, por lo tanto podemos escribir:
A(x x) + A(x x) = B + B,
Ax Ax + Ax Ax = B + B.
Si despreciamos Ax, tendremos
Ax + Ax Ax = B + B,
Ax Ax = B,
Ax = B + Ax,
x = A1 B + A1 Ax.
Si tomamos normas a ambos lados tendremos:

kxk A1 kBk + A1 kAk kxk ,
y como adems tenemos que kBk kAk kxk, entonces podemos dividir todo de manera de
obtener:

1

A kBk A1 kAk kxk
kxk
+
,
kAk kxk
kBk
kAk kxk
1
1
A kBk A kAk
+
.
kBk
kAk
Si multiplicamos por kAk tendremos que:

kxk
= kAk A1
kxk
|
{z
}
kBk kAk
+
kBk
kAk

.
(A)
Podemos ver que para que los errores de x sean pequeos no basta con que B y A
sean pequeos (es decir, que los errores inherentes sean pequeos), sino que es necesario que el
nmero de condicin de A ((A)) sea cercano a 1.
Analicemos ahora los errores de redondeo. Vamos a buscar una cota de estos errores.
Supongamos que aplicamos el mtodo de factorizacin LU para resolver el sistema. Si suponemos
que solamente se producen errores de redondeo, entonces tendremos en realidad que
LU = A + A,
donde A son las perturbaciones producidas por los errores de redondeo al obtener L y U .
Entonces, nuestro sistema queda como:
(A + A)(x x) = B,
por lo tanto,
x = A1 A(x x).
Si tomamos la norma tenemos
kxk (A) kx xk
- 38 -
PRELIMINAR
kAk
.
kAk
Curso 008
Anlisis Numrico I
Se puede demostrar que kAk 1, 01(n3 + 3n2 ) kAk , donde = max

k
aij
kAk
, y n es la
dimensin de la matriz A; entonces tenemos que

kxk
kxk
(A)1, 01(n3 + 3n2 ),

kx xk
kxk
y podemos definir el error total para los mtodos directos como

kxk
kBk kAk
(A)
+
+ 1, 01(n3 + 3n2 ) .
kxk
kBk
kAk
Podemos ver que si la matriz es de grandes dimensiones, comienzan a tener gran incidencia
los errores de redondeo, con lo cual el sistema puede volverse inestable si (A) >> 1, adems de
mal condicionado.
2.10.
Mtodos iterativos
Hasta ahora hemos estudiado los llamados mtodos directos para resolver sistemas de
ecuaciones lineales. Son llamados de esta forma porque el algoritmo tiene una cantidad conocida
de pasos (finita) y los resultados que obtenemos al aplicarlos deberan ser exactos, salvo por
el error de redondeo, aunque vimos que esto no siempre es as. Estos mtodos se suelen usar con
matrices densas o casi llenas, como por ejemplo las surgidas del anlisis matricial de estructuras
planas, las cuales tienen muchos coeficientes distintos de cero (aij 6= 0).
Pero existen muchos otros problemas en los cuales el sistema de ecuaciones tiene una
matriz A que no es densa, sino por el contrario, es rala, es decir, tiene muchos coeficientes nulos,
como es el caso del anlisis estructural en tres dimensiones. Entonces trabajar con los mtodos
directos se vuelve muy poco prctico, pues debemos hacer muchas operaciones con coeficientes
nulos y, lo que es peor, muchas veces transforamr un coeficiente nulo en otro no nulo, incorporando
un error que antes no exista. Es por eso que se han desarrollado mtodos que tienen en cuenta
este tipo de matrices. Son los mtodos denominados iterativos.
En estos mtodos, la solucin la obtenemos a partir de una solucin inicial, la cual se
va corrigiendo en sucesivas iteraciones hasta obtener la solucin correcta, de ah el nombre de
iterativos. En principio, podenos suponer que la cantidad de iteraciones es infinita, es decir,
que la solucin exacta la obtenemos luego de infinitas iteraciones. Como esto es imposible de
hacer, lo que se hace es iterar hasta que la solucin est dentro de las tolerancias impuestas.
Para analizar estos mtodos partamos de definirlos en forma matricial. Sabemos que
nuestro sistema se expresa como
Ax = B,
o, lo que es lo mismo, como
B Ax = 0.
En consecuencia, podemos sumar en ambos miembros P x sin cambiar la igualdad. Nos queda
que
P x = P x Ax + B P x = (P A) x + B.
Si despejamos x de la expresin anterior, nos queda:
x = P 1 (P A) x + P 1 B,
que puede escribirse como

x = P 1 P P 1 A x + P 1 B = I P 1 A x + P 1 B,
Curso 008
PRELIMINAR
- 39 -
Anlisis Numrico I
2.10. Mtodos iterativos
a partir del cual se puede obtener el mtodo iterativo para resolver un sistema de ecuaciones,
que toma la siguiente forma:

x(n+1) = I P 1 A x(n) + P 1 B,
donde n es la iteracin.
La expresin anterior puede escribirse en forma general como
x(n+1) = T x(n) + C,
donde
T = I P 1 A y C = P 1 B.
Con esta ltima expresin podemos defnir dos tipos de mtodos iterativos: los estacionarios, aquellos en los que T y C no sufren modificaciones durante las iteraciones, y los no
estacionarios, aquellos en los que los valores de T y C dependen de la iteracin.
2.10.1.
Mtodos estacionarios
Como hemos visto, los mtodos iterativos estacionarios son aquellos en los que T y C son
invariantes, es decir, permanecen constantes en las sucesivas iteraciones necesarias para hallar
la solucin.
Supongamos por un momento que conocemos nuestra solucin exacta x. Entonces
podemos decir que:
(n+1)
x = x(n+1)

+e
(n+1)
(n+1)
(n)
(n)
+C
x
+e
= T x +e
(n)
(n)
= T
| x {z+ C} +T e
x(n+1)
(n+1)
= x
+ T e(n)
e(n+1) = T e(n) .
De la ltima expresin podemos deducir que:
e(n+1) = T e(n) = T T e(n1) = T 2 e(n1) = . . . = T n+1 e(0) ,
expresin que nos indica que para que un mtodo iterativo estacionario sea convergente se debe
cumplir que kT k < 1, y que kT k << 1 para que la convergencia sea rpida.
Mtodo de Jacobi
El mtodo estacionario ms sencillo es el Mtodo de Jacobi. Si definimos que A = L +
D + U , este mtodo es aqul que define P = D. Por lo tanto, podemos escribir que:

x(n+1) = I D1 A x(n) + D1 B

= I D1 (L + D + U ) x(n) + D1 B
1
1
(n)
1
= [I D
| {z D} D (L + U )]x + D B
I
h
i
= D1 B (L + U )x(n) ,
donde L, D y U tienen la siguiente forma:
0
0
...
0
a11 0 . . .
0
0 a12 . . .
a1m
a21 0
...
0
0
, D = 0 a22 . . .
y U = . . . . . . . . . . . . . . . . . . . . .
L=
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
0 . . . 0 am1 m
0 ... 0
0
am1 . . . am m1 0
0
0 . . . amm
- 40 -
PRELIMINAR
Curso 008
Anlisis Numrico I
En su forma tradicional este mtodo se expresa como:

bi
(n+1)
xi
i1
X
n
X
aij xj
j=1
aij xj
j=i+1
aii
En s, el mtodo consiste en suponer una solucin inicial, generalmente el vector nulo

(x = [0]), e iterar hasta obtener la solucin, usando siempre el vector obtenido en el paso
anterior. Para analizar la convergencia, debemos recordar algunas definiciones.
Definicin 2.6. Una matriz A se denomina diagonal dominante si se cumple que
|aii |
n
X
|aij | .
j=1
j6=i
Definicin 2.7. Una matriz A se denomina estrictamente diagonal dominante si se cumple que
|aii | >
n
X
|aij | .
j=1
j6=i
Definicin 2.8. Una matriz A se denomina diagonal dominante en forma irreductible si se

cumple que
n
X
|aii |
|aij | ,
j=1
j6=i
para i = 1; 2; . . . ; n y en al menos una fila que

|akk | >
n
X
|akj | .
j=1
j6=k
El mtodo de Jacobi converge rpidamente si la matriz A es estrictamente diagonal dominante. En cambio, la convergencia es lenta si la matriz A es cualquiera de las otras dos. Finalmente, si la matriz A no cumple con ninguna de las definiciones anteriores, el mtodo de Jacobi
no converge.
Mtodo de Gauss-Seidel
Cuando el mtodo de Jacobi es convergente, esta convergencia es muy lenta. Para mejorar
esta velocidad de convergencia, imaginemos que usamos parte de los resultados ya obtenidos en el
obtencin de los siguientes, es decir, obtener el xi aprovechando los xj para j < i. Este mtodo se
conoce como mtodo de Gauss-Seidel y resulta de definir P = D + L. Desarrollemos la expresin
final sabiendo que P x(n+1) = P x(n) Ax(n) + B:
(D + L)x(n+1) = [(D + L) A] x(n) + B
= [(D + L) (L + D + U )] x(n) + B
= [D + L L D U ] x(n) + B
= B U x(n)
(n+1)
Dx(n+1) = B Lx
U x(n)
h
i
x(n+1) = D1 B Lx(n+1) U x(n) .
Curso 008
PRELIMINAR
- 41 -
Anlisis Numrico I
En su forma tradicional el mtodo se escribe de la siguiente manera:

bi
(n+1)
xi
i1
X
(n+1)
aij xj
n
X
j=1
(n)
aij xj
j=i+1
aii
Este mtodo converge para las mismas condiciones impuestas al mtodo de Jacobi. Se
puede asegurar que si el mtodo de Gauss-Seidel converge, tambin lo hace el de Jacobi, pero la
inversa no se cumple. En particular, este mtodo resulta convergente con matrices simtricas y
definidas positivas.
Mtodo de las sobrerrelajaciones sucesivas (SOR)
Si bien Gauss-Seidel es ms rpido que Jacobi, la velocidad de convergencia no es muy
alta. Busquemos algn mtodo que nos mejore esta velocidad. Partamos nuevamente de la expresin general P x(n+1) = P x(n) Ax(n) + B. Si reordenamos un poco la expresin tenemos:
P x(n+1) = P x(n) + |B {z
Ax(n)} = P x(n) + R(n) ,
R(n)
que podemos escribir tambin como

(n)
1 (n)
(n)
1 (n)
1
x(n+1) = P
| {z P} x + P R = x + P R .
I
La idea es buscar una matriz P que nos mejore la velocidad de convergencia. Supongamos,
1
entonces, que tomamos P = L + D. Si partimos de la expresin conocida tenemos que:

1
1
D + L x(n+1) =
D + L A x(n) + B

1
D + L (L + D + U ) x(n) + B
=

1
=
D + L L D U x(n) + B

1
= B 1
Dx(n) U x(n)

1
1
(n+1)
(n+1)
Dx(n) U x(n)
Dx
= B Lx
1

h
i
1
(n+1)
1
(n)
1
(n+1)
(n)
x
= 1
D
D
x
+
D
B
Lx
U
x
| {z }
I
h
i
(n)
= (1 )x + D1 B Lx(n+1) U x(n)
(n+1)
= (1 )x(n) + xGS
Este mtodo se conoce como Mtodo de las sobrerrelajaciones sucesivas (o SOR por sus
siglas en ingls), y pondera el x(n) con el x(n+1) obtenido con el mtodo de Gauss-Seidel, tomando
como factor de ponderacin el coeficiente . En su forma tradicional se suele escribir como:
bi
(n+1)
xi
- 42 -
= (1 )x(n) +
i1
X
(n+1)
aij xj
j=1
PRELIMINAR
n
X
j=i+1
aii
(n)
aij xj
.
Curso 008
Anlisis Numrico I
En este mtodo la velocidad de convergencia est dada por el . Se puede asegurar que
existe un valor que hace mxima la velocidad de convergencia para un sistema dado, que puede
ser estimado conociendo el radio espectral de la matriz de Jacobi. Si observamos con detenimiento
veremos que el mtodo de Gauss-Seidel es un caso especial del SOR, pues surge de tomar = 1.
En efecto, si = 1 tenemos:
bi
(n+1)
xi
bi
=
(n+1)
aij xj
j=1
= (1 1)x(n) +
i1
X
i1
X
n
X
(n)
aij xj
j=i+1
aii
(n+1)
aij xj
j=1
n
X
j=i+1
aii
(n)
aij xj
que es el mtodo de Gauss-Seidel.

En realidad, al imponer que 0 < < 2 existen dos mtodos: cuando 0 < < 1, estamos
en presencia de un mtodo de subrelajacin, tambin conocido como mtodo de Jacobi modificado,
en tanto que cuando 1 < < 2, se trata de un mtodo de sobrerrelajacin propiamente dicho.
En general, estos mtodos convergen mucho ms rpido que los otros dos, y puede decirse que
cuando Gauss-Seidel no converge, utilizando un < 1 se logra una mejor convergencia que con
el mtodo de Jacobi.
Criterios de interrupcin
Hasta ac hemos visto los distintos mtodos iterativos estacionarios ms tradicionales
que se aplican para resolver sistems de ecuaciones lineales. Pero no hemos analizado los criterios
para interrumpir dichas iteraciones. Dado que los mtodos convergen a una solucin cuando
n , es decir, que se debe dar que x x(n) = 0 cuando n , entonces podemos tomar
como criterios para interrumpir las iteraciones, que x x(n) < T ol, siendo T ol una valor definido
arbitrariamente, generalmente relacionado con la precisin utilizada (). Existen varios criterios
que pueden aplicarse. Estos son:
1. Que la norma infinita del vector r(n) sea menor a la tolerancia, esto es:

(n)
r < T ol.
2. Que la norma infinita del error absoluto entre dos soluciones sucesivas de x sea menor a la
tolerancia, es decir, que:

(n)
(n1)
x
x

< T ol.
3. Que la norma infinita del error relativo entre dos soluciones sucesivas sea menor a la
tolerancia, o sea:
(n)

x x(n1)

< T ol.
x(n)
El mejor de los criterios es ltimo, pues hemos visto que es el error relativo el que mejor
representa la incidencia del error en los resultados.
2.10.2.
Convergencia de los mtodos estacionarios
Hemos dicho que los mtodos de Jacobi y Gauss-Seidel convergen para matrices A estrictamente diagonal dominantes. Los siguientes teoremas aseguran la convergencia de ambos
mtodos.
Curso 008
PRELIMINAR
- 43 -
Anlisis Numrico I
Teorema 2.3. Si A es una matriz de n n, entonces se cumple que:

1/2
1. kAk2 = AT A
.
2. (A) kAk, para toda norma natural.
Teorema 2.4. Si la matriz A es estrictamente diagonal dominante, entonces con cualquier
(k) elec
(0)
cin de x , tanto el mtodo de Jacobi como el de Gauss-Seidel dan las sucesiones x
k=0
que convergen a una nica solucin del sistema Ax = B.
Teorema 2.5. Si aij 0 para cada i 6= j, y si aii > 0 para cada i = 1; 2; . . . ; n, entonces ser
vlida una y slo una de las siguientes afirmaciones:
1. 0 (TG ) < (TJ ) < 1;
2. 1 < (TJ ) < (TG );
3. (TJ ) = (TG ) = 0;
4. (TJ ) = (TG ) = 1;
donde TJ es la matriz de Jacobi, y TG es la matriz de Gauss-Seidel.
Para analizar la convergencia del mtodo de las sobrerrelajaciones sucesivas se deben
tener en cuenta estos otros teoremas.

Teorema 2.6. Para cualquier x(0) <n , la sucesin x(k) k=0 definida por
x(k+1) = T x(k) + C, para cada k 1,
converge en la solucin nica de x = T x + C si y slo si (T ) < 1.
Este teorema nos dice que cualquier mtodo iterativo converge cuando el radio espectral
de la matriz T es menor a 1, tal como vimos al comenzar. Recordemos que la definicin del radio
espectral de una matriz A cualquiera es
(A) = max || ,
donde es un autovalor de A. En efecto, habamos dicho que para que cualquier mtodo iterativo
sea convergente, se deba cumplir que kT k < 1. Como (T ) kT k < 1, si los mdulos de los
autovalores de T son menores que 1, entonces los mtodo convergen a la solucin buscada.
Teorema 2.7. Si A es una matriz definida positiva y si 0 < < 2, entonces el mtodo SOR
converge para cualquier eleccin del vector aproximado x(0) .
Teorema 2.8. Si A es una matriz definida positiva y tridiagonal, entonces (TG ) = [(TJ )]2 < 1,
y la eleccin ptima de para el mtodo SOR es
2
=
1+
1 [(TJ )]2
Este ltimo vincula los autovalores de la matriz TJ , es decir la matriz T del mtodo de
Jacobi, con el valor de . Aunque se refiere a una matriz tridiagonal, es posible ver que cuanto
menor sea el valor de (TJ ) ms se acerca a 1. (Si (TJ )2 es mayor que uno, entonces no hay
un real que haga convergente al mtodo.)
- 44 -
PRELIMINAR
Curso 008
Anlisis Numrico I
2.10.3.
Mtodos no estacionarios
Vimos en el punto anterior los mtodos estacionarios, aquellos en los cuales las matrices
T y C se mantienen invariantes en las sucesivas iteraciones. Existen otros mtodos en los cuales
estas dos matrices s se van modificando en las sucesivas iteraciones. Son los llamados mtodos
no estacionarios.
1
Supongamos que en nuestra expresin general, definimos que P = I. Si reemplazamos
obtenemos:
x(i+1 = (I IA) x(i) + IB,

= x(i) + B Ax(i) ,
= x(i) + r(i) .
Tenemos ahora un mtodo iterativo que depende de un parmetro para ir corrigiendo
el vector solucin. Nos falta definir ese parmetro. Pero tambin depende de otro vector, el ya
visto residuo. Por lo tanto tenemos dos elementos que podemos manejar para obtener una mejor
aproximacin. Veremos a continuacin algunos de los mtodos no estacioanrios ms sencillos que
han servido de base para el desarrollo de los ms modernos y complejos.
Mtodo de los residuos mnimos
Una primera aproximacin para esta expresin es buscar que el vector r(i+1) sea mnimo
en cada iteracin. De esta manera siempre tenderemos a la solucin del sistema, pues el ideal
es que sea nulo. Una forma de obtener el mnimo es minimizar la norma eucldea, es decir, el
mdulo de r(i+1) . Partamos precisamente de la definicin del mdulo:

(i+1)

r
= B Ax(i+1) .
2
Si lo elevamos al cuadrado tenemos

2
(i+1) 2

r
= B Ax(i+1)
2
2

2

(i+1) 2

r
= B A x(i) + r(i) .
2
r(i+1) ,
Como queremos minimizar el mdulo de

lo mismo es minimizar el cuadrado del mdulo.
Para ello vamos a derivar la tlima expresin respecto de , que es nuestro parmetro, y lo
igualaremos a cero. As tenemos que:

T h
i
2 Ar(i) B Ax(i) Ar(i) = 0

T h
i
Ar(i) r(i) Ar(i) = 0

T
T
Ar(i) r(i) = Ar(i) Ar(i)
T
Ar(i) r(i)
.
i =
T
Ar(i) Ar(i)
Este coeficiente i nos asegura que el residuo sea mnimo. As nuestro esquema iterativo
queda de la siguiente forma:
r(i) = B Ax(i)
T
Ar(i) r(i)
i =
T
Ar(i) Ar(i)
x(i+1) = x(i) + i r(i) .
Curso 008
PRELIMINAR
- 45 -
Anlisis Numrico I
Este mtodo slo es convergente si se cumple que la matriz A es simtrica y definida

positiva, pues de lo contrario no obtendremos un mnimo. (Una demostracin de esto puede
verse en [10].)
Existe un segundo algoritmo que tiene la siguiente forma:
r(0) = B Ax(0)
T
Ar(i) r(i)
i =
T
Ar(i) Ar(i)
x(i+1) = x(i) + i r(i)
r(i+1) = r(i) i Ar(i) .
En ambos algoritmos las iteraciones finalizan cuando r(i+1) < T ol, pues r(n) = 0 para
n.
Mtodo del descenso ms rpido
Un segundo mtodo no estacionario es el denominado mtodo del descenso ms rpido.
Este mtodo mejora la aproximacin obtenida en el punto anterior. Para poder deducirlo antes
necesitamos saber qu es una forma cuadrtica.
Forma cuadrtica: Es una funcin vectorial que se expresa como:
f (x) =
1 T
x Ax B T x + C,
2
similar a una ecuacin de segundo grado en el campo escalar, donde A es una matriz, x y B son
vectores y C es una constante (escalar).
Supongamos ahora que queremos hallar el mnimo (o mximo) de esta funcin. Entonces
debemos obtener su derivada e igualarla a cero, es decir, hacer que:
1
1
d f (x)
= AT x + Ax B = 0.
dx
2
2
Si A es una matriz simtrica entonces A = AT , y podemos escribir:
d f (x)
= Ax B = 0,
dx
que no es otra cosa que nuestro sistema de ecuaciones lineales original. Si adems A es definida
positiva, nos aseguramos que la solucin que se obtenga haga mnima a la forma cuadrtica. En
consecuencia, para aplicar este mtodo, la matriz A tambin debe ser simtrica definida positiva.
Recordemos tambin qu es el gradiente de una funcin vectorial. Para una funcin f (x)
el gradiente se expresa como:
f (x)
x1
f (x)
d f (x)
0
= f (x) = x2
dx
..
.
f (x)
xn
El gradiente nos da una idea de la pendiente o del crecimiento de la forma cuadrtica.

Si queremos hallar el valor mnimo de la funcin f (x) partiendo de una solucin inicial, lo ideal
sera utilizar estas direcciones de mayor crecimiento pero en sentido inverso, es decir, usar f 0 (x),
que puede escribirse como:
f 0 (x) = B Ax.
- 46 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Pero como estamos iterando, tenemos en realidad que:

f 0 (x(i) ) = B Ax(i) = r(i) ,
que resulta ser el residuo. En consecuencia, el residuo no es otra cosa que la direccin descendente
ms empinada para llegar al mnimo, o sea, la del descenso ms rpido. Como partimos de un
vector inicial, lo que nos interesa es obtener un coeficiente que optimice cada paso utilizando la
direccin ms empinada y as obtener una aproximacin i+1 ms cercana a la solucin exacta.
Para ello partamos de la expresin general
x(i+1) = x(i) + r(i) .
Para obtener el , minimizaremos la funcin cuadrtica. As tenemos que:
df (x(i+1) )
dx(i+1)
= f 0 (x(i+1) )T
= f 0 (x(i+1) )T r(i) = 0,
d
d
lo que equivale a decir que el residuo y el gradiente son ortogonales. Como adems sabemos que
r(i+1) = f 0 (x(i+1) , entonces tenemos:
r(i+1) r(i)
T

B Ax(i+1) r(i)
iT
h

B A x(i) + i r(i)
r(i)
T
T

(i)
(i)
(i)
B Ax
r i Ar
r(i)
T

B Ax(i) r(i)
= 0
= 0
= 0
= 0
T

= i Ar(i) r(i)
r(i) r(i) = i r(i) Ar(i)

T
i =
r(i) r(i)
T
r(i) Ar(i)
As, nuestro nuevo algoritmo es:

r(0) = B Ax(0)
T
i =
x(i+1)
r(i) r(i)
T
r(i) Ar(i)
= x(i) + i r(i)
r(i+1) = r(i) i Ar(i) .

El criterio para interrupir las iteraciones es el mismo al aplicado en residuos mnimos.
Mtodo del gradiente conjugado
El mtodo anterior es una mejora notable al mtodo de los residuos mnimos. No slo
mejora la velocidad de convergencia sino que reduce la cantidad de operaciones. Sin embargo
tiene una desventaja importante: suele usar varias veces la misma direccin de acercamiento.
Esto significa que no utiliza bien las direcciones ms empinadas. Veamos por qu.
Vimos que el vector residuo es el gradiente de nuestra forma cuadrtica. Supongamos que
sta sea solamente de dos variables, es decir, un paraboloide de revolucin. El gradiente ser un
plano que pasa por un punto cuya inclinacin nos da una idea del crecimiento (decrecimiento)
en ese punto. Pero en realidad lo que tenemos son varias direcciones posibles que descienden
rpidamente hacia el mnimo. El mtodo anterior slo exige que los residuos sean ortogonales,
Curso 008
PRELIMINAR
- 47 -
Anlisis Numrico I
pero no se ocupa de las direcciones con las cuales se aproxima al siguiente resultado, con lo cual
puede repetir cualquier direccin en el proceso iterativo hasta obtener la solucin. As pierde
eficiencia.
La forma ms rpida de llegar sera usar direcciones que no se repitan durante el proceso
de descenso. Cul sera el conjunto de direcciones que haran ms rpido ese descenso? La
respuesta es: tomemos un conjunto de direcciones d(0) ; d(1) ; . . . ; d(n1) , tales que sean ortogonales
entre s, o sea que se cumpla que:
d(0) d(1) = 0;
d(1) d(2) = 0;
(i)
(j)
= 0, para i 6= j.
Entonces nuestra expresin inicial ser

x(i+1) = x(i) + d(i) ,
en lugar de la vista para el resto de los mtodos.

Como hemos definido que las direcciones que aproximan nuestra solucin son ortogonales,
entonces tambin el error e(i+1) debera ser ortogonal, es decir, se debera cumplir que:
T
d(i)
T
(i)
e(i+1)
= 0
d
(i)
(i)
= 0
e + i d
T
d(i) e(i) + i d(i) d(i) = 0

T
d(i) e(i) = i d(i) d(i)

T
i =
d(i) e(i)
T
d(i) d(i)
Sin embargo, este algoritmo no es muy til pues debemos conocer el error que estamos
cometiendo para obtener el coeficiente i . Y si conocemos e(i+1) , conocemos la solucin y no
tendra sentido obtener el coeficiente .
En lugar de proponer que el error sea ortogonal a la direccin, vamos a proponer que las
direcciones sean conjugadas, tambin llamadas direcciones ortogonales por A. Qu significa esto?
Supongamos por un momento que trabajamos sobre una superficie esfrica similar a un globo, y
dibujamos sobre sta dos lneas que sean ortogonales, por ejemplo, un meridiano y un paralelo,
como se usan en la representacin de la superficie terrestre. Si deformamos nuestro globo de
manera que una dimensin sea ms grande que la otra, manteniendo una constante, formando
un elipsoide de revolucin, las dos lneas seguirn estando, pero no sern ortogonales. Pero si
volvemos a transformar ese globo defomado en esfera otra vez, volvern a ser ortogonales. La idea
del mtodo es partir de la situacin del elipsoide, transformar los vectores de forma de llevarlos
a la esfera, obtener all las direcciones y luego trabajar nuevamente en el elipsoide. De esa forma,
las direcciones slo sern ortogonales en la superficie de la esfera, pero sern conjugadas en el
elipsoide. (Otro ejemplo en ese mismo sentido sera proyectar la esfera sobre un plano, prctica
comn de la cartografa.)
- 48 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Vamos a proponer lo siguiente:

T
d(i) r(i+1) = 0
T
d(i)
(i)
Ae(i+1)
d
= 0
(i)
(i)
A e + i d
= 0
d(i) Ae(i) + i d(i) Ad(i) = 0

T
d(i) Ae(i) = i d(i) Ad(i)

T
d(i) Ae(i)
i =
d(i) Ad(i)
T
d(i) r(i)
.
T
d(i) Ad(i)
i =
Con este coeficiente nos aseguramos que nuestro mtodo aplica direcciones de aproximacin sean
conjugadas. Pero nos faltan hallar estas direcciones. Cmo las obtenemos? La forma ms sencilla
es aplicar el mtodo de Gram-Schmidt para ortogonalizar vectores. En este caso lo que haremos es
obtener vectores conjugados a partir de un vector inicial, por lo que la frmula de Gram-Schmidt
queda de la siguiente forma:
i1
X
(i)
(i)
d =u +
ij Ad(j) ,
j=0
y el coeficiente ij lo obtenemos mediante:

T
ij =
u(i) Ad(j)
T
d(j) Ad(j)
siendo u(i) el vector a partir del cual obtenemos las direcciones conjugadas (ortogonales por A).
(Vase [11].)
Nos falta definir el vector u(i) . Si proponemos al vector r(i) tendremos que:
T
d(i) r(i) = r(i) r(i) ,

y entonces, que:
T
ij =
r(i) Ad(j)
.
T
d(j) Ad(j)
Ahora vamos a obtener el ij para poder encontrar nuestras direcciones conjugadas. As,
tenemos.
T
r(i) r(j+1) = r(i) r(j) j r(i) Ar(j)

T
j r(i) Ar(j) = r(i) r(j) r(i) r(j+1)

1
T
si i = j
r(j) r(j)
T
j
r(i) Ar(j) =
1
T
r(j+1) r(j+1) si i = j + 1
j
T
j+1 j
1 r(j+1) r(j+1)
j d(j) T Ad(j)
Habamos obtenido que:

T
j =
Curso 008
d(j) r(j)
T
d(j) Ad(j)
1
d(j) Ad(j)
,
=
T
j
d(j) r(j)
PRELIMINAR
- 49 -
Anlisis Numrico I
por lo tanto, finalmente tendremos que:

T
j+1 j =
d(j) Ad(j) r(j+1) r(j+1)

T
d(j) r(j)
d(j) Ad(j)
r(j+1) r(j+1)
d(j) r(j)
r(j+1) r(j+1)
T
r(j) r(j)
pues al d(j) lo obtenemos a partir del r(j) . Simplificando la notacin tenemos:

T
j+1 =
r(j+1) r(j+1)
T
r(j) r(j)
Con este ltimo coeficiente tenemos el algoritmo para el mtodo del gradiente conjugado,
que resulta ser:
d(0) = r(0) = B Ax(0)
T
i =
x(i+1)
r(i) r(i)
T
d(i) Ad(i)
= x(i) + i d(i)
r(i+1) = r(i) i Ad(i)

T
i+1 =
d(i+1)
2.10.4.
r(i+1) r(i+1)
T
r(i) r(i)
(i+1)
= r
+ i+1 d(i) .
Convergencia de los mtodos no estacionarios
Analizaremos brevemente la convergencia de los mtodos no estacionarios. En primer

lugar nos ocuparemos rpidamente del mtodo de los residuos mnimos, y luego de los otros dos
mtodos.
Mtodo de los residuos mnimos
Ya habamos dicho que para garantizar la convergencia de este mtodo, la matriz A debe
ser definida positiva. El siguiente teorema demuestra esta afirmacin.
Teorema 2.9. Sea A una matriz definida positiva y sea

A + AT
; = kAk2 ,
= mn
2
entonces el vector r(i+1) generado por el mtodo de los residuos mnimos satisface la relacin

1/2

2
(i+1)
(i)
r
1 2
r ,
2
2
y el algoritmo correspondiente converge para cualquier valor inicial de x(0) .
La demostracin de este teorema puede verse en [9].
Mtodo del descenso ms rpido
Para el anlisis de la convergencia de este mtodo (y el del gradiente conjugado) nos
basaremos en el estudio de los autovalores y autovectores de la matrioz A.
Supongamos que el vector e(i) sea un autovector asociado a un autovalor e . Entonces el
residuo se puede escribir como:
r(i) = Ae(i) = e e(i) ,
- 50 -
PRELIMINAR
Curso 008
Anlisis Numrico I
por lo tanto, es tambin un autovector.

De la misma forma podemos obtener e(i+1) , pues es:
T
e(i+1) = e(i) +
= e(i) +
r(i) r(i)
T
r(i)
T
r(i)
Ar(i)
r(i)
r(i)
T
e r(i) r(i)
e e(i)
= 0.
Si uno elige i = e , basta con una iteracin para obtener el resultado exacto! Pero
en realidad, debemos expresar e(i) como una combinacin lineal de autovectores, es decir,
(i)
n
X
j v (j) ,
j=1
donde los v (j) son vectores ortonormales (elegidos as por conveniencia), y los j son las longitudes
de cada vector. Entonces nos queda
(i)
(i)
= Ae
n
X
j j v (j)
j=1
2
X
T
(i)
j 2
e = e(i) e(i) =
j
T
e(i) Ae(i)
X
X
T
=
j v (j)
j j v (j)
j
j 2 j
2
X
T
(i)
j 2 j 2
r = r(i) r(i) =
j
(i) T
Ar(i) =
j 2 j 3
Esta ltima expresin la obtenemos al tener en cuenta que el r(i) tambin se puede
expresar como la combinacin lineal de autovecores, y que su longitud es j j . Si volvemos a
la expresin del vector e(i+1) tenemos:
T
(i+1)
(i)
= e
r(i) r(i)
T
r(i) Ar(i)
X
j 2 j 2
j
= e(i) + X
j j
r(i)
r(i) ,
que nos muestra que i es un promedio ponderado de

Curso 008
PRELIMINAR
1
.
j
- 51 -
Anlisis Numrico I
Para analizar la convergencia en forma ms general vamos a definir primero la norma

1/2
energtica kekA = eT Ae
. Con esta norma tenemos:

2
T
(i+1)
= e(i+1) Ae(i+1)
e

A
T

T
=
e(i) + i r(i) A e(i) + i r(i)
T
= e(i) Ae(i) + 2i r(i) Ae(i) + i 2 r(i) Ar(i)

#2
"
T
T
2
r(i) r(i) h (i) T (i) i
r(i) r(i)
T
(i)
r(i) Ar(i)
= e + 2
r
r
+
T
T
(i)
(i)
(i)
(i)
A
r
Ar
r
Ar
h T
i2
2
r(i) r(i)

= e(i)
(i) T Ar (i)
A
r
X
2
2 2
2
j j

X
= e(i) 1 X
2 3
2
A
j j
j j
X
2
2 2
2
j j

X
= e(i) 2 con 2 = 1 X
2
3
A
j j
j2 j
Esto quiere decir que el error de la iteracin i + 1 es funcin de los autovalores de A. Como lo
que interesa es un lmite superior del error, y no el error en si mismo, si definimos que
=
max
,
mn
1
,
+1
se puede demostrar que
con lo cual tenemos

1 i
(i)
(0)
e
e .
+1
A
A
Esta demostracin se puede ver en [11].

Mtodo del gradiente conjugado
Para el mtodo del gradiente conjugado vale el mismo desarrollo hecho para el descenso
ms rpido, pero con una leve modificacin se llega a que
i

1
(0)
(i)
e 2
e .
+1
A
A
Podemos decir que el mtodo converge ms rpido que el mtodo del descenso ms rpido,
pues en el primero la convergencia depende de , mientras que en el segundo depende de

. Puesto que es equivalente a la condicin de A, finalmente tenemos que una matriz bien
condicionada converge rpidamente a la solucin, en tanto que no lo hace si est mal condicionada.
Por esta razn, este mtodo rara vez se aplica directamente sobre el sistema Ax = B, sino que se
precondiciona a la matriz A con una matriz M , formando el sistema M T Ax = M T B de manera
tal que M T A suele tener un nmero de condicin mucho menor que A.
Por otra parte, si la matriz est bien condicionada, el mtodo del gradiente conjugado
converge luego de n iteraciones. Es ms, si no hubieran problemas derivados de la representacin
numrica en las computadoras, el mtodo convergera despus de k iteraciones, siendo k el nmero
de autovalores no repetidos de A.
- 52 -
PRELIMINAR
Curso 008
Anlisis Numrico I
2.10.5.
Aspectos computacionales
En general, obtener una solucin eficiente de un sistema de ecuaciones lineales por medio
de mtodos iterativos depende fuertemente de la eleccin del mtodo. Si bien podemos esperar
una menor eficiencia de estos mtodos respecto de los mtodos directos, los mtodos iterativos
suelen ser ms fciles de implementar y, como no hay que factorizar la matriz, permiten resolver
sistemas mucho ms grandes que los directos.
Como resumen de los mtodos vistos, tenemos lo siguiente:
1. Mtodo de Jacobi: Muy fcil de usar, pero slo converge si la matriz es estrictamente
diagonal dominante. Actualmente slo se lo considera como una forma de introduccin a
los mtodos iterativos.
2. Mtodo de Gauss-Seidel: Converge ms rpido que el de Jacobi, pero no puede competir
con los mtodos no estacionarios. Tiene la ventaja de que tambin converge si la matriz
del sistema es simtrica y definida positiva.
3. Mtodo de las sobrerrelajaciones sucesivas: Converge ms rpido que Gauss-Seidel
si > 1, y suele converger con < 1 cuando Gauss-Seidel no converge. Como vimos, la
velocidad de convergencia depende de , valor que no es fcil de obtener en forma analtica.
Obtener ese valor puede llevar a perder parte de esa ventaja.
4. Mtodo de los residuos mnimos: Converge si la matriz A del sistema es definida
positiva y mejora si adems es simtrica. Es ms fcil de programar pues hay que hacer
operaciones matriciales (vectoriales). La convergencia puede ser lenta, similar a Jacobi.
5. Mtodo del descenso ms rpido: Se aplica a sistemas con matrices simtricas definidas
positivas. Converge ms rpido que el anterior pero si la matriz no est bien condicionada, no converge. Es ms fcil de programar que el anterior porque reduce la cantidad de
operaciones matriciales. Es equivalente a Gauss-Seidel.
6. Mtodo del gradiente conjugado: Se aplica a matrices simtricas definidas positivas.
Cuando la matriz est bien condicionada y adems tiene k autovalores repetidos y bien
distribuidos, converge para n k iteraciones (convergencia supralineal). Por este motivo,
suele usarse precondicionado para conseguir convergencias supralineales. Es ms fcil de
implementar que los anteriores mtodos no estacionarios, pero suele tener problemas con
el error de redondeo.
2.11.
Errores de los mtodos iterativos
En este punto analizaremos fundamentalmente los errores de los mtodos iterativos estacionarios, pues son conceptualmente ms fciles de entender. Empezaremos por el error de truncamiento.
Supongamos que x sea la solucin de nuestro sistema de ecuaciones y x(k+1) el resultado
luego de k + 1 iteraciones. Entonces podemos definir el error como

x(k+1) x = T x(k) x .
Si sumamos y restamos T x(k+1) tenemos

x(k+1) x = T x(k) x + T x(k+1) T x(k+1)

= T x(k) x(k+1) + T x(k+1) x .
Curso 008
PRELIMINAR
- 53 -
Anlisis Numrico I
2.11. Errores de los mtodos iterativos
Si tomamos las normas tenemos que

(k+1)

x kT k x(k+1) x(k) + kT k x(k+1) x
x

(1 kT k) x(k+1) x kT k x(k+1) x(k)

kT k
(k+1)
(k+1)

(k)
x
x
x

.

(1 kT k)
Por lo tanto, el error de truncamiento est dado por

kT k

(k+1)
x(k) .
ET
=
x
(1 kT k)
Para el caso del error inherente partimos de
x(k+1) = T x(k) + C.
Si consideramos que los errores inherentes del sistema, el resultado que obtendremos ser
en realidad x
(k+1) . Supongamos que desechamos todos los errores de los pasos anteriores, es decir,
que x(k) x
(k) , entonces tenemos que
x
(k+1) = x(k) x(k) = (T T )x(k) + (C C).
Como x = T x + C, podemos hacer lo siguiente:
x
(k+1) x = (T T )x(k) + (C C) T x C

= T x(k) x T x(k) C

= T x(k) x T x(k) C + T x(k+1) T x(k+1)

= T x x(k+1) + T x(k+1) x(k) T x(k) C.
Si nuevamente tomamos las normas, obtenemos

(k+1)

x kT k x(k+1) x + kT k x(k+1) x(k) + kT k x(k) + kCk
x

(1 kT k) x(k+1) x kT k x(k+1) x(k) + kT k x(k) + kCk

kT k
kCk
kT k
(k+1)
(k)
(k+1)

(k)
x
x
+
x
.
x

+
1 kT k
1 kT k
1 kT k
Si analizamos en detalle esta ltima expresin, vemos que se repite el error de truncamiento (primer trmino de la derecha). En consecuencia, el error inherente est dado por

kT k
kCk
(k)
EI =
.
x +
1 kT k
1 kT k
Finalmente, analicemos el error de redondeo. Una vez ms, partamos de la expresin
x(k+1) = T x(k) + C,
y nuevamente supongamos que lo que obtenemos es en realidad es x
(k+1) y que x(k) x
(k) .
Entonces nos queda:
x
(k+1) = T x(k) + C.
Para cada compnente de x(k+1) tenemos

n
X
(k+1)
(k+1)
(k)
x
x
= fl
tij x + ci (1 i ) .
i
j=1
- 54 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Si hacemos un anlisis retrospectivo del error (backward error), y asumimos que n

0, 01, nos queda que
X
(k+1)
(k)
(k+1)
xi
=
tij xj 1, 01(n + 2 j)j (1 + i ) + xi
i ,
j
con |j | 1 y |i | .
Consideremos ahora el hecho de que generalmente las matrices de los sistemas son ralas.
Entonces podemos definir que
p =
q =
max {pi }, con pi : cantidad de elementos no nulos en una fila.
1in
max {|tij |},
1i,jn
entonces, si tomamos normas nos queda
p

X
(k+1)
(k)
(k+1)
q
x
1,
01
(p
+
2
j)
+
x
i

i
,
j=1
y como x(k) x(k+1) , podemos escribir que

(k+1)

xi

p2 + 3p

+ 1 .
x(k) q 1, 01 2
Ahora estimemos la diferencia x
(k+1) x. Sabemos que
x
(k+1) = T x(k) + C x(k+1) ,
entonces
x
(k+1) x = T x(k) + C x(k+1) T x C
= T x(k) x x(k+1) .
Si nuevamente sumamos y restamos T x(k+1) , obtenemos

(k+1) x x(k+1) .
x
(k+1) x = T x(k) x
(k+1) + T x
Una vez ms, tomemos

(k+1)

x
x

(k+1)

(1 kT k) x
x

(k+1)

x
x
las normas, con lo cual nos queda

(k+1)

= kT k x(k+1) x
(k) + kT k x
x + x(k+1)

= kT k x(k+1) x
(k) + x(k+1) +

x(k+1)
kT k
(k+1)
(k)
=
+x

x
1 kT k
1 kT k

(k+1)
p2 +3p
Puesto que xi
q 1, 01 2 + 1 x(k) y como el primer trmino corresponde
al error de truncamiento, nos queda que
(k)

x
p2 + 3p
ER
q 1, 01
+ 1 .
1 kT k
2
Curso 008
PRELIMINAR
- 55 -
Anlisis Numrico I
2.12. Notas finales
Finalmente, el error total al aplicar un mtodo iterativo estacionario es la suma de todos

los errores, es decir,

(k+1)

x ET + EI + ER
x

kT k
kCk
kT k
(k+1)
(k)
(k)
x +
x
x +
(1 kT k)
1 kT k
1 kT k
(k)

x
p2 + 3p
+
q 1, 01
+1
1 kT k
2

1

(k+1)

kT k x(k+1) x(k) + kT k x(k) + kCk
x
x
1 kT k

p2 + 3p
(k)
+ x q 1, 01
+1 .
2
Como hemos visto en el captulo 1, siempre es conveniente que los errores de truncamiento
e inherentes predominen respecto al de redondeo. En consecuencia, siempre debemos tratar que
EI > ET > ER , es decir, que el error de redondeo sea el de menor incidencia, y si es posible,
despreciable.3
2.12.
Notas finales
Los mtodos vistos no son los nicos disponibles para resolver sistemas de ecuaciones
lineales. Dentro de los mtodos directos tambin estn el mtodo QR y el de la descomposicin
por el valor singular, mtodo muy usado con matrices muy mal condicionadas, aunque algunos
autores sostienen que debera ser un mtodo bsico, igual que eliminacin de Gauss.
Algo similar ocurre con los mtodos iterativos, particularmente con los no estacionarios.
Adems de los tres que hemos visto, estn el mtodo de los residuos mnimos generalizado, el
mtodo del gradiente biconjugado y el del gradiente conjugado cuadrado, el mtodo por iteraciones de Chebichev, ms otros derivados fundamentalmente a partir del mtodo del gradiente
conjugado y de los residuos mnimos.
La existencia de varios mtodos refleja que la eleccin de uno depende fundamentalmente
de las propiedades de la matriz de coeficientes del sistema. Es por esto que cada vez es ms
importante saber qu problema (o fenmeno fsico) est siendo representado con el sistema a
resolver. Si buscamos informacin sobre la utilizacin de cada mtodo, veremos que estn muy
ligados al tipo de problema que se estudia y resuelve.
En muchos campos de la ingeniera, los sistemas de ecuaciones lineales estn directamente
relacionados con la resolucin de ecuaciones diferenciales en derivadas parciales, por eso es que
mtodos para resolver este tipo de problemas, como el de las diferencias finitas o de los elementos finitos, hayan impulsado el desarrollo de mtodos ms potentes y ms precisos, dado que
mayormente trabajan con matrices de dimensiones muy grandes que adems suelen ser ralas.
Finalmente, quien quiera adentrarse en los mtodos iterativos no estacionarios, el libro de
Y. Saad es una muestra muy interesante de cmo la necesidad de contar con algoritmos cada vez
ms veloces y con capacidad de resolver grandes sistemas de ecuaciones, disparan el desarrollo y
la investigacin de la matemtica aplicada.
3
Gonzlez, en su libro, dice que ER > ET pero eso se contrapone con lo que afirman otros autores. La razn
principal es que el error de redondeo tiene un comportamiento errtico, lo que hace difcil acotarlo. (Ver ejemplo
en el captulo 1 con el error de discretizacin.)
- 56 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Captulo 3
Ecuaciones no Lineales
3.1.
Introduccin
En el captulo anterior vimos como resolver sistemas de ecuaciones lineales (de la forma
Ax = B o Ax B = 0), sistemas cuya solucin es nica. Pero existe una gran cantidad de
problemas que no pueden representarse mediante ecuaciones lineales. Muchas cuestiones que debe
enfrentar la ingeniera no tienen solucin nica (como en los sistemas de ecauciones lineales) o
no se pueden obtener en forma algebraica.
Tomemos el siguiente caso: supongamos que queremos desarrollar una mejora en la costa
y para ello necesitamos un recinto cerrado, el cual vamos a rellenar con arena. Para conseguir ese
recinto necesitamos una pared de contencin que construiremos con tablestacas. Para disear las
tablestacas debemos resolver una ecuacin del tipo a0 + a1 x + a2 x2 + a3 x3 = 0, donde x es la
longitud de hinca, tambin conocida como ficha. Esta ecuacin tiene tres soluciones posibles
(tres races). Si bien existe una solucin algebraica para obtener las races de una ecuacin de
tercer grado, en general, es mucho ms prctico resolverla mediante algn mtodo iterativo, y
obtener aquella solucin (riz) que es compatible con el problema.
Como dijimos, estn tambin aquellas ecuaciones que no tienen solucin algebraica y que,
por lo tanto, slo podrn resolverse mediante aproximaciones. Tenemos como ejemplo, calcular
la longitud de onda de una ola martima en aguas poco profundas. La expresin para esto es:

2
L = L0 tanh
x ,
L
L
donde L0 es la longitud de onda en aguas profundas (x ) y x es la profundidad del mar.
2
L
Esta expresin es vlida para 0 x . Como podemos ver, esta ecuacin no tiene solucin
2
algebraica, y, en consecuencia, el nico modo de obtener la solucin es mediante un mtodo
iterativo. (Cuando x > L2 , entonces tanh 2
L x = 1, y L = L0 .)
Dado que este tipo de problemas son regularmente comunes en la ingeniera, en este
captulo nos ocuparemos de estudiar los distintos mtodos para resolver ecuaciones no lineales,
de manera de obtener resultados muy precisos.
Como repaso, recordemos los teorema del valor medio y del valor intermedio.
Teorema 3.1. (Teorema del valor medio.) Si f C[a; b] y f es diferenciable en (a; b), entonces
existir un nmero c en (a; b) tal que
f 0 (c) =
f (b) f (a)
.
ba
Teorema 3.2. (Teorema del valor intermedio.) Si f C[a; b] y M es un nmero cualquiera entre
f (a) y f (b), existir un nmero c en (a; b) para el cual f (c) = M .
Curso 008
PRELIMINAR
- 57 -
Anlisis Numrico I
3.2. Mtodo de la biseccin
3.2.
Mtodo de la biseccin
Supongamos que tenemos una funcin cualquiera f (x) y debemos hallar el valor de x
, tal
que f (
x) = 0. Asumamos que x
est incluido en el intervalo (a; b), con b > a. Para que esto sea
cierto, generalmente se verifica que f (a) f (b) < 0. (Sin embargo, hay casos en que f (
x) = 0,
x
(a; b) y no se cumple que f (a) f (b) < 0.)
Puesto que x
(a; b), calculemos nuestra primera aproximacin tomando el valor medio
del intervalo, es decir,
ba
b+a
x1 = a +
=
.
2
2
Para saber si es o no solucin debemos verificar que f (x1 ) = 0. Si no lo es, debemos volver a
obtener una aproximacin mediante un esquema similar. Para ello, verifiquemos que f (a)f (
x) <
0. Si es cierto, entonces nuestro nuevo intervalo ser (a; x
), si no lo es, nuestro intervalo ser (
x; b).
Supongamos, por simplicidad, que f (a) f (
x) < 0 y que nuestro nuevo intervalo es (a; x
). Con
el mismo mtodo usado antes, nuestra nueva aproximacin es
x2 =
x1 + a
=
2
b+a
2
+a
b+a a
=
+ ,
2
4
2
que tambin puede escribirse como

ba
.
4
Nuevamente verificamos si f (x2 ) = 0. Si seguimos iterando hasta obtener xn , tenemos que
x2 = x1
xn = xn1
ba
,
2n
por lo que tambin podemos decir que

|
x xn |
ba
.
2n
Si queremos hallar el valor exacto de x

deberamos iterar hasta que |
x xn | = 0. Pero si establecemos una tolerancia de modo que |
x xn | < , entonces tendremos que la cantidad aproximada
de iteraciones para obtener este resultado es
|
x xn |
ba
2n
ba
<
2n
<
n >

ln ba
.
ln(2)
Este mtodo de aproximacin de las soluciones se conoce como mtodo de la biseccin.

Es muy sencillo y tiene la ventaja de que siempre converge, pues nada exige a la funcin a la
cual se le quiere calcular la raz, salvo que se cumpla que f (xk1 ) f (xk ) < 0, mientras se est
iterando. Los criterios para detener el procedimiento pueden ser:
|xn xn1 | ,
|xn xn1 |
,
|xn |
|f (xn | .
donde es la tolerancia impuesta.
Cualquiera de los tres criterios es bueno para detener el proceso, si bien el segundo es el
ms efectivo, pues se basa en el error relativo, y nos da una idea aproximada de la cantidad de
- 58 -
PRELIMINAR
Curso 008
Anlisis Numrico I
cifras o dgitos significativos que tiene el resultado obtenido. En cambio, el ltimo es el menos
confiable, pues por definicin f (xn ) tiende a cero, con lo cual siempre es pequeo.
Aunque no tiene problemas por la convergencia, el mtodo resulta muy lento para alcanzar un resultado aceptable. Adems, segn sea el criterio de interrupcin aplicado, en muchas
ocasiones puede despreciar un resultado intermedio ms preciso. Es por eso que no suele utilizarse
para obtener la solucin ms precisa al problema.
3.3.
Mtodo de la falsa posicin o regula falsi
Hay otro mtodo que tambin se basa en ir achicando el intervalo en el que se encuentra
la solucin. Se trata del mtodo de la falsa posicin o regula falsi. Consiste en trazar la cuerda
que une los puntos f (a) y f (b) de la funcin dada e ir reduciendo el intervalo hasta obtener el
valor de x
tal que f (
x) = 0. Como se trata tambin de un mtodo iterativo, debemos empezar
por calcular x1 . Existen dos mtodos equivalentes para obtenerlo:
f (a) (b a)
, o
f (b) f (a)
f (b) (b a)
= b
.
f (b) f (a)
x1 = a
x1
La forma de aplicar el mtodo es la siguiente. Utilicemos la primera expresin para obtener

x1 ; entonces verifiquemos que f (x1 ) f (a) < 0. Si esto es cierto, para obtener nuestra segunda
aproximacin tendremos la siguiente expresin:
x2 = a
f (a) (x1 a)
,
f (x1 ) f (a)
caso contrario, nos queda esta otra expresin:

x2 = x1
f (x1 ) (b x1 )
.
f (b) f (x1 )
Algo similar ocurre si partimos de la segunda. Si f (x1 ) f (b) < 0, nos queda
x2 = b
f (b) (b x1 )
,
f (b) f (x1 )
y si no
x2 = x1
f (x1 ) (x1 a)
.
f (x1 ) f (a)
Este mtodo no es una gran mejora al mtodo de la biseccin, aunque al trazar las cuerdas,
hace uso de la funcin y generalmente suele converger un poco ms rpido. Un punto importante
a tener en cuenta es que al igual que en el mtodo de la biseccin, los sucesivos xk se encuentran
siempre en el intervalo de anlisis (el intervalo [xk2 ; xk1 ])y, por lo tanto, en el intervalo [a; b]
inicial.
3.4.
Mtodo de las aproximaciones sucesivas o punto fijo
Puesto que los mtodos anteriores no tienen una convergencia rpida, no son muy prcticos para resolver problemas de gran complejidad. Veremos a continuacin un mtodo mucho
ms poderoso y efectivo.
Supongamos que nuestro problema a resolver, f (x) = 0, lo escribimos de una manera
levemente diferente:
f (x) = x g(x) = 0.
Curso 008
PRELIMINAR
- 59 -
3.4. Mtodo de las aproximaciones sucesivas o punto fijo
Anlisis Numrico I
Es evidente que podemos despejar x de esta ecuacin sin problemas, por lo que finalmente nos
queda:
x = g(x),
es decir, nuestro problema se resume a encontrar una funcin g(x). Pero como estamos resolvindolo en forma iterativa, la expresin que nos queda es:
xk+1 = g(xk ),
para k = 1; 2; . . . ; n. El esquema entonces es sencillo: partiendo de una solucin inicial, por
ejemplo x0 , luego de efectuar n iteraciones tendremos nuestra solucin aproximada xn , que
estar mucho ms cerca del resultado exacto que nuestro valor inicial.
Veamos entonces un ejemplo de cmo aplicar el mtodo. Supongamos que nuestra funcin
es
x4 4x3 x2 + 16x 12 = 0.
Sabemos que existe un mtodo algebraico para obtener las races de este polinomio, pero hagamos
uso del mtodo para obtener la raz en el intervalo (0, 5; 1, 5). Para ello, propongamos la siguiente
funcin g(x):
g1 (x) = 4x3 x4 + x2 15x + 12,
y resolvamos en forma iterativa tomando x0 = 0, 5. Calculemos g1 (x0 ) y obtengamos x1 , luego
x2 y as sucesivamente:
x1 = g1 (x0 ) = 4(0, 5)3 0, 54 + 0, 52 15(0, 5) + 12 = 5, 188
x2 = g1 (x1 ) = 4(5, 188)3 5, 1884 + 5, 1882 15(5, 188) + 12 = 204.
Es fcil notar que tenemos un problema. Como dijimos, la raz buscada se encuentra en
el intervalo (0, 5; 1, 5), pero ambos resultados nos dieron fuera de dicho intervalo, y en el caso de
x2 , de signo opuesto. Evidentemente, esta funcin g1 (x) no nos sirve.
Cambiemos la funcin y volvamos a intentarlo. Probemos con la siguiente funcin:
g2 (x) =
p
4x3 + x2 16x + 12,
e iniciemos el proceso con el mismo x0 . En este caso al hacer seis (6) iteraciones obtenemos el
siguiente resultado: x6 = 1, 009, valor que est dentro del intervalo. Verifiquemos si este valor es
correcto calculando f (x6 ):
f (1, 009) = 1, 0094 4(1, 009)3 1, 0092 + 16(1, 009) 12 = 0, 053.
Este valor puede considerarse cercano cero y por lo tanto, hemos podido encontrar la raz
buscada.
Pero por qu fallamos al usar la primera funcin? Para entender esto veamos los siguientes teoremas.
Teorema 3.3. Si g(x) C(a; b) y g(x) [a; b] para todo x [a; b], entonces g(x) tiene un punto
fijo en [a; b].
Teorema 3.4. Si g 0 (x) existe en [a; b], y existe una constante m < 1, tal que
0
g (x) m, para toda x [a; b],
entonces, el punto fijo en en [a; b] es nico.
- 60 -
PRELIMINAR
Curso 008
Anlisis Numrico I
La demostracin de estos teoremas puede verse en [1].

Estos teoremas son necesarios pero no suficientes, es decir, existen casos para los cuales
no se cumple ninguno de los dos pero la funcin tiene un punto fijo nico en el intervalo dado.
Si miramos la funcin g1 (x) rpidamente notamos que la funcin g1 (x) en 0, 5 no se
mapea en el intervalo dado, por lo tanto, no se puede asegurar que exista un punto fijo. Y si
hallamos la primera derivada en ese punto tenemos que |g10 (0, 5)| = |11, 5| = 11, 5 > 1, con lo
cual si existiera el punto fijo, no podramos asegurar que dicho punto fijo sea nico. No ocurre
lo mismo con la funcin g2 (x) puesto que g2 (0, 5) = 1, 476 [0, 5; 1, 5] y |g20 (0, 5)| = |0, 932| =
0, 932 < 1, con lo cual el punto fijo es nico. En realidad, deberamos haber verificado ambas
funciones g para varios puntos del intervalo, pero al comprobar que el punto de partida no
cumple con las condiciones de ambos teoremas (funcin g1 (x)), nos indica que esta funcin no
es convergente.
Verificado que la funcin g(x) es convergente, nos falta definir el o los criterios de interrupcin. Como en los casos anteriores, stos son similares a los ya vistos, es decir,
|xn xn1 | ,
|xn xn1 |
,
|xn |
|f (xn | .
Con el mismo ejemplo tenemos una pregunta: cmo podemos obtener una solucin por
aproximaciones sucesivas (o punto fijo) que tenga una convergencia rpida? Para ello tenemos el
siguiente teorema.
Teorema 3.5. Sea g(x) C[a; b] tal que g(x) [a; b] para toda x en [a; b], que existe g 0 (x) en
[a; b] y que una constante k < 1 cuando
0
g (x) k, para toda x (a; b).
Entonces, para cualquier nmero x0 [a; b], la sucesin definida por
xn = g(xn1 ), n 1,
converge en el nico punto fijo x
en [a; b] .
Demostracin El teorema 3.5 implica que existe un punto fijo en [a; b]. Como g(x) mapea
[a; b] en s mismo, la sucesin {xn }
n=0 se define para todo n 0 y xn [a; b] para todo n. Dado
que |g 0 (x)| k, si aplicamos el teorema del valor medio, tenemos

| k |xn1 x
| ,
|xn x
| = |g(xn1 ) g(
x)| = g 0 () |xn1 x
donde (a; b). En forma inductiva obtenemos
|xn x
| k |xn1 x
| k 2 |xn2 x
| . . . k n |x0 x
| .
Como k < 1, entonces
lm |xn x
| lm k n |x0 x
| = 0,
y la sucesin {xn }
.
n=0 converge a x
Corolario 3.5.1. Si g satisface las hiptesis de teorema 3.5, las cotas de error que supone utilizar
xn para aproximar x
estn dadas por
|xn x
| k n max{x0 a; b x0 },
y por
|xn x
|
Curso 008
kn
|x1 x0 | , para toda n 1.
1k
PRELIMINAR
- 61 -
Anlisis Numrico I
3.5. Mtodo de Newton-Raphson
Demostracin La primera cota viene de:

|xn x
| k n |xo x
| k n max{x0 a; b x0 },
porque x (a; b).
Con x 1, la demostracin del teorema 3.5 implica que
|xn+1 x
| = |g(xn ) g(xn1 )| |xn xn1 | . . . k n |x1 x0 | .
En consecuencia, cuando m > n 1,
|xm xn | = |xm xm1 + xm1 xm2 + . . . + xn+1 xn |
|xm xm1 | + |xm1 xm2 | + . . . + |xn+1 xn |
k m1 |x1 x0 | + k m2 |x1 x0 | + . . . + k n |x1 x0 |

= k n 1 + k + k 2 + . . . + k mn1 |x1 x0 | .
Por el mismo teorema, tenemos que lmn xm = x
, por lo tanto
n
|
x xn | = lm k |x1 x0 |
n
ki .
i=0
es una serie geomtrica con razn k. Como 0 < k < 1, esta sucesin converge
1
, por lo que nos queda
a
1k
Pero
i=0 k
|
x xn |
kn
|x1 x0 | .
1k
Podemos ver que como |g 0 (x)| k, la convergencia depende de la primera derivada de

g(x). Cuanto ms chico sea k, ms rpida ser convergencia.
3.5.
Mtodo de Newton-Raphson
Este mtodo es uno de los ms poderosos que se conocen para resolver ecuaciones de la
forma f (x) = 0. Una primera aproximacin al mtodo es partir del mtodo de la falsa posicin,
y en vez de trazar una cuerda entre los dos extremos del intervalo, trazamos una tangente.
Supongamos que para el mismo intervalo [a; b] trazamos la tangente que pasa por f (b). En
consecuencia, tendremos que
t(x) = f 0 (b)(x b) + f (b).
Cuando sea f (x) = 0 tambin se cumplir que t(x) = 0. Entonces hallemos x1 tal que y(x1 ) = 0
para ir aproximando nuestra raz. As obtenemos
t(x1 ) = 0 = f 0 (b)(x1 b) + f (b)
f (b)
x1 = b 0 .
f (b)
Si generalizamos, tendremos que
xn = xn1
f (xn1 )
.
f 0 (xn1 )
Otra forma de deducirlo es a travs de la serie de Taylor. Supongamos que f (x) C2 [a, b],
y sea x
una aproximacin de x
tal que f (
x) = 0. Tambin que f 0 (
x) 6= 0 y |
xx
| sea pequeo.
Desarrollemos el primer polinomio de Taylor para f (
x) expandida alrededor de x,
f (x) = f (
x) + f 0 (
x)(x x
) + f 00 ((x))
- 62 -
PRELIMINAR
(x x
)2
,
2
Curso 008
Anlisis Numrico I
donde (x) est entre x y x

. Puesto que f (
x) = 0, entonces para x = x
tenemos
0 = f (
x) + f 0 (
x)(
xx
) + f 00 ((
x))
(
xx
)2
.
2
Al suponer que|
xx
| es pequeo, podemos despreciar (
xx
)2 , con lo que nos queda
0 = f (
x) + f 0 (
x)(
xx
),
y despejando x
de la ecuacin nos queda
x
=x
f (
x)
.
0
f (
x)
Y si en lugar de aproximar con x

lo hacemos con x0 , entonces generamos una sucesin {xn }
definida por
f (xn1 )
xn = xn1 0
,
f (xn1 )
que es la misma expresin que ya vimos.
De este desarrollo podemos ver que el error cometido es proporcional a (
x xn )2 o a
00
f (xn ) (puesto que cuando xn x
podemos suponer que (xn ) xn ). De ah que podemos
aplicar los mismos criterios de interrupcin que en los otros mtodos.
Tambin podemos observar que si no elegimos un x0 lo suficientemente cerca, el mtodo
puede no converger. Para esto tenemos el siguiente teorema.
Teorema 3.6. Sea f C 2 [a; b]; si x
[a; b] es tal que f (
x) = 0 y f 0 (
x) 6= 0, entonces existe
un > 0 tal que el mtodo de Newton-Raphson genera una sucesin {xn }
n=1 que converge a x

para cualquier aproximacin inicial x0 [
x ; x
+ ].
Demostracin La demostracin se basa en analizar el mtodo de Newton-Raphson como si
fuera el mtodo de las aproximaciones sucesivas, tomando que xn = g(xn1 ), y n 1, y que
g(x) = x
f (x)
.
f 0 (x)
Entonces, sea k un nmero cualquiera en (0; 1). En primer lugar debemos encontrar un
intervalo [
x ; x
+] que g mapee en s mismo y en el que |g 0 (x)| k para toda x [
x ; x
+].
0
Como f (
x) 6= 0 y f 0 es continua, existe 1 > 0 tal que f 0 (x) 6= 0 para x [
x 1 ; x
+1 ]
[a; b]. Por lo tanto, g est definida y es continua en [
x 1 ; x
+ 1 ]. Por otro lado tenemos que
g 0 (x) = 1
f (x)f 00 (x)
f 0 (x)f 0 (x) f (x)f 00 (x)
=
,
[f 0 (x)]2
[f 0 (x)]2
para x [
x 1 ; x
+ 1 ] y como f C2 [a; b], tendremos que g C1 [a; b].
Como hemos supuesto que f (
x) = 0, entonces
g 0 (
x) =
f (
x)f 00 (
x)
= 0.
0
2
[f (
x)]
Adems g 0 es continua y k es tal que 0 < k < 1, entonces existe un , tal que 0 < < 1 , y
0
g (x) k para toda x [
x ; x
+ ].
Nos falta todava demostrar que g : [
x ; x
+ ] [
x ; x
+ ]. Si x x
; x
+ ]. El
teorema del valor medio implica que existe un nmero entre x y x
para el que se cumple

|g(x) g(
x)| = g 0 () |x x
| .
Curso 008
PRELIMINAR
- 63 -
Anlisis Numrico I
3.6. Anlisis del error
Por lo tanto, se cumple que

|g(x) x
| = |g(x) g(
x)| = g 0 () |x x
| k |x x
| < |x x
| .
Como x x
; x
+ ], podemos deducir que |x x
| < y que |g(x) x
| < . Este ltimo
resultado nos muestra que g : [
x ; x
+ ] [
x ; x
+ ].
En consecuencia, la funcin g(x) = x f (x)/f 0 (x) satisface todas las hiptesis del teorema 3.5, de modo que la sucesin {xn }
n=1 definida por
xn = g(xn1 ) = xn1
f (xn1 )
, para n 1,
f 0 (xn1 )
converge a x
para cualquier x0 [
x ; x
+ ].
Como vimos este mtodo es una variante del mtodo de las aproximaciones sucesivas. Si
la funcin f (x) no tiene derivada en el entorno [a; b] no es posible aplicarlo, pero si resulta difcil
calcularla o evaluarla, existe un mtodo alternativo denominado mtodo de la secante, el cual
reemplaza f 0 (xn1 ) por su aproximacin discreta, es decir,
f 0 (xn1 ) =
f (xn1 ) f (xn2 )
.
xn1 xn2
Si reemplazamos esto ltimo en la frmula de Newton-Raphson tenemos

xn = xn1
f (xn1 )(xn1 xn2 )

,
f (xn1 ) f (xn2 )
que tambin podemos escribir como

xn =
3.6.
f (xn1 )xn2 f (xn2 )xn1

.
f (xn1 ) f (xn2 )
Anlisis del error
En este punto analizaremos la convergencia de los mtodos iterativos vistos para obtener
una rpida convergencia. Para ello vamos a definir lo siguiente
Definicin 3.1. Un sucesin {xn }
de orden con una constante asinttica
n=0 convergir a x
si se cumple que
|xn+1 x
|
lm
= ,
n |xn x
|
con xn 6= x
para toda n, y y son dos constantes positivas.
A partir de esta definicin tenemos que la convergencia puede ser lineal ( = 1),
cuadrtica ( = 2), cbica ( = 3), etc. Dado que obtener un procedimiento con convergencia
mayor a la cuadrtica no es sencillo, nos ocuparemos de analizar solamente los dos primeros
casos.
Enunciaremos dos teoremas que se refieren a la convergencia lineal y a la cuadrtica, que
estn basados en el mtodo de las aproximaciones sucesivas.
Teorema 3.7. (Convergencia lineal.) Sea g C[a; b] tal que g [a; b] para toda x [a; b]. Si g 0
es continua en (a; b) y existe una constante k < 1 tal que
0
g (x) k, para todo x (a; b),
y si g 0 (
x) 6= 0, entonces para cualquier x0 [a; b] la sucesin
xn = g(xn1 ), para n 1,
converge slo linealmente al punto fijo x
[a; b].
- 64 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Teorema 3.8. (Convergencia cuadrtica.) Sea x

la solucin de la ecuacin x = g(x). Si g 0 (
x) = 0
00
y g es continua y est estrictamente acotada por una constante M en un intervalo abierto I
que contiene a x
, entonces existir un > 0 tal que, para x0 [
x ; x
+ ], la sucesin definida
por xn = g(xn1 ) cuando n 1, converge al menos cuadrticamentea x
. Adems para valores
suficientemente grandes de n, se tiene
|xn+1 x
| <
M
|xn x
|2 .
2
Las demostraciones de ambos teoremas pueden verse en [1].

El primer teorema nos dice que para que la convergencia sea cuadrtica o superior, se
debe cumplir que g 0 (
x) = 0, en tanto que el segundo, nos da las condiciones que aseguran que la
convergencia sea al menos cuadrtica. Este teorema nos indica que el mtodo de las aproximaciones sucesivas nos puede llevar a desarrollar mtodos con orden de convergencia cuadrtica o
superior. En efecto, si partimos de
xn = g(xn1 ),
podemos suponer que g(x) se puede escribir como
g(x) = x (x)f (x).
De acuerdo con el segundo teorema, para obtener una convergencia al menos cuadrtica
debemos plantear que g 0 (
x) = 0. Dado que:
g 0 (x) = 1 0 (x)f (x) (x)f 0 (x),
entonces
g 0 (
x) = 1 (
x)f 0 (
x),
pues f (
x) = 0, entonces g 0 (
x) = 0 si y slo si (
x) = 1/f 0 (
x). Si reemplazamos esto en la funcin
original nos queda
f (xn1 )
xn = g(xn1 ) = xn1 0
,
f (xn1 )
que no es otra cosa que el mtodo de Newton-Raphson.
3.7.
Mtodos de convergencia acelerada
Si bien hemos visto que el mtodo de Newton-Raphson es de convergencia cuadrtica,

no siempre es posible utilizarlo. La principal razn es que debemos conocer la derivada de la
funcin. Aunque vimos un mtodo alternativo, el mtodo de la secante, ste no resulta ser un
mtodo de convergencia cuadrtica. Veremos ahora un procedimiento para obtener convergencia
cuadrtica a partir de un mtodo linealmente convergente.
Supongamos que tenemos la sucesin {xn }
n=0 que converge linealmente y que los signos
de xn x
, xn+1 x
y xn+2 x
son iguales y que n es suficientemente grande. Para construir
una nueva sucesin {
xn }
n=0 que converja ms rpido que la anterior vamos a plantear que
xn+1 x
xn+2 x
,
xn x
xn+1 x
con lo cual nos queda

(xn+1 x
)2 (xn+2 x
)(xn x
).
Si la desarrollamos nos queda
x2n+1 2xn+1 x
+x
2 xn+2 xn (xn+2 + xn )
x+x
2 ,
Curso 008
PRELIMINAR
- 65 -
Anlisis Numrico I
3.7. Mtodos de convergencia acelerada
y
(xn+2 + xn 2xn+1 )
x xn+2 xn x2n+1 .
Si despejamos x
nos queda
x
xn+2 xn x2n+1
.
xn+2 2xn+1 + xn
Si ahora sumamos y restamos x2n y 2xn xn+1 en el numerador, tenemos

x2n + xn+2 xn 2xn xn+1 x2n + 2xn xn+1 x2n+1
xn+2 2xn+1 + xn
xn (xn+2 2xn+1 + xn ) (x2n 2xn xn+1 + x2n+1 )
xn+2 2xn+1 + xn
(xn+1 xn )2
.
xn
xn+2 2xn+1 + xn
Si definimos la nueva sucesin {

xn }
n=0 como
x
n = xn
(xn+1 xn )2
,
xn+2 2xn+1 + xn
obtenemos una tcnica denominada mtodo 2 de Aitken, que supone que la sucesin {
xn }
n=0
converge ms rpidamente a x
que la sucesin {xn }
n=0 .
La notacin asociada a esta tcnica est definida por:
Definicin 3.2. Dada la sucesin {xn }
n=0 , la diferencia progresiva xn est definida por
xn = xn+1 xn , para n 0.
Las potencias ms altas k xn se definen por medio de
k xn = (k1 xn ), para k 2.
A partir de estas definiciones tenemos que 2 xn se expresa como
2 xn = (1 xn ) = (xn+1 xn )
= xn+1 xn = (xn+2 xn+1 ) (xn+1 xn )
= xn+2 2xn+1 + xn ,
por lo que el mtodo 2 de Aitken puede escribirse como
x
n = xn
(xn )2
.
2 xn
Para analizar la convergencia de este mtodo tenemos el siguiente teorema.

Teorema 3.9. Sea la sucesin {xn }
, y que para valores sufin=0 que converge linealmente a x
cientemente grandes de n, se cumpla que (xn x
)(xn+1 x
) > 0. Entonces la sucesin {
xn }
n=0
converge a x
con mayor rapidez que {xn }
n=0 en el sentido de que
x
n x
= 0.
n xn x
lm
Si aplicamos el mtodo 2 de Aitken a una sucesin cuya convergencia sea lineal, podemos
acelerar la convergencia a cuadrtica. Podemos entonces desarrollar otros mtodos a partir de
esta tcnica.
- 66 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Tabla 3.1: Mtodo de Steffensen

i
0
1
2
3
4
5
6
7
8
3.8.
xi
0,50000
0,20043
0,27275
0,25361
0,25855
0,25727
0,25760
0,25751
0,25753
k
0
i
0
1
2
0
1
2
0
(k)
xi
0,50000
0,20043
0,27275
0,25868
0,25723
0,25761
0,25753
Mtodo de Steffensen
Si aplicamos esta tcnica a una sucesin obtenida por el mtodo de las aproximaciones
sucesivas tendremos el mtodo conocido como mtodo de Steffensen. Este mtodo, en realidad,
tiene una leve modificacin al mtodo 2 de Aitken.
Al aplicar el mtodo 2 de Aitken a una sucesin linealmente convergente, la nueva
sucesin convergente cuadrticamente se construye mediante los siguientes trminos:
x0 ; x1 = g(x0 ); x2 = g(x1 ); x
0 = {2 }(x0 ); x3 = g(x2 ); x
1 = {2 }(x1 ); . . . .
En cambio, el mtodo de Steffensen calcula los cuatro primeros trminos de la forma indicada
pero introduce una leve modificacin al calcular el trmino x3 . La secuencia queda entonces
como:
(0)
(0)
(0)
(0)
(0)
(1)
(0)
x0 ; x1 = g(x0 ); x2 = g(x1 ); x0 = {2 }(x0 );
(1)
(1)
(1)
(1)
(2)
(1)
x1 = g(x0 ); x2 = g(x1 ); x0 = {2 }(x0 ); . . .

De esta manera, el mtodo se asegura una convergencia cuadrtica y mejora notablemente
la precisin en los resultados obtenidos por el mtodo de las aproximaciones sucesivas. En el
siguiente ejemplo podemos ver la diferencia en la convergencia.
Supongamos que tenemos la siguiente ecuacin:
xk+1 =
2 exk + x2k
, x0 = 0, 50.
3
Para ver la eficacia del mtodo y poder comparar, resolveremos esta ecuacin utilizando
el mtodo de las aproximaciones sucesivas primero, y el mtodo de Steffensen, despus.
En la tabla siguiente (tabla 3.1) podemos ver los resultados obtenidos al aplicar ambos
mtodos. En la segunda columna estn los obtenidos con aproximaciones sucesivas y en la ltima,
los obtenidos con Steffensen.
Observemos que el mtodo de Steffensen alcanz ms rpidamente el resultado correcto
que el mtodo de las aproximaciones sucesivas. Mientras este ltimo necesit ocho iteraciones, el
de Steffensen requiri solamente seis. Por lo tanto, la convergencia es ms rpida.
3.9.
Notas finales
Hasta aqu hemos visto seis mtodos iterativos para obtener las races de una ecuacin
del tipo f (x) = 0. Los dos primeros, el de la biseccin y el de la posicin falsa (regula falsi)
Curso 008
PRELIMINAR
- 67 -
Anlisis Numrico I
3.9. Notas finales
son mtodos que aseguran la convergencia pero que son muy lentos. Suelen usarse como una
primera aproximacin cuando no se tiene informacin ms detallada del punto x
, de ah que son
conocidos como mtodos de arranque. Sirven para acotar el intervalo en el caul se encuentra la
raz buscada. Los otros cuatro, el de las aproximaciones sucesivas, el Newton-Raphson, el de la
secante y el de Steffensen son mucho ms potentes y en el caso de Newton-Raphson y Steffensen,
de una rpidez de convergencia cuadrtica. De los cuatro mtodos mtodos, los ms usuales para
programar son el de las aproximaciones sucesivas y el de la secante, puesto que son sencillo y no
requieren conocer la derivada primera. Es comn, adems, que cuando no se tiene un intervalo
los suficientemente acotado para trabajar con los mtodos de refinamiento, se comience con el
metodo de la biseccin, y as, disminuir el costo computacional.
Sin embargo, cuando la ecuacin f (x) = 0 tiene multiplicidad de ceros (ejemplo, la
funcin sen(x)), ninguno de estos mtodos puede distinguir rpidamente esta situacin. Es por
eso que existen otros mtodos para resolver este tipo de problemas (ver [1]).
- 68 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Captulo 4
Interpolacin de curvas
4.1.
Introduccin
En este captulo nos concentraremos en el estudio de los mtodos de interpolacin de

curvas. Es usual que los ingenieros trabajen con datos extrados de mediciones, relevamientos,
ensayos de laboratorio, etc., los cuales no siempre entregan el valor necesitado para el problema
que se est tratando de resolver. Un ejemplo tpico de interpolacin sencilla utilizado por cualquier
profesional de la ingeniera es la interpolacin lineal en una tabla de datos (por ejemplo, de
estadsticas) para obtener un valor entre dos puntos dados. Este tipo de interpolacin lineal era
muy usado cuando no existan las calculadoras cientficas de bolsillo (ni hablar de computadoras)
y deban usarse las famosas Tablas de logaritmos para obtener logaritmos, senos, cosenos y
cualquier otra funcin trigonomtrica o trascendental.
Un segundo ejemplo de interpolacin ms avanzado es la utilizacin de polinomios interpolantes en la resolucin de estructuras cuando se utilizan programas de anlisis estructural que
aplican el mtodo de los elementos finitos. All es de fundamental importancia entender los tipos
de polinomios que se pueden usar y los datos necesarios para poder obtener estos polinomios.
Puesto que hay muchos mtodos y formas de interpolar, nos ocuparemos de los mtodos
clsicos y veremos algunas mejoras que se han desarrollado a estos mtodos. En particular, gracias
al artculo de L.N. Trefethen y J. P. Berrut (vase [14]), analizaremos una mejora al mtodo de
Lagrange bsico, denominada Interpolacin Baricntrica de Lagrange.
4.2.
Mtodo de Lagrange
Supongamos que tenemos una lista con datos ordenados de a pares como la de la siguiente
tabla:
Tabla 4.1: Datos ordenados de a pares
x
x0
x1
x2
x3
y
y0
y1
y2
y3
Y supongamos que necesitamos conocer el valor de y(xA ) para un xA entre x1 y x2 . La

forma sencilla de obtener este valor es graficar estos puntos y trazar un segmento de recta que
una y1 e y2 , ubicar xA en las abscisas y trazar por l una lnea recta paralela al eje de ordenadas
Curso 008
PRELIMINAR
- 69 -
Anlisis Numrico I
4.2. Mtodo de Lagrange
que corte el segmento ya mencionado. Finalmente, desde este punto, trazamos una lnea recta
paralela al eje de abscisas hasta cortar el eje de ordenadas, con lo cual hemos obtenido el valor
de y(xA ).
Queda muy evidente que este procedimiento es muy engorroso si se quiere hacerlo en forma
metdica. Sin embargo, es la forma ms sencilla de interpolacin polinomial, la interpolacin
lineal. Efectivamente, si tomamos los dos puntos en cuestin podemos armar una recta mediante
el siguiente sistema:
y1 = m x1 + n
y2 = m x2 + n
Si restamos y1 a y2 obtenemos m:
y2 y1 = m(x2 x1 ) m =
y2 y1
.
x2 x1
Si ahora reemplazamos m en la primera ecuacin obtenemos n:

y1 =
y2 y1
y2 y1
x1 + n n = y1
x1 .
x2 x1
x2 x1
Finalmente la ecuacin de la recta que pasa por y1 e y2 es:

y(x) =
y2 y1
(x x1 ) + y1 ,
x2 x1
que tambin puede escribirse como

y(x) = y1
x x2
x x1
+ y2
.
x1 x2
x2 x1
Para hallar y(xA ) basta con reemplazar xA en cualquiera de las expresiones anteriores.
Lo hecho anteriormente es equivalente al procedimiento grfico. Pero que pasa si queremos usar ms de dos puntos? Supongamos que necesitamos usar los cuatro puntos de la tabla 4.1
para interpoalr un punto cualquiera entre x0 y x3 . En ese caso, el polinomio de mayor grado
posible es un polinomio cbico, porque tiene cuatro coeficientes, pues:
y(x) = a0 + a1 x + a2 x2 + a3 x3 .
Si reemplazamos loa cuatro puntos en esta ecuacin obtenemos el siguiente sistema de ecuaciones
lineales:
y0 = a0 + a1 x0 + a2 x20 + a3 x30
y1 = a0 + a1 x1 + a2 x21 + a3 x31
y2 = a0 + a1 x2 + a2 x22 + a3 x32
y3 = a0 + a1 x3 + a2 x23 + a3 x33
Basta con resolver este sistema de ecuaciones lineales para obtener los coeficientes ai .
Analicemos el sistema escribindolo en forma matricial:

1 x0 x20 x30
a0
y0
1 x1 x21 x31 a1 y1

1 x2 x22 x32 a2 = y2
y3
1 x3 x23 x33
a3
|
{z
}
A
- 70 -
PRELIMINAR
Curso 008
Anlisis Numrico I
La matriz es una matriz especial y se conoce como matriz de VanderMonde. Esta matriz
tiene la particularidad de ser mal condicionada, por lo que cualquier mtodo que usemos para
resolver este sistema puede traernos algn problema.
El mtodo de Lagrange para interpolacin polinomial resulta de resolver este sistema
para obtener los coeficientes pero lo hace de una forma ms sencilla y sistemtica. Para obtener
el polinomio interpolador debemos seguir los siguientes pasos:
1. Calcular n + 1 polinomios Ln;i (x) relacionados cada uno con cada dato xi , donde n es el
grado del polinomio e i indica el punto considerado, cuya particularidad es la siguiente:
(
1 si x = xi
,
Ln;i (x) =
0 si x 6= xi
para i = 0; 1; . . . ; n, que refiere a los datos usados para la interpolacin. En el caso de
la tabla 4.1, n = 3 como mximo. Los polinomios Ln;i (x) se obtienen con la siguiente
expresin:
n
Y
(x xj )
Ln;i (x) =
j=0
j6=i
n
Y
(xi xj )
n
Y
x xj
.
xi xj
j=0
j6=i
j=0
j6=i
2. El polinomio interpolador se obtiene con la siguiente expresin:

Pn (x) =
n
X
yi Ln;i (x).
i=0
Por ejemplo, podemos armar una interpolacin lineal mediante los polinomios de Lagrange entre los puntos x1 y x2 . Al aplicar el mtodo obtenemos:
x x2
x1 x2
x x1
L1;1 =
x2 x1
P1 (x) = y1 L1;0 (x) + y2 L1;1 (x)
x x1
x x2
+ y2
,
P1 (x) = y1
x1 x2
x2 x1
L1;0 =
que es la ecuacin de la recta que obtuvimos antes.

Para obtener el polinomio de tercer grado tendremos:
L3;0 (x) =
L3;1 (x) =
L3;2 (x) =
L3;3 (x) =
P3 (x) =
(x x1 )(x x2 )(x x3 )
(x0 x1 )(x0 x2 )(x0 x3 )
(x x0 )(x x2 )(x x3 )
(x1 x0 )(x1 x2 )(x1 x3 )
(x x0 )(x x1 )(x x3 )
(x2 x0 )(x2 x1 )(x2 x3 )
(x x0 )(x x1 )(x x2 )
(x3 x0 )(x3 x1 )(x3 x2 )
y0 L3;0 (x) + y1 L3;1 (x) + y2 L3;3 (x) + y3 L3;3 (x)
Como hemos utilizado todos lo puntos de los datos, es evidente que no se puede crear un polinomio
de mayor grado que el cbico. Por lo tanto, existe un slo polinomio posible de construir con
todos los datos disponibles. El siguiente teorema define a este nico polinomio.
Curso 008
PRELIMINAR
- 71 -
Anlisis Numrico I
4.2. Mtodo de Lagrange
Teorema 4.1. Sean x0 , x1 , . . ., xn , n + 1 nmeros diferentes, y sea f una funcin tal que sus
valores se obtengan a partir de los nmeros dados (f (x0 ); f (x1 ), . . ., f (xn )), entonces existe un
nico polinomio Pn (x) de grado n, que cumple con la propiedad
f (xk ) = P (xk ) para cada k = 0; 1; . . . ; n;
y este polinomio est dado por la siguiente expresin
Pn (x) = f (x0 )Ln;0 (x) + f (x1 )Ln;1 (x) + . . . + f (xn )Ln;n (x) =
n
X
f (xi )Ln;i (x),
i=0
donde
Ln;i (x) =
n
Y
x xj
,
xi xj
j=0
j6=i
para i = 0; 1; . . . ; n.
Sin embargo, se pueden crear varios polinomios de grados menores a n. As, con los datos
de la tabla 4.1 se pueden construir tres polinomios de grado 1 y dos polinomios de grado 2.
Obtenido el polinomio interpolante nos queda un punto por definir: cul es el error que
estamos cometiendo al interpolar mediante un polinomio respecto de la funcin original? Para
ello tenemos el siguiente teorema.
Teorema 4.2. Sean x0 , x1 , x2 ,. . . ,xn , nmeros distintos en el intervalo [a; b] y sea f Cn+1 [a; b].
Entonces, para cualquier x [a; b] existe un nmero (x) [a; b] para que el se cumple que
n
f (x) = Pn (x) +
f (n+1) ((x)) Y
(x xi ),
(n + 1)!
i=0
donde Pn (x) es el mximo polinomio interpolante.

Demostracin Si x = xi para i = 0; 1; 2; . . . ; n entonces f (xi ) = Pn (xi ) y para cualquier
(xi ) [a; b] se cumple lo expresado en el teorema. En cambio, si x 6= xi para i = 0; 1; 2; . . . ; n,
se puede definir la siguiente funcin g(u) para u [a; b]:
g(u) = f (u) Pn (u) [f (x) Pn (x)]
n
Y
(u xi )
i=0
(x xi )
Como f Cn+1 [a; b], Pn C [a; b], y x 6= xi para cualquier i, entonces g Cn+1 [a; b]. Si u = xj
tendremos
n
Y
(xj xi )
g(xj ) = f (xj ) Pn (xj ) [f (x) Pn (x)]
= 0 [f (x) Pn (x)]0 = 0.
(x xi )
i=0
Tambin tenemos que g(x) = 0, pues

g(x) = f (x) Pn (x) [f (x) Pn (x)]
n
Y
(x xi )
i=0
(x xi )
= f (x) Pn (x) [f (x) Pn (x)] = 0,
y en consecuencia, g Cn+1 [a; b] y se anula para x; x0 ; x1 ; . . . ; xn , es decir, para n + 2 nmeros

distintos. De acuerdo con el Teorema de Rolle, existe entonces un (a, b) tal que g n+1 () = 0.
As tendremos que
" n
#
dn+1 Y (u xi )
(n+1)
(n+1)
(n+1)
0=g
() = f
() Pn
(u) [f (x) Pn (x)] n+1
.
du
(x xi )
i=0
- 72 -
PRELIMINAR
u=
Curso 008
Anlisis Numrico I
Como Pn (u) es un polinomio de grado n, entonces
(n+1)
Pn
(u)
=0y
n
Y
(u xi )
i=0
(x xi )
es un polinomio
de grado n + 1 tendremos que

" n
#
dn+1 Y (u xi )
(n + 1)!
= n
.
n+1
Y
du
(x xi )
i=0
(x xi )
i=0
Por lo tanto, finalmente tendremos que

0 = f (n+1) () 0 [f (x) Pn (x)]
(n + 1)!
.
n
Y
(x xi )
i=0
Si despejamos f (x) de la ecuacin anterior nos queda

n
f (n+1) () Y
(x xi ).
f (x) = Pn (x) +
(n + 1)!
i=0
Desde el punto de vista terico, esta expresin del error es muy importante porque muchas
de las tcnicas de derivacin e integracin numrica se derivan de aplicar la interpolacin por el
mtodo de Lagrange. Sin embargo, para otros casos, no debemos olvidarnos que no conocemos
f (x) (y por lo tanto, tampoco f (n+1) (x)), por lo que el error calculado es slo una aproximacin.
Finalmente, podemos ver que el mtodo tiene algunas desventajas:
1. Cada evaluacin del polinomio Pn (x) requiere O(n2 ) operaciones aritmticas.
2. Agregar un par de datos xn+1 , f (xn+1 ) requiere rehacer todos lo polinomios Ln,i (x).
3. Es numricamente inestable.
4.3.
Mtodo de Newton
Una forma alternativa de plantear la construccin del polinomio interpolador es la siguiente. Supongamos que queremos usar solamente los primeros tres puntos de nuestra tabla.
Entonces planteamos el siguiente sistema de ecuaciones:
y0 = a0 + a1 x0 + a2 x20
y1 = a0 + a1 x1 + a2 x21
y2 = a0 + a1 x2 + a2 x22 .
Al eliminar a0 tenemos este nuevo sistema
y1 y0 = a1 (x1 x0 ) + a2 (x21 x20 )
y2 y1 = a1 (x2 x1 ) + a2 (x22 x21 ),
que puede escrbirse como
y1 y0
x1 x0
y 2 y1
x2 x1
Curso 008
= a1 + a2 (x1 + x0 )
= a1 + a2 (x2 + x1 ).
PRELIMINAR
- 73 -
Anlisis Numrico I
4.3. Mtodo de Newton
Si ahora eliminamos a1 obtenemos el coeficiente a2 que resulta ser

y1 y0
y2 y1
x2 x1 x1 x0
y2 y1
y1 y0
x2 x1 x1 x0
.
x2 x0
a2 (x2 x0 ) =
a2 =
Ahora reemplacemos a2 en ambas ecuaciones

y1 y 0
x1 x0
= a1 +
y2 y 1
x2 x1
= a1 +
y2 y1
x2 x1
y1 y0
x1 x0
x2 x0
y1 y0
y2 y1
x2 x1 x1 x0
x2 x0
(x1 + x0 )
(x2 + x1 ).
De la primera despejemos a1 :
y1 y0
a1 =
x1 x0
y2 y1
x2 x1
y1 y0
x1 x0
x2 x0
(x1 + x0 ).
Ahora reemplacemos a1 y a2 en la primera ecuacin de todas para obtener a0 :

"
#
y2 y1
y1 y0
y2 y1
y1 y0
y 1 y0
x2 x1 x1 x0
y0 = a0 +
(x1 + x0 ) x0 + x2 x1 x1 x0 x20
x1 x0
x2 x0
x2 x0
!
y2 y1
y1 y0
y1 y0
x2 x1 x1 x0
x1 x0 .
a0 = y0
x1 x0
x2 x0
Armemos finalmente el polinomio interpolante reemplazando a0 , a1 y a2
!
y1 y0
y2 y1
y1 y0
x2 x1 x1 x0
P (x) = y0
x1 x0 +
x1 x0
x2 x0
"
#
y2 y1
y1 y0
y2 y1
y1 y0
y1 y0
x2 x1 x1 x0
x2 x1 x1 x0 2
(x1 + x0 ) x +
x
+
x1 x0
x2 x0
x2 x0
y1 y0
= y0 +
(x x0 ) +
x1 x0
= y0 +
y1 y0
(x x0 ) +
x1 x0
y2 y1
x2 x1
y1 y0
x1 x0
x2
y2 y1
x2 x1
x0
0
xy11 y
x0
x2 x0
2

x (x0 + x1 )x + x0 x1
(x x0 )(x x1 ).
Esta forma de armar el polinomio se denomina mtodo de las diferencias dividas de Newton, y podemos sistematizarla para que sea muy sencillo de realizar. En primer lugar, podemos
decir que f (xi ) = yi . Seguidamente vamos definir lo siguiente:
f (x0 ; x1 ) =
f (x1 ; x2 ) =
f (x1 ) f (x0 )
x1 x0
f (x2 ) f (x1 )
,
x2 x1
y generalizando
f (xi ; xi+1 ) =
f (xi+1 ) f (xi )
.
xi+1 xi
Anlogamente tenemos que:

f (x0 ; x1 ; x2 ) =
- 74 -
f (x2 )f (x1 )
x2 x1
f (x1 )f (x0 )
x1 x0
x2 x0
PRELIMINAR
=,
f (x1 ; x2 ) f (x0 ; x1 )
,
x2 x0
Curso 008
Anlisis Numrico I
y si generalizamos nuevamente tenemos

f (xi ; xi+1 ; xi+2 ) =
f (xi+1 ; xi+2 ) f (xi ; xi+1 )

.
xi+2 xi
Finalmente podemos generalizar totalmente las expresiones anteriores a la siguiente expresin:

f (xk+1 ; xk+2 ; . . . ; xn ) f (xk ; xk+1 ; . . . ; xn1 )
.
xn xk
Si utilizamos esta notacin para el polinomio que hallamos ms arriba nos queda:
f (xk ; xk+1 ; . . . ; xn1 ; xn ) =
P (x) = f (x0 ) + f (x0 ; x1 )(x x0 ) + f (x0 ; x1 ; x2 )(x x0 )(x x1 ).

Esta forma nos permite agregar un punto ms y aumentar el grado del polinomio en
forma sencilla. Efectivamente, si queremos agregar x3 , solamente debemos agregar al polinomio
anterior el trmino f (x0 ; x1 ; x2 ; x3 )(x x0 )(x x1 )(x x2 ), con lo cual nos queda
P (x) = f (x0 ) + f (x0 ; x1 )(x x0 ) + f (x0 ; x1 ; x2 )(x x0 )(x x1 ) +
+f (x0 ; x1 ; x2 ; x3 )(x x0 )(x x1 )(x x2 ).
Esta forma de armar los polinomios facilita notablemente el aumentar la cantidad de
puntos para obtener un polinomio interpolante, pues permite usar el polinomio anterior. En la
tabla siguiente se puede ver un esquema de cmo operar.
Tabla 4.2: Mtodo de Newton
x
x0
f (x)
f (x0 )
x1
f (x1 )
x2
f (x2 )
x3
f (x3 )
f (xi ; xi+1 )
f (xi ; xi+1 ; xi+2 )
f (xi ; xi+1 ; xi+2 ; xi+3 )
f (x0 ; x1 )
f (x0 ; x1 ; x2 )
f (x1 ; x2 )
f (x0 ; x1 ; x2 ; x3 )
f (x1 ; x2 ; x3 )
f (x2 ; x3 )
Observemos que podemos armar dos polinomios a partir del mtodo de Newton. Uno es
el que obtuvimos antes, por el denominado mtodo de la diferencias divididas progresivas. El
otro podemos obtenerlo partiendo de x3 , que resulta ser
P (x) = f (x3 ) + f (x2 ; x3 )(x x3 ) + f (x1 ; x2 ; x3 )(x x3 )(x x2 ) +
+f (x0 ; x1 ; x2 ; x3 )(x x3 )(x x2 )(x x1 ),
que se denomina mtodo de las diferencias divididas regresivas.
El mtodo de Newton, en sus dos variantes, es muy usado cuando se trabaja con datos
que pueden ser modificados (aumentando la cantidad de puntos disponibles para la interpolacin)
y, en consecuencia, aplicar el mtodo de Lagrange se vuelve muy engorroso. Otra ventaja es que
para evaluar los polinomios Pn (x) requerimos n operaciones aritmticas, algo bastante menor al
O(n2 ) que requiere el mtodo de Lagrange 1 . Sin embargo, el mtodo exige que los datos deban
estar ordenados, segn xi , en forma ascendente (o descendente) para poder implementarlo. Si
agregamos algn dato intermedio, la ventaja anterior se pierde porque la tabla 4.2 debe rehacerse,
perdiendo practicidad.
Para mejorar esto existe una variante del mtodo de Lagrange que nos permite interpolar
de manera sencilla y al que resulta muy fcil agregarle puntos en cualquier orden.
1
De todos modos, se requieren O(n2 ) operaciones para obtener los coeficientes f (xk ; xk+1 ; . . . ; xn ).
Curso 008
PRELIMINAR
- 75 -
Anlisis Numrico I
4.4. Interpolacin baricntrica de Lagrange
4.4.
Interpolacin baricntrica de Lagrange

Supongamos que definimos un polinomio genrico L(x) tal que
L(x) = (x x0 )(x x1 ) . . . (x xn ).
Definamos adems los pesos baricntricos como:

wi =
n
Y
1
, para todo i = 0; 1; . . . ; n.
xi xk
k=0
k6=i
Entonces podemos escribir cualquier polinomio de Lagrange como

wi
,
Ln;i = L(x)
x xi
y, en consecuencia, el polinomio interpolante ser
Pn (x) =
n
X
i=0
X
L(x)wi
wi
= L(x)
,
f (xi )
f (xi )
x xi
x xi
i=0
pues L(x) es constante para todo los trminos de la sumatoria.

Esto es una gran ventaja en dos sentidos. Primero, para evaluar Pn (x) se necesitan slo
O(n) operaciones, lo cual hace mucho ms rpido el procedimiento. Y segundo, si agregamos el
par de datos xn+1 , f (xn+1 ), slo debemos hacer lo siguiente:
Dividir cada wi por xi xn+1 .
Calcular un nuevo wi+1 .
En ambos casos el costo computacional es de n + 1 operaciones. Es decir, podemos
actualizar el polinomio Pn (x) con slo O(n) operaciones! A esta variante del mtodo de Lagrange
suele llamrsela mtodo mejorado de Lagrange y tiene una ventaja adicional respecto al mtodo
de Newton que rara vez se menciona: los coeficientes wi no dependen de los datos f (xn+1 ). Esto
permite que podamos interpolar varias funciones con el mismo polinomio. Y mantiene, adems,
la ventaja de no necesitar ordenar los datos, como s requiere el mtodo de Newton.
Pero todava no hemos terminado. Supongamos ahora que interpolamos la constante 1
con el polinomio hallado. En ese caso tenemos
1=
n
X
Ln,i (x) = L(x)
i=0
n
X
i=0
wi
,
x xi
pues hemos visto que Ln,i (x) = 1 cuando x = xi .

Si dividimos Pn (x) por la expresin anterior, o sea, que la dividimos por 1, nos queda:
L(x)
n
X
f (xi )
i=0
Pn (x) =
L(x)
n
X
i=0
wi
x xi
,
wi
x xi
y simplificando L(x), obtenemos que

n
X
Pn (x) =
f (xi )
i=0
n
X
i=0
- 76 -
wi
x xi
wi
x xi
PRELIMINAR
Curso 008
Anlisis Numrico I
que se denomina interpolacin baricntrica de Lagrange. Al igual que en el caso del mtodo
mejorado, slo se necesitan O(n) operaciones para actualizar el polinomio si agregamos un par
de datos xn+1 , f (xn+1 ) adicionales.
De todos modos, si la interpolacin la realizamos con puntos uniformemente distanciados
o distribuidos unos de otros, la mala condicin del problema no se puede evitar (pues ningn
algoritmo la mejora). La consecuencia directa de esto es el llamado fenmeno de Runge, que se
da cuando aparecen oscilaciones no deseadas en ambos extremos del intervalo a interpolar (como
puede verse en [1] o [4]). A pesar de esto, en general, la interpolacin baricntrica de Lagrange
es ms estable numricamente que el mtodo de Lagrange orginal y que el mtodo de Newton,
segn el anlisis hecho por N.J. Higham en [7]. Pero para evitar el fenmeno descripto, debemos
cambiar la forma de resolver nuestro problema. Para ello tenemos otra forma de interpolar
mediante polinomios.
4.5.
Interpolacin de Hermite
Muchas veces disponemos de ms datos para interpolar. Por ejemplo, supongamos que
para una partcula que se desplaza conocemos los siguientes datos: el instante ti , la coordenada
de la trayectoria, yi y la velocidad vi , para i = 0; 1; . . . ; n. En este caso adems de los valores de
f (ti ) conocemos tambin los de f 0 (ti ) pues vi = f 0 (ti ). Por lo tanto nuestra tabla original podra
ser reescrita como (tabla 4.3):
Tabla 4.3: Datos incluyendo la primera derivada
t
t0
t1
t2
t3
y
y0
y1
y2
y3
v
v0
v1
v2
v3
Ahora contamos con ms informacin para construir nuestro polinomio interpolante. En

efecto, de disponer de slo cuatro valores asociados a nuestros puntos (en este caso, el instante
ti ), pasamos a tener ocho valores asociados dichos puntos. Si queremos utilizar todos los datos
disponibles, en lugar de interpolar con una curva de tercer grado, podemos usar ahora una curva
de grado 7, pues este polinimio tiene ocho coeficientes, a saber:
y(t) = a0 + a1 t + a2 t2 + a3 t3 + a4 t4 + a5 t5 + a6 t6 + a7 t7 ,
del cual podemos hallar la primera derivada, que resulta ser
y 0 (t) = a1 + 2a2 t + 3a3 t2 + 4a4 t3 + 5a5 t4 + 6a6 t5 + 7a7 t6 .
Al igual que al principio, podemos reemplazar cada uno de los valores en las dos ecuaciones, con lo cual obtendremos un sistema de ocho ecuaciones con ocho incgnitas, sistema que
puede resolverse sin problemas. Cuando conocemos el valor de la funcin en el punto como as
tambin su derivada, la interpolacin se denomina Interpolacin de Hermite. El siguiente teorema
define la interpolacin de Hermite.
Teorema 4.3. Sea f C1 [a; b] y sean x0 ; x1 ; . . . ; xn [a; b] distintos, el polinomio nico de
menor grado que concuerda con f y f 0 en x0 ; x1 ; . . . ; xn es el polinomio de Hermite de grado a
lo sumo 2n + 1, que est dado por la siguiente expresin:
H2n+1 (x) =
n
X
f (xi )Hn;i (x) +
i=0
Curso 008
n
X
n;i (x),
f 0 (xi )H
i=0
PRELIMINAR
- 77 -
Anlisis Numrico I
4.5. Interpolacin de Hermite
donde
Hn;i (x) = [1 2(x xi )L0n;i (xi )]L2n;i (x),
y
n;i (x) = (x xi )L2n;i (x),
H
donde Ln;i (x) es el isimo polinomio de Lagrange de grado n. Si adems f C2n+2 [a; b],
entonces se cumple que
f (x) = H2n+1 (x) +
(x x0 )2 . . . (x xn )2 (2n+2)
f
(),
(2n + 2)!
con tal que a < < b.

Demostracin Primero, recordemos que
(
1
Ln;i (x) =
0
si x = xi
,
si x =
6 xi
por lo tanto, tenemos que:

n,i (x) = 0,
Hn,i (x) = 0 H
para x 6= xi , en tanto que
Hn,i (x) = [1 2(xi xi )L0n;i (xi )]L2n;i (xi ) = [1 2(0)L0n;i (xi )] 1 = 1,
y
n,i (x) = (xi xi )L2n;i (xi ) = (xi xi ) 12 = 0.
H
Entonces, nos queda que:
H2n+1 (xk ) =
n
X
f (xk )Hn;i (xk ) +
i=0
n
X
n;i (xk ) = f (xk ) +

f (xk )H
i=0
n
X
f 0 (xk ) 0 = f (xk ),
i=0
para k = 0; 1; 2; . . . ; xn , es decir H2n+1 (x) = f (x) en los puntos dados.

0
0 (x), entonces
Demostremos ahora que H2n+1
(x) = f 0 (x). Como Lni (x) es un factor de Hn;i
0
se cumple que Hn;i (xj ) = 0 cuando j 6= i. Si j = i, tenemos que
0
Hn;j
(xj ) = 2 L2n;j (xj ) + [1 + 2(xj xj )L0n;j (xj )]2Ln;j (xj )L0n;j (xj )
= 2 L2n;j (xj ) + 2 L2n;j (xj ) = 0,

0 (x ) = 0 para todas la j e i.
o sea, Hn;i
j
Por otro lado, observemos que
0
n;i
H
(xj ) = L2n;i (xj ) + (xj xi )2Ln;i (xj )L0n;i (xj )
= Ln;i (xj )[Ln;i (xj ) + 2(xj xi )L0n;i (xj )],

y en consecuencia, cuando j 6= i tendremos que:
0
n;i
H
(xj ) = L2n;i (xj ) + (xj xi )2Ln;i (xj )L0n;i (xj ) = 0 + 0 = 0,
pues Ln;i (xj ) = 0, y cuando j = i

0 (xj ) = L2 (xj ) + (xj xj )2Ln;j (xj )L0 (xj ) = 12 + 0 = 1.
H
n;j
n;j
n;j
- 78 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Si combinamos ambos casos tenemos

0
H2n+1
(xj )
n
X
0
f (xj )Hn;i
(xj )
i=0
n
X
n
X
0 (xj )
f 0 (xj )H
n;i
i=0
0 (xj ) = 0 + f 0 (xj ) = f 0 (xj ),

f (xj ) 0 + f 0 (xj )H
n;j
i=0
0
entonces H2n+1 (x) = f (x) y H2n+1
(x) = f 0 (x) para x0 ; x1 ; . . . ; xn .
En realidad, la interpolacin de Hermite es un caso particular de los denominados polinomios osculantes, cuando mi = 1. Veamos la siguiente definicin.
Definicin 4.1. Dados x0 ; x1 ; . . . ; xn , todos distintos y los enteros no negativos m0 ; m1 ; . . . ; mn ,

se denomina polinomio osculante que aproxima una funcin f Cm [a, b] donde se cumple que
m = max {m0 ; m1 ; . . . ; mn } y xi [a; b] para cada i = 0; 1; . . . ; n, al polinomio de menor grado que
concuerda con la funcin f y con todas sus derivadas de orden menor o igual mi en xi para cada
i = 0; 1; . . . ; n. El mximo grado de este polinimio es
M=
n
X
mi + n,
i=0
pues el nmero de condiciones que debe cumplir es

n
X
(mi + 1) =
i=0
n
X
mi + (n + 1),
i=0
y un polinomio de grado M tiene M + 1 coeficientes.

Esto quiere decir que adems de las derivadas primeras se pueden tener las derivadas
segundas, terceras, etc., para armar el polinomio interpolante. Si tenemos esos datos (inclusive
puede ocurrir que contemos con datos parciales de las derivadas), el procedimiento visto para la
interpolacin de Hermite se puede ampliar para obtener curvas que tengan segundas o terceras
derivadas. Sin embargo, como el mtodo est basado en los polinomios de Lagrange, si se agregan
datos, el mtodo es bastante engorroso, porque deben repetirse todos los clculos para obtener
el nuevo polinomio interpolante. Existe una forma alternativa de armar el polinomio aplicando
el mtodo de Newton.
De acuerdo con lo ya visto, el polinomio armado segn el mtodo de Newton se escribe
como
n
k1
X
Y
Pn (x) = f (x0 ) +
f (x0 ; x1 ; . . . ; xk )
(x xj ).
k
j=0
Para utilizar el mtodo de Newton conociendo los valores de la primera derivada, debemos redefinir nuestra sucesin. Por ejemplo, si tomamos los datos de la tabla 4.3, nuestra nueva sucesin
de puntos es t0 ; t0 ; t1 ; t1 ; t2 ; t2 ; t3 ; t3 , es decir, definimos una nueva sucesin z0 ; z1 ; . . . ; z2n+1 tal
que
z2i = z2i+1 = xi ( o ti en nuestro caso),
para cada i = 0; 1, 2; . . . ; n. Puesto que con esta nueva sucesin no se puede definir f (z2i ; z2i+1 )
de la forma vista, resulta conveniente definirla aprovechando que conocemos f 0 (z2i ) = f 0 (xi ),
con lo que se aprovechan los datos conocidos. En consecuencia, podemos construir la siguiente
tabla
Contsruida nuestra tabla, el polinomio de Hermite se arma de la siguiente manera:
2n+1
k1
X
Y
f (z0 ; z1 ; . . . ; zk )
H2n+1 (x) = f (z0 ) +
(x zj ) .
k=1
Curso 008
PRELIMINAR
j=0
- 79 -
Anlisis Numrico I
4.5. Interpolacin de Hermite
Tabla 4.4: Interpolacin Hermite aplicando el Mtodo de Newton

z
z0 = x0
f (z)
f (z0 ) = f (x0 )
f (zi ; zi+1 )
f (zi ; zi+1 ; zi+2 )
f (zi ; zi+1 ; zi+2 ; zi+3 )
f (z0 ; z1 ) = f 0 (x0 )
z1 = x0
f (z1 ) = f (x0 )
z2 = x1
f (z2 ) = f (x1 )
f (z0 ; z1 ; z2 )
f (z1 ; z2 )
f (z0 ; z1 ; z2 ; z3 )
f (z1 ; z2 ; z3 )
f (z2 ; z3 ) = f 0 (x1 )
z3 = x1
f (z3 ) = f (x1 )
f (z1 ; z2 ; z3 ; z4 )
f (z2 ; z3 ; z4 )
f (z3 ; z4 )
z4 = x2
f (z4 ) = f (x2 )
f (z2 ; z3 ; z4 ; z5 )
f (z3 ; z4 ; z5 )
f (z4 ; z5 ) = f 0 (x2 )
z5 = x2
f (z5 ) = f (x2 )
z6 = x3
f (z6 ) = f (x3 )
f (z3 ; z4 ; z5 ; z6 )
f (z4 ; z5 ; z6 )
f (z5 ; z6 )
f (z4 ; z5 ; z6 ; z7 )
f (z5 ; z6 ; z7 )
f (z6 ; z7 ) = f 0 (x3 )
z7 = x3
f (z7 ) = f (x3 )
Si aplicamos esto a nuestros datos originales de la tabla 4.3, obtendramos un polinomio

de grado 7. Pero este polinomio sufrir los mismos problemas que ya vimos para los polinomios
de Lagrange, es decir, oscilaciones no deseadas en los extremos del intervalo de interpolacin. De
ah que el mtodo de Hermite no suele usarse de esta forma, sino como parte de una interpolacin
por segmentos. As, para cada intervalo entre puntos tenemos cuatro datos que podemos utilizar
para interpolar valores entre xi ; xi+1 . Veamos como aplicarlo a nuestra tabla 4.3.
Para armar la curva que interpola entre t0 y t1 , contamos con los valores de y0 , y1 , v0
y v1 , con lo cual podemos armar un polinomio de Hermite de tercer grado que cumpla con las
condiciones H3 (t0 ) = f (t0 ) = y0 ; H3 (t1 ) = f (t1 ) = y1 , H30 (t0 ) = f 0 (t0 ) = v0 y H30 (t1 ) = f 0 (t1 ) =
v1 . Lo mismo podemos hacer entre t1 y t2 , y as hasta el intervalo t2 y t3 . Tendremos, entonces,
1;0 (t) y H
1;0 (t).
cuatro polinomios de Hermite para todo el intervalo, a saber, H1;0 (t), H1;1 (t), H
Los polinomios resultantes son:

1
x x1 2
H1;0 (t) = 1 2(x x0 )
x0 x1
x0 x1

x x0 2
1
H1;1 (t) = 1 2(x x1 )
x1 x0
x1 x0
2

1;0 (t) = (x x0 ) x x1
H
x0 x1

x x0 2
H1;1 (t) = (x x1 )
x1 x0
0 (t
0
Como adems se cumple que H3;i (ti+1 ) = H3;i+1 (ti+1 ) y H3;i
i+1 ) = H3;i+1 (ti+1 ), tenemos continuidad para la curva y su primera derivada. Podemos armar una curva con segmentos
de curvas de tercer grado, que puede representar a la funcin y a la primera derivada, sin tener
que preocuparnos por los efectos negativos de las oscilaciones no deseadas en los extremos. Este
mtodo se usa en el mtodo de los elementos finitos para armar las funciones de forma en los
elementos de viga.
De todos modos, como para poder armar este tipo de curvas debemos conocer los valores
de las derivadas en cada punto, algo que no siempre es posible, usar estos segmentos de curvas
- 80 -
PRELIMINAR
Curso 008
Anlisis Numrico I
con polinomios de Hermite no siempre resultan ser una solucin aplicable. De ah que existe otra
manera de obtener curvas con estas caractersticas.
4.6.
Interpolacin por splines
Supongamos que en lugar de proponer interpolar los datos de la tabla 4.1 mediante un
solo polinomio que pase por todos los puntos, lo hagamos mediante segmentos de curvas, en
este caso con polinimios de tercer grado, denominados trazadores cbicos, similares al caso de la
interpolacin por segmentos de polinomios de Hermite. Definamos las curvas como
Si (x) = ai + bi (x xi ) + ci (x xi )2 + di (x xi )3 ,
con i = 0; 1; . . . ; n 1. Como en el caso anterior, observemos que tenemos cuatro constantes para
cada polinomio, por lo tanto, debemos agregar condiciones para poder armar nuestra interpolacin. Como no conocemos los valores de las derivadas en los puntos, las condiciones que las
curvas debern cumplir son:
1. Si (xi ) = f (xi ) para cada i = 0; 1; . . . ; n;
2. Si+1 (xi+1 ) = Si (xi+1 ) para cada i = 0; 1; . . . ; n 2;
0 (x
0
3. Si+1
i+1 ) = Si (xi+1 ) para cada i = 0; 1; . . . ; n 2;
00 (x
00
4. Si+1
i+1 ) = Si (xi+1 ) para cada i = 0; 1; . . . ; n 2;
5. Se deben cumplir alguna de las siguiente condiciones de borde:

00 (x ) = S 00 (x ) = 0 (frontera libre);
a) S000 (x0 ) = Sn1
n
n n
0
b) S00 (x0 ) = f 0 (x0 ) y Sn1
(xn ) = Sn0 (xn ) = f 0 (xn ) (frontera sujeta).
La primera condicin asegura que las curvas pasen por los datos, en tanto que las tres
condiciones siguientes aseguran la continuidad del conjunto de curvas tanto para las funciones
Si como para sus derivadas primera y segunda.
Para obtener cada polinomio, empecemos por plantear las condiciones definidas arriba.
En primer lugar, como Si (xi ) = f (xi ), tendremos que:
Si (xi ) = ai = f (xi ),
y si aplicamos la segunda condicin tenemos que:
ai+1 = Si+1 (xi+1 ) = Si (xi+1 ) = ai + bi (xi+1 xi ) + ci (xi+1 xi )2 + di (xi+1 xi )3 ,
para cada i = 0; 1; . . . ; n 2. Para simplificar la notacin definamos hi = (xi+1 xi ). Si adems
definimos que an = f (xn ), entonces nos queda que
ai+1 = ai + bi hi + ci h2i + di h3i ,
es vlida para cada i = 0; 1; . . . ; n 1.
De la misma forma tenemos que
Si0 (xi ) = bi ,
por lo tanto tambin se cumple que
bi+1 = bi + 2ci hi + 3di h2i ,
es vlida tambin para cada i = 0; 1; . . . ; n 1.
Curso 008
PRELIMINAR
- 81 -
Anlisis Numrico I
4.6. Interpolacin por splines
Finalmente, tenemos que

Si00 (xi ) = 2ci .
Como se cumple que cn = Sn00 (xn )/2, nos queda que:
ci+1 = ci + 3di hi ,
una vez ms, para cada i = 0; 1; . . . ; n1. Si despejamos di y reemplazamos en las dos expresiones
anteriores, nos queda:
h2i
(2ci + ci+1 ),
3
= bi + hi (ci + ci+1 ),
ai+1 = ai + bi hi +
bi+1
para cada i = 0; 1; . . . ; n 1.
En la primera ecuacin podemos despejar bi , que resulta ser
bi =
ai+1 ai hi
(2ci + ci+1 ).
hi
3
Si usamos la segunda para obtener bi en vez de bi+1 y utilizamos la expresin anterior para bi1 ,
nos queda
ai+1 ai hi
(2ci + ci+1 ) =
hi
3
hi1 ci1 + 2(hi1 + hi )ci + hi ci+1 =
ai ai1 hi1
(2ci1 + ci ) + hi1 (ci1 + ci )

hi1
3
3
3
(ai+1 ai )
(ai ai1 ),
hi
hi1
para cada i = 1; 2; . . . ; n 1.
Ahora nos falta determinar si con este esquema podemos obtener un resultado nico para
los valores de ci . Para ello tenemos el siguiente teorema:
Teorema 4.4. Sea f en a = x0 < x1 < . . . < xn = b, entonces f tendr un interpolante nico
de frontera libre o natural en los nodos x0 ; x1 ; . . . ; xn .
Demostracin Si la curva es de frontera libre o natural, entonces se cumple que S000 (a) = 0 y
00 (b) = S 00 (b) = 0, por lo tanto tendremos que
Sn1
n
cn =
Sn00 (xn )
= 0;
2
y que
0 = S000 (x0 ) = 2c0 + 6d0 (x0 x0 ) c0 = 0.
En consecuencia, nos queda un sistema de ecuaciones de la forma Ax = B con
...
..
.
...
..
.
..
.
..
.
0
..
.
..
.
h0 2(h0 + h1 )
h
1
h
2(h
+
h
)
h
1
1
2
2
,
A= .
.
.
.
.
.
.
.
.
.
.
.
0
..
..
..
.
.
.
hn2 2(hn2 + hn1 ) hn1
0
...
...
0
0
1
- 82 -
PRELIMINAR
Curso 008
Anlisis Numrico I

0
c0
3
3
h1 (a2 a1 ) h0 (a1 a0 )
c1

..
..
.
. .
B=
y
x
=

..
..
.
3
.
3
h (an an1 ) h (an1 an2 )
n1
n2
cn
0
Una vez obtenidos los valores de los ci , podemos hallar los restantes coeficiente, bi y di con las
expresiones ya vistas:
di =
bi =
ci+1 ci
,
3hi
ai+1 ai hi
(2ci + ci+1 ).
hi
3
Con todos los coeficientes obtenemos finalmente las Si (x) curvas o polinomios que interpolan los datos.
Para el caso de las splines con frontera sujeta tenemos el siguiente teorema.
Teorema 4.5. Sea f en a = x0 < x1 < . . . < xn = b, y diferenciable en a y en b, entonces f
tendr un interpolante nico de frontera sujeta en los nodos x0 ; x1 ; . . . ; xn .
Demostracin Puesto que conocemos f 0 (a) = f 0 (x0 ), tenemos que
b0 = f 0 (a) = f 0 (x0 ) =
a1 a0 h0
(2c0 c1 ),
h0
3
y nos queda que

a1 a0
0
2h0 c0 h0 c1 = 3
f (a) .
h0
Anlogamente, tenemos que
f 0 (b) = f 0 (xn ) = bn = bn1 + hn1 (cn1 + cn ),
que podemos escribir como
f 0 (b) = =
=
an an1 hn1
(2cn1 + cn ) + hn1 (cn1 + cn )

hn1
3
an an1 hn1
+
(cn1 + 2cn ),
hn1
3
y que nos deja la siguiente ecuacin:

an an1
0
hn1 cn1 2hn1 cn = 3 f (b)
.
hn1
En consecuencia, nos queda el siguiente sistema de ecuaciones
2h0
h0
0
...
...
0
..
..
..
h0 2(h0 + h1 )
.
.
h
.
1
..
..
0
.
h
2(h
+
h
)
h
.
1
1
2
2
,
A=
..
.
.
.
.
.
.
.
.
.
.
.
.
.
0
..
..
..
.
.
.
hn2 2(hn2 + hn1 ) hn1
0
...
...
0
hn1
2hn1
Curso 008
PRELIMINAR
- 83 -
Anlisis Numrico I
4.6. Interpolacin por splines
a1 a0
h0
i
f 0 (a)
c0
3
3
h1 (a2 a1 ) h0 (a1 a0 )
c1

..
..
.
. .
B=
,
y
x
=

..
..
.
3
.
3
an2 )
hn1 (an ahn1 ) hn2 (an1
i
cn
n1
3 f 0 (b) anha
n1
En ambos casos los sistemas de ecuaciones son estrictamente diagonal dominantes, por
lo tanto tienen solucin nica, es decir, existe un nico vector c0 , c1 , . . ., cn para cada sistema.
En cuanto al error que cometemos al interpolar una curva utilizando splines, podemos
expresarlo, para el caso con frontera libre, como
max |f (x) S(x)|
axb
5
M max |hi |4 ,
384 0in1
donde S(x) es el conjunto de las Si (x) curvas y hi = xi+1 xi . Sin embargo, cuando se utiliza
este caso, el orden del error en los extremos es proporcional a |hi |2 y no a |hi |4 , por lo que no
siempre es bueno aplicar el caso de frontera libre o natural.
Finalmente, existe un tercer caso cuando no conocemos las derivadas extremas (f 0 (a) y
f 0 (b)), denominado aproximacin sin un nodo 2 , en el cual se considera que d0 = d1 y dn2 =
dn1 , que es lo mismo que considerar que S0 (x) = S1 (x) y Sn2 (x) = Sn1 (x), lo cual tambin
introduce un error en los extremos del orden de |hi |2 .
Para este ltimo caso tenemos lo siguiente:
c1 c0
3h0
c2 c1
d1 =
.
3h1
c1 = c0 + 3d0 h0 d0 =
c2 = c1 + 3d1 h1
Como d0 = d1 , entonces
c2 c1
c 1 c0
=
3h0
3h1
h1 c1 h1 c0 = h0 c2 h0 c1 ,
lo que nos deja la siguiente expresin para la primera fila del sistema:
h1 c0 (h0 + h1 )c1 + h0 c2 = 0.
Anlogamente, para dn2 y dn1 tenemos algo similar:
cn1 cn2
3hn2
cn cn1
=
,
3hn1
cn1 = cn2 + 3dn2 hn2 dn2 =

cn = cn1 + 3dn1 hn1 dn1
de las cuales obtenemos la ltima fila del sistema:
hn1 cn2 (hn2 + hn1 )cn1 + hn2 cn = 0.

2
Algunos textos denominan a esta aproximacin como condicin no un nodo, por la expresin en ingls not a
knot approximation.
- 84 -
PRELIMINAR
Curso 008
Anlisis Numrico I
As, el sistema queda como:
h1 (h0 + h1 )
h0
...
...
0
..
..
..
h0 2(h0 + h1 )
.
.
h
.
1
..
..
0
.
h
2(h
+
h
)
h
.
1
1
2
2
,
A=
..
.
.
.
.
.
.
.
.
.
.
.
.
.
0
..
..
..
.
.
.
hn2 2(hn2 + hn1 ) hn1
0
...
...
hn1 (hn2 + hn1 ) hn2

0
c0
3
3
h1 (a2 a1 ) h0 (a1 a0 )
c1
..

.
, y x = ... .
B=

..
..
3
.
h (an an1 ) h 3 (an1 an2 )
n1
n2
cn
0
Esta variante de la interpolacin por spline es poco usada porque tiene muchas ms
indefiniciones que la natural.
4.7.
Notas finales
Hemos visto diferentes mtodos para interpolar valores a partir de datos discretos usando
funciones polinmicas completas, como son los mtodos de Lagrange, de Newton y de Hermite, y
tambin la interpolacin mediante segmentos de curvas, como es el caso del mtodo de Hermite
fragmentado y el de spline cbico. Dentro de este ltimo conjunto est tambin el mtodo de
interpolacin lineal por segmentos, cuyas funciones se obtienen utilizando el mtodo de Lagrange
tradicional entre dos puntos. As, los dos polinomios de Lagrange necesarios son:
L1;0 (x) =
L1;1 (x) =
x x1
x0 x1
x x0
,
x1 x0
donde x0 es el punto inicial y x1 el punto final de la interpolacin. Con estos dos polinomios, el
polinomio completo de Lagrange resulta ser:
P1 (x) = f (x0 )L1;0 (x) + f (x1 )L1;1 (x)
x x1
x x0
x x0
x x1
= f (x0 )
+ f (x1 )
= f (x1 )
f (x0 )
x0 x1
x1 x0
x1 x0
x1 x0
f (x1 )x0 f (x0 )x1
f (x1 ) f (x0 )
=
x
.
x1 x0
x1 x0
Adems de los mtodos vistos, existen otros ms complejos que mejoran nuestra aproximacin de valores intermedios, pero que suelen ser tambin ms difciles de implementar y con
mayor costo computacional. En particular, para ciertas curvas que no pueden ser definidas mediante polinomios contamos con curvas paramtricas denominadas curvas de Bezier. (Para ms
datos, vase [1].)
Respecto la interpolacin baricntrica de Lagrange, Berrut y Trefethen (vsae [14]) sealan
en su artculo, que resulta curioso que el mtodo no figure en ningn libro de texto de anlisis
numrico como alternativa al mtodo tradicional, teniendo en cuenta la simplicidad del mismo
para ser implementado en una computadora.
Curso 008
PRELIMINAR
- 85 -
Anlisis Numrico I
4.7. Notas finales
Por ltimo, resulta interesante observar que el diseo asistido por computadora (CAD
por sus siglas en ingls) hace un uso intensivo de la interpolacin fragmentada (o segmentada),
con las spline, y las curvas paramtricas (curvas de Bezier). Las primeras son muy usadas en
r
r
programas como el AutoCAD
, en tanto que las segundas, en programas como el Corel Draw
,
OpenDraw o similares. Por tal motivo, resulta til conocer los fundamentos matemticos de cada
una de ellas.
- 86 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Captulo 5
Mejor aproximacin y ajuste de

funciones
5.1.
Mejor aproximacin
5.1.1.
Introduccin
Uno de los problemas que suele tener que resolver un ingeniero es el de armar una funcin que ajuste datos obtenidos experimentalmente. Hemos visto en el captulo anterior como
interpolar valores mediante el armado de polinomios que pasan por los puntos dados. Adems,
de acuerdo con lo visto, si la cantidad de puntos era muy grande, interpolar mediante polinomios
creaba curvas de alto grado, que se vuelven muy inestables en los extremos. Vimos que de todos
modos esto se poda resolver en parte mediante interpolaciones fragmentadas o segmentos de
curvas (polinomios de Hermite cuando conocemos la primera derivada o spline cuando no la
conocemos). Pero en todos los casos, una de las condiciones fundamentales es que los puntos xi
sean distintos. Qu hacemos cuando esto no es as, cuando la cantidad de puntos exceden la capacidad de armar polinomios interpolantes o cuando los puntos que usaremos son aproximaciones
a lso valores reales?
Supongamos que tenemos una serie de datos empricos obtenidos en laboratorio, tales
que el conjunto de datos no cumple estrictamente que los xi sean distintos, con lo cual para un
mismo xi tenemos varios valores de f (xi ). (En realidad suele suceder que aunque los xi sean
distintos, varios xj sean suficientemente cercanos como para considerarlos iguales.) Adems que
la cantidad de datos disponibles hagan imposible que armemos un polinomio de grado menor a
4 o 5 que pase por todos los puntos y as evitar el mal condicionamiento del problema. Lo que
necesitamos, entonces, es una curva que ajuste lo mejor posible los datos que disponemos, o sea,
que el error entre los puntos y esa funcin de ajuste sea el menor posible, sin que la curva pase
por los puntos dados.
Para ello tenemos una forma de estimar este error. Supongamos que efectivamente se
cumpla que los xi sean distintos, que x0 < x1 < . . . < xn para los cuales conocemos f (x0 ),f (x1 ),. . .
,f (xn ). Asumamos que la aproximacin la haremos con la siguiente funcin:
y(x) = c0 0 (x) + c1 1 (x) + . . . + cm m (x) =
m
X
ci i (x),
i=0
donde m < n, es decir, tenemos menos funciones disponibles que puntos, y las i (x) son linealmente independientes, o sea, conforman una base de funciones. Como lo que buscamos es que el
error entre los datos y la funcin de ajuste sea el menor posible, podemos plantear que
ri = f (xi ) y(xi ), para 0 i n,
es decir, el residuo, sea mnimo. Una forma de analizar esto es mediante la norma del residuo.
Curso 008
PRELIMINAR
- 87 -
Anlisis Numrico I
5.1. Mejor aproximacin
5.1.2.
Error y normas
Lo que necesitamos hallar es una fincin y(x) que me aproxime lo mejor posible nuestros
valores f (xi ), o, lo que es lo mismo, que nuestro error sea mnimo. Pero qu error minimizamos?
Una idea es trabajar con la norma del residuo, tal como lo hacamos en sistemas de ecuaciones
lineales. Para ello tenemos varias opciones, a saber:
1. Que el norma uno del residuo sea mnima, es decir, krk1 sea mnima;
2. Que el norma infinita del residuo sea mnima, es decir, krk sea mnima;
3. Que el norma dos (eucldea) del residuo sea mnima, es decir, krk2 sea mnima.
La primera norma es buena si uno quiere eliminar aquellos valores considerados como
desviaciones, por ejemplo, mediciones mal hechas o valores que fcilmente puede inferirse errneos. Consiste en minimizar la siguiente expresin:
krk1 =
n
X
n
X
|ri | =
i=0
|f (xi ) y(xi )|
i=0
La segunda, es un caso de mnimo-mximo en la cual se tiene que:

max |f (xi ) y(xi )| .
mn
c0 ;c1 ;...;cm 0jn
Esto es til cuando los valores mximos del error deben ser considerados al momento de la
verificacin.
Ambos casos resultan muy tiles cuando se trabaja con datos discretos, en los que tiene
suma importancia verificar la exactitud de esos datos, o eventualmente, encontrar errores de
medicin, de transcripcin, etc.
Los dos casos recin analizados, krk1 , y krk llevan a la programacin lineal, materia
que est fuera del alcance de nuestro curso, y que resultan mucho ms complejos de analizar que
la ltima opcin indicada.
sta consiste en minimizar la expresin:
v
v
u n
u n
uX 2 uX
krk2 = t
|ri | = t
[f (xi ) y(xi )]2 ,
i=0
i=0
o, lo que es lo mismo,
krk22
n
X
n
X
|ri | =
i=0
[f (xi ) y(xi )]2 .
i=0
Como nuestra funcin la podemos expresar como:

y(x) =
m
X
cj j x,
j=0
tendremos que la expresin a minimizar es:
E (c0 ; c1 ; . . . ; cm ) =
n
X
f (xi )
i=0
m
X
2
cj j (xi ) ,
j=0
de ah el nombre de mtodo de los cuadrados mnimos, pues lo que se minimiza es el cuadrado

del residuo.
- 88 -
PRELIMINAR
Curso 008
Anlisis Numrico I
5.1.3.
Mtodo de los cuadrados mnimos
Para obtener que la funcin E(c0 ; c1 ; . . . ; cm ) sea mnima, debemos aplicar un concepto
E
= 0, puesto que E es funcin de los coeficientes. En consecuencia
conocido: hacer que
cj
tendremos que:
!2
n
m
X
X
E

=
f (xi )
ck k (xi ) = 0
cj
cj
i=0
k=0
!2
m
n
X
X
f (xi )
ck k (xi )
= 0.
=
cj
i=0
k=0
que si desarrollamos nos queda:

!
n
m
X
X
E
=2
f (xi )
ck k (xi ) (j (xi )) = 0 para j = 0; 1; . . . ; m.
cj
i=0
k=0
Si distribuimos el producto nos queda:

n
X
i=0
n
X
f (xi )j (xi )
f (xi )j (xi )
i=0
m
X
ck
k=0
n X
m
X
k (xi )j (xi )
=0
ck k (xi )j (xi ) = 0
i=0 k=0
n X
m
X
ck k (xi )j (xi ) =
i=0 k=0
n
X
f (xi )j (xi ),
i=0
para j = 0; 1; . . . ; m. Como podemos intercambiar las sumatorias, finalmente nos queda:

m
X
k=0
ck
n
X
k (xi )j (xi ) =
i=0
n
X
f (xi )j (xi ),
i=0
para j = 0; 1; . . . ; m.
Avancemos un poco ms. Al desarrollar la sumatoria en i del trmino de la izquierda, nos
queda:
n
X
k (xi )j (xi ) = k (x0 )j (x0 ) + k (x1 )j (x1 ) + . . . + k (xn )j (xn ).
i=0
Lo mismo podemos hacer con la sumatora del trmino de la derecha, con lo que tenemos
n
X
f (xi )j (xi ) = f (x0 )j (x0 ) + f (x1 )j (x1 ) + . . . + f (xn )j (xn ).
i=0
Para facilitar la notacin, definamos lo siguiente:

n
X
k (xi )j (xi ) = (k ; j )
i=0
n
X
f (xi )j (xi ) = (f ; j ).
i=0
Entonces, la expresin que nos queda es

m
X
ck (k ; j ) = (f ; j ),
k=0
Curso 008
PRELIMINAR
- 89 -
Anlisis Numrico I
para j = 0; 1; . . . ; m. Ahora desarrollemos la sumatoria en k, con lo cual obtenemos lo siguiente:

c0 (0 ; j ) + c1 (1 ; j ) + . . . + cm (m ; j ) = (f ; j ).
Como j = 0; 1; . . . ; m, entonces podemos armar m + 1 ecuaciones, lo que finalmente nos deja:
c0 (0 ; 0 ) + c1 (1 ; 0 ) + . . . + cm (m ; 0 ) = (f ; 0 )
c0 (0 ; 1 ) + c1 (1 ; 1 ) + . . . + cm (m ; 1 ) = (f ; 1 )
..
..
..
..
.
.
.
.
c0 (0 ; m ) + c1 (1 ; m ) + . . . + cm (m ; m ) = (f ; m ),
que podemos escribir tambin en forma
(0 ; 0 ) (1 ; 0 )
(0 ; 1 ) (1 ; 1 )
..
..
.
.
(0 ; m ) (1 ; m )
matricial como

(f ; 0 )
. . . (m ; 0 )
c0

. . . (m ; 1 )
c1 (f ; 1 )
.. = .. .
..
..
. .
.
.
. . . (m ; m )
cm
(f ; m )
Esta matriz resulta ser simtrica, pues (i ; j ) = (j ; i ), y definida positiva. El problema se reduce a resolver un sistema ecuaciones lineales cuyas incgnitas son los coeficientes ck .
Obtenidos estos coeficientes, los reemplazamos en la funcin que hemos definido, que ser la que
aproxime nuestros puntos.
Existe otra forma de plantear el problema, esta vez en forma matricial desde el principio.
Supongamos que represnetamos nuestros puntos con la funcin elegida. Entonces nos queda:
f (x0 ) =
f (x1 ) =
m
X
k=0
m
X
ck k (x0 ) = c0 0 (x0 ) + c1 1 (x0 ) + . . . + cm m (x0 )

ck k (x1 ) = c0 0 (x1 ) + c1 1 (x1 ) + . . . + cm m (x1 )
k=0
..
.
f (xn ) =
m
X
ck k (xn ) = c0 0 (xn ) + c1 1 (xn ) + . . . + cm m (xn )
k=0
Si escribimos esto en foma matricial nos queda

f (x0 )
0 (x0 ) 1 (x0 ) . . . m (x0 )
c0
f (x1 ) 0 (x1 ) 1 (x1 ) . . . m (x1 ) c1

.. = ..
.. ,
. .
.
f (xn )
0 (xn ) 1 (xn ) . . . m (xn ) cm
que resulta ser un sistema de m incgnitas con n ecuaciones, donde m < n, en el cual no existe
una nica solucin. Si hacemos

f (x0 )
0 (x0 ) 1 (x0 ) . . . m (x0 )
c0
f (x1 )
0 (x1 ) 1 (x1 ) . . . m (x1 )
c1
f = . ; = .
y c = .. ,
..
..
.
f (xn )
0 (xn ) 1 (xn ) . . . m (xn )
cm
podemos decir que nos queda una ecuacin del tipo f = c. Como lo que buscamos es aproximar
una funcin, definamos esta vez el residuo como r = f c. Al igual que en el desarrollo anterior,
vamos a obtener nuestra nueva funcin haciendo que krk22 se a mnimo. En conscuencia, tenemos
krk22 = kf ck22 .
- 90 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Recordemos que krk22 = rt r, entonces tendremos que

rt r = (f c)T (f c) .
De nuevo, para obtener que el residuo sea mnimo, anulemos la primera derivada, es decir,
hagamos
i
h
rT r
=
(f c)T (f c) = 0.
cj
cj
Al derivar nos queda
T (f c) (f c)T = 0,
que desarrollada se transforma en
T f T c + f T cT T = 0.
Como T f = f T y cT T = T c, la ecuacin anterior nos queda como
T f T c + T f T c = 0
2(T f T c) = 0
T f T c = 0
T c = T f,
donde T es una matriz simtrica definida positiva, y tiene la forma
(0 ; 0 )
(0 ; 1 )
..
(1 ; 0 )
(1 ; 1 )
..
.
...
...
..
.
(m ; 0 )
(m ; 1 )
;
..
(0 ; m ) (1 ; m ) . . . (m ; m )
y T f tiene la forma
(f ; 0 )
(f ; 1 )
.. .
.
(f ; m )
Si hacemos A = T , x = c y B = T f , entonces volvemos a tener nuestros sistema de
ecuaciones lineales en la forma Ax = B. De nuevo, el mtodo de los cuadrados mnimos no es
otra cosa que la resolucin de un sistema de ecuaciones lineales para obtener los coeficientes c
de nuestra funcin de ajuste, algo a lo que habamos llegado mediante la deduccin anterior.
Este mtodo suele usarse para obtener la recta de regresin. Para obtenerlo, basta que
observemos que
m
X
y(x) =
ci i (x) = c0 + c1 x,
i=0
es la recta que ajusta nuestros datos, con lo cual 0 = 1 y 1 = x. El siguiente paso es armar la
matriz A. Sabemos que
(k ; j ) =
n
X
k (xi )j (xi ) y (f ; j ) =
i=0
Curso 008
n
X
f (xi )j (xi ),
i=0
PRELIMINAR
- 91 -
Anlisis Numrico I
entonces podemos escribir las componentes de A y B como

n
X
(0 ; 0 ) =
i=0
n
X
(1 ; 0 ) =
11=n+1
xi 1 =
i=0
n
X
xi
i=0
n
X
(0 ; 1 ) = (1 ; 0 ) =
xi
i=0
n
X
(1 ; 1 ) =
(xi xi ) =
i=0
n
X
(f ; 0 ) =
i=0
n
X
(f ; 1 ) =
n
X
(xi )2
i=0
(f (xi ) 1) =
n
X
f (xi )
i=0
(f (xi ) xi ),
i=0
y nuestro sistema quedar de la siguiente manera:
n
n
X
X
xi
f (xi )
n + 1
c0
i=0
n
n i=0
.
=
n
X
X
X
c1
2
xi
(xi )
(f (xi ) xi )
i=0
i=0
i=0
Despejando c0 y c1 obtenemos:
n
X
c0 =
(xi )
i=0
n
X
f (xi )
i=0
(n + 1)
n
X
(f (xi ) xi )
i=0
n
X
(n + 1)
n
X
(f (xi ) xi )
i=0
c1 =
(n + 1)
n
X
n
X
i=0
n
X
!2
xi
xi
n
X
f (xi )
i=0
i=0
n
X
(xi )2
i=0
xi
i=0
(xi )2
i=0
n
X
xi
i=0
Existen algunas variantes para este tipo de regresiones, que son:

ln(y) = ln(c0 ) + c1 ln(x) (y = c0 xc1 )
ln(y) = ln(c0 ) + c1 x (y = c0 ec1 x )
y = c0 + c1 ln(x),
que permiten ajustar valores segn distintas curvas. Sin embargo, estas expresiones no son ajustes
por
X cuadrados mnimos en un sentido estricto. Lo correcto sera proponer una funcin del tipo
ci i (x) en lugar de transformar los datos. (Para ms detalles, vase [1].)
i
Si ampliamos este esquema a una funcin polinmica tendremos que

y(x) =
m
X
k=0
- 92 -
ck k (x) =
m
X
ck xk = c0 + c1 x + c2 x2 + . . . + cm xm .
k=0
PRELIMINAR
Curso 008
Anlisis Numrico I
Al armar el sistema de ecuaciones nos quedar

n
X
xi
n+1
i=0
X
n
X
n
xi
x2i
i=0
i=0
..
..
.
.
X
n
n
X
xm1
xm
i
i
i=0
i=0
X
n
n
X
m
xi
xm+1
i
i=0
i=0
...
...
n
X
xm1
i
i=0
n
X
xm
i
..
.
...
...
n
X
2(m1)
xi
i=0
n
X
x2m1
i
i=0
xm
i
n
X
f (xi )
i=0
n

X
m+1
c
0
xi
(f
(x
)
x
)
i
i
i=0
1 i=0
..
.
.
. =
.
..
.
.
n
n
cm1 X
X
m1
x2m1
(f
(x
)
x
)
i
i
i
cm
i=0
i=0
n
n
X
X
2m
m
xi
(f (xi ) xi )
i=0
n
X
i=0
..
n
X
i=0
i=0
La matriz de coeficientes no es otra cosa que una matriz de Vandemonde, similar a la

obtenida para interpolar una serie de puntos, de ah que cualquier ajuste de curvas hecho con
polinomios resulta ser un problema mal condicionado. Por supuesto, la mala condicin de la
matriz se hace cada vez ms evidente a medida que m sea ms grande. Es por eso que no se
recomienda trabajar con polinomios de grado mayor a 4 o 5. Pero de todos modos conviene que
recordemos que el ajuste polinomial, al igual que la interpolacin polinomial son problemas con
tendencia a ser mal condicionados.
5.2.
Ajuste de funciones
5.2.1.
Introduccin
En el punto anterior hemos visto un mtodo para ajustar curvas a partir de datos numricos (discretos), con el objetivo de obtener valores de la funcin f (x) para valores de x distintos
a los datos en el intervalo dado. E
Ahora bien, existen situaciones en las cuales an conociendo la funcin f (x), resulta conveniente efectuar algn tipo de aproximacin. Un ejemplo tpico de ello es el caso de las funciones
trigonomtricas (por ejemplo, cos(x)), para la cual es necesario realizar alguna aproximacin para
calcular sus valores. La ms comn es la hecha mediante las series de Taylor. Para estas funciones
puede ser muy til aplicar el desarrollo en series, pero no suele ser el caso general, puesto que
las series de Taylor son vlidas slo en el entorno de un punto, lo que le quita generalidad.
Y en qu casos necesitaramos nosotros contar con una aproximacin de una funcin
conocida? Supongamos que tenemos la siguiente funcin:
f (x) =
ex cos(x)
,
ln(x) arctan(x)
en un intervalo [a, b]. Supongamos adems, que nuestro problema exige que integremos esa funcin
f (x) en el intervalo dado. Podemos ver que la situacin ya no es tan fcil como parece. Si bien
disponemos de la funcin, hallar la primitiva puede ser todo un desafo, e incluso, imposible.
Pero de alguna manera debemos salvar el escollo.
Que tal si en vez de hacer una integral analtica nos orientamos hacia una solucin
numrica? La idea no es tan descabellada pues lo que nosotros necesitamos es el resultado numrico y no la primitiva de la misma. Hagamos uso entonces de nuestras herramientas numricas
aprendidas anteriormente y, si es necesario, adecuemos nuestras expresiones al caso analizado.
5.2.2.
Aproximacin por mnimos cuadrados
Recordemos qu significa reducir al mnimo el error cuadrtico entre la funcin y el

polinomio de aproximacin. Supongamos por un momento que conocemos tanto la funcin f (x)
Curso 008
PRELIMINAR
- 93 -
Anlisis Numrico I
5.2. Ajuste de funciones
como el polinomio de aproximacin P (x), en el intervalo [a; b]. Podemos graficar nuestra funcin
y nuestro polinomio de manera que nos queden las curvas que se ven la figura 5.1.
Figura 5.1: Error cuadrtico

Si definimos que:
Z b"
f (x)
E(ak ) =
a
n
X
#2
dx = kr(ak )k22 ,
ak xk
k=0
entonces podemos ver que que el rea bajo la curva r(ak )2 es el valor de nuestra integral. Por lo
tanto, para que nuestro error cuadrtico sea mnimo, deberemos buscar que la curva r(ak )2 sea
los ms parecida al eje de abscisas. (Esta definicin es similar a la vista para ajuste de curvas.)
Para ello, vamos a derivar la funcin E(ak ) respecto de los coeficientes ak para obtener
los valores de dichos coeficientesn que hagan mnimo el error cuadrtico, tal como hicimos para
el caso de un ajustse discreto. Entonces tendremos:
#2
Z b"
n
E (a0 ; a1 ; . . . , an )
f (x)
ak xk dx = 0.
=0
aj
aj a
k=0
Al derivar nos queda:

Z b"
2
f (x)
a
n
X
#
ak xk xj dx = 0,
k=0
y como el 2 no incide, nos queda:

Z b"
f (x)
a
n
X
#
k
ak x
xj dx = 0.
k=0
Si distribuimos el producto dentro de la integral, nos queda:

n
X
k=0
- 94 -
Z
ak
b
k+j
x
a
Z
dx =
xj f (x)dx para j = 0; 1; . . . ; n.
PRELIMINAR
Curso 008
Anlisis Numrico I
Qu es lo hemos obtenido? Nuevamente, como en la aproximacin de puntos discretos,

un sistema de ecuaciones lineales de dimensin n+1n+1. Sin embargo, no todo es tan sencillo.
Analicemos un poco ms en detalle la integral que afecta a los coeficientes ak . Tenemos que:
Z
b
k+j
x
a
b
Z b
xk+j+1
bk+j+1 ak+j+1
k+j
dx =
x
dx
=
k + j + 1 a
k+j+1
a
Si definimos que a = 0 y b = 1, entonces la integral definida resulta en el coeficiente:

1
k+j+1
La matriz que se genera a partir del coeficiente anterior es conocida como matriz de
Hilber t, que es una matriz mal condicionada. Como en el caso anterior de ajuste discreto, al
tener una matriz mal condicionada, el sistema es muy sensible a los cambios en los datos, o
modificaciones de la matriz de coeficientes, es decir, es muy sensible a los errores inherentes.
Un segundo problema, en este caso operativo, es que si por algn motivo se desea agregar
un trmino ms al polinomio, hay que recalcular el sistema (agregar una columna y una fila), lo
que significa mucho trabajo adicional. Y nada asegura que los nuevos resultados estn exentos
de errores. De todos modos, contamos con mtodo muy potente para ajustar funciones pero con
inconvientes operativos en el planteo numrico. Podemos buscar la forma de mejorarlo. Veamos
como.
Cul sera la mejor matriz de coeficientes para resolver un sistema de ecuaciones lineales?
Evidentemente, aquella que independice cada incgnita de las otras. O sea, que la matriz de
coeficientes sea una matriz diagonal. Supongamos modificar levemente la expresin del polinomio
de aproximacin por la siguiente:
n
X
P (x) =
ak k (x),
k=0
En principio, no hemos hecho sino un cambio de notacin, llamando a xk como k (x).

Veamos qu ventajas nos trae esto. Por lo pronto, ahora disponemos de ms posibilidades porque
el mtodo no cambia si proponemos una suma de funciones en vez de un polinomio como funcin
de aproximacin, tal como vimos para ajuste de curvas. Entonces nos queda:
n
X
k=0
Z
ak
Z
k (x)j (x)dx =
j f (x)dx para j = 0; 1; . . . ; n.
a
que conceptualmente es muy parecido a lo anterior. Pero con una diferencia: ahora podemos tomar
cualquier funcin para definir nuestras funciones k (x) y por lo tanto, tambin nuestros j (x).
Busquemos entonces que nuestra matriz de coeficientes se convierta en una matriz diagonal. Y
cmo lo logramos? Sencillamente estableciendo que se cumpla lo siguiente:
Z

k (x)j (x)dx =
0
M >0
si
si
k 6= j
,
k=j
donde M es un valor cualquiera. Por supuesto, lo ideal sera que M = 1. Esta condicin que
deben cumplir las k (x) asegura que las funciones sean ortogonales. En consecuencia, nuestra
matriz de coeficientes ser diagonal.
No hemos dicho nada an acerca de las funciones k (x). Como estamos tratando de
aproximar una funcin cualquiera, una buena idea es proponer que esas funciones sean tambin
polinomios. Para hallar estos polinomios ortogonales entre s, debemos agregar una segunda
condicin que es agregar una funcin de peso. Esta funcin de peso tiene por objeto asignar
Curso 008
PRELIMINAR
- 95 -
Anlisis Numrico I
5.2. Ajuste de funciones
diferentes grados de importancia a las aproximaciones de ciertas partes del intervalo. En esta
situacin tenemos:
"
#2
Z b
n
E (a0 ; a1 ; . . . , an )
=0
w(x) f (x)
ak k (x) dx = 0,
aj
aj a
k=0
con lo cual finalmente nos queda:

"
#
Z b
n
X
w(x) f (x)
ak k j dx = 0.
a
k=0
En este caso se debe cumplir que:

Z b
0
w(x)k (x)j (x)dx =
M 6= 0
a
si
si
k=
6 j
.
k=j
Si definimos que w(x) = 1, volvemos a tener nuestra expresin original para los k (x)
y los j (x). Y si, adems, el intervalo de interpolacin lo fijamos en [1, 1], el resultado es que
mediante este procedimiento obtenemos los polinomios de Legendre. Estos polinomios los
usaremos ms adelante para integrar numricamente.
5.2.3.
Polinomios de Legendre
Veremos cmo se calculan los polinomios de Legendre. Antes, debemos recordar cmo
se obtena un conjunto de vectores ortogonales a partir de un conjunto no ortogonal. Esto se
consegua mediante el proceso de Gram-Schmidt. Adaptmoslo para el caso de funciones. Primero,
debemos proponer las dos primeras funciones (x). Estas funciones son:
0 (x) = 1; 1 (x) = x B1 1 (x) = (x B1 ) 0 (x).
donde B1 es nuestra incgnita. Para obtenerla debemos plantear que:
Z b
Z b
w(x)0 (x)1 (x) dx = 0
w(x)0 (x)0 (x) (x B1 ) dx = 0.
a
Distribuyendo en el parntesis, obtenemos:

Z b
Z b
w(x)[0 (x)]2 x dx B1
w(x)[0 (x)]2 dx = 0
a
y entonces B1 se puede hallar con:

Z
w(x)[0 (x)]2 x dx
a
B1 = Z
b
2
w(x)[0 (x)] dx
a
Para los siguientes polinomios, es decir, cuando k 2, debemos proponer que:

k (x) = (x Bk ) k1 (x) Ck k2 (x) en [a; b].
Operando algebraicamente en forma similar a la anterior obtenemos los coeficientes Bk y Ck :
Z b
x w(x)[k1 (x)]2 dx
a
Bk =
Z
b
w(x)[k1 (x)]2 dx
Z b a
x w(x)k1 (x)k2 (x) dx
a Z
Ck =
b
w(x)[k2 (x)]2 dx
a
- 96 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Como hemos dicho, la funcin de peso en el caso de los polinomios de Legendre es w(x) = 1 y el
intervalo [1; 1], por lo que las expresiones quedan como sigue:
1. El coeficiente B1 se obtiene con:
Z
x dx
B1 =
1
Z 1
;
dx
2. Los coeficientes Bk se obtienen con la expresin

Z 1
x [k1 (x)]2 dx
1
Bk = Z 1
;
2
[k1 (x)] dx
1
3. Y, finalmente, los coeficientes Ck se obtienen con:

Z 1
x k1 (x)k2 (x) dx
Ck = 1 Z 1
.
2
[k2 (x)] dx
1
Existe un segundo conjunto de polinomios ortogonales muy utilizados que son los polinomios de Chebishev. Tambin se generan aplicando las expresiones generales ya vistas, pero con
1
una funcin de peso (w(x)) diferente: w(x) = 1x
.
2
5.3.
Notas finales
Tanto la aproximacin discreta de curvas como el ajueste de funciones tienen un amplio

uso en la ingeniera. En el primer caso, existen muchas expresiones matemticas resultantes de
aproximar valores obtenidos experimentalmente en laboratorios o mediante mediciones realizadas
sobre prototipos. En la ingeniera hidrulica se tienen muchas expresiones empricas que surgen
de experiencias en laboratorio que luego resultan en frmulas matemticas obtenidas mediante
aproximaciones discretas.
Con el ajuste de funciones ocurre algo similar. El ejemplo ms interesante es el uso de
polinomios de Legendre en la cuadratura de Gauss para integrar numricamente. Estos polinomios ajustan cualquier tipo de funciones y en particular, a cualquier polinomio, lo que facilita
obtener soluciones numricas exactas de cualquier integral numrica que incluya funciones
polinmicas, como se ver en el captulo siguiente.
Curso 008
PRELIMINAR
- 97 -
Anlisis Numrico I
5.3. Notas finales
- 98 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Captulo 6
Diferenciacin e integracin numrica

6.1.
Diferenciacin numrica
Como dijimos en la introduccin del captulo 2, trabajar en forma simblica resulta

bastante complicado cuando se requiere el uso de computadoras, an cuando existen programas
que lo hagan (en parte). No siempre la soluciones analticas son aplicables al problema que se est
tratando de resolver, y peor an, en muchos casos no hay tal solucin anlitica, como veremos
ms adelante.
Por otro lado, muchas veces tampoco se cuenta con las herramientas para trabajar en
forma simblica (analtica). Cuando slo se cuenta con datos obtenidos de mediciones o de
clculos previos, y no de funciones, no tiene sentido trabajar en forma simblica. Obtener la
derivada de una funcin contando nicamente con datos discretos no tiene sentido.
Al mismo tiempo, muchos programas de aplicacin ingenieril no pueden almacenar o
guardar en sus lneas de cdigo una base de datos que incluya las derivadas de cualquier funcin
(lo mismo se aplica al caso inverso, la integracin). La cantidad de informacin y la aleatoriedad
que puede presentar una exigencia de este tipo vuelve impractible realizar esto en cada programa,
adems de llevar a construir interfaces amigables, que contribuyen a aumentar los requerimientos
de memoria, tanto de operacin como de almacenamiento.
Veremos a continuacin como encarar la diferenciacin en forma numrica con ayuda de
varios ejemplos, analizando las ventajas y las desventajas de cada mtodo empleado en la discretizacin para luego analizar la extrapolacin de Richardson, mtodo que puede usarse tambin
para otros casos.
6.1.1.
Diferencias progresivas, regresivas y centradas
La diferenciacin es un tema muy conocido por los estudiantes de ingeniera. Los primeros
aos de la carrera consisten en estudiar en detalle cmo caracterizar y conocer a fondo una
funcin dada, de manera que para analizar si tiene mximos o mnimos, si es convexa o cncava,
si puede aproximarse mediante un desarrollo en serie, lo primero que se aprende es el concepto
de derivada, tanto total como parcial. Tomemos, por ejemplo, la funcin

f (x) = seno

2
x .
b
Hallar la derivada primera de f (x) respecto de x es un procedimiento sencillo pues resulta

ser
d f (x)
f (x) =
=
dx
0
Curso 008
2
b

cos
PRELIMINAR

2
x .
b
- 99 -
Anlisis Numrico I
6.1. Diferenciacin numrica
Si queremos conocer la derivada en el punto x = 6b entonces basta con reemplazar ese

valor en la expresin anterior y tendremos

2
2 b
2
0 b
=
cos
=
cos
f
6
b
b 6
b
3
Si finalmente le damos un valor a b, (b = 6), el valor de nuestra derivada en x = 6b = 1
ser

f 0 (1) =
cos
= 0, 5236
3
3
6
Supongamos ahora que queremos obtener ese mismo valor pero no recordamos cmo
hallar la derivada en forma analtica. Aplicando el concepto del cual se deduce, podemos decir
que
f (x + x) f (x)
f 0 (x)
x
que tambin suele escribirse como:
f 0 (x)
f (x + h) f (x)
h
Para hallar la derivada en nuestro punto x =

As tendremos que
seno
f (1, 1) f (1)
f (1)
=
0, 1
0
f 0 (1)
b
6
con b = 6 adoptemos el valor h = 0, 1.
2
6 1, 1
seno
0, 1
0, 9135 0, 8660
= 0, 4750
0, 1
Podemos ver que nuestra aproximacin es razonable pero no muy buena, y que el error
cometido es del orden del 10 %. Como no estamos conformes con el resultado obtenido, proponemos otro algoritmo para hallar el valor buscado. Este algoritmo es
f 0 (x)
f (x) f (x x)
x
o, como tambin suele escribirse

f 0 (x)
f (x) f (x h)
h
Hallemos ahora el valor de la derivada utilizando este nuevo algoritmo. El resultados es

2
0,
9
seno
seno
f
(1)
f
(0,
9)
3
6
f 0 (1)
=
0, 1
0, 1
f 0 (1)
0, 8660 0, 8090
= 0, 5700
0, 1
De nuevo, el valor obtenido no es una aproximacin muy buena, siendo el error cometido
del orden del 8 %. Una vez ms, tampoco estamos demasiado conformes con el resultado que nos
arroj este algoritmo y proponemos este otro
f 0 (x)
f (x + x) f (x x)
2x
o tambin:
f 0 (x)
- 100 -
f (x + h) f (x h)
2h
PRELIMINAR
Curso 008
Anlisis Numrico I
Reemplazando los valores, tendremos:

seno
f (1, 1) f (0, 9)
f (1)
=
0, 2
0
2
6 1, 1
seno
0, 2
2
6 0, 9
0, 9135 0, 8090
= 0, 5225
0, 2
Evidentemente, el valor de la derivada en el punto pedido es bastante aproximado al
considerado real o exacto. Podemos notar que el error cometido es del orden del 0,2 %. Cada
una de estas aproximaciones son equivalentes a efectuar una interpolacin aplicando el mtodo de
Lagrange y luego derivar el polinomio hallado. Como se tienen dos puntos, el polinomio resultante
es una recta. En la figura 1 se pueden ver las aproximaciones de la pendiente.
f 0 (1)
Figura 6.1: Pendiente segn cada aproximacin.

Hagamos una mejora escribindolo como:
f 0 (x)
f (x + h2 ) f (x h2 )
h
buscando mejorar la aproximacin del resultado buscado. Reemplazando tendremos:

2

seno 2
f (1, 05) f (0, 95)
0
6 1, 05 seno 6 (0, 95)
f (1)
=
0, 1
0, 1
0, 8910 0, 8387
= 0, 5230
0, 1
El resultado es una mejor aproximacin pero no se nota una gran diferencia con respecto
al anterior, puesto que el error cometido es del orden de 0,1 %. Pero sin lugar a dudas, este ltimo
algoritmo es mucho mejor.
Esta forma de aproximar la derivada en un punto se conoce como aproximacin por
diferencias, y se pueden clasificar segn tres tipos:
f 0 (1)
1. Diferencias progresivas: cuando la derivada en un punto se aproxima segn la expresin

vista en primer trmino, o sea:
f 0 (x) =
Curso 008
f (x + h) f (x)
;
h
PRELIMINAR
- 101 -
Anlisis Numrico I
2. Diferencias regresivas: cuando la derivada en punto se aproxima segn la expresin vista

en segundo trmino, o sea:
f (x) f (x h)
f 0 (x) =
,y
h
3. Diferencias centradas: cuando la derivada en un punto se aproxima segn la expresin
vista en ltimo trmino, o sea:
f 0 (x) =
f (x + h) f (x h)
.
2h
Este ltimo esquema es el que mejor aproxima.

Analizaremos ahora el por qu de esta mejora. Empecemos por el esquema de diferencias
progresivas. Si desarrollamos por Taylor la funcin f (x + h), tendremos que
f (x + h) = f (x) + f 0 (x)
h
h2
h3
+ f 00 (x) + f 000 (x) + . . . ;
1!
2!
3!
de la cual podemos despejar f 0 (x), que es

f 0 (x)h = f (x + h) f (x) f 00 (x)
h3
h2
f 000 (x) . . . ;
2!
3!
h
h2
f (x + h) f (x)
f 00 (x) f 000 (x) . . . .
h
2!
3!
n
Si nuestro h es suficientemente pequeo, entonces los h para n 2 se pueden despreciar.
Finalmente tendremos que
f 0 (x) =
f 0 (x) =
f (x + h) f (x)
h
f (x + h) f (x)
f 00 () =
+ O(h);
h
2!
h
con [x; x + h]. En este caso, nuestra aproximacin tiene un orden de convergencia O(h).
Si repitamos el proceso para el esquema de diferencias regresivas, tendremos que
f (x h) = f (x) f 0 (x)
h
h2
h3
+ f 00 (x) f 000 (x) + . . . .
1!
2!
3!
Como en el caso anterior, la expresin final ser

f 0 (x) =
f (x) f (x h)
h
f (x) f (x h)
+ f 00 () =
+ O(h).
h
2!
h
Al igual que en lo visto anteriormente, el orden de convergencia es O(h).

Finalmente, hagamos lo mismo para el esquema de diferencias centradas. En este caso
tendremos que
h
h2
h3
+ f 00 (x) + f 000 (x) + . . . ;
1!
2!
3!
2
h
h
h3
f (x h) = f (x) f 0 (x) + f 00 (x) f 000 (x) + . . . .
1!
2!
3!
f (x + h) = f (x) + f 0 (x)
Si hacemos f (x + h) f (x h) nos queda

f (x + h) f (x h) = 2f 0 (x)
h
h3
+ 2f 000 (x) + . . . .
1!
3!
Si despejamos f 0 (x) de esta expresin, nos queda

f 0 (x) =
- 102 -
f (x + h) f (x h)
h2
f (x + h) f (x h)
f 000 ()
=
+ O(h2 ),
2h
3!
2h
PRELIMINAR
Curso 008
Anlisis Numrico I
esta vez con [x h; x + h].

Notemos que en este caso la convergencia es O(h2 ), razn por la cual la aproximacin es
mucho mejor respecto de los esquemas anteriores. Entonces es conveniente armar un esquema de
diferencias centradas para aproximar una derivada en un punto dado. Adems tiene otra ventaja.
Como el error es proporcional a la tercera derivada, podemos obtener resultados muy precisos
(exactos) para un polinomio de grado menor o igual a 2.
Al mismo tiempo, el hecho de que el orden de convergencia sea O(h2 ) nos permite inferir
que si hacemos el paso (h) cada vez ms chico, deberamos tener un resultado con una mejor
aproximacin. Hagamos esto, y con la misma precisin del ejemplo anterior, calculemos de nuevo
la derivada en el punto x = 1 con un nuevo paso, h = 0, 01, para cada esquema.
1. Diferencias progresivas: f 0 (1) =
seno( 3 1,01)seno( 3 )
0,01
2. Diferencias regresivas: f 0 (1) =
seno( 3 )seno( 3 0,99)

0,01
3. Diferencias centradas: f 0 (1) =
seno( 3 1,01)seno( 3 0,99)

0,02
0,87120,8660
0,01
0,86600,8607
0,01
= 0, 5200
= 0, 5300
0,87120,8607
0,02
= 0, 5250
Al achicar el paso utilizado para reducir el error cometido podemos notar dos cosas. La
primera es que para los esquemas progresivos y regresivos el resultado obtenido es ms aproximado que en el caso anterior con un paso diez veces ms grande, mientras que para el esquema
centrado, el resultado no fue mejor. La segunda es que hemos perdido precisin, principalmente
en el esquema con diferencias centradas. La pregunta es: por qu? En todo caso, habremos
hecho algo mal?
En realidad no hemos hecho nada incorrecto. Sucede que no hemos tomado en cuenta la
incidencia del error de redondeo en nuestro algoritmo, es decir, el hecho de trabajar solamente
con cuatro dgitos al representar los resultados intermedios. Supusimos que achicar el paso inmediatamente nos mejoraba nuestra aproximacin. Pero hemos visto que la aproximacin depende
tambin de la precisin usada en los clculos, es decir, de la representacin numrica, que como
vimos, est asociada al error de redondeo.
El problema es que a medida que el paso h es cada vez ms chico, lo mismo pasa con la
operacin f (x + h) f (x) o sus equivalentes. Esa diferencia se vuelve muy chica y es posible que
nuestra unidad de mquina no pueda representarla correctamente. En consecuencia, debemos
encontrar o desarrollar otro mtodo para mejorar la aproximacin del resultado buscado.
6.1.2.
Aproximacin por polinomios de Taylor
Propongamos el siguientes esquema, que se basa en tomar los intervalos x 2h y x h,

y el desarrollo por Taylor para cada caso:
2h
4h2
8h3
16h4
32h5
+ f 00 (x)
+ f 000 (x)
+ f iv (x)
+ f v (x)
+ ...;
1!
2!
3!
4!
5!
h
h2
h3
h4
h5
f (x + h) = f (x) + f 0 (x) + f 00 (x) + f 000 (x) + f iv (x) + f v (x) + . . . ;
1!
2!
3!
4!
5!
2
3
4
5
h
h
h
h
h
f (x h) = f (x) f 0 (x) + f 00 (x) f 000 (x) + f iv (x) f v (x) + . . . ;
1!
2!
3!
4!
5!
2
3
4
4h
8h
16h
32h5
2h
+ f 00 (x)
f 000 (x)
+ f iv (x)
f v (x)
+ ....
f (x 2h) = f (x) f 0 (x)
1!
2!
3!
4!
5!
Primero hagamos f (x + 2h) f /x 2h) y f (x + h) f (x h), con las cual obtendremos
las siguientes igualdades:
f (x + 2h) = f (x) + f 0 (x)
h
h3
h5
+ 16f 000 (x) + 64f v (x) + . . . ;
1!
3!
5!
3
5
h
h
h
f (x + h) f (x h) = 2f 0 (x) + 2f 000 (x) + 2f v (x) + . . . .
1!
3!
5!
f (x + 2h) f (x 2h) = 4f 0 (x)
Curso 008
PRELIMINAR
- 103 -
Anlisis Numrico I
Si queremos mejorar la precisin de nuestros esquemas anteriores para calcular f 0 (x),

anulemos el trmino con h3 . Para ello, hagamos [f (x + 2h) f (x 2h)] 8 [f (x + h) f (x h)].
As, nos queda la siguiente igualdad:
f (x + 2h) f (x 2h) 8f (x + h) + 8f (x h) = 12f 0 (x)h + 48f v (x)
h5
+ ....
5!
De esta ltima expresin podemos despejar f 0 (x), que resulta ser:

f 0 (x) =
f (x 2h) 8f (x h) + 8f (x + h) f (x + 2h)
h4
+ 4f v (x) + . . . ;
12h
5!
y si truncamos en h4 , nos queda:

f 0 (x) =
f (x 2h) 8f (x h) + 8f (x + h) f (x + 2h)
h4
+ 4f v () .
12h
5!
con [x 2h; x + 2h] y un orden de convergencia O(h4 ). Con esta ltima expresin podemos
decir que una aproximacin de la primera derivada en un punto esta dada por:
f 0 (x)
f (x 2h) 8f (x h) + 8f (x + h) f (x + 2h)
.
12h
Ahora, apliquemos este nuevo esquema centrado para calculas la derivada buscada, con
la misma representacin numrica utilizada en los casos anteriores. Tomemos el paso h = 0, 1
con el que obtendremos:

seno 3 0, 8 8 seno 3 0, 9 + 8 seno 3 1, 1 seno 3 1, 2
0
f (x = 1) =
12 h
f 0 (x = 1) =
0, 7431 6, 4721 + 7, 3084 0, 9511

0, 6283
=
= 0, 5236
12 0, 1
1, 2
El resultado obtenido es sorprendente, pues para esa representacin numrica, se lo puede

considerar exacto! Bast que ampliramos el intervalo de clculo, es decir, los puntos que usamos para armar lo que se denomina una malla (en ingls mesh), para que la aproximacin sea
excelente. Este algoritmo se conoce como el mtodo de los cinco puntos y tiene un orden de
convergencia proporcional a la derivada quinta, lo que lo vuelve muy preciso. La nica desventaja es que requiere operar con cinco puntos y esa malla deber densificarse cada vez que la
representacin numrica sea ms precisa, cuidando siempre de evitar que el paso sea muy chico,
por el riesgo de que no pueda representarse correctamente el numerador. Veremos ms adelante
que este tipo de mallas son muy tiles para resolver ecuaciones diferenciales y/o sistemas de
ecuaciones diferenciales.
En la figura 6.2 se puede la aproximacin obtenida utilizando la aproximacin por polinomios de Taylor.
Pero nuestro inters, por ahora, es calcular en forma numrica el valor de la derivada en
un punto dado con la mejor aproximacin posible. Existir otra forma de obtener ese valor con
un grado de aproximacin similar al obtenido con el esquema anterior usando un solo punto?
6.1.3.
Extrapolacin de Richardson
Vimos en el punto anterior que para calcular una derivada en un punto y obtener la
mejor aproximacin, debemos trabajar con el esquema centrado y con un paso h pequeo, an
cuando esto trae aparejado una inestabilidad de los resultados. Tal como vimos al analizar la
aproximacin por polinomios de Taylor, nuestra aproximacin de la derivada se puede expresar
como:
M = N (h) + E(h),
- 104 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Figura 6.2: Aproximacin por polinomios de Taylor.

donde M es el valor buscado, N (h), la aproximacin de M , E(h), el error cometido y h, el paso.
Supongamos que podemos expresar nuestra E(h) de la siguiente forma:
E(h) = K1 h + K2 h2 + K3 h3 + . . . .
Anlogamente al caso anterior, para un h1 el valor buscado se podr expresar como
(I) M = N1 (h1 ) + K1 h1 + K2 h21 + K3 h31 + . . . .
Hagamos lo mismo pero para un h2 tal que q =
h1
h2 .
Entonces tendremos:
(II) M = N1 (h2 ) + K1 h2 + K2 h22 + K3 h32 + . . . .

Como h1 = qh2 podemos escribir (I) como:
(III) M = N1 (h1 ) + K1 qh2 + K2 (qh2 )2 + K3 (qh2 )3 + . . . .
Para mejorar el orden de aproximacin de nuestro resultado, anulemos el trmino lineal de h, es
decir, multipliquemos por q a (II) y luego restmosle (III):

qM M = qN1 (h2 ) N1 (h1 ) + qK1 (h2 h2 ) + qK2 h22 qh22 + qK3 h32 q 2 h32 + . . .

qM M = qN1 (h2 ) N1 (h1 ) + qK2 h22 qh22 + qK3 h32 q 2 h32 + . . . .
Si despejamos M , tendremos la siguiente expresin:

(q 1)N1 (h2 ) N1 (h2 ) N1 (h1 ) qK2 h22 (q 1) qK3 h32 q 2 1
M=
+
+ ...
q1
q1
q1
q1
en la que podemos expresar M como:
M = N1 (h2 ) +
|
N1 (h2 ) N1 (h1 )
qK2 h22 q (q + 1) K3 h32 + . . .
q1
{z
}
N2 (h1 )
Generalizando, nos queda que:

M = N2 (h) K20 h2 K30 h3 + . . .
Curso 008
PRELIMINAR
- 105 -
Anlisis Numrico I
Si repetimos el proceso otra vez tomando nuevamente h1 y h2 , entonces tenemos:

(IV) M = N2 (h1 ) + K20 h21 + K30 h31 + . . . .
(V) M = N1 (h2 ) + K20 h22 + K30 h32 + . . . .
Como nuevamente se cumple que q =
h1
h2 ,
podemos reescribir (IV) como:
(VI) M = N2 (h1 ) + K20 (qh2 )2 + K30 (qh2 )3 + . . . .

Anlogamente al caso anterior, mejoramos nuestra aproximacin anulando en este caso
el trmino cuadrtico de h, multiplicando por q 2 a (V) para luego restarle (VI):

q 2 M M = q 2 N2 (h2 ) N2 (h1 ) q 2 K2 h22 h22 + q 2 K30 h32 (q 1) + . . .
q2M M
= q 2 N2 (h2 ) N2 (h1 ) + q 2 K30 h32 (q 1) + . . .
De la misma forma que para el caso anterior, obtenemos una nueva aproximacin para
M
M=
(q 2 1)N2 (h2 ) N2 (h2 ) N2 (h1 ) q 2 K30 h32 (q 1)

+
+
+ ...
q2 1
q2 1
q2 1
M = N2 (h2 ) +
|
N2 (h2 ) N2 (h1 ) q 2 K30 h32

+
+ ....
q2 1
q+1
{z
}
N3 (h1 )
Una segunda forma de escribir esto ltimo en funcin de h1 es

M = N2
|
h1
q
N2
h1
q
N2 (h1 )
+
q2 1
{z
N3 (h1 )
q 2 K30
h1
q
q+1
3
+ ....
Finalmente, podemos generalizar el mtodo de aproximacin de la siguiente forma:

h
N
j1
q Nj1 (h)
h
+
.
Nj (h) = Nj1
q
q j1 1
Este mtodo o algoritmo para mejorar una aproximacin se conoce como Extrapolacin de
Richardson. Veremos ms adelante una aplicacin de este mismo mtodo asociado a la integracin numrica.
Un caso particular muy usado es cuando q = 2, cuya expresin general se define como:

Nj1 h2 Nj1 (h)
h
+
.
Nj (h) = Nj1
2
2j1 1
Este algoritmo permite aproximar una derivada numrica con poco esfuerzo y teniendo en cuenta
la inestabilidad del algoritmo porque no requiere dividir por nmeros excesivamente pequeos.
Apliquemos este mtodo al ejemplo inicial y calculemos la derivada de f (x) = seno 3 x
en x = 1 con el algoritmo de diferencias progresivas.
Armemos una tabla para aplicar el algoritmo anterior de modo de visualizar fcilmente
cada uno de los pasos. En primer lugar, vamos definir que la primera aproximacin, es decir, N1 (h)
sea la derivada calculada numricamente con h, que ocupar la primera columna. Usaremos la
expresin:

seno
(x
+
h)
seno
f
(x
+
h)
f
(x)
3
3x
f 0 (x)
=
.
h
h
- 106 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Las dems columnas sern N2 (h), N3 (h) y N4 (h). En segundo lugar, tomaremos varios
valores de h, por lo tanto tendremos varias filas con diferentes aproximaciones de la derivada
buscada. Para cada caso calcularemos las aproximaciones con la frmula de la Extrapolacin de
Richardson:

Nj1 h2 Nj1 (h)
h
Nj (h) = Nj1
+
.
2
2j1 1
En la tabla 6.1 podemos los resultados obtenidos al aplicar la extrapolacin de Richardson
a nuestro ejemplo.
Tabla 6.1: Extrapolacin de Richardson
hi
0,2
0,1
0,05
0,025
yi0 = N1,i
0,4250
0,4750
0,5000
0,5120
N2,i
N3,i
N4,i
0,5250
0,5250
0,5240
0,5250
0,5237
0,5235
Figura 6.3: Aproximacin con N1 .

Analicemos rpidamente los resultados obtenidos. La primera columna contiene los resultados de aproximar la derivada con varios h diferentes. Vemos que a pesar de utilizar un h
relativamente pequeo (h = 0, 025) nuestra aproximacin inicial no es muy buena.
La segunda columna es nuestra primera aplicacin de la extrapolacin de Richardson,
usando los valores de la primera columna. A primera vista se puede observar que la aproximacin es muy superior a la anterior. Algo similar ocurre en la tercera. Finalmente, en la cuarta,
la aproximacin final resulta ser casi el valor exacto para una representacin de cuatro (4) decimales. Y si comparamos con la aproximacin para h = 0, 025, ltima fila de la primera columna,
vemos que es muy superior. Si quisiramos obtener una aproximacin similar, deberamos trabajar con ms decimales, puesto que para h = 0, 01 el valor de f 0 (1) es 0,5200, que si bien tiene dos
decimales correcto, es menos preciso que el hallado con Richardson, que resulta ser casi correcto
hasta el cuarto decimal.
En las figuras 6.3, 6.4 y 6.5 se pueden ver algunas de las aproximaciones de la pendiente
en el punto dado en cada paso.
Curso 008
PRELIMINAR
- 107 -
Anlisis Numrico I

Si bien aplicamos este mtodo para obtener una derivada numrica, puede aplicarse para
cualquier caso que cumpla la condicin:
M = N (h) + K1 h + K2 h2 + K3 h3 + . . . .
como es el caso de la interpolacin polinomial.
6.1.4.
Notas finales
Es evidente que la diferenciacin numrica es inestable o, dicho de otro modo, es muy

dependiente de la precisin utilizada. Afinar el paso h en un algoritmo dado puede conducir
a resultados de menor precisin o, en trminos numricos, inservibles; en consecuencia, no es
conveniente reducir el paso h suponiendo que eso mejora la aproximacin buscada.
Los distintos mtodos vistos en los puntos anteriores indican que es preferible mejorar el
algoritmo o desarrollar uno nuevo, antes que afinar el paso de clculo. Ms an, es mucho ms
efectivo aplicar el mtodo de extrapolacin de Richardson a un algoritmo conocido y sencillo
- 108 -
PRELIMINAR
Curso 008
Anlisis Numrico I
que desarrollar uno nuevo. En todo caso, la segunda opcin sera utilizar los polinomios de
Taylor o alguna aproximacin polinomial que utilice la informacin disponible (puntos adyacentes
o aledaos). Si bien esta aproximacin puede ser laboriosa, queda ampliamente justificada al
disminuir la incidencia del error de redondeo en los clculos, sobre todo al no tener que dividir
por un nmero muy pequeo.
Los desarrollos vistos para el caso de aproximar una primera derivada pueden extrapolarse
para derivadas de orden superior. Un ejemplo de ello es la aproximacin centrada de la segunda
derivada en un punto dado, cuya expresin es:
f (x h) 2f (x) + f (x + h)
.
h2
que se obtiene de considerar los polinomios de Taylor para x h y x + h:
f 00 (x) =
h
h2
h3
+ f 00 (x)
+ f 000 (x)
+ ...;
1!
2!
3!
h2
h3
h
f 000 (x)
+ ....
f (x h) = f (x) f 0 (x) + f 00 (x)
1!
2!
3!
Sumando ambas expresiones se obtiene:
f (x + h) = f (x) + f 0 (x)
f (x + h) + f (x h) = 2f (x) + f 00 (x)h2 + f iv (x)

f 00 (x) =
h4
+ ...;
12
f (x h) 2f (x) + f (x + h)
h2
iv
f
[]
,
h2
12
con [x h; x + h).
Observemos que el error cometido al calcular la derivada segunda con la expresin dada
es proporcional a h2 y a f iv (), es decir, similar al caso de la expresin centrada para la primera
derivada. Podemos asegurar que en el caso de polinomios de grado 3 o inferior, o que no exista
la derivada cuarta, la derivada segunda obtenida en forma numrica, es exacta.
Mediante razonamientos anlogos o similares pueden obtenerse algoritmos para calcular
derivadas numricas de orden superior.
6.2.
Integracin numrica
Como en el caso de la diferenciacin numrica, la integracin numrica tiene la misma

dificultad de trabajar con mtodos simblicos. Existen muchos programas de aplicacin en la
ingeniera que dependen de obtener integrales definidas. Como es prcticamente imposible agregar
una base de datos que incluya las primitivas de cualquier funcin, la nica manera de calcular
estas integrales es mediante mtodos numricos. Un ejemplo en este sentido es la utilizacin
del mtodo de los elementos finitos en el anlisis estructural, que calcula la matriz de rigidez
mediante la integracin numrica.
Veremos a continuacin varios mtodos numricos para calcular integrales definidas, analizando ventajas y desventajas de cada uno de ellos.
6.2.1.
Frmulas de Newton-Cotes
Antes de desarrollar las distintas frmulas o mtodos para obtener una integral definida
en forma numrica, daremos algunas definiciones.
Definicin 6.1. Dada una funcin f (x) definida en [a; b], se denomina cuadratura numrica de
Rb
la integral I(f ) = a f (x)dx a una frmula tal que:
Qn (f ) =
n
X
ci f (xi ) ;
i=1
Curso 008
PRELIMINAR
- 109 -
Anlisis Numrico I
6.2. Integracin numrica
con ci < y xi [a; b]. Los puntos xi se denominan puntos de cuadratura (o races) y los
valores ci , coeficientes de cuadratura o de peso. Asimismo, se define el error de la cuadratura
como En (f ) = I(f ) Qn (f ).
Definicin 6.2. Una cuadratura
numrica tiene grado de precisin m si En (xk ) = 0 para

k = 0; 1; . . . ; m y En xm+1 6= 0.
Observacin 6.2.1. Si una cuadratura numrica tiene grado de precisin m, entonces En (pk ) =
0 para todo polinimio pk (x) de grado menor o igual a m (k m).
Definicin 6.3. Se denomina frmula cerrada de Newton-Cotes a toda cuadratura numrica
cuyos nodos incluya a los extremos del intervalo.
Definicin 6.4. Se denomina frmula abierta de Newton-Cotes a toda cuadratura numrica
cuyos nodos no incluya a los extremos del intervalo.
6.2.2.
Frmulas cerradas de Newton-Cotes
Frmulas simples
Supongamos que tenemos la siguiente funcin (o curva) y queremos hallar el rea bajo
la misma en el intervalo [a; b], como se ve en la figura 6.6.
Figura 6.6: rea bajo la curva.

Para empezar, podemos hacer dos aproximaciones muy groseras como se puede apreciar
en las figuras 6.7(a) y 6.7(b):
En la aproximacin de la figura 6.7(a), vemos que el rea obtenida es mucho menor que el
rea buscada. En cambio, en la 6.7(b), podramos suponer que la aproximacin obtenida del rea
es similar o mayor. Podemos ver que si el rea en color claro se compensa con el rea en color
oscuro excedente, entonces estaramos obteniendo una buena aproximacin. Si esto no fuera as,
entonces obtendramos una rea por defecto (la parte oscura es menor que la parte clara) o por
exceso (la parte oscura es mayor a la parte clara).
Estas dos aroximaciones se pueden expresar matemticamente como:
Qn (f ) = f (a)(b a);
para el caso (a) y,
Qn (f ) = f (b)(b a);
para el caso (b).
Otra forma de aproximar el rea es la siguiente:
- 110 -
PRELIMINAR
Curso 008
Anlisis Numrico I
(a) Por defecto
(b) Por exceso
Figura 6.7: Aproximacin por rectngulos.
Figura 6.8: Aproximacin por trapecios.

En este caso particular, no parece que esta aproximacin sea mejor, puesto que hay un
rea excedente en color claro. La expresin matemtica para este ltimo caso es:
Qn (f ) =
f (b) + f (a)
(b a).
2
Vamos a generalizar estas tres expresiones. Definamos h = b a, y escribamos cada una

de las expresiones de la siguiente forma:
Aproximacin por rectngulos (defecto): Qn (f ) = h f (a);
Aproximacin por rectngulos (exceso): Qn (f ) = h f (b);
Aproximacin por trapecio: Qn (f ) =
h
2
[f (a) + f (b)].
Para saber si nuestras aproximaciones son buenas, estimemos el error que cometemos
en cada una. Primeramente, analicemos cualquiera de los dos mtodos que aproximan por un
rectngulo. Si desarrollamos f (x) respecto del punto a mediante una serie de Taylor, tenemos
que
(x a)2
f (x) = f (a) + f 0 (a)(x a) + f 00 (a)
+ ....
2
Para obtener la integral basta con integrar la serie tambin. Entonces tenemos
Z b
Z b
Z b
Z b
(x a)2
0
dx + . . . .
f (x)dx =
f (a)dx +
f (a)(x a)dx +
f 00 (a)
2
a
a
a
a
Curso 008
PRELIMINAR
- 111 -
Anlisis Numrico I
Si integramos y truncamos en el trmino de la derivada primera, nos queda

Z b
(b a)2
,
f (x)dx = f (a)(b a) + f 0 ()
2
a
con [a; b]. Como h = b a tenemos que
Z b
h2
f (x)dx = f (a)h + f 0 () ,
2
a
es decir, nuestra expresin tiene un error proporcional a la derivada primera y su orden de
convergencia es O(h). Para el caso de usar f (b) el error es anlogo.
Para analizar el mtodo del trapecio, usemos una interpolacin entre el punto a y b usando
el polinomio de Lagrange y su error. En este caso tenemos que
f (x) = f (a)
xb
xa
(x a)(x b)
+ f (b)
+ f 00 ()
.
ab
ba
2
Integremos el polinomio obtenido; as nos queda

Z b
Z
Z
Z b
(x a)(x b)
f (b) b
f (a) b
00
(x b)dx +
(x a)dx + f ()
f (x)dx =
dx
a
b
b
a
2
a
a
a
a
(b a)3
f (a) + f (b)
(b a) + f 00 ()
=
2
12
3
f (a) + f (b)
h
=
h + f 00 () ,
2
12
nuevamente con [a; b]. Ahora lo que hemos obtenido es un mtodo cuyo error es proporcional
a la derivada segunda, y, en consecuencia, mejoramos nuestra aproximacin. Analicemos ahora
una segunda mejora. Supongamos que podemos calcular la funcin en x = a+b
2 , es decir, podemos

a+b
obtener f 2 . En consecuencia, tenemos ahora tres puntos que nos pueden servir para obtener
el rea buscada. Hagamos pasar una curva por esos tres puntos utilizando el polinomio de Taylor
y asumiendo en este caso que h = ba
2 , como se ve en la figura 6.9. Podemos ver en la figura que
Figura 6.9: Aproximacin por arcos de parbola cuadrtica.

el rea aproximada es mayor que el rea buscada, lo que significa que obtendremos un valor por
exceso.
La aproximacin usando parbolas de segundo grado es la conocida frmula de Simpson,
cuya expresin matemtica es:

h
a+b
Qn (f ) =
f (a) + f (b) + 4 f
.
3
2
- 112 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Analicemos el error que se comete con esta nueva expresin. Tomemos nuevamente nuestro
a+b
desarrollo de Taylor pero a partir del punto x1 =
y cortemos la expresin en la derivada
2
cuarta. Entonces nos queda
f (x) = f (x1 ) + f 0 (x1 )(x x1 ) + f 00 (x1 )
(x x1 )3
(x x1 )4
(x x1 )2
+ f 000 (x1 )
+ f iv (1 )
,
2
6
24
con 1 [a, b].

Si integramos nuevamente nos queda
Z b
Z b
Z b
Z b
(x x1 )2
f 00 (x1 )
f 0 (x1 )(x x1 )dx +
f (x1 )dx +
f (x)dx =
dx +
2
a
a
a
a
Z b
Z b
(x x1 )3
(x x1 )4
f 000 (x1 )
+
f iv (x1 )
dx +
dx
6
24
a
a
b
b
(x x1 )3
(x x1 )2
00
0
= f (x1 )(b a) + f (x1 )
+ f (x1 )
+
2
6
a
a
b
b
4
5
(x x1 )
(x x1 )
+f 000 (x1 )
+ f iv ()

24
120 a
a
Ahora tomemos que h = b x1 = x1 a. Entonces nos queda
Z b
h3
h5
f (x)dx = f (x1 )2h + f 00 (x1 ) + f iv () .
3
60
a
Aproximemos la derivada segunda en x1 mediante una derivada discreta, como la vista
en diferenciacin numrica, cual es:
f 00 (x1 ) =
f (a) 2f (x1 ) + f (b) h2 iv

f (2 ),
h2
12
con 2 [a; b].

Al reemplazarla en la frmula de integracin, nos queda
Z b
f (a) 2f (x1 ) + f (b) h3
h5
h5
f (x)dx = f (x1 )2h +
f iv (2 ) + f iv (1 )
2
h
3
36
60
a
5
h
h
=
[f (a) + 4f (x1 ) + f (b)] f iv ()
3

90
a+b
b a iv
h
=
f (a) + 4f
+ f (b)
f ()h4 ,
3
2
90
con [a; b]. Usualmente el trmino de error de define como:
E(h) = M h4 , con M =
b a iv
f (),
90
de ah que el orden de convergencia sea O(h4 ).

Vemos que el error del mtodo de Simpson es proporcional a la derivada cuarta, por lo
tanto, esta expresin nos da una integral exacta para polinomios de grado menor o igual a
tres.
Unifiquemos los cuatro casos en un intervalo de integracin. Si tomamos como intervalo
[a; b] el intervalo [1; 1], nos queda para cada mtodo lo siguiente:
Aproximacin por rectngulo (defecto): Qn (x) = 2 f (1).
Aproximacin por rectngulo (exceso): Qn (x) = 2 f (1).
Curso 008
PRELIMINAR
- 113 -
Anlisis Numrico I
Aproximacin por trapecios: Qn (x) = 1 f (1) + 1 f (1).

Aproximacin por Simpson: Qn (x) =
1
3
f (1) +
4
3
f (0) +
1
3
f (1).
Si nos fijamos en la definicin de cuadratura podemos ver que hemos definido para cada
caso un valor de ci y un valor de xi , que son los siguientes:
Aproximacin por rectngulo (defecto): c1 = 2, x1 = 1.
Aproximacin por rectngulo (exceso): c1 = 2, x1 = 1.
Aproximacin por trapecios: c1 = c2 = 1, x1 = 1, x2 = 1.
Aproximacin por Simpson: c1 = c3 = 13 , c2 = 43 , x1 = 1; x2 = 0; x3 = 1;
con lo cual podemos escribirlos segn la forma general definida como cuadratura numrica:
Qn (f ) =
n
X
ci f (xi ) ;
i=1
siendo n = 1 para la frmula del rectngulo, n = 2 para la del trapecio y n = 3 para la de

Simpson.
An cuando estas aproximaciones tienen una precisin interesante (sobre todo la ltima), no son lo suficientemente precisas para resolver cualquier problema. Para mejorar nuestra
aproximacin, veremos a continuacin algunas formas de mejorar la precisin de las cuadraturas.
Frmulas compuestas
Supongamos que en lugar de utilizar la frmula del rectngulo con el paso h = b a,
dividimos ese intervalo en intervalos ms chicos. Empecemos por definir un nuevo paso como
h = ba
2 . Ahora podemos aproximar la integral con dos subintervalos, tanto por defecto como
por exceso, que resultan ser [a; a + h] y [a + h; b], con los cuales se obtienen las siguientes
aproximaciones:
Qn (f ) = h f (a) + h f (a + h);
o
Qn (f ) = h f (a + h) + h f (b).
Ambas aproximaciones se pueden ver en las figuras 6.10(a) y 6.10(b). La primera es una
aproximacin francamente por defecto, en cambio, en la segunda tenemos una primer intervalo
con una aproximacin por exceso y otro intervalo por defecto; en conjunto podemos inferir que
la aproximacin resulta ser por exceso.
(a) Por defecto
(b) Por exceso
Figura 6.10: Aproximacin compuesta por rectngulos.

- 114 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Podemos hacer un desarrolo similar con la frmula del trapecio. Si tomamos el mismo
paso, y por ende, los mismos subintervalos, tendremos:
h
h
h
[f (a) + f (a + h)] + [f (a + h) + f (b)] = [f (a) + 2f (a + h) + f (b)] .
2
2
2
La aproximacin obtenida se puede ver en el figura 6.11, que resulta ser una aproximacin por
defecto.
Qn (f ) =
Figura 6.11: Aproximacin compuesta por trapecios.

Al igual que en los casos anteriores, podemos mejorar la aproximacin de la frmula de
Simpson. Si dividimos nuestro intervalo inicial en dos, de manera de trabajar con dos subintervalos y definimos h = ba
4 , tendremos la nueva aproximacin:
h
h
[f (a) + f (a + 2h) + 4 f (a + h)] + [f (a + 2h) + f (b) + 4 f (a + 3h)] .
3
3
Podemos simplificar la expresin para que nos quede una ms general:
Qn (f ) =
h
[f (a) + f (b) + 2 f (a + 2h) + 4 f (a + h)] .
3
El resultado de aplicar esta frmula, como se puede ver en la figura 6.12, muestra que la aproximacin obtenida es muy precisa, y que el resultado es muy cercano al exacto.
Qn (f ) =
Figura 6.12: Aproximacin compuesta por Simpson.

Veremos, ahora, como podemos generalizar las expresiones de los mtodos para n subintervalos. Si dividimos el intervalo ba en n intervalos tendremos las frmulas cerradas compuestas
de Newton-Cotes, que son las siguientes:
Curso 008
PRELIMINAR
- 115 -
Anlisis Numrico I
Rectngulos:
Qn (f ) = h
n1
X
f (a + i h),
i=0
Qn (f ) = h
"n1
X
#
f (a + i h) + f (b) ,
i=1
con h =
ba
n ;
Trapecios:
"
#
n1
X
h
f (a) + f (b) + 2
Qn (f ) =
f (a + i h) ,
2
i=1
tambin con h =
ba
n ;
Simpson:
h
Qn (f ) =
3
con h =
(
f (a) + f (b) + 2
n1
X
f (a + 2i h) + 4
i=1
n
X
)
f [a + (2i 1) h]
i=1
ba
2n .
Estas frmulas permiten mejorar la precisin reduciendo el paso h. En particular, en el

caso del mtodo compusto de Simpson, el error se define como
E(h) =
b a iv
b a iv
f ()h4 = M h4 , con M =
f (),
180
180
con [a; b]. Si bien se trata de una mejora en la precisin, la misma no es demasiado significativa, pues el orden de convergencia sigue siendo O(h4 ).
Sin embargo, esta metodologa tiene una desventaja. A medida que achicamos el paso
aumentamos notablemnte la cantidad de operaciones que se deben realizar, lo que significa ms
tiempo de procesamiento. Esto no siempre es prctico; por ejemplo, dividir el intervalo para
Simpson en 100 subintervalos representa un esfuerzo de clculo que no siempre mejora la precisin
del resultado en el mismo sentido. Puede ocurrir que nuestra representacin numrica nos limite
el tamao del paso h, lo que nos impide afinar el paso todo lo necesario. Algo similar puede
ocurrir con las otras frmulas.
Por otro lado, toda vez que querramos afinar nuestro clculo reduciendo el paso h, debemos calcular prcticamente todo otra vez, pues salvo los valores de la funcin en los extremos
del intervalo, el resto de los valores no suelen ser tiles (salvo excepciones). Cambiar el paso no
suele tener costo cero. Busquemos, en consecuencia, otra forma para obtener resultados ms
precisos sin tener achicar el paso, incrementar demasiado las cantidad de operaciones a realizar
o repetir todos los clculos.
Mtodo de Romberg
Como primer paso para desarrollar un mtodo ms eficiente que mejore nuestros resultados, analicemos el error que se comete al aplicar cualquiera de las frmulas de cuadratura vistas
en los puntos anteriores. En forma general, la aproximacin se puede expresar de la siguiente
forma:
- 116 -
PRELIMINAR
Curso 008
Anlisis Numrico I
f (x)dx =
I(f ) =
Z bX
n
a i=1
n
X
ci f (xi ) +
|i=1 {z
f (xi )Li (x)dx +
Qn (f )
1
n!
f (n) [(x)] Y
(x xi )dx
n!
i=1
n
Y
f (n) [(x)] (x xi )dx;
i=1
como vimos al principio, el error est dado por:

En (f ) = I(f ) Qn (f ) =
1
n!
f (n) [(x)]
n
Y
(x xi )dx.
i=1
Para cada uno de los mtodos tenemos:

Rectngulos: E1 (f ) =
ba
2
f 0 () h.
00
2
Trapecios: E2 (f ) = ba
12 f ()h .
iv
4
Simpson: E3 (f ) = ba
90 f ()h .
Podemos notar que las aproximaciones mediante cualquiera de las frmulas vistas se
pueden expresar como:
M = N (h) + K1 h + K2 h2 + K3 h3 + . . . ;
lo que nos permite aplicar el mtodo de extrapolacin de Richardson, visto para diferenciacin
numrica. La adaptacin de este mtodo a la integracin se conoce como mtodo de Romberg.
Para explicarlo, aplicaremos la extrapolacin de Richardson al mtodo compuesto de los trapecios.
Recordemos la frmula del mismo:
"
#
n1
X
h
Qn (f ) =
f (a) + f (b) + 2
f (a + i h) ;
2
i=1
y de acuerdo con lo visto, se puede definir que:

"
#
n1
X
h
b a 2 00
f (a) + f (b) + 2
f (a + i h)
h f ();
I(f ) =
2
12
i=1
con a < < b y h = ba

n .
A partir de esto vamos a desarrollalo. En primer lugar, vamos a obtener todas las aproximaciones para m1 = 1, m2 = 2, m3 = 4, . . . , mn = 2n1 , con n positivo. En consecuencia,
ba
tendremos un hk para cada valor de mk que estar definido por hk = ba
mk = 2k1 . De esta forma
podemos expresar la regla del trapecio como:
2k1
X1
hk
b a 2 00
I(f ) =
f (a) + f (b) + 2
f (a + i hk )
h f (k ).
2
12 k
i=1
Vamos a definir ahora que:
2k1
X1
hk
Rk,1 (hk ) =
f (a) + f (b) + 2
f (a + i hk ) ;
2
i=1
Curso 008
PRELIMINAR
- 117 -
Anlisis Numrico I
y con esta nueva frmula vamos a obtener los distintos Rk,1 . En efecto, para k = 1 tenemos que
R1,1 =
ba
h1
[f (a) + f (b)] =
[f (a) + f (b)] ,
2
2
con h1 = b a. Para el caso de k = 2 tenemos que

R2,1 =
=
h2
[f (a) + f (b) + 2f (a + h2 )]
2

ba
ba
f (a) + f (b) + 2f a +
4
2
h
1
#
z }| {
1 ba
ba
(f (a) + f (b)) +
6 2f (a + h2 )
2 | 2
62
{z
}
1
[R1,1 + h1 f (a + h2 )] ,
2
"
R1,1
con h2 =
ba
ba
. Anlogamente, para k = 3, h3 =
y, entonces
2
4

o
h3 n
f (a) + f (b) + 2 f (a + h3 ) + f (a + 2h3 ) + f (a + 3h3 )
R3,1 =
|{z}
2
h2
=
=
ba
{f (a) + f (b) + 2f (a + h2 ) + 2 [f (a + h3 ) + f (a + 3h3 )]}
8
1
{R2,1 + h2 [f (a + h3 ) + f (a + 3h3 )]} .
2
Si generalizamos para todos los k, tenemos que
k2
2X
1
Rk,1 =
Rk1;1 + hk1
f [a + (2i 1)hk ] .
2
i=1
Cada uno de estos Rk,1 son aproximaciones de nuestro valor buscado. Para refinar estos
resultados podemos aplicar, ahora s, la extrapolacin de Richardson con q = 4. Por lo tanto
tendremos que:
Rk,1 Rk1;1
Rk,2 = Rk,1 +
;
41 1
con k = 2; 3; . . . ; n. Si generalizamos, obtenemos la siguiente expresin:
Rk,j = Rk,j1 +
Rk,j1 Rk1;j1
;
4j1 1
con k = 2; 3; . . . ; n y j = 2; 3; . . . ; k. Al aplicar este mtodo, generamos una tabla como la 6.2,

donde cada Rk,j es una mejor aproximacin del resultado, siendo la mejor el Rn,n .
La ventaja de este mtodo es que permite calcular una nueva fila con solo hacer una
aplicacin de la frmula compuesta del trapecio y luego usar los valores ya calculados para
obtener el resto de los valores de las dems columnas de esa nueva fila; no requiere recalcular
todo.
Una cuestin a tener en cuenta al aplicar este mtodo, es que supone que la frmula
compuesta del trapecio permite la aplicacin de la extrapolacin de Richardson, esto es, se debe
cumplir que f (x) C 2(k+1) [a, b]; si esto no se cumple, no tiene sentido seguir afinando el resultado
hasta la iteracin k. Si generalizamos, es evidente que una funcin f (x) que cumpla con tener
infinitas derivadas continuas en el intervalo [a; b], es una funcin a la cual resulta muy conveniente
aplicarle el mtodo de Romberg.
- 118 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Tabla 6.2: Mtodo de Romberg
6.2.3.
R1,i
R1,1
R2,1
R3,1
..
.
R2,i
R3,i
...
R2,2
R3,2
..
.
R3,3
..
.
..
Rn,1
Rn,2
Rn,3
.
...
Rn,i
Rn,n
Frmulas abiertas de Newton-Cotes
En los puntos anteriores hemos visto las frmulas cerradas para integrar numricamente.
Existen tambin frmulas abiertas de Newton-Cotes. La ms conocida es la del punto medio.
Supongamos que tomamos la frmula del rectngulo pero en lugar de aproximar el rea con
los extremos, tomamos el punto medio del intervalo, es decir, c = a+b
2 . En ese caso nuestra
aproximacin del rea buscada estra dada por:
Qn (f ) = (b| {z
a}) f (c) = h f (c).
h
La aproximacin efectuada con esta frmula se puede ver en la figura 6.13.
Figura 6.13: Frmula del punto medio.

Al igual que en los casos anteriores, se puede desarrollar una frmula compuesta, similar
a la frmula compuesta del rectngulo pero tomando los puntos medios de los subintervalos.
Sin embargo, la idea principal de las frmulas abiertas no est relacionada con tomar
puntos de un intervalo segn un paso uniforme sino en determinar los puntos para efectuar
la integracin eligindolos de una manera inteligente. Qu significa inteligente? Analicemos
brevemente la frmula del punto medio. Al elegir dicho punto y no los extremos del intervalo,
suponemos que el rectngulo que queda formado aproxima mejor la integral buscada. Si dividimos
este intervalo en varios subintervalos ms pequeos, tendremos la frmula compuesta. As y todo,
estamos algo limitados.
Podramos avanzar en la idea y desarrollar una frmula similar para el mtodo de Simpson, es decir, crear una curva que no pase por los extremos y nos permita obtener una buena
aproximacin. Pero de todas maneras tenemos la misma limitante: debemos trabajar con puntos
Curso 008
PRELIMINAR
- 119 -
Anlisis Numrico I
equidistantes 1 . Esto puede llevar a que debamos utilizar las frmulas compuestas con muchos
trminos para alcanzar aproximaciones razonables. Veamos en el punto siguiente un mtodo
de integracin que explota la idea de las frmulas abiertas de Newton-Cotes eligiendo puntos
inteligentemente.
6.2.4.
Cuadratura de Gauss
Recordemos la frmula para una cuadratura:
Qn (f ) =
n
X
ci f (xi ) .
i=1
Supongamos ahora que elegimos una curva que pase por ciertos puntos y que aproxime
la integral de la funcin dada, usando la frmula de cuadratura. Una curva de ese tipo se ve en
la figura 6.14.
Figura 6.14: Cuadratura usando una curva de aproximacin.

Elegiremos como puntos crticos aquellos en los que la funcin se intersecta con la curva
de aproximacin. Estos sern nuestros puntos inteligentes. El problema es elegir la curva ms
conveniente. Por ejemplo, en la figura 6.14 se eligi una parbola, por lo tanto, se tienen dos
puntos que se intersectan con la funcin. Podramos haber utilizado una recta, una parbola
cbica, etc.
Supongamos ahora que definimos un intervalo fijo de integracin, por ejemplo, el [1, 1].
Debemos determinar para ese intervalo los puntos xi y los coeficientes ci para nuestra frmula
de cuadratura, esto es, debemos definir los puntos x1 ; x2 ; . . . ; xn y los coefcientes c1 ; c2 ; . . . ; cn .
En consecuencia, tenemos 2n incgnitas que debemos obtener. Si recordamos que un polinomio
de grado 2n 1 tiene 2n coeficientes (por ejemplo, un polinomio de tercer grado tiene la forma
a0 + a1 x + a2 x2 + a3 x3 ), podramos decir que hallar esos parmetros para nuestra frmula de
cuadratura es equivalente a obtener los coeficientes de ese polinomio de grado 2n 1.
Gauss defini estos polinomios que permiten aproximar la integral en el intervalo [1; 1]
dependiendo de la cantidad de puntos que se deseen utilizar. Estos polinomios son ortogonales y
1
Recordemos que la base de la integracin numrica es la interpolacin polinmica, que se vuelve inestable
cuando los puntos usados estn separados uno de otro en forma equidistante.
- 120 -
PRELIMINAR
Curso 008
Anlisis Numrico I
conocidos como polinomios de Legendre, y son los siguientes:

P0 (x) = 1
1
P2 (x) = (3x2 1)
2
1 dk 2
(x 1)k .
Pk (x) = k
2 k! dxk
P1 (x) = x
1
P3 (x) = (5x3 3x)
2
Calculando la raz de cada polinomio se obtienen los puntos xi y con estos puntos, los coeficientes
ci . En la tabla 6.3 se dan algunos los valores de las races y los coeficientes, de acuerdo con la
cantidad de puntos que se utilicen para aproximar la integral.
Tabla 6.3: Races y coeficientes de la cuadratura de Gauss-Legendre
n
1
2
3
xi
x1
x1
x2
x1
x2
x3
x1
x2
x3
x4
x1
x2
x3
x4
x5
= 0.0000000000
= 13 = 0.5773502692
= 13 = 0.5773502692
= 0.7745966692
= 0.0000000000
= 0.7745966692
= 0.8611363116
= 0.3399810436
= 0.3399810436
= 0.8611363116
= 0.9061798459
= 0.5384693101
= 0.0000000000
= 0.5384693101
= 0.9061798459
ci
c1
c1
c2
c1
c2
c3
c1
c2
c3
c4
c1
c2
c3
c4
c5
= 2.0000000000
= 1.0000000000
= 1.0000000000
= 0.5555555556
= 0.8888888889
= 0.5555555556
= 0.3478548451
= 0.6521451549
= 0.6521451549
= 0.3478548451
= 0.2369268850
= 0.4786286705
= 0.5688888889
= 0.4786286705
= 0.2369268850
Este mtodo es muy til cuando lo que queremos aproximar son integrales de funciones
polinmicas, puesto que los resultados son exactos cuando g 2n1. Si el intervalo de integracin
no es [1; 1], basta con hacer un cambio de coordenadas. Por ejemplo, si se tiene la siguiente
integral:
Z b
I(f ) =
f (x) dx
a
debemos hacer la siguiente transformacin lineal para poder aproximar con cuadratura de Gauss:
Z
ba
b+a
ba 1
x=
t+
; I(f ) =
f (t) dt.
2
2
2
1
El error cometido al aplicar la cuadratura de Gauss en el intervalo [1; 1] est dado por
E=
22n+1 (n!)4
f 2n (),
(2n + 1)[(2n)!]2
donde n es el nmero de puntos utilizados y [1, 1]. Si ampliamos el mtodo al intervalo

[a; b], tenemos que el error est dado por
E=
Curso 008
(b a)2n+1 (n!)4 2n
f (),
(2n + 1)[(2n)!]2
PRELIMINAR
- 121 -
Anlisis Numrico I
con o in[a, b]. Vemos que en ambos casos el error cometido es proporcional a la derivada de
orden 2n. Por ejemplo, si n = 2 entonces el error cometido es proporcional a la derivada cuarta
(f iv ()), pues tenemos
E=
(b a)22+1 (2!)4 22
(b a)5 (2!)4 iv
f
()
=
f ().
(2 2 + 1)[(2 2)!]2
5(4!)2
Al igual que para los mtodos anteriores, podemos pensar en un mtodo compuesto para
Gauss. Efectivamente, si dividimos el intervalo [a; b] en subintervalos ms pequeos, podemos
utilizar la cuadratura de Gauss en esos subintervalos, con la correspondiente transformacin
lineal, e inclusive usar un aproximacin con n no mayor a 3, con excelentes resultados.
6.2.5.
Integrales mltiples
Al igual que para el caso de integrales simples, podemos calcular en forma numrica
integrales mltiples, en dos o tres dimensiones. Tomemos la siguiente integral:
ZZ
f (x; y)dA,
A
donde A es una regim rectangular en el plano tal que

A = {(x; y)|a x b; c y d}.
Entonces, podemos escribir la integral de arriba como

Z d Z b
f (x; y)dx dy.
c
Integremos respecto a x usando el mtodo del trapecio. De esta manera obtendremos

b
f (x; y)dx
a
ba
[f (a; y) + f (b; y)] .
2
Reemplacemos esta expresin en la integral doble y hagamos lo mismo pero respecto a y.

Entonces nos queda que

Z d Z b
Z d
ba
f (x; y)dx dy
[f (a; y) + f (b; y)] dy
2
c
a
c
Z
ba d
[f (a; y) + f (b; y)] dy

2
c
Z d

Z d
ba
f (a; y)dy +
f (b; y)dy
2
c
c
Si aplicamos a cada integral la regla del trapecio, nos queda
d
f (a; y)dy
c
f (b; y)dy
c
dc
[f (a; c) + f (a; d)]
2
dc
[f (b; c) + f (b; d)] .
2
Al reemplazar estas dos expresiones en la general nos queda que

Z
dZ b
f (x; y) dx dy
c
- 122 -
(b a)(d c)
[f (a; c) + f (a; d) + f (b; c) + f (b; d)] .
4
PRELIMINAR
Curso 008
Anlisis Numrico I
En definitiva, podemos obtener una aproximacin de una integral mltiple, en este caso
doble, mediante la aplicacin del mtodo del trapecio en dos dimensiones. Tambin aplicando
el mtodo de Simpson podemos obtener una aproximacin de dicha integral. En este caso, la
expresin es
Z
dZ b
f (x; y) dx dy
c

hx h y
f (a; c) + f (a; d) + f (b; c) + f (b; d) +
9

c+d
a+b
c+d
a+b
+ f b;
+f
+4 f a;
;c + f
;d +
2
2
2
2

a+b c+d
+16 f
;
,
2
2
dc
donde hx = ba
2 y hy = 2 . Si reemplazamos esto ltimo en la expresin general y adems
c+d
definimos x0 = a, x1 = a+b
2 ,x2 = b, y0 = c, y1 = 2 e y2 = d, tenemos que
dZ b
f (x; y) dx dy
c
(b a)(d c)
{f (x0 ; y0 ) + f (x0 ; y2 ) + f (x2 ; y0 ) + f (x2 ; y2 ) +
36
+4 [f (x0 ; y1 ) + f (x1 ; y0 ) + f (x1 ; y2 ) + f (x2 ; y1 ) + 4f (x1 ; y1 )]}.
El error cometido por aproximar la integral mediante esta frmula est dado por:
ET
ES =
#
"
2
)
)
(b a)(d c) 2 2 f (;
2 f (;
+ hy
hx
12
x2
y 2
"
#
4
)
)
(b a)(d c) 4 4 f (;
4 f (;
hx
+ hy
90
x4
y 4
(Mtodo del trapecio),

(Mtodo de Simpson),
que, como podemos observar, son muy parecidos a los vistos para el caso de integrales simples.
Estos mtodos tambin se pueden modificar para obtener las frmulas compuestas, similares a las vistas anteriormente. (Para ms detalles, vase [1].)
As como hemos aplicado los mtodos de trapecio y de Simpson, lo mismo podemos hacer
con la cuadratura de Gauss. Si aplicamos el mismo razonamiento para integrar segn x tendremos
que
Z b
n
baX
f (x; y) dx
ci f (xi ; y).
2
a
i=1
Si hacemos lo mismo respecto de y, obtendremos

Z
dZ b
f (x; y) dx dy
c
baX
ci f (xi ; y) dy
2
c
i=1
n Z
baX d
ci f (xi ; y) dy
2
c
i=1
Curso 008
n
m
baXdcX
i=1
badc
2
2
(b a)(d c)
4
PRELIMINAR
ci cj f (xi ; yj )
j=1
n
m
XX
ci cj f (xi ; yj )
i=1 j=1
n X
m
X
ci cj f (xi ; yj ),
i=1 j=1
- 123 -
Anlisis Numrico I
6.3. Notas finales
con
xi =
yj
ba
b+a
ti +
2
2
dc
d+c
tj +
,
2
2
donde ti y tj son las races de los polinomios de Legendre, y ci y cj , los coeficientes de peso.
Por ejemplo, si tomamos n = m = 2 tenemos que t1 = 13 , t2 = 13 y c1 = c2 = 1, y la
aproximacin nos queda como
Z
dZ b
f (x; y) dx dy
c
con
(b a)(d c)
[f (x1 ; y1 ) + f (x1 ; y2 ) + f (x2 ; y1 ) + f (x2 ; y2 )] .
4
x1 =
b+a
ba 1
+
2
2
3
x2 =
ba 1
b+a
+
,
2
2
3
y1 =
dc 1
d+c
+
2
2
3
y2 =
d+c
dc 1
+
.
2
2
3
Podemos ver que con este mtodo solamente tenemos que evaluar la funcin a integrar
en cuatro puntos, en cambio, con el mtodo de Simpson debemos evaluar la misma funcin en
nueve puntos. Este mtodo es muy utilizado por el Mtodo de los Elementos Finitos para obtener
integrales dobles.
6.3.
Notas finales
La integracin numrica es uno de los mtodos numricos ms utilizados en la ingeniera

y en la ciencia en general. Inclusive, muchos programas para computadoras hacen usos de los
r
algoritmos vistos en este captulo. Por ejemplo, el MatLab
aplica el mtodo de Simpson en su
r
funcin quad que calcula integrales definidas, en tanto que el Mathcad
, aplica por omisin el
mtodo de Romberg.
- 124 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Captulo 7
Ecuaciones diferenciales ordinarias

7.1.
Ecuaciones diferenciales ordinarias con valores iniciales
7.1.1.
Introduccin
Muchos de los problemas que debemos resolver como ingenieros se pueden representar
mediante ecuaciones diferenciales ordinarias. Recordemos que las ecuaciones diferenciales ordinarias son aquellas ques estn expresadas en derivadas totales. As, buena parte de los mtodos
que empleamos para atacar un determinado problema resultan ser soluciones analticas de
ecuaciones diferenciales que se aplican en forma metdica y que se han obtenido a partir de
ciertas condiciones de borde, en este caso, condiciones iniciales.
Con todo, existen muchos casos para los cuales estas soluciones no son aplicables, por
cuanto las condiciones de borde difieren de las empleadas para hallar esas soluciones. Es en esos
casos cuando los mtodos numricos se convierten en la nica herramienta para obtener algn
tipo de solucin aproximada que nos permita resolver el problema.
Como ejemplos de diversas ecuaciones diferenciales con valores iniciales que suelen aplicarse en la ciencia y la tecnologa tenemos:
Dinmica de poblaciones. El economista ingls Thomas Malthus propuso el siguiente
modelo matemtico para definir el crecimiento demogrfico:
dP
= kP ;
dt
con k > 0, es decir, que la tasa de crecimiento de la poblacin es proporcional a la poblacin
total. (Este modelo en realidad no es muy preciso, pues deja de lado otros factores como la
inmigracin, por ejemplo, pero en su momento daba una buena aproximacin al problema
demogrfico.)
Desintegracin radiactiva. El siguiente modelo matemtico es el que se aplica para el
estudio de la desintegracin radiactiva:
dA
= kA;
dt
en este caso, con k < 0. Este modelo es la base del mtodo de datacin por Carbono 14,
usado en muchas disciplinas cientficas.
Ley de Newton del enfriamiento o calentamiento. Isaac Newton propuso la siguiente
ley matemtica para el cambio de temperatura:
dT
= k(T Tm );
dt
con k < 0, donde Tm es la temperatura del medio, y T la del objeto analizado.
Curso 008
PRELIMINAR
- 125 -
7.1. Ecuaciones diferenciales ordinarias con valores iniciales
Anlisis Numrico I
Ley de Torricceli. El drenado de un tanque cumple con el siguiente modelo:

p
dV
= Ah 2gh.
dt
Si definimos V = Aw h, entonces la expresin anterior se puede escribir como
dh
Ah p
2gh.
=
dt
Aw
La mayora de los libros toma el caso del pndulo como el ejemplo tradicional de las
ecuaciones diferenciales ordinarias con valores iniciales. El modelo matemtico que representa
este fenmeno est dado por:
d2
g
= sen(),
2
dt
L
donde g es la aceleracin de la gravedad, L, la longitud del pndulo, y , el ngulo del pndulo
respecto de la vertical. Este ejemplo suele linealizarse para el caso de ngulos muy pequeos,
pues se cumple que sen() = tan() = , y la ecuacin diferencial queda
g
d2
= .
2
dt
L
Un ejemplo de la ingeniera civil es la ecuacin del esfuerzo normal en una barra, que se
define como
dN
= t(x);
dx
donde t(x) es una carga uniformemente distribuida en el eje de la barra.
En lo que sigue veremos, primero, las condiciones para que la solucin de una ecuacin
diferencial ordinaria tenga solucin nica, y en segundo trmino, varios mtodos para resolver
numricamente este tipo de ecuaciones.
7.1.2.
Condicin de Lipschitz
Una ecuacin diferencial ordinaria con valores iniciales est definida de la siguiente mane-
ra:
dy
= f (t, y) con a t b e y(a) = y0 .
dt
Una funcin f (t, y) D <2 , con D convexo, cumple con la condicin de Lipschitz si
satisface que
|f (t, y1 ) f (t, y2 )| L |y1 y2 | ,
o

f (t, y)

y L,
para todo (t, y) D.

Para que una ecuacin diferencial tenga solucin nica se debe satisfacer el siguiente
teorema.
Teorema 7.1. Sea f (t, y) continua en D, tal que D = {(t, y)|a t b; y +}. Si
f (t, y) satisface la condicin de Lipschitz en D en la variable y, entonces el problema de valor
inicial
dy
= f (t, y) con a t b e y(a) = y0
dt
tiene solucin nica y(t) para a t b.
- 126 -
PRELIMINAR
Curso 008
Anlisis Numrico I
7.1.3.
Problema bien planteado

Un problema de valor inicial del tipo
dy
dt
se dice bien planteado si:

El problema tiene solucin nica (cumple con la condicin de Lipschitz);
Para cualquier > 0, existe una constante positiva k() con la propiedad de que siempre
que |0 | < y (t) es continua, con (t) < en [a; b], el problema tiene solucin nica z(t),
es decir,
dz
= f (t, z) + (t) con a t b e z(a) = y0 + 0 ,
dt
con
|z(t) y(t)| < k() ,
para toda a t b.
En definitiva, un problema est bien planteado si una perturbacin del problema original no cambia la esencia del mismo. El siguiente teorema define la condicin de problema bien
planteado.
Teorema 7.2. Sea D = {(t, y)|a t b; y +}. Si f (t, y) es continua y satisface la
condicin de Lipschitz en la variable y en el conjunto D, entonces el problema de valor inicial
dy
dt
se dice bien planteado.
7.1.4.
Mtodos de Euler
Hemos visto las condiciones que debe cumplir el problema de una ecuacin diferencial con
valores iniciales para tener solucin nica. Veamos ahor ael primer mtodo para resolver dicho
problema.
Partamos de la formulacin del problema
dy
= f (t, y).
dt
Si desarrollamos por Taylor la funcin y(t) en un entorno [t; t + h] tendremos
y(t + h) = y(t) + y 0 (t) h + y 00 (t)
h2
+ ... .
2
Como y 0 (t) = f (t, y) podemos modificar la expresin anterior para escribirla de la siguiente
forma:
h2
y(t + h) = y(t) + f (t, y) h + y 00 (t) + . . . .
2
ba
Dado que nuestro entorno de la solucin est dado por [a; b], definamos el paso h como h =
,
N
donde N es el nmero de intervalos. Con esto podemos definir que ti+1 = ti + h y que t0 = a y
tN = b. Con esto podemos escribir que
y(ti+1 ) = y(ti ) + h f [ti ; y(ti )] + y 00 (t)
Curso 008
PRELIMINAR
h2
+ ... .
2
- 127 -
Anlisis Numrico I
Si ahora nos limitamos a la segunda derivada, nos queda

y(ti+1 ) = y(ti ) + h f [ti ; y(ti )] + y 00 (i )
h2
,
2
con i [ti ; ti+1 ].

Puesto que lo que buscamos es una aproximacin de y(ti ), defininamos esta aproximacin
como wi y(ti ). Entonces nuestra expresin nos queda como
wi+1 = wi + h f (ti ; wi ),
para i = 0; 1; . . . ; N 1. Este mtodo se conoce como mtodo de Euler explcito.
Supongamos ahora que desarrollamos y(t) en ti +h para obtener y(ti ). Entonces tendremos
que
h2
y(ti ) = y(ti + h) y 0 (ti + h) h + y 00 (ti + h) + . . . ;
2
0
y, como y (ti + h) = f [ti + h; y(ti + h)], nos queda que
y(ti ) = y(ti + h) f [ti + h; y(ti + h)] h + y 00 (ti + h)
h2
+ ... .
2
Nuevamente, como ti+1 = ti +h, y despejando y(ti+1 ) limitando otra vez la expresin a la segunda
derivada, tenemos que
y(ti+1 ) = y(ti ) + h f [ti+1 ; y(ti+1 )] y 00 (i )
h2
,
2
con i [ti ; ti+1 ].

En forma anloga, lo que en realidad buscamos es una aproximacin de y(ti+1 ), por lo
tanto tendremos la siguiente expresin:
wi+1 = wi + h f (ti+1 ; wi+1 ),
para i = 0; 1; . . . ; N 1. Este mtodo se conoce como mtodo de Euler implcito.
Cul es la diferencia entre ambos mtodos? Bsicamente que el mtodo explcito de
Euler utiliza la pendiente en ti para obtener el nuevo punto wi+1 , en tanto que el mtodo
implcito utiliza la pendiente en el punto ti+1 para obtener el nuevo punto wi+1 . Es por eso
que el mtodo de Euler implcito suele dar mejores resultados que el explcito. La desventaja
del mtodo implcito es que para que funcione o sea fcil implementarlo, requiere trabajar la
expresin para transformarla en una explcita, es decir que no aparezca wi+1 en ambos lados de la
igualdad. Esto no siempre es posible y en consecuencia, la implementacin del mtodo implcito
no siempre es sencilla. En estos casos, el mtodo suele complementarse con algn mtodo para
obtener races de ecuaciones, generalmente el mtodo de las aproximaciones sucesivas, pues ya
se tiene la funcin g(t) que haga convergente la sucesin.
Pero existe otra forma de resolver esta situacin. Supongamos que planteamos el siguiente
sistema:
wi+1
= wi + h f (ti ; wi )
wi+1 = wi + h f (ti ; wi+1

),
es decir, obtenemos una primera aproximacin de wi+1 con el mtodo explcito, que llamaremos
, que luego usaremos para obtener una nueva aproximacin de w
wi+1
i+1 , que corrige la anterior.
1
Este mtodo se conoce como mtodo predictor-corrector de Euler .
1
Este mtodo no suele estar incluir en los libros de texto, posiblemente porque no mejora la aproximacin de
una manera significativa.
- 128 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Si bien los mtodos de Euler son bastante sencillos de implementar, los resultados que
se obtienen no son buenas aproximaciones de nuestro problema. De ah que, a pesar de que son
sencillos de implementar, generalmente no son aplicados. Se los usa solamente como introduccin
a los mtodos numricos y para el anlisis del error.
En efecto, para analizar el error, consideremos estos dos lemas:
1. Para toda x 1 y para cualquier m positiva, tenemos que 0 (1 + x)m emx .
2. Si s y t son nmeros reales positivos, {ai }ki=0 es una sucesin que satisface a0 t/s, y se
cumple que
ai+1 (1 + s)ai + t, para cada i = 0; 1; 2; . . . ; k,
entonces
(i+1)s
ai+1 e
t
a0 +
s
t
.
s
A partir de estos dos lemas se tiene el siguiente teorema.

Teorema 7.3. Sea f (t, y) continua, que satisface la condicin de Lipschitz con la constante L
en
D = {(t, y)|a t b; y +},
y existe una constante M , tal que |y 00 (t)| M para toda t [a; b]. Si y(t) es la solucin nica
del problema de valor inicial dado por
dy
= f (t, y) con a t b e y(a) = y0 ,
dt
y los w0 , w1 , . . . , wN son las aproximaciones a nuestra funcin, obtenidas por el mtodo de Euler,
entonces se cumple que
i
M h L(ti a)
|y(ti ) wi |
e
1 .
2L
La demostracin de este teorema se puede ver [1].
El error que acabamos de analizar es el error global, pues hemos estimado una cota del
error entre el valor real (o exacto) y la aproximacin por un mtodo numrico. Sin embargo, los
mtodos numricos suelen definirse segn el error local, es decir, el error entre dos iteraciones
sucesivas. Este error, en el mtodo de Euler, est dado por:
eL =
y(ti+1 y(ti )
f [ti ; y(ti )].
h
Como vimos, el mtodo explcito de Euler se puede obtener a partir de una desarrollo de
Taylor, del cual resulta que
y(ti+1 ) = y(ti ) + hy 0 (ti ) +
h2
h2 00
y (ti ) + . . . = y(ti ) + hf [ti ; y(ti )] + f 0 [ti ; y(ti )] + . . . ;
2
2
por lo tanto
y(ti+1 ) y(ti )
f (ti ) =
h
eL =
h 0
f [; y()]
2
h 0
f [; y()],
2
con [ti ; ti+1 ], lo que muestra que el error local del mtodo de Euler es O(h), es decir, son de
orden 1.
Curso 008
PRELIMINAR
- 129 -
7.1.5.
Anlisis Numrico I
Mtodos de Taylor de orden superior
El mtodo de Euler es muy fcil de aplicar pero tambin es muy poco preciso. Podemos
mejorarlo si partimos otra vez del desarrollo por Taylor. Al desarrollar la funcin y(t) en el
intervalo [ti ; ti+1 ] con h = ti+1 ti , tenemos que
y(ti+1 ) = y(ti ) + h y 0 (ti ) +
h2 00
h3
hn (n)
y (ti ) + y 000 (ti ) + . . . +
y (ti ).
2!
3!
n!
Como adems tenemos que

d y(t)
= y 0 (t) = f (t; y), y y(ti ) = yi ,
dt
el desarrollo por Taylor lo podemos escribir de la siguiente manera:
y(ti+1 ) = y(ti ) + h f (ti ; yi ) +
h2 0
h3
hn (n1)
f (ti ; yi ) + f 00 (ti ; yi ) + . . . +
f
(ti ; yi ),
2!
3!
n!
Es decir, podemos armar un esquema para obtener los y(ti+1 ) a partir de un polinomio de Taylor,
calculando las derivadas totales de la funcin f (t; y). El error que se introduce en este esquema
es el primer trmino que dejamos de considerar, que en nuestro caso es
E=
hn+1 (n)
f [; y()] con [ti ; ti+1 ],
(n + 1)!
y como el error local est dado por

eL =
y(ti+1 ) y(ti )
f [ti ; y(ti )];
h
para este caso queda definido como

eL =
hn
f (n) [; y()],
(n + 1)!
con [ti ; ti+1 ]. Estos mtodos se conocen como mtodos de Taylor de orden superior, pues
podemos definir el orden de convergencia igual a n, siempre que al menos f (t; y) Cn1 [a; b].
Podemos ver que el mtodo de Euler es un caso particular del mtodo de Taylor para n = 1.
Tambin podramos armar mtodos de Taylor de orden superior implcitos, aunque de
escasa utilidad, dado que deberamos transformar algebraicamente el algoritmo para obtener una
formulacin explcita.
7.1.6.
Mtodos de Runge-Kutta
Los mtodos de Taylor resultan muy instructivos para entender cmo mejorar nuestras
aproximaciones, pero muy poco prcticos al momento de implementar un algoritmo de clculo.
El principal escollo para esto es la necesidad de calcular las derivadas de y(t) (o de f (t, y)),
algo que no siempre es fcil de hacer. Eso obligara en muchos casos a programar algoritmos
particulares segn el problema que enfrentemos, lo que le quita generalidad.
Un segundo problema est relacionado directamente con la facilidad para obtener las
derivadas de la funcin f (t; y). An cuando se pueda probar que f (t, y) Cn1 [a; b], puede
ser muy complicado obtener las derivadas de mayor orden, perdindose la capacidad de obtener
rpidamente una aproximacin de la solucin buscada.
Es por eso que existen otros mtodos para aproximar la solucin de una ecuacin diferencial que consiguen rdenes de convergencia similares a los de Taylor pero que no requieren la
obtencin de las derivadas de la funcin f (t; y). Son los denominados mtodos de Runge-Kutta.
Para poder construir los mtodos de Runge-Kutta, nos basaremos en el siguiente teorema.
- 130 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Teorema 7.4. Sea f (t; y) Cn+1 D con D = {(t; y)|a t b, c y d}, y sea (t0 ; y0 ) D.
Entonces, para toda (t; y) D, existe [t0 ; t] y [y0 ; y] con
f (t; y) = Pn (t; y) + Rn (t; y),
tal que

f (t0 ; y0 )
f (t0 ; y0 )
+
+ (y y0 )
Pn (t; y) = f (t0 ; y0 ) + (t t0 )
t
y

(t t0 )2 2 f (t0 ; y0 )
2 f (t0 ; y0 )
+
+
(t
t
)(y
y
)
+
0
0
2!
t2
t y

(y y0 )2 2 f (t0 ; y0 )
+
+ ... +
2!
y 2
n
n
X
n
f (t0 ; y0 )
1
(t t0 )nj (y y0 )j nj j ,
+
n!
j
t
y
j=0
y
n+1
X n + 1
1
n+1 f (; )
Rn (t, y) =
(t t0 )n+1j (y y0 )j n+1j j .
(n + 1)!
j
t
y
j=0
A la funcin Pn (t; y) se la denomina polinomio de Taylor de grado n en dos variables

para la funcin f (t; y) alrededor de (t0 ; y0 ), en tanto que Rn (t; y) es el residuo o error asociado
a Pn (t; y).
Esto es necesario pues los mtodos de Runge-Kutta se basan en aproximar el polinomio
de Taylor para una variable mediante polinomios de Taylor de dos variables. (Para ms detalles
de cmo se obtiene esta aproximacin, ver [1].)
Existen varios mtodos de Runge-Kutta que se clasifican segn del orden de convergencia.
Los ms sencillos son los de orden 2, entre los cuales tenemos:
1. Mtodo del punto medio. Est dado por
w0 = y0

h
h
wi+1 = wi + h f ti + ; wi + f ti ; wi ,
2
2
para i = 0; 1; 2; . . . ; n 1.
2. Mtodo de Euler modificado. Est dado por
w0 = y0
wi+1 = wi +
o
hn
f (ti ; wi ) + f [ti + h; wi + hf (ti ; wi )] ,
2
para i = 0; 1; 2; . . . ; n 1.
3. Mtodo mplicito ponderado o de Crank-Nicolson. Est dado por
w0 = y0
wi+1 = wi +

i
hh
f ti ; wi +f ti+1 ; wi+1 ,
2
para i = 0; 1; 2; . . . ; n 1.
Curso 008
PRELIMINAR
- 131 -
Anlisis Numrico I
4. Mtodo de Heun. Est dado por

w0 = y0
wi+1

h
i

2
h
2
f ti ; wi +3f ti + h; wi + h f (ti ; wi ) ,
= wi +
4
3
3
para i = 0; 1; 2; . . . ; n 1.
Paralelamente, los mtodos del punto medio y de Crank-Nicolson pueden obtenerse tambin integrando la funcin f (t; y) en el intervalo [ti ; ti+1 ], aplicando las reglas del rectngulo y
del trapecio respectivamente. As, si partimos de la siguiente expresin
Z ti+1
y(ti+1 ) = y(ti ) +
f (t, y)dt,
ti
y aplicamos la regla del rectngulo para la integral, obtenemos que

h
h
y(ti+1 ) = y(ti ) + h f ti + ; y(ti ) + f ti ; y(ti ) ,
2
2
por lo que la aproximacin podemos escribirla como

h
h
wi+1 = wi + h f ti + ; wi + f (ti ; wi ) .
2
2
De forma anloga, si aplicamos la regla del trapecio tenemos

i
hh
y(ti+1 ) = y(ti ) +
f ti ; y(ti ) + f ti+1 ; y(ti+1 ) ,
2
y, nuestra aproximacin podemos escribirla como
wi+1 = wi +
h
[f (ti ; wi ) + f (ti+1 ; wi+1 )] .
2
Para obtener mtodos de mayor orden de convergencia, debemos aplicar el teorema 7.4.
Con l se obtiene uno de los mtodos ms usados para resolver ecuaciones diferenciales ordinarias,
el de Runge-Kutta de orden 4, cuya formulacin es la siguiente:
w0 = y0
k1 = hf (ti ; wi )

1
h
k2 = hf ti + ; wi + k1
2
2

1
h
k3 = hf ti + ; wi + k2
2
2
k4 = hf ti + h; wi + k3
1
wi+1 = wi + (k1 + 2k2 + 2k3 + k4 ) ,
6
para i = 0; 1; 2; . . . ; n 1.
El mtodo de Runge-Kutta de orden 4 tiene un error local de truncamiento O(h4 ), siempre
que la funcin y(t) tenga al menos cinco derivadas continuas.
r
r
Este mtodo es tan preciso, que programas como el MatLab
y el Mathcad
tienen
r

desarrollados distintas funciones que aplican este mtodo. Por ejemplo, Mathcad cuenta con
la funcin rkfixed(y;x1 ;x2 ;npoints;D) que resuelve ecuaciones diferenciales de orden uno
utilizando dicho mtodo, en la cual y es el valor inicial, x1 y x2 son los extremos del intervalo,
x2 x1
npoints es la cantidad de intervalos, y entonces h =
, y D es la funcin f (x, y) que
npoints
debemos resolver.
- 132 -
PRELIMINAR
Curso 008
Anlisis Numrico I
7.1.7.
Mtodos de paso mltiple
Los mtodos anteriores se basan en obtener los valores siguientes utilizando solamente el
valor anterior, sin tener en cuenta los dems valores ya calculados. Es por eso que se denominan
de paso simple. Pero la pregunta que nos podemos hacer es: si estamos tratando de aproximar
dy
una funcin, tal que se cumpla que
= f (t; y), por qu no utilizar el conjunto de los valores
dt
obtenidos, o al menos un grupo de ellos, para obtener los puntos siguientes.
Esa idea es la que domina a los denominados mtodos de paso mltiple. El mtodo ms
sencillo es el denominado mtodo del salto de rana, cuya expresin es
w0 = y0
wi+1 = wi1 + 2h f (ti ; wi ),
para i = 1; 2; . . . ; n 1. El valor de w1 debemos calcularlo con otro mtodo. Como las aproximaciones que obtenemos por el mtodo del salto de rana son del mismo orden que las que se
obtienen por cualquier mtodo de Runge-Kutta de orden 2, es conveniente aproximar w1 con
alguno de esos mtodos.
Pero existen otros mtodos, muy utilizados, que mejoran la notoriamente la aproximacin
que podemos obtener.
Mtodos de Adams
Los mtodos de Adams son mtodos de paso mltiple muy utilizados. Se dividen en dos
grupos: los mtodos explcitos, o de Adams-Bashforth, y los mtodos implcitos, o de AdamsMoulton.
En ambos casos, la idea es usar los puntos wi ; wi1 ; . . .;wi+1p para obtener el wi+1 ,
en el caso de los mtodos de Adams-Bashforth, en tanto que en los de Adams-Moulton se usan
los wi+1 ; wi ; wi1 ; . . .;wi+2p , donde p es el orden de convergencia. As, un mtodo de AdamsBashforth de orden 2 usa los puntos wi y wi1 , en tanto que un mtodo de Adams-Moulton usa
los puntos wi+1 y wi . Veamos como obtener algunos de estos mtodos.
Para obtener el mtodo de Adams-Bashforth de orden 2 partimos de la expresin
Z ti+1
f (t, y)dt.
y(ti+1 ) = y(ti ) +
ti
Al igual que en el caso de los mtodos de Runge-Kutta de orden dos, armemos un polinomio interpolante, pero en este caso, utilizando el mtodo de Newton de diferencias divididas
regresivas, para aproximar f (t; y). As, nos queda que

f ti ; y(ti ) f ti1 ; y(ti1 )
f (t; y) f ti ; y(ti ) +
(t ti )
t t

i i1

f ti ; y(ti ) +
(t ti ).
h
Al integrar el polinomio interpolante obtenemos

Z ti+1

.
f (t, y)dt h f ti ; y(ti ) + h
2
ti

i
hh
3f ti ; y(ti ) f ti1 ; y(ti1 ) .

2
y si reemplazamos en la expresin inicial, tenemos

i
hh
y(ti+1 ) = y(ti ) +
3f ti ; y(ti ) f ti1 ; y(ti1 ) .
2
Curso 008
PRELIMINAR
- 133 -
Anlisis Numrico I
Como siempre, lo que buscamos es una aproximacin de y(ti+1 ), entonces el mtodo de

Adams-Bashforth de orden 2 queda formulado de la siguiente manera:
h
[3f (ti ; wi ) f (ti1 ; wi1 )] ,
2
para i = 1; 2; . . . ; n 1. Por lo tanto, debemos calcular w1 con algn otro mtodo, por ejemplo,
el de Runge-Kutta de orden 2.
De todos los mtodos que se pueden desarrollar, uno de los mtodos de Adams-Bashforth
ms usados es el de orden 4, cuya expresin es
wi+1 = wi +
h
[55f (ti ; wi ) 59f (ti1 ; wi1 ) + 37f (ti2 ; wi2 ) 9f (ti3 ; wi3 )] ,
24
para i = 3; 4; . . . ; n 1. Nuevamente, debemos hallar w1 ; w2 y w3 con ayuda de otro mtodo. Al
igual que en el mtodo de orden 2, en este caso podemos usar el RK O4.
Para obtener los mtodos de Adams-Moulton, procedemos de forma anloga. Para obtener
el de orden 2, planteemos el siguiente polinomio interpolante para aproximar f (t; y):

f ti+1 ; y(ti+1 ) f ti ; y(ti )
(t ti+1 )
f (t; y) f ti+1 ; y(ti+1 ) +
ti+1 ti

f ti+1 ; y(ti+1 ) f ti ; y(ti )
f ti+1 ; y(ti+1 ) +
(t ti+1 ).
h
Al integrarlo, obtenemos que

Z ti+1

f ti+1 ; y(ti+1 ) f ti ; y(ti )
f (t, y)dt h f ti+1 ; y(ti+1 ) + h
.
2
ti

i
hh
f ti+1 ; y(ti+1 ) + f ti ; y(ti ) .

2
Nuevamente, al reemplazar en la expresin inicial, tenemos

i
hh
f ti+1 ; y(ti+1 ) + f ti ; y(ti ) ,
y(ti+1 ) = y(ti ) +
2
wi+1 = wi +
y como lo que buscamos es una aproximacin de y(ti+1 ), tenemos que

h
[f (ti+1 ; wi+1 ) + f (ti ; wi )] .
2
Resulta interesante ver que el mtodo de Adams-Moulton de orden 2 es el mtodo de CrankNicolson.
Al igual que con Adams-Bashforth, uno de los mtodos ms usados es el de AdamsMoulton de orden 4, cuya expresin es
wi+1 = wi +
h
[9f (ti+1 ; wi+1 ) + 19f (ti ; wi ) 5f (ti1 ; wi1 ) + f (ti2 ; wi2 )] ,
24
para i = 2; 3; . . . ; n 1. Nuevamente, debemos obtener w1 y w2 con ayuda del RK O4.
El uso de los mtodos de Adams-Moulton conlleva la necesidad de reformular la expresin
para convertirla en un mtodo explcito. Como esto no siempre es posible, una forma de aplicarlo
es mediante la combinacin de un mtodo de Adams-Bashforth y uno de Adams-Moulton, ambos
del mismo orden de convergencia. Esta combinacin se conoce como mtodo predictor-corrector
de Adams. Por ejemplo, el mtodo predictor-corrector de orden 2 es el siguiente:
wi+1 = wi +
h
[3f (ti ; wi ) f (ti1 ; wi1 )]
2

h
= wi +
f (ti+1 ; wi+1
) + f (ti ; wi ) ,
2
wi+1
= wi +
wi+1
- 134 -
PRELIMINAR
Curso 008
Anlisis Numrico I
para i = 2; 3; . . . ; n 1 y donde el valor de w1 = w1 debemos obtenerlo usando el mtodo de

Runge-Kutta de orden 2 o resolviendo en forma explcita la segunda ecuacin del mtodo. Uno
de los mtodos ms usados es el predictor-corrector de Adams de orden 4, cuya expresin es:
h
[55f (ti ; wi ) 59f (ti1 ; wi1 ) + 37f (ti2 ; wi2 ) 9f (ti3 ; wi3 )]
24

h
= wi +
9f (ti+1 ; wi+1
) + 19f (ti ; wi ) 5f (ti1 ; wi1 ) + f (ti2 ; wi2 ) ,
24
wi+1
= wi +
wi+1
para i = 4; 5; . . . ; n 1 y donde w1 = w1 , w2 = w3 y w3 = w3 los obtenemos usando RK O4.

En general, suelen ser ms precisos los mtodos de Adams-Moulton que los de AdamsBashforth. El de Adams-Moulton de orden 4 entrega resultados muy parecidos, en precisin, al
mtodo de Runge-Kutta de orden 4. Sin embargo, por una cuestin de sencillez al momento
de programar, los paquetes de software prefieren incluir este ltimo y no el mtodo de AdamsMoulton de orden 4.
7.2.
Ecuaciones diferenciales ordinarias con valores de contorno
7.2.1.
Introduccin
En el punto anterior hemos visto los diferentes mtodos numricos para la resolucin de
ecuaciones diferenciales ordinarias con valores inciales. Estos mtodos son principalmente para
resolver ecuaciones diferenciales de primer orden, tanto lineales como no lineales, y pueden ser
adaptados para ecuaciones de orden superior, siempre que stas sean de valores iniciales. El
planteo corresponde a la ecuacin diferencial expresada como:
dy
= f (t, y), en [a, b] con y(a) = y0 .
dt
El principio que subyace en los mtodo estudiados es que toda curva puede aproximarse si
se conoce la pendiente o la funcin de la misma punto a punto. Como tambin uno conoce el valor
inicial de la funcin, aplicando la idea del cociente incremental, podemos ir obteniendo los valores
siguientes dentro de un intervalo dado. Este es el caso del mtodo de Euler, y de los mtodos de
Runge-Kutta. Por supuesto, es necesario que estas ecuaciones cumplan con ciertas condiciones
que aseguren la convergencia, la estabilidad del mtodo y la unicidad de los resultados, pues de
lo contrario el o los resultados obtenidos no sern confiables.
Cuando en vez de ecuaciones diferenciales de primer orden debemos resolver numricamente ecuaciones diferenciales de orden dos o superior, los mtodos aplicados para el caso
anterior pueden utilizarse casi directamente si la expresin de la ecuacin diferencial es:
dn y
= f (t, y, y 0 , . . . , y (n1) ), en [a, b];
dtn
con las condiciones iniciales:
y(a) = ; y 0 (a) = ; . . . ; y (n1) (a) = ,
podemos aplicar un mtodo como el Runge-Kutta de orden cuatro, pero con algunas transformaciones para poder adaptarlo al problema que debe resolverse. Estas transformaciones requieren
un cambio de variable, como por ejemplo:
0
z1 (t) = y 0 (t); z2 (t) = z10 (t); . . . ; zn (t) = zn1
(t).
Supongamos que tenemos una ecuacin diferencial de orden 2 expresada como:

d2 y
= f (t, y, y 0 ), en [a, b];
dt2
Curso 008
PRELIMINAR
- 135 -
7.2. Ecuaciones diferenciales ordinarias con valores de contorno
Anlisis Numrico I
con las siguientes condiciones iniciales:

y(a) = ; y 0 (a) = .
Nuevamente, para resolver esta ecuacin lo que debe hacerse es transformar la ecuacin
diferencial en un sistema de dos ecuaciones diferenciales de primer orden, por medio de un cambio
de variable, como y 0 = z. Con este cambio de variable, teniendo en cuenta que lo que buscamos es
una aproximacin de y que llamaremos u, por lo que tambin se cumple que u0 = z, el esquema
de resolucin queda:
u0 (t) = z(t)
z 0 (t) = f (t, u, z)
A partir de aqu, se debe resolver el par de ecuaciones en forma simultnea para poder
obtener el valor de u(t) buscado. Si, por ejemplo, aplicamos el mtodo de Euler para resolver las
ecuaciones diferenciales de primer orden, el esquema iterativo queda de la siguiente manera:
ui+1 = ui + h z(t)
zi+1 = zi + h f (ti , ui , zi ),
con el cual obtenemos en cada paso el nuevo valor de u(t) y de ddtu representado por z(t).
En general, las ecuaciones diferenciales de orden dos o superior no son de valores iniciales
sino de valores de contorno o frontera. Es decir, no disponemos de todos los valores para t = a,
sino que tenemos valores para t = a y t = b. Por lo tanto, la ecuacin diferencial est dada por:
d2 y
= f (t, y, y 0 ), en [a, b];
dt2
con las condiciones en los extremos del intervalo:
y(a) = ; y(b) = .
Con estas condiciones no es posible utilizar los mtodos estudiados en forma directa,
como el de Euler o los de Runge-Kutta, an transformando la ecuacin diferencial en un sistema
de ecuaciones diferenciales. En consecuencia, debemos buscar otra forma para aproximar nuestra
ecuacin diferencial y obtener los resultados de la funcin y(t).
Es necesario analizarlo con ms detalle el procedimiento para resolverlas? Como dato
importante, basta mencionar que buena parte de los problemas que debemos resolver los ingenieros, ya sean civiles, mecnicos, electrnicos,etc., estn expresados en trminos de ecuaciones
diferenciales de orden superior. Un ejemplo que suele ser muy usado es el caso de la ecuacin
diferencial de equilibrio para una viga, dada por la expresin:
EI
d4 w
p(x) = 0.
dx4
que requiere de cuatro condiciones de contorno para ser resuelta. Estas condiciones pueden ser:
1. Condiciones de borde esenciales (Dirichlet);
2. Condiciones de borde naturales (Neumann);
3. Una combinacin de ambas.
Por ejemplo, para una viga doblemente empotrada, de longitud L, como se ve en la figura,
las condiciones de borde son:
w(0) = 0; w(L) = 0; w0 (0) = 0; y w0 (L) = 0.
- 136 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Figura 7.1: Viga doblemente empotrada
Este es el tpico caso de condiciones de borde esenciales o forzadas, puesto que las restricciones estn asociadas a los desplazamientos y los giros en los extremos de la viga. Esta
ecuacin no es posible resolverla aplicando en forma directa los mtodos mencionados anteriormente. En consecuencia, para poder aproximar una solucin, debemos buscar alguna forma de
adaptar los mtodos vistos para tener en cuenta estas condiciones de frontera o de contorno.
Veremos a continuacin dos mtodos que pueden usarse para resolver este tipo de ecuaciones diferenciales. Empezaremos por el ms sencillo, el mtodo del disparo lineal, que hace uso
de los mtodos ya estudiados.
7.2.2.
Mtodo del tiro o disparo lineal

Supongamos que tenemos la siguiente ecuacin diferencial:
y 00 = f (t, y), t [0; 1];
que debe cumplir con las condiciones:

y(0) = y0 ; y(1) = y1 .
Como vemos, no tenemos dos condiciones iniciales, sino una para el valor inicial y otra
para el valor final que debe tomar la funcin buscada.
Para encarar el problema haremos una modificacin. Resolveremos el siguiente problema
de valores iniciales, suponiendo que lo que buscamos es una aproximacin a y(t) que llamaremos
u(ti ). Entonces nuestro sistema quedar de la siguiente forma:
u00 = f (t, u), u1 (0) = y0 y u01 (0) = 1 .
donde 1 es el primer ensayo para u01 (0). Apliquemos para ello cualquiera de los mtodos vistos
anteriormente, por ejemplo el de Euler. Con l obtendremos un valor para u1 (1) igual a 1 , que
seguramente ser distinto a y1 .
Nuevamente, resolvamos con Euler un sistema similar pero proponiendo que u2 (0) = y0
0
y u2 (0) = 2 . Obtendremos otro valor para u(1), es decir, un u2 (1) = 2 , probablemente distinto
a y1 .
En consecuencia, tendremos dos aproximaciones de y1 . Para continuar, vamos a suponer
que existe una relacin lineal entre u(ti ), u1 (ti ) y u2 (ti ). Esta relacin lineal estar dada por:
u(ti ) u1 (ti )
u2 (ti ) y0
=
.
y1 1
2 y0
Para calcular u(t) debemos despejarla de la expresin anterior. As obtenemos:
u(ti ) = u1 (ti ) +
y1 1
[u2 (ti ) y0 ] .
2 y0
Para entender como opera el mtodo, veamos un ejemplo prctico, resolviendo una
ecuacin diferencial de orden 2.
Curso 008
PRELIMINAR
- 137 -
Anlisis Numrico I
Ejemplo
Resolver la siguiente ecuacin diferencial ordinaria con valores de frontera, aplicando el
mtodo de Euler:
y 00 = 4(y x); 0 x 1;
con los valores de contorno:
y(0) = 0; y(1) = 2.
Para resolver la ecuacin por el mtodo de Euler plantearemos primero que y 0 (x) = z(x),
con lo que tendremos que la ecuacin diferencial se transforma en:
y 0 (x) = z(x)
z 0 (x) = 4(y x)
Si aplicamos el mtodo de Euler, y hacemos ui = y(xi ) tendremos las siguientes ecuaciones:
ui+1 = ui + h zi
zi+1 = zi + h 4(ui xi )
Como vemos, debemos resolver dos ecuaciones para obtener el valor de ui+1 . Por ello,
en primer trmino, vamos a resolver el sistema obteniendo, primero, valores para unas funciones
v1 (x) y adoptando las siguientes condiciones iniciales:
v1 (0) = 0; z1 (0) = 0
por lo que el sistema a resolver ser:
v1i+1
= v1i + h z1i
z1i+1
= z1i + h 4(v1i xi )
En segundo trmino, haremos lo mismo pero para las funciones v2 (x) y z2 (x) = v20 (x)
con los valores de contorno levemente distintos. Estos son:
v2 (0) = 0; z2 (0) = 1,
y el sistema a resolver ser:
v2i+1
= v2i + h z2i
z2i+1
= z2i + h 4(v2i xi )
Con los valores para cada una de las soluciones y por cada iteracin, calcularemos los
valores definitivos mediante la expresin:
ui = v1i +
y(1) v1 (1)
[v2 y(0)]
v2 (1) y(0) i
En la tabla 7.1 podemos ver los resultados obtenidos.

En la penltima columna podemos ver el valor exacto de la funcin buscada, dado que
la solucin analtica de la ecuacin diferencial es:
1 2x

y(x) = e2 e4 1
e e2x + x.
Los valores de u(xi ) obtenidos no son muy precisos, dado que el mtodo utilizado para
resolver el sistema de ecuaciones es el de Euler, pero igualmente sirven como demostracin de la
efectividad al aplicar este mtodo. Podemos ver que la ltima columna muestra el error absoluto
entre el valor obtenido numricamente y el valor exacto. Observemos que el error cometido es,
del orden de 101 , un error razonable para este mtodo. (Recordemos que el mtodo de Euler
tien un error O(h).)
- 138 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Tabla 7.1: Resultados obtenidos aplicando el mtodo de Euler

xi
0, 00
0, 10
0, 20
0, 30
0, 40
0, 50
0, 60
0, 70
0, 80
0, 90
1, 00
7.2.3.
z1,i
0, 000
0, 000
0, 040
0, 120
0, 242
0, 408
0, 624
0, 896
1, 234
1, 647
2, 150
v1,i
0, 000
0, 000
0, 000
0, 004
0, 016
0, 040
0, 081
0, 143
0, 233
0, 356
0, 521
z2,i
1, 000
1, 000
1, 000
1, 000
1, 000
1, 000
1, 000
1, 000
1, 000
1, 000
1, 000
v2,i
0, 000
0, 100
0, 200
0, 300
0, 400
0, 500
0, 600
0, 700
0, 800
0, 900
1, 000
ui
0, 000
0, 252
0, 504
0, 752
0, 992
1, 220
1, 432
1, 621
1, 784
1, 913
2, 000
y(xi )
0, 000
0, 156
0, 313
0, 476
0, 645
0, 824
1, 016
1, 225
1, 455
1, 711
2, 000
e
0, 0
9, 7 102
1, 9 101
2, 8 101
3, 5 101
4, 0 101
4, 2 101
4, 0 101
3, 3 101
2, 0 101
0, 0
Diferencias finitas
En el punto anterior hemos resuelto una ecuacin diferencial lineal con condiciones de
contorno utilizando un mtodo de resolucin que transforma las condiciones de contorno en
condiciones iniciales. Sin embargo, este mtodo tiene como desventaja que es inestable en ciertas
ocasiones. Por lo que su utilizacin se ve reducida generalmente a unos pocos casos o problemas.
Uno de los mtodos ms aplicados para aproximar una solucin de ecuaciones diferenciales
de orden mayor o igual a dos, es el que reemplaza las derivadas por diferencias finitas mediante
un cociente de diferencias, tal como vimos en diferenciacin numrica. La aplicacin de estas
diferencias finitas generan un sistema de ecuaciones lineales del tipo Ax = B, sistema que puede
resolverse mediante alguno de los mtodos ya vistos. Est claro que estamos limitados en la
eleccin de nuestro intervalo h, que no puede ser muy chico. Veamos en qu consiste el mtodo,
aplicndolo a nuestro ejemplo anterior.
Para aproximar las derivadas, tomaremos el mtodo de las diferencias centradas, que permiten una mejor aproximacin de las derivadas. Para empezar, desarrollemos y(xi+1 ) y y(xi1 )
por Taylor hasta el cuarto trmino, por lo que tendremos:
y(xi+1 ) = y(xi + h) = y(xi ) + hy 0 (xi ) +
h2 00
h3
h4
y (xi ) + y 000 (xi ) + y (iv) (i+ ),
2
6
24
para alguna i+ en (xi ; xi+1 ), y

y(xi1 ) = y(xi h) = y(xi ) hy 0 (xi ) +
h3
h4
h2 00
y (xi ) y 000 (xi ) + y (iv) (i ),
2
6
24
para alguna i en (xi1 ; xi ). Dems est decir que se supone que y(x) C 4 [xi1 ; xi+1 ]. Si
sumamos ambas expresiones y despejamos y 00 (xi ), tendremos:
y 00 (xi ) =
i
1
h2 h (iv) +
(iv)
[y(x
)
2y(x
)
+
y(x
)]
y
(
)
+
y
(
)
.
i+1
i
i1
i
i
h2
24
Si aplicamos el teorema del valor medio, podemos simplificar la expresin a:

y 00 (xi ) =
1
h2 (iv)
[y(x
)
2y(x
)
+
y(x
)]
y (i ),
i+1
i
i1
h2
12
para alguna i en (xi1 ; xi+1 ).
Curso 008
PRELIMINAR
- 139 -
Anlisis Numrico I
Reemplacemos esta ltima expresin en nuestra ecuacin diferencial:

h2 (iv)
1
[y(x
)
2y(x
)
+
y(x
)]
y (i ) = 4 [y(xi ) xi ] .
i+1
i
i1
h2
|12 {z }
O(h2 )
De esta manera, nuestra ecuacin diferencial se transforma en:

[y(xi+1 ) 2y(xi ) + y(xi1 )] = 4h2 [y(xi ) xi ] ,
y desarrollando algebraicamente, obtenemos:

y(xi1 ) 2(1 + 2h2 )y(xi ) + y(xi+1 ) = 4h2 xi ,
por lo tanto, para cada i tenemos una ecuacin lineal. Definamos, entonces, el intervalo o paso
h como ba
N siendo N > 0; de esta manera obtendremos N intervalos para i [0; N ]. Con i y h
podemos armar nuestro sistema de ecuaciones para i [1; N 1]. La matriz resultante ser:
1 2(1 + 2h2 )
1
0
0
...
0
0
1
2(1 + 2h2 ) 1
0
...
0
.. .
..
..
..
..
..
A = ...
.
.
.
.
.
.
2
0
...
0
1 2(1 + 2h )
1
0
0
...
0
0
1
2(1 + 2h2 ) 1
Si hacemos que yi = y(xi ) tendremos que nuestras incgnitas son:
y0
y1
..
y = . .
yN 1
yN
Nuestro vector de trminos independientes ser:
4h2 x1
4h2 x2
..
B=
.
.
4h2 xN 2
4h2 xN 1
Pero hemos armado un sistema con N 2 filas y N incgnitas yi . Para completar el
sistema debemos recordar que y0 = y yN = , por lo que nuestro sistema de ecuaciones
lineales quedar como:
1
0
0
0
0
...
0
y0
y1 4h2 x1
1 2(1 + 2h2 )
1
0
0
...
0
0
1
2(1 + 2h2 ) 1
0
...
0
y2 4h x2
..
..
.
..
..
..
..
..
..
.
.
.. =
.
.
.
.
.
.
.
2
2
...
0
1 2(1 + 2h )
1
0 yN 2 4h xN 2
0
...
0
0
1
2(1 + 2h2 ) 1 yN 1 4h2 xN 1
yN
0
0
0
0
...
0
1
Armemos el sistema definitivo con x [0; 1], y(0) = y0 = 0, y(1) = yN = 2 y N = 10.
Con estos parmetros tendremos que h = 10
10 = 0, 1. Entonces, en la matriz A tendremos el
coeficiente (adems de 1):

2 1 + 2(0, 1)2 = 2 (1 + 0, 02) = 2, 04;
- 140 -
PRELIMINAR
Curso 008
Anlisis Numrico I
y en el vector de trminos independientes:

4(0 + 0, 1)2 0, 1i = 4(0, 1)2 0, 1i = i 4(0, 1)3 ;
con i [1, N 1]. El sistema definitivo quedar con la matriz de coeficientes:
1
0
0
0
0
0
0
0
0
0
1 2, 04
1
0
0
0
0
0
0
0
0
1
2, 04
1
0
0
0
0
0
0
0
0
1
2, 04
1
0
0
0
0
0
0
0
1
2, 04
1
0
0
0
0
0
0
0
0
1
2, 04
1
0
0
0
A = 0
0
0
0
0
0
1
2,
04
1
0
0
0
0
0
0
0
0
1
2, 04
1
0
0
0
0
0
0
0
0
1
2, 04
1
0
0
0
0
0
0
0
0
1
2, 04
0
0
0
0
0
0
0
0
0
0
0
0
0 ,
1
1
y con el vector de trminos independientes:
0
0, 004
0, 008
0, 012
0, 016
B = 0, 020 .
0, 024
0, 028
0, 032
0, 036
2
Al resolver el sistema de ecuaciones por algn mtodo numrico conocido, obtenemos el

siguiente vector solucin:
0, 000
0, 156
0, 313
0, 476
0, 645
y = 0, 824 .
1, 017
1, 225
1, 455
1, 711
2, 000
Si lo comparamos con el vector y obtenido con el mtodo de Euler, podemos observar
que la solucin por diferencias finitas es mucho ms precisa, ya que los y obtenidos son iguales a
los hallados por aplicacin de la solucin analtica.
7.3.
Mtodo de los elementos finitos
A completar en el futuro. Como gua, ver en [1], El mtodo de Rayleigh-Ritz, que es

la base del mtodo, en el captulo Problemas con valor en la frontera para ecuaciones
diferenciales ordinarias, y Una introduccin al mtodo de los elementos finitos, en el captulo
Soluciones numricas de ecuaciones diferenciales en derivadas parciales.
Curso 008
PRELIMINAR
- 141 -
Anlisis Numrico I
7.4. Notas finales
7.4.
Notas finales
Casi podra decirse que todos los problemas que debe enfrentar un ingeniero pueden
formularse mediante ecuauciones diferenciales. Desde el anlisis estructural hasta el diseo de
un avin de pasajeros, las ecuaciones diferenciales intervenienen en forma explcitas (deben ser
resueltas) o e forma implcita (se aplican soluciones anliticas de dichas ecuaciones).
Hasta la mitad del siglo XX, muchas de las limitaciones en los aspectos ingenieriles estaban dados por las pocas soluciones analticas que se podan obtener de muchas de las ecuaciones
diferenciales, y en cosencuencia, se dependa de los ensayos en modelos fsicos o en prototipos.
Con el desarrollo de las computadoras, a partir de los aos 50, y principalmente, con la aparicin
de las computadoras personales hace 25 aos, obtener soluciones aproximadas de las ecuaciones
diferenciales dej de ser un escollo en cuanto a timepo de clculo. Prcticamente todas las disciplinas cientficas y tecnolgicas basan sus soluciones en la aplicacin de mtodos numricos.
Dentro del conjunto de mtodos numricos para resolver ecuaciones diferenciales, los
mtodos de las diferencias finitas y de los elementos finitos, en particular este ltimo, son los
ms usados para encarar soluciones aproximadas. Y en los ltimos aos, la gran capacidad de
clculo de las computadoras han permitido adentrarse en la resolucin aproximada de problemas
con ecuaciones diferenciales no lineales, permitiendo el estudio de muchos fenmenos que antes
se consideraban como imposibles de abordar. Basta con ver el avance en el campo de los
estudios climticos, el comportamiento de los ros, el avance en la hidrulica martima, etc., que
han reemplazado el uso de modelos fsicos (muy caros y lerdos) por modelos matemticos (ms
baratos y rpidos).
- 142 -
PRELIMINAR
Curso 008
Anlisis Numrico I
Bibliografa
Bibliografa
[1] Burden, R.L. & Faires, J.D. Anlisis Numrico. Sexta Edicin, International Thomson, 1998.
[2] Gavurin, M.K. Conferencias sobre los mtodos de clculo. Editorial Mir, 1973.
[3] Goldberg, D. What every Computer Scientist should know about Floating-Point Arithmetic.
ACM Computing Surveys, March 1991.
[4] Gonzlez, H. Anlisis Numrico, primer curso. Primera Edicin, Nueva Librera, 2002.
[5] Higham, N.J. Accuracy and Stability of Numerical Algorithms. SIAM, 1996.
[6] Higham, N.J. How accurate is Gaussian Elimination. Numerical Analysis 1989, Proceedings
of the 13th Dundee Conference, volume 228 of Pitman research Notes in Mathematics.1990.
[7] Higham, N. J. The numerical stability of barycentric Lagrange interpolation. IMA Journal
of Numerical Analysis. 2004.
[8] Marshall, G. Solucin numrica de ecuaciones diferenciales, Tomo I. Editorial Revert S.A.,
1985.
[9] Saad, Y. Iterative Methods for Sparse Linear Systems. Second Edition, 2000.
[10] Samarski, A.A. Introduccin a los mtodos numricos. Editorial Mir, 1986.
[11] Shewchuk, J. R. An introduction to the Conjugate Gradient Method without the agonizing
pain. Edition 1 41 . School of Computer Science. Carnegie Mellon University.
[12] Trefethen, L.N. The Definition of Numerical Analysis. SIAM News. November 1992.
[13] Trefethen, L.N. Numerical Analysis. Princeton Companion to Mathematics, to appear.
[14] Trefethen, L.N. & Berrut, J.P. Barycentric Lagrange Interpolation. 2004.
[15] Zill, D. G. Ecuaciones diferenciales con aplicaciones de modelado. Sptima Edicin, International Thomson, 2002.
Curso 008
PRELIMINAR
- 143 -

7512-Resumen de Las Clases

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

7512-Resumen de Las Clases

Cargado por

Copyright:

Formatos disponibles

RESUMEN DE LAS CLASES DE

1. Errores en los mtodos numricos

2. Sistemas de Ecuaciones Lineales

5. Mejor aproximacin y ajuste de funciones

6. Diferenciacin e integracin numrica

7. Ecuaciones diferenciales ordinarias

1. Errores en los mtodos numricos

Errores en los mtodos numricos

Una definicin de Anlisis Numrico

Es usual que el anlisis numrico est asociado estrictamente a la siguiente definicin

1.2. El concepto y las fuentes de error

El anlisis numrico es la rama de la matemtica que se encarga de disear algoritmos

El concepto y las fuentes de error

Tal como dijimos en la definicin de anlisis numrico, su objetivo principal no es analizar

1. Errores en los mtodos numricos

obtener los polinomios es:

El propio Lagrange adverta en su poca, que su mtodo no era totamente confiable,

La palabra error suele llevar a interpretaciones confusas segn quien la exprese. En el

1.3. Error absoluto y error relativo

Error de redondeo/corte: Es el error debido estrictamente a la representacin numrica

Error absoluto y error relativo

1. Errores en los mtodos numricos

Resulta, entonces, ms conveniente definirlo como:

Propiedades de los algoritmos

1.4. Propiedades de los algoritmos

1. Errores en los mtodos numricos

Figura 1.1: Curvas de las distintas funciones.

1.4. Propiedades de los algoritmos

Tabla 1.1: Clculo de los yi

1. Errores en los mtodos numricos

Antes de analizar el error de redondeo, veremos la manera de representar un nmero segn

Distinto sera el caso si se usara base 3. Entonces

sera igual a 1,1; una representacin exacta.

1. Errores en los mtodos numricos

momento libre de restricciones el exponente e. Entonces, tendremos lo suguiente:

e ignorar los restantes di para i > t + 1, o aplicar

Este error surge de aproximar procesos continuos mediante procedimientos discretos o

Entonces podemos despejar f 0 (x0 ), que resulta ser:

Si nuestro algoritmo para aproximar f 0 (x0 ) es:

1. Errores en los mtodos numricos

f (0, 55) f (0, 45)

En la tabla 1.2 podemos ver los resultados obtenidos para distintos h.

Figura 1.2: Evolucin del error del algoritmo.

Errores por overflow y underflow

1. Errores en los mtodos numricos

Propagacin del error inherente

T X X es despreciable, con lo que nos queda:

que por analoga a exi podemos expresar como:

1.6. Propagacin de errores

2. Producto: En este caso tenemos y (x1 ; x2 ) = x1 x2 , entonces:

Propagacin del error de redondeo

con |k | , y donde los Fi,k son los factores de amplificacin.

Propagacin de los errores inherentes y de redondeo

Como adems tendremos P (X) en vez de Y (X), entonces:

y el error relativo ser:

1. Errores en los mtodos numricos

Si suponemos que erxj r, entonces, tendremos:

que ser el error relativo total.

Una forma de obtener los coeficientes Cp y Te es mediante la grfica de proceso. sta

que es el mismo resultado obtendido antes para la suma.

1.8. Perturbaciones experimentales

Figura 1.3: Suma.

Figura 1.4: Producto.

Supongamos que queremos estudiar la condicin o la estabilidad de un algoritmo con miles

con |k | , y donde los Fi,k son los factores de amplificacin.