Está en la página 1de 119

1

MATEMÁTICAS ESPECIALES

Métodos Numéricos
Segunda parte
Profesor: Luis Alberto Díaz

Facultad de Ingeniería
Departamento de Ingeniería Química
UNIVERSIDAD DE ANTIOQUIA

2
SOLUCIÓN DE ECUACIONES LINEALES
SIMULTÁNEAS

3
Introducción

Los métodos que se discutirán en este curso para solucionar


este problema son:

Métodos directos: Mediante transformaciones matemáticas


modifican el sistema de ecuaciones original en un sistema de
ecuaciones equivalente (con la misma solución del original) que
puede resolverse secuencialmente (se utiliza una ecuación a la
vez para calcular una variable desconocida a la vez).
Eliminación Gaussiana
Descomposición LU
Métodos iterativos: A partir de un estimativo inicial X[0] de la
solución X* del sistema, se calculan aproximaciones sucesivas
X[1], X[2] , X[3] ,…, hasta encontrar una lo suficientemente cerca
de la solución X*.
Jacobi
Gauss-Seidel

4
Jacobi/Gauss Seidel

El método de Jacobi y Gauss Seidel está basado en la


siguiente transformación [Ilustración para un sistema 4x4]:
Si se toma el sistema original y se despeja una variable de
cada ecuación:
a11 ⋅ x1 + a12 ⋅ x2 + a13 ⋅ x3 + a14 ⋅ x 4 = b1
a21 ⋅ x1 + a22 ⋅ x2 + a23 ⋅ x3 + a24 ⋅ x 4 = b2
a11 a12 a13 a14   x1   b1  a31 ⋅ x1 + a32 ⋅ x2 + a33 ⋅ x3 + a34 ⋅ x 4 = b3
a a22 a23 a24   x 2  b2  a41 ⋅ x1 + a42 ⋅ x2 + a43 ⋅ x3 + a44 ⋅ x 4 = b4
 21 ⋅ =
a31 a32 a33 a34   x3  b3  x1 = − (a12 ⋅ x2 + a13 ⋅ x3 + a14 ⋅ x 4 ) a11 + b1 a11
     
a41 a42 a43 a44   x 4  b4  x 2 = − (a21 ⋅ x1 + a23 ⋅ x3 + a24 ⋅ x 4 ) a22 + b2 a22
x3 = − (a31 ⋅ x1 + a32 ⋅ x 2 + a34 ⋅ x 4 ) a33 + b3 a33
x 4 = − (a41 ⋅ x1 + a42 ⋅ x2 + a43 ⋅ x3 ) a44 + b4 a44

En el método de Jacobi, las nuevas aproximaciones se


calculan a partir de un mismo conjunto de valores
precedentes. En el método de Gauss-Seidel se tiene en cuenta
que para calcular cada variable se considera la información
más reciente de cada variable.

5
5
Jacobi/Gauss Seidel

La característica principal del método de Gauss-Seidel es


que utiliza los valores más actualizados de las variables
disponibles:
 Fórmulas recurrente s del Método Gauss - Seidel :
 [k ]
( [k −1] [k −1]
 x1 = − a12 ⋅ x 2 + a13 ⋅ x3 + a14 ⋅ x 4
[k −1]
)
a11 + b1 a11

 2 21 (
 x [k ] = − a ⋅ x [k ] + a ⋅ x [k −1] + a ⋅ x [k −1] a + b a
1 23 3 24 4 ) 22 2 22

Sistema de ecuaciones transforma do


[ ]
( [ ] [
 x3 = − a31 ⋅ x1 + a32 ⋅ x2 + a34 ⋅ x 4
k

 [k ]
k k ] [k − 1]
) a33 + b3 a33
x1 = − (a12 ⋅ x2 + a13 ⋅ x3 + a14 ⋅ x 4 ) a11 + b1 a11 ( [k ] [k ]
 x 4 = − a41 ⋅ x1 + a42 ⋅ x2 + a43 ⋅ x3 a44 + b4 a44
[k ]
)

x2 = − (a21 ⋅ x1 + a23 ⋅ x3 + a24 ⋅ x 4 ) a22 + b2 a22 ⇒ 
x3 = − (a31 ⋅ x1 + a32 ⋅ x 2 + a34 ⋅ x 4 ) a33 + b3 a33  Fórmulas recurrente s del Método Jaccobi :

x 4 = − (a41 ⋅ x1 + a42 ⋅ x2 + a43 ⋅ x3 ) a44 + b4 a44 ( )
 x1[k ] = − a12 ⋅ x 2[k −1] + a13 ⋅ x3[k −1] + a14 ⋅ x 4[k −1] a11 + b1 a11
 [k ]
( [k −1] [k −1]
 x 2 = − a21 ⋅ x1 + a23 ⋅ x3 + a24 ⋅ x 4
[k −1]
)
a22 + b2 a22
 [k ]
( [k −1]
 x3 = − a31 ⋅ x1 + a32 ⋅ x2 + a34 ⋅ x 4
[k −1] [k −1]
)
a33 + b3 a33

 4 41 (
 x [k ] = − a ⋅ x [k −1] + a ⋅ x [k −1] + a ⋅ x [k −1] a + b a
1 42 2 43 3 )
44 4 44

6
Jacobi/Gauss Seidel

En el método de Gauss Seidel se calcula el valor actualizado de


cada variable (nueva iteración) teniendo en cuenta la información
más actualizada disponible con respecto a las otras variables.

Criterio de paro: Se afirma que se está lo suficientemente cerca de


la solución y se detienen los cálculos cuando se cumple alguna de
las siguientes condiciones:

xi[k ] − x i[k −1]


≤ εx con i = 1,.., n ó A ⋅ X [k ] − B ≤ ε R
x i[k ]
 Tolerancia asociada al cambio relativo 
ε x =  
 de las variables. 
Donde  Tolerancia asociada a la norma del vector 
 
ε R =  residuo : raiz cuadrada de la suma de los caudrados 
 de los residuos de las ecuaciones. 
 

7
Jacobi/Gauss Seidel

Características de convergencia: Se dice que un método


iterativo es convergente cuando la serie de soluciones que
genera X[1], X[2], X[3], … se va acercando cada vez más a la
solución X*. Para que el método de Jacobi/Gauss-Seidel sea
convergente:
Condición suficiente pero no necesaria: La matriz “A” debe ser
diagonalmente dominante; es decir, que en cada fila el valor
absoluto del coeficiente en la diagonal principal es superior a la
suma de los valores absolutos de los demás coeficientes en ella.
n
aii > ∑ aij
i =1
j ≠i

Condición necesaria y suficiente: El valor absoluto de todos los


valores propios de “C” es menor o igual 1.
 Vector que contiene los 
λi ≤ 1 , Donde λ =  
 valores propios de C 

8
Jacobi/Gauss Seidel

EJEMPLO 1: Determine si estas matrices son o no diagonalmente


dominantes

8 1 − 2 − 3
 − 1 − 10 2 5 
A=  Es diagonalmente dominante
 1 − 6 12 − 3
 
 − 3 2 3 − 9 
8 1 − 2 − 3
−1 6 2 5  No es diagonalmente dominante
A= 
 1 − 6 12 − 3
 
 − 3 2 3 − 9 

9
Jacobi/Gauss Seidel

EJEMPLO 2: Resuelva el sistema caracterizado por

Veamos:
− 5 0 12 80  - No es diagonalmente dominante
 4 − 1 − 1 − 2 - Elementos con mayor magnitud
  en cada fila.
 6 8 0 45  - Puede transformarse en un
sistema equivalente y
diagonalmente dominante
intercambiando filas. También se
pueden intercambiar columnas
 4 − 1 − 1 − 2 pero esto cambia el orden de las
6 8 0 45  variables, por lo que se debe tener
cuidado a la hora de presentar los
  resultados.
− 5 0 12 80  - Cambiando únicamente las filas
- Matriz diagonalmente dominante

10
Jacobi/Gauss Seidel

EJEMPLO 2:
Despejando una variable de cada ecuación
x1 = ( x 2 + x3 − 2) / 4
x 2 = ( 45 − 6 ⋅ x1 ) / 8
x3 = (80 + 5 ⋅ x1 ) / 12
Suponiendo como valores iniciales X[0]=[0 0 0]T

[1] [0 ] [0 ]
x1 = ( x 2 + x3 − 2) / 4 = −0.5 x1[2 ] = ( x 2[1] + x3[1] − 2) / 4 = 2.6146
x 2[1] = ( 45 − 6 ⋅ x1[1] ) / 8 = 6.0 x 2[2 ] = ( 45 − 6 ⋅ x1[2 ] ) / 8 = 3.6641
x3[1] = (80 + 5 ⋅ x1[1] ) / 12 = 6.4583 x3[2 ] = (80 + 5 ⋅ x1[2 ] ) / 12 = 7.7561

x1[3 ] = ( x 2[2 ] + x3[2 ] − 2) / 4 = 2.3550 x1[4 ] = ( x 2[3 ] + x3[3 ] − 2) / 4 = 2.3767


x 2[3 ] = ( 45 − 6 ⋅ x1[3 ] ) / 8 = 3.8587 x 2[4 ] = ( 45 − 6 ⋅ x1[4 ] ) / 8 = 3.8425
x3[3 ] = (80 + 5 ⋅ x1[3 ] ) / 12 = 7.6479 x3[4 ] = (80 + 5 ⋅ x1[4 ] ) / 12 = 7.6569

11
Jacobi/Gauss Seidel

EJEMPLO 2:

Resultados numéricos teniendo en cuenta un εR=1x10-8.

RESULTADOS NUMÉRICOS
[k]
k X //A.X-B//
0 0.00000000 0.00000000 0.00000000 91.8095856
1 -0.5 6 6.45833333 12.4583333
2 2.61458333 3.66406250 7.75607639 1.03819444
3 2.35503472 3.85872396 7.64793113 0.0865162
4 2.37666377 3.84250217 7.65694324 0.00720968
5 2.37486135 3.84385399 7.65619223 0.00060081
6 2.37501155 3.84374133 7.65625481 5.0067E-05
7 2.37499904 3.84375072 7.65624960 4.1723E-06
8 2.37500008 3.84374994 7.65625003 3.4769E-07
9 2.37499999 3.84375001 7.65625000 2.8974E-08
10 2.37500000 3.84375000 7.65625000 2.4145E-09

12
Ejemplo aplicado

EJEMPLO APLICADO: El gráfico que se muestra a


continuación representa una red de tuberías.

1 2 8

3 5 9
10

4 6 11 15

7
12 16
13

14 17

Considerando que por el sistema fluye agua a una


temperatura constante y que para cada divisor, el flujo de
sus corrientes de salida es el mismo, el sistema de
ecuaciones que relaciona los flujos de las corrientes se
presenta a continuación.

13
Ejemplo aplicado

EJEMPLO APLICADO:

Balances de masa en los nodos Relaciones en los divisores


F1 - (F2 + F3 ) = 0 F2 − F3 = 0
(F3 + F4 ) - (F5 + F6 + F7 ) = 0 F5 − F6 = 0 , F6 − F7 = 0
(F2 + F5 ) - (F8 + F9 + F10 ) = 0 F8 − F9 = 0 , F9 − F10 = 0
(F6 + F10 ) - (F11 + F12 ) = 0 F11 − F12 = 0
(F7 + F12 ) - (F13 + F14 ) = 0 F13 − F14 = 0
(F9 + F11 + F13 ) - (F15 + F16 ) = 0 F15 − F16 = 0
(F14 + F16 ) - (F17 ) = 0

Si F1[m3/h]=100, y F4[m3/h]=400, encuentre los flujos en


las demás corrientes.

Considerando las especificaciones, el sistema de ecuaciones


está dado por:

14
Ejemplo aplicado

EJEMPLO APLICADO:
Balances de masa en los nodos Relaciones en los divisores
F3 = F1 - F2 F2 = F3
F7 = F3 + F4 - F5 − F6 F5 = F6
F10 = F2 + F5 - F8 − F9 F6 = F7
F12 = F6 + F10 - F11 F8 = F9
F14 = F7 + F12 - F13 F9 = F10
F16 = F9 + F11 + F13 - F15 F11 = F12
F17 = F14 + F16 F13 = F14
F15 = F16
-1 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 F2 -100 F2 50
0 1 -1 -1 -1 0 0 0 0 0 0 0 0 0 0 F3 -400 F3 50
1 0 1 0 0 -1 -1 -1 0 0 0 0 0 0 0 F5 0 F5 150
0 0 0 1 0 0 0 1 -1 -1 0 0 0 0 0 F6 0 F6 150
0 0 0 0 1 0 0 0 0 1 -1 -1 0 0 0 F7 0 F7 150
0 0 0 0 0 0 1 0 1 0 1 0 -1 -1 0 F8 0 F8 66.67
0 0 0 0 0 0 0 0 0 0 0 1 0 1 -1 F9 0 F9 66.67
1 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 * F10 = 0 ==> F10 = 66.67
0 0 1 -1 0 0 0 0 0 0 0 0 0 0 0 F11 0 F11 108.3
0 0 0 1 -1 0 0 0 0 0 0 0 0 0 0 F12 0 F12 108.3
0 0 0 0 0 1 -1 0 0 0 0 0 0 0 0 F13 0 F13 129.2
0 0 0 0 0 0 1 -1 0 0 0 0 0 0 0 F14 0 F14 129.2
0 0 0 0 0 0 0 0 1 -1 0 0 0 0 0 F15 0 F15 152.1
0 0 0 0 0 0 0 0 0 0 1 -1 0 0 0 F16 0 F16 152.1
0 0 0 0 0 0 0 0 0 0 0 0 1 -1 0 F17 0 F17 281.3

15
SOLUCIÓN DE ECUACIONES NO LINEALES
SIMULTÁNEAS
Newton

Newton se fundamenta en una aproximación funcional de F(X)


a una serie de Taylor de primer orden alrededor de un
estimativo X[k]:

F (X ) ≅ F X ( [k ]
) +
( ) ⋅ (X − X [ ] )
 ∂F X
[k ]
k
Donde :
(
∂F X [k ]) (
= J F X [k ] ) X = X [k ]
 ∂X  ∂X

De esta forma, en lugar de tratar de resolver el problema F(X)=0,


se trata de resolver el problema aproximado:

( ) ( )(
F X [k ] + J F X [k ] ⋅ X − X [k ] ≅ 0 ) X ≅ X [k ] − J F
−1
( X [ ] ) ⋅ F (X [ ] )
k k

Esto da lugar a la siguiente fórmula recurrente aproximada para el


método de Newton puro:

X [k +1] = X [k ] − J F
−1
( X [ ] ) ⋅ F (X [ ] )
k k
( )( )
J F X [k ] ⋅ X [k +1] − X [k ] = −F X [k ] ( )

17
Newton

Fórmulas recurrentes del método de Newton.

X [k +1] = X [k ] − J F
−1
( X [ ] )⋅ F ( X [ ] )
k k

 ∂f1 ( X ) ∂f1 ( X ) ∂f1 ( X ) 


 ∂x L
∂x2 ∂xn 
 
 ∂f 2 ( X ) ∂f 2 ( X ) ∂f 2 ( X ) 
1

Donde (
J F X [k ] ) =  ∂x1 ∂x2
L
∂xn 
 M M O M 
 ∂f n ( X ) ∂f n ( X ) ∂f n ( X ) 
 L 
 ∂x1 ∂x2 ∂xn  X = X [k ]

(
F X [k ] ≤ ε F )
Criterio de paro:  Tolerancia asociada a 
Donde ε F =  
 la magnitud de F (X). 

18
Newton

En forma gráfica el método de Newton para una variable:

f(x) y=f(x[0])+f’(x[0]).(x-x[0]) x[1]=x[0]-f(x[0])/f’(x[0])

y=f(x[1])+f’(x[1]).(x-x[1]) x[2]=x[1]-
f(x[1])/f’(x[1])

x*

x[0] x[1] x[2] x[3] x

19
Newton

Existen casos en los que el método de Newton no converge.


Para una variable, algunos de estos casos son:

20
Newton

Características del método:

Ventaja: Bastante rápido, puede mostrarse que tiene velocidad de


convergencia cuadrática.
Desventajas: Requiere derivadas e inversión de matrices. Converge
únicamente si el punto inicial X[0] está suficientemente cerca de la
solución. En otras palabras, posee una capacidad de convergencia
local.

Elementos en un algoritmo Newton-Rapson eficiente:

Verificación de la solución al final.


Límite máximo de iteraciones.
Evitar divisiones por cero durante el cálculo del cambio relativo de X.
Mostrar un mensaje de alerta cuando f’(x)≅0 (Jx(X) singular).

21
Newton

EJEMPLO: A partir de X[0]= [ 3 3 ]T, y con εF=1E-5 encuentre


una solución del sistema:
 x2 2 − 10 ⋅ x1 + 4  0
 = 
ln(x1 ) − x1 ⋅ x2 + 10 0

Para poder realizar los cálculos es necesario disponer de JF(X):

 − 10 2 ⋅ x2 
JF ( X ) = 
(1 x1 ) − x2 − x1 
Primera iteración:

) ( )
 x [0 ] 2 − 10 ⋅ x [0 ] + 4  (3 )2 − 10 ⋅ 3 + 4  − 17 
(
F X [0 ] =  2 1
= =
( )
ln x1 − x1 ⋅ x2 + 10 ln(3 ) − 3 ⋅ 3 + 10 2.099
[0 ] [0 ] [0 ] 

T
1 − 17  − 17 
(
f X [0 ]
) 1
( ) ( )
= ⋅ F X [0 ] ⋅ F X [0 ] = ⋅ 
2
T

2 2.099 2.099 
= 146.702

 − 10 2 ⋅ x 2[0 ]   − 10 2 ⋅ 3  − 10
(
JF X [0 ] =  ) = =
6
[0 ]
(
[0 ]
 1 x1 − x 2 )     
− x1[0 ]  (1 3 ) − 3 − 3  − 2.67 − 3

22
Ejemplo aplicado

EJEMPLO: La siguiente figura muestra el diagrama de un


evaporador parcial. FV
x1]V

T, P
FI
x1] I

Calor
FL
x1] L

Si se supone sistema ideal y equilibrio de fases, las ecuaciones


que relacionan las variables con las que se describe esta unidad
durante el procesamiento en estado estacionario de una mezcla
binaria son:
FV − FI ⋅ X NV = 0 , exp(a10 + a11 / (a12 + T )) ⋅ x1]L − P ⋅ x1]V = 0
FI − FL − FV = 0 , exp(a20 + a21 / (a22 + T )) ⋅ (1 − x1]L ) − P ⋅ (1 − x1]V ) = 0
FI ⋅ x1]I − FL ⋅ x1]L − FV ⋅ x1]V = 0

23
Ejemplo aplicado

EJEMPLO:

Fj [kmol / h ] = (Flujo molar de la corriente " j".)


, P [kPa ] = (Presión operativa del evaporador .)
 Fracción molar del componente " i" 
xi]j =   , T [K ] = (Temperatur a operativa del evaporador .)
 en la corriente " j".  ,  Constante " j" de la curva de presión de vapor 
X NV = (Fracción molar de vaporizaci ón.) aij =  
 de la sustancia " i". 

El evaporador se alimenta con una mezcla caracterizada por


FI=100, x1]I=0.3. Considerando que la unidad opera con P=150,
encuentre la temperatura para vaporizar el 30% de la
alimentación (xNV=0.3).

Emplee el método de Newton con εF=1x10-8 y los siguientes


valores iniciales: F 
[ ]
 50 
0
V
F   50 
 L   
 x1]V  =  0 .5 
x   
 1]L   0 .1 
T  300 

24
Ejemplo aplicado

EJEMPLO:

Considere los siguientes valores para las aij.

i=1 i=2
ai0 14,5171728 14,0495654
ai1 -3158,2986 -3726,31756
ai2 -22,8793838 -93,0381045

Para resolver este problema se puede tratar de reducir el


sistema de ecuaciones o tratar de resolver el sistema completo.
Si se toma el sistema completo:
F − F ⋅ X 
 V I NV
  FV   x1 
FI − FL − FV  F   
 L  x2 
F ( X ) = FI ⋅ x1]I − FL ⋅ x1]L − FV ⋅ x1]V 
Donde:  x1]V  =  x 3 
 
exp(a10 + a11 / (a12 + T )) ⋅ x1]L − P ⋅ x1]V   x  x 
   1]L   4 
exp(a20 + a21 / (a22 + T )) ⋅ (1 − x1]L ) − P ⋅ (1 − x1]V ) T   x 5 

25
Ejemplo aplicado

EJEMPLO:

Por lo tanto:

 1 0 0 0 0 
 −1 −1 0 0 0 
 
− x1]V − x1]L − FV − FL 0 
 
JF ( X ) =   a11  a11  a11  
0 0 −P exp a10 +  − ⋅ x1]L ⋅ exp a10 + 
  a12 + T  (a12 + T ) 2
 a12 + T  
 
 a21   
⋅ (1 − x1]L ) ⋅ exp a20 +
 0 a21 a21
0 P − exp a20 +  − 
  a22 + T  (a22 + T ) 2
 a22 + T 

Los valores que pueden obtenerse a partir de los valores


iniciales recomendados empleando el método de Newton se
muestran a continuación:

26
Ejemplo aplicado

EJEMPLO:
[k] [k] [k] [k] [k]
k X F(X ) JF(X ) S //F(X )//
50 20 1 0 0 0 0 -20
50 0 -1 -1 0 0 0 20
0 0.4 0 -0.4 -0.2 -50 -50 0 0.592395427 107.582874
0.2 -55.4692046 0 0 -150 22.6539769 0.18633308 -0.512395427
300 -89.9846774 0 0 150 -0.01915325 1.33E-03 836.868644
30 0 1 0 0 0 0 0
70 0 -1 -1 0 0 0 0
1 0.99239543 22.0958171 -0.99239543 0.31239543 -30 -70 0 0.005930813 59672.6627
-0.31239543 -37144.7638 0 0 -150 118426.524 -0.29104801 0.313112752
1136.86864 46702.1703 0 0 150 -35586.3103 1.60E+02 -222.6387309
30 0 1 0 0 0 0 0
70 0 -1 -1 0 0 0 0
36 0.77889205 0 -0.77889205 -0.09476055 -30 -70 0 -1.88921E-11 1.3101E-08
0.09476055 -1.3101E-08 0 0 -150 1232.93719 0.08828513 8.09662E-12
449.675439 0 0 0 150 -36.6380329 9.72E-01 3.22171E-09
30 0 1 0 0 0 0 0
70 0 -1 -1 0 0 0 0
37 0.77889205 0 -0.77889205 -0.09476055 -30 -70 0 9.00102E-12 6.2418E-09
0.09476055 6.2418E-09 0 0 -150 1232.93719 0.08828513 -3.85758E-12
449.675439 0 0 0 150 -36.6380329 9.72E-01 -1.53496E-09

Finalmente, la temperatura necesaria para que se vaporice el


30% de las moles de la mezcla es 449.67 K .

27
Ejemplo aplicado

EJEMPLO:

Si se quiere reducir el sistema original para facilitar la solución


numérica basta con despejar algunas de las variables de
algunas de las ecuaciones y reemplazar estas expresiones en las
demás ecuaciones.

FV = FI ⋅ X NV
De las primeras dos ecuaciones: FL = FI ⋅ (1 − X NV )

FI ⋅ x1]I − FI ⋅ (1 − X NV ) ⋅ x1]L − FI ⋅ X NV ⋅ x1]V = 0


Reemplazando en la tercera:
⇒ x1]I − (1 − X NV ) ⋅ x1]L − X NV ⋅ x1]V = 0

De esta forma el sistema de ecuaciones se transforma en:


x1]I − (1 − X NV ) ⋅ x1]L − X NV ⋅ x1]V = 0
exp(a10 + a11 / (a12 + T )) ⋅ x1]L − P ⋅ x1]V = 0
exp(a20 + a21 / (a22 + T )) ⋅ (1 − x1]L ) − P ⋅ (1 − x1]V ) = 0

28
Ejemplo aplicado

EJEMPLO:

De esta forma:

 x1]I − (1 − X NV ) ⋅ x1]L − X NV ⋅ x1]V   x1]V   x1 


   x  = x 
F ( X ) = exp(a10 + a11 / (a12 + T )) ⋅ x1]L − P ⋅ x1]V  Donde:  1]L   2 
exp(a + a / (a + T )) ⋅ (1 − x ) − P ⋅ (1 − x )  T   x 3 
 20 21 22 1] L 1]V 

 
 
− X NV − (1 − X NV ) 0 
  a11   a11  
JF ( X ) =  − P
a11
exp a10 +  − ⋅ x1]L ⋅ exp a10 +  
  a12 + T  (a 12 + T )2
 a12 + T  
  a21   
⋅ (1 − x1]L ) ⋅ exp a20 +
a21 a21
 P − exp a20 +  − 
  a22 + T  (a22 + T ) 2
 a22 + T 

Los resultados numéricos que se obtienen con este


planteamiento son:

29
Ejemplo aplicado

EJEMPLO:
[k] [k] [k] [k] [k]
k X F(X ) JF(X ) S //F(X )//
0.4 0.04 -0.3 -0.7 0 0.59277387
0 0.2 -55.4692046 -150 22.6539769 0.18633308 -0.19690309 105.707504
300 -89.9846774 150 -0.01915325 1.33E-03 798.816412
0.99277387 0 -0.3 -0.7 0 0.00395261
1 0.00309691 182.849869 -150 107127.959 0.00288529 -0.00169398 30993.6215
1098.81641 30993.0821 150 -31090.4505 1.14E+02 -271.928759
0.77889205 0 -0.3 -0.7 0 -2.9608E-11
34 0.09476055 -2.0532E-08 -150 1232.93719 0.08828513 1.2689E-11 2.0532E-08
449.675439 0 150 -36.6380329 9.72E-01 5.0492E-09
0.77889205 0 -0.3 -0.7 0 1.4107E-11
35 0.09476055 9.7825E-09 -150 1232.93719 0.08828513 -6.0458E-12 9.7825E-09
449.675439 0 150 -36.6380329 9.72E-01 -2.4057E-09

La respuesta es la misma; sin embargo, el planteamiento de


este problema resulta más simple desde el punto de vista de la
construcción de JF(X) y el número de variables con respecto a
las que es necesario fijar valores iniciales. Generalmente, entre
menos variables se deban inicializar es más fácil proponer
valores iniciales que permiten resolver el problema.

30
Cuasi-Newton

Uno de los requerimientos para el método de Newton es el


cálculo de la matriz Jacobiana en cada iteración.

En los métodos cuasi-Newton, en lugar de utilizar la matriz


Jacobiana exacta, se utiliza una matriz que aproxima a la
Jacobiana.

Esta Jacobiana aproximada se calcula a partir de los cambios de


X y F(X) en las iteraciones. Una de las fórmulas más usada es la
de Broyden:
I para k = 0
( ) ) ( ( ) )( )

J~F X [k ] =  DF [k ] − J~F X [k −1] ⋅ DX [k ] ⋅ DX [k ] T
~
JF X([k −1]
+ para k > 0

 ( )
DX [k ] ⋅ DX [k ]
T

DX [k ] = X [k ] − X [k −1]
( ) ( )
Donde
DF [k ] = F X [k ] − F X [k −1]
Método de Powell

Para evitar los problemas del método de Newton que resultan


cuando aparecen matrices JF(X[k]) quasi-singulares, se puede
utilizar más de una dirección de búsqueda.

Una dirección de búsqueda particularmente útil es SG[k], la dirección


en la que f(X)=(1/2).FT(X).F(X) desciende más rápidamente; es
decir, la dirección dada por -∇f(X).

( ) 1
( ) ( ) 
SG[ k ] = −∇f X [ k ] = −∇ ⋅ F T X [ k ] ⋅ F X [ k ]  ( ) (
SG[ k ] = −J T F X [ k ] ⋅ F X [ k ] )
2 

Esta dirección SG[k] no presenta los problemas asociados a la


dirección de búsqueda de Newton SN[k] cuando JF(X[k]) se hace
quasi-singular.

Sin embargo, puede demostrarse que, a diferencia de un método


basado en SN[k], la velocidad de convergencia de un método basado
en de SG [k] es muy baja cerca de la solución.
Método de Powell

Para aprovechar la velocidad de convergencia que brinda SN[k] y


evitar los problemas que surgen cuando JF(X[k]) se hace quasi-
singular, se puede utilizar una combinación lineal de SG[k] y SN[k].

El método de Powell se inicia con el cálculo del tamaño de paso β[k]


con el que se minimiza una aproximación cuadrática de f(X) en la
dirección de SG[k]. Es decir:

β [k ] ( ) ( )
− F T X [k ] ⋅ J F X [k ] ⋅ SG[k ] SG[k ]
2

= β [k ] =
[k ]T
SG ⋅J T
F (X [ ] ) ⋅ J ( X [ ] ) ⋅ S [ ]
k
F
k
G
k
( )
J F X [k ] ⋅ SG[k ]
2

Ahora, para un tamaño de paso máximo deseado (γ) en cada


iteración, se construye el vector de búsqueda de acuerdo con:

SG[k ]
γ ⋅ [k ] Cuando γ ≤ β [k ] ⋅ SG[k ]
SG
S [k ] = η [k ] ⋅ SN[k ] + (1 − η [k ] )⋅ β [k ] ⋅ SG[k ] Cuando β [k ] ⋅ SG[k ] < γ < SN[k ]
SN[k ] Cuando γ ≥ SN[k ]

Donde (
η [k ] = γ − β [k ] ⋅ SG[k ] ) (S [ ] − β [ ] ⋅ S [ ] )
N
k k
G
k
Método de Powell

Según Powell:

S[k] es una fracción de β[k].SG[k] cuando el tamaño de paso γ que se


quiere dar es inferior a β[k].||SG[k]||.
S[k] es una combinación de β[k].SG[k] y SN[k] cuando el tamaño de
paso γ que se quiere dar está entre β[k].||SG[k]|| y ||SN[k]||.
S[k] es SN[k] cuando el tamaño de paso γ que se quiere dar es
superior a ||SN[k]||.

x2
Vectores de búsqueda
cuando γ≤β[k].||SG[k]|| β[k].SG[k]
SN[k]
Vectores de búsqueda
cuando β[k].||SG[k]||<γ<||SN[k]||

Vectores de búsqueda
cuando ||SN[k]||<γ
X[k]
x1
Método de Powell

De esta forma, al fijar un valor de γ :

Cuando el método se acerca a un punto en el que JF(X) es quasi-


singular, ||SN[k]|| ∞, η 0 y S[k] β[k].SG[k] ó γ.(SG[k]/||SN[k]||). En
este caso, el método utiliza una dirección casi paralela a SG[k]. Esto
hace que el método no se vea afectado por los puntos donde JF(X)
es quasi-singular.

Cuando el método se acerca a la solución, ∇f(X) 0 y por tanto


||SG[k]|| 0. Con esto, η γ/||SN[k]|| y S[k] SN[k] ó γ.(SN[k]/||SN[k]||).
En este caso , el método utiliza una dirección casi paralela a SN[k].
Esto hace que el método aproveche las características de
convergencia asociadas a SN[k] cuando se encuentra cerca de la
solución.

El método aprovecha las ventajas de dos direcciones de búsqueda y


resuelve los problemas asociados al uso de cada una de ellas.
Método de Powell

Fórmulas recurrentes del método de Powell.


X [k +1] = X [k ] + S [k ]
SG[k ]
γ ⋅ [k ] Cuando γ ≤ β [k ] ⋅ SG[k ]
SG
S [k ] = η [k ] ⋅ SN[k ] + (1 − η [k ] )⋅ β [k ] ⋅ SG[k ] Cuando β [k ] ⋅ SG[k ] < γ < SN[k ]
SN[k ] Cuando γ ≥ SN[k ]

( ) (
SG[ k ] = −J FT X [ k ] ⋅ F X [ k ] ) ( ) (
, SN[ k ] = −J F−1 X [ k ] ⋅ F X [ k ] )
SG[k ]
2
Donde
β [k ] = (
, η [k ] = γ − β [k ] ⋅ SG[k ] ) (S [ ] − β [ ] ⋅ S [ ] )
k k k

( )
J F X [k ] ⋅ SG[k ]
2 N G

(
F X [k ] ≤ ε F )
Criterio de paro:  Tolerancia asociada a 
Donde ε F =  
 la magnitud de F (X). 
Método de Powell

EJEMPLO: A partir de X[0]= [ 20 -50 ]T, y con εF=1E-8, γ=10 aplique el método
de Powell para encontrar una solución del sistema:

  x   x + 50   
 x1 ⋅  Cosh 2  − Cosh 2   − 10 
   x1   x1    0
  = 0
 
 x ⋅  Senh x 2 + 50  − Senh x2   − 65  
 1   x   x  
   1   1  
Para poder realizar los cálculos es necesario disponer de JF(X):

 x   x + 50  
 − x 2 ⋅ Senh 2  + (x2 + 50 ) ⋅ Senh 2  
Cosh x2  − Cosh x 2 + 50  +  x1   x1  Senh x2  − Senh x2 + 50 
 x   x  x1 x   x 
 1    1  
JF ( X ) = 
1 1

  x 2 + 50   x2   x2 + 50   x2  
 − (x 2 + 50 ) ⋅ Cosh  + x2 ⋅ Cosh  Cosh  − Cosh  
 x 2 + 50   x2   x1   x1   x1   x1  
Senh  − Senh   +
  x  x  x1 
 1   1
Método de Powell

EJEMPLO:

Primera iteración:
− 9.99 − 6.05
( )
92.65
F X [0 ] =   , J F X [0 ] =   ( )
56  − 9.28 − 5.13 
T
− 9.99 − 6.05 92.65 1445.58 
SG = −J F (X )⋅ F (X ) = − 
[0 ] [0 ] [0 ]
 ⋅ =
T

− 9.28 − 5.13   56   847.96 
T
[0 ] [0 ]T [0 ] 1445 .58  1445 .58
SG = SG ⋅ SG =   ⋅  = 1675 .92
 847.96   847.96 
−1
− 9.99 − 6.05  92.65  − 28.1117 
SN
[0 ]
= −J −1
(X ) ⋅ F (X )
[0 ] [0 ]
= −  ⋅ = 
− 9.28 − 5.13   56   61.7453 
F

T
[0 ] [0 ]T [0 ] − 28.1117  − 28.1117 
SN = SN ⋅ SN =   ⋅  = 67.84
 61.7453   61.7453 
[0 ] 2
SG 1675 .922
β [0 ] = = = 0.0040187
( )⋅ S [0 ] 2 2
[0 ] − 9.99 − 6.05  1445 .58 
JF X
− 9.28 − 5.13  ⋅  847.96 
G

   
Método de Powell

EJEMPLO:

= (0.0040187 ) ⋅ (1675 .92) = 6.735


[0 ]
β [0 ] ⋅ SG

[0 ] [0 ]
En este caso se cumple: β [0 ] ⋅ SG < γ < SN ↔ 6.735 < 10 < 67.84

(
η [0 ] = γ − β [0 ] ⋅ SG[0 ] ) (S[ ] − β [ ] ⋅ S [ ] )
N
0 0
G
0

= (10 − (0.0040187 ) ⋅ 1675.92) (67.84 − (0.0040187 ) ⋅ 1675.92) = 0.0534301

( )
S [0 ] = η [k ] ⋅ SN[k ] + 1 − η [k ] ⋅ β [k ] ⋅ SG[k ]
− 28.1117  1445 .58  3.997 
= (0.0534301) ⋅   + (1 − 0 . 0534301) ⋅ (0 .0040187 ) ⋅  847.96  = 6.525 
 61.7453     

 20  3.997   23.997 
Finalmente: X [1] = X [0 ] + S [0 ] =  + = 
− 50  6.525  − 43.475 
Método de Powell

EJEMPLO:

Los resultados que pueden obtenerse son:

γ 10
RESULTADOS NUMÉRICOS
[k] [k] [k] [k] [k]] [k] [k]] [k] [k] [k]
k X F(X ) JF(X ) SG //SG // SN //SN // β η S //F(X)//
20 92.64579 -9.993222 -6.050204 1445.577 -28.11165 3.996882
0 1675.924 67.84355 0.004019 0.05343 108.2576
-50 56.00409 -9.280519 -5.132289 847.9552 61.74531 6.524627
23.99688 40.51214 -3.216866 -3.25402 165.9252 -20.50909 2.696739
1 230.0674 38.62039 0.030655 0.093364 42.5733
-43.47537 13.08634 -2.720627 -2.104946 159.3734 32.72479 7.484768
26.69362 14.40707 -1.218335 -2.344813 15.08393 -14.59488 -4.309566
2 34.99724 20.03636 0.116557 0.371045 14.607
-35.99061 -2.408439 -1.025023 -0.914341 31.57977 13.72754 7.408613
22.38405 -0.186704 -0.610872 -2.762965 -3.688849 -3.013675 -3.013675
3 4.148693 3.072574 0.211527 4.155984 3.159169
-28.58199 -3.153647 -1.133544 -0.438406 -1.898432 0.598728 0.598728
19.37038 0.063382 -0.784411 -3.399907 1.581779 0.508646 0.508646
4 1.714329 0.518135 0.132311 33.54894 0.859837
-27.98326 0.857498 -1.786665 -0.519524 0.660984 -0.09871 -0.09871
19.87903 0.00294 -0.748162 -3.27159 0.061433 0.023253 0.023253
5 0.067407 0.023669 0.14236 709.8973 0.036137
-28.08197 0.036018 -1.644569 -0.503191 0.027743 -0.004419 -0.004419
19.90228 6.22E-06 -0.746558 -3.265961 0.000119 4.5E-05 4.5E-05
6 0.000131 4.58E-05 0.140711 364890.9 6.99E-05
-28.08639 6.96E-05 -1.638449 -0.502455 5.53E-05 -8.39E-06 -8.39E-06
19.90232 2.51E-11 -0.746555 -3.26595 4.46E-10 1.68E-10 1.68E-10
7 4.94E-10 1.71E-10 0.138827 9.73E+10 2.62E-10
-28.0864 2.61E-10 -1.638437 -0.502454 2.13E-10 -3.08E-11 -3.08E-11

Puede mostrarse que este método resulta más robusto y eficiente que
el de Newton para la solución de este problema.
Homotopía

Los métodos homotópicos de continuidad pertenecen a un


tipo de métodos conocidos como métodos de convergencia
global. En que consisten?

Se pretende encontrar la solución XF de F(X)=0.

Se dispone de un sistema de ecuaciones G(X)=0 con solución


XG conocida o fácil de encontrar.

Con las funciones que definen estos sistemas de ecuaciones se


puede plantear una función homotópica:

H (t, X ) = t ⋅ F ( X ) + (1 − t ) ⋅ G( X )
Homotopía

A partir de la función homotópica se puede plantear una serie


de “M+1” sistemas de ecuaciones:

H m ( X ) = 0 Con m = 0,..., M

H m ( X ) = t m ⋅ F ( X ) + (1 − t m ) ⋅ G( X )
Donde 1
t m = t m −1 + , t0 = 0 , tM = 1
M
Cuando el número sistemas “M” es muy grande, el valor de los
parámetros de continuidad (tm, tm-1) de dos sistemas
adyacentes es muy similar, al igual que las funciones
homotópicas (Hm(X) , Hm-1(X)) que los caracterizan y sus
soluciones (XHm , XHm-1). Matemáticamente.
H m ( X ) ≈ H m −1 ( X )
t m ≅ t m −1 ⇒
X Hm ≅ X Hm −1
 Solución del sistema   Solución del sistema 
Donde X Hm =   , X Hm −1 =  
 de ecuaciones H m ( X ) = 0 .   de ecuaciones H m −1 ( X ) = 0 . 
Homotopía

Como t0=0, se deduce que H0(X)=G(X). Es decir, el primer sistema de


ecuaciones de la serie es G(X)=0, cuya solución XG se conoce o se
puede encontrar fácilmente.

XG se emplea como valor inicial para encontrar XH1 (solución del


sistema H1(X)=0); este a su vez se emplea para encontrar XH2 (solución
del sistema H2(X)=0), y así sucesivamente.

Dado que tM=1, se deduce que HM(X)=F(X). Es decir, el último sistema


de ecuaciones de la serie es el sistema que originalmente se quería
resolver F(X)=0.

Con esta metodología, solucionar el sistema F(X)=0 con garantía de


convergencia a partir de valores iniciales XG lejos de la solución real XF,
equivale a solucionar una serie de “M” sistemas de ecuaciones en
donde la solución de cada sistema sirve como valor inicial que garantiza
convergencia durante la solución del sistema que le sigue dado que
Xm≈Xm-1.
Homotopía

Existen diferentes opciones para G(X). Cada una de ellas conduce a


un método Homotópico diferente. Las más comunes son:

Homotopía de punto fijo: Caracterizada por

G( X ) = ( X − X 0 )
El sistema de ecuaciones G(X)=0 (con solución XG=X0) es muy fácil de
construir, pero posee propiedades de escalado deficientes que pueden
impedir una búsqueda exitosa de la solución.

Homotopía afín: Caracterizada por

G( X ) = JF ( X 0 ) ⋅ ( X − X 0 )

El sistema de ecuaciones G(X)=0 (con solución XG=X0) es más difícil de


construir que en el caso de la homotopía de punto fijo, pero posee
propiedades de escalado que hacen del método algo más robusto.
Homotopía

Para resolver cada sistema de ecuaciones de la forma Hm(X)=0 se


utiliza el método de Newton puro, con lo que:

Hm ( X ) = 0
Newton
( ) ( )(
H m X m[K ] + J Hm X m[K ] ⋅ X − X m[K ] = 0 )
Con m = 0,..., M Con m = 0,..., M

(
X m[K +1] = X m[K ] − J Hm X m[K ] )
−1
(
⋅ H m X m[K ] )
Con m = 0,..., M

(
J Hm X m[k ] = ) ∂(H∂X( X ))
m
=

∂X
(t m ⋅ F ( X ) + (1 − t m ) ⋅ G( X ))
 X = X m[k ]  X = X m[k ]

d (G ( X ))   Ι ( ) ( ) (
J Hm X m[k ] = t m ⋅ J F X m[k ] + (1 − t m ) ⋅ JG X m[k ] )
(
JG X m[k ]
) = =
H. punto fijo
dX  X = X m[k ] J F ( X 0 ) H. afín t m = t m −1 +
1
, t0 = 0 ⇒ tM = 1
M
Homotopía

Fórmulas recurrentes y criterio de paro:

Fórmulas recurrentes:

( ) ⋅ H (X [ ] )
X m[K +1] = X m[K ] − J Hm X m[K ]
−1
m
K
m

Donde JHm (X [ ] ) = t ⋅ J (X [ ] ) + (1 − t ) ⋅ J (X [ ] )
m
k
m F m
k
m G m
k

m = 0,..., M
Con 1
t m = t m −1 + , t0 = 0 ⇒ tM = 1
M

Criterio de paro: Para cada sistema Hm(X)=0 se deben realizar cálculos


con “m” constante hasta que se cumpla el siguiente criterio:

( )
H m X m[k ] ≤ ε H
 Tolerancia asociada a 
Donde ε H =  
 la magnitud de H m (X). 
Homotopía

Características del método:

Ventaja: Bastante robusto. Tiene características de convergencia global


(converge desde casi cualquier valor inicial).
Desventajas: Lento porque implica muchos cálculos que requieren
derivadas e inversión de matrices. Equivale a ejecutar “M” veces el
método de Newton.

Elementos en un algoritmo Homotopía eficiente:

Verificación de la solución al final.


Límite máximo de iteraciones por paso.
Si el método no converge, indicar en que número de paso se detiene.
Graficar los puntos Xm (ruta homotópica).
Homotopía

EJEMPLO: A partir de X[0]= [ 3 3 ]T, con εH=1E-5, M=3,


aplique el método de la homotopía afin para encontrar una
solución del sistema 2
 x2 − 10 ⋅ x1 + 4  0
 = 
ln(x1 ) − x1 ⋅ x2 + 10 0

Para poder realizar los cálculos es necesario disponer de JF(X):


 − 10 2 ⋅ x2   − 10 2 ⋅ x2 ]0   − 10 2 ⋅ 3  − 10 6
JF ( X ) =  JF ( X 0 ) =  = =
(1 x1 ) − x 2 − x1  ( )
 1 x1]0 − x 2]0 − x1]0  (1 3 ) − 3 − 3  − 2.67 − 3

Primera iteración:
Nomenclatura

) ( )
 x [0 ] 2 − 10 ⋅ x [0 ] + 4  (3 )2 − 10 ⋅ 3 + 4  − 17 
(
F X1 [0 ]
=
2 ]1 1]1
= =
Número de la iteración
( ) [0] [0] 
ln x1]1 − x1]1 ⋅ x2[0]1] + 10 ln(3 ) − 3 ⋅ 3 + 10 2.099

(
JF X1 [0 ] 
) (
=
− 10
)
[0 ] [0 ]
2 ⋅ x 2[0]1]   − 10
[0 ]  = 
2 ⋅ 3  − 10
 =
6

 1 x1]1 − x 2 ]1 − x1]1  (1 3 ) − 3 − 3  − 2.67 − 3
x i[k]m] Número del
sistema
Hm(X)=0

Número del componente


del vector X
Homotopía

EJEMPLO:
 − 10 6   3 3  0
( ) (
G X 1[0 ] = J F ( X 0 ) ⋅ X 1[0 ] − X 0 =  )
 ⋅    −    =  
− 2.67 − 3  3 3  0

 − 10
( )
JG X 1[0 ] = J F ( X 0 ) = 
6

− 2.67 − 3

− 17  0 − 5.67
( ) ( )
H1 X 1[0 ] = t1 ⋅ F X 1[0 ] + (1 − t1 ) ⋅ G X 1[0 ] = 0.33 ⋅  (  )
+ (1 − 0.33 ) ⋅   =  
2.099 0 0.70 

 − 10  − 10 6   − 10
( ) ( )
JH1 X 1[0 ] = t1 ⋅ J F X 1[0 ] + (1 − t1 ) ⋅ JG X 1[0 ] = 0.33 ⋅  ( )
6
 + (1 − 0.33 ) ⋅   =
6

− 2.67 − 3 − 2.67 − 3 − 2.67 − 3
−1
 − 10 6  − 5.67  − 0.278 
[0 ]
S1 = −J H1
−1
(X ) ⋅ H (X )
[0 ] [0 ]
= −  ⋅ = 
− 2.66 − 3 0.70  0.48 
1 1 1

3 − 0.28 2.72


X 1[1] = X 1[0 ] + S1[0 ] =   +  =
3 0.48  3.48
 K 2.73
X 1[3 ] =  
3.48 
2.73
X 2[0 ] =  
3.48 

( )
H1 X 1[1] = 5.71 ( )
H1 X 1[3 ] = 7E − 12
Homotopía

EJEMPLO:

RESULTADOS NUMÉRICOS M= 3
[k] [k] [k] [k] [k] [k] [k] [k] [k]
m tm k Xm F(Xm ) JF(Xm ) G(Xm ) JG(Xm ) Hm (Xm ) JHm (Xm ) Sm //Hm (Xm )//
3 -17 -10 6 0 -10 6 -5.666667 -10 6 -0.278321
0 5.709681578
3 2.098612 -2.666667 -3 0 -2.666667 -3 0.699537 -2.666667 -3 0.480576
2.721679 -11.10238 -10 6.961152 5.666667 -10 6 0.076984 -10 6.320384 0.010582
1 0.088206108
3.480576 1.52824 -3.113155 -2.721679 -0.699537 -2.666667 -3 0.043055 -2.815496 -2.907226 0.004562
1 0.333
2.73226 -11.17642 -10 6.970275 5.588221 -10 6 6.94E-06 -10 6.323425 -2.08E-06
2 1.98546E-05
3.485138 1.482826 -3.11914 -2.73226 -0.741441 -2.666667 -3 -1.86E-05 -2.817491 -2.910753 -4.38E-06
2.732258 -11.17643 -10 6.970266 5.588215 -10 6 6.4E-12 -10 6.323422 -2.47E-14
3 7.1222E-12
3.485133 1.482844 -3.119136 -2.732258 -0.741422 -2.666667 -3 -3.13E-12 -2.81749 -2.910753 -1.05E-12
2.732258 -11.17643 -10 6.970266 5.588215 -10 6 -5.588215 -10 6.646844 -0.226073
0 5.637185146
3.485133 1.482844 -3.119136 -2.732258 -0.741422 -2.666667 -3 0.741422 -2.968313 -2.821506 0.500611
2.506185 -5.175695 -10 7.971489 10.85261 -10 6 0.167074 -10 7.314326 0.019338
1 0.182339644
3.985744 0.929747 -3.586732 -2.506185 -1.640394 -2.666667 -3 0.073033 -3.280043 -2.67079 0.003596
2 0.667
2.525523 -5.340393 -10 7.978681 10.68081 -10 6 8.62E-06 -10 7.319121 -9.06E-06
2 6.66655E-05
3.989341 0.851276 -3.593383 -2.525523 -1.70275 -2.666667 -3 -6.61E-05 -3.284478 -2.683682 -1.35E-05
2.525514 -5.340411 -10 7.978654 10.68082 -10 6 1.22E-10 -10 7.319103 -5.93E-12
3 1.49644E-10
3.989327 0.851343 -3.593368 -2.525514 -1.702686 -2.666667 -3 -8.61E-11 -3.284468 -2.683676 -2.48E-11
2.525514 -5.340411 -10 7.978654 10.68082 -10 6 -5.340411 -10 7.978654 -0.124148
0 5.407843411
3.989327 0.851343 -3.593368 -2.525514 -1.702686 -2.666667 -3 0.851343 -3.593368 -2.525514 0.513737
2.401366 0.263926 -10 9.006129 15.00472 -10 6 0.263926 -10 9.006129 0.01968
1 0.271232422
4.503065 0.06253 -4.086635 -2.401366 -2.912837 -2.666667 -3 0.06253 -4.086635 -2.401366 -0.007453
3 1
2.421047 5.55E-05 -10 8.991223 14.7632 -10 6 5.55E-05 -10 8.991223 1.89E-05
2 0.00012616
4.495612 0.000113 -4.082567 -2.421047 -2.94296 -2.666667 -3 0.000113 -4.082567 -2.421047 1.49E-05
2.421066 2.21E-10 -10 8.991253 14.7631 -10 6 2.21E-10 -10 8.991253 -3.73E-11
3 3.82477E-10
4.495627 -3.12E-10 -4.082585 -2.421066 -2.943055 -2.666667 -3 -3.12E-10 -4.082585 -2.421066 -6.6E-11
Homotopía

PROBLEMA PROPUESTO: A partir de X[0]= [ 20 -50 ]T, y con


εH=1E-5, M=3, aplique el método de la homotopía afín para
encontrar una solución del sistema:

   x2   x 2 + 50   

 1 
x  Cosh
x   − Cosh 
 x 
 − 10 
   1   1    0
  = 0
 
 x ⋅  Senh x 2 + 50  − Senh x 2   − 65  
 1   x   x  
   1   1  

Para apreciar las características de convergencia de la


homotopía afín, trate de resolver el mismo problema
utilizando el método de Newton.
INTERPOLACIÓN Y APROXIMACIONES
Aproximaciones polinomiales

Cuando se tienen datos de alta precisión, se puede generar una


función que capte exactamente el comportamiento de los datos
pasando por todos ellos. Funciones de este tipo permiten estimar
datos intermedios a aquellos presentados en tablas.

Para este propósito, a partir de un conjunto de “n+1” datos, se


pueden calcular los coeficientes del único polinomio de grado “n”
que pasa por todos ellos.

Este procedimiento se conoce como interpolación polinomial y


genera una función con la que pueden encontrarse valores entre
los intervalos descritos por los datos originales.

Aunque sólo existe un polinomio de grado “n” que pasa


exactamente por un conjunto de “n+1” datos, existen varias
presentaciones matemáticas equivalentes para tal polinomio.

53
Aproximaciones polinomiales

Gráfico que muestra un estimativo de Ln(x) a partir de un


polinomio cúbico que pasa por cuatro puntos de la función.

54
Aproximaciones polinomiales

Tres formas equivalentes de polinomios de interpolación:

Forma estándar:
n
f (x )n = a0 + a1 ⋅ x + ... + an ⋅ x = ∑ ak ⋅ x k
n

k =0

Polinomios de Gregory-Newton:

f (x )n = b0 + b1 ⋅ (x − x0 ) + b2 ⋅ (x − x0 ) ⋅ (x − x1 ) + ... + bn ⋅ (x − x0 ) ⋅ ... ⋅ (x − x n −1 )
k −1
= b0 + ∑ bk ⋅ ∏ (x − x j )
n

k =1 j =0

bk = ( Diferencia finita dividida de orden "k")


f [ x1 ] − f [ x0 ]
b0 = f [ x0 ] = f ( x0 ) , b1 = f [ x1 , x0 ] =
x1 − x0
f [ x2 , x1 ] − f [ x1 , x0 ] f [ xk ,.., x2 , x1 ] − f [ xk −1 ,.., x1 , x0 ]
b2 = f [ x2 , x1 , x0 ] = ,L , bk = f [ xk ,.., x2 , x1 , x0 ] =
x2 − x0 xk − x0

55
Aproximaciones polinomiales

Polinomios de Lagrange:

f (x )n = L0 (x ) ⋅ f (x0 ) + L1(x ) ⋅ f (x1 ) + ... + Ln (x ) ⋅ f (x n )


n
= ∑ Lk (x ) ⋅ f (x k )
k =0

L0 (x ) =
( x − x1 ) ⋅ (x − x 2 ) ⋅ ... ⋅ (x − x n )
=∏
n
(x − x j )
(x0 − x1 ) ⋅ (x0 − x2 ) ⋅ ... ⋅ (x0 − xn ) j =0 (x0 − x j )
j ≠0

L1 (x ) =
(x − x0 ) ⋅ (x − x2 ) ⋅ ... ⋅ (x − xn ) = (x − x j )
n

Donde (x1 − x0 ) ⋅ (x1 − x2 ) ⋅ ... ⋅ (x1 − xn ) ∏ j = 0 (x1 − x j )


j ≠1
M
Lk (x ) =
( x − x0 ) ⋅ ... ⋅ (x − x k −1 ) ⋅ (x − x k ´ +1 ) ⋅ ... ⋅ (x − x n ) n
=∏
(x − x j )
(xk − x0 ) ⋅ ... ⋅ (xk − xk −1 ) ⋅ (xk − xk´+1 ) ⋅ ... ⋅ (xk − xn ) j =0 (xk − x j )
j ≠k

56
Método de Gregory-Newton

Se fundamentan en las llamadas “diferencias divididas de Newton”.


Estas cantidades son diferencias de la variable dependiente yi=f(xi)
divididas entre diferencias de la variable independiente “xi”.

 Diferencia dividida de orden cero : 


b0 = f [0 ]
= f [x0 ] = f (x0 )  
 Corresponde a la variable dependiente 

 Diferencia dividida de orden uno : 


f [x1 ] − f [x0 ]  
b1 = f [1] = f [x1, x0 ] =  Relación entre la diferencia de diferencias de orden cero 
x1 − x0  y la diferencia entre valores de la variable independiente



 Diferencia dividida de orden dos : 
f [x 2 , x1 ] − f [x1, x 0 ]  
b2 = f [2 ]
= f [x 2 , x1, x0 ] =  Relación entre la diferencia de diferencias de orden uno 
x2 − x0  y la diferencia entre valores de la variable independiente


M M
bn = f [n ] = f [xn ,.., x2 , x1, x0 ]  Diferencia dividida de orden " n" : 
 
f [x n ,.., x 2 , x1 ] − f [x n −1,.., x1, x0 ]  Relación entre la diferencia de diferencias de orden " n - 1" 
=  y la diferencia entre valores de la variable independiente 
 
x n − x0
57
Método de Gregory-Newton

En forma práctica, las diferencias pueden calcularse empleando un


formato tabular en el que las diferencias de orden “k” se calculan
con la ayuda de las diferencias de orden “k-1” calculadas
previamente.

Empleando las diferencias, el polinomio de Newton que pasa por


todos los “n+1” puntos está dado por:
k −1
f (x )n = b0 + b1 ⋅ (x − x 0 ) + b2 ⋅ (x − x 0 ) ⋅ (x − x1 ) + ... + bn ⋅ (x − x0 ) ⋅ ... ⋅ (x − x n −1 ) = b0 + ∑ bk ⋅ ∏ (x − x j )
n

k =1 j =0

58
Método de Gregory-Newton

Características del método:

Ventajas:
Las diferencias divididas pueden calcularse eficientemente mediante un
código de computador.
Cuando no se conoce el grado más adecuado para el polinomio, se
pueden reutilizar los cálculos construyendo polinomios de grado superior
que se basan en los cálculos de diferencias divididas hechos para
polinomios de grado inferior.
No se requiere que los datos estén igualmente espaciados ni que se
encuentren organizados de mayor a menor con respecto a los xi.

Por sus características, es posible diseñar fácilmente algoritmos de


computador altamente eficientes para interpolar datos mediante
polinomios de Newton.

59
Método de Gregory-Newton

EJEMPLO: Empleando un polinomio de Newton que pase por


todos los puntos, encuentre f(3.44)

Datos
i xi yi
0 3.35 0.298507
1 3.4 0.294118
2 3.5 0.285714
3 3.6 0.27778

Antes que nada, es necesario calcular las diferencias divididas:


Cálculo de las diferencias divididas
(0) (1) (2) (3)
i xi f i =f i fi fi fi
0 3.35 0.298507 -0.08778 0.024933 -0.00573
1 3.4 0.294118 -0.08404 0.0235
2 3.5 0.285714 -0.07934
3 3.6 0.27778

60
Método de Gregory-Newton

EJEMPLO:
A partir del valor de “x” donde se quiere evaluar la función f(x)
y las diferencias divididas recién calculadas, se pueden generar
todos los términos que al sumarse conforman el polinomio de
Newton. El término de grado “k” está dado por:
k −1
f [x k ,..., x0 ] ⋅ ∏ (x − x j )
j =0

Los valores que se obtienen para los términos y la función f(x)


evaluada en x=3.44 son:
Cálculo de los términos del
polinomio y estimación de f(x)
k fi(k) (x-xk) Términok
1 0.298507 0.09 0.298507
2 -0.08778 0.04 -0.0079
3 0.024933 -0.06 8.98E-05
4 -0.00573 -0.16 1.24E-06
x 3.44
f(x) 0.290698

61
Método de Lagrange

Estos polinomios se construyen como una combinación lineal


de polinomios Li(x) (con i=0,…,n), cada uno de ellos
asociado a un valor “xi”. Cada polinomio toma un valor de
uno en el “xi” al que se encuentra asociado y toma un valor
de cero en el resto de los “xi”.

L0 (x ) =
( x − x1 ) ⋅ (x − x 2 ) ⋅ ... ⋅ (x − x n ) n
=∏
(x − x j )  Polinomio de orden " n" : 
 
1 para i = 0 
(x0 − x1 ) ⋅ (x0 − x2 ) ⋅ ... ⋅ (x0 − xn ) j =0 (x0 − x j )

 L 0 (x i ) = 0 para i ≠ 0 
j ≠0   

(x − x ) ⋅ (x − x ) ⋅ ... ⋅ (x − x ) = (x − x )
 Polinomio de orden " n" : 
n  
L (x ) =
(x − x ) ⋅ (x − x ) ⋅ ... ⋅ (x − x ) ∏ (x − x )
0 2 n j  1 para i = 1 
1  L1(x i ) = 0 para i ≠ 1 
1 0 1 2 1 n j =0 1 j   
j ≠1
M M
Ln (x ) =
( x − x 0 ) ⋅ (x − x1 ) ⋅ ... ⋅ (x − x n −1 ) n
=∏
(x − x j )  Polinomio de orden " n" : 
 
(xn − x0 ) ⋅ (xn − x1 ) ⋅ ... ⋅ (xn − xn −1 ) j =0 (xn − x j )  1 para i = 0 
 L 0 (x i ) = 0 para i ≠ 0 

j ≠n  

62
Método de Lagrange

Empleando las funciones Lk(x) se construye el polinomio como:


n
f (x )n = L0 (x ) ⋅ f (x0 ) + L1 (x ) ⋅ f (x1 ) + ... + Ln (x ) ⋅ f (x n ) = ∑ Lk (x ) ⋅ f (x k )
k =0

El siguiente gráfico presenta los 3 términos de grado 2 (parábolas)


que componen un polinomio de Lagrange que pasa por por 3 puntos
(x0,y0), (x1,y1), (x2,y2).

63
Método de Lagrange

Características del método:

Ventajas:
Las fórmulas para el cálculo de los términos en los polinomios de
Lagrange son muy simples y fáciles de programar. Cuando se van a
hacer cálculos conociendo el grado de interpolación adecuado, Newton y
Lagrange implican aproximadamente la misma carga computacional. Sin
embargo, el método de Lagrange se prefiere en este caso gracias a la
mayor facilidad en la programación de las fórmulas.
No se requiere que los datos estén igualmente espaciados ni que se
encuentren organizados de mayor a menor con respecto a los xi.

Desventaja: A diferencia de lo que ocurre con los polinomios de Newton,


si se quiere cambiar el grado del polinomio de interpolación, es
necesario repetir casi todos los cálculos. Esto hace que el método de
Lagrange no pueda competir con el método de Newton en cuanto a
eficiencia de cómputo cuando se está tratando de determinar el grado
de interpolación correcto.

64
Método de Lagrange

EJEMPLO: A partir de los datos presentados en el ejemplo


anterior y empleando un polinomio de Lagrange que pase
por todos los puntos, encuentre f(3.44)
Datos
i xi yi
0 3.35 0.298507
1 3.4 0.294118
2 3.5 0.285714
3 3.6 0.27778

Antes que nada, es necesario calcular las diferencias entre las


“xi” que posteriormente permiten calcular las Lk(x)
Matriz de diferencias aij=(xi-xj)
x0 x1 x2 x3
3.35 3.4 3.5 3.6
x 3.44 0.09 0.04 -0.06 -0.16
x0 3.35 0 -0.05 -0.15 -0.25
x1 3.4 0.05 0 -0.1 -0.2
x2 3.5 0.15 0.1 0 -0.1
x3 3.6 0.25 0.2 0.1 0

65
Método de Lagrange

EJEMPLO:
A partir de las diferencias ya calculadas se pueden calcular los
Lk(x), y con estos y los f(xk) se pueden generar todos los
términos del polinomio de Lagrange. El término de grado k está
dado por:
n
f (x k ) ⋅ ∏
(x − x )
j

j =0 (x − x )
k j
j ≠k

Los valores que se obtienen para los términos y la función f(x)


evaluada en x=3.44 son:
Cálculo de los términos del
polinomio y estimación de f(x)
k f(xk) Lk(x) Términok
0 0.298507 -0.2048 -0.06113
1 0.294118 0.864 0.254118
2 0.285714 0.384 0.109714
3 0.27778 -0.0432 -0.012
x 3.44
f(x) 0.290698

66
Mínimos cuadrados

Cuando se tienen datos con error, se puede generar una función


que capta el comportamiento general de los datos en conjunto sin
pasar necesariamente por todos ellos.

Para un conjunto de puntos determinados pueden plantearse


muchas funciones diferentes con parámetros desconocidos que se
pueden calcular minimizando la discrepancia entre los puntos y la
curva que representa la función.

67
Mínimos cuadrados

Existen varios criterios para caracterizar la discrepancia entre la


curva (modelo matemático) y los puntos:

Suma de las desviaciones:

(Discrepancia) = ∑ (y i ]dato − y i ]modelo )


n

i =1

Suma de valores absolutos de las desviaciones:


n
(Discrepancia) = ∑ y i ]dato − y i ]modelo
i =1

La mayor de las desviaciones


(Discrepancia ) = max (y i ]dato − y i ]modelo )
Suma de los cuadrados de las desviaciones:

(Discrepanc ia) = ∑ (y i ]dato − y i ]modelo )2


n

i =1

68
Mínimos cuadrados

Matemáticamente se puede mostrar que el mejor de los criterios


para cuantificar la discrepancia es el último: LA SUMA DE LAS
DESVIACIONES CUADRÁTICAS.

Esta definición de discrepancia aporta un criterio con el que se


puede cuantificar que tan bueno es el ajuste de un modelo a un
conjunto de datos.

Al ajustar los parámetros desconocidos de un modelo para


minimizar la suma de las desviaciones cuadráticas, se obtiene el
mejor ajuste que puede lograrse entre dicho modelo y los datos en
cuestión.

En último término, el procedimiento de ajuste implica la solución de


un problema de optimización : minimización de la suma de
desviaciones cuadráticas (función objetivo) mediante la
modificación de los parámetros desconocidos del modelo (variables
independientes).

69
Mínimos cuadrados

Procedimiento general: Se pretende ajustar un conjunto de puntos


a una función escalar multivariable general:

 ( X 1, y 1 ) 
 ( X , y )
Datos :  2 2 
 M 
 
( X n , y n )
Modelo : y = f (A, X )
 x1  a0 
x   a   Vector de 
 Vector de variables 
X =  2  =   , A =   =  parámetros 
1

 M   independie ntes.  M 


Donde :      del modelo. 
xm  ap 
 Variable escalar 
y =  
 dependient e. 

70
Mínimos cuadrados

Se construye una función de error cuadrático (E):

E = ∑ (y i ]dato − y i ]modelo ) = ∑ (y i − f (A, X i ))


n n
2 2

i =1 i =1

Dado que los valores {(Xi,yi)} son datos conocidos, “E” es una función
de “p+1” variables: Los parámetros desconocidos del modelo a0, a1,
a2,…, ap.

Para encontrar el mejor ajuste es necesario resolver el problema de


optimización no restringido:
n
E = ∑ (y i − f (A, X i ))
2
min
i =1

Puede demostrarse que este método proporciona el ajuste más


adecuado cuando la dispersión de los puntos es de magnitud similar en
todo el rango de datos y la distribución de los puntos al rededor del
modelo es normal.

71
Mínimos cuadrados

Aplicando condición necesaria de primer orden para un punto solución


de este problema de optimización:

 ∂   ∂f (A, X i )
( )
n
E a , a ,..., a  − 2 ⋅ ∑ (y − f ( A , X )) ⋅
 ∂a  ∂a0 
0 1 p i i
 0
  i =1

 ∂
E(a0 , a1,..., ap ) − 2 ⋅ ∑ (y i − f (A, X i )) ⋅
n
∂f ( A, X )
i 
∇E(a0 , a1,..., ap ) =  ∂a1 = i =1 ∂a1  = 0
 M   M 
 ∂   ( ) 
E(a0 , a1,..., ap ) − 2 ⋅ ∑ (y i − f (A, X i )) ⋅
n
∂f A, X 
 i
∂a
 p 
  i =1 ∂ a p 

n ∂f (A, X i ) n ∂f (A, X i )
∑ y i ⋅ − ∑ f (A, X i ) ⋅
∂a0 ∂a0 
 i n=1 i =1
 Sistema de “p+1”
∂f (A, X i ) n ∂f (A, X i )
 y − ∑ f (A, X i ) ⋅
∑
⋅ ecuaciones con “p+1”
∂a1 ∂a1  = 0
i
i =1 i =1 incógnitas (ao,a1,…,ap)
 M 
n 
∂f (A, X i ) n ∂f (A, X i )
∑ y i ⋅ − ∑ f (A, X i ) ⋅
 i =1 ∂ap i =1 ∂ap 

72
Mínimos cuadrados

Para establecer que tanto se ajusta un conjunto de puntos a un modelo


se utiliza un parámetro conocido como coeficiente de correlación (r).

Para calcular el coeficiente de correlación se debe calcular previamente


dos parámetros:

Desviación cuadrática respecto al promedio (Et):

Et = ∑ (y i ]dato − y Promedio )
n n
, y Promedio = ∑ y i ]dato n
2

i =1 i =1

(Et) cuantifica la dispersión de los datos alrededor del valor medio de los
datos yi. Es decir, cuantifica la dispersión de la variable independiente
cuando no se considera ningún modelo.

Desviación cuadrática respecto al modelo (Er):

Er = ∑ (y i ]dato − y i ]modelo ) , y i ]modelo = f (A, X i ]dato )


n
2

i =1

73
Mínimos cuadrados

(Er) cuantifica la dispersión de los datos alrededor del modelo. Es decir,


cuantifica la dispersión de la variable independiente después de realizar
la regresión con el modelo. En otras palabras, representa la variabilidad
en el comportamiento de los datos que no puede explicar el modelo.

Coeficiente de determinación (r2) y coeficiente de correlación (r):

r 2 = (Et − E r ) Et , r= (Et − Er ) Et
(Et-Er) cuantifica la reducción en la dispersión de los datos que se logra
cuando se ajusta un modelo a los datos. Es decir, cuantifica la
variabilidad de los datos que puede explicar el modelo. Como (Et-Er)
depende de la escala con la que se miden los datos, se debe normalizar
para obtener (Et-Er)/Et, un parámetro objetivo que puede utilizarse para
comparar el ajuste de diferentes datos y modelos.

Un ajuste perfecto implica: Er=0, r2=1, r=1. Esto quiere decir que el
modelo es capaz de explicar el 100% de la variabilidad de los yi.

74
Regresión polinomial

Regresión polinomial: Se trata de ajustar un conjunto de


puntos a un modelo polinomial de una variable y grado “m”:
 (x1, y 1 ) 
 (x , y )
 2 2  Datos :
 M 
 
(x n , y n )
m
Modelo : y = ao + ∑ ak ⋅ (x )
k

k =1

Mediante una transformación de los datos originales y un


cambio de variable es posible convertir este problema en un
problema de regresión lineal múltiple:
(
 (x11, x 21,..., x m1, y 1 )   (x1 )1, (x1 )2 ,..., (x1 )m , y 1 ) 
Datos :
(x , x ,..., x , y ) 
 12 22 m2 2 
=  ( (
x 2 ) , (x 2 ) ,..., (x 2 ) , y 2
1 2 m
)
Haciendo :  M   
M
yi = yi , x ki = (xi )
k   
(
(x1n , x 2n ,..., x mn , y n )  (x n ) , (x n ) ,..., (x n ) , y n
1 2 m
)


m
Modelo : y = ao + ∑ ak ⋅ x k
k =1

75
Regresión polinomial

Con este cambio de variable se pueden utilizar todas las expresiones


presentadas para la regresión lineal múltiple.

Si se hace el planteamiento de la función de error cuadrático (E) y se


aplica la condición de primer orden para encontrar el mínimo, se puede
llegar al siguiente sistema de ecuaciones normales:

 n n n
  n 
∑x ∑x ∑  ∑ i 
2 m
 n i i L x i  y
 n i =1
n
i =1
n
i =1
n   a0   n i =1 
 m +1 
 a   ∑ xi ⋅ y i 
∑ ∑x ∑x ∑
2 3
xi L xi
i =1 i =1
i
i =1
i
i =1
  1   i =1  Ecuaciones
 n 2 n n n   = n 2
m + 2 ⋅ a2
 normales de
 ∑ xi ∑x i
3
∑x i
4
L ∑ xi     ∑ xi ⋅ y i  la regresión
 i =1 i =1 i =1 i =1   M   i =1  polinomial
 M M M O M  a   M 
n m  m
m +m   
n n n n

∑ x i ∑x ∑x ∑ ∑ i
m +1 m +2

m
i i L x i  x y i
 i =1 i =1 i =1 i =1   i =1 

Nuevamente, el sistema lineal de ecuaciones posee una matriz de


coeficientes y vector de términos independientes que pueden calcularse
a partir de los datos

76
Regresión polinomial

EJEMPLO: Encuentre la ecuación del polinomio de segundo


grado que mejor se ajusta a los datos:

Datos
i xi yi
1 1 16.7209
2 2 17.5592
3 2.5 14.9204
4 3 12.8401
5 4 2.75075
6 4.5 -3.26496
7 5 -10.6096

Ajustar estos datos a un modelo y=a0+a1.x+a2.x2 implica el


cálculo los parámetros a0, a1 , a2. Para lograrlo, es necesario
estimar los valores de los coeficientes y términos
independientes de las ecuaciones derivadas a partir de la
minimización de la función de error cuadrático (E).

77
Regresión polinomial

EJEMPLO:
Para calcular los parámetros desconocidos del modelo:

Valores para el cálculo de los parámetros desconocidos del modelo


2 3 4 2
i xi xi xi xi yi xi.yi xi .yi
1 1 1 1 1 16.72089 16.72089 16.72089
2 2 4 8 16 17.55918 35.11836 70.23672
3 2.5 6.25 15.625 39.0625 14.9204 37.30099 93.25248
4 3 9 27 81 12.84009 38.52027 115.5608
5 4 16 64 256 2.750752 11.00301 44.01203
6 4.5 20.25 91.125 410.0625 -3.26496 -14.6923 -66.1154
7 5 25 125 625 -10.6096 -53.0481 -265.241
Σ 22 81.5 331.75 1428.125 50.91673 70.92307 8.426855

Ecuaciones normales:
4
n 7.00 Σ xi 1428.13  7 22 81.5  a0  50.92
Σ xi Σ yi  22 331.75  ⋅  a1  = 70.92
22.00 50.92
2
Σ xi.yi  81.5
Σ xi 81.50 70.92
Σ xi
3
331.75 2
Σ xi .yi 8.43 81.5 331.75 1428.13  a2   8.43 

−1
a0   7 22 81.5  50.92  12.04 
 a  =  22 81.5 331.75  ⋅ 70.92 =  7.22 
 1 
a2  81.5 331.75 1428.13  8.43  − 2.36

78
Regresión polinomial

EJEMPLO:

Para calcular el coeficiente de correlación del modelo:

Valores para el cálculo del coeficiente de


correlación
2 2
i yi]modelo (yi-yi]modelo) (yi-yPromedio)
1 16.90 0.03 89.25 yPromedio 7.27
2 17.05 0.26 105.79 Er 0.85
3 15.35 0.19 58.47 Et 735.83
4 12.48 0.13 30.98
5 3.19 0.19 20.46
6 -3.23 0.00 111.07
7 -10.82 0.04 319.82
Σ 50.92 0.85 735.83

2
r 0.9988
r 0.9994

79
Regresión polinomial

EJEMPLO:
Gráfico de dispersión de datos

20

10

0
0 1 2 3 4 5 6

-10 y = -2.3587x2 + 7.2213x + 12.04


yi

R2 = 0.9988

-20

-30

-40
xi

80
Regresión polinomial

EJERCICIO PROPUESTO: Se han obtenido los siguientes


datos en el laboratorio de la capacidad calorífica c para un
gas determinado a diferentes temperaturas T.

T -40 -20 10 70 100 120


c 1250 1280 1350 1480 1580 1700

Ajuste los datos a un modelo polinomial de segundo grado que


permita predecir c en función de T. Además, evalúe el
coeficiente de determinación y de correlación.

81
Regresión No lineal

En el caso en que se tenga la siguiente situación, se pretende


ajustar un conjunto de puntos a una función escalar multivariable
general:
 ( X 1 , y1 ) 
( X , y )
Datos :  2 2 
 M 
 
( X
 n n  , y )
a
Modelo : y =
b+x
 x1 
x   Vector de 
 Vector de variables a   
X =  2  =   , A =   =  parámetros 
 M   independientes.  b   del modelo.
Donde :    
 xm 
 Variable escalar 
y =  
 dependient e. 

82
Regresión No lineal

Se construye una función de error cuadrático (E):


2
 a 
E = ∑ ( yi ]dato − yi ]modelo )
n n
= ∑  yi − 
2

i =1 i =1  b + X i 

Dado que los valores {(Xi,yi)} son datos conocidos, “E” es una función
de “p+1” variables: Los parámetros desconocidos del modelo a, b.

Para encontrar el mejor ajuste es necesario resolver el problema de


optimización no restringido:
2
n
 a 
min E = ∑  yi − 
i =1  b + X i 

Puede demostrarse que este método proporciona el ajuste más


adecuado cuando la dispersión de los puntos es de magnitud similar en
todo el rango de datos y la distribución de los puntos al rededor del
modelo es normal.

83
Regresión No lineal

Aplicando condición necesaria de primer orden para un punto solución


de este problema de optimización:

 n
   
∂   2 ⋅ ∑  yi − a  − 1  
 ∂a E(a, b )  
i =1  b + X i  b + X i  
∇E(a, b ) =  = n =0
∂  
 E(a, b ) 2 ⋅ ∑ ( yi − f ( A, X i )) ⋅  a

 ∂b   i =1  (b + X )2 
  i 

 n  a  1  
 ∑ i  y − −
 b + X  

 =  b + X i  i  
=0
i 1
 n  
∑ ( yi − f ( A, X i )) ⋅ 
a

2 
 i =1  (b + X i ) 

84
Regresión No lineal

Linealización de datos y modelos: Cuando se tienen modelos


no lineales, es posible aplicar cambios de variables y
transformaciones en los datos que permiten ajustarlos a
modelos lineales. Este es un procedimiento similar al
presentado para convertir la regresión polinomial en una
regresión lineal múltiple. Algunos de los modelos más
comunes y sus transformaciones son:

Modelo logarítmico (y=a0+a1.Ln(x)):


 (Ln (x1 ), y 1 )   (x1´, y 1´) 
Transformación del modelo :  (Ln (x ), y )  (x ´, y ´)
Datos :  2 2 
= 2 2 
No es necesario  M   M 
   
Transforma ción de datos : (Ln (x n ), y n ) (x n ´, y n ´ )
y i ´= y i , x i ´= Ln (x i ) Modelo : y ´= ao + a1 ⋅ x´

85
Regresión No lineal

Modelo exponencial: y=a0.ea1.x


 (x1, Ln (y 1 ))   (x1´, y 1´) 
Transformación del modelo :  (x , Ln (y ))  (x ´, y ´)
Datos :  2 2 
= 2 2 
( )
Ln (y ) = Ln a0 ⋅ e a1⋅x ⇒ Ln (y ) = Ln (a0 ) + a1 ⋅ x 

M  
 
M 

Transforma ción de dados : (x n , Ln (y n )) (x n ´, y n ´)
y i ´= ln(y i ) , xi ´= x i Modelo : y ´= Ln (ao ) + a1 ⋅ x´

Modelo potencial: y=a0.xa1


 (Ln (x1 ), Ln (y 1 ))   (x1´, y 1´) 
Transformación del modelo :  (Ln (x ), Ln (y )) (x ´, y ´)
( ) Datos :  2 
2
= 2 2 
Ln (y ) = Ln a0 ⋅ x a1 ⇒ Ln (y ) = Ln (a0 ) + a1 ⋅ Ln (x )  M   M 
   
Transformación de datos : (Ln (x n ), Ln (y n )) (x n ´, y n ´)
y i ´= ln(y i ) , x i ´= ln(x i ) Modelo : y ´= Ln (ao ) + a1 ⋅ x´

86
Regresión No lineal

87
Regresión No lineal

Un resumen de algunos de los modelos más comunes y sus


transformaciones se presenta en la siguiente tabla:
Transformación del Transformación de
Modelo original Modelo a ajustar
modelo los datos

Modelo logarítmico y i ´= y i
- y ´= ao + a1 ⋅ x´
= 0 + 1 · xi ´= Ln (x i )
Transforma
ln(ydados
y i ´= de i)
  
Ln (y ) = Ln (a0 ) + a1 ⋅ x ción
Modelo exponencial

y´= Ln (ao ) + a1 ⋅ x´
= 0 · x i ´= x i

y i ´= ln(y i )
y ´= Ln (ao ) + a1 ⋅ x´
Modelo potencial
Ln (y ) = Ln (a0 ) + a1 ⋅ Ln (x )
= 0· 1 x i ´= ln(x i )

x 
y i ´=  i 
 yi 
Modelo cinético de
x i ´= x i
Michaelis-Menten  x   a1   1 
  =   +   ⋅ x a  y ´= a´0 +a´1⋅x´
·  y   a0   a0  a´0 =  1 
=
0  a0 
1+
 1
a´1 =  
 a0 

88
Regresión No lineal

EJEMPLO 5: Se cree que dos variables “x” y “y” que


describen un cierto fenómeno se relacionan de acuerdo con
el modelo y=a0.x/(a1+x). Datos experimentales de estas
variables se muestran a continuación. Determine el valor de
los parámetros desconocidos empleando regresión lineal.
Datos
i xi yi
1 3 5.66554
2 6 8.85981
3 8 12.1491
4 9 11.5915
5 10 13.1111
6 15 15.8458
7 17 16.1599

Dado que el modelo es no lineal, es necesario plantear una


transformación para poder utilizar las expresiones de la
regresión lineal.

89
Regresión No lineal

EJEMPLO 5:

Una posible transformación para linealizar los datos y el modelo


es:

Transforma ción del modelo :


x x a   1   (x1, (x1 y 1 ))   (x1´, y 1´) 
y = a0 ⋅ ⇒   =  1  +   ⋅ x  (x , (x y )) (x ´, y ´)
(a1 + x )  y   a0   a0  Datos :  2 2 2  =  2 2 
 M   M 
   
Transforma ción de los datos : (xn , (xn y n )) (xn ´, y n ´)
x  Modelo : y´= a´0 +a´1⋅x´
y i ´=  i  , x i ´= x i
 yi 
a   1
a´0 =  1  , a´1 =  
 a0   a0 

90
Regresión No lineal

EJEMPLO 5:

Para calcular los parámetros desconocidos del modelo:

Valores para el cálculo de los parámetros desconocidos


del modelo
2
i x´i y´i x´i.y´i x´i
1 3 0.529516771 1.588550314 9 n 7 Σxi.yi 57.62
2 6 0.677215543 4.063293259 36 Σxi 68 Σxi
2
804
3 8 0.658486129 5.267889028 64 Σyi 5.40
4 9 0.776428346 6.98785511 81
5 10 0.762712117 7.62712117 100
6 15 0.946625803 14.19938704 225
7 17 1.051989052 17.88381388 289
Σ 68 5.40297376 57.6179098 804 Ecuaciones normales:
−1
a´0   7 68   5.40  0.4243  7 68  a´0   5.40 
 a´  =   ⋅ =  68 804 ⋅  a´  = 57.62
 1  68 804 57.62 0.0358    1  

a0   1 a´1   1 0.0358  27.95 


 a  = a´ a´  =   = 11.86 
 1   0 1  0 . 4243 0 .0358   

91
Regresión No lineal

EJEMPLO 5:
Para calcular el coeficiente de correlación del modelo modificado
y del modelo original:
Valores para el cálculo del coeficiente de
correlación (modelo modificado) y´Prom edio 0.77
i y´i]m odelo (y´i-y´i]m odelo)2 (y´i-y´Prom edio)2 E´r 0.01
1 0.53 0.00 0.06 E´t 0.19
2 0.64 0.00 0.01
3 0.71 0.00 0.01
4 0.75 0.00 0.00
5 0.78 0.00 0.00
2
6 0.96 0.00 0.03 r´ 0.9681
7 1.03 0.00 0.08
r´ 0.9839
Σ 5.40 0.01 0.19
Valores para el cálculo del coeficiente de
correlación (modelo original) yProm edio 11.91
i yi]m odelo 2
(yi-yi]m odelo) (yi-yProm edio)
2 Er 1.55
1 5.64 0.00 39.02 Et 83.45
2 9.39 0.28 9.31
3 11.26 0.79 0.06
4 12.06 0.22 0.10
5 12.79 0.11 1.44
2
6 15.61 0.06 15.48 r 0.9815
7 16.46 0.09 18.05
r 0.9907
Σ 83.21 1.55 83.45

92
Regresión No lineal

EJEMPLO 5:

Gráfico de dispersión de datos


(Modelo y datos transformados)

1.2

0.8
y´i

0.6 y = 0.0358x + 0.4243


R2 = 0.9681

0.4

0.2

0
0 2 4 6 8 10 12 14 16 18 20
x´i

93
Regresión No lineal

EJEMPLO 5:

Gráfico de dispersión de datos


(Modelo y datos originales)

20

18

16

14

12

10
yi

y = 27.95x / (11.86 + x)
8
R2 = 0.9815
6

0
0 2 4 6 8 10 12 14 16 18 20
xi

94
Mínimos cuadrados con Excel

La regresión de datos con mínimos cuadrados es en esencia


un problema de optimización no restringida.

Dado que el “Solver” de Excel es una herramienta para


resolver problemas de optimización, puede emplearse para
ajustar datos a cualquier tipo de modelo.

Como en todo planteamiento de un problema de


optimización en Excel es necesario seleccionar dos conjuntos
de celdas:
Celdas asociadas con las incógnitas del problema:
Corresponden a los parámetros del modelo (a0,...,ap).
Celdas asociadas a la función objetivo: Corresponde a la
función de error cuadrático (E=Er).

95
Mínimos cuadrados con Excel

EJEMPLO 5: Se cree que en un cierto sistema químico


reactivo a condiciones de temperatura y presión dadas, la
relación entre la velocidad de consumo de un reactivo “A”
(rA) y su concentración (CA) en el sistema está dada por el
modelo:
a
CA 1
rA = a0 ⋅
(1 + a2 ⋅ CA )a3

A partir de los datos experimentales mostrados a


continuación y empleando el MSES, encuentre los valores de
los parámetros que permiten el mejor ajuste del modelo a los
datos. Utilice (a0,a1,a2,a3)=(1,1,1,1) como estimativos
iniciales. ¿ El modelo planteado caracteriza el
comportamiento del sistema?

96
Mínimos cuadrados con Excel

EJEMPLO 5:
Datos
i xi=CA yi=rA
1 0 0
2 0.2 0.088029
3 0.7 0.528936
4 2 1.441212
5 4.5 2.475565
6 7.1 2.516552
7 8.7 2.876045

Las fórmulas y valores que se incluyen en Excel para plantear el


problema de optimización se muestran a continuación:
B C D E F G H I J K L
2 yProm edio =PROMEDIO(D5:D11)
Valores para el cálculo del coeficiente de correlación
3 Datos Er =H12
2 2
4 i xi yi i yi]m odelo (yi-yi]m odelo) (yi-yProm edio) Et =I12
5 1 0 0 1 =($L$6*C5^$L$7)/((1+$L$8*C5)^$L$9) =(D5-G5)^2 =(D5-$L$2)^2
6 2 0.2 0.08803 2 =($L$6*C6^$L$7)/((1+$L$8*C6)^$L$9) =(D6-G6)^2 =(D6-$L$2)^2 a0 1.59762943818594
7 3 0.7 0.52894 3 =($L$6*C7^$L$7)/((1+$L$8*C7)^$L$9) =(D7-G7)^2 =(D7-$L$2)^2 a1 1.70104201282993
8 4 2 1.44121 4 =($L$6*C8^$L$7)/((1+$L$8*C8)^$L$9) =(D8-G8)^2 =(D8-$L$2)^2 a2 0.436613198199381
9 5 4.5 2.47556 5 =($L$6*C9^$L$7)/((1+$L$8*C9)^$L$9) =(D9-G9)^2 =(D9-$L$2)^2 a3 1.9933196584736
10 6 7.1 2.51655 6 =($L$6*C10^$L$7)/((1+$L$8*C10)^$L$9) =(D10-G10)^2 =(D10-$L$2)^2
11 2
7 8.7 2.87604 7 =($L$6*C11^$L$7)/((1+$L$8*C11)^$L$9) =(D11-G11)^2 =(D11-$L$2)^2 r =(L4-L3)/L4
12 Σ =SUMA(G5:G11) =SUMA(H5:H11) =SUMA(I5:I11) r =RAIZ(L11)

97
Mínimos cuadrados con Excel

EJEMPLO 5:

Los resultados obtenidos luego del proceso iterativo automático


desarrollado por el Solver son:
Valores para el cálculo del coeficiente de yProm edio 1.42E+00
correlación Er 5.46E-02
2 2
i yi]m odelo (yi-yi]m odelo) (yi-yProm edio) Et 9.02E+00
1 0.00 0.00E+00 2.01E+00
2 0.09 2.76E-07 1.77E+00 a0 1.60
3 0.51 2.93E-04 7.91E-01 a1 1.70
4 1.49 2.06E-03 5.37E-04 a2 0.44
5 2.36 1.23E-02 1.12E+00 a3 1.99
6 2.69 3.07E-02 1.21E+00
2
7 2.78 9.32E-03 2.13E+00 r 0.9939
Σ 9.92 5.46E-02 9.02E+00 r 0.9970

El coeficiente de correlación indica que el modelo es capaz de


explicar aproximadamente el 99% de la variabilidad de los
datos. Esto indica que el modelo si capta la esencia del
fenómeno medido en el laboratorio.

98
Mínimos cuadrados con Excel

EJEMPLO 5:
Gráfico de dispersión de datos

3.5

2.5

2
yi

1.5

0.5

0
0 1 2 3 4 5 6 7 8 9 10
xi

99
DIFERENCIACIÓN NUMÉRICA
Diferenciación numérica

La diferenciación numérica se puede realizar mediante:

Derivando el polinomio de aproximación:


f ( x ) = Pn ( x ) → f ' ( x ) = Pn ' ( x )

Aproximación de la derivada mediante la secante:

f ( xn +1 ) − f ( xn ) f ( xn +1 ) − f ( xn ) x +x
f ' ( xn ) = f ' (C ) = , C = n +1 n
xn +1 − xn xn +1 − xn 2

Diferencias finitas:
Ver ejemplo libro y realizarlo en Excel.
1 1 2 1 3 1 4  1  2 11 4 5 5 
D= ∆ − ∆ + ∆ − ∆ + ... D2 = ∆ − ∆3
+ ∆ − ∆ ...
h  2 3 4  h2  12 6 

Fórmulas hacia adelante, atrás y centradas (siguientes diapositivas)

102
Fórmulas de
diferencias finitas
Con el número de términos de la aproximación se puede
construir fórmulas de diferencias finitas hacia adelante

103
Fórmulas de
diferencias finitas
También permite construir fórmulas de diferencias finitas
hacia atrás:

104
Fórmulas de
diferencias finitas
Finalmente, permite construir fórmulas de diferencias finitas
centradas:

105
Fórmulas de
diferencias finitas
El uso de una fórmula de diferencias finitas hacia adelante,
hacia atrás o centrada depende de la disponibilidad de datos
alrededor del punto xi en el que se desea evaluar la fórmula.

Cuando se pretende evaluar las derivadas en los primeros


puntos (x1,x2,...) de una lista, es muy probable que se
deban utilizar fórmulas hacia a delante (donde f(m)(xi)= f((xi,fi),
(xi+1,fi+1) , (xi+2,fi+2)...)) (no centradas). Cuando se pretende
evaluar las derivadas en los últimos puntos de (...,xn-2,xn-
1,xn) de una lista, es muy probable que se deban utilizar
fórmulas hacia atrás (donde f(m)(xi)= f((xn,fn), (xn-1,fn-1) , (xn-2,fn-
2)...)) (no centradas).

Durante el cálculo de una derivada de cierto orden a partir


de un conjunto de puntos (xi,f(xi)), se pueden utilizar
formulas diferentes para diferentes puntos siempre y cuando
tengan el mismo orden de error.
106
Fórmulas de
diferencias finitas
EJEMPLO: Durante la titulación de una solución se
obtuvieron los siguientes datos:
i V (ml) PH
1 0.12 1.946
En este caso V(ml) representa la cantidad 2
3
0.62
1.12
1.982
2.023
de reactivo añadido a la solución durante 4
5
1.62
2.12
2.073
2.133
la titulación. 6
7
2.62
3.12
2.208
2.303
8 3.62 2.427
9 4.12 2.597
10 4.62 2.845
Construya las curvas para la primera y 11 5.12 3.238
12 5.62 3.956
segunda derivada. A partir de la última 13 6.12 5.695
14 6.62 10.304
encuentre el punto de equivalencia. 15 7.12 12.043
16 7.62 12.761
17 8.12 13.154
18 8.62 13.402
Para cumplir con los requerimientos de 19 9.12 13.572
20 9.62 13.696
precisión se pide que las derivadas 21 10.12 13.791

se calculen con (orden mínimo de error)=2

107
Fórmulas de
diferencias finitas
EJEMPLO:

Como los puntos se encuentran igualmente espaciados, es posible


emplear fórmulas de diferencias finitas para calcular las derivadas de la
función PH=f(V(ml)).

Las derivadas en los puntos intermedios se pueden calcular con las


fórmulas de diferencias centrales y error O(h2):

f (xi +1 ) − f (xi −1 )
f ' (x i ) =
2⋅h
f (xi +1 ) − 2 ⋅ f (x i ) + f (x i −1 )
f ' ' (x i ) =
h2

Sin embargo, estas fórmulas no permiten calcular las derivadas de los


puntos extremos en la lista (i=1, i=21). Para calcular las derivadas en
x1 se requieren fórmulas de diferencia finita hacia delante, y para
calcular las derivadas en x21 se requieren fórmulas de diferencia finita
hacia atrás, todas ellas con error O(h2).

108
Fórmulas de
diferencias finitas
EJEMPLO:

− f (x i + 2 ) + 4 ⋅ f (x i +1 ) − 3 ⋅ f (x i ) 3 ⋅ f (x i ) − 4 ⋅ f (x i −1 ) + f (x i −2 )
f ' (x i ) = f ' (x i ) =
2⋅h 2⋅h
− f (x i +3 ) + 4 ⋅ f (x i + 2 ) − 5 ⋅ f (x i +1 ) + 2 ⋅ f (x i ) 2 ⋅ f (x i ) − 5 ⋅ f (x i −1 ) + 4 ⋅ f (x i −2 ) − f (x i −3 )
f ' ' (x i ) = f ' ' (x i ) =
h2 h2

Con estas expresiones:

− f (x3 ) + 4 ⋅ f (x 2 ) − 3 ⋅ f (x1 ) − (2.023 ) + 4 ⋅ (1.982) − 3 ⋅ (1.946 )


f ' (x1 ) = = = .067
2⋅h 2 ⋅ (0.5 )
f (x3 ) − f (x1 ) (2.023 ) − (1.982)
f ' (x 2 ) = = = .077
2⋅h 2 ⋅ (0.5 )
M
f (x21 ) − f (x19 ) (13.791) − (13.572 )
f ' (x20 ) = = = 0.219
2⋅h 2 ⋅ (0.5 )
3 ⋅ f (x 21 ) − 4 ⋅ f (x 20 ) + f (x19 ) 3 ⋅ (13.791) − 4 ⋅ (13.696 ) + f (13.572)
f ' (x21 ) = = = 0.161
2⋅h 2 ⋅ (0.5 )

109
Fórmulas de
diferencias finitas
EJEMPLO:

Adicionalmente:
− f (x 4 ) + 4 ⋅ f (x3 ) − 5 ⋅ f (x2 ) + 2 ⋅ f (x1 ) − (2.073 ) + 4 ⋅ (2.023 ) − 5 ⋅ (1.982) + 2 ⋅ (1.946 )
f ' ' (x1 ) = = = 0.004
h2 (0.5 )2
f (x3 ) − 2 ⋅ f (x2 ) + f (x1 ) (2.023 ) − 2 ⋅ (1.982) + (1.946 )
f ' ' (x 2 ) = = = 0.020
h2 (0.5)2
M
f (x21 ) − 2 ⋅ f (x20 ) + f (x19 ) (13.791) − 2 ⋅ (13.696 ) + (13.572)
f ' ' (x20 ) = = = −0.116
h2 (0.5)2
2 ⋅ f (x 21 ) − 5 ⋅ f (x20 ) + 4 ⋅ f (x19 ) − f (x18 ) 2 ⋅ (13.791) − 5 ⋅ (13.696 ) + 4 ⋅ (13.572) − (13.402)
f ' ' (x21 ) = = = −0.048
h2 (0.5)2
Los valores numéricos para todos los puntos se pueden utilizar para
encontrar el punto de equivalencia. Se sabe que este punto es aquel en
el que la función PH=f(V) posee un punto de inflexión, es decir, aquel en
el que (dPH/dV)=f(V) es máxima, o aquel en el que (d2PH/dV2)=f(V) es
igual a cero.

110
Fórmulas de
diferencias finitas
EJEMPLO:
Los valores numérico obtenidos son:
2 2
i V (ml) PH dPH/dV d PH/dV
1 0.12 1.946 0.067 0.004
2 0.62 1.982 0.077 0.020
3 1.12 2.023 0.091 0.036
4 1.62 2.073 0.110 0.040
5 2.12 2.133 0.135 0.060
6 2.62 2.208 0.170 0.080
7 3.12 2.303 0.219 0.116
8 3.62 2.427 0.294 0.184
9 4.12 2.597 0.418 0.312
10 4.62 2.845 0.641 0.580
11 5.12 3.238 1.111 1.300
12 5.62 3.956 2.457 4.084
13 6.12 5.695 6.348 11.480
14 6.62 10.304 6.348 -11.480
15 7.12 12.043 2.457 -4.084
16 7.62 12.761 1.111 -1.300
17 8.12 13.154 0.641 -0.580
18 8.62 13.402 0.418 -0.312
19 9.12 13.572 0.294 -0.184
20 9.62 13.696 0.219 -0.116
21 10.12 13.791 0.161 -0.048

111
Fórmulas de
diferencias finitas
EJEMPLO:
PH vs . volum e n de re activo añadido (dPH/dV) vs . volum e n de re activo añadido

16 7.000
14 6.000
12
5.000
10

dPH/dV
4.000
PH

8
3.000
6
2.000
4
2 1.000

0 0.000
0 2 4 6 8 10 0 2 4 6 8 10
V (m l) V (m l)

(d 2 PH/dV 2) vs . volum e n de reactivo añadido (d 2PH/dV 2 ) vs. volum e n de re activo añadido


(Es calas am pliadas )

15.000
2.000

10.000 1.500
Punto de equivalencia
1.000 V=6.37 ml
5.000
d 2 PH/dV 2

d 2 PH/dV 2 0.500
0.000 0.000
0 2 4 6 8 10 6.34 6.35 6.36 6.37 6.38 6.39 6.4
-5.000 -0.500

-1.000
-10.000
-1.500

-15.000 -2.000
V (m l) V (m l)

112
Diferenciación de
datos con errores
Cuando se van a calcular derivadas f(n)(xi) a partir de datos
experimentales de los que se sospecha poseen errores aleatorios,
no se recomienda utilizar ni las fórmulas de diferencias finitas ni las
fórmulas deducidas a partir de la derivación de polinomios de
interpolación como los de Lagrange.

Ambas expresiones (diferencias finitas y derivadas de polinomios


de Lagrange) se fundamentan en funciones de interpolación que,
tal cual se mencionó en el capítulo de aproximación funcional, no
son adecuadas para manejar datos con errores.

En su lugar, se recomienda ajustar una función f(x) a los datos


mediante un procedimiento de mínimos cuadrados y derivar esta
función para encontrar f(n)(x). Esta última función puede evaluarse
en cualquiera de los xi o valores intermedios.

113
Diferenciación de
datos con errores
Si se utilizan fórmulas basadas en funciones de interpolación
para diferenciar datos con errores, estos errores se
amplifican.

Gráficamente:

a) Datos exactos
b) Datos modificados ligeramente
c) Diferenciación de a)
d) Diferenciación de b)

114
Diferenciación de
datos con errores
EJEMPLO: Encuentre los valores de la pendiente y la
curvatura asociadas a cada uno de los puntos en la siguiente
tabla:
Datos
i xi yi
1 0 -7.0619
2 1 4.784551
3 2 4.533839
4 3 -1.99953
5 4 -3.40819
6 5 7.86434
7 6 28.6778

Los datos fueron medidos en el laboratorio con instrumentos


de baja precisión y caracterizan un fenómeno en el que la
relación de las variable estudiadas está dada por la ecuación
y=a0+a1.x+a2.x2+a3.x3

115
Diferenciación de
datos con errores
EJEMPLO:

Mediante mínimos cuadrados se encuentran los parámetros que mejor


ajustan la función a los datos:

y (x ) = −6.5853 + 18.272 ⋅ x − 8.8088 ⋅ x 2 + 1.1278 ⋅ x 3

Diferenciando:

y ' (x ) = 18.272 − 2 ⋅ (8.8088 ) ⋅ x + 3 ⋅ (1.1278 ) ⋅ x 2


y ' ' (x ) = −2 ⋅ (8.8088 ) + 6 ⋅ (1.1278 ) ⋅ x

Con estas funciones se encuentran los siguientes resultados


Derivadas
i y'i y''i
1 18.27218 -17.6176
2 4.038054 -10.8506
3 -3.42908 -4.08364
4 -4.12923 2.683349
5 1.937618 9.450339
6 14.77145 16.21733
7 34.37227 22.98432

116
Diferenciación de
datos con errores
EJEMPLO:
Gráfico de dispersión de datos originales y las derivadas

80

y = 1.1278x3 - 8.8088x2 + 18.272x - 6.5853


60
R2 = 0.9869

40 y' = 3(1.1278)x2 - 2(8.8088)x + 18.272

y'' = 6(1.1278)x - 2(8.8088)


yi, y'i, y''i

20

0
-1 0 1 2 3 4 5 6 7

-20

-40
xi

117
Referencias
REFERENCIAS
"Métodos matemáticos aplicados en ingeniería química«. Heberto Tapias,
Luz Amparo Palacio. U. de Antioquia.

Chapra S.,C., Canale R.,P.(2002). Métodos numéricos para ingenieros.


México: McGrawHill. Secciones: 5.1, 5.2 5.2.1, 5.2.2, 5.4, 6.1, 6.1.1, 6.1.2,
6.2, 6.2.2, 6.2.3, 6.5, 6.5.1, 6.5.2.

Biegler L.T., Grossmann I.E., Westerberg A.W. (1997). Systematic methods


of chemical process design. Upper Saddle River: Prentice Hall. Sección 8.3

Henao C.A. (2005 ). Simulación y Evaluación de Procesos Químicos.


Medellín: UPB. Secciones: 2.2.1, 2.2.2, 2.2.5.

118
Referencias
REFERENCIAS
"Métodos matemáticos aplicados en ingeniería química«. Heberto Tapias,
Luz Amparo Palacio. U. de Antioquia.

Chapra S.,C., Canale R.,P.(2002). Métodos numéricos para ingenieros.


México: McGrawHill. Secciones: PT6.1, PT6.2, PT6.3, 21.1, 21.1.1, 21.1.2,
21.2, 21.2.1, 21.2.2, 21.2.3, 21.3, 22.3, 22.3.2, 22.3.3, 23.1, 23.3, 23.4,
25.1, 25.3, 25.3.1, 25.3.2, 25.3.3, 25.5, 25.5.1, 25.5.2, 25.5.3, 26.1,
26.2.3.

Rice R.,G., Do D.,D.(1995). Applied mathematics and modeling for chemical


engineers. New York: John Wiley. Secciones: 7.3, 7.4, 7.5, 7.6, 7.7, 7.8.

Hoffman J.,D. (1992). Numerical methods for engineers and scientists. New
York: Marcel Dekker. Secciones: 7.14.3

Notas de clase curso Métodos numéricos para ingenieros químicos. I.Q.


Carlos A. Henao © U.P.B. 2005

Queda prohibida la reproducción total o parcial, copia, uso, distribución, comercialización,


comunicación pública o cualquier otra actividad que se pueda hacer con el contenido. No se
responsabiliza de la mala utilización de los contenidos de presentación por parte del usuario.

También podría gustarte