Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ajuste de Curvas Regresion Lineal y No Lineal
Ajuste de Curvas Regresion Lineal y No Lineal
Introduccin al ajuste de
ecuaciones a curvas
Tipos de Modelizacin Matemtica
Fundamentos tericos de la regresin
lineal y no lineal
Ejemplos en Ciencias Experimentales
Diapositiva 1
Cmo interpretar los datos de un experimento?
[S] : 1.2
Reaccin Enzimtica
v:
8.4
9.4
9.5
Describir el sistema
Cuantitativa (ecuacin)
Cualitativa (palabras)
y = f(x)
(S)
(S)
Modelizacin Emprica
v = a + b[S] + c[S]2
Modelizacin Terica
E + S ES P + E
v=
Diapositiva 2
Vmax [S]
KM + [S]
2)
Modelizacin Emprica
Situacin:
Sistema
Estmulo
Respuesta
(Mecanismo
desconocido)
Ecuacin emprica
Inters:
Ecuaciones : Polinomios :
y = a + bx + cx 2
y = (a + bx + cx 2 + dx 3 )i
Cubic splines :
Diapositiva 3
y n = a + bx + cx 2 + ...nx n
Diapositiva 4
5)
Modelizacin Terica
En ecuaciones algebricas
+L
M0
K1
[M1]
K1 =
[M0] [L]
y=
En ecuaciones diferenciales
+L
M1
K2
E*S
E* + S
M2
[M2]
K2 =
[M1] [L]
K1[L] + 2K1K2[L]2
2(1 + K1[L] + K1K2[L]2 )
d[ES*]
= k1[S][E*] - (k - 1 + kcat)[ES*]
dt
d[P]
= kcat [ES*]
dt
........... etc
Diapositiva 5
6)
Ecuaciones algebricas habituales
De una variable y varios parmetros :
Decaimiento exponencial:
v=
Suma de Michaelis-Menten:
Unin Ligandos: y =
V max(1) [S]
V max(2) [S]
+
K m(1) + [S] K m(2) + [S]
Diapositiva 6
Otras ecuaciones algebricas
De dos variables y varios parmetros :
Inhibicin competitiva : v =
Ping Pong Bi Bi :
v=
Vmax [S]
[I]
Km 1 +
+ [S]
KI
Vmax [A][B]
K B ([ A] ) + K A ([ A] ) + [A][B]
Diapositiva 7
Linealidad de una ecuacin
Linealidad en las vaariables
Ecuacin lineal
Ecuacin no lineal
y
y
x
x
Linealidad en los parmetros
Ecuacin lineal
y = a + bx + cx
Ecuacin no lineal
y = Ae - k x
Ejemplos
y = a + bx
y = a + bx + cx 2
y = Ae -kx
(Lineal en variables,
lineal en parmetros)
Diapositiva 8
1) Ordenada en el origen
Y=f(x)+C
Y=f(x)
a
(0,0)
(0,0)
v=
v=
Vmax [S]
KM + [S]
(mal)
ap
Vmax
[S]
ap
KM
+ [S] + K -SI1 [S]2
(bien)
(Mximos, mnimos)
Diapositiva 9
Datos
x y
y= a+bx+cx
1
2
3
...
Procedimiento:
encontrar los valores
de los parmetros
que mejor ajustan
la ecuacin a los datos
Ecuacin no lineal
Datos
[L] y
8.4
5.6
3.4
.. .
y=
K1 [L] + 2 K1 K2 [L]
2
n ( 1+ K1 [L] +2 K1 K2 [L]
Procedimiento:
0.1 0.9
0.2 0.6
0.5 0.4
... ...
Regresin no lineal
Regresin lineal
[L]
Diapositiva 10
Criterios de Ajuste
1) Minimizar residuales al cuadrados (Mnimos Cuadrados)
(Norma L2)
residual
residual
y
residual
residual
residual
Diapositiva 11
Objetivos
Regresin lineal
Regresin no lineal
SSQ = (y i ( a + bx i )) 2
SSQ = (y i Ae -kx i )) 2
(SSQ)
= ............... = 0 A = ?
A
(SSQ)
= ............... = 0 k = ?
k
(SSQ)
= .......... ..... = 0 a = .........
a
(SSQ)
= .......... ..... = 0 b = ..........
b
f = C + B 1 x 1 + B 2 x 2 + B 3x 3
Diapositiva 12
YXP=R
( Y X P )( Y X P ) = SSQ
(SSQ)
= 0 ( X)T ( Y X P ) + ( Y X P )T ( X ) = 0
2 X ( Y X P ) = 0 ( X X ) P = X Y
T
P = ( X X ) 1 X Y
T
Diapositiva 13
WSSQ
Mnimo local
Mnimo
global
Pa
rm
etr
o
tro
me
Par
1.
2.
3.
Lo recomendable es alcanzar
un mismo mnimo a partir de
diferentes estimas iniciales de
los parmetros
Diapositiva 14
15)
Algoritmos iterativos en regresin no lineal
Gradiente (Gauss-Newton, Marquardt)
p1
x
x
x
x
x x
x
x
pi +1 = pi + i ui
x
x
x
x
W SSQ
Diapositiva 15
Bondad de un ajuste en regresin lineal
(Respecto a los residuales)
Sumatorio de residuales al cuadrado :
SSQ = (y i f (p, x i )) 2
Varianza y desviacin estandar del ajuste :
SSQ
S2 =
y S = S2
nm
( ( y - y )(y - y ))
(y - y ) (y - y )
2
R2 =
i, c
i, c
=1-
SSQreg
SSQtotal
+1
0
-1
Diapositiva 16
17)
Matriz de correlacin
p p = Cov [ pi , p j ]
var(p1)
..
..
..
cov(p(1),
p(n))
..
..
var(pn)
Lmites de confianza :
Coeficient e de variacin :
1 .0
0 .98
0 .56
0 .98
1 .0
0 .17
var p i var p j
0 .56
0 .17
1 .0
pi t (n - m, ) var( pi )
CV%(p i ) =
( VAR(p ) p ) 100
Diapositiva 17
t=
0 - pi
var( pi )
(p<0.05)
Diapositiva 18
19) El criterio de los mnimos cuadrados
Regresin con pesos estadsticos
El criterio de mnimos cuadrados asume que:
La variable x no tiene error
Todos los errores (ui, u j , ... ) siguen una distribucin normal de media
cero y varianza constante (todas las medidas tienen la misma precisin )
w i = 1 si2
(weight)
Diapositiva 19
1
VAR (v i )
1
VAR (1 v i )
pero VAR ( 1 v i ) =
wi =
v i4
VAR (v i )
Diapositiva 20
VAR (v i)
v i4
21)
v=
(n)[ S ]
V
Vmax (1)[ S ] Vmax (2)[ S ]
+
+ ......... + max
K M (n) + [ S ]
K M (1) + [ S ] K M (2) + [ S ]
Diapositiva 21
Discriminacin por superposicin de ajustes
Diapositiva 22
Ajuste a ecuaciones de 2 variables
Ecuacin:
Inhibicin competitiva : v =
Datos:
Vmax [S]
[I ]
Km 1 +
+ [S]
I
K
Inhibidor :
2 .......
Sustrato :
8 ......
6.3
7.1
9.1
3.2
5.2
6.4
7.5 ........
velocidad : 5.2
Diapositiva 23
24)
Superficie ajustada
v=
Vmax [S]
[I ]
Km 1 +
+ [S]
KI
Diapositiva 24
Modelizacin en ecuaciones diferenciales
Ecuacin diferencial simple
Ejemplo : Cintica de orden uno
d [E]
d [A]
= k [A]
dt
d [S]
-1
dt
1 X ES
2 E + P
ZZZZZ
E + S YZZZZ
Z
k
k
A
-kt
= - k1[E][S] + k-1[ES]
dt
d [ES]
= k1[E][S] - k-1[ES] - k2 [ES]
dt
d [P]
= k2 [ES]
dt
Integran numricamente (Adams, Gear...)
Diapositiva 25
Ajuste de ecuaciones diferenciales
Modelo de Michaelis-Menten reversible
k
k
1 ES ZZZZZZ
2 XE + P
ZZZZZX
E + S YZZZZZ
YZZZZZ
Z
k
k
-1
d [E]
=
dt
d [S]
=
dt
d [ES]
=
dt
d [P]
=
dt
Datos
[S]
[P]
[ES]
[E]
-2
8.7
0.1
- k1[E][S] + k-1[ES]
7.7
7.1
0.8
1.2
0.02
0.04
0.07
0.03
6.5
6.1
1.8
2.3
0.07
0.08
0.02
0.01
..
..
..
k2 [ES]- k-2[P][E]
Diapositiva 26
..
10
Sustrato
Producto
27)
En la diapositiva 27 puede
observarse el ajuste de las ecuaciones
diferenciales comentadas en el punto
anterior a unos datos experimentales
simulados. Estas integraciones y ajustes
con ecuaciones diferenciales ordinarias
se pueden hacer en SIMFIT con el
programa DEQSOL.
Enzima.Sustrato
Enzima
Diapositiva 2
Ejemplo de regresin no lineal con SIMFIT
Con una preparacin enzimtica de dos isoenzimas se realiz el siguiente estudio:
8 puntos experimentales, en el margen de concentraciones de 0.05 a 50 mM,
espaciados logartmicamente y realizndose 5 rplicas por punto (40 datos en total).
[S]
0.050
0.0530
0.0006
0.050
0.0531
0.0006
0.050
0.0523
0.0006
0.050
0.0522
0.0006
0.050
0.0520
0.0006
..
..
..
50.0
1.73
0.06
50.0
1.86
0.06
50.0
1.86
0.06
50.0
1.77
0.06
50.0
1.76
0.06
v=
w i = 1 si2
WSSQ = (1 si2 )(v i f ( p , [S ]i ) 2
Diapositiva 28
Ajuste a 1 Funcin de Michaelis-Menten
Iteracin
WSSQ (1:1)
Algoritmo Bsqueda al azar
0
3.627E+04
1
7.945E+03
14
1.308E+03
Bsqueda 1 terminada (Sigma = 1.00)
43
1.131E+03
46
6.811E+02
61
6.444E+02
Bsqueda local terminada (Sigma = 0.10, 0.20)
WSSQ antes de la bsqueda = 3.627E+04
WSSQ despus de la bsqueda = 6.444E+02
Estimas iniciales de los parmetros
Vmax(1) = 1.609E+00
Km(1) = 1.669E+00
WSSQ antes del ajuste
= 6.444E+02
WSSQ despus del ajuste = 2.428E+02
Algoritmo Cuasi-Newton
redundancia : t =
N Parmetro
Valor
Err. estnd.
...Lm.conf.95%..
1
Vmax(1)
1.617E+00
2.90E-02
1.56E+00
1.68E+00
2
Km(1)
1.525E+00
3.68E-02
1.45E+00
1.60E+00
Diapositiva 29
p
0.000
0.000
0 - pi
var( pi )
(p<0.05)
Matriz de correlacin de
1.000
0.876 1.000
si
Var.indep. Err.estnd.
5.000E-02
6.381E-04
5.000E-02
6.381E-04
5.000E-02
6.381E-04
5.000E-02
6.381E-04
5.000E-02
6.381E-04
los parmetros
yexp.
yajus.
yexp.- yajus.
Var.dep.
5.295E-02
5.309E-02
5.226E-02
5.219E-02
5.151E-02
Teora
5.133E-02
5.133E-02
5.133E-02
5.133E-02
5.133E-02
Residuales
1.618E-03
1.759E-03
9.279E-04
8.599E-04
1.809E-04
Resids.pond.
2.536E+00
2.757E+00
1.454E+00
1.348E+00
2.836E-01
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
.........
5.000E+01
5.000E+01
5.000E+01
5.000E+01
5.000E+01
5.995E-02
5.995E-02
5.995E-02
5.995E-02
5.995E-02
1.729E+00
1.865E+00
1.855E+00
1.773E+00
1.763E+00
1.569E+00
1.569E+00
1.569E+00
1.569E+00
1.569E+00
1.600E-01
2.958E-01
2.865E-01
2.041E-01
1.937E-01
2.669E+00*
4.934E+00**
4.779E+00**
3.404E+00**
3.231E+00**
11
Diapositiva 30
Anlisis global de los residuales (importante)
Anlisis de Residuales
Anlisis de residuales: WSSQ
P(Ji-cuadrado >= WSSQ)
R-cuadrado, cc(teora-datos)^2
Mayor err. rel. en residuales
Menor err. rel. en residuales
Media de err.rel. en residuales
Residuales con err.rel. 10-20 %
Residuales con err.rel. 20-40 %
Residuales con err.rel. 40-80 %
Residuales con err.rel. > 80 %
Nmero residuales < 0 (m)
Nmero residuales > 0 (n)
Nmero de rachas observadas (r)
P(rachas =< r , dados m y n)
Valor en cola inferior al 5%
Valor en cola inferior al 1%
P(rachas =< r , asumiendo m+n)
P(signos =< menor n observado)
Estadstico de Durbin-Watson
W de Shapiro-Wilks (resid.pond.)
Nivel de significancia de W
Test AIC de Akaike (SC Schwarz)
Veredicto sobre bondad ajuste:
Diapositiva 31
Diapositiva 32
31)
A continuacin se muestra un
anlisis global de los residuales. Se da
el valor de WSSQ, que si el ajuste es
bueno debiera seguir una distribucin
Ji-cuadrado con n-par. grados de
libertad, extremo que se encarga de
analizar la p correspondiente, que en
este caso vale 0.000 (p < 0.05) y hace
que se levante una bandera a la
derecha con un Rechazar al 1 % de
significancia. Luego sigue el valor de
R2, la media de los errores relativos de
los residuales, el n de residuales
positivos y negativos, el n de rachas, la
p del test de las rachas, que en este
caso vale 0.000 (p < 0.05) y hace que se
levante la bandera correspondiente.
(Ver Diap. 31).
32) El programa permite hacer
tambin una grfica de los residuales,
en este caso de residuales ponderados
(considerando sus pesos) en ordenadas
frente a los valores tericos ajustados
(Diap. 32). Para este ajuste se observan
7 rachas, que son pocas para 40
residuales, donde cabra esperar una
distribucin ms al azar y por tanto
mayor nmero de rachas. Esto significa
un ajuste sesgado, lo que unido al
anlisis hecho en el punto anterior (31),
nos va llevando a la conclusin de que
la bondad de este ajuste es escasa.
12
Diapositiva 33
Ajuste a 2 Michaelis-Menten
Iteracin
WSSQ (2:2)
0
3.627E+04
Algoritmo
1
1.045E+04
7
3.393E+03
21
1.262E+03
30
8.976E+02
143
5.505E+02
Bsqueda 1 terminada (Sigma = 1.00)
185
5.462E+02
195
4.145E+02
202
3.354E+02
222
2.044E+02
Bsqueda local terminada (Sigma = 0.10, 0.20)
bsqueda al azar
Algoritmo Cuasi-Newton
Parmetro
Vmax(1)
Vmax(2)
Km(1)
Km(2)
Valor
Err. estnd.
9.317E-01
6.70E-02
1.033E+00
8.81E-02
9.823E+00
2.39E+00
1.033E+00
6.43E-02
...Lm.conf.95%..
7.96E-01
1.07E+00
8.55E-01
1.21E+00
4.97E+00
1.47E+01
9.03E-01
1.16E+00
p
0.000
0.000
0.000
0.000
Las 4 p
son < 0.05 ,
parmetros
distintos 0
Diapositiva 34
35)
Err.estnd.
6.381E-04
6.381E-04
6.381E-04
6.381E-04
6.381E-04
......
......
5.995E-02
5.995E-02
5.995E-02
5.995E-02
5.995E-02
Var.dep.
5.295E-02
5.309E-02
5.226E-02
5.219E-02
5.151E-02
.......
.......
1.729E+00
1.865E+00
1.855E+00
1.773E+00
1.763E+00
Teora
5.242E-02
5.242E-02
5.242E-02
5.242E-02
5.242E-02
......
......
1.791E+00
1.791E+00
1.791E+00
1.791E+00
1.791E+00
Residuales
5.310E-04
6.720E-04
-1.590E-04
-2.270E-04
-9.060E-04
.......
.......
-6.235E-02
7.345E-02
6.415E-02
-1.825E-02
-2.865E-02
Resids.pond.
8.322E-01
1.053E+00
-2.491E-01
-3.557E-01
-1.420E+00
......
......
-1.040E+00
1.225E+00
1.070E+00
-3.044E-01
-4.779E-01
Diapositiva 35
= 3.442E+01
(disminuy (antes 2.43E+02))
= 0.544
Test 2 (buen ajuste p > 0.05)
= 0.998
=
6.64 %
=
0.21 %
=
1.96 % (disminuy (antes 5.66 %))
=
0.00 %
=
0.00 %
=
0.00 %
=
0.00 %
=
21
=
19
(aument (antes 7 ))
=
18
= 0.217 (test rachas (buen ajuste ( p > 0.05 ))
=
15
=
13
= 0.261
= 0.875
= 2.019
= 0.982
= 0.776
= 1.495E+02 ( 1.489E+02)
increible
Diapositiva 36
13
Diapositiva 37
14
39)
Resultados del test F
WSSQ previo
WSSQ actual
N parmetros previos
N parmetros actuales
N de valores x
Akaike AIC previo
Akaike AIC actual
Schwarz SC previo
Schwarz SC actual
Mallows Cp (Cp/M1)
Grad. lib. numerador
Grad. lib. denominador
Estadstico F (EF)
P(F >= EF)
P(F =< EF)
Cola superior al 5%
Cola superior al 1%
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
Diapositiva 39
40)
Diapositiva 40
Bibliografa
1) William G. Bardsley, SIMFIT: Reference manual (2004), http://www. simfit. man. ac.uk.
2) H. J. Motulsky and A. Christopoulos, Fitting models to biological data using linear
and nonlinear regression. A practical guide to curve fitting (2003), http://www.
graphpad.com.
3) Leah Edelstein-Keshet, Mathematical Models in Biology (1988) , McGraw-Hill.
4) Paul Doucet and Peter B. Sloep, Mathematical Modeling in the Life Sciences (1992) ,
Ellis Horword.
5) Laszlo Endrenyi (Ed.), Kinetic Data Analysis. Design and Analysis of Enzyme and
Pharmacokinetic Experiments (1981), Plenum Press.