Documentos de Académico
Documentos de Profesional
Documentos de Cultura
apuntesIC4 PDF
apuntesIC4 PDF
IDENTIFICACION DE SISTEMAS
CONTROL ADAPTATIVO
CONTROL PREDICTIVO
Daniel Rodr
guez Ram
rez
Carlos Bordns Alba
o
Rev. 5/05/2005
Indice general
Lista de guras
IX
10
12
15
INDICE GENERAL
ii
1.6.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
17
1.6.3. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
19
. . . . . . . . . . .
19
20
20
21
21
22
24
24
27
28
30
1.9.2.1. Clculo de Ke . . . . . . . . . . . . . . . . . . . . . . .
a
32
. . . . . . . . . .
34
35
36
41
INDICE GENERAL
iii
43
43
45
2.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
o
45
46
46
48
51
3.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
o
51
52
52
53
54
54
3.2.4.1. Identicacin en l
o
nea . . . . . . . . . . . . . . . . . .
54
55
55
57
58
INDICE GENERAL
iv
58
59
60
62
4. Identicacin por m
o
nimos cuadrados
63
63
65
67
4.4. M
nimos cuadrados ponderados . . . . . . . . . . . . . . . . . . . . . .
70
4.5. M
nimos cuadrados extendidos y generalizados . . . . . . . . . . . . . .
71
72
73
73
73
74
77
78
81
81
INDICE GENERAL
82
84
87
89
93
93
95
96
6.2.1. El regulador de m
nima varianza generalizado . . . . . . . . . .
99
105
INDICE GENERAL
vi
117
. . . . . . 132
INDICE GENERAL
vii
9. Controladores predictivos
135
151
. . . . . . . . . . . . . . . . . . . . . . 156
viii
INDICE GENERAL
Indice de guras
1.1. Diagrama de bloques de la representacin en espacio de estados de un
o
sistema LTI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.3. Diagrama de bloques de un sistema LTI controlado mediante una realimentacin del vector de estados que estima el estado con un observador. 31
o
1.4. Diagrama de bloques de un observador de orden completo. . . . . . . .
31
. . . . . . .
47
48
. . . . . . . . . . . . . . . . . .
55
57
59
67
75
ix
INDICE DE FIGURAS
4.3. Misma situacin que en la gura 4.2 pero con una seal de entrada
o
n
1
senoidal de frecuencia = 1 rad s . . . . . . . . . . . . . . . . . . .
75
82
. . . .
84
. . . .
85
86
87
88
94
95
. . . . . . . . . . . . . . .
99
. . . . . . . . . . . . . 101
7.1. PID industrial moderno con funcin de autoajuste (ABB modelo ECA). 107
o
7.2. Determinacin de T y L por areas. . . . . . . . . . . . . . . . . . . . . 109
o
INDICE DE FIGURAS
xi
. . 112
. . . . . . . . . . . . 113
xii
INDICE DE FIGURAS
Cap
tulo 1
Control de sistemas discretos en el
espacio de estados
1.1.
Las variables de estado se agrupan en el llamado vector de estado y el espacio ndimensional que determinan los posibles valores de esas variables, se denomina espacio
de estados.
La dinmica de un sistema se puede describir en funcin del valor del vector de
a
o
estados y de la seal de entrada (asumiendo que el sistema es no autnomo mediante
n
o
1
(1.1)
x(k+1)
+
z-1
u(k)
x(k)
G
Figura 1.1: Diagrama de bloques de la representacin en espacio de estados de un sistema LTI.
o
1.2.
Y (z)
b0 + b1 z 1 + b2 z 2 + + bn z n
=
U (z)
1 + a1 z 1 + a2 z 2 + + an z n
(1.3)
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
1.2.1.
Y (z)
U (z)
(1.4)
se obtiene:
(1.5)
(1.6)
con:
(1.7)
Y (z) =
1 + a1 z 1 + a2 z 2 + + an z n
Por otra parte, teniendo en cuenta la expresin de Y (z) se puede denir un Q(z) que
o
cumple que:
Q(z) =
Y (z)
U (z)
=
1 + + (b a b )z n
1 + + a z n
(b1 a1 b0 )z
1 + a1 z
n
n 0
n
(1.8)
De ah se obtiene que:
(1.9)
(n1)
Q(z)
Xn (z) = z 1 Q(z)
lo que teniendo en cuenta las propiedades de la transformada Z, implica que:
zX1 (z) = X2 (z)
zX2 (z) = X3 (z)
(1.11)
(1.12)
x2 (k + 1) = x3 (k)
xn1 (k + 1) = xn (k)
Ntese que segn la ultima igualdad de (1.11) se tiene que Q(z) = zXn (z), luego
o
u
(1.13)
o lo que es lo mismo:
xn (k + 1) = an x1 (k) an1 x2 (k) a1 xn (k) + u(k)
(1.14)
x1 (k + 1)
0
1
0
0
x1 (k)
0
x2 (k + 1) 0
0
1
0 x2 (k) 0
.
.
.
.
.
.
.
.
.
.
.
.
.
= .
+ . u(k)
.
.
.
.
.
.
xn1 (k + 1) 0
0
0
1 xn1 (k) 0
xn (k + 1)
an an1 an2 a1
xn (k)
1
(1.15)
Por otra parte, podemos reescribir tambin (1.10) teniendo en cuenta las igualdades
e
de (1.11) de manera que:
Y (z) = (b1 a1 b0 )Xn (z) + (b2 a2 b0 )Xn1 (z) + + (bn an b0 )X1 (z)
(1.16)
y(k) =
bn an b0 bn1 an1 b0 b1 a1 b0
x1 (k)
x2 (k)
.
.
.
xn1 (k)
xn (k)
+ b0 u(k)
(1.18)
Las ecuaciones (1.15) y (1.18) forman una representacin en espacio de estados del
o
sistema descrito por la funcin de transferencia (1.3) que se denomina forma cannica
o
o
controlable.
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
1.2.2.
(1.19)
(1.20)
(1.21)
(1.22)
(1.23)
0
x1 (k + 1)
1
x2 (k + 1)
.
.
= .
.
.
0
xn1 (k + 1)
xn (k + 1)
y(k) =
(1.24)
bn a n b0
x1 (k)
0 0 0 an
x2 (k) bn1 an1 b0
0 0 0 an1
.
.
.
. .
.
.
.
.
. .
.
+
.
.
.
. .
.
0 1 0 a2 xn1 (k) b2 a2 b0
b1 a 1 b0
xn (k)
0 0 0 1 a1
x1 (k)
x2 (k)
.
.
0 0 0 1
+ b0 u(k)
.
xn1 (k)
xn (k)
u(k)
(1.25)
1.3.
podemos tomar otras variables de estado que describan la dinmica del sistema que
a
sean a su vez combinaciones lineales de las variables de estado originales, o considerar
que stas son a su vez combinaciones lineales de otras. Dicho de otro modo, dado un
e
sistema LTI como el descrito en (1.1) podemos considerar que el vector de estado x(k)
est relacionado con otro vector x(k) con variables de estado distintas mediante una
a
transformacin:
o
x(k) = P x(k)
(1.26)
donde P es una matriz invertible. Esto se puede llevar a la ecuacin de estado del
o
sistema de manera que obtendr
amos:
P x(k + 1) = GP x(k) + Hu(k)
Premultiplicando por P 1 :
x(k + 1) = P 1 GP x(k) + P 1 Hu(k)
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
(1.27)
(1.28)
1.4.
1.4.1.
Procedimiento recursivo
Iterando las ecuaciones del estado para un sistema LTI como (1.1) a partir de k = 0:
x(1) = Gx(0) + Hu(0)
x(2) = Gx(1) + Hu(1) = G2 x(0) + GHu(0) + Hu(1)
x(3) = Gx(2) + Hu(2) = G3 x(0) + G2 Hu(0) + GHu(1) + Hu(2)
.
.
.
generalizando para cualquier k > 0:
k1
Gkj1 Hu(j)
x(k) = G x(0) +
(1.29)
j=0
1
Obsrvese que en la ecuacin (1.28) el estado aparece con indicando que el vector de estados
e
o
,
es diferente al original. La salida sin embargo si coincide con la del sistema original pues ambas
representaciones son equivalentes.
RESOLUCION DE LAS ECUACIONES DEL ESPACIO DE ESTADOS
Obsrvese que x(k) depende del estado inicial y de los valores de la entrada. Por otra
e
parte, la salida se puede expresar como:
k1
y(k) = CG x(0) + C
(1.30)
j=0
1.4.2.
Considrese la ecuacin:
e
o
x(k + 1) = Gx(k)
(1.31)
En este caso, al no tener seal de entrada la solucin de la ecuacin viene dada por:
n
o
o
x(k) = (k)x(0)
con:
(k + 1) = G(k)
(0) = I
es decir:
(k) = Gk
A (k) se le llama la matriz de transicin de estados y contiene toda la informacin
o
o
sobre los movimientos libres del sistema descrito por (1.31). Estos movimientos libres
se reeren a los cambios de estado o evolucin del estado del sistema en ausencia de
o
entrada.
En trminos de (k) la solucin de la ecuacin de estados para el sistema (1.1)
e
o
o
viene dada por:
k1
x(k) = (k)x(0) +
(k j 1)Hu(j)
(1.32)
j=0
k1
= (k)x(0) +
(j)Hu(k j 1)
j=0
lo que lleva a:
k1
y(k) = C(k)x(0) + C
(j)Hu(k j 1) + Du(k)
j=0
(1.33)
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
1.4.3.
G =Z
(zI G) z
(1.34)
j=0
0
1
0,16 1
H=
1
1
C=
1 0
z
1
0,16 z + 1
z+1
(z+0,2)(z+0,8)
0,16
(z+0,2)(z+0,8)
1 1
4 1
3 z+0,8
3 z+0,2
1
1
0,8 z+0,2 + 0,8 z+0,8
3
3
1
(z+0,2)(z+0,8)
z
(z+0,2)(z+0,8)
5 1
5 1
3 z+0,8
3 z+0,2
1
4 1
1 z+0,2 + 3 z+0,8
3
(1.35)
RESOLUCION DE LAS ECUACIONES DEL ESPACIO DE ESTADOS
10
5
(0,2)k 5 (0,8)k
3
3
1
3 (0,2)k + 4 (0,8)k
3
(1.36)
El ejemplo se puede completar resolviendo completamente la ecuacin de estado y la
o
de la salida para una seal de entrada dada por:
n
u(k) = 1
k = 0, 1, 2,
x(0) =
1
1
zx(0) + HU (z) =
z
z1
z
z1
z2
z1
z 2 +2z
z1
22
25
z
z
17 z
6
9
18
+ z+0,8 + z1
z+0,2
3,4
7
z
z
17,6 z
6
9
18
+ z+0,8 + z1
z+0,2
y de ahi, antitransformando:
17 (0,2)k + 22 (0,8)k +
6
9
3,4
(0,2)k 17,6 (0,8)k +
6
9
x(k) =
25
18
7
18
1 0 x(k)
17
22
25
= (0,2)k + (0,8)k +
6
9
18
1.4.3.1.
Se observa en el ejemplo 1.1 que gran parte del clculo se emplea en calcular (zI
a
G) . Esto puede ser muy engorroso cuando el orden de las matrices involucradas es
superior a 3. A continuacin se detalla un procedimiento alternativo para esos casos.
o
En primer lugar es conocido que, por denicin de matriz inversa:
o
1
(zI G)1 =
Adj(zI G)
|zI G|
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
11
a1 = traza(G)
a2 = 1 traza(GH1 )
2
H1 = G + a 1 I
0
1
0,16 1
1
1
0,16 0
= 0,16
DISCRETIZACION DE LAS ECUACIONES DE ESTADO CONTINUAS
12
Adj(zI G) = Iz +
=
Finalmente:
(zI G)1
z+1 1
0,16 z
=
(z + 0,2)(z + 0,8)
1.5.
y = Cx + Du
(1.37)
(1.38)
donde puede observarse que las matrices G y H dependen del tiempo de muestreo T .
Para determinar el valor de G(T ) y H(T ) usaremos la solucin de la ecuacin de estado
o
o
en tiempo continuo:
t
eA Bu( )d
(1.39)
para
kT t kT + T
(1.40)
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
13
Se tiene que:
(k+1)T
eA Bu( )d
(1.41)
0
kT
x(kT ) = e
AkT
x(0) + e
AkT
eA Bu( )d
(1.42)
eA Bu( )d
(1.43)
kT
eA Bu(kT )d
0
= eAT x(kT ) +
eA Bu(kT )d
(1.44)
donde = T . Sea:
G(T ) = eAT
H(T ) =
T
0
eA d B
(1.45)
(1.46)
(1.47)
(1.48)
DISCRETIZACION DE LAS ECUACIONES DE ESTADO CONTINUAS
14
A=
Para ello se calcula:
(sI A) =
s 0
0 s
0 1
0 2
s 1
0 s+2
1
s
1
s(s+2)
1
(s+2)
1
0
1
(1
2
e2t )
e2t
Ejemplo 1.4
Como ejemplo de discretizacin de las ecuaciones de estado en tiempo continuo, cono
sidrese el siguiente sistema:
e
x = ax + u
y = x
Usando las expresiones de (1.45) se obtiene:
G(T ) = eAT
= eaT
y
H(T ) =
=
=
T A
e d
0
T a
e d
0
aT
1e
a
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
15
Luego:
x(k + 1) = eaT x(k) +
y(k) = x(k)
1.6.
1eaT
a
u(k)
Controlabilidad y Observabilidad
1.6.1.
Controlabilidad
Gnj1 Hu(jT )
x(nT ) = G x(0) +
j=0
16
CONTROLABILIDAD Y OBSERVABILIDAD
x(nT ) Gn x(0) =
.
.
.
H . GH . . Gn1 H
.
.
.
donde la matriz
Mc =
u((n 1)T )
u((n 2)T )
.
.
.
u(0)
.
.
.
H . GH . . Gn1 H
.
.
.
(1.50)
(1.51)
a
Si el sistema es controlable, se podr determinar la secuencia de valores de la entrada
a
necesaria para llevar al sistema a xf resolviendo el sistema de ecuaciones (1.50).
Por otra parte, la controlabilidad se puede comprobar a partir de la funcin de
o
transferencia de un sistema observando si hay cancelaciones de polos y ceros. En el
caso de que las hubiese, el sistema no ser controlable. Por tanto, el sistema
a
Y (z)
z + 0,2
=
U (z)
(z + 0,8)(z + 0,2)
no ser controlable pues existe una cancelacin de un polo con un cero.
a
o
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
1.6.2.
17
(1.52)
.
.
.
CH . CGH . . CGn1 H
.
.
.
=m
(1.53)
(1.54)
.
.
.
.
D . CH . CGH . . CGn1 H
.
.
.
.
=m
(1.55)
Ntese que en esta segunda forma de la ecuacin de salida, la presencia del trmino
o
o
e
Du(kT ) no empeora la controlabidad del sistema, sino justo lo contrario. De hecho, al
introducirse una columna extra en la matriz de controlabilidad (la correspondiente a
D), se puede dar el caso que se pase de tener m1 columnas linealmente independientes
a tener m, por lo que se lograr la controlabilidad de la salida. Dicho de otra manera,
a
encontrar m vectores linealmente independientes siempre ser igual o ms fcil entre
a
a a
n + 1 vectores que entre slo n de esos vectores.
o
1.6.3.
Observabilidad
(1.56)
18
CONTROLABILIDAD Y OBSERVABILIDAD
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
19
Finalmente, se enuncia a continuacin una propiedad que ser util para poder obte
o
a
ner la representacin de un sistema en forma cannica, sin que por ello pueda arguo
o
mentarse que existe la posibilidad de variar la controlabilidad u observabilidad del
mismo.
Propiedad 1.1 Sea un sistema LTI dado en la forma usual (1.1), cuya matriz de
controlabilidad es M y la de observabilidad es N . Si se dene una transformacin
o
como (1.26) con:
G = P 1 GP
H = P 1 H
C = CP
siendo P una matriz invertible, entonces las matrices de controlabilidad y observabilidad
del sistema equivalente tienen el mismo rango que M y N .
1.6.4.
Principio de Dualidad
(1.58)
y (kT ) = H x(kT )
(1.59)
1.7.
CONTROLABLE
OBSERVABLE
ENTONCES S2
OBSERVABLE
CONTROLABLE
(1.60)
Ntese que los sistemas S1 y S2 son diferentes, es decir, S2 no es una representacin alternativa
o
o
de S1 .
20
1.7.1.
M=
.
.
.
H . GH . . Gn1 H
.
.
.
W =
an1 an2
an2 an3
.
.
.
.
.
.
a1
1
1
0
a1
1
.
.
.
0
0
1
0
.
.
.
0
0
x(k) = T x(k)
Entonces el sistema:
(1.61)
1.7.2.
.
.
.
C . G C . . (G )n1 C
.
.
.
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
1.8.
21
En esta seccin se presentar una estrategia de control que permite elegir la situacin
o
a
o
de los polos de bucle cerrado del sistema, mediante la realimentacin lineal del vector
o
de estados. Se ver que la condicin necesaria para que esto se pueda conseguir es que
a
o
el sistema sea controlable. Por otra parte, se asumir que todas las variables de estados
a
son accesibles, es decir, podemos medirlas directamente sin tener que estimarlas por
otros procedimientos.
1.8.1.
z-1
x(k)
G
u(k)
-K
Figura 1.2: Diagrama de bloques de un sistema controlado por una realimentacin del vector de
o
estados.
Lema 1.2 Se demuestra que la condicin necesaria y suciente para que por medio de
o
una realimentacin del vector de estados puedan escogerse los polos de bucle cerrado
o
(es decir, los autovalores de (G HK)) es que el sistema en bucle abierto sea de estado
completamente controlable. Si esta condicin no se cumple, no se podrn elegir todos
o
a
los polos de bucle cerrado.
1.8.2.
Sean 1 ,2 , ,n los valores deseados para los polos de bucle cerrado, es decir,
para los autovalores de (G HK). Aquellos que sean complejos siempre irn por pares
a
conjugados. La ecuacin caracter
o
stica del sistema en bucle abierto es:
|zI G| = z n + a1 z n1 + + an = 0
Se dene una matriz de transformacin T = M W exactamente igual que la matriz
o
de transformacin necesaria para obtener la forma cannica controlable descrita en la
o
o
seccin 1.7.1. Se obtiene:
o
0
1
0
0
0
0
0
0
1
0
.
.
.
.
1
.
.
.
.
T GT = G = .
T 1 H = H = .
.
.
.
.
.
0
0
0
0
1
1
an an1 an2 a1
Se dene a continuacin:
o
K = KT =
n n1 1
Entonces:
HK =
0
0
.
.
.
1
n n1 1
0
0
.
.
.
0
0
.
.
.
0
0
.
.
.
0
0 0
n n1 1
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
23
1 0 0
0 1 0
. .
.
.
= z . .
.
. .
0 0 0
0 0
0
0
0
0
.
.
.
.
.
.
0
0
n n1
z
0
.
.
.
0
0
.
.
.
0
0
.
.
.
1
0
.
.
.
0
1
.
.
.
0
0
.
.
.
0
0
0
1
an an1 an2 a1
0
1
1
.
.
.
0
0
.
.
.
0
0
1
an + n an1 + n1 z + a1 + 1
n
= z + (a1 + 1 )z n1 + + (an1 + n1 )z + (an + n ) = 0
A su vez, la ecuacin caracter
o
stica correspondiente a los autovalores deseados ser:
a
(z 1 )(z 2 ) (z n ) = z n + 1 z n1 + 2 z n2 + + n1 + n = 0
Igualando los coecientes de ambas ecuaciones caracter
sticas:
1 = a 1 + 1
2 = a 2 + 2
.
.
.
n = a n + n
se obtiene la siguiente expresin para K:
o
K = KT 1
=
n n1 1 T 1
.
.
.
=
.
.
.
n an . n1 an1 . . 1 a1
(1.62)
T
que coloca los polos de bucle cerrado del sistema en los valores deseados. Ntese
o
que si el sistema en bucle abierto viene dado en forma cannica controlable, se verica
o
que T = I = T 1 .
1.8.2.1.
cionaremos uno muy conocido, el que emplea la frmula de Ackermann. Segn esto, la
o
u
expresin para K tomar la forma:
o
a
K=
.
.
.
H . GH . . Gn1 H
.
.
.
0 0 0 1
(G)
donde:
(G) = Gn + 1 Gn1 + + n1 G + n I
Los coecientes i se calcularn como en el apartado anterior.
a
Finalmente, otro procedimiento que puede ser util para sistemas de bajo orden
consiste en tomar
K = k1 k2 k n
plantear la ecuacin caracter
o
stica en funcin de los ki :
o
|zI G + HK| = 0
e igualar a los coecientes de
z n + 1 z n1 + 2 z n2 + + n1 + n = 0
1.8.3.
Control Dead-Beat
Este es un tipo de control que resulta ser un caso particular del control por colocacin de polos.
o
Denicin 1.4 Dado un sistema LTI, entenderemos como control dead-beat aquel que
o
consigue llevar el estado a cero en como mximo n intervalos de muestreo, donde n es
a
el orden del sistema.
Para obtener este tipo de control se deben especicar los polos de bucle cerrado conforme a lo que se establece en el siguiente lema.
Lema 1.3 Se demuestra que si se escogen los polos de bucle cerrado de manera que
estn todos en el origen (es decir, todos los autovalores de (G HK) igual a cero) se
e
consigue un control dead-beat.
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
25
Esto se lleva a la prctica con una matriz de realimentacin del vector de estados
a
o
calculada mediante:
K = an an1 a1 T 1
Este tipo de control no goza de una reputacin excesivamente favorable porque habito
ualmente se precisa de una seal de control de amplitud muy grande para obtener la
n
respuesta dead-beat. De hecho en este tipo de control, el unico parmetro de diseo
a
n
que se ha de elegir es el tiempo de muestreo. Si ste es muy pequeo, los n intervalos
e
n
de muestreo supondrn un tiempo total muy corto, de manera que para llevar el estado
a
a cero partiendo de un estado inicial arbitrario se precisar un valor muy alto de la
a
seal.
n
Ejemplo 1.5
Sea un sistema
x(k + 1) = Gx(k) + Hu(k)
con
G=
0
1
0
1
0,16 1
Se desea determinar una matriz K, tal que los polos de bucle cerrado sean el par
complejo conjugado z = 0,5 j0,5.
En primer lugar hay que determinar la controlabilidad del sistema. Para ello, se
forma la matriz de controlabilidad:
.
.
H . GH
0 1
1 1
cuyo rango es igual a dos (basta comprobar que su determinante es distinto de cero),
por lo que el sistema es controlable y se puede proceder a calcular K. La ecuacin
o
caracter
stica de bucle cerrado deseada es:
|zI G + HK| = (z 0,5 j0,5)(z 0,5 + j0,5) = z 2 z + 0,5 = 0
(1.63)
por tanto, los coecientes i son en este caso 1 = 1 y 2 = 0,5. Por otra parte, la
ecuacin caracter
o
stica de bucle abierto del sistema es:
|zI G| =
z
1
0,16 z + 1
por lo que los coecientes ai son a1 = 1 y a2 = 0,16. A partir de aqu se puede aplicar
Mtodo 1
e
K=
.
2 a 2 . 1 a 1
.
T 1
Obsrvese que el sistema viene dado en forma cannica controlable, por lo que T = I
e
o
y por tanto:
K = 0,34 2
Mtodo 2 (frmula de Ackermann)
e
o
En este caso la frmula de Ackermann ser
o
a:
K=
0 1
.
H . GH
.
(G)
donde (G) es
(G) = G2 G + 0,5I
0,16 1
=
0,16 0,84
0,34 2
=
0,32 2,34
0
1
0,16 1
0,5 0
0 0,5
por lo que
K =
=
0 1
0 1
1 1
0,34 2
0,34 2
0,32 2,34
Mtodo 3
e
Este procedimiento es apropiado para sistemas de bajo orden como el que nos ocupa.
En primer lugar, se toma K = [k1 k2 ] y se formula la ecuacin caracter
o
stica de bucle
cerrado en funcin de K:
o
0
1
z 0
+
0,16 1
0 z
z
1
=
0,16 + k1 z + 1 + k2
2
= z + (1 + k2 )z + k1 + 0,16 = 0
|zI G + HK| =
0
1
k1 k2
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
27
T 1 =
a2 a1
0,16 1
=
=
0
1
0,16 1
x1 (k)
0 1
x2 (k)
0 0
x1 (k)
x2 (k)
0
1
0,16 1
x1 (k)
x2 (k)
a
b
0 1
0 0
a
b
b
0
x1 (2)
x2 (2)
0 1
0 0
b
0
0
0
luego este control lleva al estado a cero en 2 pasos y es efectivamente un control deadbeat.
1.9.
En el control por colocacin de polos se asume que el estado se puede medir direco
tamente. En ocasiones, sin embargo, puede que esta suposicin no se cumpla y todas
o
28
o algunas de las variables de estado no puedan ser medidas. Es decir, puede que haya
variables de estado no accesibles. En cualquier caso, para poder controlar el sistema se
debern estimar los valores de esas variables de estado no accesibles. Este proceso de
a
estimacin es lo que se conoce como observacin.
o
o
Un observador del estado es un subsistema del sistema de control, que realiza la
estimacin de las variables de estado basndose en los valores medidos (observados) de
o
a
las salidas y la seal de control. Se distinguen tres tipos de observadores, en funcin
n
o
de las variables de estado que se estimen:
1. Observador del estado completo. Es aqul que estima todas las variables de estae
do.
2. Observador de orden m
nimo. En este caso slo se estiman aquellas variables de
o
estado que no son accesibles.
3. Observador de orden reducido. Este tipo de observador estima todas las variables
no accesibles y algunas de las accesibles.
En esta asignatura nos centraremos en los dos primeros tipos de observadores. Como
en el caso de la colocacin de polos, formularemos en primer lugar las condiciones para
o
que se pueda llevar a cabo la observacin.
o
Lema 1.4 Condicin necesaria y suciente para la observacin del estado. Dado un
o
o
sistema LTI, se puede determinar x(k + 1) a partir de y(k), y(k 1), ,y(k n + 1) y
u(k),u(k 1), ,u(k n + 1), donde n es el orden del sistema, s y slo s, el sistema
o
es completamente observable.
Por tanto x(k + 1) se puede determinar, si el sistema es observable, en n pasos. Sin
embargo, no debe olvidarse que sobre el sistema actan ruidos y perturbaciones. Por
u
esta razn no es posible utilizar un procedimiento algebraico para determinar el estado,
o
sino que se ha de acudir a un procedimiento iterativo para estimarlo.
1.9.1.
(1.64)
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
29
Si se dispone de una aproximacin del estado en k, que denotaremos x(k), sta evoluo
e
cionar segn la dinmica del sistema
a
u
a
x(k + 1) = G(k) + Hu(k)
x
y (k) = C x(k)
(1.65)
Si las condiciones iniciales son las mismas, es decir, si x(0) = x(0) entonces se verica
que x(k) = x(k). Sin embargo, si las condiciones iniciales son diferentes entonces, de
manera general, x(k) = x(k). Podemos pues, denir el error de estimacin en k como:
o
e(k) = x(k) x(k)
Por tanto, si el sistema es estable, la propia dinmica del sistema hace que la aproxia
macin del estado tienda al valor real del mismo. Esto quiere decir que podr
o
amos usar
la propia ecuacin del sistema para obtener en cualquier instante k una aproximacin
o
o
del estado, cuyo error ir decayendo a lo largo del tiempo. Esta convergencia al valor
a
real, sin embargo, puede ser muy lenta, y por otra parte no siempre se tratar con
a
sistemas estables. Por tanto, esta estrategia no es muy aconsejable.
Ntese que en el esquema que se ha presentado, no se hace uso de la salida del siso
tema, que siempre ser accesible. Esto puede ser aprovechado para mejorar el rendimiena
to del observador introducindose un trmino corrector, de manera que la ecuacin para
e
e
o
obtener la aproximacin del estado para el instante k + 1 ser
o
a:
x(k + 1) = G(k) + Hu(k) + Ke (y(k) C x(k))
30
1.9.2.
Sea un sistema LTI observable (1.64) con una ley de control por realimentacin
o
negativa del vector de estados,
u(k) = Kx(k)
siendo el estado del sistema x(k) no accesible pero s observable. Por tanto, podemos
(1.66)
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
x(k+1)
z-1
x(k)
u(k)
31
y(k)
G
-K
u(k)
x(k)
u(k)
y(k)
OBSERVADOR
Figura 1.3: Diagrama de bloques de un sistema LTI controlado mediante una realimentacin del vector
o
de estados que estima el estado con un observador.
x(k)
x(k+1)
+
z-1
x(k)
u(k)
y(k)
Ke
y(k)
32
1.9.2.1.
Clculo de Ke
a
El procedimiento para elegir Ke de manera que se coloquen los polos del observador
en unos valores especicados es anlogo al de la colocacin de polos vista en la seccin
a
o
o
1.8. Si la ecuacin caracter
o
stica deseada del observador es:
z n + 1 z n1 + + n1 z + n = 0
y la del sistema es
z n + +a1 z n1 + + an1 z + an = 0
entonces
Ke = (W N )1
donde
W =
an1 an2
an2 an3
.
.
.
.
.
.
a1
1
1
0
a1
1
.
.
.
0
0
1
0
.
.
.
0
0
n a n
n1 an1
.
.
.
1 a 1
N=
(1.67)
.
.
.
C . G C . . (G )n1 C
.
.
.
0
C
CG 0
Ke = (G)
.
.
.
.
.
.
CGn1
donde
(G) = Gn + 1 Gn1 + + n1 G + n I = 0
Ejemplo 1.7
Considrese un sistema como (1.64) con
e
G=
3
1 1
0 1
H=
0,5
1
C=
1 0
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
33
.
C . G C
.
1 1
0 1
= rango
=2
0 z
0 1
= z 2 2z + 1 = 0
|zI G| =
Ke = (W N )1
con
N=
1 1
0 1
W =
resultando
a1 1
1 0
2 1
1 0
2
1
Ke =
C
CG
0
1
con
(G) = G2 + 1 G + 2 I = G2
resultando
Ke =
1 1
0 1
1 0
1 1
0
1
2
1
34
a2
b2
a1 a 2
b1 b 2
G Ke C =
1 1
1 1
x(0) =
a1
b1
entonces
a
b
e1 (k)
e2 (k)
1 1
1 1
=
=
e1 (2)
e2 (2)
=
=
1 1
1 1
a + b
a + b
1 1
1 1
0
0
a
b
a + b
a + b
luego, tal y como se pretend la estimacin del vector de estados coincide con el
a,
o
valor real de dicho vector dos tiempos de muestreo despus de iniciarse la estimacin.
e
o
Finalmente, la ecuacin del observador es:
o
x1 (k + 1)
x1 (k + 1)
1.9.2.2.
1 1
1 1
x1 (k)
x1 (k)
0,5
1
u(k) +
2
1
y(k)
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
35
planta coincida con la dinmica real de la misma) este trmino corrector deber tomar
a
e
a
un valor alto. Sin embargo, si la seal de salida est contaminada por perturbaciones y
n
a
ruido en general procedente, por ejemplo, de los sensores de medida, entonces la seal
n
de salida no es able en el sentido de que no proviene unicamente de la dinmica real de
a
la planta. Por tanto, en estas situaciones el trmino corrector deber ser ms pequeo.
e
a
a
n
Al seleccionar Ke se debe pensar no slo en reducir el error en base a una correccin
o
o
enrgica, sino que hay que tener en cuenta que cuando hay ruidos o perturbaciones,
e
una ganancia Ke alta no contribuir a reducir el error, porque las correcciones no ir
a
an
en la ((direccin)) correcta. Es decir, hay que llegar a un compromiso entre la velocidad
o
de respuesta y la sensibilidad a ruidos y perturbaciones.
1.9.2.3.
(1.68)
Cabe preguntarse si al usar el observador, se colocan los polos del sistema en el sitio
que se pretende al calcularse la ganancia de realimentacin del vector de estado K.
o
Que efectos tiene el observador sobre los polos de bucle cerrado? Para estudiar esto,
se analizar el efecto que tiene la adicin del observador sobre la ecuacin caracter
a
o
o
stica
del sistema en bucle cerrado.
Sea el sistema (1.64) controlado mediante (1.68). La ecuacin de estado puede
o
reescribirse como:
x(k + 1) = Gx(k) HK x(k)
= (G HK)x(k) + HKe(k)
donde e(k) es el error de observacin en el instante k. Recordemos que el error de
o
observacin viene dado por:
o
e(k + 1) = (G Ke C)e(k)
La ecuacin de estado y la del error, se pueden combinar en la ecuacin de un sistema
o
o
autnomo aumentado que describe la dinmica del sistema observado (es decir, de todo
o
a
el conjunto sistema-controlador-observador):
x(k + 1)
e(k + 1)
G HK
HK
0
G Ke C
x(k)
e(k)
36
La ecuacin caracter
o
stica de este sistema es
zI G + HK
HK
0
zI G + Ke C
=0
es decir,
|zI G + HK||zI G + Ke C| = 0
Dado que las ra de esta ecuacin son las ra de cada uno de los dos determinantes
ces
o
ces
que aparecen, esto implica que los polos del sistema completo son los polos del sistema
en bucle cerrado, tal y como se han colocado mediante el diseo de K junto con los
n
polos del observador. Por tanto, la colocacin de polos y la observacin son dos cosas
o
o
independientes, porque la adicin del observador no modica los polos de bucle cerrado
o
del sistema tal y como se eligieron al disear K. Por tanto:
n
Los polos del sistema se eligen para que se cumplan las especicaciones del sistema
de control.
Los polos del observador se escogen de manera que la respuesta del observador
sea ms rpida que la del sistema (para que esta ultima resulte dominante),
a a
t
picamente 4 o 5 veces ms rpida.
a a
1.9.3.
Observador de orden m
nimo
Supngase que x(k) es un n-vector y que y(k) es un m-vector. Como las m salidas
o
son combinaciones lineales del estado, hay m variables que no necesitan ser estimadas.
El observador de orden m
nimo ser el que estime las n m restantes.
a
Para disear el observador de orden m
n
nimo estableceremos una particin del vector
o
de estados:
xa (k)
x(k) =
xb (k)
donde el m-vector xa (k) son las variables medibles (accesibles) y el n m-vector xb (k)
son las variables no medibles (no accesibles). Esta particin del vector de estados
o
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
37
Gaa . Gab
.
xa (k + 1)
Ha
xa (k)
= . + u(k)
.
.
xb (k + 1)
xb (k)
Hb
. Gbb
Gba .
xa (k)
.
. 0
y(k) =
I .
xb (k)
(1.69)
Por otro lado, la parte del vector de estados que no se puede medir se puede escribir
como:
xb (k + 1) = Gba xa (k) + Gbb xb (k) + Hb u(k)
Obsrvese que en esta ecuacin, los trminos que dependen de xa (k) y u(k) son conoe
o
e
cidos mientras que el trmino que depende de xb (k) es desconocido. Esta ecuacin la
e
o
podemos reescribir como
xb (k + 1) = Gbb xb (k) + [Gba xa (k) + Hb u(k)]
(1.70)
38
x
Comparando las ecuaciones de estado y salida del observador de orden completo y las
del observador de orden m
nimo, se establecen las siguientes analog
as:
Observador de orden completo Observador de orden m
nimo
x(k)
G
Hu(k)
y(k)
C
Ke Rnm
xb (k)
Gbb
Gba xa (k) + Hb u(k)
xa (k + 1) Gaa xa (k) Ha u(k)
Gab
Ke R(nm)m
x
(1.71)
Adems, de la ecuacin del sistema sabemos que
a
o
y(k) = xa (k)
luego, aplicando esto en la ecuacin (1.71) se obtiene
o
xb (k + 1) = (Gbb Ke Gab )b (k) + Ke y(k + 1) + (Gba Ke Gaa )y(k) + (Hb Ke Ha )u(k)
x
que ser la ecuacin del observador de orden m
a
o
nimo. Los polos del observador de
orden m
nimo ser los autovalores de (Gbb Ke Gab ). Obsrvese, sin embargo, que en
an
e
esta ecuacin aparece un trmino que multiplica a y(k + 1). Como es lgico el valor
o
e
o
de la salida en k + 1 no est disponible en el instante k, por lo que esta ecuacin ha
a
o
de ser modicada. Se puede demostrar (no se har aqu que esta ecuacin se puede
a
),
o
reescribir como:
xb (k) = (k) + Ke xa (k)
+(Hb Ke Ha )u(k)
(1.72)
La ecuacin caracter
o
stica del observador de orden m
nimo es:
|zI Gbb + Ke Gab | = 0
y como en el caso del observador de orden completo, Ke se puede elegir para colocar
los polos del observador donde se desee mediante los mtodos indicados en la seccin
e
o
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
39
1.9.2.1. Por ejemplo, si la salida y(k) es un escalar, es decir m = 1, se tienen que estimar
n 1 variables. La frmula de Ackermann, por ejemplo, quedar
o
a:
1
Gab
0
Gab Gbb 0
Ke = (Gbb )
.
.
.
.
.
.
Gab Gn2
bb
donde
1 0,2
0 1
H=
0,02
0,2
C=
1 0
se pide
1. Disear un controlador que coloque los polos de bucle cerrado en z = 0,6 j0,4.
n
2. Asumiendo que y(k) = x1 (k) es el unico estado accesible, disear un observador
n
de orden m
nimo con respuesta dead-beat.
En primer lugar, se ha de comprobar la controlabilidad y observabilidad del sistema:
rango
rango
.
H . GH
.
= rango
.
.
C . G C
= rango
0,02 0,06
=2
0,2 0,2
1 1
=2
0 0,2
40
2 a 2 1 a 1
T 1 =
T 1
0,48 0,8
a1 1
1 0
.
H . GH
.
0,02 0,02
0,2 0,2
y
T 1 =
25 2,5
25 2,5
lo que lleva a
K=
8 3,2
x1 (k)
x2 (k)
8 3,2
En cuanto al observador de
que es de orden 1. La particin
o
.
Gaa . Gab
.
. =
.
.
.
. Gbb
Gba .
8 3,2
y(k)
x2 (k)
orden m
nimo, ste estimar una sola variable, por lo
e
a
de la ecuacin de estado en este caso ser:
o
a
1 . 0,2
.
0,02
Ha
.
=
.
.
.
0,2
Hb
0 . 1
.
La ecuacin caracter
o
stica deseada del observador es
(z) = z = 0
luego
Ke = (Gbb )[Gab ]1 [1] = (1)(0,2)1 (1) = 5
Las ecuaciones del observador ser
an
(k + 1) = (Gbb Ke Gab )(k) + [(Gbb Ke Gab )Ke + Gba Ke Gaa ] y(k)
+(Hb Ke Ha )u(k)
= (1 5 0,2)(k) + [(1 5 0,2) 5 + 0 5 1] y(k) + (0,2 5 0,02)u(k)
= 5y(k) + 0,1u(k)
x2 (k) = Ke y(k) + (k)
= 5y(k) + (k)
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
41
1.10.
K x(k)
24y(k) 3,2(k)
Las tcnicas de control optimo conforman una de las ramas del control automtico
e
a
ms importantes en el desarrollo de las estrategias modernas de control ms utilizadas
a
a
hoy en d Se han escrito numerosas monograf dedicadas a su estudio, y se ha
a.
as
publicado una ingente cantidad de art
culos en revistas especializadas. No obstante,
en estos apuntes slo se dar una pincelada sobre este particular, centrndonos en el
o
a
a
caso particular del control LQR con horizonte innito, tambin conocido como LQR
e
de rgimen permanente.
e
Las estrategias de control optimo calculan la ley de control de manera que se opti
miza una cierta medida del rendimiento del controlador. Se parte de un sistema descrito
por
x(k + 1) = Gx(k) + Hu(k)
El objetivo es calcular una ley de control
u(k) = Kx(k)
de tal manera que se minimiza el funcional (que expresa un
ndice de funcionamiento)
1
J=
2
(x (k)Qx(k) + u (k)Ru(k))
(1.73)
k=0
CONTROL OPTIMO LQR
42
siempre lo ms cerca posible del origen4 . Por otra parte, se observa que en el funcional
a
hay otro trmino que pondera el valor de la secuencia de seales de actuacin. Este
e
n
o
trmino impide que se obtenga una ley de control que lleve el estado al origen a expene
sas de una actuacin muy grande. Al minimizarse J, por tanto, se conseguir una ley de
o
a
control que por una parte acerque el estado al origen lo mas rpido posible, pero mana
teniendo un nivel de actuaciones moderado, encontrndose por tanto, una solucin de
a
o
compromiso entre el rendimiento del controlador y su nivel de actuacin. El sentido de
o
este compromiso puede venir dictado por diferentes razones, como por ejemplo moderar
el gasto de energ o combustible necesario para proporcionar la seal de actuacin.
a
n
o
Existen razones ms sutiles pero no por ello menos importantes para incorporar esta
a
ponderacin del esfuerzo de control. Por ejemplo, cuando existen discrepancias entre
o
el modelo del sistema y su dinmica real (algo que ocurre casi siempre, pues los modea
los matemticos no pueden recoger todas las complejidades de los sistemas o procesos
a
reales) esta ponderacin del esfuerzo de control resulta en un sistema ms estable.
o
a
Para calcular la ley de control que minimiza el
ndice (1.73) se dene una matriz P
que satisface la siguiente ecuacin de Riccatti:
o
P = Q + G P G G P H(R + H P H)1 H P G
(1.74)
Esta es una interpretacin que hay que tomar con cierto cuidado, pues puede que se obtenga una
o
ley de control que provoque que el estado no se acerque al origen todo lo posible al principio pero que
lo lleve a dicho origen muy rpidamente en los instantes siguientes, manteniendo pues el valor de J
a
muy bajo.
CAP
ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
1.10.1.
43
e
resolver la ecuacin de Riccatti (1.74). Esto no es algo trivial en general, pero si podeo
mos resolverla fcilmente si se dispone de un computador. Para ello formularemos un
a
proceso iterativo en que tomando como valor inicial de P = 0 (es decir una matriz de
ceros) se calcular el valor de la matriz P en el paso i + 1 como
a
Pi+1 = Q + G Pi G G Pi H (R + H Pi H)1 H Pi G
La condicin de parada del bucle o proceso iterativo ser que Pi+1 Pi 0, esto es,
o
a
que la diferencia entre Pi+1 y Pi sea una matriz cuyos elementos estn todos cerca del
e
cero.
1.11.
Filtro de Kalman
la estimacin obtenida tiene el menor error posible teniendo en cuenta que al haber
o
ruidos actuando, nunca se podr obtener una estimacin perfecta. Al igual que en el
a
o
caso del control LQR no se entrar en profundidad en el estudio de este estimador, sino
a
que slo se presentar la formulacin de un caso particular, el ltro de Kalman para
o
a
o
rgimen permanente.
e
Sea un sistema:
donde (k) y (k) son variables aleatorios que actan como ruidos aditivos. Se deu
muestra que se puede obtener una estimacin optima del vector de estados mediante
o
el siguiente esquema:
x(k + 1) = G(k) + Hu(k) + Ke (k) (y(k) C x(k))
1
Ke (k) = GPk C (R + CPk C )
Pk+1 = Q + (G Ke (k)C) Pk G
donde
R = E { (k) (k)}
Q = E {(k) (k)}
P0 = E { (0) (0)}
(1.75)
44
FILTRO DE KALMAN
1
Ke = GP C (R + CP C )
P = Q + GP G GP C (R + CP C )1 CP G
(1.76)
que son las ecuaciones del ltro de Kalman de rgimen permanente. Ntese que para
e
o
resolver la ecuacin de Riccatti se puede usar el mismo mtodo usado en el LQR.
o
e
Cap
tulo 2
Modelos de procesos y
perturbaciones
2.1.
Introduccin
o
En este cap
tulo se expondrn diversos tipos de formas de modelar perturbaciones
a
y procesos cuya evolucin se ve afectada por perturbaciones. Es importante tener en
o
cuenta que los modelos de procesos con perturbaciones tienen su origen en el modelado
de perturbaciones y no al revs.
e
En la teor clsica del control automtico siempre se ha tenido en cuenta el coma a
a
portamiento de los sistemas frente a perturbaciones a la hora de disear sistemas de
n
control. Dichas perturbaciones se modelaban siempre de manera muy simplicada. Es
por tanto comn en esta teor el considerar que las perturbaciones van a tener la
u
a
forma de
Pulsos.
Escalones.
Rampas.
Sinusoides.
Todos estos modelos tienen en comn que son absolutamente predecibles en su evoluu
cin en funcin de las condiciones iniciales. Es decir, en cuanto la perturbacin aparece
o
o
o
45
46
podemos predecir su evolucin futura. Es una suposicin comn en estos casos, consi
o
o
u
derar que estas perturbaciones vienen generadas por sistemas dinmicos.
a
2.2.
Como fuente de perturbaciones con una mayor variabilidad que los modelos clsicos
a
antes comentados, se pueden considerar las perturbaciones deterministas a trozos. Surgen de la necesidad de estudiar el efecto de perturbaciones ms realistas en sistemas
a
de control que se basan en algn tipo de esquema predictivo para calcular la seal
u
n
de control. En este tipo de sistemas, el considerar una perturbacin absolutamente
o
predecible (como en el caso de los modelos clsicos) no tiene utilidad alguna, pues se
a
pueden considerar directamente en el clculo de la ley de control.
a
Los modelos de perturbaciones deterministas a trozos parten de la suposicin de
o
que son generados por un sistema lineal, en el que la entrada es cero excepto en ciertos
instantes de tiempo separados por ms de n tiempos de muestreo, donde n es el orden
a
del sistema:
C(z 1 )
w(k)
y(k) =
A(z 1 )
suponindose que el grado de C(z 1 ) es igual al grado de A(z 1 ). Si la entrada es
e
cero excepto en ciertos instantes de tiempo que estn separados, quiere decir que la
a
seal w(k) es un tren de pulsos. La amplitud y momento de aparicin de esos pulsos
n
o
son desconocidos. Esto es lo que le da variabilidad a la fuente de perturbaciones. Sin
embargo, una vez que aparecen y se conoce la amplitud del pulso, la evolucin de la
o
salida y(k) es perfectamente predecible pues la dinmica del sistema es conocida. De
a
ah el nombre de determinista a trozos.
2.3.
Procesos estocsticos
a
Estocstico: relativo a una variable aleatoria; algo que sigue una determinada distribucin de
a
o
probabilidad, usualmente con varianza nita.
CAP
ITULO 2. MODELOS DE PROCESOS Y PERTURBACIONES
47
o
a
estocstico puede ser considerado como una funcin de dos variables
a
o
X(t, w)
donde t es la variable tiempo con su signicado habitual y w es una variable aleatoria.
Si consideramos un valor jo de w, esto es w = w0 y dejamos la variable t libre, lo que
denotaremos como
X(:, w0 )
estaremos hablando de una ((realizacin)) del proceso. Esta realizacin es una funcin
o
o
o
temporal comn sin ningn tipo de carcter aleatorio una vez que se conoce que w =
u
u
a
w0 . Si por otra parte se considera un instante de tiempo jo, es decir t = t0 , que
denotaremos como
X(t0 , :) X(t0 )
tendremos una variable aleatoria. Se puede considerar por tanto, que la evolucin del
o
proceso est dictada por un generador de seales aleatorias. En la gura 2.1 se ilustran
a
n
estos conceptos. Puede observarse que el valor de la funcin en cada instante es un
o
valor aleatorio que en la gura se considera variable en un determinado rango. Por
otra parte, cuando se habla de una realizacin no es ms que una funcin comn que
o
a
o
u
depende de t.
w=w0
t0
t1
t2
t3
t4
......
48
Denicin 2.3 Se denomina ruido blanco discreto, a un proceso aleatorio que se puede
o
considerar como una secuencia cuyos elementos son variables aleatorias independientes
entre s cuya distribucin es idntica. Se suele suponer que
o
e
E {x(k)} = 0
es decir, que el valor esperado es cero y adems
a
E {x(i)x(j)} =
2.4.
En esta seccin veremos cmo se pueden generar diversos tipos de procesos eso
o
tocsticos, cuando a un sistema lineal se le inyecta un ruido blanco v(k) adems de
a
a
una entrada externa u(k) a travs de sendas funciones de transferencia.
e
El caso ms general es el llamado modelo de Box-Jenkins, el cual se ilustra en la
a
gura 2.2. Esta estructura es demasiado general, y normalmente se utilizan diversas
v(k)
"
!
u(k)
y(k)
CAP
ITULO 2. MODELOS DE PROCESOS Y PERTURBACIONES
49
50
para formular leyes de control que incorporen un efecto integral, de manera que
sean capaces de rechazar perturbaciones en escaln.
o
Cuando en los modelos anteriores el polinomio que convoluciona con la seal v(k) es
n
distinto de la unidad se habla de ruido coloreado, y en caso contrario, de ruido blanco.
Cap
tulo 3
Introduccin a la identicacin de
o
o
sistemas
3.1.
Introduccin
o
52
3.2.
A continuacin, se irn desglosando las principales ideas de cada uno de estos aspectos.
o
a
3.2.1.
CAP
ITULO 3. INTRODUCCION A LA IDENTIFICACION DE SISTEMAS
53
bucle abierto esta propiedad puede perderse en bucle cerrado. Esto ocurre, por ejemplo,
si los perles de la consigna o referencia que se usan son muy simples. Tambin, si los
e
lazos de control son demasiado simples. En general, cuanto ms complejos sean los
a
lazos de control y ms se mueva la consigna, ms fcil ser la identicacin en bucle
a
a a
a
o
cerrado.
3.2.2.
En teor la seleccin del tipo de modelo deber venir dada por un conocimiento
a,
o
a
del proceso y de las perturbaciones que deban ser tenidas en cuenta. Dependiendo de
si conocemos mucho o poco la estructura del proceso elegiremos entre uno u otro tipo
de modelo. En general, los modelos los clasicaremos como:
54
3.2.3.
Eleccin de un criterio
o
J() =
g(e(k))
k=1
3.2.4.
3.2.4.1.
Identicacin en l
o
nea
CAP
ITULO 3. INTRODUCCION A LA IDENTIFICACION DE SISTEMAS
u(k)
PLANTA
55
y(k)
IDENTIFICACIN
MODELO
ACTUALIZADO
SUPERVISIN
MODELO
CORREGIDO
3.2.4.2.
Identicacin fuera de l
o
nea
En este caso se toman los datos del experimento (es decir, series de medidas) y
posteriormente, se ajusta el modelo usando para ello todo el conjunto de datos. Este
tipo de procedimientos suelen obtener modelos ms precisos y son ms ables en cuanto
a
a
a la convergencia de los parmetros estimados a los parmetros reales del proceso1 . En
a
a
cualquier caso, existe un consenso general en que no existe un mtodo universalmente
e
bueno, por tanto, dependiendo de la situacin unos funcionarn mejor que otros.
o
a
3.2.5.
Ntese que aunque el proceso real no corresponder en general exactamente con el modelo (pues
o
a
todo modelo implica un cierto grado de simplicacin de la realidad) se asume que existe un valor del
o
vector de parmetros que es el que mejor describe al proceso.
a
56
2dimensin()
o
1+
N
1
N
e2 (t, )
t=1
donde e(t, ) = y(t) y (t, ) es el error de estimacin para los datos obtenidos en el
o
instante t.
Tampoco puede descartarse la posibilidad de no usar criterio de validacin alguno y
o
efectuar una inspeccin visual sobre una simulacin, en la que se usa el modelo estimado
o
o
para predecir la salida en base a datos de entradas experimentales.
Finalmente, la tcnica de validacin cruzada, aunque muy popular no es la unica.
e
o
Otra tcnica que a veces se utiliza es el anlisis de residuos. Se entiende por residuos
e
a
los errores que comete el modelo una vez ajustado, es decir e(t) = y(t) y (t, ). Si el
modelo estimado es sucientemente bueno, estos residuos tienen que ser independientes
CAP
ITULO 3. INTRODUCCION A LA IDENTIFICACION DE SISTEMAS
57
que si existe correlacin entre e(t) y alguna entrada pasada u(t ), quiere decir que
o
una parte del valor de y(t), que depende de u(t ) no ha sido reproducida por el
modelo en y (t, ). Por tanto, el modelo no estar reproduciendo toda la dinmica del
a
a
proceso.
3.2.6.
TOMA DE DATOS
ACONDICIONAMIENTO DE
DATOS
AJUSTAR MODELO
VALIDAR MODELO
NO
VALIDO ?
SI
USAR MODELO
pueda retornar a cualquiera de las pasos intermedios, indica que puede que en cada
58
ALGUNAS PROPIEDADES
iteracin no se realicen todos los pasos. Por otra parte, aparece un paso sobre el que no
o
se ha comentado nada, el acondicionamiento de datos. Esta tarea consiste en manipular los datos de manera que sean apropiados para el mtodo de ajuste elegido. Es algo
e
que es espec
co para cada procedimiento. As por ejemplo, una tarea muy comn de
u
acondicionamiento de datos es la eliminacin de los valores de continua de las seales
o
n
de entrada y salida. Esto ser tratado en mayor profundidad en el tema 4. Finalmente,
a
en el caso de la identicacin en linea el proceso es ms simple, ya que por ejemplo
o
a
no es posible cambiar la estructura del modelo sin descartar el resultado que se ha
obtenido hasta ese momento. Adems, los datos se toman segn van llegando, pues
a
u
recordemos que en este tipo de identicacin la identicacin se hace como su propio
o
o
nombre indica en tiempo real, es decir, ((en l
nea)).
3.3.
Algunas propiedades
3.3.1.
Excitacin persistente
o
o
1
l
m
N N
N
1
A(z )u(k)
>0
k=1
para todo polinomio A(z 1 ) no nulo de grado inferior a n. Usando este resultado se
pueden caracterizar las seales ms comunes:
n
a
CAP
ITULO 3. INTRODUCCION A LA IDENTIFICACION DE SISTEMAS
59
Esto quiere decir que el ruido blanco ser una seal de entrada muy buena para identia
n
car sistemas. En la prctica, sin embargo, es muy dif obtener una seal de entrada
a
cil
n
que se comporte como un ruido blanco ideal, porque es muy dif obtener una secil
cuencia de valores puramente aleatorios. Es posible obtener sin embargo, secuencias de
valores seudoaleatorios, por lo que en la prctica se recurre a secuencias seudoaleatorias
a
de escalores binarios (PRBSS: Pseudo Random Binary Step Sequence). En la gura
3.3 se muestra una de esas secuencias. Ntese que los escalones no tienen por qu tener
o
e
amplitud unitaria, el concepto de binario se reere solamente a dos niveles de entrada
distintos. Por otra parte, la aleatoriedad est en la duracin de los escalones y en el
a
o
momento de aparicin de los mismos.
o
6.5
voltaje
5.5
4.5
3.5
20
40
60
80
100
120
intervalos de muestreo
140
160
180
200
3.3.2.
Convergencia e identicabilidad
l E()) = 0
m
N
60
ALGUNAS PROPIEDADES
convergencia tiene a su vez una serie de requisitos o condiciones que se pueden resumir
en:
3.3.2.1.
Q(z 1 )
y(t)
P (z 1 )
CAP
ITULO 3. INTRODUCCION A LA IDENTIFICACION DE SISTEMAS
61
exactitud.
Segunda condicin de identicabilidad en bucle cerrado
o
Si los polinomios A(z 1 ) y C(z 1 ) tienen p ceros comunes (en caso de que sean primos
entre si, p = 0) se ha de cumplir que
mx(w mb , d + v ma ) p
a
Si esto no se cumpliese, la solucin pasa por jar alguno de los parmetros del modelo
o
a
a n de bajar los grados ma o mb . Si fuera factible aumentar el retraso, tambin
e
podr usarse esto para lograr la identicabilidad en bucle cerrado. Ntese que por
a
o
estos procedimientos lo que se consigue es que el proceso de identicacin converja a
o
un valor del vector de parmetros que corresponde con el que da un menor error. No
a
quiere decir que el sistema real se describa mejor por ese modelo. Es decir, puede que
exista otro modelo del mismo orden mejor, pero si no se toman las medidas indicadas
no se llegar a ese modelo ni probablemente se converger a ningn otro.
a
a
u
Un caso comn es que p = 0 y ma = mb = n, por lo que esta condicin se puede
u
o
expresar como
mx(w, v + d) n
a
Ejemplo 3.1
Supongamos que ma = mb = n y que
u(k) =
G(z 1 )
y(k)
zB(z 1 )F (z 1 )
62
ALGUNAS PROPIEDADES
3.3.3.
En la identicacin en l
o
nea es habitual introducir un nivel de supervisin y tratamieno
to de las seales a n de evitar que se produzcan situaciones que desestabilicen la
n
identicacin, es decir, que el valor del vector de parmetros identicado no converja
o
a
o converja a un valor incorrecto. Las tareas que se pueden realizar en estos niveles
incluyen:
Cap
tulo 4
Identicacin por m
o
nimos
cuadrados
4.1.
El mtodo de los m
e
nimos cuadrados
Este mtodo permite la identicacin en tiempo real de modelos con el unico reqe
o
uisito de que estos sean lineales en los parmetros. Esto incluye, por tanto, a modelos
a
lineales y no lineales que sean lineales en los parmetros. El mayor interes prctico rea
a
side, sin embargo, en la identicacin de los primeros, dado que son los ms utilizados
o
a
en control.
Considerse el siguiente modelo paramtrico lineal monovariable1 :
e
e
y(k) + a1 y(k 1) + + an y(k n) = b1 u(k 1) + + bn u(k n)
(4.1)
Ntese que este modelo es determinista en el sentido de que no considera ruidos aleatoo
rios como en los modelos vistos en el tema 2. Es inmediato comprobar que este modelo
corresponde a la siguiente funcin de transferencia:
o
G(z 1 ) =
b1 z 1 + + bn z n
1 + a1 z 1 + + an z n
(4.2)
Este mtodo se puede aplicar sin cambios conceptuales a modelos multivariables. Sin embargo por
e
simplicidad nos ceiremos al caso de modelos monovariables.
n
63
EL METODO DE LOS M
INIMOS CUADRADOS
64
donde el vector
m(k) =
es llamado regresor y
=
a1 a n b 1 b n
(4.3)
Ntese que conocido el valor de los valores presentes y pasados de la salida y la entrada,
o
la expresin (4.2) es una ecuacin en las que las 2n incognitas son los parmetros que
o
o
a
forman . Si el proceso a identicar correspondiese exactamente con un modelo como
(4.1) se podr determinar el valor del vector de parmetros a partir de 2n medidas u
a
a
observaciones de la salida para una serie de entradas conocidas. Es decir, se formar
a
un sistema de 2n ecuaciones con el que se podr determinar el valor ((real)) de .
a
El mtodo de los m
e
nimos cuadrados parte de N pares (y(k), m(k)) donde N es
generalmente mucho mayor de 2n (este ser el conjunto de estimacin) y permite
a
o
ajustar un modelo del tipo (4.1). En el supuesto poco realista de que el proceso coincida
con un modelo como el que se intenta ajustar, se tendr un sistema de ecuaciones
a
sobredeterminado compatible, de manera que tendr solucin y el error de prediccin
a
o
o
alcanzado ser cero para todas las medidas del conjunto de estimacin. Sin embargo,
a
o
en la prctica el proceso no se puede describir a la perfeccin mediante un modelo lineal
a
o
del tipo (4.1) por lo que el sistema de ecuaciones no tiene solucin en el sentido de que
o
no existe un valor del vector de parmetros que haga que el error de prediccin sea cero
a
o
para todas las medidas del conjunto de estimacin. Es decir, el sistema de ecuaciones
o
es incompatible. Sin embargo si se puede encontrar un valor del vector de parmetros
a
que haga m
nimo el error de prediccin, de manera ms precisa que haga m
o
a
nima la
suma de los cuadrados de los errores de prediccin del conjunto de estimacin. Esta es
o
o
2
precisamente la estrategia del mtodo de m
e
nimos cuadrados .
Las medidas obtenidas desde k = n hasta k = N se agrupan en vectores de manera
que se obtiene:
E(N, ) = Y (N ) M (N )
donde los vectores E(N ) e Y (N ) son
E(N, ) =
Y (N ) =
2
e(n, ) e(N, )
T
y(n) y(N )
CAP
ITULO 4. IDENTIFICACION POR M
INIMOS CUADRADOS
65
m(n)
.
.
M (N ) =
.
m(N )
Se dene el
ndice de bondad de ajuste como
J() = E(N, )
e2 (k, )
=
k=n
Este
ndice lo podemos reescribir como
J() = (Y (N ) M (N ))T (Y (N ) M (N ))
El m
nimo valor de J() se dar en el valor del vector de parmetros que cumpla que
a
a
dJ()
=0
d
es decir,
2(M (N ) Y (N ))T M (N ) = 0
de donde se obtiene que el valor del vector de parmetros que hace m
a
nimo el
ndice
de bondad de ajuste es
= [M T (N )M (N )]1 M T (N )Y (N )
(4.4)
y ese es por tanto el valor del vector de parmetros del modelo identicado.
a
Ntese que para que el problema de identicacin tenga solucin la matriz [M T (N )M (N )]
o
o
o
tiene que ser invertible al igual que M (N ). Sin entrar en demasiados detalles, tal condicin se verica cuando la entrada cumple las condiciones de excitacin persistente del
o
o
sistema. Se deber acudir por tanto a seales de entrada parecidas al ruido blanco (ver
a
n
tema 3).
4.2.
La expresin (4.4) implica la inversin de una matriz que puede tener unas dimeno
o
siones apreciables, tanto ms si se tiene en cuenta que para identicar correctamente
a
ALGORITMO RECURSIVO PARA IDENTIFICACION EN LINEA
66
un sistema se deben tener sucientes medidas para eliminar el efecto de ruidos y perturbaciones ajenas a la dinmica del sistema. Intentar efectuar estos clculos en linea
a
a
3
es bastante ambicioso para el hardware de control habitual . Por tanto este algoritmo
se destina a la identicacin fuera de linea. En linea se emplea otro procedimiento que
o
se muestra a continuacin.
o
La estimacin para el instante k usando las medidas obtenidas desde el instante n
o
vendr dada por
a
k
T
(4.5)
m (i)m(i)
i=n
M T (k 1)Y (k 1) = P 1 (k 1)(k 1)
= P 1 (k)(k 1) mT (k)m(k)(k 1)
Combinando las dos ultimas expresiones con (4.5) se obtiene
(k) =
=
=
(4.6)
donde K(k) = P (k)mT (k). Por tanto (k) se puede expresar en forma recursiva, es
decir en funcin del valor del estimador en el instante anterior ms un trmino corrector
o
a
e
que consiste en el error de prediccin en el instante actual cometido por el estimador
o
calculado en el instante anterior multiplicado por una ganancia de adaptacin K(k).
o
Esta formula da lugar al llamado algoritmo de minimos cuadrados recursivos, que
consiste en
1. Dar valores iniciales a la matriz P y al vector de parmetros .
a
3
Tngase en cuenta que el hardware industrial no se renueva tan rpidamente como el usado
e
a
en informtica personal y que adems tampoco se incorporan las ultimas tecnologias con la misma
a
a
rapidez.
CAP
ITULO 4. IDENTIFICACION POR M
INIMOS CUADRADOS
67
2. En cada instante k
a) Leer los valores de y(k) y u(k).
b) Formar el vector regresor m(k) segn la expresin (4.3).
u
o
c) Calcular P (k) mediante
P (k) = P (k 1)
P (k 1)mT (k)m(k)P (k 1)
1 + m(k)P (k 1)mT (k)
A@9 86
7
+
10) 23 5 4
ALGORITMO
RECURSIVO
&% #$ ( '
FORMAR
REGRESOR
AGF EDC
A@9 78B
PLANTA
Z-1
4.3.
Interpretacin estad
o
stica
INTERPRETACION ESTAD
ISTICA
68
del vector de parametros estimado tambien es una variable aleatoria que se puede
estudiar desde un punto de vista estad
stico. Por responder el proceso exactamente a
uno de los dos tipos de modelos considerados existe un valor del vector de parmetros
a
vector de parmetros estimados (k) coincide con . Dado que (k) es una variable
a
aleatoria estudiaremos su valor esperado, es decir su esperanza matemtica. Se dene
a
el sesgo de la estimacin como
o
= E (k)
CAP
ITULO 4. IDENTIFICACION POR M
INIMOS CUADRADOS
69
La situacin es diferente con el modelo ARX-LS. En este caso los valores de M (k)
o
no pueden estar relacionados con V (k) (que, al ser cn = 0, solo est formada por los
a
valores presentes de v(k) para cada instante k). Por tanto, el estimador por m
nimos
= 0 y por tanto el valor esperado del estimador
cuadrados es insesgado, es decir
coincide con el valor real del vector de parmetros, es decir
a
E (k) =
Por otra parte, el hecho que de que el proceso responda a uno u otro tipo de
modelo tiene una interpretacin f
o sica inmediata. En el caso del proceso ARMAX el
ruido presenta una cierta dinmica , mientras que en el caso del ARX-LS el ruido no
a
presenta dinmica alguna y responde unicamente a un ruido proveniente del sensor
a
e
nimos cuadrados produce
estimaciones consistentes.
Otra propiedad que resulta interesante conocer es la varianza del estimador. Claramente interesa que esta varianza sea pequea o por lo menos que disminuya conforme
n
se acumulan medidas disponibles para usarlas en la estimacin. De esa manera, el veco
tor de parmetros estimados estar con seguridad cerca del vector real. La varianza del
a
a
estimador se puede calcular como
mT (k)m(k)
k=n
M
INIMOS CUADRADOS PONDERADOS
70
mT (i)m(i)
P (k) =
i=n
lo que implica que a medida que N crece P decrece. Se puede demostrar que si el
1
tamao del regresor no cambia demasiado P decrece como N . Esto quiere decir que la
n
incertidumbre en la estimacin decrece, es decir, que cada vez se obtiene un estimador
o
ms cercano al valor real. Adems la ganacia de adaptacin K(k) tambien decrece
a
a
o
(vease su denicin en la seccin 4.2) lo cual es congruente con el hecho de que cuanto
o
o
ms exacta es la estimacin menos correccin de su valor se necesita. Esto es bueno
a
o
o
si la dinmica del proceso no cambia con el tiempo, pero si esto no es as habr que
a
a
modicar este esquema.
4.4.
M
nimos cuadrados ponderados
w(k)e2 (k, )
=
k=n
w(n)
...
W (N ) =
w(N )
= [M T (N )W (N )M (N )]1 M T (N )W (N )Y (N )
(4.8)
CAP
ITULO 4. IDENTIFICACION POR M
INIMOS CUADRADOS
71
, donde (0, 1) es el llamado factor de olvido. Es fcil entender por que se le llama
a
olvido exponencial: el peso dado a la medida disminuye exponencialmente cuanto ms
a
antigua sea. De esta manera las medidas muy antiguas se olvidan, pues su peso es tan
pequeo que es como si no se contribuyesen a la estimacin. Habitualmente se usa
n
o
[0,98, 1). Por ejemplo, si = 0,99 el estimador tendr una ((memoria)) de unas 100
a
muestras. En aquellos casos que la dinmica del proceso cambie muy rpidamente se
a
a
puede optar por valores ms bajos (por ejemplo, = 0,95).
a
En el caso de la tcnica de olvido la formulacin recursiva puede aplicarse modie
o
cando las expresiones para el calculo de P (k) de manera que:
P (k) =
P (k 1) P (k 1)mT (k)m(k)P (k 1)
Puede observarse que, dado que K(k) = P (k)mT (k), la ganancia de adaptacin K(k)
o
depende de y a menor mayor ganancia de adaptacin. Esto quiere decir que a menor
o
mejor se adaptar la identicacin a una dinmica cambiante, ya que se considerar
a
o
a
a
en la optimizacin solo la informacin ms reciente.
o
o
a
Sin embargo si en el sistema o en las medidas hay mucho ruido, es conveniente
que la dinmica se identique sobre un conjunto amplio de medidas ya que si no se
a
identicar el ruido ms que la dinmica del proceso. Por tanto en estos casos conviene
a
a
a
que no sea muy pequeo. Por tanto hay que llegar a un compromiso entre la capacidad
n
de seguir una dinmica cambiante y el rechazo del ruido en la identicacin.
a
o
4.5.
M
nimos cuadrados extendidos y generalizados
a1 a n b 1 b n c 1 c n
ESTIMACION DE LOS VALORES DE CONTINUA
72
Sin embargo, los valores pasados de la seal de ruido v(k) no son medibles, por lo que
n
no se pueden incluir en el regresor. Lo que se hace es aproximarlos por los errores de
prediccin, es decir
o
El resto del procedimiento es exactamente igual, tanto en las formulaciones fuera de linea como en linea. Con este mtodo se consiguen estimaciones insesgadas y consistentes
e
para procesos que respondan como un modelo ARMAX. Los problemas son un aumento de la carga de calculo y una menor velocidad de convergencia en los parmetros ci
a
debido a que la seal de ruido no es la ms preponderante.
n
a
Finalmente, existe otra variante de los m
nimos cuadrados que son los m
nimos
cuadrados generalizados. Sin entrar en demasiados detalles, esta formulacin se usa
o
1
cuando se tiene algn conocimiento del valor real del polinomio C(z ) o de la matriz
u
P (matriz de covarianza). En este caso si la matriz N denida como
N = E vv T
es distinta de la matriz identidad se obtienen mejores resultados si el criterio que se
utiliza es
J() =
eT (k, )N 1 e(k, )
4.6.
y(k) = Y (k) Y
donde U (k) e Y (k) son los valores reales de la salida y la entrada y U e Y son
los valores de continua de ambas seales. Para estimar dichos valores existen diversas
n
opciones.
CAP
ITULO 4. IDENTIFICACION POR M
INIMOS CUADRADOS
4.6.1.
73
4.6.2.
La idea es aproximar los valores de continua por los valores medios de las seales.
n
En el caso de la formulacin fuera de linea estos valores medios se calculan mediante
o
las expresiones tradicionales, es decir
U =
1
N
u(i)
Y =
i=1
1
N
y(i)
i=1
4.6.3.
1
(U (k) U (k 1))
k
1
(Y (k) Y (k 1))
k
La idea en este caso es que el modelo que se pretende identicar puede reescribirse
como
Y (k) Y = a1 (Y (k 1) Y ) a2 (Y (k 1) Y ) an (Y (k n) Y )
+b1 (U (k d 1) U ) + + bn (U (k d n) U )
74
(4.9)
a1 a n b 1 b n K
y en el regresor se incluye un 1
m(k) =
Una vez estimado el valor de K, lo que se hace es dar un valor arbitrario a Y , por
ejemplo igual al valor de la referencia o consigna. Con ese valor se calcula U mediante
la expresin (4.9).
o
4.7.
El orden del sistema a identicar es algo que debe ser conocido para asegurar la
convergencia e identicabilidad (ver tema 3). En la prctica esto no es sencillo, y se
a
debe recurrir a probar con varios modelos de ordenes y estructuras distintas a ver cual
resulta mejor. Esto quiere decir que se pueden dar situaciones de mala estimacin del
o
orden del modelo por defecto (incurriendose en lo que se llama infraparametrizacin)
o
o por exceso (sobreparametrizacin).
o
Veamos que ocurre cuando se intenta aproximar un sistema por un modelo de
orden inferior. Si esto sucede se llega a una situacin en la que el modelo solo puede
o
aproximar al sistema real en una banda de frecuencia relativamente estrecha. Si durante
el transcurso del proceso de identicacin la seal de entrada cambia su contenido
o
n
frecuencial, el modelo estimado (es decir su vector de parmetros) evoluciona hasta
a
aproximar al sistema en torno a la nueva banda de frecuencias. Todo esto implica que
se obtendr un modelo distinto dependiendo de la seal de entrada. Este problema se
a
n
ilustra en las guras 4.2 y 4.3. En ambas se muestra el diagrama de bode de un sistema
de segundo orden sobre el que ha sido identicado un modelo de primer orden mediante
dos entradas senoidales de distinta frecuencia. Puede observarse en ambas guras que
CAP
ITULO 4. IDENTIFICACION POR M
INIMOS CUADRADOS
75
20
amplitud dB
10
0
10
20
30
40
1
10
10
10
10
desfase (grados)
50
100
150
200
250
1
10
10
frecuencia rad/s
Figura 4.2: Diagrama de Bode de un sistema de segundo orden (linea continua) y de un modelo de
primer orden estimado para una entrada senoidal de frecuencia = 0,2 rad s 1 .
20
amplitud dB
10
0
10
20
30
40
1
10
10
10
10
desfase (grados)
50
100
150
200
250
1
10
10
frecuencia rad/s
Figura 4.3: Misma situacin que en la gura 4.2 pero con una seal de entrada senoidal de frecuencia
o
n
1
= 1 rad s .
76
uey
0.5
0
0.5
1
1.5
10
15
20
25
30
35
40
10
15
20
tiempo (s)
25
30
35
40
1.5
0
0.5
a , b estimados
1
0.5
1.5
2
CAP
ITULO 4. IDENTIFICACION POR M
INIMOS CUADRADOS
77
0.025
k=30
0.02
k=100
0.015
0.01
0.005
0
0.005
2
1.8
k=180
1.6
1.4
a1
1.2
0.8
0.8
0.6
1.5
1
0.5
k=180
k=100
0
0.5
2
k=30
1.8
1.6
1.4
a1
1.2
0.6
Figura 4.5: Evolucin de unos parmetros frente a otros para el modelo sobreparametrizado.
o
a
4.8.
El mtodo de los m
e
nimos cuadrados puede aplicarse a procesos con retardo, siempre
que se tengan en cuenta algunas cuestiones. El modelo determinista de un sistema con
retardo puro de d periodos de muestreo se puede poner como
A(z 1 )y(k) = B(z 1 )u(k d 1)
Eso quiere decir que el regresor en el instante k debe contener valores pasados de la
entrada desde k d 1 a k d n donde n es el grado del polinomio B(z 1 ). Por
tanto el regresor queda
m(k) =
a
suele depender del punto de funcionamiento (por ejemplo, los retardos de transporte
ocasionados por tuberias dependen del caudal de material que se transporta). El problema es que, aunque los mtodos de identicacin propuestos puedan seguir cambios
e
o
78
CONSIDERACIONES FINALES
en los parametros del modelo (se adaptan a esos cambios) no recogen la posibilidad
de un retardo variable (existen remedios a este problema, pero no se tratarn aqu
a
).
Otro problema que puede suceder es que el retardo no sea multiplo exacto del tiempo
de muestreo. Aunque existen formas para describir retardos no enteros (por ejemplo,
el uso de una expansin de Pad) es mas sencillo y menos problemtico emplear si es
o
e
a
posible otro tiempo de muestreo para hacer que el retardo sea entero.
Finalmente se coment al principio del tema que el mtodo de m
o
e
nimos cuadrados
tambien permite la identicacin de sistemas no lineales con la limitacin de que el
o
o
modelo a identicar sea lineal en los parmetros. De este modo, si el sistema se pretende
a
identicar con un modelo que por ejemplo podr ser
a
y(k) + ay(k 1) = bu2 (k 1)
el regresor y el vector de parmetros ser
a
an
m(k) =
y(k 1) u2 (k 1)
(k) =
a b
respectivamente.
4.9.
Consideraciones nales
CAP
ITULO 4. IDENTIFICACION POR M
INIMOS CUADRADOS
79
y como valor inicial del vector de parmetros se puede usar = P (0)M (2n)Y (2n).
a
80
CONSIDERACIONES FINALES
Cap
tulo 5
Introduccin al control adaptativo
o
5.1.
o
la bondad o comportamiento del controlador. Dicho
ndice de actuacin se compara con
o
un cierto comportamiento deseado y segn el resultado de dicha comparacin se ajustan
u
o
81
` W
hxYrq
COMPORTAMIENTO
DESEADO
`YWyeb uri
i iq
sX xyfiW
q
`
REFERENCIA
u
+
`YUyrebYyi
Wiv W
q
sWuq `
grrqs
q i q
egrexywvui
ib t
dX igXdb
hsqrphfec`aXYW
bfpg
i `i
82
los parmetros del regulador. Para ello se utiliza un mecanismo de adaptacin que en
a
o
algunos casos (no siempre) tambin puede actuar directamente sobre la actuacin o
e
o
seal de control que recibe el proceso. En algunos casos se aade un tercer bucle que
n
n
tiene como tarea la supervisin del sistema de manera que, por ejemplo, se garantice la
o
estabilidad del sistema en bucle cerrado o se eviten ciertos comportamientos indeseados
tales como cambios demasiado abruptos en los parmetros del regulador ajustable.
a
Es fcil ver que en el esquema anterior el mecanismo de adaptacin realiza la tarea
a
o
de resolver en tiempo real el problema de disear un regulador apropiado (en el caso
n
ms sencillo con una estructura predenida) para un sistema dado de manera que se
a
cumplan unas determinadas especicaciones de diseo (dadas por el ((comportamiento
n
deseado))).
Existen otros controladores que proporcionan una cierta capacidad de adaptacin
o
pero que no encajan en la denicin anterior ya que la adaptacin se realiza en bucle
o
o
abierto, es decir, para adaptar la ley de control no se usan las medidas de la salida o
estado de la planta. Este es el caso de los controladores gain scheduling los cuales se
tratarn en la seccin 7.4.
a
o
5.1.1.
CAP
ITULO 5. INTRODUCCION AL CONTROL ADAPTATIVO
83
Ambas estrategias suponen que para cualquier juego de valores de los parmetros del
a
sistema y las perturbaciones, existe un controlador lineal que hace que el sistema en
bucle cerrado cumpla los requisitos de diseo.
n
Los MRAC intentan alcanzar un comportamiento en bucle cerrado deseado que
viene especicado por un modelo de referencia. Por otra parte, los STR intentan alcanzar un control lo mejor posible (ptimo) a partir de un tipo de controlador prejado y
o
la informacin obtenida del proceso (seales de entrada, salida, etc. . . ).
o
n
Las dos tcnicas tienen sus ventajas e inconvenientes. Las ventajas del MRAC pasan
e
por una rpida adaptacin y la posibilidad de utilizar formulaciones que garanticen
a
o
estabilidad (usando mtodos de Lyapunov). Sin embargo, la capacidad de adaptacin
e
o
de estas estrategias dependen en gran medida de la riqueza dinmica de la seal de
a
n
control (esto es anlogo a lo que ocurre en la identicacin de sistemas, vase el tema
a
o
e
3). Por otra parte, los STR se adaptan bien en casi todas las situaciones y son fciles de
a
implementar pues admiten tcnicas de programacin modular. Sin embargo, tambin
e
o
e
presentan sus propios inconvenientes como se ver ms adelante.
a a
Otra posible clasicacin de los sistemas de control adaptativos es aquella que
o
atiende a la forma de obtener los parmetros del controlador. En este esquema podemos
a
encontrarnos:
En los primeros el valor de los parmetros se obtiene buscando entre los posibles valores
a
aquellos que hacen optimo un cierto criterio de comportamiento del sistema. Es decir,
JUSTIFICACION DEL USO DE CONTROL ADAPTATIVO
84
Los controladores adaptativos sin criterio optimo buscan los parmetros del contro
a
lador no mediante la optimizacin de un criterio de funcionamiento sino entre aquellos
o
que cumplen unas ciertas especicaciones, por ejemplo, la colocacin de los ceros y los
o
polos de bucle cerrado. En estos esquemas el controlador ajustable puede ser por ejemplo un regulador PID, un controlador dead-beat como los estudiados anteriormente o
un controlador por asignacin de polos o de ceros y polos. En tiempo real se resolver el
o
a
problema de disear dichos controladores, de manera que a pesar de los cambios en el
n
proceso se sigan cumpliendo las especicaciones de diseo.
n
5.2.
El control adaptativo conlleva una serie de inconvenientes que pueden hacernos cuestionar su uso. Por ejemplo, su sinton no suele ser tan sencilla como la de los clsicos
a
a
controladores PID. Por tanto, hay que ver en que situaciones puede ser ventajoso su
uso y en que situaciones es mejor quedarse con controladores ms sencillos.
a
En general un controlador convencional est pensando para controlar sistemas cuyos
a
parmetros permanecen constantes (es decir, su dinmica no var Esta suposicin se
a
a
a).
o
corresponde ms o menos con la de un sistema que suele operar siempre cerca de un
a
determinado punto de operacin y cuyas perturbaciones no son grandes (en relacin a
o
o
la variable controlada) y no var demasiado. Sin embargo, puede suceder que el punto
an
de trabajo var frecuentemente y en algunos sistemas puede suponer una variacin de
e
o
su dinmica lo sucientemente importante para afectar al rendimiento del controlador.
a
Por ejemplo, supongamos un sistema realimentado en el que el actuador presenta una
caracter
stica de transferencia no lineal (gura 5.2). Esta situacin corresponde por
o
+
f(u)
G(s)
ejemplo a la caracter
stica instalada de un vlvula que usualmente suele ser no lineal.
a
Supongamos que el caudal de salida de la vlvula viene dado por una expresin C =
a
o
4
A , donde es una cierta constante y A la apertura porcentual de la vlvula. En la
a
gura 5.3 se muestra dicha caracter
stica instalada (trazo slido). A la hora de disear
o
n
el sistema de control se intentar obtener un modelo linealizado del actuador, que
a
CAP
ITULO 5. INTRODUCCION AL CONTROL ADAPTATIVO
85
14
12
caudal (m /h)
10
10
20
30
40
50
apertura (%)
60
70
80
90
100
general, cuando la variacin en los parmetros del sistema o los actuadores se conoce
o
a
de antemano y adems se puede establecer una dependencia entre dichos parmetros
a
a
y el punto de operacin (o una variable auxiliar) se puede recurrir a tcnicas sencillas
o
e
de control adaptativo como el gain scheduling (vase la seccin 7.4). En caso contrario
e
o
tendr
amos que recurrir a tcnicas ms sosticadas.
e
a
Otro hecho a tener en cuenta es que no siempre es fcil juzgar la necesidad o
a
no de utilizar el control adaptativo. Considrese el sistema dado por la funcin de
e
o
transferencia
G(s) =
1
(s + 1)(s + a)
(5.1)
La primera aproximacin a este sistema ser hallar su respuesta ante escaln, para
o
a
o
los diversos valores de a. Como se ilustra en la gura 5.4 (izquierda), dicha respuesta
var mucho en funcin de los valores del parmetro a, pasando de hecho de ser un
a
o
a
sistema estable a otro inestable. Parecer que el sistema var lo suciente como para
a
a
justicar el uso del control adaptativo. Sin embargo, la conguracin que realmente
o
nos interesa es la del sistema realimentado. En la gura 5.4 (derecha) se muestra la
JUSTIFICACION DEL USO DE CONTROL ADAPTATIVO
86
Step Response
Step Response
1.2
500
400
0.8
Amplitude
1.4
600
Amplitude
700
300
0.6
200
0.4
100
0.2
20
40
60
80
100
120
140
160
180
200
Time (sec)
10
12
Time (sec)
Figura 5.4: Respuestas en bucle abierto (izquierda) y cerrado (derecha) del sistema dado en (5.1).
G(s) =
20(1 T s)
(s + 1)(s + 20)(T s + 1)
(5.2)
En este caso la respuesta en bucle abierto del sistema es muy parecida independientemente de los valores de T (gura 5.5 izquierda). Cuando se le realimenta usando como
entrada u = 15(ref y) se obtienen, sin embargo, comportamientos muy diferentes en
funcin del valor de T (gura 5.5 derecha). Es por tanto que en este caso s estar
o
a
justicado el uso de tcnicas de control adaptativo. El lector puede comprobar adems
e
a
que no slo hay que juzgar en funcin del comportamiento en bucle cerrado en general,
o
o
sino que hay que tener en cuenta cules van a ser las condiciones de operacin particua
o
lares en las que se va a trabajar. En efecto, si se obtiene la respuesta en bucle cerrado
para el sistema (5.2) pero utilizando una realimentacin unitaria (esto es, u = (ref y))
o
entonces las respuestas son esencialmente iguales independientemente del valor de T .
CAP
ITULO 5. INTRODUCCION AL CONTROL ADAPTATIVO
87
Step Response
Step Response
1.5
0.9
0.8
0.7
1
Amplitude
Amplitude
0.6
0.5
0.4
0.5
0.3
0.2
0.1
0
0
0
3
Time (sec)
0.5
1.5
2.5
Time (sec)
Figura 5.5: Respuestas en bucle abierto (izquierda) y cerrado (derecha) del sistema dado en (5.2).
5.3.
88
SjYf{ezrYPzd|kr pu h
erh
r v k fdtipz r
+
-
ri jgh
h d fjqYi pdPn d
phkYoflgmafje p
REFERENCIA
toeUi s
jg j
yp
e s
rxydfhwnoeUefk Yr j u
k p v u j v g j j
Figura 5.6: Conguracin genrica de un controlador adaptativo por modelo de referencia (MRAC).
o
e
CAP
ITULO 5. INTRODUCCION AL CONTROL ADAPTATIVO
5.3.1.
89
Se basa en un
ndice de actuacin, usualmente cuadrtico, que mide la bondad de
o
a
la adaptacin en base a las discrepancias entre las salidas del modelo y la planta a lo
o
largo de un intervalo de tiempo:
t+T
e2 ( )d
J(t + T ) =
(5.3)
t
donde Rnn es una matriz denida positiva que acta como ganancia de adaptacin.
u
o
Es fcil entender que el controlador slo tiene inuencia sobre la salida de la planta,
a
o
no sobre la del modelo. Por tanto ymodelo (t) no depende de y al variar ste tampoco
e
lo hace ymodelo (t), luego
yproceso ( )
e( )
=
Ntese que yproceso representa cmo var la salida del proceso frente a variaciones del
o
o
a
90
que resulta en
d
e(t)
=
signo(e(t))
dt
e(t)
signo(e(t))
Ejemplo 5.1
Supongamos que tenemos un proceso cuya funcin de transferencia viene dada por
o
G(s) = kF (s)
donde k es ganancia desconocida y F (s) es perfectamente conocida. Se pretende que
el sistema en bucle cerrado se comporte acorde al modelo de referencia
GM (s) = k0 F (s)
(5.6)
donde k0 es una ganancia conocida (es un dato de entrada del problema). El controlador
ajustable del que se dispone tiene la estructura
u = uc
donde u es la entrada que se aplica a la planta y uc es la entrada al controlador (es
decir el parmetro que se ha de ajustar es simplemente una ganancia). Se supone una
a
conguracin del sistema de control tal que es una ganancia feed-forward , es decir,
o
la funcin de transferencia desde uc a la salida del proceso yp es
o
Y (s)
= kF (s)
UC (s)
Como se pretende que la funcin de transferencia sea como en (5.6), lo lgico ser
o
o
a
tomar
k0
=
k
pero es evidente que esto no se puede hacer, porque se desconoce el valor de k. Se
propone ajustar mediante la regla del MIT en el contexto de un control adaptativo
MRAC. El error es en este caso
e(t) = yp (t) ym (t) = kF (s)uc (t) k0 F (s)uc (t)
(5.7)
CAP
ITULO 5. INTRODUCCION AL CONTROL ADAPTATIVO
91
(5.8)
ym (t)
k0
k0
La variacin de los parmetros segn la regla del MIT ser
o
a
u
a
k
d
= ym (t)e(t)
dt
k0
Ntese que se sigue desconociendo el valor de k0 , sin embargo esto no plantea problema
o
alguno, pues como es una constante cualquiera podemos agrupar las constantes que
aparecen en una sola , de manera que la regla ser
a
d
= ym (t)e(t)
dt
92
Cap
tulo 6
Reguladores Autoajustables (STR)
6.1.
INTRODUCCION. ESTRUCTURA GENERAL DE LOS STR
94
~pp ~
ef~ eA~ p }
COMPORTAMIENTO
DESEADO
U{PSft} u A z
p
~ ~V ~
ePppfep }
Pp
REFERENCIA
En los STR clsicos se suele suponer que los procesos son deterministas (es decir no
a
se consideran fuentes de perturbaciones estocsticas como las vistas en el cap
a
tulo 2).
Por otra parte es comn que el controlador ajustable sea del tipo PID. En realidad,
u
como es la estructura de un STR es modular, se puede usar cualquier combinacin de
o
controlador/mtodo de identicacin.
e
o
Tambin se pueden considerar procesos estocsticos en los STR. Es comn entonces
e
a
u
que la estructura escogida para el modelo sea la de tipo ARMAX (vase el cap
e
tulo 2).
El diseo se podr hacer, por tanto, utilizando un criterio estocstico o no estocstico.
n
a
a
a
En el caso de que sea un criterio estocstico normalmente se obtienen los parmetros
a
a
del regulador mediante la minimizacin de un cierto
o
ndice de funcionamiento. Por
ejemplo en el regulador de m
nima varianza (el cual se ver en la seccin 6.2) se intentan
a
o
minimizar las variaciones con respecto a cero de la salida (se considera un problema de
regulacin con referencia nula), que al ser una seal ruidosa se consigue minimizando
o
n
la esperanza matemtica de la salida en k + d, es decir
a
J = E y 2 (k + d)
siendo d el retraso.
Cuando el diseo ser realiza usando un planteamiento no estocstico, se est conn
a
a
siderando que las perturbaciones que inciden sobre el sistema son conocidas con exactitud de antemano, de tal manera que podemos usar modelos deterministas (vase el
e
cap
tulo 2). En este caso el
ndice de actuacin se da en funcin de unas especicao
o
ciones que debe cumplir la salida del sistema, como por ejemplo el tiempo de subida y
CAP
ITULO 6. REGULADORES AUTOAJUSTABLES (STR)
95
6.1.1.
Entre los STR podemos distinguir dos tipos de algoritmos, unos que identican directamente los parmetros de la planta y luego disean el controlador para cumplir con
a
n
los requisitos (estructura expl
cita) y otros que lo que hacen es estimar el controlador
directamente sin pasar por la estimacin previa de la planta (estructura impl
o
cita).
Un algoritmo con estructura expl
cita constar de los siguientes pasos:
a
1. Estimar los parmetros del modelo mediante un algoritmo de identicacin rea
o
cursivo.
2. Calcular los parmetros del controlador.
a
3. Calcular la seal de control y aplicarla.
n
Estos pasos se repetir en cada tiempo de muestreo.
an
Los algoritmos de estructura impl
cita son ms complicados desde el punto de vista
a
conceptual. Lo que se hace en ellos es reparametrizar el modelo de la planta y el
controlador en funcin de los parmetros del controlador. El esquema ser el mostrado
o
a
a
en la gura 6.2. Obsrvese en esta gura que no se est pasando por la fase de diseo del
e
a
n
-
tVz8t8 pet p
z w 8
Vz8
REFERENCIA
COMPORTAMIENTO
DESEADO
e VPhzz
pzp oYf8
controlador sino que este se identica, de manera que cumpla con las especicaciones de
diseo. Por eso en la gura 6.2 como la identicacin toma como datos de entrada las
n
o
CONTROL POR M
INIMA VARIANZA
96
6.2.
Control por M
nima Varianza
El regulador de m
nima varianza es un regulador optimo que pretende reducir el
(6.1)
CAP
ITULO 6. REGULADORES AUTOAJUSTABLES (STR)
97
y d es el retraso puro1 .
Supngase que se desea dividir C(z 1 ) entre A(z 1 ). Dicha divisin de polinomios
o
o
producir en general un polinomio cociente y un polinomio resto. El cociente lo denoa
taremos por F (z 1 ) y el resto se factoriza de manera que se denote por z (d+1) G(z 1 ).
Por tanto podremos reescribir la conocida expresin dividendo igual a divisor por coo
ciente ms resto as
a
(6.2)
donde
F (z 1 ) = 1 + f1 z 1 + + fd z d
G(z 1 ) = g0 + g1 z 1 + + gn1 z (n1)
Ntese que el grado de F (z 1 ) es d y el de G(z 1 ) es n 1. A continuacin dividiremos
o
o
1
ambos miembros de la ecuacin (6.1) por A(z ) y usaremos (6.2) de manera que se
o
obtiene
B(z 1 )
z 1 G(z 1 )
y(k + d) =
u(k) + F (z 1 )v(k + d) +
v(k)
(6.3)
A(z 1 )
A(z 1 )
en donde adems se ha tenido en cuenta que z d v(k + d) = v(k). Veamos el signicado
a
de algunos de los trminos de (6.3). El trmino F (z 1 )v(k + d) es una combinacin
e
e
o
lineal de los valores de v(k) a v(k + d) cuyo efecto sobre y(k + d) no depende de u(k).
Por otra parte el termino
z 1 G(z 1 )
v(k)
A(z 1 )
representa el efecto sobre la salida de las perturbaciones en instantes anteriores a k.
Por otra parte si dividimos por C(z 1 ) la expresin (6.2) se obtiene
o
1=
A(z 1 )F (z 1 )
z (d+1) G(z 1 )
=
C(z 1 )
C(z 1 )
(6.4)
A(z 1 )
B(z 1 ) d
y(k)
z u(k)
C(z 1 )
C(z 1 )
Ntese que el polinomio B(z 1 ) no tiene trmino independiente, lo que se reeja en la forma de
o
e
describir el proceso ARMAX en la ecuacin (6.1).
o
CONTROL POR M
INIMA VARIANZA
98
B(z 1 )
z 1 G(z 1 ) A(z 1 )
B(z 1 ) d
u(k) + F (z 1 )v(k + d) +
y(k)
z u(k)
A(z 1 )
A(z 1 )
C(z 1 )
C(z 1 )
operando
y(k + d) =
B(z 1 )
z 1 G(z 1 )
G(z 1 )B(z 1 ) (d+1)
u(k) + F (z 1 )v(k + d) +
y(k)
z
u(k)
A(z 1 )
C(z 1 )
A(z 1 )C(z 1 )
z 1 G(z 1 )
F (z 1 )B(z 1 )
y(k) +
u(k)
C(z 1 )
C(z 1 )
A partir de esta ecuacin podemos calcular J y ver que valor de u(k) hace m
o
nimo J:
E y 2 (k + d)
= E F (z 1 )v(k + d)
z 1 G(z 1 )
F (z 1 )B(z 1 )
u(k) +
y(k)
C(z 1 )
C(z 1 )
F (z 1 )B(z 1 )
z 1 G(z 1 )
u(k) +
y(k)
C(z 1 )
C(z 1 )
+E
+2E F (z 1 )v(k + d)
a
nimo valor posible de una funcin cuadrtica).
o
a
El resultado es
z 1 G(z 1 )
u(k) =
y(k)
(6.5)
F (z 1 )B(z 1 )
que se puede reescribir tambin como (y as aparece en algunos textos)
e
u(k) =
G(z 1 )
y(k)
zB(z 1 )F (z 1 )
(6.6)
CAP
ITULO 6. REGULADORES AUTOAJUSTABLES (STR)
99
Ejemplo 6.1
Considrese el siguiente sistema lineal
e
yk = ayk1 + buk2
Se pide encontrar la expresin del regulador de m
o
nima varianza.
En este caso es fcil ver que
a
A(z 1 ) = 1 az 1 B(z 1 ) = bz 1 C(z 1 ) = 1
y por otra parte d = 1. Recordemos que se ha de dividir C(z 1 ) entre A(z 1 ) hasta que
el grado del cociente F (z 1 ) sea d, o sea en este caso F (z 1 ) tiene la forma F (z 1 ) = 1+
f1 z 1 . La gura 6.3 nos muestra la divisin hecha paso a paso a la manera tradicional.
o
Por tanto F (z 1 ) = 1 + az 1 . El resto que en este caso es a2 z 2 debe identicarse con
8
8Sw
A
8 8
8
8Sw
la expresin z 2 G(z 1 ), por lo que es evidente que en este caso G(z 1 ) = a2 . Luego
o
recordando la expresin (6.5) obtenemos que el regulador de m
o
nima varianza para este
caso es
z 1 a2
a2
uk =
yk =
yk
(1 + az 1 )bz 1
(1 + az 1 )b
6.2.1.
El regulador de m
nima varianza generalizado
El control por m
nima varianza tal y como se ha presentado aqu presenta problemas
a
nima varianza que tratan este problema y adems incorporan seguimiento de referencias
a
y ponderacin del esfuerzo de control (es decir, que adems de perseguir el objetivo de
o
a
ASIGNACION DE POLOS Y CEROS
100
m
nimizar las variaciones de la salida con respecto a la referencia se intenta hacer esto
usando el menor esfuerzo de control posible). La ms conocida es la del regulador de
a
m
nima varianza generalizado. La idea de este regulador es la de considerar el siguiente
ndice de funcionamiento
J =E
(6.7)
6.3.
C(z 1 )
G(z 1 )
y(t)
ref(t + d)
zB(z 1 )F (z 1 )
zB(z 1 )F (z 1 )
(6.8)
e
de asignacin de polos y ceros debido a Astrm y Wittenmark. En el cap
o
o
tulo 1 ya se
trat el problema de la asignacin de polos mediante realimentacin lineal del vector
o
o
o
de estados. Es conocido que con un slo controlador no se pueden asignar polos y ceros
o
arbitrariamente, por lo que usualmente se preere asignar los polos. El mtodo que
e
aqu se presenta se basa por tanto en una estructura ms compleja que permite colocar
a
los polos y los ceros en las posiciones deseadas. Dicha estructura se presenta en la gura
6.4.
El objetivo del procedimiento es que la funcin de transferencia de bucle cerrado
o
CAP
ITULO 6. REGULADORES AUTOAJUSTABLES (STR)
101
&
1{
Figura 6.4: Estructura para la asignacin de polos y ceros.
o
Rm (z 1 ) d
z w(k)
Pm (z 1 )
(6.9)
o
de que la funcin de transferencia entre w(k) (la referencia a seguir) y y(k) es
o
y(k) =
S(z 1 )B(z 1 )z d
w(k)
A(z 1 )M (z 1 ) + B(z 1 )G(z 1 )z d
(6.10)
Rm (z 1 ) = B (z 1 )Rm1 (z 1 )
Impondremos adems que las ra
a
ces estables de B(z 1 ) estn en M (z 1 ), de manera
e
que tendremos
M (z 1 ) = M1 (z 1 )B + (z 1 )
ASIGNACION DE POLOS Y CEROS
102
Por otra parte se asume que, adems de especicarse el retraso y los polinomios que
a
denen la funcin de transferencia deseada, como parte de los datos de entrada del
o
problema, se tiene un polinomio A0 (z 1 ) que se utiliza para denir S(z 1 ) mediante la
expresin
o
S(z 1 ) = A0 (z 1 )Rm1 (z 1 )
Con todo lo anterior y la ecuacin (6.10) se llega a
o
A(z 1 )M1 (z 1 ) + B (z 1 )G(z 1 )z d = A0 (z 1 )Pm (z 1 )
(6.11)
Esto es una ecuacin polinomial, donde las incgnitas son M1 (z 1 ) y G(z 1 ), que
o
o
2
puede resolverse mediante diferentes mtodos . Quizs el ms simple (pero no ms
e
a
a
a
eciente) sea plantear un sistema de ecuaciones lineales donde las incgnitas sean los
o
1
1
coecientes de los polinomios M1 (z ) y G(z ). En cualquier caso se deben imponer
condiciones sobre los grados de dichos polinomios para que la ecuacin tenga solucin
o
o
unica. Aplicando consideraciones algebraicas que no mostraremos aqu se llega a que
,
1
1
existen dos posibles opciones para los grados de M1 (z ) y G(z ),
1.
grado(G(z 1 )) = grado(A(z 1 )) 1
grado(M1 (z 1 )) = grado(A0 (z 1 )) + grado(Pm (z 1 )) grado(A(z 1 ))
2.
grado(G(z 1 )) = grado(A0 (z 1 )) + grado(Pm (z 1 )) grado(B (z 1 )) d
grado(M1 (z 1 )) = grado(B (z 1 )) + d 1
Se puede demostrar que el control por asignacin de polos y ceros es equivalente al
o
MRAC. Por otra parte segn el sistema podemos tener casos simplicados:
u
1. Cancelacin de todos los ceros. Esto se puede hacer si el sistema es de fase m
o
nima.
En este caso
B + (z 1 ) = B(z 1 )
B (z 1 ) = 1
M (z 1 ) = M1 (z 1 )B(z 1 )
Rm (z 1 ) = Rm1 (z 1 ) = K
S(z 1 ) = KA0 (z 1 )
De hecho es una ecuacin polinomial diofntica. Este tipo de ecuaciones las encontraremos de
o
a
nuevo en el cap
tulo 9, donde se vern otros mtodos para resolverla.
a
e
CAP
ITULO 6. REGULADORES AUTOAJUSTABLES (STR)
103
2. No se cancela ningn cero. Esto ocurre si todos las ra de B(z 1 ) son inestables.
u
ces
En este caso
B + (z 1 ) = 1
B (z 1 ) = B(z 1 )
M (z 1 ) = M1 (z 1 )
S(z 1 ) = KA0 (z 1 )
Rm (z 1 ) = KB(z 1 )
6.3.1.
Ntese que multiplicando ambos miembros de la ecuacin (6.11) por y(k) se obtiene
o
o
A(z 1 )M1 (z 1 )y(k) + B (z 1 )G(z 1 )z d y(k) = A0 (z 1 )Pm (z 1 )y(k)
que dado que A(z 1 )y(k) = B(z 1 )z d u(k) es equivalente a
M1 (z 1 )B(z 1 )z d u(k) + B (z 1 )G(z 1 )y(k) = A0 (z 1 )Pm (z 1 )y(k)
Por otra parte sabemos que M (z 1 ) = M1 (z 1 )B + (z 1 ) y B(z 1 ) = B + (z 1 )B (z 1 ),
por lo que se llega a
A0 (z 1 )Pm (z 1 )y(k) = B (z 1 )z d M (z 1 )u(k) + G(z 1 )y(k)
(6.12)
La ecuacin (6.12) expresa una relacin entre la entrada y la salida que constituye
o
o
un modelo reparametrizado del sistema en bucle cerrado. En dicho modelo aparecen
polinomios conocidos de antemano (A0 (z 1 ), Pm (z 1 )), el retraso d que se supone
conocido, y tres polinomios (B (z 1 ) , M (z 1 ), G(z 1 )) que son los que deben ser
identicados (ajustados mediante un mtodo de identicacin recursivo), usando los
e
o
valores experimentales de la entrada y la salida. Obsrvese que al identicarse dicho
e
modelo reparametrizado se estarn identicando los parmetros del controlador adems
a
a
a
de parte de los parmetros de la planta. Estos ultimos no son sin embargo necesarios,
a
ASIGNACION DE POLOS Y CEROS
104
1
S(z 1 )w(k) G(z 1 )y(k)
1 )
M (z
6.3.2.
1
S(z 1 )w(k) G(z 1 )y(k)
M (z 1 )
Cap
tulo 7
Controladores PID con autoajuste
y Ajuste por tabla
7.1.
Introduccin
o
En este cap
tulo se revisaran algunas de las tcnicas de control adaptativo con mayor
e
aplicacin en la industria. Estas no son tan ambiciosas como algunas de las presentadas
o
hasta ahora y sin embargo son denitivamente estrategias de control avanzado que han
demostrado ser utiles en la prctica. Adems de las tcnicas referidas en el t
a
a
e
tulo del
cap
tulo se concluir el temario relativo a control adaptativo con un breve repaso a
a
algunos sistemas comerciales.
7.2.
Los reguladores adaptativos vistos hasta ahora, es decir los MRAC y STR, necesitan
para poder funcionar correctamente un conocimiento bsico a priori de la planta. A n
a
de poder obtener esa informacin lo mas fcilmente posible, los fabricantes introdujeron
o
a
en los controladores adaptativos comerciales un modo de sinton previa (pre-tune), que
a
obten dicha informacin bsica.
a
o a
Paralelamente, se estaban desarrollando tcnicas para poder ajustar automticae
a
mente controladores de tipo PID sin necesidad de intervencin del operario. Lo que
o
105
106
ocurri, es que se vio que para poder ajustar un PID automticamente bastaba con la
o
a
informacin bsica que proporcionaban los modos pre-tune de los controladores adapo a
tativos.
Por otra parte, desde el mundo industrial una de las caracter
sticas ms demandadas
a
era una funcin de autoajuste inicial. Al instalarse el controlador se activar dicha
o
a
funcin (apretando un botn en el panel de control) a lo que el controlador responder
o
o
a
realizando una bater de tests pre-programados que dar como resultado el ajuste
a
an
automtico del controlador. Esta demanda surge de la dicultad y el engorro de ajustar
a
un controlador inicialmente. Lo que hicieron los fabricantes de PID fue aprovechar los
resultados obtenidos en el desarrollo de funciones pre-tune en controladores adaptativos
para dotar a sus PID de una funcin de autoajuste como la que demandaban los
o
usuarios.
Para conseguir el autoajuste se puede utilizar cualquier tcnica de control adape
tativo que permita estimar los parmetros adecuados, con el unico requisito de que
a
CAP
ITULO 7. CONTROLADORES PID CON AUTOAJUSTE Y AJUSTE POR TABLA
7.3.
107
Antes de tratar las distintas tcnicas existentes para ajustar automticamente PIDs
e
a
es importante hacer notar que los PIDs industriales (gura 7.1) no son exactamente
iguales a las formulaciones acadmicas que se ensean en cursos bsicos de control. Por
e
n
a
Figura 7.1: PID industrial moderno con funcin de autoajuste (ABB modelo ECA).
o
108
0,7 1
e
anti-windup de manera que la accin integral se mantenga acotada cuando el actuador
o
se sature. El parmetro Tt es una constante de tiempo para reinicializar la accin
a
o
integral cuando aparezca la saturacin y suele ser una fraccin del tiempo integral T i .
o
o
Por otra parte la accin derivativa se calcula usando
o
dy
Td dD
= D Kc Td
N dt
dt
donde el parmetro N es jo y suele tomarse igual a 10.
a
En cuanto a las tcnicas para sintonizar automticamente PIDs, la gran mayor
e
a
a
estn basadas en experimentos simples que el PID puede llevar a cabo por si solo. Estos
a
experimentos podrn ser en bucle abierto o cerrado, de ah que luego distingamos dos
a
tipos de tcnicas. Hay que mencionar que en los PID industriales el ajuste automtico
e
a
viene realizado por el propio PID, o por un mdulo separado que se coloca en lugar del
o
PID para realizar los experimentos, y que devuelve los valores de los parmetros del
a
PID. Este mdulo deber ser compatible con los distintos modelos de PID que se usen en
o
a
la planta, ya que para calcular los parmetros deben conocerse todas las peculiaridades
a
de los algoritmos usados por cada PID. Otros mtodos ms sosticados son los que
e
a
se basan en tcnicas de inteligencia articial principalmente sistemas expertos. Estos
e
programas monitorizan en paralelo el funcionamiento de la planta y cuando se producen
cambios de referencia o perturbaciones importantes los aprovechan para analizar la
dinmica de la planta, estimndose valores para parmetros como ganancias, factores de
a
a
a
amortiguamiento, etc . . . Estos parmetros son los que luego se usarn para sintonizar
a
a
el PID. Esta tcnica se utiliza por ejemplo en controladores de las marcas Foxboro o
e
Fenwal.
7.3.1.
Estas son tcnicas de ajuste en bucle abierto que se basan en aplicar un escaln en
e
o
la seal de entrada del lazo que se quiere sintonizar y ajustar un modelo simple del
n
tipo
k
esL
(7.1)
G(s) =
1 + sT
CAP
ITULO 7. CONTROLADORES PID CON AUTOAJUSTE Y AJUSTE POR TABLA
109
Conocidos los parmetros del modelo el PID se puede ajustar usando tcnicas del
a
e
tipo Ziegler-Nichols de bucle abierto. Otros mtodos estn basados en medida de areas
e
a
L+T =
A0
k
T =
eA1
k
k
A0
A1
L+T
7.3.2.
Los mtodos de ajuste basados en la respuesta transitoria son simples, pero muy
e
sensibles a las perturbaciones, ya que las pruebas se realizan en bucle abierto. Las
tcnicas basadas en experimentos en bucle cerrado no tienen este problema. De estas
e
tcnicas veremos la que est basada en las oscilaciones producidas al realimentar con
e
a
un rel. La estructura para realizar el ajuste es la que se muestra en la gura 7.3.
e
La idea clave es que la mayor de los procesos exhiben oscilaciones autosostenidas
a
1
(conocidas como ciclos lmite ) cuando son realimentados con un rel en la cadena
e
1
LA TECNICA DE AJUSTE POR TABLA O GAIN SCHEDULING
110
PID
r
y
PROCESO
REL
7.4.
CAP
ITULO 7. CONTROLADORES PID CON AUTOAJUSTE Y AJUSTE POR TABLA
a
fu
Y
MEDIO
AMBIENTE
ffU
yoo
REFERENCIA
oUe{A
uyyU{uu
py
111
Figura 7.4: Conguracin genrica de un controlador adaptativo con adaptacin en bucle abierto.
o
e
o
se usan en cada instante vienen determinados por una tabla precalculada para varios
puntos de funcionamiento o valores de la variable auxiliar. Este tipo de control es muy
popular, por ejemplo, en sistemas de control de vuelo, en los que los parmetros del
a
controlador se seleccionan de un conjunto de parmetros precalculados en funcin de
a
o
la altura de vuelo. Por supuesto, este tipo de control funciona bien si entre la variable
auxiliar y la dinmica del sistema existe una fuerte relacin, que permite determinar
a
o
el valor de los parmetros en funcin del valor observado de la variable auxiliar. Una
a
o
ventaja que tiene este esquema es que los parmetros del control se pueden cambiar
a
(adaptar) a la misma velocidad a la que cambia la dinmica del sistema pues estos
a
cambios se reejan sobre la variable auxiliar a la vez que se producen. Esta rapidez en
el cambio de los parmetros puede ser, sin embargo, contraproducente. Por otra parte la
a
construccin de la tabla puede ser muy complicada. De hecho no existe una metodolog
o
a
universal, sino que para cada aplicacin ha de verse como llevar a la prctica las ideas
o
a
del gain scheduling. Por ultimo encontrar la variable auxiliar apropiada no siempre es
posible.
Estos controladores, sin embargo, se pueden encontrar en diversos sistemas t
picos de control, principalmente debido a su sencillez y efectividad cuando estn bien
a
diseados. Algunas de las aplicaciones t
n
picas son:
Linealizacin de la caracter
o
stica de ciertos actuadores. Tal y como se vio en la
seccin 5.2 la caracter
o
stica no lineal de un actuador se puede aproximar por un
modelo linealizado a trozos, de manera que en funcin del punto de operacin del
o
o
actuador se escogern unos valores u otros para el controlador.
a
Control de pH. En estos sistemas se presentan no linealidades originadas tanto
por los elementos de control (vlvulas, bombas, sensores) como por las reacciones
a
LA TECNICA DE AJUSTE POR TABLA O GAIN SCHEDULING
112
qu
micas propias del proceso. La no linealidad principal proviene de la relacin
o
entre las concentraciones de los reactivos y el pH de la solucin resultante. Dicha
o
2
relacin se representa en la llamada curva de pH . En dicha curva se representa
o
el pH en funcin de las diferencias en las concentraciones de los reactivos. En la
o
gura 7.5 se muestra dicha curva para una solucin acuosa de acido clorh
o
drico
y sosa custica (es decir un par acido-base). Puede observarse que en este caso
a
pH
8
7
6
5
4
3
2
1
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
1
3
x 10
Figura 7.5: Curva de pH para una solucin de HCl 0.001 M y NaOH 0.001 M.
o
1 si V > 0,5
1 si V 0,5
En realidad el nombre tcnico es curva de titracin, aunque tales detalles no son relevantes en
e
o
esta asignatura
CAP
ITULO 7. CONTROLADORES PID CON AUTOAJUSTE Y AJUSTE POR TABLA
113
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0.5
0.6
0.7
0.8
0.9
1.1
1.2
1.3
1.4
1.5
el nmero de Mach.
u
Control de la direccin de un barco. En este caso la dinmica considerada para
o
a
el control de la direccin depende de la velocidad del barco y de ciertas variables
o
relacionadas con el tiempo atmosfrico, como la fuerza y direccin del viento (en
e
o
realidad dichas variables atmosfricas no afectan a la dinmica del barco en si,
e
a
sino a la de las perturbaciones que este sufre).
A modo de conclusin, podemos decir que la tcnica de gain scheduling se puede
o
e
usar con xito cuando las no linealidades que se pretendan compensar se conocen bien
e
a priori. Por otra parte como la adaptacin es en bucle abierto, es necesario conocer
o
bien tanto la dinmica del proceso como la de las perturbaciones.
a
7.5.
114
opcionales del controlador como en el caso de los sistemas Protonic (Hartman &
Braun) o UDC 6000 (Honeywell). Estos combinan reglas emp
ricas y tcnicas
e
de colocacin de polos usando experimentos en bucle abierto. Las estrategias de
o
oscilaciones mediante rel tambin son comunes como por ejemplo en el SattCone
e
3
trol ECA40 y en el DPR900 (Fisher-Rosemount). Otra posibilidad es que estas
herramientas para sintonizar controladores sean mdulos independientes, como
patibles con determinadas familias de controladores. En este tipo encontramos
ejemplo como SIEPID (Siemens), Supertuner (Toyo), Protuner (Techmation) o
PIDWIZ (BST Control). Una tercera posibilidad es que estas herramientas formen parte de sistemas de control distribuido como en el caso de Looptune (Honeywell) e Intelligent Tuner (Fisher-Rosemount).
Controladores adaptativos estandar. Estos controladores ajustan los parmetros
a
de manera ms o menos continua. Los hay que estn basados en la identicacin
a
a
o
de un modelo mediante m
nimos cuadrados recursivos como los CLC04 (Bailey
Controls) y SLPC-181/281 (Yokogawa) que adems utilizan una estrategia de
a
control por colocacin de polos. Algunos, como el SattControl ECA40, no identio
can un modelo paramtrico sino que usan reglas del tipo Ziegler-Nichols de bucle
e
cerrado, a partir de experimentos de realimentacin con rel. Por otra parte exiso
e
ten otros ms ambiciosos que estn basados en sistemas expertos y en tcnicas de
a
a
e
reconocimiento de patrones como EXACT (Foxboro), SLPC-171/271 (Yokogawa)
o UDC 6000 de Honeywell. Estos sistemas utilizan una base de reglas (100-200)
con las que se pretende reproducir el conocimiento de un experto (humano) en
sintonizar controladores. Finalmente, las capacidades de gain scheduling tambin estn presentes en ciertos controladores como el SattControl ECA 400 o el
e
a
DPR910 (Fisher-Rosemount).
Controladores adaptativos basados en autmatas programables. Los autmatas
o
o
programables ganan terreno d a d en cualquier aplicacin industrial de control.
a a
o
3M y General Electric tienen en su catlogo aplicaciones de control adaptativo
a
basados en sus autmatas.
o
Soluciones a medida. A veces en determinadas aplicaciones se encuentran controladores adaptativos a medida y que por tanto son exclusivos de cada sistema. Se
encuentran en barcos, aviones, automocin, y ciertas industrias.
o
CAP
ITULO 7. CONTROLADORES PID CON AUTOAJUSTE Y AJUSTE POR TABLA
7.5.1.
115
a
o
mtodo de Ziegler-Nichols. Una vez se calculan los parmetros el controlador conmuta
e
a
a modo automtico. El ajuste ofrece tres perles diferentes: control normal, lento o
a
rpido. La reaccin de la comunidad industrial a estos productos ha sido muy buena,
a
o
encontrndose particularmente util en industrias que no tienen personal especializado
a
7.5.2.
Foxboro EXACT
escala de tiempos del proceso. Si esta informacin se desconoce se puede usar el modo
o
de pre-tune incorporado que la obtiene mediante la aplicacin de un escaln. Es neceo
o
sario sin embargo que el proceso est en regimen permanente. La aceptacin comercial
e
o
de este producto ha sido excelente y se han vendido miles de unidades. A modo de
ancdota la planta de Atlantic Copper en Huelva utiliza este controlador en algunos
e
de sus procesos. El controlador adaptativo multivariable EXACT MV se distribuye actualmente en forma de software de control avanzado como parte del sistema I/A Series
de Foxboro.
7.5.3.
ABB Novatune
Esta herramienta de control STR (gura 7.7) est basada entre otras cosas en el
a
control de m
nima varianza y ofrece la capacidad de especicar la posicin de 1 de los
o
116
Figura 7.7: La herramienta Novatune se comercializa actualmente con el sistema Advant 410 de ABB.
Cap
tulo 8
Control Predictivo Basado en
Modelo (MPC)
8.1.
Perspectiva histrica
o
CONCEPTOS BASICOS DE CONTROL PREDICTIVO
118
formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del
Controlador de M
nima Varianza y se desarroll el Control Predictivo Generalizado
o
(Generalized Predictive Control gpc) que es uno de los mtodos ms populares en la
e
a
actualidad.
8.2.
e
a ciertas ideas comunes e integra diversas disciplinas como control optimo, control
CAP
ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
119
o
batch).
Es una metodolog completamente abierta basada en algunos principios bsicos
a
a
que permite futuras extensiones.
Pero, lgicamente, tambin presenta inconvenientes. Unos de ellos es la carga de
o
e
clculo necesaria para la resolucin de algunos algoritmos. Pero quizs el mayor ina
o
a
conveniente venga marcado por la necesidad de disponer de un modelo apropiado del
proceso. El algoritmo de diseo est basado en el conocimiento previo del modelo y es
n
a
independiente de ste, pero resulta evidente que las prestaciones obtenidas dependern
e
a
de las discrepancias existentes entre el proceso real y el modelo usado.
8.3.
120
u(t+k|t)
u(t)
^
y(t+k|t)
y(t)
N
t-1
t+1
...
t+k
...
t+N
1. En cada instante t y haciendo uso del modelo del proceso se predicen las futuras
salidas para un determinado horizonte N , llamado horizonte de prediccin. Estas
o
1
salidas predichas, y (t + k | t) para k = 1 . . . N dependen de los valores conocidos
CAP
ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
Entradas y salidas
pasadas
Salidas
predichas
Modelo
121
Trayectoria
de referencia
Controles
futuros
Optimizador
Errores futuros
Funcion de coste
Restricciones
decisivo en el controlador. El modelo elegido debe ser capaz de capturar la dinmica del
a
proceso para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo
de usar y de comprender.
El optimizador es otra parte fundamental de la estrategia pues proporciona las
acciones de control. Si la funcin de coste es cuadrtica, el m
o
a
nimo se puede obtener
como una funcin expl
o
cita de las entradas y salidas pasadas y de la trayectoria de
referencia. Sin embargo, cuando existen restricciones de desigualdad la solucin debe
o
ser calculada por mtodos numricos con ms carga de clculo.
e
e
a
a
8.4.
Elementos bsicos
a
Todos los controladores predictivos poseen elementos comunes y para cada uno de
estos elementos se pueden elegir diversas opciones, dando lugar a distintos algoritmos.
ELEMENTOS BASICOS
122
Modelo de prediccin
o
Funcin objetivo
o
Obtencin de la ley de control
o
8.4.1.
Modelo de prediccin
o
La piedra angular del mpc es el modelo; un diseo completo debe incluir los mecann
ismos necesarios para la obtencin del mejor modelo posible, el cual debe ser lo suo
cientemente rico para capturar al maximo la dinmica del proceso y debe ser capaz de
a
permitir el clculo de las predicciones a la vez que sea intuitivo y permita un anlisis
a
a
terico. El uso del modelo del proceso viene determinado por la necesidad del clcuo
a
lo de la salida predicha en instantes futuros y (t + k | t). Las diferentes estrategias
de mpc pueden usar distintos modelos para representar la relacin de las salidas con
o
las entradas medibles, algunas de las cuales sern variables manipuladas y otras se
a
pueden considerar como perturbaciones medibles, que pueden ser compensadas por accin feedforward. Adems se tendr en cuenta un modelo de las perturbaciones, para
o
a
a
intentar describir el comportamiento que no aparece reejado en el modelo del proceso, englobndose aqu el efecto de las entradas no medibles, el ruido y los errores de
a
modelado.
Para el estudio se puede separar el modelo en dos partes: el modelo del proceso
propiamente dicho y el modelo de las perturbaciones. Cualquier mtodo usar ambas
e
a
partes para la prediccin.
o
Modelo del Proceso
Casi todas las formas posibles de modelar un proceso aparecen en alguna formulacin de mpc siendo las ms usadas las siguientes:
o
a
hi u(t i)
y(t) =
i=1
CAP
ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
g2
y(t)
g1
y(t)
hN
h1
hi
h2
123
...
t+1 t+2
t+N
...
t+1 t+2
t+N
b)
a)
Figura 8.3: Respuesta impulsional y ante escaln
o
y(t) =
(8.1)
i=1
y (t + k | t) =
i=1
gi
y(t) = y0 +
i=1
(8.2)
ELEMENTOS BASICOS
124
donde las gi son los valores muestreados ante la entrada en escaln y u(t) =
o
u(t) u(t 1), segn se muestra en la gura 8.3b. El valor de y0 puede tomarse
u
0 sin prdida de generalidad, con lo cual el predictor ser:
e
a
N
gi
y (t + k | t) =
u(t + k i | t)
i=1
B(z 1 )
u(t + k | k)
A(z 1 )
Posee la ventaja de que sirve tambin para sistemas multivariables a la vez que
e
permite analizar la estructura interna del proceso (aunque a veces los estados
obtenidos al discretizar no tienen ningn signicado f
u
sico). Los clculos pueden
a
ser complicados, con la necesidad adicional de incluir un observador si los estados
no son accesibles.
CAP
ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
125
C(z 1 )e(t)
D(z 1 )
e(t)
1 z 1
8.4.1.1.
Una caracter
stica t
pica de la mayor de los controladores mpc es el empleo de los
a
conceptos de repuesta libre y forzada. La idea es expresar la secuencia de acciones de
control como la suma de dos seales:
n
u(t) = uf (t) + uc (t)
La seal uf (t) corresponde a las entradas pasadas (anteriores al instante t) y en el
n
futuro se mantiene constante e igual al ultimo valor de la variable manipulada. Es
decir,
uf (t j) = u(t j) para j = 1, 2,
uf (t + j) = u(t 1) para j = 0, 1, 2,
ELEMENTOS BASICOS
126
La seal uc (t) vale cero en el pasado y corresponde a las seales de control en los
n
n
instantes futuros:
uc (t j) = 0 para j = 1, 2,
uc (t + j) = u(t + j) u(t 1) para j = 0, 1, 2,
La prediccin de la secuencia se salida se separa en dos partes, como se ve en
o
la gura 8.4. Una de ellas (yf (t)), la respuesta libre, corresponde a la prediccin de
o
la salida cuando la variable manipulada se hace igual a uf (t), y la otra, la repuesta
forzada (yc (t)), corresponde a la prediccin de la salida cuando la seal de control es
o
n
uc (t). La respuesta libre corresponde a la evolucin del proceso debido a su estado
o
actual (incluido por tanto el efecto de acciones pasadas) mientras que la respuesta
forzada es la debida a las acciones de control futuras.
y
Process
uc
y
f
yc
8.4.2.
Funcin objetivo
o
Los diversos algoritmos de mpc proponen distintas funciones de coste para la obtencin de la ley de control. En general se persigue que la salida futura en el horizonte
o
considerado siga a una determinada seal de referencia al mismo tiempo que se puede
n
penalizar el esfuerzo de control requerido para hacerlo. La expresin general de tal
o
funcin objetivo ser:
o
a
N2
Nu
J(N1 , N2 , N u) =
j=N1
(8.3)
j=1
CAP
ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
127
se tiene en cuenta, mientras que en otros tambin aparecen directamente los valores de
e
la seal de control (no sus incrementos). En la funcin de coste se pueden considerar:
n
o
ELEMENTOS BASICOS
128
k = 1 . . . N (8.4)
r(t+k)
w1(t+k)
w2 (t+k)
y(t)
t
Figura 8.5: Trayectoria de referencia
dad de cambio (slew rate), como es el caso de las vlvulas, limitadas por las posia
ciones de totalmente abierta o cerrada y por la velocidad de respuesta. Razones
constructivas, de seguridad o medioambientales o bien los propios alcances de los
sensores pueden causar l
mites en las variables de proceso, tales como niveles en
depsitos, caudales en tuber o temperaturas y presiones mximas. Adems,
o
as
a
a
normalmente las condiciones de operacin vienen denidas por la interseccin
o
o
de ciertas restricciones por motivos fundamentalmente econmicos, con lo que el
o
sistema de control operar cerca de los l
a
mites. Todo lo expuesto anteriormente
hace necesaria la introduccin de restricciones en la funcin a minimizar.
o
o
Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo
cual han tenido gran xito en la industria. Normalmente se considerarn l
e
a mites
en la amplitud y el slew rate de la seal de control y l
n
mites en las salidas:
umin
u(t)
umax
CAP
ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
y(t)
ymax
129
t
t
8.4.3.
j > Nu
lo cual es equivalente a dar pesos innitos a las cambios en el control a partir de cierto
instante. El caso l
mite ser considerar N u igual a 1 con lo que todas las acciones
a
futuras ser iguales a u(t)2 .
an
2
REVISION DE LOS PRINCIPALES ALGORITMOS
130
8.5.
8.5.0.1.
Este mtodo usa la respuesta ante escaln (8.2) para modelar el proceso, considerane
o
do slo los N primeros trminos, asumiendo por tanto que el proceso es estable. En
o
e
cuanto a las perturbaciones, se considera que su valor permanence constante e igual al
existente en el instante actual durante todo el horizonte, es decir, igual al valor medido
de la salida (ym ) menos el estimado por el modelo y (t | t)).
gi
y (t + k | t) =
i=1
gi
u(t + k i) +
u(t + k i) + n(t + k | t)
i=k+1
donde el primer trmino contiene las acciones de control futuras (que sern calculadas),
e
a
el segundo los valores pasados de las acciones de control (conocidas) y el ultimo rep
resenta las perturbaciones. La funcin de coste puede considerar slo errores futuros o
o
o
incluir tambin el esfuerzo de control, en cuyo caso toma la forma genrica (8.3).
e
e
Una de las caracter
sticas de este mtodo que lo ha hecho muy popular en la ine
dustria es la inclusin de restricciones, que se traduce en inecuaciones de la forma
o
genrica:
e
N
j
j
Cyi y (t + k | t) + Cui u(t + k i) + cj 0
j = 1 . . . Nc
i=1
En este caso la optimizacin debe ser numrica y se lleva a cabo en cada periodo de
o
e
muestreo, envindose la seal u(t) y recalculando todo en el nuevo periodo de muestreo,
a
n
como en todos los mtodos mpc. Los principales inconvenientes de este mtodo son el
e
e
tamao del modelo empleado y la imposibilidad de tratar procesos inestables.
n
CAP
ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
8.5.0.2.
131
Este mtodo se conoce tambin como Model Predictive Heuristic Control y el proe
e
ducto comercial se llama idcom (Identication-Command). Es muy similar al dmc con
la diferencia principal de usar un modelo de respuesta impulsional (8.1). Introduce el
concepto de trayectoria de referencia como un sistema de primer orden que evoluciona
desde la salida actual al setpoint segn una determinada constante de tiempo. La varu
ianza del error entre esta trayectoria y la salida es lo que marca la minimizacin de la
o
funcin objetivo. Las perturbaciones se pueden tratar como en el mtodo anterior o se
o
e
pueden estimar segn la siguiente expresin:
u
o
n(t + k | t) = (t + k 1 | t) + (1 )(ym (t) y (t | t))
a
de respuesta, el ancho de banda y la robustez del bucle cerrado. El mtodo tambin
e
e
considera restricciones en los actuadores, en las variables internas o en salidas secundarias.
8.5.0.3.
Este controlador fue desarrollado por Richalet para procesos rpidos. Emplea un
a
modelo en el espacio de estados, por lo que permite el manejo de procesos inestables,
y tambin la extensin al caso no lineal. Este esquema de control tiene dos carace
o
ter
sticas que lo distinguen del resto de controladores de la familia: el uso de puntos de
coincidencia y de funciones base.
El concepto de puntos de coincidencia (ver gura 8.6) se emplea para simplicar los
clculos considerando slo un subconjunto de puntos en el horizonte de prediccin hj ,
a
o
o
j = 1, . . . , nH . La salida deseada y la predicha deben coincidir en dichos puntos, no en
todo el horizonte de prediccin.
o
La otra idea innovadora de este mtodo es la parametrizacin de la seal de cone
o
n
trol como una combinacin lineal de ciertas funciones base, que son elegidas segn la
o
u
naturaleza del proceso y la referencia:
nB
u(t + k) =
i (t)Bi (k)
i=1
Normalmente estas funciones son de tipo polinmico: escalones (B1 (k) = 1), rampas
o
2
(B2 (k) = k) o parbolas (B3 (k) = k ), ya que la mayor de referencias se pueden esa
a
pecicar como combinacin de estas funciones. Con esta estrategia, un perl de entrada
o
REVISION DE LOS PRINCIPALES ALGORITMOS
132
Puntos de coincidencia
J=
j=1
8.5.0.4.
CAP
ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
133
k=d
N
k=d
(k)h2
k
8.5.0.5.
1<k N d
u2 (t + k)
J=
k=0
u(t + N d)
0 (w(t + N ) y (t + N | t))
N d
2
i
k=0
REVISION DE LOS PRINCIPALES ALGORITMOS
134
8.5.0.6.
Este mtodo propuesto por Clarke et al. emplea un modelo carima (Controlled
e
Auto-Regressive Integrated Moving Average) para la prediccin de la salida:
o
e(t)
donde la perturbacin viene dada por un ruido blanco coloreado por el polinomio
o
1
C(z ). Como en la prctica es dif encontrar el verdadero valor de este polinomio,
a
cil
se puede emplear como parmetro de diseo para rechazo de perturbaciones o mejora de
a
n
la robustez. La prediccin optima se lleva a cabo resolviendo una ecuacin diofntica,
o
o
a
lo cual puede hacerse ecazmente de forma recursiva.
Este algoritmo, al igual que otros que usan el modelo de funcin de transferencia,
o
se puede implementar fcilmente en forma adaptativa usando un algoritmo de identia
cacin en l
o
nea como los m
nimos cuadrados recursivos.
gpc usa una funcin de coste cuadrtica de la forma
o
a
N2
Nu
J(N1 , N2 , Nu ) =
j=N1
j=1
Cap
tulo 9
Controladores predictivos
9.1.
El mtodo Dmc se desarroll a nales de los setenta por Cutler y Ramaker de Shell
e
o
Oil Co. y ha sido aceptado ampliamente en el mundo industrial, principalmente por
las industrias petroqu
micas. Actualmente dmc es algo ms que un algoritmo y parte
a
de su xito se debe al hecho de que el producto comercial resuelve otros temas como
e
identicacin u optimizacin global de la planta. En esta seccin slo se analiza el
o
o
o o
algoritmo standard sin abordar detalles tcnicos propios del producto de mercado que
e
no son de dominio pblico.
u
Pero a pesar de este xito en la prctica, este mtodo adolece quizs de la ausencia
e
a
e
a
de un anlisis terico ma completo que estudie la inuencia de los parmetros de
a
o
s
a
diseo (horizontes, secuencias de ponderacin) sobre la estabilidad del bucle cerrado
n
o
as como de resultados de robustez.
9.1.1.
Prediccin
o
136
gi
y(t) =
u(t i)
i=1
gi
y (t + k | t) =
u(t + k i) + n(t + k | t) =
i=1
k
gi
u(t + k i) +
i=1
gi
u(t + k i) + n(t + k | t)
i=k+1
y (t + k | t) =
gi
u(t + k i) +
i=1
gi
i=1
u(t + k i) + ym (t)
gi
i=k+1
u(t i) =
gi
u(t + k i) + f (t + k)
i=1
(gk+i gi )
f (t + k) = ym (t) +
u(t i)
(9.1)
i=1
f (t + k) = ym (t) +
(gk+i gi )
u(t i)
i=1
CAP
ITULO 9. CONTROLADORES PREDICTIVOS
137
u(t) + f (t + 1)
y (t + 2 | t) = g2
.
.
.
u(t) + g1
u(t + 1) + f (t + 2)
y (t + p | t) =
gi
u(t + p i) + f (t + p)
i=pm+1
g1
0
g
g1
2
.
.
.
.
.
.
G =
gm gm1
.
.
.
.
.
.
gp gp1
...
0
0
.
.
.
...
g1
.
.
.
gpm+1
(9.2)
o
que contiene las predicciones de la salida, u representa el vector de incrementos de
control y f es el vector de respuestas libres. Esta es la expresin que relaciona las
o
respuestas futuras con los incrementos en las seales de control, por lo que usar para
n
a
calcular las acciones necesarias para conseguir el comportamiento deseado del sistema.
9.1.2.
Perturbaciones medibles
138
o
similar a G que contiene los coecientes de la respuesta del sistema a un escaln en la
o
perturbacin, d es el vector de incrementos en la perturbacin y fd es la parte de la
o
o
respuesta que no depende de la perturbacin.
o
En el caso ms general de perturbaciones medibles y no medibles, la respuesta libre
a
completa del sistema (la fraccin de la salida que no depende de la variable manipulada)
o
se puede considerar como la suma de cuatro efectos: la respuesta a la entrada u(t), a la
perturbacin medible d(t), a la perturbacin no medible y al estado actual del proceso:
o
o
f = fu + D d + f d + fn
Por tanto la prediccin se puede expresar en la forma general
o
y = Gu + f
9.1.3.
Algoritmo de control
J=
j=1
[ u(t + j 1)]2
J=
j=1
j=1
CAP
ITULO 9. CONTROLADORES PREDICTIVOS
+
K
139
Proceso
f
Calculo
Resp. libre
u = (GT G + I)1 GT (w f )
(9.3)
Recurdese que, como en todas las estrategias predictivas, slo se env al proceso
e
o
a
el primer elemento del vector u ( u(t)). No es aconsejable implementar la secuencia
completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma
exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que
provocan que la salida real diera de las predicciones que se emplean para calcular la
secuencia futura de acciones de control. Adems, el setpoint puede cambiar durante los
a
prximos m intervalos.
o
Resulta interesante analizar en qu consiste realmente la ley de control. Analizane
do la expresin 9.3 se observa que el primer elemento del vector u, que es la seal
o
n
que efectivamente se env a la planta, es el producto de la primera la de la matriz
a
T
1 T
(G G+I) G (llammosle K) por la diferencia entre la trayectoria de referencia y la
e
respuesta libre, que es el error futuro si no hubiera incrementos en la seal de control.
n
Se puede decir por tanto que el incremento de la seal de control es proporcional (por
n
medio de K) a los errores futuros y por tanto habr cambios en la seal de control
a
n
siempre que el controlador detecte que va a haber una discrepancia en el futuro entre el
objetivo deseado y el comportamiento esperado del sistema. Esta idea queda reejada
en la gura 9.1.
140
Zona segura 1
P. operacion
optimo
Punto operacion 1
Restriccion
zona
segura 2
Punto operacion 2
Restriccion
9.1.3.1.
u
o
o
restricciones, como se muestra en la gura 9.2. Por razones de seguridad, es necesario
mantener una zona segura alrededor del punto de operacin, ya que el efecto de las
o
perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona
se puede reducir (y por tanto aumentar los benecios econmicos) si el controlador es
o
capaz de manejar restricciones (punto de operacin 1).
o
Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades
de forma genrica
e
N
j
j
Cyi y (t + k | t) + Cui u(t + k i) + cj 0
j = 1 . . . Nc
i=1
que deben tenerse en cuenta para la minimizacin. Como se ha visto, las salidas se
o
pueden expresar en funcin del vector de incrementos de control a travs de la matriz
o
e
dinmica, por que las restricciones tanto en la entrada como en la salida se pueden
a
recoger en una desigualdad matricial de la forma Ru c, como se ver con ms
a
a
detalle en el tema dedicado a restricciones. Ahora la minimizacin es un problema de
o
Programacin Cuadrtica qp, cuya solucin es numrica.
o
a
o
e
Todo lo relacionado con las restricciones ser abordado con mayor grado de detalle
a
en el tema dedicado a ello.
CAP
ITULO 9. CONTROLADORES PREDICTIVOS
9.1.3.2.
141
u1 (t + m1 1), . . . ,
unu (t), . . . ,
G = .
.
.
...
.
.
.
.
.
.
Gny1 Gny2 Gnynu
Cada submatriz Gij contiene los coecientes de la respuesta ante escaln i-sima
o
e
correspondiente a la entrada j-sima. El proceso de minimizacin es anlogo slo que la
e
o
a
o
ponderacin tanto de los errores como de los esfuerzos de control se realiza con matrices
o
de peso.
9.2.
El Control Predictivo Generalizado gpc fue propuesto por Clarke et al. en 1987
y se ha convertido en uno de los mtodos ms populares en el ambito del Control
e
a
142
o
o
o
las acciones de control. Las diversas posibilidades disponibles para el gpc conducen a
una gran variedad de objetivos de control comparado con otras realizaciones, algunas
de las cuales pueden ser consideradas como subconjuntos o casos l
mites del gpc.
9.2.1.
La mayor de los procesos de una sola entrada y una sola salida (single-input singlea
output, siso), al ser considerados en torno a un determinado punto de trabajo y tras
ser linealizados, pueden ser descritos de la siguiente forma:
A(z 1 )y(t) = z d B(z 1 )u(t 1) + C(z 1 )e(t)
donde u(t) y y(t) son respectivamente la seal de control y la salida del proceso y e(t)
n
es un ruido blanco de media cero. A, B y C son los siguientes polinomios en el operador
de desplazamiento hacia atrs z 1 :
a
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + ... + ana z na
B(z 1 ) = b0 + b1 z 1 + b2 z 2 + ... + bnb z nb
C(z 1 ) = 1 + c1 z 1 + a2 z 2 + ... + cnc z nc
donde d es el tiempo muerto del sistema.
CAP
ITULO 9. CONTROLADORES PREDICTIVOS
143
e(t)
con
= 1 z 1
(9.4)
Nu
2
J(N1 , N2 , N u) =
(9.5)
j=1
j=N1
o
con datos conocidos hasta el instante t, N1 y N2 son los horizontes m
nimo y mximo
a
de coste, N u es el horizonte de control y (j) y (j) son las secuencias de ponderacin
o
mientras que w(t + j) es la futura trayectoria de referencia, que se puede calcular segn
u
se muestra en la gura 8.5. En muchas situaciones se considera (j) igual a 1 y (j)
constante.
El objetivo es pues el clculo de la futura secuencia de control u(t), u(t + 1),... de
a
tal manera que la salida futura del proceso y(t + j) permanezca prxima a w(t + j).
o
Esto se logra minimizando J(N1 , N2 , N u).
9.2.1.1.
Prediccin optima
o
A + z j Fj (z 1 )
1 = Ej (z 1 )A + z j Fj (z 1 )
(9.6)
vamente. Se pueden obtener dividiendo 1 entre A(z 1 ) hasta que el resto pueda ser facj
1
torizado como z Fj (z ). El cociente de la divisin es entonces el polinomio Ej (z 1 ).
o
144
u(t + j d 1) + Ej (z 1 )e(t + j)
donde Gj (z 1 ) = Ej (z 1 )B(z 1 )
Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursivamente, de forma que los nuevos valores en el paso j + 1 (Ej+1 y Fj+1 ) sean funcin de
o
los del paso j. A continuacin se muestra una demostracin simple de la recursividad
o
o
de la ecuacin diofntica. Existen otras formulaciones del gpc que no estn basadas
o
a
a
en la recursividad de esta ecuacin.
o
Supngase que se utiliza el mismo procedimiento para obtener Ej+1 y Fj+1 , es decir,
o
dividir 1 entre A(z 1 ) hasta que el resto se pueda factorizar como z (j+1) Fj+1 (z 1 ) con
Fj+1 (z 1 ) = fj+1,0 + fj+1,1 z 1 + + fj+1,na z na
Est claro que solamente es necesario dar un paso ms en la divisin para obtener
a
a
o
los polinomios Ej+1 y Fj+1 . Al ser Ej+1 el nuevo cociente de la divisin, ser igual al
o
a
CAP
ITULO 9. CONTROLADORES PREDICTIVOS
145
cociente que hab hasta el momento (Ej ) ms un nuevo trmino, que ser el fj,0 pues
a
a
e
a
es mnico. Por tanto:
el divisor (A)
o
Ej+1 (z 1 ) = Ej (z 1 ) + ej+1,j z j
Teniendo en cuenta que el nuevo resto ser el resto anterior menos el producto del
a
cociente por el divisor, los coecientes del polinomio Fj+1 se pueden expresar como:
fj+1,i = fj,i+1 fj,0 ai+1 i = 0 na
para i = 0 nb
y (t + d + 1 | t) = Gd+1
y (t + d + 2 | t) = Gd+2
.
.
.
y (t + d + N | t) = Gd+N
146
u(t 1)
(9.9)
Donde
y =
G =
y (t + d + 1 | t)
y (t + d + 2 | t)
.
.
.
y (t + d + N | t)
g0
g1
.
.
.
0
g0
.
.
.
F(z ) =
0
0
.
.
.
gN 1 gN 2 ... g0
G (z 1 ) =
...
...
.
.
.
u=
u(t)
u(t + 1)
.
.
.
u(t + N 1)
z(Gd+1 (z 1 ) g0 )
2
z (Gd+2 (z 1 ) g0 g1 z 1 )
.
.
.
z N (Gd+N (z 1 ) g0 g1 z 1 gN 1 z (N 1) )
Fd+1 (z 1 )
Fd+2 (z 1 )
.
.
Fd+N (z 1 )
Al depender los ultimos trminos de la ecuacin (9.9) slo del pasado, pueden
e
o
o
agruparse en f, dando lugar a:
y = Gu + f
(9.10)
Obsrvese que es la misma expresin que se obtuvo para el dmc, aunque en este
e
o
caso la respuesta libre es distinta.
9.2.1.2.
(9.11)
donde:
w=
(9.12)
CAP
ITULO 9. CONTROLADORES PREDICTIVOS
147
(9.13)
donde:
H = 2(GT G + I)
b = 2(f w)T G
f0 = (f w)T (f w)
El m
nimo de J, siempre que no existan restricciones en la seal de control, puede
n
ser calculado igualando a cero el gradiente de J, lo cual conduce a:
u = H1 bT
(9.14)
Debido al uso de la estrategia deslizante, slo se aplica realmente el primer elemento del
o
vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo.
La solucin propuesta involucra la inversin (o al menos la triangularizacin) de una
o
o
o
matriz de dimensin N N , lo cual conlleva una gran carga de clculo. El concepto ya
o
a
usado en otros mtodos de horizonte de control se emplea con la nalidad de reducir
e
la cantidad de clculo, asumiendo que las seales de control permanecern en un valor
a
n
a
constante a partir del intervalo N u < N . Por tanto la dimensin de la matriz que hay
o
que invertir queda reducida a N u N u, quedando la carga de clculo reducida (en el
a
caso l
mite de N u = 1, se reduce al caso escalar) aunque restringiendo la optimalidad.
9.2.2.
Ejemplo de clculo
a
e(t)
148
F1 (z 1 ) = 1,8 0,8z 1
E2 = 1 + 1,8z 1
y (t + 1 | t)
0,4
y (t + 2 | t) = 1,32
y (t + 3 | t)
2,056
0,6
+ 1,08
1,464
0
0
0,4 0
1,32 0,4
u(t)
u(t + 1) +
u(t + 2)
0,133
0,286 0,147
(GT G + I)1 GT = 0,154 0,165 0,286
0,029 0,154 0,1334
CAP
ITULO 9. CONTROLADORES PREDICTIVOS
149
Como slo se necesita el valor de u(t) para los clculos, slo se emplea realmente la
o
a
o
primera la de la matriz, con lo que resulta la siguiente expresin para la ley de control:
o
u(t) = 0,6042
9.2.3.
Caso multivariable
Al igual que en el dmc todo lo visto para el caso de sistemas con una sola entrada
y una sola salida se puede extender al caso multivariable, aunque los clculos son ms
a
a
complejos.
En este caso el modelo carima para un sistema de m entradas y n salidas se puede
expresar como:
1
A(z 1 )y(t) = B(z 1 )u(t 1) + C(z 1 )e(t)
(9.15)
donde A(z 1 ) y C(z 1 ) son matrices polinomiales mnicas de dimensin nn y B(z 1 )
o
o
es una matriz polinomial de dimensin n m, denidos como:
o
A(z 1 ) = Inn + A1 z 1 + A2 z 2 + + Ana z na
B(z 1 ) = B0 + B1 z 1 + B2 z 2 + + Bnb z nb
C(z 1 ) = Inn + C1 z 1 + C2 z 2 + + Cnc z nc
150
J(N1 , N2 , N3 ) =
N3
y (t + j | t) w(t + j)
j=N1
2
R
u(t + j 1)
2
Q
j=1
Cap
tulo 10
Otros aspectos del Control
Predictivo
10.1.
En la prctica todos los procesos estn sujetos a restricciones. Los actuadores tienen
a
a
un campo limitado de accin impuesto por l
o
mites f
sicos (por ejemplo una vlvula no
a
puede abrir ms de un 100 % o un calentador no puede aportar ms de su potencia
a
a
mxima. Tambin existen l
a
e
mites de seguridad (por ejemplo presiones o temperaturas
mximas), requerimientos tecnolgicos (por ejemplo mantener temperaturas en un rana
o
go dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa
medioambiental.
10.1.1.
o
a
151
152
P
Pmax
P1
P2
Q1 Q2
o
ningn caso garantiza el cumplimiento de las restricciones en la salida. La violacin de
u
o
los l
mites de las variables controladas puede ser ms costoso y peligroso, produciendo
a
daos en equipos y prdidas en la produccin.
n
e
o
La gura 10.2 muestra con claridad el fenmeno de prdida de la solucin optima
o
e
o
cuando las variables manipuladas se mantienen en sus l
mites por el programa de
control o por el propio actuador. Este hecho puede llevar a valores mayores de la
funcin objetivo y a un comportamiento no deseado (incluso inestabiliad). En 10.2a se
o
muestra un caso con horizonte de control igual a 2, donde se observa que si se satura
la seal de control u(t) a umax el valor de la funcin de coste no es el mejor que se
n
o
podr conseguir (que ser el correspondiente a uc ). Incluso puede que no se viole la
a
a
restriccin en el instante actual pero s en el futuro (gura 10.2b) con lo que la seal
o
n
enviada al sistema (sin saturar) no es la mejor para el problema de dimensin 2 que se
o
est optimizando.
a
CAP
ITULO 10. OTROS ASPECTOS DEL CONTROL PREDICTIVO
u(t+1)
u(t+1)
u max
153
u max
uc
u
u max
uc
u
u max
u(t)
a)
u(t)
b)
10.1.2.
a
de forma sistemtica en la fase de diseo del controlador, siendo esta caracter
a
n
stica una
de las razones de su gran xito en la industria. Parece lgico que al disponer de un
e
o
modelo dinmico del proceso se pueda conocer la evolucin futura de su salida y por
a
o
tanto se pueda saber si sta va a violar o no las restricciones y actuar en consecuencia.
e
Para formular el algoritmo mpc con restricciones hay que expresar stas en funcin
e
o
de la variable sobre la que se puede actuar, es decir, en funcin de u. Las restricciones
o
en la entrada estn ya expresadas en funcin de u y para las restricciones en la salida
a
o
se hace uso de las ecuaciones de prediccin que expresan el valor futuro de las salidas
o
en funcin de las seales de control futuras y valores conocidos en el instante t.
o
n
Cualquier controlador predictivo calcula la prediccin como:
o
y = Gu + f
por lo que tanto entradas como salidas se pueden expresar en funcin del vector de
o
incrementos de la seal de control.
n
Las restricciones que aparecen sern bsicamente amplitud y velocidad de cambio
a a
en la seal de control y amplitud en la salida y se pueden expresar como:
n
154
U
u(t)
U t
u u(t) u(t 1) u t
y
y(t)
y t
R=
IN N
IN N
T
T
G
G
c=
lu
l u
l U lu(t 1)
l U + lu(t 1)
l yf
l y + f
CAP
ITULO 10. OTROS ASPECTOS DEL CONTROL PREDICTIVO
155
Restricciones blandas, que son aqullas que pueden ser violadas en un momento
e
dado por no ser cruciales, pero la violacin se penaliza en la funcin objetivo
o
o
como un trmino ms. Es una forma de relajar la restriccin.
e
a
o
10.1.3.
156
En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las
incertidumbres en el modelo y los temas asociados con la factiblidad.
10.1.4.
Gestin de restricciones
o
CAP
ITULO 10. OTROS ASPECTOS DEL CONTROL PREDICTIVO
157
Lmites fsicos
Lmites de operacin
Restricciones reales
10.1.4.1.
158
2. Eliminacin de restricciones.
o
3. Relajacin de restricciones.
o
4. Otras tcnicas.
e
CAP
ITULO 10. OTROS ASPECTOS DEL CONTROL PREDICTIVO
159
Eliminacin jerrquica En este caso slo se eliminan las restricciones que provocan
o
a
o
problemas de incompatibilidad. En este mtodo se asigna en la etapa de diseo una
e
n
prioridad a cada restriccin, que da un grado de importancia relativa de dicha restrico
cin frente a las otras. Esta prioridad se usar para clasicar las restricciones de una
o
a
forma jerrquica (se asigna un nmero que indica su posicin en la jerarqu De este
a
u
o
a).
modo, cada vez que haya problemas de factibilidad o existencia de solucin el gestor
o
de restricciones va eliminando por orden las restricciones menos prioritarias hasta que
se restablece la factibilidad de la solucin, que se chequea cada periodo de muestreo
o
para reinsertar restricciones que hubieran sido temporalmente eliminadas.
En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes
tipos de reglas para establecer el nmero de restricciones que se eliminan, si conviene
u
eliminar ms restricciones a costa de no eliminar una con prioridad superior, etc.
a
3. Relajacin de restricciones
o
Otro mtodo para tener en cuenta el problema de existencia de solucin es la ree
o
lajacin de las restricciones. Se puede hacer una relajacin de los l
o
o
mites de forma
temporal o convertir restricciones duras (Ru c), cambindolas en restricciones blana
das (Ru c + , con 0) para asegurar la existencia de solucin, aadiendo un
o
n
trmino T T a la funcin de coste de forma que se penalice la violacin de la ree
o
o
striccin y obtener un mejor comportamiento del sistema controlado. A largo plazo, el
o
trmino de penalizacin en la funcin objetivo llevar las variables auxiliares a cero.
e
o
o
a
4. Otras tcnicas
e
Existen tcnicas que se basan en la manipulacin del horizonte m
e
o
nimo de las restricciones. Algunos controladores industriales como el qdmc usan el concepto de constraint
window. La constraint window comienza en algn punto en el futuro y contina hasta
u
u
el estado estacionario. Si existe dinmica del tipo de fase no m
a
nima, se pueden mejorar
las prestaciones desplazando la ventana hacia el futuro, lo que equivale a ignorar las
restricciones duras en la salida durante la fase inicial de la respuesta.
160