Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Control Predictivo PDF
Control Predictivo PDF
Universidad de Sevilla
Indice
general
Indice
Fundamentos
::::::::::::::::::::::::::::::
::::::::::::::::::::::::::::::::
:::::::::::::::::::
::::::::::::::::::::::::
1.2
Perspectiva historica
1.3
Situacion actual
1.4
1.5
Controladores predictivos
2.1
:::::::::::::::::
1.1
Elementos basicos
11
:::::::::::::::::::::::::::::::
11
:::::::::::::::::::::::::
11
::::::::::::::::::::::::::::
15
::::::::::::::::::::
18
::::::::::::::::::::
18
::::::::::::::::::::::::::::
23
2.1.1
Modelo de prediccion
2.1.2
Funcion objetivo
2.1.3
2.2
2.3
Estado de la tecnologa
Algoritmos
3.1
25
:::::::::::::::::::::::::::
25
:::::::::::::::::::::::::::::::
25
Prediccion
Indice
general
ii
3.2
:::::::::::::::::::::::
27
:::::::::::::::::::::::::
28
:::::::::::::::::::::::
31
:::::::::
32
3.1.2
Perturbaciones medibles
3.1.3
Algoritmo de control
3.2.2
Ejemplo de calculo
:::::::::::::::::::::::::::
36
3.2.3
Caso multivariable
:::::::::::::::::::::::::::
38
41
::::::::::::::::::
41
:::::::::::::::::::::
42
:::::::::::::::::::::::::::
44
::::::::::::::::::::::::::::
45
::::::::::::
46
4.1
4.2
4.3
4.4
Gestion de restricciones
4.4.1
Tecnicas de busqueda
de soluciones factibles
5.2
:::::::::::::::::::::
51
:::::::::::::::::::::::::
53
::::::::::::::::::::::::::
54
::::::::::::::::
56
:::::::::::::::::::::::::
56
::::::::::::::::::::
57
::::::::::::::::::::::::::::::::
61
::::::::::::::::::
64
::::::::::
66
::::::::::::::::::::::::::
68
51
Jerarqua de objetivos
5.2.2
Fundamentos teoricos
5.2.3
5.2.4
Modelos
5.2.5
5.2.6
5.2.7
Necesidades futuras
Bibliografa
69
Tema 1
Fundamentos
1.1 Tendencias actuales en control de procesos
1983
Retardo
Perturbaciones
Interaccion
Respuesta
Estabilidad
(%)
24
21
17
16
11
1989
Retardo
Interaccion
Perturbaciones
Cambios
No lineal
(%)
23
16
15
12
10
1995
Interaccion
Perturbaciones
Retardo
Cambios
No lineal
(%)
24
22
21
14
7
los multiples
criterios de funcionamiento relevantes en la industria de procesos. Quizas
sea e sta la principal razon del e xito de estas tecnicas en numerosas aplicaciones de la
industria de procesos, unida a que es la forma mas general de formular el problema de
control en el dominio del tiempo, de manera que puede resultar facil de aceptar por el
personal de la industria.
Los resultados de un estudio realizado por Takatsu et al. para la Society of Instrumentation and Control Engineering [19] son indicativos de las necesidades futuras de
la industria en el a mbito del control. En este informe se analizan los principales problemas de control que se encuentran en la industria de procesos, el estado de aplicacion
de las tecnologas avanzadas, el grado de satisfaccion de los usuarios con cada una de
ellas y las expectativas que cada una genera.
Fundamentos
Tecnica
1989 1995
Compensacion de retardo 29.6 52.4
Borroso
9.9
38
Control Predictivo
25.4 37.2
Gain-scheduling
25.7 32.5
PID avanzado
24.8 29.4
Autoajuste
32.2 29.1
Desacoplo
17.5 28.6
Basado en reglas
6.3 17.9
Filtro de Kalman
9.1 15.5
Neuronal
0 11.8
LQ
8.2
11
Observador
8.2
9.8
Control adaptativo
10.3
7
H1
0
9.3
Tabla 1.4: Estado de las distintas tecnicas
Tecnica
1989 1995
Control Predictivo
76
94
PID avanzado
77
89
Compensacion de retardo
72
89
Gain-scheduling
78
87
Borroso
67
83
LQ
79
70
Neuronal
69
Desacoplo
64
66
Filtro de Kalman
70
66
Autoajuste
60
65
Observador
67
62
Basado en reglas
43
61
Control adaptativo
50
56
H1
50
Tabla 1.5: Grado de satisfaccion de las distintas tecnicas
Fundamentos
MPC
Retardo
Expectativas
Borroso
PID
Adaptativo
Neuronal
Hoo
Desacoplo
LQ
F. Kalman
Auto
ajuste
Deslizante
Posibilidades tcnicas
Situacion actual
y algortmica e intentaban aprovechar el creciente potencial de los computadores digitales por aquella e poca.
Rapidamente el MPC adquirio gran popularidad en las industrias de procesos
qumicos principalmente debido a la simplicidad del algoritmo y al uso del modelo
de respuesta impulsional o en escalon, que aunque posea muchos mas parametros
que las formulaciones en el espacio de estados o funcion de transferencia suele ser
preferido por ser intuitivo y necesitar menos informacion a priori para identificar. La
mayora de las aplicaciones fueron llevadas a cabo sobre sistemas multivariables incluyendo restricciones. Los algoritmos utilizados fueron principalmente el IDCOM
(Identification-Command) y el DMC (Control con Matriz Dinamica, Dynamic Matrix
Control).
Independientemente fue surgiendo otra lnea de trabajo en torno a las ideas del control adaptativo, desarrollando estrategias esencialmente para procesos monovariables
formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del
Controlador de Mnima Varianza y se desarrollo el Control Predictivo Generalizado
(Generalized Predictive Control GPC) que es uno de los metodos mas populares en la
actualidad.
actual
1.3 Situacion
La situacion actual de aplicaciones de MPC en la industria esta bien reflejada en la recopilacion de Qin y Badgwell [16], que recoge unas 2200 aplicaciones, principalmente
en el sector petroqumico (desde entonces el numero de aplicaciones puede estimarse
en torno a las 3000). La mayora de las aplicaciones son en procesos multivariables,
registrandose casos como un controlador con 40 entradas y 80 salidas. Sorprendentemente, MPC ha tenido menor impacto en otro tipo de industrias, aunque estudios de
1993 sugieren que unas 20.000 aplicaciones podran beneficiarse de esta tecnica.
El e xito actual del MPC en la industria se debe a tres razones principales:
Fundamentos
optimo
de operacion. La inclusion de restricciones es quizas la caracterstica que
mas distingue al MPC respecto a otras metodologas.
Otra de las razones que han contribuido a que el MPC se haya convertido en un e xito
comercial es el hecho de que existen unos 15 suministradores que instalan el producto
llave en mano, con periodos de amortizacion de entre 3 y 12 meses, permitiendo
que medianas empresas puedan tener acceso a esta tecnologa. Aparte de esto, los
nuevos Sistemas de Control Distribuido empiezan a ofertar productos MPC genericos
que ofrecen al usuario la posibilidad de realizar futuras modificaciones sin depender
de un producto cerrado.
Uso explcito de un modelo para predecir la salida del proceso en futuros instantes
de tiempo (horizonte).
Calculo de las senales
Fundamentos
u(t+k|t)
u(t)
^y(t+k|t)
y(t)
N
t-1
t+1
...
t+k
...
t+N
de control futuras
u(t + k j t), k = 0 : : : N ; 1 que se pretenden mandar al sistema y que son las que
se quieren calcular.
2. El conjunto de senales
10
Entradas y salidas
pasadas
Trayectoria
de referencia
Salidas
predichas
Modelo
+
-
Controles
futuros
Optimizador
Errores futuros
Funcion de coste
Restricciones
son calculadas
por el optimizador teniendo en cuenta la funcion de coste (donde aparece el futuro error
de seguimiento) as como las restricciones. Por tanto el modelo juega un papel decisivo
en el controlador. El modelo elegido debe ser capaz de capturar la dinamica del proceso
para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo de usar
y de comprender.
El optimizador es otra parte fundamental de la estrategia pues proporciona las
acciones de control. Si la funcion de coste es cuadratica, el mnimo se puede obtener
como una funcion explcita de las entradas y salidas pasadas y de la trayectoria de
referencia. Sin embargo, cuando existen restricciones de desigualdad la solucion debe
ser calculada por metodos numericos con mas carga de calculo.
Tema 2
Controladores predictivos
2.1 Elementos basicos
Todos los controladores predictivos poseen elementos comunes y para cada uno de
estos elementos se pueden elegir diversas opciones, dando lugar a distintos algoritmos.
Estos elementos son:
Modelo de prediccion
Funcion objetivo
Obtencion de la ley de control
2.1.1
Modelo de prediccion
Elementos basicos
12
Para el estudio se puede separar el modelo en dos partes: el modelo del proceso
propiamente dicho y el modelo de las perturbaciones. Cualquier metodo usara ambas
partes para la prediccion.
Modelo del Proceso
Casi todas las formas posibles de modelar un proceso aparecen en alguna formu de MPC siendo las mas usadas las siguientes:
lacion
Respuesta impulsional. Tambien conocida por secuencia de ponderacion o modelo de convolucion. La salida viene relacionada con la entrada por la ecuacion
y(t) =
1
X
i=1
hiu(t ; i)
y(t) =
N
X
i=1
hi u(t ; i) = H (z;1)u(t)
:1)
(2
el gran numero
de parametros que necesita, ya que N suele ser un valor elevado
(del orden de 40-50). La prediccion vendra dada por:
y(t + k j t) =
N
X
i =1
hi u(t + k ; i j t) = H (z;1)u(t + k j t)
Respuesta ante escalon. Es muy similar al anterior solo que ahora la senal
de
entrada es un escalon. Para sistemas estables se tiene la respuesta truncada que
sera
N
X
y(t) = y0 + gi 4 u(t ; i) = y0 + G(z;1)(1 ; z;1 )u(t)
(2:2)
i=1
donde las gi son los valores muestreados ante la entrada en escalon y 4u(t) =
se muestra en la figura 2.1b. El valor de y0 puede tomarse 0
u(t) ; u(t ; 1), segun
sin perdida de generalidad, con lo cual el predictor sera:
y(t + k j t) =
N
X
i=1
gi 4 u(t + k ; i j t)
Controladores predictivos
g2
y(t)
g1
y(t)
hN
h1
hi
h2
13
...
t+1 t+2
t+N
...
t+1 t+2
t+N
b)
a)
A( z ; 1 )
B (z ;1 )
=
=
1 + a1 z ;1 + a2 z ;2 + + ana z ;na
b1 z;1 + b2 z;2 + + bnb z;nb
B
(z ;1 )
y(t + k j t) = A(z;1 ) u(t + k j k)
Esta representacion es valida tambien para procesos inestables y posee la ventaja
de necesitar pocos parametros, aunque es fundamental un conocimiento a priori
del proceso sobre todo en cuanto al orden de los polinomios A y B .
k
X
Ai;1Bu(t + k ; i j t)]
i=1
Elementos basicos
14
Posee la ventaja de que sirve tambien para sistemas multivariables a la vez que
permite analizar la estructura interna del proceso (aunque a veces los estados
obtenidos al discretizar no tienen ningun significado fsico). Los calculos pueden
ser complicados, con la necesidad adicional de incluir un observador si los estados
no son accesibles.
Modelo de las perturbaciones
De tanta importancia como la eleccion de un determinado modelo del proceso
es la eleccion del modelo utilizado para representar la perturbaciones. Un modelo
bastante extendido es el Autorregresivo Integrado de Media Movil (Auto-Regressive
and Integrated Moving Average, ARIMA), en el que las perturbaciones, es decir, las
diferencias entre la salida medida y la calculada por el modelo vienen dadas por
(z ;1 )e(t)
n(t) = C D
(z ;1 )
n(t) = 1 ;e(tz);1
cuya mejor prediccion sera n (t + k j t) = n(t).
Respuestas libre y forzada
Una caracterstica tpica de la mayora de los controladores MPC es el empleo de los
conceptos de repuesta libre y forzada. La idea es expresar la secuencia de acciones de
control como la suma de dos senales:
uf (t ; j )
uf (t + j )
=
=
u(t ; j ) para j = 1 2
u(t ; 1) para j = 0 1 2
Controladores predictivos
15
La senal
uc (t) vale cero en el pasado y corresponde a las senales
de control en los
instantes futuros:
uc(t ; j )
uc(t + j )
=
=
0 para j
1 2
u(t + j ) ; u(t ; 1) para j
=
0 1 2
Process
uc
y
f
yc
2.1.2
Funcion objetivo
Los diversos algoritmos de MPC proponen distintas funciones de coste para la obtencion
de la ley de control. En general se persigue que la salida futura en el horizonte
considerado siga a una determinada senal
de referencia al mismo tiempo que se puede
penalizar el esfuerzo de control requerido para hacerlo. La expresion general de tal
funcion objetivo sera:
N
X
2
j =N1
Nu
X
j =1
:3)
(2
Elementos basicos
16
Parametros: N1 y N2 son los horizontes mnimo y maximo de coste (o de prediccion) y Nu es el horizonte de control, que no tiene por que coincidir con el
horizonte maximo, como se vera posteriormente. El significado de N1 y N2 resulta bastante intuitivo: marcan los lmites de los instantes en que se desea que
la salida siga a la referencia. As, si se toma un valor grande de N1 es porque
no importa que haya errores en los primeros instantes, lo cual provocara una
respuesta suave del proceso. Notese que para procesos con tiempo muerto d no
tiene sentido que N1 sea menor que dicho valor puesto que la salida no empezara
a evolucionar hasta el instante t + d. Ademas, si el proceso es de fase no mnima,
este parametro permite eliminar de la funcion objetivo los primeros instantes de
respuesta inversa.
Los coeficientes (j ) y (j ) son secuencias que ponderan el comportamiento futuro. Usualmente se consideran valores constantes o secuencias exponenciales.
Por ejemplo se puede conseguir un peso exponencial de (j ) a lo largo del horizonte usando:
(j ) = N2;j
Si esta comprendido entre 0 y 1 indica que se penaliza mas a los errores mas
alejados del instante t que a los mas proximos, dando lugar a un control mas
suave y con menor esfuerzo. Si, por el contrario, > 1 es que se penalizan mas
los primeros errores, provocando un control mas brusco.
Todos estos valores pueden ser usados como parametros de sintonizacion, obteniendo un abanico muy amplio de posibilidades con las que se puede cubrir
una extensa gama de opciones, desde un control estandar hasta una estrategia
disenada
Robotica,
servos o procesos en batch; en otras aplicaciones aunque la referencia sea
constante, se puede conseguir una sensible mejora de prestaciones simplemente
conociendo el instante de cambio de valor y adelantandose a esa circunstancia.
En el criterio de minimizacion (2.3), la mayora de los metodos suelen usar una
trayectoria de referencia w(t + k ) que no tiene por que coincidir con la referencia
real. Normalmente sera una suave aproximacion desde el valor actual de la salida
y(t) a la referencia conocida mediante un sistema de primer orden:
w(t) = y(t)
:4)
(2
Controladores predictivos
17
r(t+k)
w1(t+k)
w2 (t+k)
y(t)
en depositos,
caudales en tuberas o temperaturas y presiones maximas. Ademas,
normalmente las condiciones de operacion vienen definidas por la interseccion
de ciertas restricciones por motivos fundamentalmente economicos, con lo que el
sistema de control operara cerca de los lmites. Todo lo expuesto anteriormente
hace necesaria la introduccion de restricciones en la funcion a minimizar.
Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo
cual han tenido gran e xito en la industria. Normalmente se consideraran lmites
en la amplitud y el slew rate de la senal
de control y lmites en las salidas:
umin
u(t)
dumin u(t) ; u(t ; 1)
ymin
y(t)
umax
dumax
ymax
8t
8t
8t
18
2.1.3
de control futuras,
haciendo uso del modelo que se haya elegido y se sustituyen en la funcion de coste,
obteniendo una expresion cuya minimizacion conduce a los valores buscados. Para el
criterio cuadratico si el modelo es lineal y no existen restricciones se puede obtener una
solucion analtica, en otro caso se debe usar un metodo iterativo de optimizacion.
De cualquiera de las maneras la obtencion de la solucion no resulta trivial pues
existiran N2 ; N1 + 1 variables independientes, valor que puede ser elevado (del orden
de 10 a 30). Con la idea de reducir estos grados de libertad se puede proponer cierta
estructura a la ley de control. Ademas se ha encontrado que esta estructuracion de la
ley de control produce una mejora en la robustez y en el comportamiento general del
sistema, debido fundamentalmente a que el hecho de permitir la libre evolucion de
las variables manipuladas (sin estructurar) puede conducir a senales
de control de alta
frecuencia no deseables y que en el peor de los casos podran conducir a la inestabilidad.
Esta estructura de la ley de control se plasma en el uso del concepto de horizonte de
control (Nu), que consiste en considerar que tras un cierto intervalo Nu < N2 no hay
variacion en las senales
4u(t + j ; 1) = 0
j > Nu
lo cual es equivalente a dar pesos infinitos a las cambios en el control a partir de cierto
instante. El caso lmite sera considerar Nu igual a 1 con lo que todas las acciones
futuras seran iguales a u(t)1 .
Controladores predictivos
19
n (t + k j t) = n (t j t) = ym(t) ; y(t j t)
y por tanto el valor predicho de la salida sera:
y(t + k j t) =
k
X
i=1
gi 4 u(t + k ; i) +
N
X
i=k+1
gi 4 u(t + k ; i) + n (t + k j t)
donde el primer termino contiene las acciones de control futuras (que seran calculadas),
N
X
i=1
j = 1 : : : Nc
En este caso la optimizacion debe ser numerica y se lleva a cabo en cada periodo de
muestreo, enviandose la senal
u(t) y recalculando todo en el nuevo periodo de muestreo,
como en todos los metodos MPC. Los principales inconvenientes de este metodo son el
tamano
del modelo empleado y la imposibilidad de tratar procesos inestables.
20
Puntos de coincidencia
u(t + k) =
nB
X
i=1
i(t)Bi(k)
Normalmente estas funciones son de tipo polinomico: escalones (B1 (k ) = 1), rampas
(B2 (k ) = k) o parabolas (B3 (k ) = k2 ), ya que la mayora de referencias se pueden
especificar como combinacion de estas funciones. Con esta estrategia, un perfil de
entrada complejo se puede especificar usando un pequeno
numero de parametros
desconocidos i que son las incognitas del problema de minimizacion.
La funcion a minimizar es:
J=
nH
X
y t hj ) ; w(t + hj )]2
( +
j =1
Controladores predictivos
21
N
P
h
(k)w(t + k) ; P (z;1)y(t + k j t)]
u(t) = k=d
N
P
(k)h2
k=d
4u(t + k ; 1) = 0
o minimizar el esfuerzo de control
J=
NX
;d
k =0
1<k N ;d
u2(t + k)
22
con el grado de E igual a N ; 1. Una ventaja de este metodo es que se puede encontrar
facilmente una solucion explcita, dada por
) ; y (t + N j t))
u(t) = u(t ; 1) + 0(w(t + NNP
;d 2
i
k=0
donde la perturbacion viene dada por un ruido blanco coloreado por el polinomio
C (z;1 ). Como en la practica es difcil encontrar el verdadero valor de este polinomio, se
puede emplear como parametro de diseno
para rechazo de perturbaciones o mejora de
GPC
Controladores predictivos
23
una unica
funcion objetivo.
Estos problemas motivaron el desarrollo de algoritmos como HIECON (Hierarchical
Constrained Control, por Adersa) o IDCOM-M (por parte de Setpoint). Este ultimo
incluye un supervisor para plantas mal condicionadas, funcion objetivo multicriterio o
jerarqua de restricciones. El SMOC de Shell es similar incluyendo caractersticas como
modelos en espacio de estados (validos para sistemas inestables) o la consideracion de
un observador extendido para la realimentacion de la salida en lugar del valor constante
empleado en los demas metodos. Estos metodos junto con el PCT de Profimatics, el
RMPCT de Honeywell o el PFC de Adersa constituyen la tercera generaci
on.
Los productos que existen hoy da en el mercado comparten las ideas basicas de
24
Estado de la tecnologa
Optimalidad de la solucion. Muchos paquetes proporcionan una solucion sub
optima
para acelerar el calculo. En algunos casos este procedimiento no esta
justificado.
Incertidumbres en el modelo. Normalmente no se tiene en cuenta la incertidumbre asociada a la identificacion, sino que se desintoniza el controlador intentando
aumentar la robustez.
Perturbacion constante. Aunque es la hipotesis mas sensata a priori, se podra
obtener una mejor realimentacion si la distribucion de la perturbacion se estudiara
con mas cuidado.
Tema 3
Algoritmos
En este tema se tratan en profundidad los dos algoritmos considerados mas representativos de las metodologas existentes en Control Predictivo. Representan a las dos
familias de controladores predictivos, una de origen claramente industrial y la otra mas
academica.
3.1.1
Prediccion
26
Como se emplea un modelo de respuesta ante escalon:
y(t) =
1
X
i=1
gi 4 u(t ; i)
y(t + k j t) =
1
X
gi 4 u(t + k ; i) + n (t + k j t) =
1
k
X
X
gi 4 u(t + k ; i) +
gi 4 u(t + k ; i) + n (t + k j t)
=
i=1
i=k+1
i=1
k
1
X
X
y(t + k j t) = gi 4 u(t + k ; i) +
gi 4 u(t + k ; i) + ym(t) ;
i=1
i=k+1
1
k
X
X
;
gi 4 u(t ; i) = gi 4 u(t + k ; i) + f (t + k)
i=1
i=1
f (t + k) = ym(t) +
1
X
i=1
:1)
(3
f (t + k) = ym(t) +
N
X
i=1
Notese
que si el proceso no es estable, entonces no existe N y no se puede calcular f (t + k) (aunque existe una generalizacion en el caso de que la inestabilidad sea
producida por integradores puros).
(k
y(t + 1 j t)
g1 4 u(t) + f (t + 1)
Algoritmos
27
y(t + 2 j t)
y(t + p j t)
..
.
g2 4 u(t) + g1 4 u(t + 1) + f (t + 2)
p
X
gi 4 u(t + p ; i) + f (t + p)
i=p;m+1
2
66 gg12 g01
66 . .
66 .. ..
66 gm gm;1
66 .. ..
4 . .
gp gp;1
...
...
0
0
..
.
g1
..
.
gp;m+1
3
77
77
77
77
77
5
y^ = Gu + f
:2)
(3
3.1.2
y^
Perturbaciones medibles
y^d = Dd + fd
y^
28
f = fu + D d + fd + fn
Por tanto la prediccion se puede expresar en la forma general
y^ = Gu + f
3.1.3
Algoritmo de control
El e xito en la industria del DMC se ha debido principalmente a su aplicacion a sistemas multivariables de gran dimension con la consideracion de restricciones. En esta
seccion se describe el algoritmo de control comenzando por el caso mas simple de un
sistema monovariable sin restricciones y extendiendolo posteriormente al caso general
multivariable con restricciones.
El objetivo del controlador DMC es llevar el proceso los mas cerca posible al setpoint
en el sentido de mnimos cuadrados con la posibilidad de incluir una penalizacion en los
movimientos de la senal
de control. Por ello se seleccionan las variables manipuladas
de forma que minimicen un objetivo cuadratico que puede incluir solo los errores
futuros
p
J=
y t j j t) ; w(t + j )]2
( +
j =1
o tambien el esfuerzo de control, presentando la forma generica
J=
p
X
y t j j t) ; w(t + j )]
( +
j =1
m
X
j =1
4u(t + j ; 1)]2
ee
uu
u = (GT G + I ); GT (w ; f )
1
:3)
(3
Recuerdese que, como en todas las estrategias predictivas, solo se enva al proceso
el primer elemento del vector (4u(t)). No es aconsejable implementar la secuencia
completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma
exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que
provocan que la salida real difiera de las predicciones que se emplean para calcular la
Algoritmos
29
w
u
K
Proceso
f
Calculo
Resp. libre
optimo
segun criterios economicos se encuentra normalmente en la interseccion de las
restricciones, como se muestra en la figura 3.2. Por razones de seguridad, es necesario
mantener una zona segura alrededor del punto de operacion, ya que el efecto de las
perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona
se puede reducir (y por tanto aumentar los beneficios economicos) si el controlador es
capaz de manejar restricciones (punto de operacion 1).
Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades
de forma generica
N
X
i=1
j = 1 : : : Nc
30
Zona segura 1
P. operacion
optimo
Punto operacion 1
Restriccion
zona
segura 2
Punto operacion 2
Restriccion
Ru
Todo lo relacionado con las restricciones sera abordado con mayor grado de detalle
en el tema dedicado a ello.
y el de senales
de control de la forma:
u = [4u (t) : : : 4u (t + m
1
teniendo en cuenta que la respuesta libre de la salida i depende tanto de valores pasados
de yi como de valores pasados de todas las senales
de control.
Algoritmos
31
Con estas definiciones, la ecuacion de prediccion es igual que en el caso monovariable simplemente considerando que la matriz G toma la forma:
2 G G
66 G1121 G1222
66 ..
..
4 .
.
Gny1 Gny2
...
G1nu
G2nu
..
.
Gnynu
3
77
77
5
Cada submatriz Gij contiene los coeficientes de la respuesta ante escalon i-esima
correspondiente a la entrada j-esima. El proceso de minimizacion es analogo solo que
la ponderacion tanto de los errores como de los esfuerzos de control se realiza con
matrices de peso.
32
3.2.1
La mayora de los procesos de una sola entrada y una sola salida (single-input singleoutput, SISO), al ser considerados en torno a un determinado punto de trabajo y tras ser
linealizados, pueden ser descritos de la siguiente forma:
A(z;1 )
B (z;1 )
C (z;1)
=
=
=
con
4 = 1 ; z;1
:4)
(3
J (N1 N2 Nu) =
N
X
2
j =N1
Nu
X
j =1
:5)
(3
Algoritmos
33
Prediccion optima
Con la intencion de minimizar la funcion de coste, se obtendra previamente la pre
diccion optima
de y (t + j ) para j N1 y j N2 . Considerese la siguiente ecuacion
diofantica:
1 = Ej (z ;1 ) 4 A + z ;j Fj (z ;1 )
1 = Ej (z ;1 )A + z ;j Fj (z ;1 )
(3.6)
(3.7)
:8)
(3
Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursivamente, de forma que los nuevos valores en el paso j + 1 (Ej +1 y Fj +1) sean funcion de
los del paso j . A continuacion se muestra una demostracion simple de la recursividad
de la ecuacion diofantica. Existen otras formulaciones del GPC que no estan basadas en
la recursividad de esta ecuacion.
Considerense que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A (z ;1 )
hasta que el resto haya sido factorizado como z;j Fj (z ;1 ) .
Con:
Fj (z;1 )
Ej (z;1 )
=
=
34
Supongase
que se utiliza el mismo procedimiento para obtener Ej +1 y Fj +1, es decir,
dividir 1 entre A (z ;1 ) hasta que el resto se pueda factorizar como z;(j +1) Fj +1 (z ;1 ) con
Por tanto:
el divisor (A ) es monico.
con ej +1j
fj0
Teniendo en cuenta que el nuevo resto sera el resto anterior menos el producto del
cociente por el divisor, los coeficientes del polinomio Fj +1 se pueden expresar como:
1, F1
z(1 ; A )
2. Ir anadiendo
fj0
para i = 0 nb
de control u(t),
u(t + 1), ...,u(t + N ) que minimizan la ecuacion (3.5). Al tener el proceso un retardo de
d perodos de muestreo, la salida solo se vera influenciada por la senal
u(t) despues del
instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes pueden ser definidos
como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido hacer N1 < d + 1 ya que
los terminos de (3.5) solo dependeran de las senales
Algoritmos
35
y(t + d + 1 j t)
y(t + d + 2 j t)
y(t + d + N j t)
=
=
..
.
=
Donde
G0(z; )
F( z ; )
:9)
(3
2 y(t + d + 1 j t) 3
2
3
4u(t)
66 y(t + d + 2 j t) 77
66 4u(t + 1) 77
66
7
66
77
u
=
..
..
7
4
5
4
5
.
.
y(t + d + N j t)
4u(t + N ; 1)
2 g
0
::: 0 3
0
66 g1 g0 ::: 0 77
66 ..
..
.. .. 7
7
4 .
.
. . 5
g
g
::: g
3
2 N ;1 N ;2 z(G0 (z;1 ) ; g )
0
d+1
77
66
z2 (Gd+2 (z;1 ) ; g0 ; g1z;1 )
77
66
..
5
4
.
N
;
1
;
1
;
(
N
;
1)
z (G (z ) ; g0 ; g1z ; ; gN ;1z
)
2 F (dz+;N1 ) 3
66 Fdd++12 (z;1 ) 77
66
77
..
4
5
.
;
1
Fd+N (z )
y Gu f
DMC,
aunque en este
Gu f w Gu f w) + uT u
:11)
(3
36
donde:
w = w(t + d + 1) w(t + d + 2)
w(t + d + N )
iT
(3.12)
J = 12 uT Hu + bu + f0
:13)
(3
donde:
H
b
f
0
=
=
=
GG I
f w G
f w f w)
2( T + )
2( ; )T
T
( ; ) ( ;
u = ;H; bT
1
:14)
(3
Debido al uso de la estrategia deslizante, solo se aplica realmente el primer elemento del
vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo.
La solucion propuesta involucra la inversion (o al menos la triangularizacion) de una
matriz de dimension N N , lo cual conlleva una gran carga de calculo. El concepto ya
usado en otros metodos de horizonte de control se emplea con la finalidad de reducir
la cantidad de calculo, asumiendo que las senales
3.2.2
Ejemplo de calculo
Se presenta a continuacion un ejemplo de calculo de un Controlador Predictivo Generalizado en un caso sencillo. Se disenar
a el controlador para un sistema de primer
orden.
Al discretizar el proceso continuo se obtiene el siguiente equivalente discreto:
(1 +
(t)
az;1 )y(t) = (b0 + b1 z;1 )u(t ; 1) + e4
Algoritmos
37
Ej (z;1 ),
E1 (z;1 ) = 1
E2 = 1 + 1:8z;1
F2 = 2:44 ; 1:44z;1
E3 = 1 + 1:8z;1 + 2:44z;2 F3 = 2:952 ; 1:952z;1
Con estos valores y el polinomio B (z;1 ) = 0:4 + 0:6z ;1 , los elementos Gi (z ;1 ) resultan
ser:
3
2
y(t + 1 j t)
64 y(t + 2 j t) 75
y(t + 3 j t)
2
3
32
0:4
0
0
4u(t)
64 1:32 0:4 0 75 64 4u(t + 1) 75 +
2:056 1:32 0:4
4u(t + 2)
2
3
0:6 4 u(t ; 1) + 1:8y (t) ; 0:8y (t ; 1)
64 1:08 4 u(t ; 1) + 2:44y(t) ; 1:44y(t ; 1) 75
| 1:464 4 u(t ; 1) + 2:952
{z y(t) ; 1:952y(t ; 1) }
f
2
3
0:133
0:286 0:147
7
T
;1 T 6
(G G + I) G = 4 ;0:154 ;0:165 0:286 5
;0:029 ;0:154 0:1334
Como solo se necesita el valor de 4u(t) para los calculos, solo se emplea realmente la
primera fila de la matriz, con lo que resulta la siguiente expresion para la ley de control:
4u(t)
=
+
38
u(t)
=
+
3.2.3
Caso multivariable
Al igual que en el DMC todo lo visto para el caso de sistemas con una sola entrada y
una sola salida se puede extender al caso multivariable, aunque los calculos son mas
complejos.
En este caso el modelo CARIMA para un sistema de m entradas y n salidas se puede
expresar como:
1
;1
;1
;1
(z )e(t)
(z )y (t) = (z )u(t ; 1) +
(3:15)
4
A(z; )
B(z; )
C(z; )
B(z; )
1
J (N1 N2 N3 ) =
N
X
2
j =N1
ky (t + j j t) ; w (t + j )k2R +
N
X
3
j =1
k 4 u(t + j ; 1)k2Q
Algoritmos
39
40
Tema 4
Restricciones en Control Predictivo
En la practica todos los procesos estan sujetos a restricciones. Los actuadores tienen
un campo limitado de accion impuesto por lmites fsicos (por ejemplo una valvula no
puede abrir mas de un 100 % o un calentador no puede aportar mas de su potencia
maxima. Tambien existen lmites de seguridad (por ejemplo presiones o temperaturas
maximas), requerimientos tecnologicos (por ejemplo mantener temperaturas en un
rango dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa
medioambiental.
optimo
se encuentra en la interseccion de las restricciones obligando a acercarse lo mas
posible a las e stas pero sin superarlas.
Si el controlador fuera capaz de tener en cuenta las restricciones y evitar su violacion,
el proceso podra operar mas cerca de e stas y por tanto de forma mas eficiente. La figura
4.1 muestra un ejemplo donde existe una limitacion de presion maxima y se observa
como
al alejar el punto de operacion del lmite la produccion Q disminuye.
En cuanto a la forma de operar de un controlador predictivo que no considera restricciones el procedimiento es similar: si la senal
de control calculada viola la restriccion,
se satura. Las senales
42
P
Pmax
P1
P2
Q1 Q2
43
u(t+1)
u(t+1)
u max
u max
uc
u
u max
uc
u
u max
u(t)
a)
u(t)
b)
y = Gu + f
por lo que tanto entradas como salidas se pueden expresar en funcion del vector de
incrementos de la senal
de control.
Las restricciones que aparecen seran basicamente amplitud y velocidad de cambio
en la senal
de control y amplitud en la salida y se pueden expresar como:
U
u
y
u(t)
u(t) ; u(t ; 1)
y(t)
U
u
y
8t
8t
8t
1U
1u
1y
T u + u(t ; 1) 1
u
Gu + f
N , las
1U
1u
1y
Ru c
44
siendo
2 I
66 ;INNNN
66 T
R = 66 ;T
66
4 G
3
2
3
l
u
77
66
7
77
66 l U ;;lul (ut ; 1) 777
77 c = 66
7
77
66 ;l U + lu(t ; 1) 777
5
4
5
ly;f
;G
;l y + f
Restricciones duras como aquellas que no se pueden violar bajo ningun concepto.
En este grupo se incluyen las restricciones relacionadas con la operacion segura
del proceso.
Restricciones blandas, que son aquellas que pueden ser violadas en un momento
dado por no ser cruciales, pero la violacion se penaliza en la funcion objetivo
como un termino mas. Es una forma de relajar la restriccion.
del problema
4.3 Resolucion
Con la adicion de restricciones el problema general de control predictivo cambia se
puede formular como
u)
Ru c
minimizar J (
sujeto a
45
En los ultimos
anos
se ha trabajado mucho sobre la estabilidad en estas circunstancias, proponiendose soluciones basadas en la teora de Lyapunov. La idea basica
consiste en que la funcion de coste cuando el horizonte es infinito es monotona decreciente (si existe solucion factible) y se puede interpretar como funcion de Lyapunov
que garantiza por tanto la estabilidad. Sin embargo, como la solucion tiene que ser
numerica, el numero
de variables de decision tiene que ser finito, por lo que se han propuesto dos ideas. En la primera, se descompone la funcion objetivo en dos partes: una
con horizonte finito y restricciones y otra con horizonte infinito y sin restricciones. La
segunda idea es en esencia equivalente y consiste en imponer restricciones terminales
al estado y usar un horizonte infinito.
En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las
incertidumbres en el modelo y los temas asociados con la factiblidad.
de restricciones
4.4 Gestion
Durante la etapa de optimizacion puede aparecer problemas de no existencia de so optima
lucion
para unas restricciones dadas (no existe compatibilidad entre las restricciones), por ejemplo por el planteamiento de unos objetivos inalcanzables para unas
restricciones dadas. Existen otras posibles causas de inexistencia de solucion, como es
el caso de que una perturbacion saque al proceso fuera de la zona de trabajo usual.
La factibilidad de un problema de optimizacion significa que la funcion objetivo
este acotada y que todas las restricciones sean satisfechas.
La no factibilidad puede aparecer en regimen permanente o en el transitorio. El
problema de la falta de solucion en regimen permanente puede venir provocado por
un objetivo de control irrealizable. Sin embargo, este tipo de no factibilidad puede
ser facilmente eliminado en la etapa de diseno
evitando la inclusion de tales objetivos.
Tambien puede ser debido a cambios en referencias que hagan incompatibles las restricciones (se quiera llevar alguna variable a un punto que es imposible de alcanzar con
una entrada que esta acotada).
En el regimen transitorio puede aparecer no factibilidad incluso cuando las restricciones impuestas parezcan razonables. Restricciones que no causan problemas en
Gestion de restricciones
46
operacion normal pueden producir problemas bajo ciertas circunstancias. Puede que
una perturbacion o cambio de referencia grande fuerce a una variable fuera de su lmite
y sea imposible introducirla de nuevo en su zona permitida con senales
de control de
energa limitada. En estos casos las restricciones se hacen temporalmente incompatibles.
Las soluciones no factibles aparecen con mayor frecuencia en casos en que el optimo
se encuentre cerca de las restricciones y el sistema este sujeto a perturbaciones, llevando
a la salida a "regiones prohibidas".
4.4.1
Tecnicas de busqueda
de soluciones factibles
47
Lmites fsicos
Restricciones reales
Lmites de operacin
Eliminacion de restricciones
La factibilidad se analiza en cada periodo de muestreo, por lo que la eliminacion de
restricciones se realiza de forma temporal. Periodicamente se chequea la factibilidad
para poder reinsertar restricciones eliminadas.
La eliminacion de un grupo de restricciones ha de realizarse en aquellos casos en que
el conjunto completo de restricciones que se imponen sobre el sistema sea incompatible.
Cada vez que existe un problema de incompatibilidad de restricciones, se forma un
conjunto de restricciones no admisibles que no se tienen en cuenta en el proceso de
Gestion de restricciones
48
Eliminacion jerarquica En este caso solo se eliminan las restricciones que provocan
problemas de incompatibilidad. En este metodo se asigna en la etapa de diseno
una
prioridad a cada restriccion, que da un grado de importancia relativa de dicha restriccion frente a las otras. Esta prioridad se usara para clasificar las restricciones de una
forma jerarquica (se asigna un numero que indica su posicion en la jerarqua). De este
modo, cada vez que haya problemas de factibilidad o existencia de solucion el gestor
de restricciones va eliminando por orden las restricciones menos prioritarias hasta que
se restablece la factibilidad de la solucion, que se chequea cada periodo de muestreo
para reinsertar restricciones que hubieran sido temporalmente eliminadas.
En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes
tipos de reglas para establecer el numero de restricciones que se eliminan, si conviene
eliminar mas restricciones a costa de no eliminar una con prioridad superior, etc.
Relajacion de restricciones
Otro metodo para tener en cuenta el problema de existencia de solucion es la relajacion
de las restricciones. Se puede hacer una relajacion de los lmites de forma temporal o convertir restricciones duras (
), cambiandolas en restricciones blandas
(
+ , con 0) para asegurar la existencia de solucion, anadiendo
un termino
T a la funcion de coste de forma que se penalice la violacion de la restriccion y
obtener un mejor comportamiento del sistema controlado. A largo plazo, el termino
en la funcion objetivo llevara las variables auxiliares a cero.
de penalizacion
Ru c
T
Ru
Otras tecnicas
Existen tecnicas que se basan en la manipulacion del horizonte mnimo de las restricciones. Algunos controladores industriales como el QDMC usan el concepto de constraint
49
50
Gestion de restricciones
Tema 5
Tendencias actuales y nuevas
perspectivas
En la actualidad existen muchos campos abiertos en Control Predictivo, tanto en lo
referente a aplicaciones practicas como a lneas de investigacion. Todava queda mucho
por estudiar en campos como identificacion de modelos, estimacion del estado y de
las perturbaciones no medibles o tratamiento sistematico de las incertidumbres. El
estudio de estabilidad o robustez de la solucion es complicado, sobre todo en el caso de
inclusion de restricciones, ya que la ley de control es en general variable con el tiempo
y no se puede representar el sistema de la forma clasica de bucle cerrado.
Los procesos deben operar de forma diferente en distintos momentos. Por ejemplo, durante la fase de arranque puede interesar una estrategia de tiempo mnimo
y en el regimen nominal el objetivo puede ser reducir en lo posible la varianza de
las variables controladas.
51
52
Notese
que ahora la funcion objetivo no es cuadratica y por tanto no se puede
emplear para su minimizacion un algoritmo de programacion cuadratica, aunque se
puede transformar en uno de este tipo anadiendo
y(t + j ) yh + h (j )
y(t + j ) yl ; h (j )
La secuencia optima
de control se obtiene con la minimizacion de
N2
X
J = (h(j )2 + l (j )2)
j =N1
con la condicion de que las variables de holgura sean no negativas (y el resto de las
restricciones si las hubiera). En definitiva lo que se ha hecho es transformar el problema
en un QP con mas restricciones y variables.
En muchas ocasiones todos los objetivos de control se pueden agrupar en una sola
funcion de coste. Algunos de los objetivos pueden ser mantener las variables lo mas
cerca posible de los setpoints o dentro de unas determinadas regiones de operacion.
Cada uno de estos objetivos equivale a minimizar una cierta funcion Ji (sujeta a una serie
de restricciones). Entonces la secuencia de control se puede obtener de la minimizacion
de:
m
J=
i Ji
i=1
sujeta a todo el conjunto de restricciones. La importancia relativa de cada objetivo se
puede ponderar mediante la adecuada eleccion de los i , aunque en la practica es difcil
encontrar estos pesos. Ademas, muchas veces los objetivos de control son cualitativos,
mas difcil.
haciendo la tarea aun
5.1.1
53
Jerarqua de objetivos
Riu ai
La idea consiste en introducir variables enteras Li que toman valor 1 cuando se satisface
el correspondiente objetivo de control y cero en caso contrario. Los objetivos se expresan
entonces como:
PL .
i
Ru a
J = ;K
m
X
Li + f ()
i=1
donde f es una funcion de penalizacion de la variable de holgura (positiva y monotona
creciente) y K es su cota superior. El algoritmo de optimizacion intentara maximizar
54
el numero
de objetivos satisfechos (Li = 1) antes de intentar reducir f () porque la
funcion objetivo global se puede hacer mas pequena
incrementando el numero de
variables Li distintas de cero que reduciendo la funcion de penalizacion. Como todos
los objetivos Oi estan satisfechos para i < f , las restricciones (5.2) tambien se satisfacen.
Como Of es el primero que falla:
i;1
X
i=1
Li = f ; 1 para i f
Es decir, el termino que multiplica a Ki es cero para i = f mientras que para ndices
mayores es mayor que uno. Esto implica que todas las restricciones se satisfaran para
i > f . La unica
restriccion activa es f f + .
Ru a
En los ultimos
anos
el Control Predictivo Basado en Modelo se ha convertido en la
estrategia de control preferida para una gran cantidad de procesos industriales. Los
esquemas de MPC lineal, es decir, los vistos hasta ahora en los que la prediccion esta
basada en un modelo lineal del proceso, se usan de forma rutinaria como una opcion
de control mas a tener en cuenta en ciertos sectores de la industria y se puede decir que
sus fundamentos teoricos estan suficientemente estudiados.
Por su parte, el Control Predictivo No Lineal (Nonlinear Model Predictive Control,
NMPC) surgi
o hace relativamente poco tiempo y existen pocas referencias de aplicaciones industriales. Pero debido a su capacidad para tener en cuenta las no-linealidades
del proceso se espera que se convierta en una opcion prometedora a corto plazo.
No hay nada en los conceptos basicos de MPC contra el uso de modelos no lineales,
por tanto la extension de tales conceptos a procesos no lineales es en principio sencilla.
Sin embargo, como se vera seguidamente esto no es un asunto trivial y aun hay muchos
temas abiertos como:
55
En estas situaciones una ley de control lineal puede no ser efectiva siendo necesario
el empleo de un controlador no lineal para mejorar el comportamiento o simplemente
para una operacion estable del proceso. Es por tanto en este caso donde se puede
justificar el empleo de tecnicas de NMPC. Aunque en la actualidad el numero de
reducido, el potencial es considerable, como se desprende del
aplicaciones es aun
informe de Qin y Badgwell [17], donde se observa que MPC no ha penetrado aun en
campos donde las no linealidades son fuertes y el mercado exige frecuentes cambios
del punto de operacion; es aqu donde se espera el auge del NMPC.
56
5.2.1
Resulta evidente que la principal ventaja del NMPC frente al MPC radica en la posibilidad
de abordar dinamicas no lineales. A medida que aparecen nuevas herramientas que
hacen posible la obtencion y representacion de modelos no lineales, bien a partir de
primeros principios (leyes de conservacion) o bien a partir de datos experimentales
(modelos de Volterra o redes neuronales) el interes por su utilizacion en NMPC se va
acrecentando.
Aunque la extension de los conceptos de MPC al caso no lineal es directa, a la hora de
realizar el controlador aparecen una serie de problemas a tener en cuenta, que dan lugar
a una mayor dificultad en su implantacion. Las principales dificultades derivadas del
empleo de modelos no lineales son:
5.2.2
Fundamentos teoricos
Se puede definir un algoritmo generico NMPC que englobe a todas las tecnicas que
comparten las mismas ideas. El proceso (en general multivariable) se puede describir
por un modelo en el espacio de estados de la forma:
57
de control
que llevan al proceso desde su estado actual al estado deseado s . El punto de trabajo
deseado ( s , s , s ) viene en general determinado por una optimizacion estatica basada
normalmente en criterios economicos. Este punto de trabajo debe ser recalculado
periodicamente
ya que las perturbaciones pueden hacer cambiar el punto o ptimo de
operacion.
y x u
donde
J=
P
X
j =1
y(t + j ) ; ys
kq
Q+
MX
;1
j =1
k 4 (t + j )kqS +
MX
;1
j =1
:3)
(5
x(t + j ) = f (x(t + j ; 1) u(t + j ; 1) d(t + j ; 1) w(t + j ; 1))y(t + j ) = g(x(t + j )) + b(t)
y al resto de restricciones en entradas y salidas que se quieran considerar:
y ; s y(t + j ) y ; s 8j = 1 P
u u(t + j ) u 8j = 1 M ; 1
4u 4u(t + j ) 4u 8j = 1 M ; 1
5.2.3
La resolucion del NMPC plantea nuevos problemas que no existan en el caso lineal
relacionados por un lado con la metodologa de calculo de la senal
de control y por
otro con el comportamiento dinamico del bucle cerrado, basicamente su estabilidad.
58
Resolucion
puntos de busqueda,
ademas de comprobar la violacion o no de las restricciones
y los criterios de finalizacion del algoritmo. Estas tareas consumen mas tiempo
de calculo que en el caso lineal.
Estabilidad de la solucion
en el caso de
El otro problema fundamental es el de la estabilidad de la solucion. Aun
59
x(k + P ) = xs
Con la imposicion de esta restriccion, la funcion objetivo se convierte en una funcion
de Lyapunov para el sistema en bucle cerrado, conduciendo a la estabilidad nominal.
Con la introduccion de esta restriccion el estado al final del horizonte finito es cero y
por tanto tambien lo sera la senal
de control, con lo que el sistema (sin perturbaciones)
se queda para siempre en el origen. De esta forma es como si el horizonte de prediccion
fuera infinito.
El problema de este metodo es que en la practica la introduccion de esta restriccion
artificial anade
a la formulacion es:
x t P ) ; xs ) 2 W
( ( +
Si el estado actual se encuentra fuera de esta region se usa el algoritmo NMPC con la
restriccion anterior. Una vez que el estado se encuentra en W , el control conmuta a una
estrategia lineal determinada previamente (estrategia del tipo dual-mode controller).
Este metodo conlleva por tanto la gestion de la conmutacion entre los dos controladores y la determinacion de la region W y de la matriz de ganancia de la realimentacion
del vector de estados (una forma de hacerlo se puede encontrar en el artculo citado).
4. Horizonte casi-infinito
Chen y Allgower ([3]) extendieron el concepto anterior, proponiendo un esquema
de control con horizonte casi-infinito. Se hace uso de la idea de region terminal y
60
controlador estabilizante, pero solo para el calculo del coste terminal. La senal
de
control se determina resolviendo el problema de optimizacion en lnea (con horizonte
finito) sin conmutar al controlador lineal incluso dentro de la region terminal.
El procedimiento consiste en anadir
2 (0 1)
Esta restriccion fuerza a la magnitud del vector de estado a contraerse segun el factor
elegido cada vez que se calcula la senal
de control. La estabilidad queda garantizada
siempre que el problema sea factible, lo que no viene impuesto necesariamente porque
sea factible en k = 0, ya que las restricciones que se le imponen al estado son muy
estrictas y pueden hacer perder factibilidad. Esto se puede mejorar con valores grandes
de , pero entonces la disminucion de la magnitud del estado es menor. En general
se puede decir que en muchas situaciones reales la condicion es muy restrictiva y la
no-factibilidad aparece con facilidad.
Robustez
lo es el de
Si el estudio de la estabilidad en NMPC resulta de por s complicado, mas aun
la robustez, es decir, la estabilidad cuando existen errores de modelado. Los resultados
de estabilidad de la seccion anterior son validos solo en el caso de que el modelo del
proceso sea perfecto. Resulta evidente que esto nunca va a ser cierto en la practica, por
lo que es necesario alguna forma de afrontar la existencia de incertidumbres.
Se puede considerar el problema de la robustez como algo todava sin resolver
para NMPC, aunque existen algunos resultados preliminares. Algunos de los esquemas
que garantizan establidad se pueden hacer robustos con algunos cambios, como por
ejemplo el uso de restricciones terminales conservadoras in el dual-mode. Pero en
general los resultados existentes solo indican que incertidumbres pequenas no amenazan
la estabilidad del bucle cerrado, sin permitir el diseno
del controlador que garantice la
estabilidad dada una incertidumbre descrita por sus lmites. Existen algunos resultados
61
5.2.4
Modelos
Estos resultados teoricos proporcionan una base para poner en marcha un NMPC, aunque en la practica existen muchos temas abiertos, principalmente en lo referente a la
definicion e identificacion del modelo y al desarrollo de metodos de resolucion fiables.
La obtencion de modelos no lineales adecuados de forma emprica puede ser muy
difcil y no existe una formulacion que sea claramente adecuada para representar
procesos no lineales de forma generica. Parte del e xito del MPC se debe a la relativa
facilidad con la que se pueden obtener experimentalmente modelos del tipo respuesta
ante escalon o funciones de transferencia de bajo orden. En cambio los modelos no
lineales son mucho mas difciles de construir, tanto basandose en correlacion de datos
de entrada/salida como en principios basicos de conservacion de masa y energa.
Un gran obstaculo que se encuentra a la hora de desarrollar una teora de sistemas
no lineales es la ausencia de un principio de superposicion para este tipo de sistemas.
Debido a ello, la determinacion experimental de los modelos se convierte en una tarea
muy complicada, requiriendo una cantidad de ensayos mucho mayor que para una
planta no lineal.
Si el proceso es lineal en teora solo es necesario llevar a cabo un ensayo de respuesta ante escalon para calcular el modelo (aunque en la practica no sea realmente
as). Debido al principio de superposicion, la respuesta ante un escalon de diferente
amplitud se puede obtener escalando la salida convenientemente. Pero esto no es as
para procesos no lineales, donde se deben realizar ensayos con escalones de distinto
tamano.
Ademas, si el proceso es multivariable, la diferencia en el numero de ensayos
necesarios es mucho mayor. En general, si un sistema lineal se ensaya con senales
de entrada u1 (t),u2 (t),...,un (t), y las correspondientes salidas son y1 (t),y2 (t),...,yn (t), la
respuesta a una senal
que se puede expresar como combinacion lineal de las senales
de
prueba
u(t) = 1u1(t) + 2 u2(t) + + nun(t)
es
Es decir, un sistema lineal no necesita ser probado con ninguna secuencia de senales
de entrada.
Si la desviacion de la linealidad no es demasiado grande, se pueden hacer algunas aproximaciones que tengan en cuenta el cambio de comportamiento de un punto
62
Modelos de entrada/salida
Una idea adoptada por algunos fabricantes de controladores predictivos es usar un
modelo no lineal estatico junto con un modelo dinamico no lineal. Si se considera el
caso monovariables, definiendo las variables de desviacion como:
u(t) = u(t) ; us
y(t) = y(t) ; ys
ys = hs(us)
63
dys j
Ks = du
u(t)
s
:4)
(5
siendo uis y ufs los valores estacionarios actual y proximo y Ksi y Ksf las ganancias
calculadas en esos puntos usando el modelo no lineal estatico. Sustituyendo la ganancia
dada por (5.4) en la ecuacion del submodelo lineal se obtiene:
y(t) =
donde
n
X
i=1
:5)
(5
biKsi (1 ; Pnj=1 aj )
bi (1 ; Pnj=1 aj )
gi = Pn Ksf ;K i
bi =
Pn b
s
j =1 j
j =1 bj ufs ;uis
64
Modelos basados en primeros principios
5.2.5
Se han propuesto diversas soluciones para intentar resolver los problemas que se
han visto, como por ejemplo en [1], donde la prediccion de la salida del proceso
se hace mediante la adicion de la respuesta libre (la respuesta futura que se obtiene
si la entrada se mantiene en un valor constante durante los horizontes de control y
prediccion) obtenida de un modelo no lineal de la planta, y la respuesta forzada (la
debida a los movimiento de control futuros), calculada con un modelo incremental de
la planta. Las predicciones obtenidas de esta manera son solo una aproximacion ya
que el principio de superposicion, que permite la descomposicion mencionada, solo
es valido para sistemas lineales. Sin embargo, la aproximacion que se obtiene de esta
forma se comporta mejor que cuando se usa un modelo linealizado del proceso para
obtener ambas respuestas.
Si se usa una funcion de coste cuadratica, la funcion objetivo es cuadratica en las
variables de decision (futuros movimientos de la senal
de control) y la secuencia de
control se puede calcular (en caso de que no haya restricciones) como la solucion de
un conjunto de ecuaciones lineales, dando lugar a una ley de control simple. La unica
diferencia respecto a un MPC estandar es que la respuesta libre se calcula mediante un
modelo no lineal del proceso. Como el principio de superposicion no se cumple, la
aproximacion solo es valida cuando la secuencia de senales
de control es pequena.
Esta
circunstancia tendra lugar cuando el proceso opera en torno al punto de trabajo con
pequenas
perturbaciones. Si el proceso cambia continuamente de punto de operacion
o las perturbaciones son considerables los incrementos de la senal
de control seran en
general mayores y la aproximacion no sera muy buena.
Existe una forma de resolver este problema, propuesta en [9] para el EPSAC. La idea
basica es considerar la secuencia de senales
65
de control base mas los incrementos de control optimos que encuentre el algoritmo QP.
Este procedimiento se repite hasta que la secuencia de senales
de control se lleva lo
suficientemente cerca de cero.
Las condiciones iniciales para la secuencia de control base se pueden hacer inicial
mente iguales a la ultima
senal
de control que se ha aplicado al proceso. Observese que
esto corresponde al calculo de la respuesta libre en el MPC. Se puede probar con una
el ultimo
periodo de muestreo (con el desplazamiento temporal correspondiente).
Las condiciones de convergencia del algoritmo son muy difciles de obtener ya que
dependen de la severidad de la caracterstica no lineal del proceso, de las entradas y
salidas pasadas, de las referencias futuras y de las perturbaciones.
Otra manera de atacar el problema es teniendo en cuenta que en algunas ocasiones,
el modelo no lineal se puede convertir en un modelo lineal mediante aproximaciones
apropiadas. Considerese por ejemplo el proceso descrito mediante la siguiente ecuacion
en el espacio de estados:
x(t + 1)
y(t)
=
=
f (x(t) u(t))
g(x(t))
z(t + 1)
y(t)
=
=
Az(t) + Bv(t))
Cz(t)
66
z(t)
h(x(t))
u(t)
p(x(t) v(t))
solo se
5.2.6
Empresa
Producto
Modelo
F. Objetivo
Restricciones
Estructura u
Met. solucion
Adersa
PFC
EE, PP
Q
S, BS
FB, UM
NLS
Aspen Tech.
Aspen Target
EE
Q
DS, DE, BS
MM
QP
Continental
MVC
E/S, PNE
Q
DE, BS
UM
GRG
67
DOT Products
NOVA NLC
EE, PP
Q, N1
DE, BS
MM
MINLP
Pavillion Tech.
Process Perfecter
RN, E/S
Q
DE, DS
MM
GD
Tabla 5.1: EE: espacio de estados no lineal. PP: primeros principios. E/S: entrada/salida. PNE: polinomio no lineal estatico. RN: red neuronal. N1: norma 1.
S: saturacion. BS: blandas (mnimo y maximo) en la salida. DS: duras en las salidas.
una restriccion dura en forma de embudo, de manera que se da mas libertad a la salida
al comienzo del horizonte que al final.
Parametros: normalmente se elige un horizonte de prediccion finito muy grande,
con la idea de capturar la dinamica hasta el permanente de las salidas para todas las
entradas. Esto se puede considerar una aproximacion al metodo de horizonte infinito
propuesto para garantizar la estabilidad del bucle cerrado y puede explicar por que
ninguno de los productos comerciales incluye restriccion terminal.
Una idea introducida en el PFC y adoptada por Aspen Target es el uso de puntos de
coincidencia, en los cuales deben coincidir la salida y la trayectoria de referencia. Esta
cuando las salidas responden con distinta velocidad y se pueden
idea puede ser util
definir distintos puntos de coincidencia para cada una de ellas.
En cuanto a la estructuracion de la senal
de control, se puede encontrar desde
considerar el horizonte de control igual a 1, horizonte variable o funciones base. Esta
68
5.2.7
Necesidades futuras
Modelado: los modelos no lineales son mas complejos que los lineales, pero
ademas el proceso de identificacion es mucho mas difcil. Se necesita una gran
batera de ensayos para capturar las no-linealidades del proceso, resultando en
un perodo de pruebas considerable. Por tanto, la forma de disponer de una
representacion correcta de la dinamica del proceso es un problema que no esta
completamente resuelto.
Resolucion del problema: la inclusion del modelo no lineal en la optimizacion da
lugar a que e sta no sea convexa. Grandes esfuerzos deben hacerse todava para
encontrar algoritmos de optimizacion fiables que permitan la resolucion dentro
del tiempo asignado.
Justificacion del esfuerzo: vistas las dificultades que aparecen en la aplicacion
de NMPC, debe poder justificarse el beneficio que este tipo de tecnica aporta.
Algunos fabricantes ofrecen un MPC de respaldo, de manera que en el caso de
que no se necesite ese esfuerzo adicional o el controlador no lineal sea realmente
complicado de poner en marcha, se aplicara la estrategia lineal.
Otros temas: temas que son aplicables al Control Predictivo en general, funciones objetivos multicriterio, sintonizacion de parametros, mal condicionamiento o
tolerancia a fallos.
Es de destacar que ninguna de los productos comerciales incluye restriccion terminal ni horizonte infinito, situaciones requeridas en teora para garantizar la estabilidad
nominal. En lugar de eso, se confa en que con un horizonte de prediccion lo suficientemente grande se consiga el mismo comportamiento que horizonte infinito.
Bibliografa
[1] E.F. Camacho, M. Berenguel y F.R. Rubio. Advanced Control of Solar Power Plants.
Springer-Verlag, London, 1997.
[2] E.F. Camacho y C. Bordons. Model Predictive Control. Springer-Verlag, 1999.
[3] H. Chen y F. Allgower. A quasi-infinite horizon nonlinear predictive control
scheme with guaranteed stability. Automatica, 34(10):12051218, 1998.
[4] D.W. Clarke y C. Mohtadi. Properties of Generalized Predictive Control. Automatica, 25(6):859875, 1989.
[5] D.W. Clarke, C. Mohtadi y P.S. Tuffs. Generalized Predictive Control. Part I. The
Basic Algorithm. Automatica, 23(2):137148, 1987.
[6] C.R. Cutler y B.C. Ramaker. Dynamic Matrix Control- A Computer Control Algorithm. En Automatic Control Conference, San Francisco, 1980.
[7] C.E. Garca, D.M. Prett y M. Morari. Model Predictive Control: Theory and
Practice-a Survey. Automatica, 25(3):335348, 1989.
[8] S.S. Keerthi y E.G. Gilbert. Optimal infinite-horizon feedback laws for a general
class of constrained discrete-time systems: Stability and moving-horizon approximations. J. Optim. Theory Appl., 57(2):265293, 1988.
[9] R. De Keyser. A Gentle Introduction to Model Based Predictive Control. En
PADI2 International Conference on Control Engineering and Signal Processing, Piura,
Peru, 1998.
[10] R.M.C. De Keyser, Ph.G.A. Van de Velde y F.G.A. Dumortier. A Comparative Study
of Self-adaptive Long-range Predictive Control Methods. Automatica, 24(2):149
163, 1988.
[11] K. Kramer y H. Ubehauen. Predictive Adaptive Control. Comparison of Main
Algorithms. En Proceedings 1st European Control Conference, Grenoble, paginas 327
332, julio 1991.
[12] A.G. Kutnetsov y D.W. Clarke. Advances in Model-Based Predictive Control, captulo
Application of constrained GPC for improving performance of controlled plants.
Oxford University Press, 1994.
69
70
Bibliografa
[13] E.S. Meadows, M.A. Henson, J.W. Eaton y J. Rawlings. Receding horizon control
and discontinuous state feedback stabilization. Int. Journal Control, paginas 1217
1229, 1995.
[14] H. Michalska y D.Q. Mayne. Robust receding horizon control of constrained
nonlinear systems. IEEE Trans. on Automatic Control, 38(11):16231633, 1993.
[15] N.M.C. Oliveira y L.T. Biegler. An extension of newton-type algorithms for nonlinear process control. Automatica, 31:281286, 1995.
[16] S.J. Qin y T.A. Badgwell. An Overview of Industrial Model Predictive Control
Technology. In Chemical Process Control: Assessment and New Directions for
Research. En AIChE Symposium Series 316, 93. Jeffrey C. Kantor, Carlos E. Garcia and
Brice Carnahan Eds. 232-256, 1997.
[17] S.J. Qin y Thomas A. Badgwell. An overview of nonlinear model predictive control
applications. En IFAC Workshop on Nonlinear Model Predictive Control. Assessment
and Future Directions. Ascona (Switzerland), 1998.
[18] J. Richalet. Practique de la commande predictive. Hermes, 1992.
[19] H. Takatsu, T. Itoh y M. Araki. Future needs for the control theory in industries.
report and topics of the control technology survey in japanese indsutry. Journal of
Process Control, 8:369374, 1998.
[20] M.L. Tyler y M. Morari. Propositional Logic in Control and Monitoring Problems.
Technical Report AUT96-15, Institut fur Automatik, ETH- Swiss Federal Institute of
Technology, Zurich, Switzerland, 1996.
[21] B.E. Ydstie. Extended Horizon Adaptive Control. En Proc. 9th IFAC World Congress,
Budapest, Hungary, 1984.