Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Control Predictivo
Control Predictivo
Universidad de Sevilla
Carlos Bord ons Alba Departamento de Ingenier a de Sistemas y Autom atica Universidad de Sevilla
Indice general
Indice 1 Fundamentos 1.1 1.2 1.3 1.4 1.5 2 Tendencias actuales en control de procesos Perspectiva hist orica Situaci on actual
i 1
:::::::::::::::::
1 5 6 7 8 11 11 11 15 18 18 23 25
:::::::::::::::::::::::::::::: :::::::::::::::::::
:::::::::::::::::::::::::::::::: ::::::::::::::::::::::::
Controladores predictivos 2.1 Elementos b asicos 2.1.1 2.1.2 2.1.3 2.2 2.3
::::::::::::::::::::::::::::
:::::::::::::::::::::::::::
i
25 25
:::::::::::::::::::::::::::::::
Indice general
27 28 31 32 36 38 41
:::::::::::::::::::::::::
4 Restricciones en Control Predictivo 4.1 4.2 4.3 4.4 Tratamiento convencional de restricciones Restricciones en Control Predictivo Resoluci on del problema Gesti on de restricciones 4.4.1
41 42 44 45 46 51 51 53 54 56 56 57 61 64 66 68 69
:::::::::::::::::::::
5 Tendencias actuales y nuevas perspectivas 5.1 Multiobjetivo. Jerarqu a de objetivos 5.1.1 5.2 Jerarqu a de objetivos
:::::::::::::::::::::
::::::::::::::::::::::::: ::::::::::::::::
Control predictivo no lineal 5.2.1 5.2.2 5.2.3 5.2.4 5.2.5 5.2.6 5.2.7
::::::::::::::::::::::::::::::::
::::::::::::::::::::::::::
Bibliograf a
Tema 1 Fundamentos
1.1 Tendencias actuales en control de procesos
Aunque en el pasado pod a considerarse que el unico objetivo del control consist a en mantener una operaci on estable del proceso, actualmente la industrias se enfrentan a un mercado cambiante y dif cil de predecir, lo que les obliga a operar sus procesos productivos en consonancia con la evoluci on del mercado para poder mantenerse competitivas y rentables. La competencia en muchos sectores industriales as como el creciente inter es social por los problemas medioambientales relacionados con los procesos de producci on provoca la necesidad de disponer de t ecnicas ables que permitan la operaci on del proceso con gran eciencia y alto grado de exibilidad. Actualmente los sistemas de control en la industria de procesos deben satisfacer criterios econ omicos, asociados con el mantenimiento de las variables de proceso en sus referencias minimizando din amicamente una funci on de coste de operaci on, criterios de seguridad y medioambientales, y de calidad en la producci on, la cual debe satisfacer ciertas especicaciones sujetas a una demanda normalmente variable. Por ello, se puede considerar que en la actualidad el objetivo de todo sistema de control consiste en actuar sobre las variables manipuladas de forma que puedan satis facerse multiples y cambiantes criterios de funcionamiento (econ omicos, de seguridad, medioambientales o de calidad) en presencia de cambios en las caracter sticas del proceso. El amplio abanico de metodolog as actuales de control de procesos se enfrenta al cumplimiento de este objetivo. La diferencia entre las diversas t ecnicas radica b asicamente en los compromisos hechos en la formulaci on matem atica de los criterios de funcionamiento y en la elecci on de la manera de representar el proceso. La represen1
(%) 24 21 17 16 11
(%) 23 16 15 12 10
(%) 24 22 21 14 7
taci on matem atica de muchos de estos criterios se lleva a cabo en la forma de funciones objetivo din amicas y de restricciones mientras que el proceso se representa como un modelo din amico con incertidumbres asociadas. La importancia de las incertidumbres est a siendo cada vez m as reconocida y por tanto incluida expl citamente en la formulaci on de los controladores. Las t ecnicas de Control Predictivo Basado en Modelo (Model Based Predictive Control, MPC) parecen constituir unas poderosas herramientas para afrontar estos retos. MPC, en su forma m as general, acepta cualquier tipo de modelos, funciones objetivo o restricciones, siendo la metodolog a que actualmente puede reejar m as directamente los multiples criterios de funcionamiento relevantes en la industria de procesos. Quiz as sta la principal raz xito de estas t sea e on del e ecnicas en numerosas aplicaciones de la industria de procesos, unida a que es la forma m as general de formular el problema de control en el dominio del tiempo, de manera que puede resultar f acil de aceptar por el personal de la industria. Los resultados de un estudio realizado por Takatsu et al. para la Society of Instrumentation and Control Engineering [19] son indicativos de las necesidades futuras de mbito del control. En este informe se analizan los principales problela industria en el a mas de control que se encuentran en la industria de procesos, el estado de aplicaci on de las tecnolog as avanzadas, el grado de satisfacci on de los usuarios con cada una de ellas y las expectativas que cada una genera. La evoluci on en los ultimos anos de los principales problemas de control para los usuarios se muestra en la tabla 1.1. Obs ervese que los tres primeros problemas siguen siendo los mismos en los tres anos que se ha realizado la encuesta y parece que a lo largo del tiempo se resuelven problemas b asicos como estabilidad y respuesta y se atacan problemas m as dif ciles como din amica no lineal. Como se ver a m as adelante, el Control Predictivo es una metodolog a capaz de ofrecer soluciones a todos estos problemas. xito y fracaso de la Tambi en resulta interesante analizar los factores claves de e automatizaci on del proceso (1.2 y 1.3). De estas tablas se desprende que la elecci on de la estrategia de control no es el unico factor a tener en cuenta para garantizar un buen
Fundamentos
Selecci on de la estrategia de control 14 % Selecci on del equipo de control 12 % Especicaciones apropiadas 10 % Conguraci on exible del sistema 10 % Operaci on de emergencia 10 % Interface con el operario 8% An alisis de proceso 8% xito Tabla 1.2: Principales factores claves de e
Ausencia de an alisis del proceso. Inexactitud del modelo 21 % Selecci on de los sensores 14 % Falta de rechazo a las perturbaciones 10 % Selecci on de la estrategia de control 7% Selecci on de los actuadores 6% Selecci on del equipo de control 5% Especicaciones inapropiadas 5% Conguraci on r gida del sistema 5% Tabla 1.3: Principales factores claves de fracaso
funcionamiento del sistema de control. Del informe citado se pueden extraer conclusiones interesante sobre el estado y el grado de aceptaci on de las tecnolog as consideradas avanzadas (ver tabla 1.4). En ella se muestra el porcentaje de plantas que usaron cada t ecnica en 1989 y 1995. Obs ervese que todas crecieron excepto el control adaptativo y el autoajuste que tuvieron un ligero descenso. Con el n de evaluar el grado de satisfacci on del usuario con las distintas t ecnicas, se muestra en la tabla 1.5 el porcentaje de usuarios que est an satisfechos con cada una de las t ecnicas que han empleado. Como conclusi on interesante destaca el hecho de que pr acticamente todos los usuarios de Control Predictivo est an satisfechos. Tambi en resulta interesante intentar cuanticar la evoluci on futura de las distintas t ecnicas. Para ello, la gura 1.1 intenta mostrar las posibilidades t ecnicas y las expectativas despertadas por cada una de ellas. Posibilidad t ecnica se reere a la facilidad de implementaci on y expectativas al efecto esperado de uso de cada t ecnica. El punto de partida de cada echa es la media de todas las respuestas a la encuesta, mientras que su extremo corresponde a la media de las 15 plantas consideradas l deres en temas de control. El citado art culo interpreta la echa como tendencia futura. Seg un esto, el PID avanzado, compensaci on de retardo, borroso, desacoplo y MPC ser an t ecnicas
T ecnica 1989 1995 Compensaci on de retardo 29.6 52.4 Borroso 9.9 38 Control Predictivo 25.4 37.2 Gain-scheduling 25.7 32.5 PID avanzado 24.8 29.4 Autoajuste 32.2 29.1 Desacoplo 17.5 28.6 Basado en reglas 6.3 17.9 Filtro de Kalman 9.1 15.5 Neuronal 0 11.8 LQ 8.2 11 Observador 8.2 9.8 Control adaptativo 10.3 7 H1 0 9.3 Tabla 1.4: Estado de las distintas t ecnicas
T ecnica 1989 1995 Control Predictivo 76 94 PID avanzado 77 89 Compensaci on de retardo 72 89 Gain-scheduling 78 87 Borroso 67 83 LQ 79 70 Neuronal 69 Desacoplo 64 66 Filtro de Kalman 70 66 Autoajuste 60 65 Observador 67 62 Basado en reglas 43 61 Control adaptativo 50 56 H1 50 Tabla 1.5: Grado de satisfacci on de las distintas t ecnicas
Fundamentos
ampliamente usadas con grandes expectativas. El control neuronal despierta grandes expectativas pero tiene ciertas dicultades de implementaci on, mientras que el Autoajuste se implementa con facilidad pero pierde expectativas. Las t ecnicas como LQR, ltro de Kalman, H1 o adaptativo se mantienen como "sin demasiadas expectativas y no f acilmente implementables".
Expectativas
PID
Posibilidades tcnicas
Figura 1.1: Expectativas y posibilidades t ecnicas Este estado actual y futuras tendencias en el campo del control de procesos industriales indican que el Control Predictivo Basado en Modelo se puede considerar una tecnolog a sucientemente introducida en la industria y que adem as sigue despertando muchas expectativas. Estos hechos, unidos a la existencia de campos abiertos tanto en investigaci on como en temas relacionados con la implementaci on justica un estudio m as detallado de esta tecnolog a.
Situaci on actual
y algor tmica e intentaban aprovechar el creciente potencial de los computadores digi poca. tales por aqu ella e R apidamente el MPC adquiri o gran popularidad en las industrias de procesos qu micos principalmente debido a la simplicidad del algoritmo y al uso del modelo de respuesta impulsional o en escal on, que aunque posea muchos m as par ametros que las formulaciones en el espacio de estados o funci on de transferencia suele ser preferido por ser intuitivo y necesitar menos informaci on a priori para identicar. La mayor a de las aplicaciones fueron llevadas a cabo sobre sistemas multivariables incluyendo restricciones. Los algoritmos utilizados fueron principalmente el IDCOM (Identication-Command) y el DMC (Control con Matriz Din amica, Dynamic Matrix Control). Independientemente fue surgiendo otra l nea de trabajo en torno a las ideas del control adaptativo, desarrollando estrategias esencialmente para procesos monovariables formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del Controlador de M nima Varianza y se desarroll o el Control Predictivo Generalizado (Generalized Predictive Control GPC) que es uno de los m etodos m as populares en la actualidad.
Fundamentos
optimo de operaci on. La inclusi on de restricciones es quiz as la caracter stica que m as distingue al MPC respecto a otras metodolog as. xito Otra de las razones que han contribuido a que el MPC se haya convertido en un e comercial es el hecho de que existen unos 15 suministradores que instalan el producto llave en mano, con periodos de amortizaci on de entre 3 y 12 meses, permitiendo que medianas empresas puedan tener acceso a esta tecnolog a. Aparte de esto, los ericos nuevos Sistemas de Control Distribuido empiezan a ofertar productos MPC gen que ofrecen al usuario la posibilidad de realizar futuras modicaciones sin depender de un producto cerrado.
xito, tanto en la industria aplicaciones de controladores predictivos funcionando con e de procesos como en control de motores o Rob otica. El buen funcionamiento de estas aplicaciones muestra la capacidad del MPC para conseguir sistemas de control de elevadas prestaciones capaces de operar sin apenas intervenci on durante largos per odos de tiempo. etodos, entre las que destacan: El MPC presenta una serie de ventajas sobre otros m Resulta particularmente atractivo para personal sin un conocimiento profundo de control, puesto que los conceptos resultan muy intuitivos, a la vez que la sintonizaci on es relativamente f acil. Puede ser usado para controlar una gran variedad de procesos, desde aqu ellos con din amica relativamente simple hasta otros m as complejos incluyendo sistemas con grandes retardos, de fase no m nima o inestables. Permite tratar con facilidad el caso multivariable. Posee intr nsecamente compensaci on del retardo. Resulta conceptualmente simple la extensi on al tratamiento de restricciones, que pueden ser incluidas de forma sistem atica durante el proceso de diseno. cuando se conocen las futuras referencias (rob Es muy util otica o procesos en batch). Es una metodolog a completamente abierta basada en algunos principios b asicos que permite futuras extensiones. Pero, l ogicamente, tambi en presenta inconvenientes. Unos de ellos es la carga de c alculo necesaria para la resoluci on de algunos algoritmos. Pero quiz as el mayor inconveniente venga marcado por la necesidad de disponer de un modelo apropiado del proceso. El algoritmo de diseno est a basado en el conocimiento previo del modelo y es ste, pero resulta evidente que las prestaciones obtenidas depender independiente de e an de las discrepancias existentes entre el proceso real y el modelo usado.
Fundamentos
u(t+k|t) u(t)
^ y(t+k|t) y(t) N
t-1
t+1
...
t+k
...
t+N
Figura 1.2: Estrategia del Control Predictivo salidas predichas, y (t + k j t)1 para k = 1 : : : N dependen de los valores conocidos hasta el instante t (entradas y salidas pasadas) y de las senales de control futuras u(t + k j t), k = 0 : : : N ; 1 que se pretenden mandar al sistema y que son las que se quieren calcular. 2. El conjunto de senales de control futuras se calcula optimizando un determinado criterio en el que se pretende mantener el proceso lo m as pr oximo posible a la trayectoria de referencia w (t + k ) (que puede ser directamente el setpoint o una ste). Este criterio suele tomar la forma de una funci suave aproximaci on a e on cuadr atica de los errores entre la salida predicha y la trayectoria de referencia tambi en predicha, incluyendo en muchos casos el esfuerzo de control. Si el criterio es cuadr atico, el modelo lineal y no existen restricciones se puede obtener una soluci on expl cita, en otro caso se debe usar un m etodo iterativo de optimizaci on. Adicionalmente se hace alguna suposici on sobre la estructura de la ley de control futura, como por ejemplo que va a ser constante a partir de cierto instante. 3. La senal de control u(t j t) es enviada al proceso mientras que las siguientes senales de control calculadas son desechadas, puesto que en el siguiente instante de muestreo ya se conoce y (t + 1) y se repite el paso 1 con este nuevo valor y todas las secuencias son actualizadas. Se calcula por tanto u(t + 1 j t + 1) (que en on), haciendo principio ser a diferente al u(t + 1 j t) al disponer de nueva informaci uso del concepto de horizonte deslizante. Para llevar a cabo esta estrategia, se usa una estructura como la mostrada en la gura 1.3. Se hace uso de un modelo para predecir las salidas futuras del proceso,
1
10
Salidas predichas
Trayectoria de referencia + -
Modelo
Controles futuros
Optimizador
Errores futuros Funcion de coste Restricciones
Figura 1.3: Estructura b asica del MPC bas andose en las futuras senales de control propuestas. Estas senales son calculadas por el optimizador teniendo en cuenta la funci on de coste (donde aparece el futuro error de seguimiento) as como las restricciones. Por tanto el modelo juega un papel decisivo en el controlador. El modelo elegido debe ser capaz de capturar la din amica del proceso para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo de usar y de comprender. El optimizador es otra parte fundamental de la estrategia pues proporciona las acciones de control. Si la funci on de coste es cuadr atica, el m nimo se puede obtener como una funci on expl cita de las entradas y salidas pasadas y de la trayectoria de referencia. Sin embargo, cuando existen restricciones de desigualdad la soluci on debe ser calculada por m etodos num ericos con m as carga de c alculo.
2.1.1
Modelo de predicci on
La piedra angular del MPC es el modelo; un diseno completo debe incluir los mecanismos necesarios para la obtenci on del mejor modelo posible, el cual debe ser lo sucientemente rico para capturar al maximo la din amica del proceso y debe ser capaz de permitir el c alculo de las predicciones a la vez que sea intuitivo y permita un an alisis te orico. El uso del modelo del proceso viene determinado por la necesidad del c alculo de la salida predicha en instantes futuros y (t + k j t). Las diferentes estrategias de MPC pueden usar distintos modelos para representar la relaci on de las salidas con las entradas medibles, algunas de las cuales ser an variables manipuladas y otras se pueden considerar como perturbaciones medibles, que pueden ser compensadas por feedforward. Adem accion as se tendr a en cuenta un modelo de las perturbaciones, para intentar describir el comportamiento que no aparece reejado en el modelo del proceso, englob andose aqu el efecto de las entradas no medibles, el ruido y los errores de modelado. 11
12
Elementos b asicos
Para el estudio se puede separar el modelo en dos partes: el modelo del proceso propiamente dicho y el modelo de las perturbaciones. Cualquier m etodo usar a ambas partes para la predicci on. Modelo del Proceso Casi todas las formas posibles de modelar un proceso aparecen en alguna formu de MPC siendo las m lacion as usadas las siguientes: Respuesta impulsional. Tambi en conocida por secuencia de ponderaci on o modelo de convoluci on. La salida viene relacionada con la entrada por la ecuaci on
y(t) =
1 X
i=1
hiu(t ; i)
donde hi son los valores muestreados obtenidos al someter al proceso a un impulso unitario de amplitud igual al per odo de muestreo (ver gura 2.1a). Esta suma es truncada y s olo se consideran N valores (por tanto s olo permite representar procesos estables y sin integradores), teniendo
y(t) =
N X i=1
hi u(t ; i) = H (z;1)u(t)
(2
:1)
donde H (z ;1 ) = h1 z ;1 + h2 z ;2 + + hN z ;N . Un inconveniente de este m etodo es el gran numero de par ametros que necesita, ya que N suele ser un valor elevado (del orden de 40-50). La predicci on vendr a dada por:
y (t + k j t) =
N X i =1
hi u(t + k ; i j t) = H (z;1)u(t + k j t)
Este m etodo es ampliamente aceptado en la pr actica industrial debido a que es muy intuitivo y no requiere informaci on previa sobre el proceso, con lo que el procedimiento de identicaci on se simplica, a la vez que permite describir f acilmente din amicas complejas como fase no m nima o retardos. Respuesta ante escal on. Es muy similar al anterior s olo que ahora la senal de entrada es un escal on. Para sistemas estables se tiene la respuesta truncada que ser a N X y(t) = y0 + gi 4 u(t ; i) = y0 + G(z;1)(1 ; z;1 )u(t) (2:2) i=1 donde las gi son los valores muestreados ante la entrada en escal on y 4u(t) = u(t) ; u(t ; 1), segun se muestra en la gura 2.1b. El valor de y0 puede tomarse 0 sin p erdida de generalidad, con lo cual el predictor ser a:
y (t + k j t) =
N X i=1
gi 4 u(t + k ; i j t)
Controladores predictivos
13
h2
h1
hi
y(t)
hN
y(t)
g1
t+1 t+2
a)
...
g2
t+N
t+1 t+2
b)
...
Figura 2.1: Respuesta impulsional y ante escal on Funci on de transferencia. Se utiliza el concepto de funci on de transferencia G = B=A con lo que la salida viene dada por:
A( z ; 1 ) B (z ;1 )
= =
B (z ;1 ) y (t + k j t) = A(z;1 ) u(t + k j k)
Esta representaci on es v alida tambi en para procesos inestables y posee la ventaja de necesitar pocos par ametros, aunque es fundamental un conocimiento a priori del proceso sobre todo en cuanto al orden de los polinomios A y B . Espacio de estados. Tiene la siguiente representaci on:
x(t) = Ax(t ; 1) + Bu(t ; 1) y(t) = Cx(t) siendo x el estado y A, B y C las matrices del sistema, de entrada y de salida y (t + k j t) = C x (t + k j t) = C Ak x(t) +
k X Ai;1Bu(t + k ; i j t)] i=1
t+N
14
Elementos b asicos
Posee la ventaja de que sirve tambi en para sistemas multivariables a la vez que permite analizar la estructura interna del proceso (aunque a veces los estados obtenidos al discretizar no tienen ning un signicado f sico). Los c alculos pueden ser complicados, con la necesidad adicional de incluir un observador si los estados no son accesibles. Modelo de las perturbaciones
De tanta importancia como la elecci on de un determinado modelo del proceso es la elecci on del modelo utilizado para representar la perturbaciones. Un modelo bastante extendido es el Autorregresivo Integrado de Media M ovil (Auto-Regressive and Integrated Moving Average, ARIMA), en el que las perturbaciones, es decir, las diferencias entre la salida medida y la calculada por el modelo vienen dadas por
(z ;1 )e(t) n(t) = C D (z ;1 )
donde el polinomio D (z;1 ) incluye expl citamente el integrador 4 = 1 ; z;1 , e(t) es un ruido de media cero y normalmente el polinomio C se considera igual a uno. Este modelo se considera apropiado para dos tipos de perturbaciones: cambios aleatorios ocurridos en instantes aleatorios (por ejemplo cambio en la calidad del material) y movimiento browniano (en procesos con balance de energ a) y es usado en varios m etodos. N otese que al incluir un integrador se consigue un control con error nulo en r egimen permanente (offset-free). Como caso particular del ARIMA se puede incluir la perturbaci on constante
uf (t ; j ) uf (t + j )
= =
Controladores predictivos
15
La senal uc (t) vale cero en el pasado y corresponde a las senales de control en los instantes futuros:
uc(t ; j ) uc(t + j )
= =
0 para j
0 1 2
La predicci on de la secuencia se salida se separa en dos partes, como se ve en la gura 2.2. Una de ellas (yf (t)), la respuesta libre, corresponde a la predicci on de la salida cuando la variable manipulada se hace igual a uf (t), y la otra, la repuesta forzada (yc (t)), corresponde a la predicci on de la salida cuando la senal de control es uc (t). La respuesta libre corresponde a la evoluci on del proceso debido a su estado actual (incluido por tanto el efecto de acciones pasadas) mientras que la respuesta forzada es la debida a las acciones de control futuras.
u y
Process
uc
y f
yc
2.1.2
Funci on objetivo
Los diversos algoritmos de MPC proponen distintas funciones de coste para la obtenci on de la ley de control. En general se persigue que la salida futura en el horizonte considerado siga a una determinada senal de referencia al mismo tiempo que se puede penalizar el esfuerzo de control requerido para hacerlo. La expresi on general de tal funci on objetivo ser a:
J (N1 N2 Nu) =
N X
2
j =N1
( )
j y (t + j j t) ; w(t + j )]2 +
Nu X j =1
( )
4u(t + j ; 1)]2
(2
:3)
En algunos m etodos el segundo sumando, que considera el esfuerzo de control, no se tiene en cuenta, mientras que en otros tambi en aparecen directamente los valores de la senal de control (no sus incrementos). En la funci on de coste se pueden considerar:
16
Elementos b asicos
Par ametros: N1 y N2 son los horizontes m nimo y m aximo de coste (o de predicci on) y Nu es el horizonte de control, que no tiene por qu e coincidir con el horizonte m aximo, como se ver a posteriormente. El signicado de N1 y N2 resulta bastante intuitivo: marcan los l mites de los instantes en que se desea que la salida siga a la referencia. As , si se toma un valor grande de N1 es porque no importa que haya errores en los primeros instantes, lo cual provocar a una respuesta suave del proceso. N otese que para procesos con tiempo muerto d no a tiene sentido que N1 sea menor que dicho valor puesto que la salida no empezar a evolucionar hasta el instante t + d. Adem as, si el proceso es de fase no m nima, este par ametro permite eliminar de la funci on objetivo los primeros instantes de respuesta inversa.
Los coecientes (j ) y (j ) son secuencias que ponderan el comportamiento futuro. Usualmente se consideran valores constantes o secuencias exponenciales. Por ejemplo se puede conseguir un peso exponencial de (j ) a lo largo del horizonte usando: N2 ;j (j ) = Si est a comprendido entre 0 y 1 indica que se penaliza m as a los errores m as alejados del instante t que a los m as pr oximos, dando lugar a un control m as suave y con menor esfuerzo. Si, por el contrario, > 1 es que se penalizan m as los primeros errores, provocando un control m as brusco. Todos estos valores pueden ser usados como par ametros de sintonizaci on, obteniendo un abanico muy amplio de posibilidades con las que se puede cubrir una extensa gama de opciones, desde un control est andar hasta una estrategia disenada a medida para un proceso en particular. Trayectoria de referencia: Una de las ventajas del control predictivo es que si se conoce a priori la evoluci on futura de la referencia, el sistema puede empezar a reaccionar antes de que el cambio se haya efectivamente realizado, evitando los efectos del retardo en la respuesta del proceso. En muchas aplicaciones la evoluci on futura de la referencia r(t + k ) es conocida de antemano, como en Robotica, servos o procesos en batch; en otras aplicaciones aunque la referencia sea constante, se puede conseguir una sensible mejora de prestaciones simplemente conociendo el instante de cambio de valor y adelant andose a esa circunstancia. En el criterio de minimizaci on (2.3), la mayor a de los m etodos suelen usar una trayectoria de referencia w(t + k ) que no tiene por qu e coincidir con la referencia real. Normalmente ser a una suave aproximaci on desde el valor actual de la salida y(t) a la referencia conocida mediante un sistema de primer orden:
w(t) = y(t)
(2
:4)
es un par ametro comprendido entre 0 y 1 (mientras m as pr oximo a 1 m as suave ser a la aproximaci on) que constituye un valor ajustable que inuir a en la respuesta din amica del sistema. En la gura 2.3 se muestra la forma de la trayectoria cuando la referencia r (t + k) es constante y para dos valores distintos de ; para valores pequenos de este par ametro se tiene un seguimiento r apido
Controladores predictivos
17
(w1 ) mientras que si aumenta, la trayectoria de referencia ser a w2 dando lugar a una respuesta m as suave.
w2 (t+k)
Restricciones: En la pr actica, todos los procesos est an sujetos a restricciones. Los actuadores tienen un campo limitado de acci on as como una determinada velocidad de cambio (slew rate), como es el caso de las v alvulas, limitadas por las posiciones de totalmente abierta o cerrada y por la velocidad de respuesta. Razones constructivas, de seguridad o medioambientales o bien los propios alcances de los sensores pueden causar l mites en las variables de proceso, tales como niveles en depositos, caudales en tuber as o temperaturas y presiones m aximas. Adem as, normalmente las condiciones de operaci on vienen denidas por la intersecci on de ciertas restricciones por motivos fundamentalmente econ omicos, con lo que el sistema de control operar a cerca de los l mites. Todo lo expuesto anteriormente hace necesaria la introducci on de restricciones en la funci on a minimizar. Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo xito en la industria. Normalmente se considerar cual han tenido gran e an l mites en la amplitud y el slew rate de la senal de control y l mites en las salidas:
8t 8t 8t
con la adici on de estas restricciones a la funci on objetivo, la minimizaci on resulta m as compleja, no pudiendo obtenerse la soluci on anal ticamente como en el caso sin restringir.
18
2.1.3
Para obtener los valores u(t + k j t) ser a necesario minimizar la funcional J de la ecuaci on (2.3). Para ello se calculan los valores de las salidas predichas y (t + k j t) en funci on de valores pasados de entradas y salidas y de senales de control futuras, haciendo uso del modelo que se haya elegido y se sustituyen en la funci on de coste, obteniendo una expresi on cuya minimizaci on conduce a los valores buscados. Para el criterio cuadr atico si el modelo es lineal y no existen restricciones se puede obtener una soluci on anal tica, en otro caso se debe usar un m etodo iterativo de optimizaci on. De cualquiera de las maneras la obtenci on de la soluci on no resulta trivial pues existir an N2 ; N1 + 1 variables independientes, valor que puede ser elevado (del orden de 10 a 30). Con la idea de reducir estos grados de libertad se puede proponer cierta estructura a la ley de control. Adem as se ha encontrado que esta estructuraci on de la ley de control produce una mejora en la robustez y en el comportamiento general del sistema, debido fundamentalmente a que el hecho de permitir la libre evoluci on de las variables manipuladas (sin estructurar) puede conducir a senales de control de alta frecuencia no deseables y que en el peor de los casos podr an conducir a la inestabilidad. Esta estructura de la ley de control se plasma en el uso del concepto de horizonte de control (Nu), que consiste en considerar que tras un cierto intervalo Nu < N2 no hay variaci on en las senales de control propuestas, es decir:
4u(t + j ; 1) = 0
j > Nu
lo cual es equivalente a dar pesos innitos a las cambios en el control a partir de cierto instante. El caso l mite ser a considerar Nu igual a 1 con lo que todas las acciones futuras ser an iguales a u(t)1 .
Dynamic Matrix Control Este m etodo usa la respuesta ante escal on (2.2) para modelar el proceso, considerando los N primeros t solo erminos, asumiendo por tanto que el proceso es estable. En
Recu erdese que debido al horizonte deslizante, la senal de control se recalcula en el siguiente muestreo.
1
Controladores predictivos
19
cuanto a las perturbaciones, se considera que su valor permanence constante e igual al existente en el instante actual durante todo el horizonte, es decir, igual al valor medido de la salida (ym ) menos el estimado por el modelo y (t j t)).
n (t j t) = ym (t) ; y (t j t) (t + k j t) = n
y por tanto el valor predicho de la salida ser a:
y (t + k j t) =
k X i=1
gi 4 u(t + k ; i) +
N X i=k+1
gi 4 u(t + k ; i) + n (t + k j t)
donde el primer t ermino contiene las acciones de control futuras (que ser an calculadas), el segundo los valores pasados de las acciones de control (conocidas) y el ultimo representa las perturbaciones. La funci on de coste puede considerar s olo errores futuros o incluir tambi en el esfuerzo de control, en cuyo caso toma la forma gen erica (2.3). Una de las caracter sticas de este m etodo que lo ha hecho muy popular en la industria es la inclusi on de restricciones, que se traduce en inecuaciones de la forma gen erica:
N X i=1
j = 1 : : : Nc
En este caso la optimizaci on debe ser num erica y se lleva a cabo en cada periodo de muestreo, envi andose la senal u(t) y recalculando todo en el nuevo periodo de muestreo, como en todos los m etodos MPC. Los principales inconvenientes de este m etodo son el tamano del modelo empleado y la imposibilidad de tratar procesos inestables.
Model Algorithmic Control Este m etodo se conoce tambi en como Model Predictive Heuristic Control y el producto comercial se llama IDCOM (Identication-Command). Es muy similar al DMC con la diferencia principal de usar un modelo de respuesta impulsional (2.1). Introduce el concepto de trayectoria de referencia como un sistema de primer orden que evoluciona desde la salida actual al setpoint seg un una determinada constante de tiempo. La varianza del error entre esta trayectoria y la salida es lo que marca la minimizaci on de la funci on objetivo. Las perturbaciones se pueden tratar como en el m etodo anterior o se pueden estimar seg un la siguiente expresi on:
n (t + k j t) = n (t + k ; 1 j t) + (1 ;
)(
ym(t) ; y (t j t))
con n (t j t) = 0. es un par ametro ajustable (0 < 1) relacionado con el tiempo de respuesta, el ancho de banda y la robustez del bucle cerrado [7]. El m etodo tambi en considera restricciones en los actuadores, en las variables internas o en salidas secundarias.
20
Puntos de coincidencia
Figura 2.4: Puntos de coincidencia Predictive Functional Control Este controlador fue desarrollado por Richalet [18] para procesos r apidos. Emplea un modelo en el espacio de estados, por lo que permite el manejo de procesos inestables, y tambi en la extensi on al caso no lineal. Este esquema de control tiene dos caracter sticas que lo distinguen del resto de controladores de la familia: el uso de puntos de coincidencia y de funciones base. El concepto de puntos de coincidencia (ver gura 2.4) se emplea para simplicar los c alculos considerando s olo un subconjunto de puntos en el horizonte de predicci on hj , j = 1 : : : nH . La salida deseada y la predicha deben coincidir en dichos puntos, no en todo el horizonte de predicci on. La otra idea innovadora de este m etodo es la parametrizaci on de la senal de control como una combinaci on lineal de ciertas funciones base, que son elegidas seg un la naturaleza del proceso y la referencia:
u(t + k) =
nB X i=1
i (t)Bi (k)
Normalmente estas funciones son de tipo polin omico: escalones (B1 (k ) = 1), rampas (B2 (k ) = k) o par abolas (B3 (k ) = k2 ), ya que la mayor a de referencias se pueden especicar como combinaci on de estas funciones. Con esta estrategia, un perl de entrada complejo se puede especicar usando un pequeno n umero de par ametros desconocidos i que son las inc ognitas del problema de minimizaci on. La funci on a minimizar es:
J=
nH X j =1
y (t + hj ) ; w(t + hj )]2
El algoritmo PFC tambi en puede manejar restricciones de m aximo y m nimo en la aceleraci on, que son pr acticas en aplicaciones de servocontrol.
Controladores predictivos
Extended Prediction Self Adaptive Control El algoritmo EPSAC usa un modelo de funci on de transferencia
21
A(z;1 )y(t) = B (z;1 )u(t ; d) + v(t) donde d es el retardo y v (t) la perturbaci on. Este modelo puede ampliarse para tratar perturbaciones medibles anadiendo un t ermino D (z;1 )d(t) para incluir efecto feedfor-
ward. La predicci on se obtiene seg un se muestra en [10] y la estructura de la ley de control es muy simple, ya que se considera que la senal de control permanecer a constante a partir del instante t (es decir, horizonte de control igual a 1): 4u(t + k ) = 0 para k > 0. Para obtener la senal de control de minimiza una funci on de coste de la forma: N X ;1 (t + k j t)]2 (k ) w (t + k ) ; P (z )y k=d donde P (z ;1 ) es un polinomio de diseno con ganancia unitaria y (k) es una secuencia de ponderaci on. La senal de control se puede calcular anal ticamente de la forma:
k=d
4u(t + k ; 1) = 0
o minimizar el esfuerzo de control
1<k
N ;d
J=
N ;d X k =0
u2(t + k)
y (t + N j t) = y (t) + F (z ;1 ) 4 y (t) + E (z ;1 )B (z ;1 ) 4 u(t + N ; d) donde E (z ;1 ) y F (z ;1 ) son polinomios que satisfacen la relaci on ;1 ;1 ;1 ;1 ;N F (z;1 )(1 ; z;1 ) (1 ; z ) = A(z )E (z )(1 ; z ) + z
22
con el grado de E igual a N ; 1. Una ventaja de este m etodo es que se puede encontrar f acilmente una soluci on expl cita, dada por
u(t) = u(t ; 1) +
0(
w(t + N ) ; y (t + N j t)) N ;d 2 P
k=0 i
siendo k el coeciente correspondiente a 4u(t + k) en la ecuaci on de predicci on. Por tanto la ley de control depende s olo de los par ametros del proceso y puede hacerse f acilmente adaptativa si se emplea un identicador en l nea. El unico coeciente de ajuste es el horizonte de predicci on N , lo cual simplica el uso pero proporciona poca libertad para el diseno. Obs ervese que no puede usarse trayectoria de referencia porque el error se considera s olo en un instante (t + N ), ni tampoco la ponderaci on del esfuerzo de control.
Generalized Predictive Control Este m etodo propuesto por Clarke et al. [5] emplea un modelo CARIMA (Controlled Auto-Regressive Integrated Moving Average) para la predicci on de la salida:
(t) A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1 ) e4
donde la perturbaci on viene dada por un ruido blanco coloreado por el polinomio ; 1 C (z ). Como en la pr actica es dif cil encontrar el verdadero valor de este polinomio, se puede emplear como par ametro de diseno para rechazo de perturbaciones o mejora de la robustez. La predicci on optima se lleva a cabo resolviendo una ecuaci on diof antica, lo cual puede hacerse ecazmente de forma recursiva. Este algoritmo, al igual que otros que usan el modelo de funci on de transferencia, se puede implementar f acilmente en forma adaptativa usando un algoritmo de identicaci on en l nea como los m nimos cuadrados recursivos.
GPC
usa una funci on de coste cuadr atica de la forma N2 Nu X X J (N1 N2 Nu) = (j ) y (t + j j t) ; w(t + j )]2 + j =N1 j =1
( )
4u(t + j ; 1)]2
donde las secuencia de ponderaci on (j ) y (j ) se eligen normalmente constantes o exponenciales y la trayectoria de referencia w (t + j ) se puede generar como una secuencia que empieza en el valor actual de la salida y tiende exponencialmente al setpoint. Las bases te oricas del algoritmo GPC has sido ampliamente estudiadas y se puede demostrar (ver [4]) que, para distintos conjuntos de par ametros, el algoritmo es estable ste. y que otros controladores como por ejemplo el dead beat son casos incluidos en e
Controladores predictivos
23
24
Estado de la tecnolog a
Optimalidad de la soluci on. Muchos paquetes proporcionan una soluci on sub optima para acelerar el c alculo. En algunos casos este procedimiento no est a justicado. Incertidumbres en el modelo. Normalmente no se tiene en cuenta la incertidumbre asociada a la identicaci on, sino que se desintoniza el controlador intentando aumentar la robustez. Perturbaci on constante. Aunque es la hip otesis m as sensata a priori, se podr a obtener una mejor realimentaci on si la distribuci on de la perturbaci on se estudiara con m as cuidado.
Tema 3 Algoritmos
En este tema se tratan en profundidad los dos algoritmos considerados m as representativos de las metodolog as existentes en Control Predictivo. Representan a las dos familias de controladores predictivos, una de origen claramente industrial y la otra m as acad emica.
3.1.1
Predicci on
El modelo de proceso que se emplea es el de respuesta temporal, considerando la perturbaci on como constante a lo largo del horizonte. El procedimiento para obtener la predicci on se describe a continuaci on. 25
y(t) =
1 X
i=1
gi 4 u(t ; i)
(t + k j t) = y
1 X
f (t + k) = ym(t) +
1 X
i=1
(3
:1)
Si el proceso es asint oticamente estable, los coecientes gi de la respuesta ante tienden a un valor constante despu escalon es de N periodos de muestreo, por lo que se puede considerar que gk+i ; gi 0 i>N y por tanto la respuesta libre se puede calcular como
f (t + k) = ym(t) +
N X i=1
Notese que si el proceso no es estable, entonces no existe N y no se puede calcular f (t + k) (aunque existe una generalizaci on en el caso de que la inestabilidad sea producida por integradores puros). (k
=
Ahora las predicciones se pueden calcular a lo largo del horizonte de predicci on 1 : : : p), considerando m acciones de control.
y (t + 1 j t)
g1 4 u(t) + f (t + 1)
Algoritmos
27
y (t + 2 j t) y (t + p j t)
. . .
=
g2 4 u(t) + g1 4 u(t + 1) + f (t + 2)
p X gi 4 u(t + p ; i) + f (t + p) i=p;m+1
... ...
. . . gp;m+1
g1
0 0 . . .
3 7 7 7 7 7 7 7 7 7 7 5
y ^ = Gu + f u y ^
(3
:2)
Obs ervese que est a formada por m (horizonte de control) columnas de la respuesta ante escal on apropiadamente desplazadas hacia abajo. es un vector de dimensi on p que contiene las predicciones de la salida, representa el vector de incrementos de control y es el vector de respuestas libres. Esta es la expresi on que relaciona las respuestas futuras con los incrementos en las senales de control, por lo que usar a para calcular las acciones necesarias para conseguir el comportamiento deseado del sistema.
3.1.2
Perturbaciones medibles
El efecto de las perturbaciones medibles se puede anadir f acilmente a las anteriores stas se pueden tratar como entradas al sistema. La ecuaciones de predicci on, ya que e expresi on (3.2) se puede usar para calcular la predicci on del efecto de las perturbaciones en la salida de la siguiente forma:
y ^d = Dd + fd
donde d es la contribuci on de las perturbaciones medibles a la salida, es una matriz similar a que contiene los coecientes de la respuesta del sistema a un escal on en la perturbaci on, es el vector de incrementos en la perturbaci on y d es la parte de la respuesta que no depende de la perturbaci on.
y ^
En el caso m as general de perturbaciones medibles y no medibles, la respuesta libre completa del sistema (la fracci on de la salida que no depende de la variable manipulada)
28
se puede considerar como la suma de cuatro efectos: la respuesta a la entrada u(t), a la perturbaci on medible d(t), a la perturbaci on no medible y al estado actual del proceso:
f = fu + D d + fd + fn
Por tanto la predicci on se puede expresar en la forma general
y ^ = Gu + f
3.1.3 Algoritmo de control
xito en la industria del DMC se ha debido principalmente a su aplicaci El e on a sistemas multivariables de gran dimensi on con la consideraci on de restricciones. En esta secci on se describe el algoritmo de control comenzando por el caso m as simple de un sistema monovariable sin restricciones y extendi endolo posteriormente al caso general multivariable con restricciones. El objetivo del controlador DMC es llevar el proceso los m as cerca posible al setpoint en el sentido de m nimos cuadrados con la posibilidad de incluir una penalizaci on en los movimientos de la senal de control. Por ello se seleccionan las variables manipuladas de forma que minimicen un objetivo cuadr atico que puede incluir s olo los errores futuros p
J=
y (t + j j t) ; w(t + j )]2
m X j =1
J=
p X j =1
y (t + j j t) ; w(t + j )]
4u(t + j ; 1)]2
T, Si no existen restricciones, la minimizaci on de la funci on de coste J = T + donde es el vector de errores futuros a lo largo del horizonte de predicci on y es el vector de futuros incrementos en la senal de control 4u(t) : : : 4u(t + m), se puede hacer de forma anal tica calculando la derivada de J y haci endola igual a 0, lo que proporciona el resultado general:
ee
uu
u = (GT G + I ); GT (w ; f )
1
(3
:3)
Recu erdese que, como en todas las estrategias predictivas, s olo se env a al proceso el primer elemento del vector (4u(t)). No es aconsejable implementar la secuencia completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que provocan que la salida real diera de las predicciones que se emplean para calcular la
Algoritmos
w + K
-
29
u Proceso y
Figura 3.1: Ley de control secuencia futura de acciones de control. Adem as, el setpoint puede cambiar durante los pr oximos m intervalos. Resulta interesante analizar en qu e consiste realmente la ley de control. Analizando la expresi on 3.3 se observa que el primer elemento del vector u, que es la senal que efectivamente se env a a la planta, es el producto de la primera la de la matriz (GT G + I );1 GT (llam emosle K ) por la diferencia entre la trayectoria de referencia y la respuesta libre, que es el error futuro si no hubiera incrementos en la senal de control. Se puede decir por tanto que el incremento de la senal de control es proporcional (por medio de K ) a los errores futuros y por tanto habr a cambios en la senal de control siempre que el controlador detecte que va a haber una discrepancia en el futuro entre el objetivo deseado y el comportamiento esperado del sistema. Esta idea queda reejada en la gura 3.1.
El caso con restricciones Aunque computacionalmente m as complicado que otros algoritmos m as simples, la capacidad de manejar restricciones que posee este m etodo (y MPC en general) lo hace muy atractivo para aplicaciones pr acticas, ya que en general el punto de operaci on optimo seg un criterios econ omicos se encuentra normalmente en la intersecci on de las restricciones, como se muestra en la gura 3.2. Por razones de seguridad, es necesario mantener una zona segura alrededor del punto de operaci on, ya que el efecto de las perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona se puede reducir (y por tanto aumentar los benecios econ omicos) si el controlador es capaz de manejar restricciones (punto de operaci on 1). Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades de forma gen erica
N X i=1
j = 1 : : : Nc
30
Zona segura 1
Restriccion
Figura 3.2: Punto de operaci on optimo de un proceso t pico que deben tenerse en cuenta para la minimizaci on. Como se ha visto, las salidas se pueden expresar en funci on del vector de incrementos de control a trav es de la matriz din amica, por que las restricciones tanto en la entrada como en la salida se pueden , como se ver a con m as recoger en una desigualdad matricial de la forma detalle en el tema dedicado a restricciones. Ahora la minimizaci on es un problema de on es num erica. Programaci on Cuadr atica QP, cuya soluci
Ru
Todo lo relacionado con las restricciones ser a abordado con mayor grado de detalle en el tema dedicado a ello.
Extensi on al caso multivariable El esquema previo se puede extender f acilmente al caso de sistemas con varias entradas y varias salidas. Las ecuaciones b asicas se mantienen igual a excepci on de que las matrices y vectores cambian de dimensi on para poder incluir todas las entradas y salidas. Al tratarse de modelos lineales, se puede aplicar el principio de superposici on para obtener el valor de las salidas ante las diversas entradas. Para ello se dene el vector de salidas futuras como:
u = [4u (t) : : : 4u (t + m
1 1
; 1)
:::
4unu(t)
:::
teniendo en cuenta que la respuesta libre de la salida i depende tanto de valores pasados de yi como de valores pasados de todas las senales de control.
Algoritmos
31
Con estas deniciones, la ecuaci on de predicci on es igual que en el caso monovariable simplemente considerando que la matriz G toma la forma:
2 G G 11 12 6 G G 6 21 22 6 . . 6 . . 4 . . Gny1 Gny2
...
. . . Gnynu
G1nu G2nu
3 7 7 7 7 5
Cada submatriz Gij contiene los coecientes de la respuesta ante escal on i- esima correspondiente a la entrada j- esima. El proceso de minimizaci on es an alogo s olo que la ponderaci on tanto de los errores como de los esfuerzos de control se realiza con matrices de peso.
32
3.2.1
La mayor a de los procesos de una sola entrada y una sola salida (single-input singleoutput, SISO), al ser considerados en torno a un determinado punto de trabajo y tras ser linealizados, pueden ser descritos de la siguiente forma:
= = =
1 + a1 z ;1 + a2 z ;2 + ::: + ana z ;na b0 + b1 z;1 + b2 z;2 + ::: + bnbz;nb 1 + c1 z ;1 + a2 z ;2 + ::: + cncz ;nc
donde d es el tiempo muerto del sistema. Este modelo es conocido como Autorregresivo de Media M ovil (Controller AutoRegressive Moving-Average CARMA). En muchas aplicaciones industriales en las que las perturbaciones son no-estacionarias resulta m as conveniente el uso de un modelo CARMA integrado, dando lugar al CARIMA, que viene descrito por:
(t) A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1) e4
con
4 = 1 ; z;1
(3
:4)
Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. N otese que en el caso de que C ;1 pueda ser truncado se puede absorber en A y B . El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia de senales de control que minimice una funci on de coste de la forma:
J (N1 N2 Nu) =
N X
2
j =N1
( )
j y (t + j j t) ; w (t + j )]
Nu X j =1
( )
4u(t + j ; 1)]2
(3
:5)
donde y (t + j j t) es la predicci on optima j pasos hacia delante de la salida del proceso con datos conocidos hasta el instante t, N1 y N2 son los horizontes m nimo y m aximo de coste, Nu es el horizonte de control y (j ) y (j ) son las secuencias de ponderaci on mientras que w(t + j ) es la futura trayectoria de referencia, que se puede calcular seg un se muestra en la gura 2.3. En muchas situaciones se considera (j ) igual a 1 y (j ) constante. El objetivo es pues el c alculo de la futura secuencia de control u(t), u(t + 1),... de tal manera que la salida futura del proceso y (t + j ) permanezca pr oxima a w (t + j ). Esto se logra minimizando J (N1 N2 Nu).
Algoritmos
Predicci on optima
33
Con la intenci on de minimizar la funci on de coste, se obtendr a previamente la pre N1 y j N2. Consid erese la siguiente ecuaci on dicci on optima de y (t + j ) para j diof antica: 1 = Ej (z ;1 ) 4 A + z ;j Fj (z ;1 ) + z ;j Fj (z ;1 ) 1 = Ej (z ;1 )A (3.6)
Los polinomios Ej y Fj est an unicamente denidos con grados j ; 1 y na respec (z ;1 ) hasta que el resto pueda tivamente. Se pueden obtener dividiendo 1 entre A ; j ; 1 on es entonces el polinomio ser factorizado como z Fj (z ). El cociente de la divisi ; 1 Ej (z ). Si se multiplica la ecuaci on (3.4) por Ej (z ;1 ) z j 4 (z ;1 )Ej (z ;1 )y (t + j ) = Ej (z ;1 )B (z ;1 ) 4 u(t + j ; d ; 1) + Ej (z ;1 )e(t + j ) A
(3.7)
(3
Al ser el grado del polinomio Ej (z ;1 ) igual a j ; 1 los t erminos del ruido en la ecuaci on (3.8) est an todos en el futuro. La mejor predicci on de y (t + j ) ser a por consiguiente:
Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursivamente, de forma que los nuevos valores en el paso j + 1 (Ej +1 y Fj +1) sean funci on de los del paso j . A continuaci on se muestra una demostraci on simple de la recursividad an basadas en de la ecuaci on diof antica. Existen otras formulaciones del GPC que no est la recursividad de esta ecuaci on. (z ;1 ) Consid erense que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A hasta que el resto haya sido factorizado como z;j Fj (z ;1 ) . Con:
Fj (z;1 ) Ej (z;1 )
= =
fj 0 + fj 1z;1 + ej 0 + ej 1z;1 +
fj naz;na ;(j;1) + ej j ;1 z
+
34
Supongase que se utiliza el mismo procedimiento para obtener Ej +1 y Fj +1, es decir, (z ;1 ) hasta que el resto se pueda factorizar como z;(j +1) Fj +1 (z ;1 ) con dividir 1 entre A
fj+1 naz;na
Est a claro que solamente es necesario dar un paso m as en la divisi on para obtener los polinomios Ej +1 y Fj +1 . Al ser Ej +1 el nuevo cociente de la divisi on, ser a igual al cociente que hab a hasta el momento (Ej ) m as un nuevo t ermino, que ser a el fj 0 pues el divisor (A) es monico. Por tanto:
con ej +1 j
fj 0
Teniendo en cuenta que el nuevo resto ser a el resto anterior menos el producto del cociente por el divisor, los coecientes del polinomio Fj +1 se pueden expresar como:
na
1, F1
) z(1 ; A
=
fj 0
f j i + 1 ; fj 0 a i+1 i = 0
para i = 0
nb
Para resolver el GPC es necesario obtener el conjunto de senales de control u(t), u(t + 1), ...,u(t + N ) que minimizan la ecuaci on (3.5). Al tener el proceso un retardo de d per odos de muestreo, la salida s olo se ver a inuenciada por la senal u(t) despu es del instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes pueden ser denidos como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido hacer N1 < d + 1 ya que los t erminos de (3.5) s olo depender an de las senales de control pasadas. Por otro lado, haciendo N1 > d + 1 los primeros puntos de la secuencia de salida, que ser an los mejor estimados, no se tendr an en cuenta.
Algoritmos
El conjunto de las j predicciones optimas: (t + d + 1 j t) y y (t + d + 2 j t)
= =
35
(t + d + N j t) y
. . .
=
Gd+1 4 u(t) + Fd+1 y(t) Gd+2 4 u(t + 1) + Fd+2 y(t) Gd+N 4 u(t + N ; 1) + Fd+N y(t)
1 1
(3
:9)
Donde
y G G0(z; )
1
F( z ; )
1
Al depender los ultimos t erminos de la ecuaci on (3.9) s olo del pasado, pueden agruparse en f, dando lugar a: = + (3:10)
y Gu f
Obs ervese que es la misma expresi on que se obtuvo para el caso la respuesta libre es distinta.
DMC,
aunque en este
Gu f w Gu f w) + uT u
(3
:11)
36 donde:
w = w(t + d + 1) w(t + d + 2)
La ecuaci on (3.11) se puede poner como:
w(t + d + N )
iT
(3.12)
J=1 uT Hu + bu + f0 2
donde:
(3
:13)
H b f
0
= = =
2( T + ) 2( ; )T T ( ; ) ( ;
GG I f w G f w f w)
:14)
El m nimo de J , siempre que no existan restricciones en la senal de control, puede ser calculado igualando a cero el gradiente de J , lo cual conduce a:
u = ;H; bT
1
(3
Debido al uso de la estrategia deslizante, s olo se aplica realmente el primer elemento del vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo. La soluci on propuesta involucra la inversi on (o al menos la triangularizaci on) de una matriz de dimensi on N N , lo cual conlleva una gran carga de c alculo. El concepto ya usado en otros m etodos de horizonte de control se emplea con la nalidad de reducir la cantidad de c alculo, asumiendo que las senales de control permanecer an en un valor constante a partir del intervalo Nu < N . Por tanto la dimensi on de la matriz que hay que invertir queda reducida a Nu Nu, quedando la carga de c alculo reducida (en el caso l mite de Nu = 1, se reduce al caso escalar) aunque restringiendo la optimalidad.
3.2.2
Ejemplo de c alculo
Se presenta a continuaci on un ejemplo de c alculo de un Controlador Predictivo Generalizado en un caso sencillo. Se disenar a el controlador para un sistema de primer orden. Al discretizar el proceso continuo se obtiene el siguiente equivalente discreto:
(1 + (t) az;1 )y(t) = (b0 + b1 z;1 )u(t ; 1) + e4
Se va a considerar un retardo d igual a 0 y un polinomio de ruido C (z;1 ) igual a 1. Se usar a el algoritmo descrito previamente para obtener la ley de control, obteniendo resultados num ericos para valores de los pa ametros a = 0:8, b0 = 0:4 y b1 = 0:6, siendo
Algoritmos
37
los horizontes N1 = 1 y N = Nu = 3. Como se ha mostrado, se calcular an los valores predichos de la salida del proceso en el horizonte haciendo uso de la ecuaci on (3.9), obteniendo la ley de control de la expresi on (3.14). Resolviendo la ecuaci on (3.6) se obtienen los polinomios del predictor 1 ; Fj (z ) desde j = 1 hasta j = 3, con (z ;1 ) = A(z ;1 )(1 ; z ;1 ) = 1 ; 1:8z ;1 + 0:8z ;2 A
Ej (z;1 ),
En este caso sencillo donde el horizonte no es demasiado largo, estos polinomios se (z ;1 ). Como se ha explicado antes, pueden obtener directamente dividiendo 1 por A tambi en se pueden calcular recursivamente, comenzando con los valores obtenidos en el primer paso de la divisi on, es decir:
E1 (z;1 ) = 1
ser:
E2 = 1 + 1:8z;1 F2 = 2:44 ; 1:44z;1 E3 = 1 + 1:8z;1 + 2:44z;2 F3 = 2:952 ; 1:952z;1 Con estos valores y el polinomio B (z;1 ) = 0:4 + 0:6z ;1 , los elementos Gi (z ;1 ) resultan G1 = 0:4 + 0:6z;1 G2 = 0:4 + 1:32z;1 + 1:08z;2 G3 = 0:4 + 1:32z;1 + 2:056z;2 + 1:464z;3
y por tanto se pueden escribir las salidas predichas como:
3 2 y (t + 1 j t) 6 (t + 2 j t) 7 5 4y y (t + 3 j t)
2 3 32 0:4 0 0 4u(t) 6 4 1:32 0:4 0 7 5+ 56 4 4u(t + 1) 7 2:056 1:32 0:4 4u(t + 2) 2 3 0:6 4 u(t ; 1) + 1:8y (t) ; 0:8y (t ; 1) 6 4 1:08 4 u(t ; 1) + 2:44y(t) ; 1:44y(t ; 1) 7 5 | 1:464 4 u(t ; 1) + 2:952 {z y(t) ; 1:952y(t ; 1) }
f
primera la de la matriz, con lo que resulta la siguiente expresi on para la ley de control:
2 3 0:133 0:286 0:147 7 T ;1 T 6 (G G + I) G = 4 ;0:154 ;0:165 0:286 5 ;0:029 ;0:154 0:1334 Como s olo se necesita el valor de 4u(t) para los c alculos, s olo se emplea realmente la
4u(t)
= +
H; b. Tomando
1
38
donde w(t + i) es la trayectoria de referencia que se puede considerar bien constante sta. e igual a la referencia actual o bien una suave aproximaci on de primer orden a e Entonces la senal de control resulta ser una funci on de la referencia deseada y de entradas y salidas pasadas, dada por:
u(t)
= +
Al mismo resultado se puede llegar sin emplear la ecuaci on diof antica, calculando G en base a los coecientes de la respuesta ante escal on (que se pueden calcular en funci on de los coecientes de la funci on de transferencia) y calculando la respuesta libre como se muestra en [2].
3.2.3
Caso multivariable
Al igual que en el DMC todo lo visto para el caso de sistemas con una sola entrada y una sola salida se puede extender al caso multivariable, aunque los c alculos son m as complejos. En este caso el modelo CARIMA para un sistema de m entradas y n salidas se puede expresar como: 1 ;1 ;1 ;1 (z )e(t) (z )y (t) = (z )u(t ; 1) + (3:15) 4 donde (z ;1 ) y (z ;1 ) son matrices polinomiales m onicas de dimensi on n es una matriz polinomial de dimensi on n m, denidos como:
n y B(z;1)
La predicci on conlleva la resoluci on de una ecuaci on diofantina matricial, que tambi en puede calcularse de forma recursiva.
In n + A1 z;1 + A2z;2 + + Ana z;na 1 ;1 + B2z;2 + + Bnb z;nb = B0 + B1 z 1 ;1 + C2z;2 + + Cnc z;nc = In n + C1 z Las variablesy (t), u(t) y e(t) son de dimensi on n 1, m 1 y n 1 respectivamente.
1
En muchas ocasiones el problema radica en la obtenci on adecuada del modelo en esta forma a partir de una matriz de transferencia en continuo que puede haberse obtenido a partir de la curva de reacci on. Una forma de hacerlo se muestra en [2]. Una vez obtenido el modelo, el criterio a minimizar tendr a la forma general
J (N1 N2 N3 ) =
N X
2
j =N1
ky (t + j j t) ; w (t + j )k2 R+
N X
3
j =1
k 4 u(t + j ; 1)k2 Q
Algoritmos
39
donde R y Q son matrices de ponderaci on denidas positivas que normalmente se eligen diagonales. La minimizaci on se realiza igual que en el caso monovariable dando como resultado un vector de senales de control a enviar a la planta en el instante actual: u1(t), u2(t) : : : um(t).
40
42
P Pmax P1 P2
Q1 Q2
Figura 4.1: Restricciones y punto de operaci on optimo se calculan. Esta forma de proceder no garantiza el car acter optimo de la soluci on y en caso garantiza el cumplimiento de las restricciones en la salida. La violaci ningun on de los l mites de las variables controladas puede ser m as costoso y peligroso, produciendo danos en equipos y p erdidas en la producci on. La gura 4.2 muestra con claridad el fen omeno de p erdida de la soluci on optima cuando las variables manipuladas se mantienen en sus l mites por el programa de control o por el propio actuador. Este hecho puede llevar a valores mayores de la funci on objetivo y a un comportamiento no deseado (incluso inestabiliad). En 4.2a se muestra un caso con horizonte de control igual a 2, donde se observa que si se satura la senal de control u(t) a umax el valor de la funci on de coste no es el mejor que se podr a conseguir (que ser a el correspondiente a uc ). Incluso puede que no se viole la restricci on en el instante actual pero s en el futuro (gura 4.2b) con lo que la senal enviada al sistema (sin saturar) no es la mejor para el problema de dimensi on 2 que se est a optimizando.
43
u(t+1)
u(t+1)
u max
u max
uc u max
u u(t)
uc
u u max u(t)
a)
b)
Figura 4.2: Restricciones en la senal de control en funci on de las senales de control futuras y valores conocidos en el instante t. Cualquier controlador predictivo calcula la predicci on como:
y = Gu + f
por lo que tanto entradas como salidas se pueden expresar en funci on del vector de incrementos de la senal de control. Las restricciones que aparecen ser an b asicamente amplitud y velocidad de cambio en la senal de control y amplitud en la salida y se pueden expresar como:
U u y
U u y
8t 8t 8t
Para un proceso de m entradas y n salidas y restricciones en el horizonte restricciones se pueden expresar como:
N , las
1U 1u 1y
T u + u(t ; 1) 1
u Gu + f
1U 1u 1y
donde es una matriz de dimensi on (N n) m formada por N m m matrices identidad y T es una matriz triangular inferior por bloques cuyos elementos no nulos son matrices identidad de dimensi on m m. En forma condensada se pueden expresar como: (4:1)
Ru c
44 siendo
2 I N N 6 ; I 6 N N 6 6 T R=6 6 ;T 6 6 4 G
3 2 3 l u 7 6 7 ;l u 7 6 7 7 6 7 7 6 7 l U ; l u ( t ; 1 ) 7 6 7 c =6 7 ;l U + lu(t ; 1) 7 7 6 7 7 6 7 5 4 5 ly;f ;G ;l y + f
Aparte de las restricciones en amplitud, a la salida se le pueden aplicar otro tipo de restricciones de para forzar un determinado comportamiento temporal (movimiento dentro de una banda, comportamiento mon otono, evitar respuesta inicial inversa, etc.) como se muestra en [12], pudiendo expresarlas tambi en de la forma gen erica (4.1). Adem as de la clasicaci on en restricciones en la entrada y en la salida seg un a qu e tipo de variable se apliquen, se puede hacer otra clasicaci on atendiendo a la forma de tratarlas. As , se puede hablar de: Restricciones duras como aqu ellas que no se pueden violar bajo ning un concepto. En este grupo se incluyen las restricciones relacionadas con la operaci on segura del proceso. Restricciones blandas, que son aqu ellas que pueden ser violadas en un momento dado por no ser cruciales, pero la violaci on se penaliza en la funci on objetivo como un t ermino m as. Es una forma de relajar la restricci on.
u) Ru c
Es decir, el problema consiste en la minimizaci on de una funci on cuadr atica con restricciones lineales, lo que se conoce como Programaci on Cuadr atica, QP. En este caso no se puede encontrar una soluci on anal tica como en el caso sin restricciones, sino que hay que recurrir a m etodos iterativos. Resulta evidente que la carga de c alculo ser a considerable, ya que hay que encontrar la soluci on resolviendo el algoritmo iterativo en cada periodo de muestreo. Normalmente el esfuerzo est a justicado por el benecio econ omico obtenido al trabajar m as cerca del punto de operaci on optimo.
45
Para resolver el problema QP existen diversos algoritmos sucientemente probados. Una revisi on de estos m etodos se puede encontrar en [2]. Un problema asociado a la implementaci on del control con restricciones es el an alisis de la estabilidad del bucle cerrado. Como es necesario utilizar m etodos num ericos para resolver el problema de la optimizaci on, la ley de control resultante no se puede describir de forma expl cita, haciendo el problema muy dif cil de atacar mediante la teor a cl asica de control. En los ultimos anos se ha trabajado mucho sobre la estabilidad en estas circunstancias, proponi endose soluciones basadas en la teor a de Lyapunov. La idea b asica consiste en que la funci on de coste cuando el horizonte es innito es mon otona decreciente (si existe soluci on factible) y se puede interpretar como funci on de Lyapunov que garantiza por tanto la estabilidad. Sin embargo, como la soluci on tiene que ser num erica, el numero de variables de decisi on tiene que ser nito, por lo que se han propuesto dos ideas. En la primera, se descompone la funci on objetivo en dos partes: una con horizonte nito y restricciones y otra con horizonte innito y sin restricciones. La segunda idea es en esencia equivalente y consiste en imponer restricciones terminales al estado y usar un horizonte innito. En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las incertidumbres en el modelo y los temas asociados con la factiblidad.
46
Gesti on de restricciones
operaci on normal pueden producir problemas bajo ciertas circunstancias. Puede que una perturbaci on o cambio de referencia grande fuerce a una variable fuera de su l mite y sea imposible introducirla de nuevo en su zona permitida con senales de control de energ a limitada. En estos casos las restricciones se hacen temporalmente incompatibles. Las soluciones no factibles aparecen con mayor frecuencia en casos en que el optimo se encuentre cerca de las restricciones y el sistema est e sujeto a perturbaciones, llevando a la salida a "regiones prohibidas".
4.4.1
Los m etodos de gesti on de restricciones tratan de recuperar la factibilidad actuando sobre las restricciones seg un diferentes criterios. Los l mites de las restricciones se pueden considerar de los siguientes tipos: Limites sicos: nunca se pueden sobrepasar, principalmente por motivos de seguridad o por la propia construcci on de los equipos (p.ej. actuadores) Limites de operaci on: son jados por los operarios para mantener las condiciones nominales de funcionamiento. Se pueden sobrepasar bajo ciertas circunstancias Limites reales: son los que usa el algoritmo de control en cada instante. Son los que proporciona el gestor de restricciones, quien debe calcularlos de forma que nunca superen los limites f sicos. Es decir, el gestor de restricciones calcular a los l mites reales (los que se env an al algoritmo QP) en base a los l mites de operaci on pero sin salirse nunca de los l mites f sicos, seg un se observa en la gura 4.3. Se analizan a continuaci on posibles soluciones para este problema, que se pueden agrupar en:
47
Lmites fsicos
Figura 4.3: Gesti on de restricciones Desconexi on del controlador La forma m as sencilla de resolver de este tipo de problemas es pasar el controlador a posici on manual cuando aparecen las incompatibilidades de restricciones y volver a operaci on autom atica cuando se recupera la admisibilidad de la soluci on. Este m etodo, como se puede comprender tiene serias desventajas. Normalmente, cuando aparecen problemas de incompatibilidad de restricciones es porque el sistema en bucle cerrado se encuentra en un estado cr tico donde normalmente el operador tendr a muy poca experiencia en la operaci on. Adicionalmente, si las restricciones est an relacionadas con aspectos de seguridad o econ omicos, las decisiones llevadas a cabo cuando aparecen problem aticas de compatibilidad de restricciones suelen ser cr ticas dado que en estos casos alguno de los objetivos del control no puede ser satisfecho. El m etodo suele ser utilizado cuando los problemas de incompatibilidad de restricciones no son frecuentes.
Eliminaci on de restricciones La factibilidad se analiza en cada periodo de muestreo, por lo que la eliminaci on de restricciones se realiza de forma temporal. Peri odicamente se chequea la factibilidad para poder reinsertar restricciones eliminadas. La eliminaci on de un grupo de restricciones ha de realizarse en aquellos casos en que el conjunto completo de restricciones que se imponen sobre el sistema sea incompatible. Cada vez que existe un problema de incompatibilidad de restricciones, se forma un conjunto de restricciones no admisibles que no se tienen en cuenta en el proceso de
48
Gesti on de restricciones
Eliminaci on indiscriminada Con esta estrategia todas las restricciones se eliminan cada vez que aparezcan problemas de existencia de soluci on factible, quedando la optimizaci on de un problema sin restricciones. No es un m etodo muy optimo para resolver el problema de la existencia de soluci on admisible, pero es la forma m as r apida de tener en cuenta incompatibilidad de restricciones. La eliminaci on indiscriminada de restricciones no es adecuada en todas las aplicaciones. No debe ser por ejemplo usada en casos en que las restricciones est en directamente relacionadas con l mites de seguridad.
Eliminaci on jer arquica En este caso s olo se eliminan las restricciones que provocan problemas de incompatibilidad. En este m etodo se asigna en la etapa de diseno una prioridad a cada restricci on, que da un grado de importancia relativa de dicha restricci on frente a las otras. Esta prioridad se usar a para clasicar las restricciones de una forma jer arquica (se asigna un n umero que indica su posici on en la jerarqu a). De este modo, cada vez que haya problemas de factibilidad o existencia de soluci on el gestor de restricciones va eliminando por orden las restricciones menos prioritarias hasta que se restablece la factibilidad de la soluci on, que se chequea cada periodo de muestreo para reinsertar restricciones que hubieran sido temporalmente eliminadas. En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes tipos de reglas para establecer el n umero de restricciones que se eliminan, si conviene eliminar m as restricciones a costa de no eliminar una con prioridad superior, etc.
Relajaci on de restricciones Otro m etodo para tener en cuenta el problema de existencia de soluci on es la relajaci on de las restricciones. Se puede hacer una relajaci on de los l mites de forma temporal o convertir restricciones duras ( ), cambi andolas en restricciones blandas ( + , con 0) para asegurar la existencia de soluci on, anadiendo un t ermino T a la funci on de coste de forma que se penalice la violaci on de la restricci on y obtener un mejor comportamiento del sistema controlado. A largo plazo, el t ermino en la funci de penalizacion on objetivo llevar a las variables auxiliares a cero.
Ru c T
Ru
Otras t ecnicas Existen t ecnicas que se basan en la manipulaci on del horizonte m nimo de las restricciones. Algunos controladores industriales como el QDMC usan el concepto de constraint
49
window. La constraint window comienza en alg un punto en el futuro y contin ua hasta el estado estacionario. Si existe din amica del tipo de fase no m nima, se pueden mejorar las prestaciones desplazando la ventana hacia el futuro, lo que equivale a ignorar las restricciones duras en la salida durante la fase inicial de la respuesta.
50
Gesti on de restricciones
52
En muchas situaciones el objetivo de control no es minimizar la suma de errores, sino mantener ciertas variables dentro de unos l mites especicados. Esto es equivalente a las restricciones blandas. Este tipo de objetivo se puede expresar penalizando la cantidad que se sobrepasa cada variable del setpoint. Consid erese, por ejemplo, que el objetivo es mantener la variable y (t) entre sus l mites yl e yh . En este caso, el objetivo de control se puede escribir como: N2 N2 X X J = p(y(t + j ) ; yh) (y(t + j ) ; yh)2 + p(yl ; y(t + j )) (y(t + j ) ; yl )2 j =N1 j =N1 siendo p la funci on escal on (vale 1 cuando el argumento es mayor o igual que 0 y vale 0 en caso contrario). Notese que ahora la funci on objetivo no es cuadr atica y por tanto no se puede emplear para su minimizaci on un algoritmo de programaci on cuadr atica, aunque se puede transformar en uno de este tipo anadiendo unas variables de holgura h (j ) y l (j ) :
y(t + j ) yh + y(t + j ) yl ;
h (j ) h (j )
La secuencia optima de control se obtiene con la minimizaci on de N2 X J = ( h(j )2 + l (j )2) j =N1 con la condici on de que las variables de holgura sean no negativas (y el resto de las restricciones si las hubiera). En denitiva lo que se ha hecho es transformar el problema en un QP con m as restricciones y variables. En muchas ocasiones todos los objetivos de control se pueden agrupar en una sola funci on de coste. Algunos de los objetivos pueden ser mantener las variables lo m as cerca posible de los setpoints o dentro de unas determinadas regiones de operaci on. Cada uno de estos objetivos equivale a minimizar una cierta funci on Ji (sujeta a una serie de restricciones). Entonces la secuencia de control se puede obtener de la minimizaci on de: m
i Ji i=1 sujeta a todo el conjunto de restricciones. La importancia relativa de cada objetivo se puede ponderar mediante la adecuada elecci on de los i , aunque en la pr actica es dif cil encontrar estos pesos. Adem as, muchas veces los objetivos de control son cualitativos, m haciendo la tarea aun as dif cil.
J=
53
5.1.1
Jerarqu a de objetivos
En muchas situaciones, se puede establecer una importancia relativa de unos objetivos sobre otros por medio de una priorizaci on o jerarqu a. Es decir, los objetivos de mayor prioridad (por ejemplo los relacionados con la seguridad) se deben satisfacer antes que otros con menor prioridad. Aunque esto se puede resolver con ponderaciones, no es un asunto trivial. Tyler y Morari [20] proponen una forma de introducir m ultiples objetivos jerarquizados. Consid erese un proceso con m objetivos Oi jerarquizados (el Oi+1 tiene mayor prioridad que el Oi) que se pueden expresar como:
Riu ai
La idea consiste en introducir variables enteras Li que toman valor 1 cuando se satisface el correspondiente objetivo de control y cero en caso contrario. Los objetivos se expresan entonces como:
tiene que Li = 1 y el objetivo reformulado coincide con el original. Con la introducci on de Ki el objetivo reformulado se satisface incluso cuando el correspondiente objetivo Oi no lo hace (Li = 0). La jerarqu a de objetivos se puede establecer imponiendo las restricciones siguientes: Li ; Li+1 0 El problema es maximizar el n umero de objetivos de control satisfechos
Riu ai + Ki(1 ; Li) (5:1) donde Ki es una cota superior conservadora para Ri u ; ai . Si se cumple el objetivo i, se
PL .
i
Si el modelo del proceso es lineal el problema se puede resolver con Programaci on Lineal Entera Mixta (MILP). El conjunto de restricciones 5.1 se puede modicar para mejorar el grado de satisfacci on de restricciones de los objetivos que no pueden ser satisfechos. Sup ongase que no todos los objetivos se pueden satisfacer y que el Of es el primero que falla. Con la idea de acercarse todo lo posible a la satisfacci on de este objetivo se introduce una variable de holgura que cumpla el siguiente conjunto de restricciones: 0 1 i;1 X Lj A (5:2) i i + + Ki @(1 ; i) + (1 ; Li ) ; j =1
Ru a
Li + f ( ) i=1 donde f es una funci on de penalizaci on de la variable de holgura (positiva y mon otona creciente) y K es su cota superior. El algoritmo de optimizaci on intentar a maximizar
J = ;K
m X
54
el numero de objetivos satisfechos (Li = 1) antes de intentar reducir f ( ) porque la funci on objetivo global se puede hacer m as pequena incrementando el n umero de variables Li distintas de cero que reduciendo la funci on de penalizaci on. Como todos an satisfechos para i < f , las restricciones (5.2) tambi en se satisfacen. los objetivos Oi est Como Of es el primero que falla:
i;1 X i=1
Li = f ; 1 para i f
Es decir, el t ermino que multiplica a Ki es cero para i = f mientras que para ndices mayores es mayor que uno. Esto implica que todas las restricciones se satisfar an para i > f . La unica restricci on activa es f + . f
Ru a
O sea, el m etodo de optimizaci on intentar a optimizar el grado de satisfacci on del primer objetivo que falle s olo despu es de que todos los objetivos m as prioritarios se hayan satisfecho. N otese que Li = 0 no implica que el objetivo i- esimo no sea satisfecho, sino que indica que la restricci on correspondiente ha sido relajada. Si el modelo del proceso y la funci on de penalizaci on son lineales, el problema es del tipo MILP, pero si f () es cuadr atica se recurre a Programaci on Cuadr atica Entera Mixta (MIQP). Aunque existen algoritmos para Programaci on Mixta, el esfuerzo computacional es mucho mayor que el requerido para problemas LP o QP, por ello el n umero de objetivos debe ser pequeno para poder implementar el m etodo en tiempo real.
55
La complejidad de los c alculos necesarios para resolver el problema del control predictivo de procesos no lineales. La escasez de resultados de estabilidad y robustez.
En general los procesos industriales son no lineales, pero a un as la mayor a de las aplicaciones de control predictivo est an basadas en el uso de modelos lineales, del tipo de los vistos hasta ahora. Existen varias razones para ello: por un lado resulta relativamente f acil identicar modelos lineales a partir de datos del proceso, y por otro los modelos lineales dan buen resultado cuando el proceso opera en las cercan as del punto de trabajo nominal. En el sector petroqu mico, donde tiene lugar la mayor a de las aplicaciones de MPC, el objetivo es mantener el proceso en torno al estado estacionario (problema del regulador) m as que realizar frecuentes cambios de un punto de operaci on a otro (problema del servo) y por tanto un modelo lineal preciso es suciente. Adem as el uso de un modelo lineal junto con una funci on objetivo cuadr atica da lugar a un problema convexo de programaci on cuadr atica (QP) cuya soluci on est a sucientemente estudiada en la actualidad, existiendo diversos productos comerciales ables. La existencia de algoritmos que garanticen una soluci on que converja en un corto tiempo (menor que el periodo de muestreo) resulta crucial en procesos en los que interviene un gran n umero de variables. Sin embargo, existen situaciones en las que los efectos no lineales justican el uso de la tecnolog a NMPC. Estas situaciones entran dentro de las dos categor as siguientes:
Procesos fuertemente no lineales y sujetos a grandes perturbaciones, como por ejemplo el control de pH. Problemas de seguimiento de consigna en los que el punto de operaci on cambia con frecuencia y estos cambios sacan a relucir la din amica no lineal del proceso, como en el caso de la fabricaci on de pol meros.
En estas situaciones una ley de control lineal puede no ser efectiva siendo necesario el empleo de un controlador no lineal para mejorar el comportamiento o simplemente para una operaci on estable del proceso. Es por tanto en este caso donde se puede justicar el empleo de t ecnicas de NMPC. Aunque en la actualidad el n umero de reducido, el potencial es considerable, como se desprende del aplicaciones es aun informe de Qin y Badgwell [17], donde se observa que MPC no ha penetrado a un en campos donde las no linealidades son fuertes y el mercado exige frecuentes cambios del punto de operaci on; es aqu donde se espera el auge del NMPC.
56
5.2.1
Resulta evidente que la principal ventaja del NMPC frente al MPC radica en la posibilidad de abordar din amicas no lineales. A medida que aparecen nuevas herramientas que hacen posible la obtenci on y representaci on de modelos no lineales, bien a partir de primeros principios (leyes de conservaci on) o bien a partir de datos experimentales (modelos de Volterra o redes neuronales) el inter es por su utilizaci on en NMPC se va acrecentando. Aunque la extensi on de los conceptos de MPC al caso no lineal es directa, a la hora de realizar el controlador aparecen una serie de problemas a tener en cuenta, que dan lugar a una mayor dicultad en su implantaci on. Las principales dicultades derivadas del empleo de modelos no lineales son: La obtenci on de un modelo no lineal a partir de datos experimentales es un problema abierto. La utilizaci on de redes neuronales o series de Volterra no parecen solucionar el problema de forma general. Por otra parte, la obtenci on de modelos a partir de primeros principios no es siempre viable. El problema de optimizaci on es no convexo, cuya resoluci on es mucho m as dif cil que un problema de programaci on cuadr atica. Aparecen problemas relativos a la obtenci on del optimo global, lo que inuye no s olo en la calidad del control, sino tambi en en problemas relacionados con la estabilidad. La dicultad del problema de optimizaci on se traduce en un aumento considerable del tiempo de c alculo, hecho que puede dar lugar a que la aplicaci on de esta t ecnica quede restringida a un conjunto de sistemas con din amica lenta. El estudio de temas fundamentales como estabilidad o robustez se complica enormemente. Este tema constituye un campo abierto de gran inter es para los investigadores.
5.2.2
Fundamentos te oricos
Se puede denir un algoritmo gen erico NMPC que englobe a todas las t ecnicas que comparten las mismas ideas. El proceso (en general multivariable) se puede describir por un modelo en el espacio de estados de la forma:
x(t + 1) = f (x(t) u(t) d(t) w(t)) y(t) = g(x(t)) + e(t) donde x es el vector de estados de dimensi on n, u es el vector de mu entradas, d son las perturbaciones medibles y w(t)) las no medibles. El vector de salidas es y de dimensi on my , la misma que la del vector de ruidos de medida e.
57
El problema que hay que resolver es el c alculo de la secuencia de senales de control que llevan al proceso desde su estado actual al estado deseado s . El punto de trabajo deseado ( s , s , s ) viene en general determinado por una optimizaci on est atica basada normalmente en criterios econ omicos. Este punto de trabajo debe ser recalculado ptimo de periodicamente ya que las perturbaciones pueden hacer cambiar el punto o operaci on.
y x u
f , mientras que el resto se rechaza con la realimentaci on, normalmente considerando y(t + j ) = g(x(t + j )) + b(t)
M ;1 X j =1
donde
que la perturbaci on permanecer a constante a lo largo del horizonte. Esto se formalizar anadiendo un t ermino constante (bias) e igual al error entre medida y salida calculada a toda la predicci on:
El problema consiste en la minimizaci on de una funci on objetivo que de la forma m as gen erica ser a:
J=
P X j =1
y(t + j ) ; ys
kq
Q+
k 4 (t + j )kq S+
M ;1 X j =1
(5
:3)
2 segun el tipo de norma que se est donde q puede ser 1 o e utilizando y Q, S, R y T son matrices de ponderaci on. La minimizaci on estar a sujeta a la restricci on del modelo:
Obs ervese que se ha considerado la violaci on de las restricciones en la salida con el t ermino s, que entra en juego en la minimizaci on apareciendo en la funci on de coste con una penalizaci on dada por la matriz T. Igual que en caso lineal, la soluci on del problema es una secuencia de acciones de control de las cuales s olo la primera de ellas es enviada a la planta, desechando el resto y volviendo a la resolver el problema en el siguiente periodo de muestreo.
5.2.3
La resoluci on del NMPC plantea nuevos problemas que no exist an en el caso lineal relacionados por un lado con la metodolog a de c alculo de la senal de control y por otro con el comportamiento din amico del bucle cerrado, b asicamente su estabilidad.
58 Resoluci on
La introducci on de un modelo no lineal en el algoritmo de optimizaci on conduce a la p erdida de convexidad, no pudiendo ser resuelto por los algoritmos de programaci on cuadr atica (QP), para los cuales existen soluciones ables y sucientemente estudiadas. Esta p erdida de convexidad hace que sea mucho m as dif cil encontrar una soluci on y que, una vez encontrada, no se pueda garantizar que sea un optimo global. En estas circunstancias el tiempo de c alculo aumenta considerablemente debido principalmente a dos motivos Para la obtenci on de la secuencia de acciones de control optima, el paquete de programaci on no lineal debe evaluar repetidamente la funci on objetivo y en cada evaluaci on se debe resolver el sistema de ecuaciones no lineales que componen el modelo de predicci on, lo cual conlleva mucho tiempo de c alculo. A partir de los datos obtenidos a trav es de la evaluaci on de la funci on objetivo, el programa de optimizaci on debe calcular el gradiente de la funci on y los pr oximos puntos de busqueda, adem as de comprobar la violaci on o no de las restricciones y los criterios de nalizaci on del algoritmo. Estas tareas consumen m as tiempo de c alculo que en el caso lineal.
Estabilidad de la soluci on en el caso de El otro problema fundamental es el de la estabilidad de la soluci on. Aun que el algoritmo de minimizaci on encuentre la soluci on optima, este hecho no garantiza la estabilidad del bucle cerrado (incluso en el caso de que el modelo sea perfecto). Este problema ha sido abordado desde distintos puntos de vistos de vista, existiendo en la actualidad diferentes propuestas, las cuales se describen a continuaci on. 1. Horizonte innito Existe una soluci on propuesta por Meadows et al. ([13]) que consiste en ampliar los horizontes de control y de predicci on hasta el innito, P M ! 1. En este caso la funci on objetivo tambi en sirve como funci on de Lyapunov, dando lugar a la estabilidad nominal. En el art culo citado se demuestra que si existe soluci on inicial factible entonces existe soluci on en cada periodo de muestreo posterior. La idea b asica es que si el problema de minimizaci on es factible en el instante entonces la funci on de coste es nita y
59
A la hora de la verdad este concepto tiene principalmente un inter es teorico sobre el que basar un desarrollo pr actico, ya que no es viable una implementaci on con horizonte innito. Para llevarlo a la pr actica se puede tomar un horizonte lo sucientemente grande, pero esta elecci on no tiene por qu e garantizar la estabilidad, ya que las trayectorias de la entrada y el estado diferir an de las trayectorias predichas incluso si no hay incertidumbres ni perturbaciones. 2. Restricci on terminal Otra soluci on al problema, propuesta por Keerthi y Gilbert ([8]) consiste en anadir una restricci on terminal al estado en el algoritmo NMPC de la forma:
x(k + P ) = xs
Con la imposici on de esta restricci on, la funci on objetivo se convierte en una funci on de Lyapunov para el sistema en bucle cerrado, conduciendo a la estabilidad nominal. Con la introducci on de esta restricci on el estado al nal del horizonte nito es cero y por tanto tambi en lo ser a la senal de control, con lo que el sistema (sin perturbaciones) se queda para siempre en el origen. De esta forma es como si el horizonte de predicci on fuera innito. El problema de este m etodo es que en la pr actica la introducci on de esta restricci on articial anade un coste computacional considerable y, lo que es m as importante a un, da lugar a una regi on de operaci on muy restrictiva, por lo que en la realidad resulta muy dif cil satisfacer esta condici on. 3. Control dual La dicultad de la aproximaci on anterior llev o a Michalska y Mayne ([14]) a buscar una restricci on menos estricta. La idea es denir un entorno W alrededor del estado nal deseado s dentro del cual el sistema pueda ser llevado a dicho estado por medio de un controlador lineal por realimentaci on del vector de estados. Por tanto la restricci on que se anade a la formulaci on es:
( ( +
x t P ) ; xs ) 2 W
Si el estado actual se encuentra fuera de esta regi on se usa el algoritmo NMPC con la restricci on anterior. Una vez que el estado se encuentra en W , el control conmuta a una estrategia lineal determinada previamente (estrategia del tipo dual-mode controller). Este m etodo conlleva por tanto la gesti on de la conmutaci on entre los dos controladores y la determinaci on de la regi on W y de la matriz de ganancia de la realimentaci on del vector de estados (una forma de hacerlo se puede encontrar en el art culo citado). 4. Horizonte casi-innito Chen y Allgower ([3]) extendieron el concepto anterior, proponiendo un esquema de control con horizonte casi-innito. Se hace uso de la idea de regi on terminal y
60
controlador estabilizante, pero s olo para el c alculo del coste terminal. La senal de control se determina resolviendo el problema de optimizaci on en l nea (con horizonte nito) sin conmutar al controlador lineal incluso dentro de la regi on terminal. on de coste, El procedimiento consiste en anadir el t ermino kx(t + Tp )k2 P a la funci cuyo objetivo es extender el horizonte de predicci on hasta el innito y por tanto evitar la conmutaci on del controlador. Se puede demostrar que, eligiendo adecuadamente la matriz de ponderaci on P , este t ermino es una cota superior de lo que costar a llevar al sistema no lineal con el controlador lineal hasta el origen partiendo de un estado perteneciente a la regi on terminal y la funci on de coste con horizonte nito se aproxima a una de horizonte innito, en cuyo caso la estabilidad queda asegurada. Esto se puede interpretar como si el horizonte de predicci on se expandiera casi hasta el innito (es decir, es como si se minimizara un coste de horizonte innito resolviendo un problema de horizonte nito). 5. Contracci on del estado La idea consiste en imponer la siguiente restricci on:
kx(t + N )k2
kx(t)k2
2 (0 1)
Esta restricci on fuerza a la magnitud del vector de estado a contraerse seg un el factor elegido cada vez que se calcula la senal de control. La estabilidad queda garantizada siempre que el problema sea factible, lo que no viene impuesto necesariamente porque sea factible en k = 0, ya que las restricciones que se le imponen al estado son muy estrictas y pueden hacer perder factibilidad. Esto se puede mejorar con valores grandes de , pero entonces la disminuci on de la magnitud del estado es menor. En general se puede decir que en muchas situaciones reales la condici on es muy restrictiva y la no-factibilidad aparece con facilidad.
Robustez lo es el de complicado, m as aun Si el estudio de la estabilidad en NMPC resulta de por s la robustez, es decir, la estabilidad cuando existen errores de modelado. Los resultados de estabilidad de la secci on anterior son v alidos s olo en el caso de que el modelo del proceso sea perfecto. Resulta evidente que esto nunca va a ser cierto en la pr actica, por lo que es necesario alguna forma de afrontar la existencia de incertidumbres. Se puede considerar el problema de la robustez como algo todav a sin resolver para NMPC, aunque existen algunos resultados preliminares. Algunos de los esquemas que garantizan establidad se pueden hacer robustos con algunos cambios, como por ejemplo el uso de restricciones terminales conservadoras in el dual-mode. Pero en general los resultados existentes s olo indican que incertidumbres peque nas no amenazan la estabilidad del bucle cerrado, sin permitir el diseno del controlador que garantice la estabilidad dada una incertidumbre descrita por sus l mites. Existen algunos resultados
61
para casos muy simples como incertidumbre en la ganancia y se est a avanzando en algunos campos como en LMI, pero todav a queda mucho por hacer.
5.2.4
Modelos
Estos resultados te oricos proporcionan una base para poner en marcha un NMPC, aunque en la pr actica existen muchos temas abiertos, principalmente en lo referente a la denici on e identicaci on del modelo y al desarrollo de m etodos de resoluci on ables. La obtenci on de modelos no lineales adecuados de forma emp rica puede ser muy dif cil y no existe una formulaci on que sea claramente adecuada para representar xito del MPC se debe a la relativa procesos no lineales de forma gen erica. Parte del e facilidad con la que se pueden obtener experimentalmente modelos del tipo respuesta ante escal on o funciones de transferencia de bajo orden. En cambio los modelos no lineales son mucho m as dif ciles de construir, tanto bas andose en correlaci on de datos de entrada/salida como en principios b asicos de conservaci on de masa y energ a. Un gran obst aculo que se encuentra a la hora de desarrollar una teor a de sistemas no lineales es la ausencia de un principio de superposici on para este tipo de sistemas. Debido a ello, la determinaci on experimental de los modelos se convierte en una tarea muy complicada, requiriendo una cantidad de ensayos mucho mayor que para una planta no lineal. Si el proceso es lineal en teor a s olo es necesario llevar a cabo un ensayo de respuesta ante escal on para calcular el modelo (aunque en la pr actica no sea realmente as ). Debido al principio de superposici on, la respuesta ante un escal on de diferente amplitud se puede obtener escalando la salida convenientemente. Pero esto no es as para procesos no lineales, donde se deben realizar ensayos con escalones de distinto tamano. Adem as, si el proceso es multivariable, la diferencia en el n umero de ensayos necesarios es mucho mayor. En general, si un sistema lineal se ensaya con senales de entrada u1 (t),u2 (t),...,un (t), y las correspondientes salidas son y1 (t),y2 (t),...,yn (t), la respuesta a una senal que se puede expresar como combinaci on lineal de las senales de prueba u(t) = 1u1(t) + 2 u2(t) + + nun(t) es
n yn (t)
Es decir, un sistema lineal no necesita ser probado con ninguna secuencia de senales de entrada que sea una combinaci on lineal de senales ya probada, mientras que no ocurre lo mismo con un sistema no lineal, cuya respuesta debe ser analizada para todas las posibles senales de entrada. Si la desviaci on de la linealidad no es demasiado grande, se pueden hacer algunas aproximaciones que tengan en cuenta el cambio de comportamiento de un punto
62
de operaci on a otro y asuman comportamiento lineal en las cercan as del punto de operaci on. Pero en general habr a que recurrir a modelos espec cos que reejen la din amica no lineal. Existen diferentes aproximaciones que usan modelos de Wiener, otras basadas en redes de neuronas, modelos de Volterra o de Hammerstein, modelos NARX, modelos borrosos, etc. Los modelos usados en la industria se detallan a continuaci on.
Modelos en el espacio de estados Se puede usar un modelo formado por la combinaci on de una ecuaci on de estado lineal con una relaci on no lineal de salida:
Modelos de entrada/salida Una idea adoptada por algunos fabricantes de controladores predictivos es usar un modelo no lineal est atico junto con un modelo din amico no lineal. Si se considera el caso monovariables, deniendo las variables de desviaci on como:
u(t) = u(t) ; us
y(t) = y(t) ; ys
ys = hs(us)
63
Se considera que las variables de desviaci on verican la siguiente relaci on din amica lineal: n X y(t) = ai y(t ; i) + bi u(t ; i) i=1 La identicaci on del modelo lineal se lleva a cabo mediante ensayos ante escal on mientras que a partir de datos hist oricos se obtiene la representaci on de la relaci on no lineal por medio de una red de neuronas. Como el modelo din amico tiene una ganancia ja que en general ser a distinta de la del modelo no lineal, la ganancia del submodelo lineal se escala hasta ser igual a la ganancia local no lineal para la entrada actual:
dys j Ks = du u(t)
s
Esto se consigue reescalando los coecientes bi . Para usar este modelo, un programa de optimizaci on no lineal calcula los mejores f f valores de entrada y salida us , ys a partir del modelo est atico. Durante el c alculo din amico del controlador, la ganancia est atica no lineal se aproxima por una interpo lineal de las ganancias inicial y nal: lacion
(5
:4)
f i y K f las ganancias siendo ui oximo y Ks s y us los valores estacionarios actual y pr s calculadas en esos puntos usando el modelo no lineal est atico. Sustituyendo la ganancia dada por (5.4) en la ecuaci on del submodelo lineal se obtiene:
y(t) =
donde
n X i=1
(5
:5)
biKsi (1 ; Pn bi (1 ; Pn j = 1 aj ) j =1 aj ) gi = Pn K bi = Pn b f ;K i s s j =1 j j =1 bj uf s ;ui s
con esto se consigue reducir la complejidad computacional. Se puede observar que los valores en estado estacionario se calculan a partir del modelo est atico no lineal, mientras que los movimientos din amicos de control est an basados en el modelo cuadr atico de la ecuaci on (5.5). Sin embargo, los coecientes del modelo cuadr atico (la ganancia local) cambian de un periodo de muestro a otro, ya son reescalados para ajustarse a la ganancia local del modelo no lineal. Esta estrategia se puede interpretar como una sucesiva linealizaci on de los estados inicial y nal seguida por una interpolaci on lineal de las ganancias linealizadas, en una formulaci on similar al gain-scheduling, pero con un modelo global diferente debido el reescalado de la ganancia.
En cualquier caso siempre es dif cil obtener modelos emp ricos ables a partir de datos experimentales, por lo que en la pr actica existe la posibilidad de usar modelos dados directamente de las ecuaciones de balance, llamados normalmente modelos de primeros principios. Estas ecuaciones pueden ser ecuaciones est aticas de balance o funciones no lineales de variables f sicas que generan otra variable. En este caso el c alculo de la predicci on se realiza mediante una simulaci on de las ecuaciones no lineales (integraci on) que describen el proceso.
5.2.5
Se han propuesto diversas soluciones para intentar resolver los problemas que se han visto, como por ejemplo en [1], donde la predicci on de la salida del proceso se hace mediante la adici on de la respuesta libre (la respuesta futura que se obtiene si la entrada se mantiene en un valor constante durante los horizontes de control y predicci on) obtenida de un modelo no lineal de la planta, y la respuesta forzada (la debida a los movimiento de control futuros), calculada con un modelo incremental de la planta. Las predicciones obtenidas de esta manera son s olo una aproximaci on ya que el principio de superposici on, que permite la descomposici on mencionada, s olo es v alido para sistemas lineales. Sin embargo, la aproximaci on que se obtiene de esta forma se comporta mejor que cuando se usa un modelo linealizado del proceso para obtener ambas respuestas. Si se usa una funci on de coste cuadr atica, la funci on objetivo es cuadr atica en las variables de decisi on (futuros movimientos de la senal de control) y la secuencia de control se puede calcular (en caso de que no haya restricciones) como la soluci on de un conjunto de ecuaciones lineales, dando lugar a una ley de control simple. La unica diferencia respecto a un MPC est andar es que la respuesta libre se calcula mediante un modelo no lineal del proceso. Como el principio de superposici on no se cumple, la aproximaci on s olo es v alida cuando la secuencia de senales de control es pequena. Esta circunstancia tendr a lugar cuando el proceso opera en torno al punto de trabajo con pequenas perturbaciones. Si el proceso cambia continuamente de punto de operaci on o las perturbaciones son considerables los incrementos de la senal de control ser an en general mayores y la aproximaci on no ser a muy buena. Existe una forma de resolver este problema, propuesta en [9] para el EPSAC. La idea b asica es considerar la secuencia de senales de control como la suma de una secuencia de control base (ub (t + j )) y una secuencia de incrementos de la variable manipulada (ui (t + j )). Es decir:
65
La predicci on j- esima de la salida del proceso se calcula como la suma de la respuesta del proceso (yb (t + j )) debida a la secuencia base m as la respuesta (yi (t + j )) debida a los futuros incrementos del control en la secuencia base de entrada ui (t + j ):
x(t + 1) y(t)
= =
El m etodo consiste en encontrar funciones de transformaci on de estados y entrada z(t) = h(x(t)) y u(t) = p(x(t) v(t)) tales que:
z(t + 1) y(t)
= =
z(t)
h(x(t))
u(t)
p(x(t) v(t))
s olo se
Las restricciones, que usualmente son lineales, se convierten en no lineales. Es decir, incluso en los casos en que el modelo pueda ser linealizado mediante transformaciones adecuadas, el problema se transforma de minimizar una funci on no lineal (no cuadr atica) con restricciones lineales en minimizar una funci on cuadr atica con restricciones no lineales. La forma general de resolver el problema es usar el modelo no lineal completo de la planta para calcular la predicci on de la salida. Haciendo esto, se est a anadiendo una restricci on no lineal a la minimizaci on, con lo que los algoritmos QP no se pueden usar. Sin embargo el problema se puede resolver en l nea, en algunos casos, gracias al r apido desarrollo de algoritmos de programaci on no lineal (nonlinear programming, NLP) capaces de manejar un n umero grande de variables y restricciones.
5.2.6
Muchos controladores comerciales dividen el algoritmo de control en una optimizaci on local est atica y una optimizaci on din amica. El primer m odulo calcula los valores de entrada y salida a los que es necesario llegar y el segundo calcula la secuencia de control adecuada. La optimizaci on din amica se lleva a cabo minimizando la funci on objetivo gen erica (5.3) con las restricciones correspondientes. Los distintos esquemas comerciales hacen simplicaciones respecto a la formulaci on general. La mayor a de los productos (ver tabla 5.1) s olo permiten matrices de peso constantes en todo el horizonte y s olo el NOVA-NLC trabaja con norma 1. Por su parte, el la salida pero con una matriz de peso que se incrementa Process Perfecter minimiza solo gradualmente con el horizonte, dando por tanto m as importancia a los errores m as lejanos y en consecuencia dando lugar a una acci on de control m as suave. En cuanto a las restricciones, normalmente las correspondientes a la entrada se tratan como restricciones duras, es decir, que nunca deben ser violadas. El PFC tambi en incluye restricciones de aceleraci on, muy utiles para aplicaciones de servomecanismos. Este m etodo no trata estas restricciones de forma optima, sino que resuelve el problema de optimizaci on sin restricciones y luego satura a los l mites, produciendo por tanto una soluci on no optima. Respecto a restricciones en la salida, la mayor a de los productos comerciales las trata como restricciones blandas, debido a que una perturbaci on puede producir f acilmente una p erdida de factibilidad. Una opci on ofertada por el Process Perfecter es considerar
67
Tabla 5.1: EE: espacio de estados no lineal. PP: primeros principios. E/S: entrada/salida. PNE: polinomio no lineal est atico. RN: red neuronal. N1: norma 1. S: saturaci on. BS: blandas (m nimo y m aximo) en la salida. DS: duras en las salidas. DE: duras en las entradas. FB: funciones base. UM: unico movimiento. MM: m ultiples movimientos. NLS: m nimos cuadrados no lineales. GRG: Generalized Reduced Gradient. MINLP: Mixed Integer Nonlinear Programming. GD: Gradient descent.
una restricci on dura en forma de embudo, de manera que se da m as libertad a la salida al comienzo del horizonte que al nal. Par ametros: normalmente se elige un horizonte de predicci on nito muy grande, con la idea de capturar la din amica hasta el permanente de las salidas para todas las entradas. Esto se puede considerar una aproximaci on al m etodo de horizonte innito propuesto para garantizar la estabilidad del bucle cerrado y puede explicar por qu e ninguno de los productos comerciales incluye restricci on terminal. Una idea introducida en el PFC y adoptada por Aspen Target es el uso de puntos de coincidencia, en los cuales deben coincidir la salida y la trayectoria de referencia. Esta cuando las salidas responden con distinta velocidad y se pueden idea puede ser util denir distintos puntos de coincidencia para cada una de ellas. En cuanto a la estructuraci on de la senal de control, se puede encontrar desde considerar el horizonte de control igual a 1, horizonte variable o funciones base. Esta de control usando un conjunto de ultima idea, propia del PFC, parametriza la senal funciones polinomiales, permitiendo un perl de entrada complejo para un horizonte de control grande (en teor a podr a ser innito) empleando un n umero de inc ognitas pequeno. Esto puede resultar una ventaja en el caso de sistemas no lineales. La de la familia de funciones base establece muchas de las caracter eleccion sticas del perl de la entrada, pudiendo asegurar con una correcta elecci on una senal de control suave, por ejemplo. Si se eligen funciones base polin omicas, se puede seleccionar el orden para seguir un setpoint polin omico sin retraso, lo cual puede ser importante para aplicaciones de servosistemas mec anicos. La soluci on del problema no es tarea f acil debido a la no convexidad del problema gen erico. El PFC propone una soluci on sencilla resolviendo el problema sin restricciones usando un algoritmo de m nimos cuadrados no lineal y saturando las entradas a sus
68
stos se violan; l l mites si e ogicamente no se asegura una soluci on optima, pero se gana en velocidad, permitiendo que este controlador se use en aplicaciones con per odos de muestreo pequenos, como el caso de seguimiento de missiles. Para el caso gen erico se usan diversos algoritmos, algunos propietarios, basados en m etodos m as o menos conocidos de optimizaci on. Entre ellos cabe destacar el que usa Aspen Target, desarrollado por Oliveira y Biegler [15], que garantiza que las ptimas, son factibles. Ello garantiza que una pronta soluciones intermedias, aunque no o nalizaci on del algoritmo por limitaciones de tiempo produce siempre una soluci on factible. En cualquier caso queda claro que el esfuerzo computacional es superior al sta una de las principales razones la todav caso lineal, siendo e a escasa implantaci on de estas t ecnicas en la industria.
5.2.7
Necesidades futuras
Los temas que pueden considerarse abiertos en esta t ecnica son: Modelado: los modelos no lineales son m as complejos que los lineales, pero adem as el proceso de identicaci on es mucho m as dif cil. Se necesita una gran bater a de ensayos para capturar las no-linealidades del proceso, resultando en un per odo de pruebas considerable. Por tanto, la forma de disponer de una representaci on correcta de la din amica del proceso es un problema que no est a completamente resuelto. Resoluci on del problema: la inclusi on del modelo no lineal en la optimizaci on da sta no sea convexa. Grandes esfuerzos deben hacerse todav lugar a que e a para encontrar algoritmos de optimizaci on ables que permitan la resoluci on dentro del tiempo asignado. Justicaci on del esfuerzo: vistas las dicultades que aparecen en la aplicaci on de NMPC, debe poder justicarse el benecio que este tipo de t ecnica aporta. Algunos fabricantes ofrecen un MPC de respaldo, de manera que en el caso de que no se necesite ese esfuerzo adicional o el controlador no lineal sea realmente complicado de poner en marcha, se aplicar a la estrategia lineal. Otros temas: temas que son aplicables al Control Predictivo en general, funciones objetivos multicriterio, sintonizaci on de par ametros, mal condicionamiento o tolerancia a fallos. Es de destacar que ninguna de los productos comerciales incluye restricci on terminal ni horizonte innito, situaciones requeridas en teor a para garantizar la estabilidad nominal. En lugar de eso, se conf a en que con un horizonte de predicci on lo sucientemente grande se consiga el mismo comportamiento que horizonte innito.
Bibliograf a
[1] E.F. Camacho, M. Berenguel y F.R. Rubio. Advanced Control of Solar Power Plants. Springer-Verlag, London, 1997. [2] E.F. Camacho y C. Bordons. Model Predictive Control. Springer-Verlag, 1999. [3] H. Chen y F. Allgower. A quasi-innite horizon nonlinear predictive control scheme with guaranteed stability. Automatica, 34(10):12051218, 1998. [4] D.W. Clarke y C. Mohtadi. Properties of Generalized Predictive Control. Automatica, 25(6):859875, 1989. [5] D.W. Clarke, C. Mohtadi y P.S. Tuffs. Generalized Predictive Control. Part I. The Basic Algorithm. Automatica, 23(2):137148, 1987. [6] C.R. Cutler y B.C. Ramaker. Dynamic Matrix Control- A Computer Control Algorithm. En Automatic Control Conference, San Francisco, 1980. [7] C.E. Garc a, D.M. Prett y M. Morari. Model Predictive Control: Theory and Practice-a Survey. Automatica, 25(3):335348, 1989. [8] S.S. Keerthi y E.G. Gilbert. Optimal innite-horizon feedback laws for a general class of constrained discrete-time systems: Stability and moving-horizon approximations. J. Optim. Theory Appl., 57(2):265293, 1988. [9] R. De Keyser. A Gentle Introduction to Model Based Predictive Control. En PADI2 International Conference on Control Engineering and Signal Processing, Piura, Peru, 1998. [10] R.M.C. De Keyser, Ph.G.A. Van de Velde y F.G.A. Dumortier. A Comparative Study of Self-adaptive Long-range Predictive Control Methods. Automatica, 24(2):149 163, 1988. [11] K. Kr amer y H. Ubehauen. Predictive Adaptive Control. Comparison of Main aginas 327 Algorithms. En Proceedings 1st European Control Conference, Grenoble, p 332, julio 1991. [12] A.G. Kutnetsov y D.W. Clarke. Advances in Model-Based Predictive Control, cap tulo Application of constrained GPC for improving performance of controlled plants. Oxford University Press, 1994. 69
70
Bibliograf a
[13] E.S. Meadows, M.A. Henson, J.W. Eaton y J. Rawlings. Receding horizon control and discontinuous state feedback stabilization. Int. Journal Control, p aginas 1217 1229, 1995. [14] H. Michalska y D.Q. Mayne. Robust receding horizon control of constrained nonlinear systems. IEEE Trans. on Automatic Control, 38(11):16231633, 1993. [15] N.M.C. Oliveira y L.T. Biegler. An extension of newton-type algorithms for nonlinear process control. Automatica, 31:281286, 1995. [16] S.J. Qin y T.A. Badgwell. An Overview of Industrial Model Predictive Control Technology. In Chemical Process Control: Assessment and New Directions for Research. En AIChE Symposium Series 316, 93. Jeffrey C. Kantor, Carlos E. Garcia and Brice Carnahan Eds. 232-256, 1997. [17] S.J. Qin y Thomas A. Badgwell. An overview of nonlinear model predictive control applications. En IFAC Workshop on Nonlinear Model Predictive Control. Assessment and Future Directions. Ascona (Switzerland), 1998. [18] J. Richalet. Practique de la commande predictive. Hermes, 1992. [19] H. Takatsu, T. Itoh y M. Araki. Future needs for the control theory in industries. report and topics of the control technology survey in japanese indsutry. Journal of Process Control, 8:369374, 1998. [20] M.L. Tyler y M. Morari. Propositional Logic in Control and Monitoring Problems. Technical Report AUT96-15, Institut fur Automatik, ETH- Swiss Federal Institute of Technology, Zurich, Switzerland, 1996. [21] B.E. Ydstie. Extended Horizon Adaptive Control. En Proc. 9th IFAC World Congress, Budapest, Hungary, 1984.