Está en la página 1de 73

Escuela Superior de Ingenieros

Universidad de Sevilla

Control Predictivo: metodolog a, tecnolog a y nuevas perspectivas

Carlos Bord ons Alba Departamento de Ingenier a de Sistemas y Autom atica Universidad de Sevilla

I Curso de Especializaci on en Autom atica Aguadulce, Almer a, 2000

Indice general

Indice 1 Fundamentos 1.1 1.2 1.3 1.4 1.5 2 Tendencias actuales en control de procesos Perspectiva hist orica Situaci on actual

i 1

:::::::::::::::::

1 5 6 7 8 11 11 11 15 18 18 23 25

:::::::::::::::::::::::::::::: :::::::::::::::::::

:::::::::::::::::::::::::::::::: ::::::::::::::::::::::::

Conceptos b asicos de control predictivo Estrategia de los controladores

Controladores predictivos 2.1 Elementos b asicos 2.1.1 2.1.2 2.1.3 2.2 2.3

::::::::::::::::::::::::::::::: ::::::::::::::::::::::::: :::::::::::::::::::: :::::::::::::::::::: ::::::::::::::::::::::::::::

Modelo de predicci on Funci on objetivo

Obtenci on de la ley de control

de los principales algoritmos Revision Estado de la tecnolog a

::::::::::::::::::::::::::::

Algoritmos 3.1 Dynamic Matrix Control 3.1.1 Predicci on

:::::::::::::::::::::::::::
i

25 25

:::::::::::::::::::::::::::::::

ii 3.1.2 3.1.3 3.2 Perturbaciones medibles Algoritmo de control

Indice general

::::::::::::::::::::::: ::::::::::::::::::::::: :::::::::

27 28 31 32 36 38 41

:::::::::::::::::::::::::

Control Predictivo Generalizado 3.2.1 3.2.2 3.2.3

Formulaci on del Control Predictivo Generalizado Ejemplo de c alculo Caso multivariable

::::::::::::::::::::::::::: ::::::::::::::::::::::::::: ::::::::::::::::::

4 Restricciones en Control Predictivo 4.1 4.2 4.3 4.4 Tratamiento convencional de restricciones Restricciones en Control Predictivo Resoluci on del problema Gesti on de restricciones 4.4.1

41 42 44 45 46 51 51 53 54 56 56 57 61 64 66 68 69

:::::::::::::::::::::

::::::::::::::::::::::::::: :::::::::::::::::::::::::::: ::::::::::::

T ecnicas de busqueda de soluciones factibles

5 Tendencias actuales y nuevas perspectivas 5.1 Multiobjetivo. Jerarqu a de objetivos 5.1.1 5.2 Jerarqu a de objetivos

:::::::::::::::::::::

::::::::::::::::::::::::: ::::::::::::::::

Control predictivo no lineal 5.2.1 5.2.2 5.2.3 5.2.4 5.2.5 5.2.6 5.2.7

:::::::::::::::::::::::::: ::::::::::::::::::::::::: :::::::::::::::::::: :::::::::::::::::: ::::::::::

Diferencias respecto al m etodo lineal Fundamentos te oricos

Problem atica asociada al NMPC Modelos

::::::::::::::::::::::::::::::::

Otras formulaciones del problema

Resoluci on del problema. Productos comerciales Necesidades futuras

::::::::::::::::::::::::::

Bibliograf a

Tema 1 Fundamentos
1.1 Tendencias actuales en control de procesos
Aunque en el pasado pod a considerarse que el unico objetivo del control consist a en mantener una operaci on estable del proceso, actualmente la industrias se enfrentan a un mercado cambiante y dif cil de predecir, lo que les obliga a operar sus procesos productivos en consonancia con la evoluci on del mercado para poder mantenerse competitivas y rentables. La competencia en muchos sectores industriales as como el creciente inter es social por los problemas medioambientales relacionados con los procesos de producci on provoca la necesidad de disponer de t ecnicas ables que permitan la operaci on del proceso con gran eciencia y alto grado de exibilidad. Actualmente los sistemas de control en la industria de procesos deben satisfacer criterios econ omicos, asociados con el mantenimiento de las variables de proceso en sus referencias minimizando din amicamente una funci on de coste de operaci on, criterios de seguridad y medioambientales, y de calidad en la producci on, la cual debe satisfacer ciertas especicaciones sujetas a una demanda normalmente variable. Por ello, se puede considerar que en la actualidad el objetivo de todo sistema de control consiste en actuar sobre las variables manipuladas de forma que puedan satis facerse multiples y cambiantes criterios de funcionamiento (econ omicos, de seguridad, medioambientales o de calidad) en presencia de cambios en las caracter sticas del proceso. El amplio abanico de metodolog as actuales de control de procesos se enfrenta al cumplimiento de este objetivo. La diferencia entre las diversas t ecnicas radica b asicamente en los compromisos hechos en la formulaci on matem atica de los criterios de funcionamiento y en la elecci on de la manera de representar el proceso. La represen1

Tendencias actuales en control de procesos

1983 Retardo Perturbaciones Interacci on Respuesta Estabilidad

(%) 24 21 17 16 11

1989 Retardo Interacci on Perturbaciones Cambios No lineal

(%) 23 16 15 12 10

1995 Interacci on Perturbaciones Retardo Cambios No lineal

(%) 24 22 21 14 7

Tabla 1.1: Principales problemas de control

taci on matem atica de muchos de estos criterios se lleva a cabo en la forma de funciones objetivo din amicas y de restricciones mientras que el proceso se representa como un modelo din amico con incertidumbres asociadas. La importancia de las incertidumbres est a siendo cada vez m as reconocida y por tanto incluida expl citamente en la formulaci on de los controladores. Las t ecnicas de Control Predictivo Basado en Modelo (Model Based Predictive Control, MPC) parecen constituir unas poderosas herramientas para afrontar estos retos. MPC, en su forma m as general, acepta cualquier tipo de modelos, funciones objetivo o restricciones, siendo la metodolog a que actualmente puede reejar m as directamente los multiples criterios de funcionamiento relevantes en la industria de procesos. Quiz as sta la principal raz xito de estas t sea e on del e ecnicas en numerosas aplicaciones de la industria de procesos, unida a que es la forma m as general de formular el problema de control en el dominio del tiempo, de manera que puede resultar f acil de aceptar por el personal de la industria. Los resultados de un estudio realizado por Takatsu et al. para la Society of Instrumentation and Control Engineering [19] son indicativos de las necesidades futuras de mbito del control. En este informe se analizan los principales problela industria en el a mas de control que se encuentran en la industria de procesos, el estado de aplicaci on de las tecnolog as avanzadas, el grado de satisfacci on de los usuarios con cada una de ellas y las expectativas que cada una genera. La evoluci on en los ultimos anos de los principales problemas de control para los usuarios se muestra en la tabla 1.1. Obs ervese que los tres primeros problemas siguen siendo los mismos en los tres anos que se ha realizado la encuesta y parece que a lo largo del tiempo se resuelven problemas b asicos como estabilidad y respuesta y se atacan problemas m as dif ciles como din amica no lineal. Como se ver a m as adelante, el Control Predictivo es una metodolog a capaz de ofrecer soluciones a todos estos problemas. xito y fracaso de la Tambi en resulta interesante analizar los factores claves de e automatizaci on del proceso (1.2 y 1.3). De estas tablas se desprende que la elecci on de la estrategia de control no es el unico factor a tener en cuenta para garantizar un buen

Fundamentos

Selecci on de la estrategia de control 14 % Selecci on del equipo de control 12 % Especicaciones apropiadas 10 % Conguraci on exible del sistema 10 % Operaci on de emergencia 10 % Interface con el operario 8% An alisis de proceso 8% xito Tabla 1.2: Principales factores claves de e

Ausencia de an alisis del proceso. Inexactitud del modelo 21 % Selecci on de los sensores 14 % Falta de rechazo a las perturbaciones 10 % Selecci on de la estrategia de control 7% Selecci on de los actuadores 6% Selecci on del equipo de control 5% Especicaciones inapropiadas 5% Conguraci on r gida del sistema 5% Tabla 1.3: Principales factores claves de fracaso

funcionamiento del sistema de control. Del informe citado se pueden extraer conclusiones interesante sobre el estado y el grado de aceptaci on de las tecnolog as consideradas avanzadas (ver tabla 1.4). En ella se muestra el porcentaje de plantas que usaron cada t ecnica en 1989 y 1995. Obs ervese que todas crecieron excepto el control adaptativo y el autoajuste que tuvieron un ligero descenso. Con el n de evaluar el grado de satisfacci on del usuario con las distintas t ecnicas, se muestra en la tabla 1.5 el porcentaje de usuarios que est an satisfechos con cada una de las t ecnicas que han empleado. Como conclusi on interesante destaca el hecho de que pr acticamente todos los usuarios de Control Predictivo est an satisfechos. Tambi en resulta interesante intentar cuanticar la evoluci on futura de las distintas t ecnicas. Para ello, la gura 1.1 intenta mostrar las posibilidades t ecnicas y las expectativas despertadas por cada una de ellas. Posibilidad t ecnica se reere a la facilidad de implementaci on y expectativas al efecto esperado de uso de cada t ecnica. El punto de partida de cada echa es la media de todas las respuestas a la encuesta, mientras que su extremo corresponde a la media de las 15 plantas consideradas l deres en temas de control. El citado art culo interpreta la echa como tendencia futura. Seg un esto, el PID avanzado, compensaci on de retardo, borroso, desacoplo y MPC ser an t ecnicas

Tendencias actuales en control de procesos

T ecnica 1989 1995 Compensaci on de retardo 29.6 52.4 Borroso 9.9 38 Control Predictivo 25.4 37.2 Gain-scheduling 25.7 32.5 PID avanzado 24.8 29.4 Autoajuste 32.2 29.1 Desacoplo 17.5 28.6 Basado en reglas 6.3 17.9 Filtro de Kalman 9.1 15.5 Neuronal 0 11.8 LQ 8.2 11 Observador 8.2 9.8 Control adaptativo 10.3 7 H1 0 9.3 Tabla 1.4: Estado de las distintas t ecnicas

T ecnica 1989 1995 Control Predictivo 76 94 PID avanzado 77 89 Compensaci on de retardo 72 89 Gain-scheduling 78 87 Borroso 67 83 LQ 79 70 Neuronal 69 Desacoplo 64 66 Filtro de Kalman 70 66 Autoajuste 60 65 Observador 67 62 Basado en reglas 43 61 Control adaptativo 50 56 H1 50 Tabla 1.5: Grado de satisfacci on de las distintas t ecnicas

Fundamentos

ampliamente usadas con grandes expectativas. El control neuronal despierta grandes expectativas pero tiene ciertas dicultades de implementaci on, mientras que el Autoajuste se implementa con facilidad pero pierde expectativas. Las t ecnicas como LQR, ltro de Kalman, H1 o adaptativo se mantienen como "sin demasiadas expectativas y no f acilmente implementables".

MPC Retardo Borroso

Expectativas

Adaptativo Neuronal Hoo LQ F. Kalman Deslizante Desacoplo Auto ajuste

PID

Posibilidades tcnicas

Figura 1.1: Expectativas y posibilidades t ecnicas Este estado actual y futuras tendencias en el campo del control de procesos industriales indican que el Control Predictivo Basado en Modelo se puede considerar una tecnolog a sucientemente introducida en la industria y que adem as sigue despertando muchas expectativas. Estos hechos, unidos a la existencia de campos abiertos tanto en investigaci on como en temas relacionados con la implementaci on justica un estudio m as detallado de esta tecnolog a.

1.2 Perspectiva hist orica


El Control Predictivo se desarroll o en base a dos l neas b asicas. Por un lado, a nales de los anos setenta surgieron diversos algoritmos que usaban expl citamente un modelo din amico del proceso para predecir el efecto de las acciones de control futuras en la salida, las cuales eran determinadas minimizando el error predicho sujeto a restricciones de operaci on. La optimizaci on se repet a en cada instante de muestreo con informaci on actualizada del proceso. Estas formulaciones eran de naturaleza heur stica

Situaci on actual

y algor tmica e intentaban aprovechar el creciente potencial de los computadores digi poca. tales por aqu ella e R apidamente el MPC adquiri o gran popularidad en las industrias de procesos qu micos principalmente debido a la simplicidad del algoritmo y al uso del modelo de respuesta impulsional o en escal on, que aunque posea muchos m as par ametros que las formulaciones en el espacio de estados o funci on de transferencia suele ser preferido por ser intuitivo y necesitar menos informaci on a priori para identicar. La mayor a de las aplicaciones fueron llevadas a cabo sobre sistemas multivariables incluyendo restricciones. Los algoritmos utilizados fueron principalmente el IDCOM (Identication-Command) y el DMC (Control con Matriz Din amica, Dynamic Matrix Control). Independientemente fue surgiendo otra l nea de trabajo en torno a las ideas del control adaptativo, desarrollando estrategias esencialmente para procesos monovariables formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del Controlador de M nima Varianza y se desarroll o el Control Predictivo Generalizado (Generalized Predictive Control GPC) que es uno de los m etodos m as populares en la actualidad.

actual 1.3 Situacion


La situaci on actual de aplicaciones de MPC en la industria est a bien reejada en la recopilaci on de Qin y Badgwell [16], que recoge unas 2200 aplicaciones, principalmente en el sector petroqu mico (desde entonces el n umero de aplicaciones puede estimarse en torno a las 3000). La mayor a de las aplicaciones son en procesos multivariables, registr andose casos como un controlador con 40 entradas y 80 salidas. Sorprendentemente, MPC ha tenido menor impacto en otro tipo de industrias, aunque estudios de 1993 sugieren que unas 20.000 aplicaciones podr an beneciarse de esta t ecnica. xito actual del MPC en la industria se debe a tres razones principales: El e La incorporaci on de un modelo expl cito del proceso en los c alculos permite al controlador tratar con todas las caracter sticas importantes de la din amica del proceso. La consideraci on del comportamiento del proceso a lo largo de un horizonte futuro permite tener en cuenta el efecto de las perturbaciones en realimentaci on y pre-alimentaci on, permitiendo al controlador conducir la salida a la trayectoria de referencia deseada. La consideraci on de restricciones en la fase del diseno del controlador evita en lo posible su violaci on, resultando en un control m as preciso en torno al punto

Fundamentos

optimo de operaci on. La inclusi on de restricciones es quiz as la caracter stica que m as distingue al MPC respecto a otras metodolog as. xito Otra de las razones que han contribuido a que el MPC se haya convertido en un e comercial es el hecho de que existen unos 15 suministradores que instalan el producto llave en mano, con periodos de amortizaci on de entre 3 y 12 meses, permitiendo que medianas empresas puedan tener acceso a esta tecnolog a. Aparte de esto, los ericos nuevos Sistemas de Control Distribuido empiezan a ofertar productos MPC gen que ofrecen al usuario la posibilidad de realizar futuras modicaciones sin depender de un producto cerrado.

1.4 Conceptos b asicos de control predictivo


El Control Predictivo Basado en Modelo, Model (Based) Predictive Control (MBPC o MPC) constituye un campo muy amplio de m etodos de control desarrollados en torno ptimo, control a ciertas ideas comunes e integra diversas disciplinas como control o estoc astico, control de procesos con tiempos muertos, control multivariable o control con restricciones. El Control Predictivo no es una estrategia de control espec ca, sino que se trata m as bien de un campo muy amplio de m etodos de control desarrollados en torno a ciertas ideas comunes. Estos m etodos de diseno conducen a controladores lineales que poseen pr acticamente la misma estructura y presentan sucientes grados de libertad. Las ideas que aparecen en mayor o menor medida en toda la familia de controladores predictivos son b asicamente: Uso expl cito de un modelo para predecir la salida del proceso en futuros instantes de tiempo (horizonte). C alculo de las senales de control minimizando una cierta funci on objetivo. Estrategia deslizante, de forma que en cada instante el horizonte se va desplazando hacia el futuro, lo que implica aplicar la primera senal de control en cada instante y desechar el resto, repitiendo el c alculo en cada instante de muestreo. Los distintos algoritmos de MPC dieren entre s casi exclusivamente en el modelo usado para representar el proceso y los ruidos y en la funci on de coste a minimizar. Aunque las diferencias puedan parecer pequenas a priori, pueden provocar distintos xito de un determinado comportamientos en bucle cerrado, siendo cr ticas para el e algoritmo en una determinada aplicaci on. El Control Predictivo es un tipo de control de naturaleza abierta dentro del cual se han desarrollado muchas realizaciones, encontrando gran aceptaci on tanto en aplicaciones industriales como en el mundo acad emico. En la actualidad existen numerosas

Estrategia de los controladores

xito, tanto en la industria aplicaciones de controladores predictivos funcionando con e de procesos como en control de motores o Rob otica. El buen funcionamiento de estas aplicaciones muestra la capacidad del MPC para conseguir sistemas de control de elevadas prestaciones capaces de operar sin apenas intervenci on durante largos per odos de tiempo. etodos, entre las que destacan: El MPC presenta una serie de ventajas sobre otros m Resulta particularmente atractivo para personal sin un conocimiento profundo de control, puesto que los conceptos resultan muy intuitivos, a la vez que la sintonizaci on es relativamente f acil. Puede ser usado para controlar una gran variedad de procesos, desde aqu ellos con din amica relativamente simple hasta otros m as complejos incluyendo sistemas con grandes retardos, de fase no m nima o inestables. Permite tratar con facilidad el caso multivariable. Posee intr nsecamente compensaci on del retardo. Resulta conceptualmente simple la extensi on al tratamiento de restricciones, que pueden ser incluidas de forma sistem atica durante el proceso de diseno. cuando se conocen las futuras referencias (rob Es muy util otica o procesos en batch). Es una metodolog a completamente abierta basada en algunos principios b asicos que permite futuras extensiones. Pero, l ogicamente, tambi en presenta inconvenientes. Unos de ellos es la carga de c alculo necesaria para la resoluci on de algunos algoritmos. Pero quiz as el mayor inconveniente venga marcado por la necesidad de disponer de un modelo apropiado del proceso. El algoritmo de diseno est a basado en el conocimiento previo del modelo y es ste, pero resulta evidente que las prestaciones obtenidas depender independiente de e an de las discrepancias existentes entre el proceso real y el modelo usado.

1.5 Estrategia de los controladores


La metodolog a de todos los controladores pertenecientes a la familia del MPC se caracteriza por la estrategia siguiente, representada en la gura 1.2: 1. En cada instante t y haciendo uso del modelo del proceso se predicen las futuras salidas para un determinado horizonte N , llamado horizonte de predicci on. Estas

Fundamentos

u(t+k|t) u(t)

^ y(t+k|t) y(t) N

t-1

t+1

...

t+k

...

t+N

Figura 1.2: Estrategia del Control Predictivo salidas predichas, y (t + k j t)1 para k = 1 : : : N dependen de los valores conocidos hasta el instante t (entradas y salidas pasadas) y de las senales de control futuras u(t + k j t), k = 0 : : : N ; 1 que se pretenden mandar al sistema y que son las que se quieren calcular. 2. El conjunto de senales de control futuras se calcula optimizando un determinado criterio en el que se pretende mantener el proceso lo m as pr oximo posible a la trayectoria de referencia w (t + k ) (que puede ser directamente el setpoint o una ste). Este criterio suele tomar la forma de una funci suave aproximaci on a e on cuadr atica de los errores entre la salida predicha y la trayectoria de referencia tambi en predicha, incluyendo en muchos casos el esfuerzo de control. Si el criterio es cuadr atico, el modelo lineal y no existen restricciones se puede obtener una soluci on expl cita, en otro caso se debe usar un m etodo iterativo de optimizaci on. Adicionalmente se hace alguna suposici on sobre la estructura de la ley de control futura, como por ejemplo que va a ser constante a partir de cierto instante. 3. La senal de control u(t j t) es enviada al proceso mientras que las siguientes senales de control calculadas son desechadas, puesto que en el siguiente instante de muestreo ya se conoce y (t + 1) y se repite el paso 1 con este nuevo valor y todas las secuencias son actualizadas. Se calcula por tanto u(t + 1 j t + 1) (que en on), haciendo principio ser a diferente al u(t + 1 j t) al disponer de nueva informaci uso del concepto de horizonte deslizante. Para llevar a cabo esta estrategia, se usa una estructura como la mostrada en la gura 1.3. Se hace uso de un modelo para predecir las salidas futuras del proceso,
1

la notaci on indica el valor de la variable en el instante t + k calculado en el instante t.

10

Estrategia de los controladores

Entradas y salidas pasadas

Salidas predichas

Trayectoria de referencia + -

Modelo
Controles futuros

Optimizador
Errores futuros Funcion de coste Restricciones

Figura 1.3: Estructura b asica del MPC bas andose en las futuras senales de control propuestas. Estas senales son calculadas por el optimizador teniendo en cuenta la funci on de coste (donde aparece el futuro error de seguimiento) as como las restricciones. Por tanto el modelo juega un papel decisivo en el controlador. El modelo elegido debe ser capaz de capturar la din amica del proceso para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo de usar y de comprender. El optimizador es otra parte fundamental de la estrategia pues proporciona las acciones de control. Si la funci on de coste es cuadr atica, el m nimo se puede obtener como una funci on expl cita de las entradas y salidas pasadas y de la trayectoria de referencia. Sin embargo, cuando existen restricciones de desigualdad la soluci on debe ser calculada por m etodos num ericos con m as carga de c alculo.

Tema 2 Controladores predictivos


2.1 Elementos b asicos
Todos los controladores predictivos poseen elementos comunes y para cada uno de estos elementos se pueden elegir diversas opciones, dando lugar a distintos algoritmos. Estos elementos son: Modelo de predicci on Funci on objetivo Obtenci on de la ley de control

2.1.1

Modelo de predicci on

La piedra angular del MPC es el modelo; un diseno completo debe incluir los mecanismos necesarios para la obtenci on del mejor modelo posible, el cual debe ser lo sucientemente rico para capturar al maximo la din amica del proceso y debe ser capaz de permitir el c alculo de las predicciones a la vez que sea intuitivo y permita un an alisis te orico. El uso del modelo del proceso viene determinado por la necesidad del c alculo de la salida predicha en instantes futuros y (t + k j t). Las diferentes estrategias de MPC pueden usar distintos modelos para representar la relaci on de las salidas con las entradas medibles, algunas de las cuales ser an variables manipuladas y otras se pueden considerar como perturbaciones medibles, que pueden ser compensadas por feedforward. Adem accion as se tendr a en cuenta un modelo de las perturbaciones, para intentar describir el comportamiento que no aparece reejado en el modelo del proceso, englob andose aqu el efecto de las entradas no medibles, el ruido y los errores de modelado. 11

12

Elementos b asicos

Para el estudio se puede separar el modelo en dos partes: el modelo del proceso propiamente dicho y el modelo de las perturbaciones. Cualquier m etodo usar a ambas partes para la predicci on. Modelo del Proceso Casi todas las formas posibles de modelar un proceso aparecen en alguna formu de MPC siendo las m lacion as usadas las siguientes: Respuesta impulsional. Tambi en conocida por secuencia de ponderaci on o modelo de convoluci on. La salida viene relacionada con la entrada por la ecuaci on

y(t) =

1 X
i=1

hiu(t ; i)

donde hi son los valores muestreados obtenidos al someter al proceso a un impulso unitario de amplitud igual al per odo de muestreo (ver gura 2.1a). Esta suma es truncada y s olo se consideran N valores (por tanto s olo permite representar procesos estables y sin integradores), teniendo

y(t) =

N X i=1

hi u(t ; i) = H (z;1)u(t)

(2

:1)

donde H (z ;1 ) = h1 z ;1 + h2 z ;2 + + hN z ;N . Un inconveniente de este m etodo es el gran numero de par ametros que necesita, ya que N suele ser un valor elevado (del orden de 40-50). La predicci on vendr a dada por:

y (t + k j t) =

N X i =1

hi u(t + k ; i j t) = H (z;1)u(t + k j t)

Este m etodo es ampliamente aceptado en la pr actica industrial debido a que es muy intuitivo y no requiere informaci on previa sobre el proceso, con lo que el procedimiento de identicaci on se simplica, a la vez que permite describir f acilmente din amicas complejas como fase no m nima o retardos. Respuesta ante escal on. Es muy similar al anterior s olo que ahora la senal de entrada es un escal on. Para sistemas estables se tiene la respuesta truncada que ser a N X y(t) = y0 + gi 4 u(t ; i) = y0 + G(z;1)(1 ; z;1 )u(t) (2:2) i=1 donde las gi son los valores muestreados ante la entrada en escal on y 4u(t) = u(t) ; u(t ; 1), segun se muestra en la gura 2.1b. El valor de y0 puede tomarse 0 sin p erdida de generalidad, con lo cual el predictor ser a:

y (t + k j t) =

N X i=1

gi 4 u(t + k ; i j t)

Este m etodo presenta las mismas ventajas e inconvenientes que el anterior.

Controladores predictivos

13

h2

h1

hi

y(t)

hN

y(t)
g1

t+1 t+2
a)

...

g2

t+N

t+1 t+2
b)

...

Figura 2.1: Respuesta impulsional y ante escal on Funci on de transferencia. Se utiliza el concepto de funci on de transferencia G = B=A con lo que la salida viene dada por:

A(z;1 )y(t) = B (z;1 )u(t) b1 z;1 + b2 z;2 +


1 + a1 z ;1 + a2 z ;2 +

A( z ; 1 ) B (z ;1 )

= =

anaz;na ;nb + bnb z


+

Por tanto la predicci on vendr a dada por

B (z ;1 ) y (t + k j t) = A(z;1 ) u(t + k j k)
Esta representaci on es v alida tambi en para procesos inestables y posee la ventaja de necesitar pocos par ametros, aunque es fundamental un conocimiento a priori del proceso sobre todo en cuanto al orden de los polinomios A y B . Espacio de estados. Tiene la siguiente representaci on:

respectivamente. Para este modelo la predicci on viene dada por

x(t) = Ax(t ; 1) + Bu(t ; 1) y(t) = Cx(t) siendo x el estado y A, B y C las matrices del sistema, de entrada y de salida y (t + k j t) = C x (t + k j t) = C Ak x(t) +
k X Ai;1Bu(t + k ; i j t)] i=1

t+N

14

Elementos b asicos
Posee la ventaja de que sirve tambi en para sistemas multivariables a la vez que permite analizar la estructura interna del proceso (aunque a veces los estados obtenidos al discretizar no tienen ning un signicado f sico). Los c alculos pueden ser complicados, con la necesidad adicional de incluir un observador si los estados no son accesibles. Modelo de las perturbaciones

De tanta importancia como la elecci on de un determinado modelo del proceso es la elecci on del modelo utilizado para representar la perturbaciones. Un modelo bastante extendido es el Autorregresivo Integrado de Media M ovil (Auto-Regressive and Integrated Moving Average, ARIMA), en el que las perturbaciones, es decir, las diferencias entre la salida medida y la calculada por el modelo vienen dadas por
(z ;1 )e(t) n(t) = C D (z ;1 )

donde el polinomio D (z;1 ) incluye expl citamente el integrador 4 = 1 ; z;1 , e(t) es un ruido de media cero y normalmente el polinomio C se considera igual a uno. Este modelo se considera apropiado para dos tipos de perturbaciones: cambios aleatorios ocurridos en instantes aleatorios (por ejemplo cambio en la calidad del material) y movimiento browniano (en procesos con balance de energ a) y es usado en varios m etodos. N otese que al incluir un integrador se consigue un control con error nulo en r egimen permanente (offset-free). Como caso particular del ARIMA se puede incluir la perturbaci on constante

e(t) n(t) = 1 ; z;1


cuya mejor predicci on ser an (t + k j t) = n(t). Respuestas libre y forzada Una caracter stica t pica de la mayor a de los controladores MPC es el empleo de los conceptos de repuesta libre y forzada. La idea es expresar la secuencia de acciones de control como la suma de dos senales:

u(t) = uf (t) + uc(t)


La senal uf (t) corresponde a las entradas pasadas (anteriores al instante t) y en el futuro se mantiene constante e igual al ultimo valor de la variable manipulada. Es decir,

uf (t ; j ) uf (t + j )

= =

u(t ; j ) para j = 1 2 u(t ; 1) para j = 0 1

Controladores predictivos

15

La senal uc (t) vale cero en el pasado y corresponde a las senales de control en los instantes futuros:

uc(t ; j ) uc(t + j )

= =

0 para j

1 2 u(t + j ) ; u(t ; 1) para j


=

0 1 2

La predicci on de la secuencia se salida se separa en dos partes, como se ve en la gura 2.2. Una de ellas (yf (t)), la respuesta libre, corresponde a la predicci on de la salida cuando la variable manipulada se hace igual a uf (t), y la otra, la repuesta forzada (yc (t)), corresponde a la predicci on de la salida cuando la senal de control es uc (t). La respuesta libre corresponde a la evoluci on del proceso debido a su estado actual (incluido por tanto el efecto de acciones pasadas) mientras que la respuesta forzada es la debida a las acciones de control futuras.
u y

Process

uc

y f

yc

Figura 2.2: Respuestas libre y forzada

2.1.2

Funci on objetivo

Los diversos algoritmos de MPC proponen distintas funciones de coste para la obtenci on de la ley de control. En general se persigue que la salida futura en el horizonte considerado siga a una determinada senal de referencia al mismo tiempo que se puede penalizar el esfuerzo de control requerido para hacerlo. La expresi on general de tal funci on objetivo ser a:

J (N1 N2 Nu) =

N X
2

j =N1

( )

j y (t + j j t) ; w(t + j )]2 +

Nu X j =1

( )

4u(t + j ; 1)]2

(2

:3)

En algunos m etodos el segundo sumando, que considera el esfuerzo de control, no se tiene en cuenta, mientras que en otros tambi en aparecen directamente los valores de la senal de control (no sus incrementos). En la funci on de coste se pueden considerar:

16

Elementos b asicos
Par ametros: N1 y N2 son los horizontes m nimo y m aximo de coste (o de predicci on) y Nu es el horizonte de control, que no tiene por qu e coincidir con el horizonte m aximo, como se ver a posteriormente. El signicado de N1 y N2 resulta bastante intuitivo: marcan los l mites de los instantes en que se desea que la salida siga a la referencia. As , si se toma un valor grande de N1 es porque no importa que haya errores en los primeros instantes, lo cual provocar a una respuesta suave del proceso. N otese que para procesos con tiempo muerto d no a tiene sentido que N1 sea menor que dicho valor puesto que la salida no empezar a evolucionar hasta el instante t + d. Adem as, si el proceso es de fase no m nima, este par ametro permite eliminar de la funci on objetivo los primeros instantes de respuesta inversa.

Los coecientes (j ) y (j ) son secuencias que ponderan el comportamiento futuro. Usualmente se consideran valores constantes o secuencias exponenciales. Por ejemplo se puede conseguir un peso exponencial de (j ) a lo largo del horizonte usando: N2 ;j (j ) = Si est a comprendido entre 0 y 1 indica que se penaliza m as a los errores m as alejados del instante t que a los m as pr oximos, dando lugar a un control m as suave y con menor esfuerzo. Si, por el contrario, > 1 es que se penalizan m as los primeros errores, provocando un control m as brusco. Todos estos valores pueden ser usados como par ametros de sintonizaci on, obteniendo un abanico muy amplio de posibilidades con las que se puede cubrir una extensa gama de opciones, desde un control est andar hasta una estrategia disenada a medida para un proceso en particular. Trayectoria de referencia: Una de las ventajas del control predictivo es que si se conoce a priori la evoluci on futura de la referencia, el sistema puede empezar a reaccionar antes de que el cambio se haya efectivamente realizado, evitando los efectos del retardo en la respuesta del proceso. En muchas aplicaciones la evoluci on futura de la referencia r(t + k ) es conocida de antemano, como en Robotica, servos o procesos en batch; en otras aplicaciones aunque la referencia sea constante, se puede conseguir una sensible mejora de prestaciones simplemente conociendo el instante de cambio de valor y adelant andose a esa circunstancia. En el criterio de minimizaci on (2.3), la mayor a de los m etodos suelen usar una trayectoria de referencia w(t + k ) que no tiene por qu e coincidir con la referencia real. Normalmente ser a una suave aproximaci on desde el valor actual de la salida y(t) a la referencia conocida mediante un sistema de primer orden:

w(t) = y(t)

w(t + k) = w(t + k ; 1) + (1 ; )r(t + k) k = 1 : : : N

(2

:4)

es un par ametro comprendido entre 0 y 1 (mientras m as pr oximo a 1 m as suave ser a la aproximaci on) que constituye un valor ajustable que inuir a en la respuesta din amica del sistema. En la gura 2.3 se muestra la forma de la trayectoria cuando la referencia r (t + k) es constante y para dos valores distintos de ; para valores pequenos de este par ametro se tiene un seguimiento r apido

Controladores predictivos

17

(w1 ) mientras que si aumenta, la trayectoria de referencia ser a w2 dando lugar a una respuesta m as suave.

r(t+k) w1(t+k) y(t)

w2 (t+k)

Figura 2.3: Trayectoria de referencia

Restricciones: En la pr actica, todos los procesos est an sujetos a restricciones. Los actuadores tienen un campo limitado de acci on as como una determinada velocidad de cambio (slew rate), como es el caso de las v alvulas, limitadas por las posiciones de totalmente abierta o cerrada y por la velocidad de respuesta. Razones constructivas, de seguridad o medioambientales o bien los propios alcances de los sensores pueden causar l mites en las variables de proceso, tales como niveles en depositos, caudales en tuber as o temperaturas y presiones m aximas. Adem as, normalmente las condiciones de operaci on vienen denidas por la intersecci on de ciertas restricciones por motivos fundamentalmente econ omicos, con lo que el sistema de control operar a cerca de los l mites. Todo lo expuesto anteriormente hace necesaria la introducci on de restricciones en la funci on a minimizar. Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo xito en la industria. Normalmente se considerar cual han tenido gran e an l mites en la amplitud y el slew rate de la senal de control y l mites en las salidas:

umin dumin ymin

u(t) u(t) ; u(t ; 1) y(t)

umax dumax ymax

8t 8t 8t

con la adici on de estas restricciones a la funci on objetivo, la minimizaci on resulta m as compleja, no pudiendo obtenerse la soluci on anal ticamente como en el caso sin restringir.

18

de los principales algoritmos Revision

2.1.3

Obtenci on de la ley de control

Para obtener los valores u(t + k j t) ser a necesario minimizar la funcional J de la ecuaci on (2.3). Para ello se calculan los valores de las salidas predichas y (t + k j t) en funci on de valores pasados de entradas y salidas y de senales de control futuras, haciendo uso del modelo que se haya elegido y se sustituyen en la funci on de coste, obteniendo una expresi on cuya minimizaci on conduce a los valores buscados. Para el criterio cuadr atico si el modelo es lineal y no existen restricciones se puede obtener una soluci on anal tica, en otro caso se debe usar un m etodo iterativo de optimizaci on. De cualquiera de las maneras la obtenci on de la soluci on no resulta trivial pues existir an N2 ; N1 + 1 variables independientes, valor que puede ser elevado (del orden de 10 a 30). Con la idea de reducir estos grados de libertad se puede proponer cierta estructura a la ley de control. Adem as se ha encontrado que esta estructuraci on de la ley de control produce una mejora en la robustez y en el comportamiento general del sistema, debido fundamentalmente a que el hecho de permitir la libre evoluci on de las variables manipuladas (sin estructurar) puede conducir a senales de control de alta frecuencia no deseables y que en el peor de los casos podr an conducir a la inestabilidad. Esta estructura de la ley de control se plasma en el uso del concepto de horizonte de control (Nu), que consiste en considerar que tras un cierto intervalo Nu < N2 no hay variaci on en las senales de control propuestas, es decir:

4u(t + j ; 1) = 0

j > Nu

lo cual es equivalente a dar pesos innitos a las cambios en el control a partir de cierto instante. El caso l mite ser a considerar Nu igual a 1 con lo que todas las acciones futuras ser an iguales a u(t)1 .

de los principales algoritmos 2.2 Revision


Se presentan a continuaci on los principales algoritmos de control predictivo, mostrando sus principales caracter sticas pero sin entrar en detalles. Se pueden encontrar estudios comparativos en [10], [7], [11] y [16]. En el tema siguiente se estudiar an en detalle los dos m etodos considerados m as representativos: DMC y GPC.

Dynamic Matrix Control Este m etodo usa la respuesta ante escal on (2.2) para modelar el proceso, considerando los N primeros t solo erminos, asumiendo por tanto que el proceso es estable. En
Recu erdese que debido al horizonte deslizante, la senal de control se recalcula en el siguiente muestreo.
1

Controladores predictivos

19

cuanto a las perturbaciones, se considera que su valor permanence constante e igual al existente en el instante actual durante todo el horizonte, es decir, igual al valor medido de la salida (ym ) menos el estimado por el modelo y (t j t)).

n (t j t) = ym (t) ; y (t j t) (t + k j t) = n
y por tanto el valor predicho de la salida ser a:

y (t + k j t) =

k X i=1

gi 4 u(t + k ; i) +

N X i=k+1

gi 4 u(t + k ; i) + n (t + k j t)

donde el primer t ermino contiene las acciones de control futuras (que ser an calculadas), el segundo los valores pasados de las acciones de control (conocidas) y el ultimo representa las perturbaciones. La funci on de coste puede considerar s olo errores futuros o incluir tambi en el esfuerzo de control, en cuyo caso toma la forma gen erica (2.3). Una de las caracter sticas de este m etodo que lo ha hecho muy popular en la industria es la inclusi on de restricciones, que se traduce en inecuaciones de la forma gen erica:

N X i=1

jy j u(t + k ; i) + cj Cyi (t + k j t) + Cui

j = 1 : : : Nc

En este caso la optimizaci on debe ser num erica y se lleva a cabo en cada periodo de muestreo, envi andose la senal u(t) y recalculando todo en el nuevo periodo de muestreo, como en todos los m etodos MPC. Los principales inconvenientes de este m etodo son el tamano del modelo empleado y la imposibilidad de tratar procesos inestables.

Model Algorithmic Control Este m etodo se conoce tambi en como Model Predictive Heuristic Control y el producto comercial se llama IDCOM (Identication-Command). Es muy similar al DMC con la diferencia principal de usar un modelo de respuesta impulsional (2.1). Introduce el concepto de trayectoria de referencia como un sistema de primer orden que evoluciona desde la salida actual al setpoint seg un una determinada constante de tiempo. La varianza del error entre esta trayectoria y la salida es lo que marca la minimizaci on de la funci on objetivo. Las perturbaciones se pueden tratar como en el m etodo anterior o se pueden estimar seg un la siguiente expresi on:

n (t + k j t) = n (t + k ; 1 j t) + (1 ;

)(

ym(t) ; y (t j t))

con n (t j t) = 0. es un par ametro ajustable (0 < 1) relacionado con el tiempo de respuesta, el ancho de banda y la robustez del bucle cerrado [7]. El m etodo tambi en considera restricciones en los actuadores, en las variables internas o en salidas secundarias.

20

de los principales algoritmos Revision

Puntos de coincidencia

Figura 2.4: Puntos de coincidencia Predictive Functional Control Este controlador fue desarrollado por Richalet [18] para procesos r apidos. Emplea un modelo en el espacio de estados, por lo que permite el manejo de procesos inestables, y tambi en la extensi on al caso no lineal. Este esquema de control tiene dos caracter sticas que lo distinguen del resto de controladores de la familia: el uso de puntos de coincidencia y de funciones base. El concepto de puntos de coincidencia (ver gura 2.4) se emplea para simplicar los c alculos considerando s olo un subconjunto de puntos en el horizonte de predicci on hj , j = 1 : : : nH . La salida deseada y la predicha deben coincidir en dichos puntos, no en todo el horizonte de predicci on. La otra idea innovadora de este m etodo es la parametrizaci on de la senal de control como una combinaci on lineal de ciertas funciones base, que son elegidas seg un la naturaleza del proceso y la referencia:

u(t + k) =

nB X i=1

i (t)Bi (k)

Normalmente estas funciones son de tipo polin omico: escalones (B1 (k ) = 1), rampas (B2 (k ) = k) o par abolas (B3 (k ) = k2 ), ya que la mayor a de referencias se pueden especicar como combinaci on de estas funciones. Con esta estrategia, un perl de entrada complejo se puede especicar usando un pequeno n umero de par ametros desconocidos i que son las inc ognitas del problema de minimizaci on. La funci on a minimizar es:

J=

nH X j =1

y (t + hj ) ; w(t + hj )]2

El algoritmo PFC tambi en puede manejar restricciones de m aximo y m nimo en la aceleraci on, que son pr acticas en aplicaciones de servocontrol.

Controladores predictivos
Extended Prediction Self Adaptive Control El algoritmo EPSAC usa un modelo de funci on de transferencia

21

A(z;1 )y(t) = B (z;1 )u(t ; d) + v(t) donde d es el retardo y v (t) la perturbaci on. Este modelo puede ampliarse para tratar perturbaciones medibles anadiendo un t ermino D (z;1 )d(t) para incluir efecto feedfor-

ward. La predicci on se obtiene seg un se muestra en [10] y la estructura de la ley de control es muy simple, ya que se considera que la senal de control permanecer a constante a partir del instante t (es decir, horizonte de control igual a 1): 4u(t + k ) = 0 para k > 0. Para obtener la senal de control de minimiza una funci on de coste de la forma: N X ;1 (t + k j t)]2 (k ) w (t + k ) ; P (z )y k=d donde P (z ;1 ) es un polinomio de diseno con ganancia unitaria y (k) es una secuencia de ponderaci on. La senal de control se puede calcular anal ticamente de la forma:

N P hk (k) w(t + k) ; P (z;1)y (t + k j t)] u(t) = k=d N P (k )h2


siendo hk los coecientes de la respuesta impulsional del sistema. Extended Horizon Adaptive Control Esta formulaci on tambi en emplea un modelo de funci on de transferencia y pretende minimizar la discrepancia entre la salida calculada y la referencia en el instante t + N : (t + N j t) ; w(t + N ), con N d. La soluci y on a este problema no es unica (a menos que N = d)[21]; una posible estrategia es considerar horizonte de control igual a 1:

k=d

4u(t + k ; 1) = 0
o minimizar el esfuerzo de control

1<k

N ;d

J=

N ;d X k =0

u2(t + k)

y (t + N j t) = y (t) + F (z ;1 ) 4 y (t) + E (z ;1 )B (z ;1 ) 4 u(t + N ; d) donde E (z ;1 ) y F (z ;1 ) son polinomios que satisfacen la relaci on ;1 ;1 ;1 ;1 ;N F (z;1 )(1 ; z;1 ) (1 ; z ) = A(z )E (z )(1 ; z ) + z

Este m etodo utiliza un predictor de N pasos de la forma

22

de los principales algoritmos Revision

con el grado de E igual a N ; 1. Una ventaja de este m etodo es que se puede encontrar f acilmente una soluci on expl cita, dada por

u(t) = u(t ; 1) +

0(

w(t + N ) ; y (t + N j t)) N ;d 2 P
k=0 i

siendo k el coeciente correspondiente a 4u(t + k) en la ecuaci on de predicci on. Por tanto la ley de control depende s olo de los par ametros del proceso y puede hacerse f acilmente adaptativa si se emplea un identicador en l nea. El unico coeciente de ajuste es el horizonte de predicci on N , lo cual simplica el uso pero proporciona poca libertad para el diseno. Obs ervese que no puede usarse trayectoria de referencia porque el error se considera s olo en un instante (t + N ), ni tampoco la ponderaci on del esfuerzo de control.

Generalized Predictive Control Este m etodo propuesto por Clarke et al. [5] emplea un modelo CARIMA (Controlled Auto-Regressive Integrated Moving Average) para la predicci on de la salida:
(t) A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1 ) e4

donde la perturbaci on viene dada por un ruido blanco coloreado por el polinomio ; 1 C (z ). Como en la pr actica es dif cil encontrar el verdadero valor de este polinomio, se puede emplear como par ametro de diseno para rechazo de perturbaciones o mejora de la robustez. La predicci on optima se lleva a cabo resolviendo una ecuaci on diof antica, lo cual puede hacerse ecazmente de forma recursiva. Este algoritmo, al igual que otros que usan el modelo de funci on de transferencia, se puede implementar f acilmente en forma adaptativa usando un algoritmo de identicaci on en l nea como los m nimos cuadrados recursivos.
GPC

usa una funci on de coste cuadr atica de la forma N2 Nu X X J (N1 N2 Nu) = (j ) y (t + j j t) ; w(t + j )]2 + j =N1 j =1

( )

4u(t + j ; 1)]2

donde las secuencia de ponderaci on (j ) y (j ) se eligen normalmente constantes o exponenciales y la trayectoria de referencia w (t + j ) se puede generar como una secuencia que empieza en el valor actual de la salida y tiende exponencialmente al setpoint. Las bases te oricas del algoritmo GPC has sido ampliamente estudiadas y se puede demostrar (ver [4]) que, para distintos conjuntos de par ametros, el algoritmo es estable ste. y que otros controladores como por ejemplo el dead beat son casos incluidos en e

Controladores predictivos

23

2.3 Estado de la tecnolog a


Se puede considerar que productos como el MAC-IDCOM o el DMC est an ampliamente introducidos en la industria, proporcionando un buen control de sistemas multivariables sin restricciones y constituyen la primera generaci on de controladores predictivos. Sin embargo, la gesti on de restricciones es algo que todav a no estaba bien resuelto en estos productos hasta que apareci o una versi on de DMC denominada QDMC, ligera variaci on del algoritmo b asico en el que se consideran restricciones duras y blandas de forma sistem atica. Este algoritmo se suele considerar como la segunda generaci on. es y aceptaci on, los probleConforme la tecnolog a MPC iba despertando mayor inter mas que se abordaban eran cada vez m as complejos, apareciendo nuevas problem aticas como el tratamiento de la no-factibilidad, la consideraci on de modelos apropiados para procesos inestables o la representaci on de la perturbaci on para la realimentaci on de otra forma m as adecuada que un valor constante. Tambi en se consideraba importante la respuesta ante fallos, de forma que el controlador fuera capaz de recongurarse si se perdiera alguna senal, o la dicultad de incluir diversos requerimientos de control en una unica funci on objetivo. Estos problemas motivaron el desarrollo de algoritmos como HIECON (Hierarchical Constrained Control, por Adersa) o IDCOM-M (por parte de Setpoint). Este ultimo incluye un supervisor para plantas mal condicionadas, funci on objetivo multicriterio o sticas como jerarqu a de restricciones. El SMOC de Shell es similar incluyendo caracter modelos en espacio de estados (v alidos para sistemas inestables) o la consideraci on de un observador extendido para la realimentaci on de la salida en lugar del valor constante empleado en los dem as m etodos. Estos m etodos junto con el PCT de Promatics, el RMPCT de Honeywell o el PFC de Adersa constituyen la tercera generaci on. Los productos que existen hoy d a en el mercado comparten las ideas b asicas de nfasis en los ultimos DMC o MAC desarrollados hace m as de veinte anos y el mayor e anos se ha centrado en la consideraci on de otros tipos de modelos, incluyendo modelos no lineales, y en una mejor integraci on del controlador con los equipos de control existentes. A pesar de su creciente implantaci on, la tecnolog a actual tiene todav a ciertas limitaciones, siendo las m as destacables las siguientes: Modelos sobre-parametrizados. La mayor a de los productos comerciales usan modelos de convoluci on, que emplean una cantidad considerable de par ametros y no se pueden usar para representar din amicas inestables. Sintonizaci on. No existe una clara relaci on entre los par ametros de sinton a y el comportamiento del bucle cerrado. La garant a de estabilidad, sobre todo cuando existen restricciones, es otro gran problema.

24

Estado de la tecnolog a
Optimalidad de la soluci on. Muchos paquetes proporcionan una soluci on sub optima para acelerar el c alculo. En algunos casos este procedimiento no est a justicado. Incertidumbres en el modelo. Normalmente no se tiene en cuenta la incertidumbre asociada a la identicaci on, sino que se desintoniza el controlador intentando aumentar la robustez. Perturbaci on constante. Aunque es la hip otesis m as sensata a priori, se podr a obtener una mejor realimentaci on si la distribuci on de la perturbaci on se estudiara con m as cuidado.

Tema 3 Algoritmos
En este tema se tratan en profundidad los dos algoritmos considerados m as representativos de las metodolog as existentes en Control Predictivo. Representan a las dos familias de controladores predictivos, una de origen claramente industrial y la otra m as acad emica.

3.1 Dynamic Matrix Control


El m etodo DMC se desarroll o a nales de los setenta by Cutler and Ramaker [6] de Shell Oil Co. y ha sido aceptado ampliamente en el mundo industrial, principalmente por las industrias petroqu micas. Actualmente DMC es algo m as que un algoritmo y parte xito se debe al hecho de que el producto comercial resuelve otros temas como de su e identicaci on u optimizaci on global de la planta. En esta secci on s olo se analiza el algoritmo standard sin abordar detalles t ecnicos propios del producto de mercado que no son de dominio p ublico. xito en la pr Pero a pesar de este e actica, este m etodo adolece quiz as de la ausencia de un an alisis te orico ma s completo que estudie la inuencia de los par ametros de diseno (horizontes, secuencias de ponderaci on) sobre la estabilidad del bucle cerrado as como de resultados de robustez.

3.1.1

Predicci on

El modelo de proceso que se emplea es el de respuesta temporal, considerando la perturbaci on como constante a lo largo del horizonte. El procedimiento para obtener la predicci on se describe a continuaci on. 25

26 Como se emplea un modelo de respuesta ante escal on:

Dynamic Matrix Control

y(t) =

1 X
i=1

gi 4 u(t ; i)

los valores predichos a lo largo del horizonte ser an:

gi 4 u(t + k ; i) + n (t + k j t) = 1 k X X gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + n (t + k j t) =


i=1 i=1 i=k+1
Las perturbaciones se consideran constantes, n (t + k j t) = n (t j t) = ym (t) ; y (t j t), por lo que se puede escribir:

(t + k j t) = y

1 X

k 1 X X y (t + k j t) = gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + ym(t) ; i=1 i=k+1 1 k X X ; gi 4 u(t ; i) = gi 4 u(t + k ; i) + f (t + k) i=1 i=1


donde f (t + k ) es la respuesta libre del proceso, es decir, la parte de la respuesta que no depende de las acciones de control futuras, y viene dada por:

f (t + k) = ym(t) +

1 X
i=1

gk+i ; gi) 4 u(t ; i)

(3

:1)

Si el proceso es asint oticamente estable, los coecientes gi de la respuesta ante tienden a un valor constante despu escalon es de N periodos de muestreo, por lo que se puede considerar que gk+i ; gi 0 i>N y por tanto la respuesta libre se puede calcular como

f (t + k) = ym(t) +

N X i=1

gk+i ; gi) 4 u(t ; i)

Notese que si el proceso no es estable, entonces no existe N y no se puede calcular f (t + k) (aunque existe una generalizaci on en el caso de que la inestabilidad sea producida por integradores puros). (k
=

Ahora las predicciones se pueden calcular a lo largo del horizonte de predicci on 1 : : : p), considerando m acciones de control.

y (t + 1 j t)

g1 4 u(t) + f (t + 1)

Algoritmos

27

y (t + 2 j t) y (t + p j t)

. . .
=

g2 4 u(t) + g1 4 u(t + 1) + f (t + 2)
p X gi 4 u(t + p ; i) + f (t + p) i=p;m+1

Si se dene la matriz din amica G como:

2 g1 0 6 g2 g1 6 6 . . 6 . . 6 . . 6 6 g g m m;1 6 6 . 6 . 4 . ... gp gp;1

... ...

. . . gp;m+1

g1

0 0 . . .

3 7 7 7 7 7 7 7 7 7 7 5

se puede escribir que:

y ^ = Gu + f u y ^

(3

:2)

Obs ervese que est a formada por m (horizonte de control) columnas de la respuesta ante escal on apropiadamente desplazadas hacia abajo. es un vector de dimensi on p que contiene las predicciones de la salida, representa el vector de incrementos de control y es el vector de respuestas libres. Esta es la expresi on que relaciona las respuestas futuras con los incrementos en las senales de control, por lo que usar a para calcular las acciones necesarias para conseguir el comportamiento deseado del sistema.

3.1.2

Perturbaciones medibles

El efecto de las perturbaciones medibles se puede anadir f acilmente a las anteriores stas se pueden tratar como entradas al sistema. La ecuaciones de predicci on, ya que e expresi on (3.2) se puede usar para calcular la predicci on del efecto de las perturbaciones en la salida de la siguiente forma:

y ^d = Dd + fd
donde d es la contribuci on de las perturbaciones medibles a la salida, es una matriz similar a que contiene los coecientes de la respuesta del sistema a un escal on en la perturbaci on, es el vector de incrementos en la perturbaci on y d es la parte de la respuesta que no depende de la perturbaci on.

y ^

En el caso m as general de perturbaciones medibles y no medibles, la respuesta libre completa del sistema (la fracci on de la salida que no depende de la variable manipulada)

28

Dynamic Matrix Control

se puede considerar como la suma de cuatro efectos: la respuesta a la entrada u(t), a la perturbaci on medible d(t), a la perturbaci on no medible y al estado actual del proceso:

f = fu + D d + fd + fn
Por tanto la predicci on se puede expresar en la forma general

y ^ = Gu + f
3.1.3 Algoritmo de control

xito en la industria del DMC se ha debido principalmente a su aplicaci El e on a sistemas multivariables de gran dimensi on con la consideraci on de restricciones. En esta secci on se describe el algoritmo de control comenzando por el caso m as simple de un sistema monovariable sin restricciones y extendi endolo posteriormente al caso general multivariable con restricciones. El objetivo del controlador DMC es llevar el proceso los m as cerca posible al setpoint en el sentido de m nimos cuadrados con la posibilidad de incluir una penalizaci on en los movimientos de la senal de control. Por ello se seleccionan las variables manipuladas de forma que minimicen un objetivo cuadr atico que puede incluir s olo los errores futuros p

j =1 o tambi en el esfuerzo de control, presentando la forma gen erica

J=

y (t + j j t) ; w(t + j )]2
m X j =1

J=

p X j =1

y (t + j j t) ; w(t + j )]

4u(t + j ; 1)]2

T, Si no existen restricciones, la minimizaci on de la funci on de coste J = T + donde es el vector de errores futuros a lo largo del horizonte de predicci on y es el vector de futuros incrementos en la senal de control 4u(t) : : : 4u(t + m), se puede hacer de forma anal tica calculando la derivada de J y haci endola igual a 0, lo que proporciona el resultado general:

ee

uu

u = (GT G + I ); GT (w ; f )
1

(3

:3)

Recu erdese que, como en todas las estrategias predictivas, s olo se env a al proceso el primer elemento del vector (4u(t)). No es aconsejable implementar la secuencia completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que provocan que la salida real diera de las predicciones que se emplean para calcular la

Algoritmos
w + K
-

29
u Proceso y

f Calculo Resp. libre

Figura 3.1: Ley de control secuencia futura de acciones de control. Adem as, el setpoint puede cambiar durante los pr oximos m intervalos. Resulta interesante analizar en qu e consiste realmente la ley de control. Analizando la expresi on 3.3 se observa que el primer elemento del vector u, que es la senal que efectivamente se env a a la planta, es el producto de la primera la de la matriz (GT G + I );1 GT (llam emosle K ) por la diferencia entre la trayectoria de referencia y la respuesta libre, que es el error futuro si no hubiera incrementos en la senal de control. Se puede decir por tanto que el incremento de la senal de control es proporcional (por medio de K ) a los errores futuros y por tanto habr a cambios en la senal de control siempre que el controlador detecte que va a haber una discrepancia en el futuro entre el objetivo deseado y el comportamiento esperado del sistema. Esta idea queda reejada en la gura 3.1.

El caso con restricciones Aunque computacionalmente m as complicado que otros algoritmos m as simples, la capacidad de manejar restricciones que posee este m etodo (y MPC en general) lo hace muy atractivo para aplicaciones pr acticas, ya que en general el punto de operaci on optimo seg un criterios econ omicos se encuentra normalmente en la intersecci on de las restricciones, como se muestra en la gura 3.2. Por razones de seguridad, es necesario mantener una zona segura alrededor del punto de operaci on, ya que el efecto de las perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona se puede reducir (y por tanto aumentar los benecios econ omicos) si el controlador es capaz de manejar restricciones (punto de operaci on 1). Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades de forma gen erica

N X i=1

jy j u(t + k ; i) + cj Cyi (t + k j t) + Cui

j = 1 : : : Nc

30

Dynamic Matrix Control


P. operacion optimo

Zona segura 1

Punto operacion 1 Restriccion zona segura 2 Punto operacion 2

Restriccion

Figura 3.2: Punto de operaci on optimo de un proceso t pico que deben tenerse en cuenta para la minimizaci on. Como se ha visto, las salidas se pueden expresar en funci on del vector de incrementos de control a trav es de la matriz din amica, por que las restricciones tanto en la entrada como en la salida se pueden , como se ver a con m as recoger en una desigualdad matricial de la forma detalle en el tema dedicado a restricciones. Ahora la minimizaci on es un problema de on es num erica. Programaci on Cuadr atica QP, cuya soluci

Ru

Todo lo relacionado con las restricciones ser a abordado con mayor grado de detalle en el tema dedicado a ello.

Extensi on al caso multivariable El esquema previo se puede extender f acilmente al caso de sistemas con varias entradas y varias salidas. Las ecuaciones b asicas se mantienen igual a excepci on de que las matrices y vectores cambian de dimensi on para poder incluir todas las entradas y salidas. Al tratarse de modelos lineales, se puede aplicar el principio de superposici on para obtener el valor de las salidas ante las diversas entradas. Para ello se dene el vector de salidas futuras como:

y ^ = y (t + 1 j t) : : : y (t + p j t) : : : yny (t + 1 j t) : : : yny(t + pny j t) T


1 1 1

y el de senales de control de la forma:

u = [4u (t) : : : 4u (t + m
1 1

; 1)

:::

4unu(t)

:::

4unu(t + mnu ; 1)]T

as como la respuesta libre:

f = f (t + 1 j t) : : : f (t + p j t) : : : fny (t + 1 j t) : : : fny (t + pny j t) T


1 1 1

teniendo en cuenta que la respuesta libre de la salida i depende tanto de valores pasados de yi como de valores pasados de todas las senales de control.

Algoritmos

31

Con estas deniciones, la ecuaci on de predicci on es igual que en el caso monovariable simplemente considerando que la matriz G toma la forma:

2 G G 11 12 6 G G 6 21 22 6 . . 6 . . 4 . . Gny1 Gny2

...

. . . Gnynu

G1nu G2nu

3 7 7 7 7 5

Cada submatriz Gij contiene los coecientes de la respuesta ante escal on i- esima correspondiente a la entrada j- esima. El proceso de minimizaci on es an alogo s olo que la ponderaci on tanto de los errores como de los esfuerzos de control se realiza con matrices de peso.

3.2 Control Predictivo Generalizado


El Control Predictivo Generalizado GPC fue propuesto por Clarke et al. en 1987 y se ha mbito del Control Predictivo convertido en uno de los m etodos m as populares en el a xito en tanto en el mundo industrial como en el acad emico. Se ha empleado con e numerosas aplicaciones industriales, mostrando buenas prestaciones a la vez que un cierto grado de robustez respecto a sobreparametrizaci on o retardos mal conocidos. Puede resolver muchos problemas de control diferentes para un amplio campo de procesos con un n umero razonable de variables de diseno, que son especicadas por el operario dependiendo del conocimiento previo del proceso y de los objetivos de control. La idea b asica del GPC es calcular una secuencia de futuras acciones de control de tal forma que minimice una funci on de coste multipaso. El ndice a minimizar es una funci on cuadr atica que mide por un lado la distancia entre la salida predicha del sistema y una cierta trayectoria de referencia hasta el horizonte de predicci on, y por otro el esfuerzo de control necesario para obtener dicha salida. El Control Predictivo Generalizado tiene muchas ideas en com un con otros controladores predictivos previamente mencionados ya que est a basado en las mismas ideas pero posee a su vez algunas diferencias. Como se ver a m as adelante, es capaz de proporcionar una soluci on expl cita (en ausencia de restricciones), puede trabajar con procesos inestables o de fase no m nima e incorpora el concepto de horizonte de control as como la consideraci on en la funci on de coste de ponderaci on de los incrementos en las acciones de control. Las diversas posibilidades disponibles para el GPC conducen a una gran variedad de objetivos de control comparado con otras realizaciones, algunas de las cuales pueden ser consideradas como subconjuntos o casos l mites del GPC.

32

Control Predictivo Generalizado

3.2.1

Formulaci on del Control Predictivo Generalizado

La mayor a de los procesos de una sola entrada y una sola salida (single-input singleoutput, SISO), al ser considerados en torno a un determinado punto de trabajo y tras ser linealizados, pueden ser descritos de la siguiente forma:

A(z;1 )y(t) = z;d B (z;1 )u(t ; 1) + C (z;1)e(t)


donde u(t) y y (t) son respectivamente la senal de control y la salida del proceso y e(t) es un ruido blanco de media cero. A, B y C son los siguientes polinomios en el operador de desplazamiento hacia atr as z ;1 :

A(z;1 ) B (z;1 ) C (z;1)

= = =

1 + a1 z ;1 + a2 z ;2 + ::: + ana z ;na b0 + b1 z;1 + b2 z;2 + ::: + bnbz;nb 1 + c1 z ;1 + a2 z ;2 + ::: + cncz ;nc

donde d es el tiempo muerto del sistema. Este modelo es conocido como Autorregresivo de Media M ovil (Controller AutoRegressive Moving-Average CARMA). En muchas aplicaciones industriales en las que las perturbaciones son no-estacionarias resulta m as conveniente el uso de un modelo CARMA integrado, dando lugar al CARIMA, que viene descrito por:
(t) A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1) e4

con

4 = 1 ; z;1

(3

:4)

Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. N otese que en el caso de que C ;1 pueda ser truncado se puede absorber en A y B . El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia de senales de control que minimice una funci on de coste de la forma:

J (N1 N2 Nu) =

N X
2

j =N1

( )

j y (t + j j t) ; w (t + j )]

Nu X j =1

( )

4u(t + j ; 1)]2

(3

:5)

donde y (t + j j t) es la predicci on optima j pasos hacia delante de la salida del proceso con datos conocidos hasta el instante t, N1 y N2 son los horizontes m nimo y m aximo de coste, Nu es el horizonte de control y (j ) y (j ) son las secuencias de ponderaci on mientras que w(t + j ) es la futura trayectoria de referencia, que se puede calcular seg un se muestra en la gura 2.3. En muchas situaciones se considera (j ) igual a 1 y (j ) constante. El objetivo es pues el c alculo de la futura secuencia de control u(t), u(t + 1),... de tal manera que la salida futura del proceso y (t + j ) permanezca pr oxima a w (t + j ). Esto se logra minimizando J (N1 N2 Nu).

Algoritmos
Predicci on optima

33

Con la intenci on de minimizar la funci on de coste, se obtendr a previamente la pre N1 y j N2. Consid erese la siguiente ecuaci on dicci on optima de y (t + j ) para j diof antica: 1 = Ej (z ;1 ) 4 A + z ;j Fj (z ;1 ) + z ;j Fj (z ;1 ) 1 = Ej (z ;1 )A (3.6)

Los polinomios Ej y Fj est an unicamente denidos con grados j ; 1 y na respec (z ;1 ) hasta que el resto pueda tivamente. Se pueden obtener dividiendo 1 entre A ; j ; 1 on es entonces el polinomio ser factorizado como z Fj (z ). El cociente de la divisi ; 1 Ej (z ). Si se multiplica la ecuaci on (3.4) por Ej (z ;1 ) z j 4 (z ;1 )Ej (z ;1 )y (t + j ) = Ej (z ;1 )B (z ;1 ) 4 u(t + j ; d ; 1) + Ej (z ;1 )e(t + j ) A

(3.7)

Teniendo en cuenta (3.6), la ecuaci on (3.7) queda:


(1 ;

z;j Fj (z;1 ))y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j ) :8)

La cual se puede escribir como

y(t + j ) = Fj (z;1 )y(t) + Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j )

(3

y (t + j j t) = Gj (z ;1 ) 4 u(t + j ; d ; 1) + Fj (z ;1 )y (t) donde Gj (z ;1 ) = Ej (z ;1 )B (z ;1 )

Al ser el grado del polinomio Ej (z ;1 ) igual a j ; 1 los t erminos del ruido en la ecuaci on (3.8) est an todos en el futuro. La mejor predicci on de y (t + j ) ser a por consiguiente:

Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursivamente, de forma que los nuevos valores en el paso j + 1 (Ej +1 y Fj +1) sean funci on de los del paso j . A continuaci on se muestra una demostraci on simple de la recursividad an basadas en de la ecuaci on diof antica. Existen otras formulaciones del GPC que no est la recursividad de esta ecuaci on. (z ;1 ) Consid erense que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A hasta que el resto haya sido factorizado como z;j Fj (z ;1 ) . Con:

Fj (z;1 ) Ej (z;1 )

= =

fj 0 + fj 1z;1 + ej 0 + ej 1z;1 +

fj naz;na ;(j;1) + ej j ;1 z
+

34

Control Predictivo Generalizado

Supongase que se utiliza el mismo procedimiento para obtener Ej +1 y Fj +1, es decir, (z ;1 ) hasta que el resto se pueda factorizar como z;(j +1) Fj +1 (z ;1 ) con dividir 1 entre A

Fj+1(z;1 ) = fj+1 0 + fj+1 1z;1 +

fj+1 naz;na

Est a claro que solamente es necesario dar un paso m as en la divisi on para obtener los polinomios Ej +1 y Fj +1 . Al ser Ej +1 el nuevo cociente de la divisi on, ser a igual al cociente que hab a hasta el momento (Ej ) m as un nuevo t ermino, que ser a el fj 0 pues el divisor (A) es monico. Por tanto:

Ej+1(z;1 ) = Ej (z;1 ) + ej+1 j z;j

con ej +1 j

fj 0

Teniendo en cuenta que el nuevo resto ser a el resto anterior menos el producto del cociente por el divisor, los coecientes del polinomio Fj +1 se pueden expresar como:

fj+1 i = fj i+1 ; fj 0 a i+1 i = 0

na

En resumen, la forma de obtener los polinmios Ej y Fj es la siguiente: 1. Comenzar con E1


=

1, F1

) z(1 ; A
=

2. Ir anadiendo nuevos t erminos a Ej con ej +1 j 3. Calcular fj +1 i


=

fj 0

f j i + 1 ; fj 0 a i+1 i = 0

na, (siendo fj na+1 = 0).

El polinomio Gj +1 puede ser obtenido recursivamente como sigue:

Gj+1 = Ej+1B = (Ej + fj 0z;j )B = Gj + fj 0z;j B


Es decir, los primeros j coecientes de Gj +1 ser an id enticos a los de Gj mientras que el resto viene dado por:

gj+1 j+i = gj j+i + fj 0 bi

para i = 0

nb

Para resolver el GPC es necesario obtener el conjunto de senales de control u(t), u(t + 1), ...,u(t + N ) que minimizan la ecuaci on (3.5). Al tener el proceso un retardo de d per odos de muestreo, la salida s olo se ver a inuenciada por la senal u(t) despu es del instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes pueden ser denidos como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido hacer N1 < d + 1 ya que los t erminos de (3.5) s olo depender an de las senales de control pasadas. Por otro lado, haciendo N1 > d + 1 los primeros puntos de la secuencia de salida, que ser an los mejor estimados, no se tendr an en cuenta.

Algoritmos
El conjunto de las j predicciones optimas: (t + d + 1 j t) y y (t + d + 2 j t)
= =

35

(t + d + N j t) y

. . .
=

Gd+1 4 u(t) + Fd+1 y(t) Gd+2 4 u(t + 1) + Fd+2 y(t) Gd+N 4 u(t + N ; 1) + Fd+N y(t)
1 1

puede ser escrito en forma matricial como:

y = Gu + F(z; )y(t) + G0(z; ) 4 u(t ; 1)


2 y 3 2 3 (t + d + 1 j t) 4u(t) 6 6 y (t + d + 2 j t) 7 4u(t + 1) 7 6 7 6 7 6 7 6 7 u = . . 6 7 6 7 . . 4 5 4 5 . . y (t + d + N j t) 4u(t + N ; 1) 2 g 0 ::: 0 3 0 6 g1 g0 ::: 0 7 7 6 7 6 . . . . 7 6 . . . . 4 . . . . 5 g g ::: g0 3 2 N ;1 N ;2 z(G d+1 (z ;1 ) ; g0 ) 7 6 z2 (Gd+2 (z;1 ) ; g0 ; g1z;1 ) 7 6 7 6 . 7 6 . 5 4 . N ; 1 ; 1 ; ( N ; 1) z (G (z ) ; g0 ; g1z ; ; gN ;1z ) 2 F (dz+;N 1 3 ) d+1 6 1 7 ; Fd+2 (z ) 7 6 6 7 . 6 7 . 4 5 . ; 1 Fd+N (z )

(3

:9)

Donde

y G G0(z; )
1

F( z ; )
1

Al depender los ultimos t erminos de la ecuaci on (3.9) s olo del pasado, pueden agruparse en f, dando lugar a: = + (3:10)

y Gu f

Obs ervese que es la misma expresi on que se obtuvo para el caso la respuesta libre es distinta.

DMC,

aunque en este

Obtenci on de la ley de control Entonces la ecuaci on (3.5) puede escribirse como: J = ( + ; )T ( + ;

Gu f w Gu f w) + uT u

(3

:11)

36 donde:

Control Predictivo Generalizado

w = w(t + d + 1) w(t + d + 2)
La ecuaci on (3.11) se puede poner como:

w(t + d + N )

iT

(3.12)

J=1 uT Hu + bu + f0 2
donde:

(3

:13)

H b f
0

= = =

2( T + ) 2( ; )T T ( ; ) ( ;

GG I f w G f w f w)
:14)

El m nimo de J , siempre que no existan restricciones en la senal de control, puede ser calculado igualando a cero el gradiente de J , lo cual conduce a:

u = ;H; bT
1

(3

Debido al uso de la estrategia deslizante, s olo se aplica realmente el primer elemento del vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo. La soluci on propuesta involucra la inversi on (o al menos la triangularizaci on) de una matriz de dimensi on N N , lo cual conlleva una gran carga de c alculo. El concepto ya usado en otros m etodos de horizonte de control se emplea con la nalidad de reducir la cantidad de c alculo, asumiendo que las senales de control permanecer an en un valor constante a partir del intervalo Nu < N . Por tanto la dimensi on de la matriz que hay que invertir queda reducida a Nu Nu, quedando la carga de c alculo reducida (en el caso l mite de Nu = 1, se reduce al caso escalar) aunque restringiendo la optimalidad.

3.2.2

Ejemplo de c alculo

Se presenta a continuaci on un ejemplo de c alculo de un Controlador Predictivo Generalizado en un caso sencillo. Se disenar a el controlador para un sistema de primer orden. Al discretizar el proceso continuo se obtiene el siguiente equivalente discreto:
(1 + (t) az;1 )y(t) = (b0 + b1 z;1 )u(t ; 1) + e4

Se va a considerar un retardo d igual a 0 y un polinomio de ruido C (z;1 ) igual a 1. Se usar a el algoritmo descrito previamente para obtener la ley de control, obteniendo resultados num ericos para valores de los pa ametros a = 0:8, b0 = 0:4 y b1 = 0:6, siendo

Algoritmos

37

los horizontes N1 = 1 y N = Nu = 3. Como se ha mostrado, se calcular an los valores predichos de la salida del proceso en el horizonte haciendo uso de la ecuaci on (3.9), obteniendo la ley de control de la expresi on (3.14). Resolviendo la ecuaci on (3.6) se obtienen los polinomios del predictor 1 ; Fj (z ) desde j = 1 hasta j = 3, con (z ;1 ) = A(z ;1 )(1 ; z ;1 ) = 1 ; 1:8z ;1 + 0:8z ;2 A

Ej (z;1 ),

En este caso sencillo donde el horizonte no es demasiado largo, estos polinomios se (z ;1 ). Como se ha explicado antes, pueden obtener directamente dividiendo 1 por A tambi en se pueden calcular recursivamente, comenzando con los valores obtenidos en el primer paso de la divisi on, es decir:

E1 (z;1 ) = 1

F1(z;1 ) = 1:8 ; 0:8z;1

Cualquiera que sea el m etodo empleado, los valores obtenidos son:

ser:

E2 = 1 + 1:8z;1 F2 = 2:44 ; 1:44z;1 E3 = 1 + 1:8z;1 + 2:44z;2 F3 = 2:952 ; 1:952z;1 Con estos valores y el polinomio B (z;1 ) = 0:4 + 0:6z ;1 , los elementos Gi (z ;1 ) resultan G1 = 0:4 + 0:6z;1 G2 = 0:4 + 1:32z;1 + 1:08z;2 G3 = 0:4 + 1:32z;1 + 2:056z;2 + 1:464z;3
y por tanto se pueden escribir las salidas predichas como:

3 2 y (t + 1 j t) 6 (t + 2 j t) 7 5 4y y (t + 3 j t)

2 3 32 0:4 0 0 4u(t) 6 4 1:32 0:4 0 7 5+ 56 4 4u(t + 1) 7 2:056 1:32 0:4 4u(t + 2) 2 3 0:6 4 u(t ; 1) + 1:8y (t) ; 0:8y (t ; 1) 6 4 1:08 4 u(t ; 1) + 2:44y(t) ; 1:44y(t ; 1) 7 5 | 1:464 4 u(t ; 1) + 2:952 {z y(t) ; 1:952y(t ; 1) }
f

primera la de la matriz, con lo que resulta la siguiente expresi on para la ley de control:

2 3 0:133 0:286 0:147 7 T ;1 T 6 (G G + I) G = 4 ;0:154 ;0:165 0:286 5 ;0:029 ;0:154 0:1334 Como s olo se necesita el valor de 4u(t) para los c alculos, s olo se emplea realmente la
4u(t)
= +

El paso siguiente es el c alculo de

H; b. Tomando
1

igual a 0:8 se tiene que:

;0:6042 4 u(t ; 1) ; 1:371y (t) + 0:805y (t ; 1) + 0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)

38

Control Predictivo Generalizado

donde w(t + i) es la trayectoria de referencia que se puede considerar bien constante sta. e igual a la referencia actual o bien una suave aproximaci on de primer orden a e Entonces la senal de control resulta ser una funci on de la referencia deseada y de entradas y salidas pasadas, dada por:

u(t)

= +

0:3958u(t ; 1) + 0:6042u(t ; 2) ; 1:371y (t) + 0:805y (t ; 1) + 0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)

Al mismo resultado se puede llegar sin emplear la ecuaci on diof antica, calculando G en base a los coecientes de la respuesta ante escal on (que se pueden calcular en funci on de los coecientes de la funci on de transferencia) y calculando la respuesta libre como se muestra en [2].

3.2.3

Caso multivariable

Al igual que en el DMC todo lo visto para el caso de sistemas con una sola entrada y una sola salida se puede extender al caso multivariable, aunque los c alculos son m as complejos. En este caso el modelo CARIMA para un sistema de m entradas y n salidas se puede expresar como: 1 ;1 ;1 ;1 (z )e(t) (z )y (t) = (z )u(t ; 1) + (3:15) 4 donde (z ;1 ) y (z ;1 ) son matrices polinomiales m onicas de dimensi on n es una matriz polinomial de dimensi on n m, denidos como:

n y B(z;1)

La predicci on conlleva la resoluci on de una ecuaci on diofantina matricial, que tambi en puede calcularse de forma recursiva.

In n + A1 z;1 + A2z;2 + + Ana z;na 1 ;1 + B2z;2 + + Bnb z;nb = B0 + B1 z 1 ;1 + C2z;2 + + Cnc z;nc = In n + C1 z Las variablesy (t), u(t) y e(t) son de dimensi on n 1, m 1 y n 1 respectivamente.
1

A(z; ) B(z; ) C(z; )

En muchas ocasiones el problema radica en la obtenci on adecuada del modelo en esta forma a partir de una matriz de transferencia en continuo que puede haberse obtenido a partir de la curva de reacci on. Una forma de hacerlo se muestra en [2]. Una vez obtenido el modelo, el criterio a minimizar tendr a la forma general

J (N1 N2 N3 ) =

N X
2

j =N1

ky (t + j j t) ; w (t + j )k2 R+

N X
3

j =1

k 4 u(t + j ; 1)k2 Q

Algoritmos

39

donde R y Q son matrices de ponderaci on denidas positivas que normalmente se eligen diagonales. La minimizaci on se realiza igual que en el caso monovariable dando como resultado un vector de senales de control a enviar a la planta en el instante actual: u1(t), u2(t) : : : um(t).

40

Control Predictivo Generalizado

Tema 4 Restricciones en Control Predictivo


En la pr actica todos los procesos est an sujetos a restricciones. Los actuadores tienen un campo limitado de acci on impuesto por l mites f sicos (por ejemplo una v alvula no puede abrir m as de un 100 % o un calentador no puede aportar m as de su potencia m axima. Tambi en existen l mites de seguridad (por ejemplo presiones o temperaturas m aximas), requerimientos tecnol ogicos (por ejemplo mantener temperaturas en un rango dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa medioambiental.

4.1 Tratamiento convencional de restricciones


El tratamiento convencional de restricciones en control de procesos se basa en que las restricciones en la variable manipulada (entrada) se cumplen saturando la salida del controlador. Sin embargo, las restricciones en la variable controlada (salida) no pueden abordarse; se intenta evitar su violaci on trabajando alejados de los l mites (en zona segura), operando lejos de la restricci on. Por seguridad se trabaja con una consigna ptimo, lo que normalmente equivale a una inferior, m as lejos del punto de operaci on o disminuci on de la calidad y/o cantidad en la producci on, ya que normalmente el punto optimo se encuentra en la intersecci on de las restricciones obligando a acercarse lo m as stas pero sin superarlas. posible a las e Si el controlador fuera capaz de tener en cuenta las restricciones y evitar su violaci on, stas y por tanto de forma m el proceso podr a operar m as cerca de e as eciente. La gura 4.1 muestra un ejemplo donde existe una limitaci on de presi on m axima y se observa como al alejar el punto de operaci on del l mite la producci on Q disminuye. En cuanto a la forma de operar de un controlador predictivo que no considera restricciones el procedimiento es similar: si la senal de control calculada viola la restricci on, se satura. Las senales futuras ni siquiera se tienen en cuenta, ya que normalmente no 41

42
P Pmax P1 P2

Restricciones en Control Predictivo

Q1 Q2

Figura 4.1: Restricciones y punto de operaci on optimo se calculan. Esta forma de proceder no garantiza el car acter optimo de la soluci on y en caso garantiza el cumplimiento de las restricciones en la salida. La violaci ningun on de los l mites de las variables controladas puede ser m as costoso y peligroso, produciendo danos en equipos y p erdidas en la producci on. La gura 4.2 muestra con claridad el fen omeno de p erdida de la soluci on optima cuando las variables manipuladas se mantienen en sus l mites por el programa de control o por el propio actuador. Este hecho puede llevar a valores mayores de la funci on objetivo y a un comportamiento no deseado (incluso inestabiliad). En 4.2a se muestra un caso con horizonte de control igual a 2, donde se observa que si se satura la senal de control u(t) a umax el valor de la funci on de coste no es el mejor que se podr a conseguir (que ser a el correspondiente a uc ). Incluso puede que no se viole la restricci on en el instante actual pero s en el futuro (gura 4.2b) con lo que la senal enviada al sistema (sin saturar) no es la mejor para el problema de dimensi on 2 que se est a optimizando.

4.2 Restricciones en Control Predictivo


En la actualidad el MPC es la unica metodolog a capaz de incorporar las restricciones de forma sistem atica en la fase de diseno del controlador, siendo esta caracter stica una xito en la industria. Parece l de las razones de su gran e ogico que al disponer de un modelo din amico del proceso se pueda conocer la evoluci on futura de su salida y por sta va a violar o no las restricciones y actuar en consecuencia. tanto se pueda saber si e stas en funci Para formular el algoritmo MPC con restricciones hay que expresar e on de la variable sobre la que se puede actuar, es decir, en funci on de u. Las restricciones en la entrada est an ya expresadas en funci on de u y para las restricciones en la salida se hace uso de las ecuaciones de predicci on que expresan el valor futuro de las salidas

Restricciones en Control Predictivo

43

u(t+1)

u(t+1)

u max

u max

uc u max

u u(t)

uc

u u max u(t)

a)

b)

Figura 4.2: Restricciones en la senal de control en funci on de las senales de control futuras y valores conocidos en el instante t. Cualquier controlador predictivo calcula la predicci on como:

y = Gu + f

por lo que tanto entradas como salidas se pueden expresar en funci on del vector de incrementos de la senal de control. Las restricciones que aparecen ser an b asicamente amplitud y velocidad de cambio en la senal de control y amplitud en la salida y se pueden expresar como:

U u y

u(t) u(t) ; u(t ; 1) y(t)

U u y

8t 8t 8t

Para un proceso de m entradas y n salidas y restricciones en el horizonte restricciones se pueden expresar como:

N , las

1U 1u 1y

T u + u(t ; 1) 1

u Gu + f

1U 1u 1y

donde es una matriz de dimensi on (N n) m formada por N m m matrices identidad y T es una matriz triangular inferior por bloques cuyos elementos no nulos son matrices identidad de dimensi on m m. En forma condensada se pueden expresar como: (4:1)

Ru c

44 siendo

Resoluci on del problema

2 I N N 6 ; I 6 N N 6 6 T R=6 6 ;T 6 6 4 G

3 2 3 l u 7 6 7 ;l u 7 6 7 7 6 7 7 6 7 l U ; l u ( t ; 1 ) 7 6 7 c =6 7 ;l U + lu(t ; 1) 7 7 6 7 7 6 7 5 4 5 ly;f ;G ;l y + f

Aparte de las restricciones en amplitud, a la salida se le pueden aplicar otro tipo de restricciones de para forzar un determinado comportamiento temporal (movimiento dentro de una banda, comportamiento mon otono, evitar respuesta inicial inversa, etc.) como se muestra en [12], pudiendo expresarlas tambi en de la forma gen erica (4.1). Adem as de la clasicaci on en restricciones en la entrada y en la salida seg un a qu e tipo de variable se apliquen, se puede hacer otra clasicaci on atendiendo a la forma de tratarlas. As , se puede hablar de: Restricciones duras como aqu ellas que no se pueden violar bajo ning un concepto. En este grupo se incluyen las restricciones relacionadas con la operaci on segura del proceso. Restricciones blandas, que son aqu ellas que pueden ser violadas en un momento dado por no ser cruciales, pero la violaci on se penaliza en la funci on objetivo como un t ermino m as. Es una forma de relajar la restricci on.

del problema 4.3 Resolucion


Con la adici on de restricciones el problema general de control predictivo cambia se puede formular como minimizar J ( sujeto a

u) Ru c

Es decir, el problema consiste en la minimizaci on de una funci on cuadr atica con restricciones lineales, lo que se conoce como Programaci on Cuadr atica, QP. En este caso no se puede encontrar una soluci on anal tica como en el caso sin restricciones, sino que hay que recurrir a m etodos iterativos. Resulta evidente que la carga de c alculo ser a considerable, ya que hay que encontrar la soluci on resolviendo el algoritmo iterativo en cada periodo de muestreo. Normalmente el esfuerzo est a justicado por el benecio econ omico obtenido al trabajar m as cerca del punto de operaci on optimo.

Restricciones en Control Predictivo

45

Para resolver el problema QP existen diversos algoritmos sucientemente probados. Una revisi on de estos m etodos se puede encontrar en [2]. Un problema asociado a la implementaci on del control con restricciones es el an alisis de la estabilidad del bucle cerrado. Como es necesario utilizar m etodos num ericos para resolver el problema de la optimizaci on, la ley de control resultante no se puede describir de forma expl cita, haciendo el problema muy dif cil de atacar mediante la teor a cl asica de control. En los ultimos anos se ha trabajado mucho sobre la estabilidad en estas circunstancias, proponi endose soluciones basadas en la teor a de Lyapunov. La idea b asica consiste en que la funci on de coste cuando el horizonte es innito es mon otona decreciente (si existe soluci on factible) y se puede interpretar como funci on de Lyapunov que garantiza por tanto la estabilidad. Sin embargo, como la soluci on tiene que ser num erica, el numero de variables de decisi on tiene que ser nito, por lo que se han propuesto dos ideas. En la primera, se descompone la funci on objetivo en dos partes: una con horizonte nito y restricciones y otra con horizonte innito y sin restricciones. La segunda idea es en esencia equivalente y consiste en imponer restricciones terminales al estado y usar un horizonte innito. En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las incertidumbres en el modelo y los temas asociados con la factiblidad.

de restricciones 4.4 Gestion


Durante la etapa de optimizaci on puede aparecer problemas de no existencia de so lucion optima para unas restricciones dadas (no existe compatibilidad entre las restricciones), por ejemplo por el planteamiento de unos objetivos inalcanzables para unas restricciones dadas. Existen otras posibles causas de inexistencia de soluci on, como es el caso de que una perturbaci on saque al proceso fuera de la zona de trabajo usual. La factibilidad de un problema de optimizaci on signica que la funci on objetivo est e acotada y que todas las restricciones sean satisfechas. La no factibilidad puede aparecer en r egimen permanente o en el transitorio. El problema de la falta de soluci on en r egimen permanente puede venir provocado por un objetivo de control irrealizable. Sin embargo, este tipo de no factibilidad puede ser f acilmente eliminado en la etapa de diseno evitando la inclusi on de tales objetivos. Tambi en puede ser debido a cambios en referencias que hagan incompatibles las restricciones (se quiera llevar alguna variable a un punto que es imposible de alcanzar con una entrada que est a acotada). En el r egimen transitorio puede aparecer no factibilidad incluso cuando las restricciones impuestas parezcan razonables. Restricciones que no causan problemas en

46

Gesti on de restricciones

operaci on normal pueden producir problemas bajo ciertas circunstancias. Puede que una perturbaci on o cambio de referencia grande fuerce a una variable fuera de su l mite y sea imposible introducirla de nuevo en su zona permitida con senales de control de energ a limitada. En estos casos las restricciones se hacen temporalmente incompatibles. Las soluciones no factibles aparecen con mayor frecuencia en casos en que el optimo se encuentre cerca de las restricciones y el sistema est e sujeto a perturbaciones, llevando a la salida a "regiones prohibidas".

4.4.1

T ecnicas de busqueda de soluciones factibles

Los m etodos de gesti on de restricciones tratan de recuperar la factibilidad actuando sobre las restricciones seg un diferentes criterios. Los l mites de las restricciones se pueden considerar de los siguientes tipos: Limites sicos: nunca se pueden sobrepasar, principalmente por motivos de seguridad o por la propia construcci on de los equipos (p.ej. actuadores) Limites de operaci on: son jados por los operarios para mantener las condiciones nominales de funcionamiento. Se pueden sobrepasar bajo ciertas circunstancias Limites reales: son los que usa el algoritmo de control en cada instante. Son los que proporciona el gestor de restricciones, quien debe calcularlos de forma que nunca superen los limites f sicos. Es decir, el gestor de restricciones calcular a los l mites reales (los que se env an al algoritmo QP) en base a los l mites de operaci on pero sin salirse nunca de los l mites f sicos, seg un se observa en la gura 4.3. Se analizan a continuaci on posibles soluciones para este problema, que se pueden agrupar en:

1. Desconexi on del controlador. 2. Eliminaci on de restricciones. de restricciones. 3. Relajacion 4. Otras t ecnicas.

Restricciones en Control Predictivo

47

Lmites fsicos

Restricciones reales Lmites de operacin

Figura 4.3: Gesti on de restricciones Desconexi on del controlador La forma m as sencilla de resolver de este tipo de problemas es pasar el controlador a posici on manual cuando aparecen las incompatibilidades de restricciones y volver a operaci on autom atica cuando se recupera la admisibilidad de la soluci on. Este m etodo, como se puede comprender tiene serias desventajas. Normalmente, cuando aparecen problemas de incompatibilidad de restricciones es porque el sistema en bucle cerrado se encuentra en un estado cr tico donde normalmente el operador tendr a muy poca experiencia en la operaci on. Adicionalmente, si las restricciones est an relacionadas con aspectos de seguridad o econ omicos, las decisiones llevadas a cabo cuando aparecen problem aticas de compatibilidad de restricciones suelen ser cr ticas dado que en estos casos alguno de los objetivos del control no puede ser satisfecho. El m etodo suele ser utilizado cuando los problemas de incompatibilidad de restricciones no son frecuentes.

Eliminaci on de restricciones La factibilidad se analiza en cada periodo de muestreo, por lo que la eliminaci on de restricciones se realiza de forma temporal. Peri odicamente se chequea la factibilidad para poder reinsertar restricciones eliminadas. La eliminaci on de un grupo de restricciones ha de realizarse en aquellos casos en que el conjunto completo de restricciones que se imponen sobre el sistema sea incompatible. Cada vez que existe un problema de incompatibilidad de restricciones, se forma un conjunto de restricciones no admisibles que no se tienen en cuenta en el proceso de

48

Gesti on de restricciones

optimizaci on. Se pueden distinguir en la metodolog a de eliminaci on de restricciones varios tipos.

Eliminaci on indiscriminada Con esta estrategia todas las restricciones se eliminan cada vez que aparezcan problemas de existencia de soluci on factible, quedando la optimizaci on de un problema sin restricciones. No es un m etodo muy optimo para resolver el problema de la existencia de soluci on admisible, pero es la forma m as r apida de tener en cuenta incompatibilidad de restricciones. La eliminaci on indiscriminada de restricciones no es adecuada en todas las aplicaciones. No debe ser por ejemplo usada en casos en que las restricciones est en directamente relacionadas con l mites de seguridad.

Eliminaci on jer arquica En este caso s olo se eliminan las restricciones que provocan problemas de incompatibilidad. En este m etodo se asigna en la etapa de diseno una prioridad a cada restricci on, que da un grado de importancia relativa de dicha restricci on frente a las otras. Esta prioridad se usar a para clasicar las restricciones de una forma jer arquica (se asigna un n umero que indica su posici on en la jerarqu a). De este modo, cada vez que haya problemas de factibilidad o existencia de soluci on el gestor de restricciones va eliminando por orden las restricciones menos prioritarias hasta que se restablece la factibilidad de la soluci on, que se chequea cada periodo de muestreo para reinsertar restricciones que hubieran sido temporalmente eliminadas. En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes tipos de reglas para establecer el n umero de restricciones que se eliminan, si conviene eliminar m as restricciones a costa de no eliminar una con prioridad superior, etc.

Relajaci on de restricciones Otro m etodo para tener en cuenta el problema de existencia de soluci on es la relajaci on de las restricciones. Se puede hacer una relajaci on de los l mites de forma temporal o convertir restricciones duras ( ), cambi andolas en restricciones blandas ( + , con 0) para asegurar la existencia de soluci on, anadiendo un t ermino T a la funci on de coste de forma que se penalice la violaci on de la restricci on y obtener un mejor comportamiento del sistema controlado. A largo plazo, el t ermino en la funci de penalizacion on objetivo llevar a las variables auxiliares a cero.

Ru c T

Ru

Otras t ecnicas Existen t ecnicas que se basan en la manipulaci on del horizonte m nimo de las restricciones. Algunos controladores industriales como el QDMC usan el concepto de constraint

Restricciones en Control Predictivo

49

window. La constraint window comienza en alg un punto en el futuro y contin ua hasta el estado estacionario. Si existe din amica del tipo de fase no m nima, se pueden mejorar las prestaciones desplazando la ventana hacia el futuro, lo que equivale a ignorar las restricciones duras en la salida durante la fase inicial de la respuesta.

50

Gesti on de restricciones

Tema 5 Tendencias actuales y nuevas perspectivas


En la actualidad existen muchos campos abiertos en Control Predictivo, tanto en lo referente a aplicaciones pr acticas como a l neas de investigaci on. Todav a queda mucho por estudiar en campos como identicaci on de modelos, estimaci on del estado y de las perturbaciones no medibles o tratamiento sistem atico de las incertidumbres. El estudio de estabilidad o robustez de la soluci on es complicado, sobre todo en el caso de inclusi on de restricciones, ya que la ley de control es en general variable con el tiempo y no se puede representar el sistema de la forma cl asica de bucle cerrado. Este tema est a dedicado a dos areas de especial inter es: la consideraci on de funciones objetivos multicriterio y un campo que est a empezando a tener gran relevancia en la pr actica como es el Control Predictivo No lineal.

5.1 Multiobjetivo. Jerarqu a de objetivos


Las estrategias que se han considerado hasta ahora est an basadas en la minimizaci on de una funci on de coste de un unico objetivo para la obtenci on de la mejor secuencia de acciones de control. Sin embargo, en muchas situaciones el comportamiento del proceso no se puede medir con una sola funci on objetivo sino que, la mayor a de las veces, existen diversos (y a menudo contrapuestos) objetivos de control. Las razones de la existencia de diversos objetivos de control pueden ser: Los procesos deben operar de forma diferente en distintos momentos. Por ejemplo, durante la fase de arranque puede interesar una estrategia de tiempo m nimo y en el r egimen nominal el objetivo puede ser reducir en lo posible la varianza de las variables controladas. 51

52

Multiobjetivo. Jerarqu a de objetivos


El objetivo de control puede variar aun el caso de estar trabajando en r egimen nominal, dependiendo del valor de las variables. Por ejemplo, aunque el objetivo de control sea minimizar la suma ponderada de los errores de las variables, si una de ellas alcanza un valor muy alto (por ejemplo debido a una perturbaci on) el objetivo de control ser a disminuir el valor de esta variable lo antes posible.

En muchas situaciones el objetivo de control no es minimizar la suma de errores, sino mantener ciertas variables dentro de unos l mites especicados. Esto es equivalente a las restricciones blandas. Este tipo de objetivo se puede expresar penalizando la cantidad que se sobrepasa cada variable del setpoint. Consid erese, por ejemplo, que el objetivo es mantener la variable y (t) entre sus l mites yl e yh . En este caso, el objetivo de control se puede escribir como: N2 N2 X X J = p(y(t + j ) ; yh) (y(t + j ) ; yh)2 + p(yl ; y(t + j )) (y(t + j ) ; yl )2 j =N1 j =N1 siendo p la funci on escal on (vale 1 cuando el argumento es mayor o igual que 0 y vale 0 en caso contrario). Notese que ahora la funci on objetivo no es cuadr atica y por tanto no se puede emplear para su minimizaci on un algoritmo de programaci on cuadr atica, aunque se puede transformar en uno de este tipo anadiendo unas variables de holgura h (j ) y l (j ) :

y(t + j ) yh + y(t + j ) yl ;

h (j ) h (j )

La secuencia optima de control se obtiene con la minimizaci on de N2 X J = ( h(j )2 + l (j )2) j =N1 con la condici on de que las variables de holgura sean no negativas (y el resto de las restricciones si las hubiera). En denitiva lo que se ha hecho es transformar el problema en un QP con m as restricciones y variables. En muchas ocasiones todos los objetivos de control se pueden agrupar en una sola funci on de coste. Algunos de los objetivos pueden ser mantener las variables lo m as cerca posible de los setpoints o dentro de unas determinadas regiones de operaci on. Cada uno de estos objetivos equivale a minimizar una cierta funci on Ji (sujeta a una serie de restricciones). Entonces la secuencia de control se puede obtener de la minimizaci on de: m

i Ji i=1 sujeta a todo el conjunto de restricciones. La importancia relativa de cada objetivo se puede ponderar mediante la adecuada elecci on de los i , aunque en la pr actica es dif cil encontrar estos pesos. Adem as, muchas veces los objetivos de control son cualitativos, m haciendo la tarea aun as dif cil.

J=

Tendencias actuales y nuevas perspectivas

53

5.1.1

Jerarqu a de objetivos

En muchas situaciones, se puede establecer una importancia relativa de unos objetivos sobre otros por medio de una priorizaci on o jerarqu a. Es decir, los objetivos de mayor prioridad (por ejemplo los relacionados con la seguridad) se deben satisfacer antes que otros con menor prioridad. Aunque esto se puede resolver con ponderaciones, no es un asunto trivial. Tyler y Morari [20] proponen una forma de introducir m ultiples objetivos jerarquizados. Consid erese un proceso con m objetivos Oi jerarquizados (el Oi+1 tiene mayor prioridad que el Oi) que se pueden expresar como:

Riu ai
La idea consiste en introducir variables enteras Li que toman valor 1 cuando se satisface el correspondiente objetivo de control y cero en caso contrario. Los objetivos se expresan entonces como:

tiene que Li = 1 y el objetivo reformulado coincide con el original. Con la introducci on de Ki el objetivo reformulado se satisface incluso cuando el correspondiente objetivo Oi no lo hace (Li = 0). La jerarqu a de objetivos se puede establecer imponiendo las restricciones siguientes: Li ; Li+1 0 El problema es maximizar el n umero de objetivos de control satisfechos

Riu ai + Ki(1 ; Li) (5:1) donde Ki es una cota superior conservadora para Ri u ; ai . Si se cumple el objetivo i, se

PL .
i

Si el modelo del proceso es lineal el problema se puede resolver con Programaci on Lineal Entera Mixta (MILP). El conjunto de restricciones 5.1 se puede modicar para mejorar el grado de satisfacci on de restricciones de los objetivos que no pueden ser satisfechos. Sup ongase que no todos los objetivos se pueden satisfacer y que el Of es el primero que falla. Con la idea de acercarse todo lo posible a la satisfacci on de este objetivo se introduce una variable de holgura que cumpla el siguiente conjunto de restricciones: 0 1 i;1 X Lj A (5:2) i i + + Ki @(1 ; i) + (1 ; Li ) ; j =1

Ru a

con la funci on objetivo

Li + f ( ) i=1 donde f es una funci on de penalizaci on de la variable de holgura (positiva y mon otona creciente) y K es su cota superior. El algoritmo de optimizaci on intentar a maximizar

J = ;K

m X

54

Control predictivo no lineal

el numero de objetivos satisfechos (Li = 1) antes de intentar reducir f ( ) porque la funci on objetivo global se puede hacer m as pequena incrementando el n umero de variables Li distintas de cero que reduciendo la funci on de penalizaci on. Como todos an satisfechos para i < f , las restricciones (5.2) tambi en se satisfacen. los objetivos Oi est Como Of es el primero que falla:

i;1 X i=1

Li = f ; 1 para i f

Es decir, el t ermino que multiplica a Ki es cero para i = f mientras que para ndices mayores es mayor que uno. Esto implica que todas las restricciones se satisfar an para i > f . La unica restricci on activa es f + . f

Ru a

O sea, el m etodo de optimizaci on intentar a optimizar el grado de satisfacci on del primer objetivo que falle s olo despu es de que todos los objetivos m as prioritarios se hayan satisfecho. N otese que Li = 0 no implica que el objetivo i- esimo no sea satisfecho, sino que indica que la restricci on correspondiente ha sido relajada. Si el modelo del proceso y la funci on de penalizaci on son lineales, el problema es del tipo MILP, pero si f () es cuadr atica se recurre a Programaci on Cuadr atica Entera Mixta (MIQP). Aunque existen algoritmos para Programaci on Mixta, el esfuerzo computacional es mucho mayor que el requerido para problemas LP o QP, por ello el n umero de objetivos debe ser pequeno para poder implementar el m etodo en tiempo real.

5.2 Control predictivo no lineal


En los ultimos anos el Control Predictivo Basado en Modelo se ha convertido en la estrategia de control preferida para una gran cantidad de procesos industriales. Los on est a esquemas de MPC lineal, es decir, los vistos hasta ahora en los que la predicci basada en un modelo lineal del proceso, se usan de forma rutinaria como una opci on de control m as a tener en cuenta en ciertos sectores de la industria y se puede decir que sus fundamentos te oricos est an sucientemente estudiados. Por su parte, el Control Predictivo No Lineal (Nonlinear Model Predictive Control, NMPC) surgi o hace relativamente poco tiempo y existen pocas referencias de aplicaciones industriales. Pero debido a su capacidad para tener en cuenta las no-linealidades del proceso se espera que se convierta en una opci on prometedora a corto plazo. No hay nada en los conceptos b asicos de MPC contra el uso de modelos no lineales, por tanto la extensi on de tales conceptos a procesos no lineales es en principio sencilla. Sin embargo, como se ver a seguidamente esto no es un asunto trivial y a un hay muchos temas abiertos como: La disponibilidad de modelos no lineales debido a la dicultad de t ecnicas de

Tendencias actuales y nuevas perspectivas


identicaci on para procesos no lineales.

55

La complejidad de los c alculos necesarios para resolver el problema del control predictivo de procesos no lineales. La escasez de resultados de estabilidad y robustez.

En general los procesos industriales son no lineales, pero a un as la mayor a de las aplicaciones de control predictivo est an basadas en el uso de modelos lineales, del tipo de los vistos hasta ahora. Existen varias razones para ello: por un lado resulta relativamente f acil identicar modelos lineales a partir de datos del proceso, y por otro los modelos lineales dan buen resultado cuando el proceso opera en las cercan as del punto de trabajo nominal. En el sector petroqu mico, donde tiene lugar la mayor a de las aplicaciones de MPC, el objetivo es mantener el proceso en torno al estado estacionario (problema del regulador) m as que realizar frecuentes cambios de un punto de operaci on a otro (problema del servo) y por tanto un modelo lineal preciso es suciente. Adem as el uso de un modelo lineal junto con una funci on objetivo cuadr atica da lugar a un problema convexo de programaci on cuadr atica (QP) cuya soluci on est a sucientemente estudiada en la actualidad, existiendo diversos productos comerciales ables. La existencia de algoritmos que garanticen una soluci on que converja en un corto tiempo (menor que el periodo de muestreo) resulta crucial en procesos en los que interviene un gran n umero de variables. Sin embargo, existen situaciones en las que los efectos no lineales justican el uso de la tecnolog a NMPC. Estas situaciones entran dentro de las dos categor as siguientes:

Procesos fuertemente no lineales y sujetos a grandes perturbaciones, como por ejemplo el control de pH. Problemas de seguimiento de consigna en los que el punto de operaci on cambia con frecuencia y estos cambios sacan a relucir la din amica no lineal del proceso, como en el caso de la fabricaci on de pol meros.

En estas situaciones una ley de control lineal puede no ser efectiva siendo necesario el empleo de un controlador no lineal para mejorar el comportamiento o simplemente para una operaci on estable del proceso. Es por tanto en este caso donde se puede justicar el empleo de t ecnicas de NMPC. Aunque en la actualidad el n umero de reducido, el potencial es considerable, como se desprende del aplicaciones es aun informe de Qin y Badgwell [17], donde se observa que MPC no ha penetrado a un en campos donde las no linealidades son fuertes y el mercado exige frecuentes cambios del punto de operaci on; es aqu donde se espera el auge del NMPC.

56

Control predictivo no lineal

5.2.1

Diferencias respecto al m etodo lineal

Resulta evidente que la principal ventaja del NMPC frente al MPC radica en la posibilidad de abordar din amicas no lineales. A medida que aparecen nuevas herramientas que hacen posible la obtenci on y representaci on de modelos no lineales, bien a partir de primeros principios (leyes de conservaci on) o bien a partir de datos experimentales (modelos de Volterra o redes neuronales) el inter es por su utilizaci on en NMPC se va acrecentando. Aunque la extensi on de los conceptos de MPC al caso no lineal es directa, a la hora de realizar el controlador aparecen una serie de problemas a tener en cuenta, que dan lugar a una mayor dicultad en su implantaci on. Las principales dicultades derivadas del empleo de modelos no lineales son: La obtenci on de un modelo no lineal a partir de datos experimentales es un problema abierto. La utilizaci on de redes neuronales o series de Volterra no parecen solucionar el problema de forma general. Por otra parte, la obtenci on de modelos a partir de primeros principios no es siempre viable. El problema de optimizaci on es no convexo, cuya resoluci on es mucho m as dif cil que un problema de programaci on cuadr atica. Aparecen problemas relativos a la obtenci on del optimo global, lo que inuye no s olo en la calidad del control, sino tambi en en problemas relacionados con la estabilidad. La dicultad del problema de optimizaci on se traduce en un aumento considerable del tiempo de c alculo, hecho que puede dar lugar a que la aplicaci on de esta t ecnica quede restringida a un conjunto de sistemas con din amica lenta. El estudio de temas fundamentales como estabilidad o robustez se complica enormemente. Este tema constituye un campo abierto de gran inter es para los investigadores.

5.2.2

Fundamentos te oricos

Se puede denir un algoritmo gen erico NMPC que englobe a todas las t ecnicas que comparten las mismas ideas. El proceso (en general multivariable) se puede describir por un modelo en el espacio de estados de la forma:

x(t + 1) = f (x(t) u(t) d(t) w(t)) y(t) = g(x(t)) + e(t) donde x es el vector de estados de dimensi on n, u es el vector de mu entradas, d son las perturbaciones medibles y w(t)) las no medibles. El vector de salidas es y de dimensi on my , la misma que la del vector de ruidos de medida e.

Tendencias actuales y nuevas perspectivas

57

El problema que hay que resolver es el c alculo de la secuencia de senales de control que llevan al proceso desde su estado actual al estado deseado s . El punto de trabajo deseado ( s , s , s ) viene en general determinado por una optimizaci on est atica basada normalmente en criterios econ omicos. Este punto de trabajo debe ser recalculado ptimo de periodicamente ya que las perturbaciones pueden hacer cambiar el punto o operaci on.

y x u

f , mientras que el resto se rechaza con la realimentaci on, normalmente considerando y(t + j ) = g(x(t + j )) + b(t)
M ;1 X j =1
donde

Las perturbaciones medibles se pueden eliminar incluyendo su efecto en la funci on

que la perturbaci on permanecer a constante a lo largo del horizonte. Esto se formalizar anadiendo un t ermino constante (bias) e igual al error entre medida y salida calculada a toda la predicci on:

b(t) = ym(t) ; y(t)

El problema consiste en la minimizaci on de una funci on objetivo que de la forma m as gen erica ser a:

J=

P X j =1

y(t + j ) ; ys

kq

Q+

k 4 (t + j )kq S+

M ;1 X j =1

u(t + j ) ; uskqR + kskqT

(5

:3)

2 segun el tipo de norma que se est donde q puede ser 1 o e utilizando y Q, S, R y T son matrices de ponderaci on. La minimizaci on estar a sujeta a la restricci on del modelo:

x(t + j ) = f (x(t + j ; 1) u(t + j ; 1) d(t + j ; 1) w(t + j ; 1))y(t + j ) = g(x(t + j )) + b(t)


y al resto de restricciones en entradas y salidas que se quieran considerar:

y ; s y(t + j ) y ; s 8j = 1 P u u(t + j ) u 8j = 1 M ; 1 4u 4u(t + j ) 4u 8j = 1 M ; 1

Obs ervese que se ha considerado la violaci on de las restricciones en la salida con el t ermino s, que entra en juego en la minimizaci on apareciendo en la funci on de coste con una penalizaci on dada por la matriz T. Igual que en caso lineal, la soluci on del problema es una secuencia de acciones de control de las cuales s olo la primera de ellas es enviada a la planta, desechando el resto y volviendo a la resolver el problema en el siguiente periodo de muestreo.

5.2.3

Problem atica asociada al NMPC

La resoluci on del NMPC plantea nuevos problemas que no exist an en el caso lineal relacionados por un lado con la metodolog a de c alculo de la senal de control y por otro con el comportamiento din amico del bucle cerrado, b asicamente su estabilidad.

58 Resoluci on

Control predictivo no lineal

La introducci on de un modelo no lineal en el algoritmo de optimizaci on conduce a la p erdida de convexidad, no pudiendo ser resuelto por los algoritmos de programaci on cuadr atica (QP), para los cuales existen soluciones ables y sucientemente estudiadas. Esta p erdida de convexidad hace que sea mucho m as dif cil encontrar una soluci on y que, una vez encontrada, no se pueda garantizar que sea un optimo global. En estas circunstancias el tiempo de c alculo aumenta considerablemente debido principalmente a dos motivos Para la obtenci on de la secuencia de acciones de control optima, el paquete de programaci on no lineal debe evaluar repetidamente la funci on objetivo y en cada evaluaci on se debe resolver el sistema de ecuaciones no lineales que componen el modelo de predicci on, lo cual conlleva mucho tiempo de c alculo. A partir de los datos obtenidos a trav es de la evaluaci on de la funci on objetivo, el programa de optimizaci on debe calcular el gradiente de la funci on y los pr oximos puntos de busqueda, adem as de comprobar la violaci on o no de las restricciones y los criterios de nalizaci on del algoritmo. Estas tareas consumen m as tiempo de c alculo que en el caso lineal.

Estabilidad de la soluci on en el caso de El otro problema fundamental es el de la estabilidad de la soluci on. Aun que el algoritmo de minimizaci on encuentre la soluci on optima, este hecho no garantiza la estabilidad del bucle cerrado (incluso en el caso de que el modelo sea perfecto). Este problema ha sido abordado desde distintos puntos de vistos de vista, existiendo en la actualidad diferentes propuestas, las cuales se describen a continuaci on. 1. Horizonte innito Existe una soluci on propuesta por Meadows et al. ([13]) que consiste en ampliar los horizontes de control y de predicci on hasta el innito, P M ! 1. En este caso la funci on objetivo tambi en sirve como funci on de Lyapunov, dando lugar a la estabilidad nominal. En el art culo citado se demuestra que si existe soluci on inicial factible entonces existe soluci on en cada periodo de muestreo posterior. La idea b asica es que si el problema de minimizaci on es factible en el instante entonces la funci on de coste es nita y

Jt+1 Jt + x(t)t Rx(t) + u(t)t Su(t)


Por tanto la funci on de coste es mon otona decreciente y se puede interpretar como una funci on de Lyapunov, garantizando por consiguiente la estabilidad asint otica.

Tendencias actuales y nuevas perspectivas

59

A la hora de la verdad este concepto tiene principalmente un inter es teorico sobre el que basar un desarrollo pr actico, ya que no es viable una implementaci on con horizonte innito. Para llevarlo a la pr actica se puede tomar un horizonte lo sucientemente grande, pero esta elecci on no tiene por qu e garantizar la estabilidad, ya que las trayectorias de la entrada y el estado diferir an de las trayectorias predichas incluso si no hay incertidumbres ni perturbaciones. 2. Restricci on terminal Otra soluci on al problema, propuesta por Keerthi y Gilbert ([8]) consiste en anadir una restricci on terminal al estado en el algoritmo NMPC de la forma:

x(k + P ) = xs
Con la imposici on de esta restricci on, la funci on objetivo se convierte en una funci on de Lyapunov para el sistema en bucle cerrado, conduciendo a la estabilidad nominal. Con la introducci on de esta restricci on el estado al nal del horizonte nito es cero y por tanto tambi en lo ser a la senal de control, con lo que el sistema (sin perturbaciones) se queda para siempre en el origen. De esta forma es como si el horizonte de predicci on fuera innito. El problema de este m etodo es que en la pr actica la introducci on de esta restricci on articial anade un coste computacional considerable y, lo que es m as importante a un, da lugar a una regi on de operaci on muy restrictiva, por lo que en la realidad resulta muy dif cil satisfacer esta condici on. 3. Control dual La dicultad de la aproximaci on anterior llev o a Michalska y Mayne ([14]) a buscar una restricci on menos estricta. La idea es denir un entorno W alrededor del estado nal deseado s dentro del cual el sistema pueda ser llevado a dicho estado por medio de un controlador lineal por realimentaci on del vector de estados. Por tanto la restricci on que se anade a la formulaci on es:

( ( +

x t P ) ; xs ) 2 W

Si el estado actual se encuentra fuera de esta regi on se usa el algoritmo NMPC con la restricci on anterior. Una vez que el estado se encuentra en W , el control conmuta a una estrategia lineal determinada previamente (estrategia del tipo dual-mode controller). Este m etodo conlleva por tanto la gesti on de la conmutaci on entre los dos controladores y la determinaci on de la regi on W y de la matriz de ganancia de la realimentaci on del vector de estados (una forma de hacerlo se puede encontrar en el art culo citado). 4. Horizonte casi-innito Chen y Allgower ([3]) extendieron el concepto anterior, proponiendo un esquema de control con horizonte casi-innito. Se hace uso de la idea de regi on terminal y

60

Control predictivo no lineal

controlador estabilizante, pero s olo para el c alculo del coste terminal. La senal de control se determina resolviendo el problema de optimizaci on en l nea (con horizonte nito) sin conmutar al controlador lineal incluso dentro de la regi on terminal. on de coste, El procedimiento consiste en anadir el t ermino kx(t + Tp )k2 P a la funci cuyo objetivo es extender el horizonte de predicci on hasta el innito y por tanto evitar la conmutaci on del controlador. Se puede demostrar que, eligiendo adecuadamente la matriz de ponderaci on P , este t ermino es una cota superior de lo que costar a llevar al sistema no lineal con el controlador lineal hasta el origen partiendo de un estado perteneciente a la regi on terminal y la funci on de coste con horizonte nito se aproxima a una de horizonte innito, en cuyo caso la estabilidad queda asegurada. Esto se puede interpretar como si el horizonte de predicci on se expandiera casi hasta el innito (es decir, es como si se minimizara un coste de horizonte innito resolviendo un problema de horizonte nito). 5. Contracci on del estado La idea consiste en imponer la siguiente restricci on:

kx(t + N )k2

kx(t)k2

2 (0 1)

Esta restricci on fuerza a la magnitud del vector de estado a contraerse seg un el factor elegido cada vez que se calcula la senal de control. La estabilidad queda garantizada siempre que el problema sea factible, lo que no viene impuesto necesariamente porque sea factible en k = 0, ya que las restricciones que se le imponen al estado son muy estrictas y pueden hacer perder factibilidad. Esto se puede mejorar con valores grandes de , pero entonces la disminuci on de la magnitud del estado es menor. En general se puede decir que en muchas situaciones reales la condici on es muy restrictiva y la no-factibilidad aparece con facilidad.

Robustez lo es el de complicado, m as aun Si el estudio de la estabilidad en NMPC resulta de por s la robustez, es decir, la estabilidad cuando existen errores de modelado. Los resultados de estabilidad de la secci on anterior son v alidos s olo en el caso de que el modelo del proceso sea perfecto. Resulta evidente que esto nunca va a ser cierto en la pr actica, por lo que es necesario alguna forma de afrontar la existencia de incertidumbres. Se puede considerar el problema de la robustez como algo todav a sin resolver para NMPC, aunque existen algunos resultados preliminares. Algunos de los esquemas que garantizan establidad se pueden hacer robustos con algunos cambios, como por ejemplo el uso de restricciones terminales conservadoras in el dual-mode. Pero en general los resultados existentes s olo indican que incertidumbres peque nas no amenazan la estabilidad del bucle cerrado, sin permitir el diseno del controlador que garantice la estabilidad dada una incertidumbre descrita por sus l mites. Existen algunos resultados

Tendencias actuales y nuevas perspectivas

61

para casos muy simples como incertidumbre en la ganancia y se est a avanzando en algunos campos como en LMI, pero todav a queda mucho por hacer.

5.2.4

Modelos

Estos resultados te oricos proporcionan una base para poner en marcha un NMPC, aunque en la pr actica existen muchos temas abiertos, principalmente en lo referente a la denici on e identicaci on del modelo y al desarrollo de m etodos de resoluci on ables. La obtenci on de modelos no lineales adecuados de forma emp rica puede ser muy dif cil y no existe una formulaci on que sea claramente adecuada para representar xito del MPC se debe a la relativa procesos no lineales de forma gen erica. Parte del e facilidad con la que se pueden obtener experimentalmente modelos del tipo respuesta ante escal on o funciones de transferencia de bajo orden. En cambio los modelos no lineales son mucho m as dif ciles de construir, tanto bas andose en correlaci on de datos de entrada/salida como en principios b asicos de conservaci on de masa y energ a. Un gran obst aculo que se encuentra a la hora de desarrollar una teor a de sistemas no lineales es la ausencia de un principio de superposici on para este tipo de sistemas. Debido a ello, la determinaci on experimental de los modelos se convierte en una tarea muy complicada, requiriendo una cantidad de ensayos mucho mayor que para una planta no lineal. Si el proceso es lineal en teor a s olo es necesario llevar a cabo un ensayo de respuesta ante escal on para calcular el modelo (aunque en la pr actica no sea realmente as ). Debido al principio de superposici on, la respuesta ante un escal on de diferente amplitud se puede obtener escalando la salida convenientemente. Pero esto no es as para procesos no lineales, donde se deben realizar ensayos con escalones de distinto tamano. Adem as, si el proceso es multivariable, la diferencia en el n umero de ensayos necesarios es mucho mayor. En general, si un sistema lineal se ensaya con senales de entrada u1 (t),u2 (t),...,un (t), y las correspondientes salidas son y1 (t),y2 (t),...,yn (t), la respuesta a una senal que se puede expresar como combinaci on lineal de las senales de prueba u(t) = 1u1(t) + 2 u2(t) + + nun(t) es

y(t) = 1y1(t) + 2y2(t) +

n yn (t)

Es decir, un sistema lineal no necesita ser probado con ninguna secuencia de senales de entrada que sea una combinaci on lineal de senales ya probada, mientras que no ocurre lo mismo con un sistema no lineal, cuya respuesta debe ser analizada para todas las posibles senales de entrada. Si la desviaci on de la linealidad no es demasiado grande, se pueden hacer algunas aproximaciones que tengan en cuenta el cambio de comportamiento de un punto

62

Control predictivo no lineal

de operaci on a otro y asuman comportamiento lineal en las cercan as del punto de operaci on. Pero en general habr a que recurrir a modelos espec cos que reejen la din amica no lineal. Existen diferentes aproximaciones que usan modelos de Wiener, otras basadas en redes de neuronas, modelos de Volterra o de Hammerstein, modelos NARX, modelos borrosos, etc. Los modelos usados en la industria se detallan a continuaci on.

Modelos en el espacio de estados Se puede usar un modelo formado por la combinaci on de una ecuaci on de estado lineal con una relaci on no lineal de salida:

x(t + 1) = Ax(t) + Bu(t) + Dd(t)y(t) = g(x(t))


A su vez la no linealidad de la salida se puede modelar con la superposici on de una relaci on lineal y una red neuronal no lineal:

g(x(t)) = Cx(t) + NN (x(t))


Al no estar el vector de estados limitado necesariamente a variables f sicas, este modelo es muy gen erico y permite englobar m as efectos no lineales que los exclusivos de las medidas. Pero el principal problema en NMPC no es la elecci on del tipo de modelo, sino de un m etodo de identicaci on able y robusto. Seg un el modelo propuesto, se identica el sistema como lineal y los residuos de las salidas se ajustan a los estados con la red neuronal. Se puede usar un ndice de conanza de modo que la predicci on se basa m as o menos en la red neuronal seg un este ndice, apag andose en caso de que su aportaci on no sea able. Tambi en puede anadir un ltro de Kalman extendido (EKF) para corregir los errores de modelado y las perturbaciones no medibles, reemplazando de este modo el error constante en la realimentaci on que se emplea normalmente en el MPC.

Modelos de entrada/salida Una idea adoptada por algunos fabricantes de controladores predictivos es usar un modelo no lineal est atico junto con un modelo din amico no lineal. Si se considera el caso monovariables, deniendo las variables de desviaci on como:

u(t) = u(t) ; us

y(t) = y(t) ; ys

donde los valores en estado estacionario de entrada y salida cumplen:

ys = hs(us)

Tendencias actuales y nuevas perspectivas

63

Se considera que las variables de desviaci on verican la siguiente relaci on din amica lineal: n X y(t) = ai y(t ; i) + bi u(t ; i) i=1 La identicaci on del modelo lineal se lleva a cabo mediante ensayos ante escal on mientras que a partir de datos hist oricos se obtiene la representaci on de la relaci on no lineal por medio de una red de neuronas. Como el modelo din amico tiene una ganancia ja que en general ser a distinta de la del modelo no lineal, la ganancia del submodelo lineal se escala hasta ser igual a la ganancia local no lineal para la entrada actual:

dys j Ks = du u(t)
s
Esto se consigue reescalando los coecientes bi . Para usar este modelo, un programa de optimizaci on no lineal calcula los mejores f f valores de entrada y salida us , ys a partir del modelo est atico. Durante el c alculo din amico del controlador, la ganancia est atica no lineal se aproxima por una interpo lineal de las ganancias inicial y nal: lacion

; Ks u(t) Ks(u(t)) = Ksi + Ks f us ; uis

(5

:4)

f i y K f las ganancias siendo ui oximo y Ks s y us los valores estacionarios actual y pr s calculadas en esos puntos usando el modelo no lineal est atico. Sustituyendo la ganancia dada por (5.4) en la ecuaci on del submodelo lineal se obtiene:

y(t) =
donde

n X i=1

ai y(t ; i) + bi u(t ; i) + gi u2(t ; i)

(5

:5)

biKsi (1 ; Pn bi (1 ; Pn j = 1 aj ) j =1 aj ) gi = Pn K bi = Pn b f ;K i s s j =1 j j =1 bj uf s ;ui s

con esto se consigue reducir la complejidad computacional. Se puede observar que los valores en estado estacionario se calculan a partir del modelo est atico no lineal, mientras que los movimientos din amicos de control est an basados en el modelo cuadr atico de la ecuaci on (5.5). Sin embargo, los coecientes del modelo cuadr atico (la ganancia local) cambian de un periodo de muestro a otro, ya son reescalados para ajustarse a la ganancia local del modelo no lineal. Esta estrategia se puede interpretar como una sucesiva linealizaci on de los estados inicial y nal seguida por una interpolaci on lineal de las ganancias linealizadas, en una formulaci on similar al gain-scheduling, pero con un modelo global diferente debido el reescalado de la ganancia.

64 Modelos basados en primeros principios

Control predictivo no lineal

En cualquier caso siempre es dif cil obtener modelos emp ricos ables a partir de datos experimentales, por lo que en la pr actica existe la posibilidad de usar modelos dados directamente de las ecuaciones de balance, llamados normalmente modelos de primeros principios. Estas ecuaciones pueden ser ecuaciones est aticas de balance o funciones no lineales de variables f sicas que generan otra variable. En este caso el c alculo de la predicci on se realiza mediante una simulaci on de las ecuaciones no lineales (integraci on) que describen el proceso.

5.2.5

Otras formulaciones del problema

Se han propuesto diversas soluciones para intentar resolver los problemas que se han visto, como por ejemplo en [1], donde la predicci on de la salida del proceso se hace mediante la adici on de la respuesta libre (la respuesta futura que se obtiene si la entrada se mantiene en un valor constante durante los horizontes de control y predicci on) obtenida de un modelo no lineal de la planta, y la respuesta forzada (la debida a los movimiento de control futuros), calculada con un modelo incremental de la planta. Las predicciones obtenidas de esta manera son s olo una aproximaci on ya que el principio de superposici on, que permite la descomposici on mencionada, s olo es v alido para sistemas lineales. Sin embargo, la aproximaci on que se obtiene de esta forma se comporta mejor que cuando se usa un modelo linealizado del proceso para obtener ambas respuestas. Si se usa una funci on de coste cuadr atica, la funci on objetivo es cuadr atica en las variables de decisi on (futuros movimientos de la senal de control) y la secuencia de control se puede calcular (en caso de que no haya restricciones) como la soluci on de un conjunto de ecuaciones lineales, dando lugar a una ley de control simple. La unica diferencia respecto a un MPC est andar es que la respuesta libre se calcula mediante un modelo no lineal del proceso. Como el principio de superposici on no se cumple, la aproximaci on s olo es v alida cuando la secuencia de senales de control es pequena. Esta circunstancia tendr a lugar cuando el proceso opera en torno al punto de trabajo con pequenas perturbaciones. Si el proceso cambia continuamente de punto de operaci on o las perturbaciones son considerables los incrementos de la senal de control ser an en general mayores y la aproximaci on no ser a muy buena. Existe una forma de resolver este problema, propuesta en [9] para el EPSAC. La idea b asica es considerar la secuencia de senales de control como la suma de una secuencia de control base (ub (t + j )) y una secuencia de incrementos de la variable manipulada (ui (t + j )). Es decir:

u(t + j ) = ub(t + j ) + ui(t + j )

Tendencias actuales y nuevas perspectivas

65

La predicci on j- esima de la salida del proceso se calcula como la suma de la respuesta del proceso (yb (t + j )) debida a la secuencia base m as la respuesta (yi (t + j )) debida a los futuros incrementos del control en la secuencia base de entrada ui (t + j ):

y(t + j ) = yb(t + j ) + yi(t + j )


Como se usa un modelo no lineal para calcular yb(t + j ) mientras que yi (t + j ) se calcula a partir de un modelo lineal del proceso, la funci on de coste es cuadr atica en las variables de decisi on (ui (t + j )) y se puede resolver mediante un algoritmo QP como andar. Como se ha indicado, el principio de superposici on no es v alido en el MPC est para procesos no lineales, y por ello la salida generada de esta forma s olo coincidir a con la generada por el controlador no lineal en el caso de que la secuencia de futuros movimientos de la senal de control sea cero. ste no es el caso, la secuencia de control base se hace igual a la ultima Si e secuencia de control base m as los incrementos de control optimos que encuentre el algoritmo QP. Este procedimiento se repite hasta que la secuencia de senales de control se lleva lo sucientemente cerca de cero. Las condiciones iniciales para la secuencia de control base se pueden hacer inicial mente iguales a la ultima senal de control que se ha aplicado al proceso. Obs ervese que esto corresponde al c alculo de la respuesta libre en el MPC. Se puede probar con una secuencia inicial mejor haciendo la secuencia base igual a la optima que se obtuvo en el ultimo periodo de muestreo (con el desplazamiento temporal correspondiente). Las condiciones de convergencia del algoritmo son muy dif ciles de obtener ya que dependen de la severidad de la caracter stica no lineal del proceso, de las entradas y salidas pasadas, de las referencias futuras y de las perturbaciones. Otra manera de atacar el problema es teniendo en cuenta que en algunas ocasiones, el modelo no lineal se puede convertir en un modelo lineal mediante aproximaciones apropiadas. Consid erese por ejemplo el proceso descrito mediante la siguiente ecuaci on en el espacio de estados:

x(t + 1) y(t)

= =

f (x(t) u(t)) g(x(t))

El m etodo consiste en encontrar funciones de transformaci on de estados y entrada z(t) = h(x(t)) y u(t) = p(x(t) v(t)) tales que:

z(t + 1) y(t)

= =

Az(t) + Bv(t)) Cz(t)

El m etodo tiene dos importantes inconvenientes:

66 Las funciones de transformaci on pueden obtener en ciertos casos.

Control predictivo no lineal

z(t)

h(x(t))

u(t)

p(x(t) v(t))

s olo se

Las restricciones, que usualmente son lineales, se convierten en no lineales. Es decir, incluso en los casos en que el modelo pueda ser linealizado mediante transformaciones adecuadas, el problema se transforma de minimizar una funci on no lineal (no cuadr atica) con restricciones lineales en minimizar una funci on cuadr atica con restricciones no lineales. La forma general de resolver el problema es usar el modelo no lineal completo de la planta para calcular la predicci on de la salida. Haciendo esto, se est a anadiendo una restricci on no lineal a la minimizaci on, con lo que los algoritmos QP no se pueden usar. Sin embargo el problema se puede resolver en l nea, en algunos casos, gracias al r apido desarrollo de algoritmos de programaci on no lineal (nonlinear programming, NLP) capaces de manejar un n umero grande de variables y restricciones.

5.2.6

Resoluci on del problema. Productos comerciales

Muchos controladores comerciales dividen el algoritmo de control en una optimizaci on local est atica y una optimizaci on din amica. El primer m odulo calcula los valores de entrada y salida a los que es necesario llegar y el segundo calcula la secuencia de control adecuada. La optimizaci on din amica se lleva a cabo minimizando la funci on objetivo gen erica (5.3) con las restricciones correspondientes. Los distintos esquemas comerciales hacen simplicaciones respecto a la formulaci on general. La mayor a de los productos (ver tabla 5.1) s olo permiten matrices de peso constantes en todo el horizonte y s olo el NOVA-NLC trabaja con norma 1. Por su parte, el la salida pero con una matriz de peso que se incrementa Process Perfecter minimiza solo gradualmente con el horizonte, dando por tanto m as importancia a los errores m as lejanos y en consecuencia dando lugar a una acci on de control m as suave. En cuanto a las restricciones, normalmente las correspondientes a la entrada se tratan como restricciones duras, es decir, que nunca deben ser violadas. El PFC tambi en incluye restricciones de aceleraci on, muy utiles para aplicaciones de servomecanismos. Este m etodo no trata estas restricciones de forma optima, sino que resuelve el problema de optimizaci on sin restricciones y luego satura a los l mites, produciendo por tanto una soluci on no optima. Respecto a restricciones en la salida, la mayor a de los productos comerciales las trata como restricciones blandas, debido a que una perturbaci on puede producir f acilmente una p erdida de factibilidad. Una opci on ofertada por el Process Perfecter es considerar

Tendencias actuales y nuevas perspectivas

67

Empresa Producto Modelo F. Objetivo Restricciones Estructura u M et. solucion

Adersa PFC EE, PP Q S, BS FB, UM NLS

Aspen Tech. Aspen Target EE Q DS, DE, BS MM QP

Continental MVC E/S, PNE Q DE, BS UM GRG

DOT Products NOVA NLC EE, PP Q, N1 DE, BS MM MINLP

Pavillion Tech. Process Perfecter RN, E/S Q DE, DS MM GD

Tabla 5.1: EE: espacio de estados no lineal. PP: primeros principios. E/S: entrada/salida. PNE: polinomio no lineal est atico. RN: red neuronal. N1: norma 1. S: saturaci on. BS: blandas (m nimo y m aximo) en la salida. DS: duras en las salidas. DE: duras en las entradas. FB: funciones base. UM: unico movimiento. MM: m ultiples movimientos. NLS: m nimos cuadrados no lineales. GRG: Generalized Reduced Gradient. MINLP: Mixed Integer Nonlinear Programming. GD: Gradient descent.

una restricci on dura en forma de embudo, de manera que se da m as libertad a la salida al comienzo del horizonte que al nal. Par ametros: normalmente se elige un horizonte de predicci on nito muy grande, con la idea de capturar la din amica hasta el permanente de las salidas para todas las entradas. Esto se puede considerar una aproximaci on al m etodo de horizonte innito propuesto para garantizar la estabilidad del bucle cerrado y puede explicar por qu e ninguno de los productos comerciales incluye restricci on terminal. Una idea introducida en el PFC y adoptada por Aspen Target es el uso de puntos de coincidencia, en los cuales deben coincidir la salida y la trayectoria de referencia. Esta cuando las salidas responden con distinta velocidad y se pueden idea puede ser util denir distintos puntos de coincidencia para cada una de ellas. En cuanto a la estructuraci on de la senal de control, se puede encontrar desde considerar el horizonte de control igual a 1, horizonte variable o funciones base. Esta de control usando un conjunto de ultima idea, propia del PFC, parametriza la senal funciones polinomiales, permitiendo un perl de entrada complejo para un horizonte de control grande (en teor a podr a ser innito) empleando un n umero de inc ognitas pequeno. Esto puede resultar una ventaja en el caso de sistemas no lineales. La de la familia de funciones base establece muchas de las caracter eleccion sticas del perl de la entrada, pudiendo asegurar con una correcta elecci on una senal de control suave, por ejemplo. Si se eligen funciones base polin omicas, se puede seleccionar el orden para seguir un setpoint polin omico sin retraso, lo cual puede ser importante para aplicaciones de servosistemas mec anicos. La soluci on del problema no es tarea f acil debido a la no convexidad del problema gen erico. El PFC propone una soluci on sencilla resolviendo el problema sin restricciones usando un algoritmo de m nimos cuadrados no lineal y saturando las entradas a sus

68

Control predictivo no lineal

stos se violan; l l mites si e ogicamente no se asegura una soluci on optima, pero se gana en velocidad, permitiendo que este controlador se use en aplicaciones con per odos de muestreo pequenos, como el caso de seguimiento de missiles. Para el caso gen erico se usan diversos algoritmos, algunos propietarios, basados en m etodos m as o menos conocidos de optimizaci on. Entre ellos cabe destacar el que usa Aspen Target, desarrollado por Oliveira y Biegler [15], que garantiza que las ptimas, son factibles. Ello garantiza que una pronta soluciones intermedias, aunque no o nalizaci on del algoritmo por limitaciones de tiempo produce siempre una soluci on factible. En cualquier caso queda claro que el esfuerzo computacional es superior al sta una de las principales razones la todav caso lineal, siendo e a escasa implantaci on de estas t ecnicas en la industria.

5.2.7

Necesidades futuras

Los temas que pueden considerarse abiertos en esta t ecnica son: Modelado: los modelos no lineales son m as complejos que los lineales, pero adem as el proceso de identicaci on es mucho m as dif cil. Se necesita una gran bater a de ensayos para capturar las no-linealidades del proceso, resultando en un per odo de pruebas considerable. Por tanto, la forma de disponer de una representaci on correcta de la din amica del proceso es un problema que no est a completamente resuelto. Resoluci on del problema: la inclusi on del modelo no lineal en la optimizaci on da sta no sea convexa. Grandes esfuerzos deben hacerse todav lugar a que e a para encontrar algoritmos de optimizaci on ables que permitan la resoluci on dentro del tiempo asignado. Justicaci on del esfuerzo: vistas las dicultades que aparecen en la aplicaci on de NMPC, debe poder justicarse el benecio que este tipo de t ecnica aporta. Algunos fabricantes ofrecen un MPC de respaldo, de manera que en el caso de que no se necesite ese esfuerzo adicional o el controlador no lineal sea realmente complicado de poner en marcha, se aplicar a la estrategia lineal. Otros temas: temas que son aplicables al Control Predictivo en general, funciones objetivos multicriterio, sintonizaci on de par ametros, mal condicionamiento o tolerancia a fallos. Es de destacar que ninguna de los productos comerciales incluye restricci on terminal ni horizonte innito, situaciones requeridas en teor a para garantizar la estabilidad nominal. En lugar de eso, se conf a en que con un horizonte de predicci on lo sucientemente grande se consiga el mismo comportamiento que horizonte innito.

Bibliograf a
[1] E.F. Camacho, M. Berenguel y F.R. Rubio. Advanced Control of Solar Power Plants. Springer-Verlag, London, 1997. [2] E.F. Camacho y C. Bordons. Model Predictive Control. Springer-Verlag, 1999. [3] H. Chen y F. Allgower. A quasi-innite horizon nonlinear predictive control scheme with guaranteed stability. Automatica, 34(10):12051218, 1998. [4] D.W. Clarke y C. Mohtadi. Properties of Generalized Predictive Control. Automatica, 25(6):859875, 1989. [5] D.W. Clarke, C. Mohtadi y P.S. Tuffs. Generalized Predictive Control. Part I. The Basic Algorithm. Automatica, 23(2):137148, 1987. [6] C.R. Cutler y B.C. Ramaker. Dynamic Matrix Control- A Computer Control Algorithm. En Automatic Control Conference, San Francisco, 1980. [7] C.E. Garc a, D.M. Prett y M. Morari. Model Predictive Control: Theory and Practice-a Survey. Automatica, 25(3):335348, 1989. [8] S.S. Keerthi y E.G. Gilbert. Optimal innite-horizon feedback laws for a general class of constrained discrete-time systems: Stability and moving-horizon approximations. J. Optim. Theory Appl., 57(2):265293, 1988. [9] R. De Keyser. A Gentle Introduction to Model Based Predictive Control. En PADI2 International Conference on Control Engineering and Signal Processing, Piura, Peru, 1998. [10] R.M.C. De Keyser, Ph.G.A. Van de Velde y F.G.A. Dumortier. A Comparative Study of Self-adaptive Long-range Predictive Control Methods. Automatica, 24(2):149 163, 1988. [11] K. Kr amer y H. Ubehauen. Predictive Adaptive Control. Comparison of Main aginas 327 Algorithms. En Proceedings 1st European Control Conference, Grenoble, p 332, julio 1991. [12] A.G. Kutnetsov y D.W. Clarke. Advances in Model-Based Predictive Control, cap tulo Application of constrained GPC for improving performance of controlled plants. Oxford University Press, 1994. 69

70

Bibliograf a

[13] E.S. Meadows, M.A. Henson, J.W. Eaton y J. Rawlings. Receding horizon control and discontinuous state feedback stabilization. Int. Journal Control, p aginas 1217 1229, 1995. [14] H. Michalska y D.Q. Mayne. Robust receding horizon control of constrained nonlinear systems. IEEE Trans. on Automatic Control, 38(11):16231633, 1993. [15] N.M.C. Oliveira y L.T. Biegler. An extension of newton-type algorithms for nonlinear process control. Automatica, 31:281286, 1995. [16] S.J. Qin y T.A. Badgwell. An Overview of Industrial Model Predictive Control Technology. In Chemical Process Control: Assessment and New Directions for Research. En AIChE Symposium Series 316, 93. Jeffrey C. Kantor, Carlos E. Garcia and Brice Carnahan Eds. 232-256, 1997. [17] S.J. Qin y Thomas A. Badgwell. An overview of nonlinear model predictive control applications. En IFAC Workshop on Nonlinear Model Predictive Control. Assessment and Future Directions. Ascona (Switzerland), 1998. [18] J. Richalet. Practique de la commande predictive. Hermes, 1992. [19] H. Takatsu, T. Itoh y M. Araki. Future needs for the control theory in industries. report and topics of the control technology survey in japanese indsutry. Journal of Process Control, 8:369374, 1998. [20] M.L. Tyler y M. Morari. Propositional Logic in Control and Monitoring Problems. Technical Report AUT96-15, Institut fur Automatik, ETH- Swiss Federal Institute of Technology, Zurich, Switzerland, 1996. [21] B.E. Ydstie. Extended Horizon Adaptive Control. En Proc. 9th IFAC World Congress, Budapest, Hungary, 1984.

También podría gustarte