Está en la página 1de 73

Escuela Superior de Ingenieros Universidad de Sevilla

Control Predictivo: metodologa,


tecnologa y nuevas perspectivas

Carlos Bordons Alba


Departamento de Ingeniera de Sistemas y Automatica
Universidad de Sevilla

I Curso de Especializacion en Automatica


Aguadulce, Almera, 2000

Indice general

Indice i

1 Fundamentos 1

1.1 Tendencias actuales en control de procesos ::::::::::::::::: 1

1.2 Perspectiva historica :::::::::::::::::::::::::::::: 5

1.3 Situacion actual :::::::::::::::::::::::::::::::: 6

1.4 Conceptos basicos de control predictivo ::::::::::::::::::: 7

1.5 Estrategia de los controladores :::::::::::::::::::::::: 8

2 Controladores predictivos 11

2.1 Elementos basicos ::::::::::::::::::::::::::::::: 11

2.1.1 Modelo de prediccion ::::::::::::::::::::::::: 11

2.1.2 Funcion objetivo :::::::::::::::::::::::::::: 15

2.1.3 Obtencion de la ley de control :::::::::::::::::::: 18

2.2 de los principales algoritmos


Revision :::::::::::::::::::: 18

2.3 Estado de la tecnologa :::::::::::::::::::::::::::: 23

3 Algoritmos 25

3.1 Dynamic Matrix Control ::::::::::::::::::::::::::: 25

3.1.1 Prediccion ::::::::::::::::::::::::::::::: 25

i
ii
Indice general

3.1.2 Perturbaciones medibles ::::::::::::::::::::::: 27

3.1.3 Algoritmo de control ::::::::::::::::::::::::: 28

3.2 Control Predictivo Generalizado ::::::::::::::::::::::: 31

3.2.1 Formulacion del Control Predictivo Generalizado ::::::::: 32

3.2.2 Ejemplo de calculo ::::::::::::::::::::::::::: 36

3.2.3 Caso multivariable ::::::::::::::::::::::::::: 38

4 Restricciones en Control Predictivo 41

4.1 Tratamiento convencional de restricciones :::::::::::::::::: 41

4.2 Restricciones en Control Predictivo ::::::::::::::::::::: 42

4.3 Resolucion del problema ::::::::::::::::::::::::::: 44

4.4 Gestion de restricciones :::::::::::::::::::::::::::: 45

4.4.1
Tecnicas de busqueda de soluciones factibles :::::::::::: 46

5 Tendencias actuales y nuevas perspectivas 51

5.1 Multiobjetivo. Jerarqua de objetivos ::::::::::::::::::::: 51

5.1.1 Jerarqua de objetivos ::::::::::::::::::::::::: 53

5.2 Control predictivo no lineal :::::::::::::::::::::::::: 54

5.2.1 Diferencias respecto al metodo lineal :::::::::::::::: 56

5.2.2 Fundamentos teoricos ::::::::::::::::::::::::: 56

5.2.3 Problematica asociada al NMPC :::::::::::::::::::: 57

5.2.4 Modelos :::::::::::::::::::::::::::::::: 61

5.2.5 Otras formulaciones del problema :::::::::::::::::: 64

5.2.6 Resolucion del problema. Productos comerciales :::::::::: 66

5.2.7 Necesidades futuras :::::::::::::::::::::::::: 68

Bibliografa 69
Tema 1

Fundamentos

1.1 Tendencias actuales en control de procesos


Aunque en el pasado poda considerarse que el unico objetivo del control consista en
mantener una operacion estable del proceso, actualmente la industrias se enfrentan a
un mercado cambiante y difcil de predecir, lo que les obliga a operar sus procesos
productivos en consonancia con la evolucion del mercado para poder mantenerse
competitivas y rentables.

La competencia en muchos sectores industriales as como el creciente interes social


por los problemas medioambientales relacionados con los procesos de produccion
provoca la necesidad de disponer de tecnicas fiables que permitan la operacion del
proceso con gran eficiencia y alto grado de flexibilidad.

Actualmente los sistemas de control en la industria de procesos deben satisfacer


criterios economicos, asociados con el mantenimiento de las variables de proceso en sus
referencias minimizando dinamicamente una funcion de coste de operacion, criterios
de seguridad y medioambientales, y de calidad en la produccion, la cual debe satisfacer
ciertas especificaciones sujetas a una demanda normalmente variable.

Por ello, se puede considerar que en la actualidad el objetivo de todo sistema de


control consiste en actuar sobre las variables manipuladas de forma que puedan satis-

facerse multiples y cambiantes criterios de funcionamiento (economicos, de seguridad,
medioambientales o de calidad) en presencia de cambios en las caractersticas del pro-
ceso.

El amplio abanico de metodologas actuales de control de procesos se enfrenta al


cumplimiento de este objetivo. La diferencia entre las diversas tecnicas radica basi-
camente en los compromisos hechos en la formulacion matematica de los criterios de
funcionamiento y en la eleccion de la manera de representar el proceso. La represen-

1
2 Tendencias actuales en control de procesos

1983 (%) 1989 (%) 1995 (%)


Retardo 24 Retardo 23 Interaccion 24
Perturbaciones 21 Interaccion 16 Perturbaciones 22
Interaccion 17 Perturbaciones 15 Retardo 21
Respuesta 16 Cambios 12 Cambios 14
Estabilidad 11 No lineal 10 No lineal 7

Tabla 1.1: Principales problemas de control

tacion matematica de muchos de estos criterios se lleva a cabo en la forma de funciones


objetivo dinamicas y de restricciones mientras que el proceso se representa como un
modelo dinamico con incertidumbres asociadas. La importancia de las incertidum-
bres esta siendo cada vez mas reconocida y por tanto incluida explcitamente en la
formulacion de los controladores.

Las tecnicas de Control Predictivo Basado en Modelo (Model Based Predictive


Control, MPC) parecen constituir unas poderosas herramientas para afrontar estos retos.
MPC, en su forma mas general, acepta cualquier tipo de modelos, funciones objetivo o
restricciones, siendo la metodologa que actualmente puede reflejar mas directamente

los multiples criterios de funcionamiento relevantes en la industria de procesos. Quizas
sea e sta la principal razon del e xito de estas tecnicas en numerosas aplicaciones de la
industria de procesos, unida a que es la forma mas general de formular el problema de
control en el dominio del tiempo, de manera que puede resultar facil de aceptar por el
personal de la industria.

Los resultados de un estudio realizado por Takatsu et al. para la Society of Instru-
mentation and Control Engineering [19] son indicativos de las necesidades futuras de
la industria en el a mbito del control. En este informe se analizan los principales proble-
mas de control que se encuentran en la industria de procesos, el estado de aplicacion
de las tecnologas avanzadas, el grado de satisfaccion de los usuarios con cada una de
ellas y las expectativas que cada una genera.


La evolucion en los ultimos anos
de los principales problemas de control para los
usuarios se muestra en la tabla 1.1.

Observese que los tres primeros problemas siguen siendo los mismos en los tres
anos
que se ha realizado la encuesta y parece que a lo largo del tiempo se resuelven
problemas basicos como estabilidad y respuesta y se atacan problemas mas difciles
como dinamica no lineal. Como se vera mas adelante, el Control Predictivo es una
metodologa capaz de ofrecer soluciones a todos estos problemas.

Tambien resulta interesante analizar los factores claves de e xito y fracaso de la


automatizacion del proceso (1.2 y 1.3). De estas tablas se desprende que la eleccion de

la estrategia de control no es el unico factor a tener en cuenta para garantizar un buen
Fundamentos 3

Seleccion de la estrategia de control 14 %


Seleccion del equipo de control 12 %
Especificaciones apropiadas 10 %
Configuracion flexible del sistema 10 %
Operacion de emergencia 10 %
Interface con el operario 8%
Analisis de proceso 8%

Tabla 1.2: Principales factores claves de e xito

Ausencia de analisis del proceso. Inexactitud del modelo 21 %


Seleccion de los sensores 14 %
Falta de rechazo a las perturbaciones 10 %
Seleccion de la estrategia de control 7%
Seleccion de los actuadores 6%
Seleccion del equipo de control 5%
Especificaciones inapropiadas 5%
Configuracion rgida del sistema 5%

Tabla 1.3: Principales factores claves de fracaso

funcionamiento del sistema de control.

Del informe citado se pueden extraer conclusiones interesante sobre el estado y el


grado de aceptacion de las tecnologas consideradas avanzadas (ver tabla 1.4). En ella
se muestra el porcentaje de plantas que usaron cada tecnica en 1989 y 1995. Observese
que todas crecieron excepto el control adaptativo y el autoajuste que tuvieron un ligero
descenso.

Con el fin de evaluar el grado de satisfaccion del usuario con las distintas tecnicas,
se muestra en la tabla 1.5 el porcentaje de usuarios que estan satisfechos con cada una
de las tecnicas que han empleado. Como conclusion interesante destaca el hecho de
que practicamente todos los usuarios de Control Predictivo estan satisfechos.

Tambien resulta interesante intentar cuantificar la evolucion futura de las distintas


tecnicas. Para ello, la figura 1.1 intenta mostrar las posibilidades tecnicas y las expec-
tativas despertadas por cada una de ellas. Posibilidad tecnica se refiere a la facilidad
de implementacion y expectativas al efecto esperado de uso de cada tecnica. El punto
de partida de cada flecha es la media de todas las respuestas a la encuesta, mientras
que su extremo corresponde a la media de las 15 plantas consideradas lderes en temas
de control. El citado artculo interpreta la flecha como tendencia futura. Segun esto,
el PID avanzado, compensacion de retardo, borroso, desacoplo y MPC seran tecnicas
4 Tendencias actuales en control de procesos

Tecnica 1989 1995


Compensacion de retardo 29.6 52.4
Borroso 9.9 38
Control Predictivo 25.4 37.2
Gain-scheduling 25.7 32.5
PID avanzado 24.8 29.4
Autoajuste 32.2 29.1
Desacoplo 17.5 28.6
Basado en reglas 6.3 17.9
Filtro de Kalman 9.1 15.5
Neuronal 0 11.8
LQ 8.2 11
Observador 8.2 9.8
Control adaptativo 10.3 7
H1 0 9.3

Tabla 1.4: Estado de las distintas tecnicas

Tecnica 1989 1995


Control Predictivo 76 94
PID avanzado 77 89
Compensacion de retardo 72 89
Gain-scheduling 78 87
Borroso 67 83
LQ 79 70
Neuronal - 69
Desacoplo 64 66
Filtro de Kalman 70 66
Autoajuste 60 65
Observador 67 62
Basado en reglas 43 61
Control adaptativo 50 56
H1 - 50

Tabla 1.5: Grado de satisfaccion de las distintas tecnicas


Fundamentos 5

ampliamente usadas con grandes expectativas. El control neuronal despierta grandes


expectativas pero tiene ciertas dificultades de implementacion, mientras que el Autoa-
juste se implementa con facilidad pero pierde expectativas. Las tecnicas como LQR,
filtro de Kalman, H1 o adaptativo se mantienen como "sin demasiadas expectativas y
no facilmente implementables".

MPC

Retardo

Borroso

PID
Expectativas

Adaptativo
Neuronal

Hoo
Desacoplo
LQ Auto
ajuste
F. Kalman

Deslizante

Posibilidades tcnicas

Figura 1.1: Expectativas y posibilidades tecnicas

Este estado actual y futuras tendencias en el campo del control de procesos indus-
triales indican que el Control Predictivo Basado en Modelo se puede considerar una
tecnologa suficientemente introducida en la industria y que ademas sigue despertando
muchas expectativas. Estos hechos, unidos a la existencia de campos abiertos tanto en
investigacion como en temas relacionados con la implementacion justifica un estudio
mas detallado de esta tecnologa.

1.2 Perspectiva historica

El Control Predictivo se desarrollo en base a dos lneas basicas. Por un lado, a finales
de los anos
setenta surgieron diversos algoritmos que usaban explcitamente un mo-
delo dinamico del proceso para predecir el efecto de las acciones de control futuras
en la salida, las cuales eran determinadas minimizando el error predicho sujeto a res-
tricciones de operacion. La optimizacion se repeta en cada instante de muestreo con
informacion actualizada del proceso. Estas formulaciones eran de naturaleza heurstica
6 Situacion actual

y algortmica e intentaban aprovechar el creciente potencial de los computadores digi-


tales por aquella e poca.

Rapidamente el MPC adquirio gran popularidad en las industrias de procesos


qumicos principalmente debido a la simplicidad del algoritmo y al uso del modelo
de respuesta impulsional o en escalon, que aunque posea muchos mas parametros
que las formulaciones en el espacio de estados o funcion de transferencia suele ser
preferido por ser intuitivo y necesitar menos informacion a priori para identificar. La
mayora de las aplicaciones fueron llevadas a cabo sobre sistemas multivariables in-
cluyendo restricciones. Los algoritmos utilizados fueron principalmente el IDCOM
(Identification-Command) y el DMC (Control con Matriz Dinamica, Dynamic Matrix
Control).

Independientemente fue surgiendo otra lnea de trabajo en torno a las ideas del con-
trol adaptativo, desarrollando estrategias esencialmente para procesos monovariables
formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del
Controlador de Mnima Varianza y se desarrollo el Control Predictivo Generalizado
(Generalized Predictive Control GPC) que es uno de los metodos mas populares en la
actualidad.

actual
1.3 Situacion

La situacion actual de aplicaciones de MPC en la industria esta bien reflejada en la re-


copilacion de Qin y Badgwell [16], que recoge unas 2200 aplicaciones, principalmente
en el sector petroqumico (desde entonces el numero de aplicaciones puede estimarse
en torno a las 3000). La mayora de las aplicaciones son en procesos multivariables,
registrandose casos como un controlador con 40 entradas y 80 salidas. Sorprendente-
mente, MPC ha tenido menor impacto en otro tipo de industrias, aunque estudios de
1993 sugieren que unas 20.000 aplicaciones podran beneficiarse de esta tecnica.

El e xito actual del MPC en la industria se debe a tres razones principales:

 La incorporacion de un modelo explcito del proceso en los calculos permite al


controlador tratar con todas las caractersticas importantes de la dinamica del
proceso.

 La consideracion del comportamiento del proceso a lo largo de un horizonte


futuro permite tener en cuenta el efecto de las perturbaciones en realimentacion
y pre-alimentacion, permitiendo al controlador conducir la salida a la trayectoria
de referencia deseada.

 La consideracion de restricciones en la fase del diseno


del controlador evita en
lo posible su violacion, resultando en un control mas preciso en torno al punto
Fundamentos 7


optimo de operacion. La inclusion de restricciones es quizas la caracterstica que
mas distingue al MPC respecto a otras metodologas.

Otra de las razones que han contribuido a que el MPC se haya convertido en un e xito
comercial es el hecho de que existen unos 15 suministradores que instalan el producto
llave en mano, con periodos de amortizacion de entre 3 y 12 meses, permitiendo
que medianas empresas puedan tener acceso a esta tecnologa. Aparte de esto, los
nuevos Sistemas de Control Distribuido empiezan a ofertar productos MPC genericos
que ofrecen al usuario la posibilidad de realizar futuras modificaciones sin depender
de un producto cerrado.

1.4 Conceptos basicos de control predictivo

El Control Predictivo Basado en Modelo, Model (Based) Predictive Control (MBPC o


MPC) constituye un campo muy amplio de m etodos de control desarrollados en torno
a ciertas ideas comunes e integra diversas disciplinas como control o ptimo, control
estocastico, control de procesos con tiempos muertos, control multivariable o control
con restricciones.

El Control Predictivo no es una estrategia de control especfica, sino que se trata


mas bien de un campo muy amplio de metodos de control desarrollados en torno a
ciertas ideas comunes. Estos metodos de diseno
conducen a controladores lineales que
poseen practicamente la misma estructura y presentan suficientes grados de libertad.
Las ideas que aparecen en mayor o menor medida en toda la familia de controladores
predictivos son basicamente:

 Uso explcito de un modelo para predecir la salida del proceso en futuros instantes
de tiempo (horizonte).
 Calculo de las senales
de control minimizando una cierta funcion objetivo.
 Estrategia deslizante, de forma que en cada instante el horizonte se va despla-
zando hacia el futuro, lo que implica aplicar la primera senal de control en cada
instante y desechar el resto, repitiendo el calculo en cada instante de muestreo.

Los distintos algoritmos de MPC difieren entre s casi exclusivamente en el modelo


usado para representar el proceso y los ruidos y en la funcion de coste a minimizar.
Aunque las diferencias puedan parecer pequenas a priori, pueden provocar distintos
comportamientos en bucle cerrado, siendo crticas para el e xito de un determinado
algoritmo en una determinada aplicacion.

El Control Predictivo es un tipo de control de naturaleza abierta dentro del cual se


han desarrollado muchas realizaciones, encontrando gran aceptacion tanto en aplica-
ciones industriales como en el mundo academico. En la actualidad existen numerosas
8 Estrategia de los controladores

aplicaciones de controladores predictivos funcionando con e xito, tanto en la industria


de procesos como en control de motores o Robotica. El buen funcionamiento de estas
aplicaciones muestra la capacidad del MPC para conseguir sistemas de control de ele-
vadas prestaciones capaces de operar sin apenas intervencion durante largos perodos
de tiempo.

El MPC presenta una serie de ventajas sobre otros metodos, entre las que destacan:

 Resulta particularmente atractivo para personal sin un conocimiento profundo


de control, puesto que los conceptos resultan muy intuitivos, a la vez que la
sintonizacion es relativamente facil.

 Puede ser usado para controlar una gran variedad de procesos, desde aquellos con
dinamica relativamente simple hasta otros mas complejos incluyendo sistemas
con grandes retardos, de fase no mnima o inestables.

 Permite tratar con facilidad el caso multivariable.

 Posee intrnsecamente compensacion del retardo.

 Resulta conceptualmente simple la extension al tratamiento de restricciones, que


pueden ser incluidas de forma sistematica durante el proceso de diseno.

 Es muy util
cuando se conocen las futuras referencias (robotica o procesos en
batch).

 Es una metodologa completamente abierta basada en algunos principios basicos


que permite futuras extensiones.

Pero, logicamente, tambien presenta inconvenientes. Unos de ellos es la carga


de calculo necesaria para la resolucion de algunos algoritmos. Pero quizas el mayor
inconveniente venga marcado por la necesidad de disponer de un modelo apropiado del
proceso. El algoritmo de diseno esta basado en el conocimiento previo del modelo y es
independiente de e ste, pero resulta evidente que las prestaciones obtenidas dependeran
de las discrepancias existentes entre el proceso real y el modelo usado.

1.5 Estrategia de los controladores

La metodologa de todos los controladores pertenecientes a la familia del MPC se carac-


teriza por la estrategia siguiente, representada en la figura 1.2:

1. En cada instante t y haciendo uso del modelo del proceso se predicen las futuras
salidas para un determinado horizonte N , llamado horizonte de prediccion. Estas
Fundamentos 9

u(t+k|t)

u(t)

^y(t+k|t)
y(t)
N

t-1 t t+1 ... t+k ... t+N

Figura 1.2: Estrategia del Control Predictivo

salidas predichas, y (t + k j t)1 para k = 1 : : : N dependen de los valores conocidos


hasta el instante t (entradas y salidas pasadas) y de las senales
de control futuras
u(t + k j t), k = 0 : : : N ; 1 que se pretenden mandar al sistema y que son las que
se quieren calcular.
2. El conjunto de senales
de control futuras se calcula optimizando un determinado
criterio en el que se pretende mantener el proceso lo mas proximo posible a la
trayectoria de referencia w (t + k ) (que puede ser directamente el setpoint o una
suave aproximacion a e ste). Este criterio suele tomar la forma de una funcion
cuadratica de los errores entre la salida predicha y la trayectoria de referencia
tambien predicha, incluyendo en muchos casos el esfuerzo de control. Si el criterio
es cuadratico, el modelo lineal y no existen restricciones se puede obtener una
solucion explcita, en otro caso se debe usar un metodo iterativo de optimizacion.
Adicionalmente se hace alguna suposicion sobre la estructura de la ley de control
futura, como por ejemplo que va a ser constante a partir de cierto instante.
de control u(t j t) es enviada al proceso mientras que las siguientes
3. La senal
senales
de control calculadas son desechadas, puesto que en el siguiente instante
de muestreo ya se conoce y (t + 1) y se repite el paso 1 con este nuevo valor y
todas las secuencias son actualizadas. Se calcula por tanto u(t + 1 j t + 1) (que en
principio sera diferente al u(t + 1 j t) al disponer de nueva informacion), haciendo
uso del concepto de horizonte deslizante.

Para llevar a cabo esta estrategia, se usa una estructura como la mostrada en la
figura 1.3. Se hace uso de un modelo para predecir las salidas futuras del proceso,
1
la notacion indica el valor de la variable en el instante t + k calculado en el instante t.
10 Estrategia de los controladores

Entradas y salidas Trayectoria


Salidas de referencia
pasadas predichas +
Modelo
-

Controles
futuros

Optimizador
Errores futuros

Funcion de coste Restricciones

Figura 1.3: Estructura basica del MPC

basandose en las futuras senales


de control propuestas. Estas senales
son calculadas
por el optimizador teniendo en cuenta la funcion de coste (donde aparece el futuro error
de seguimiento) as como las restricciones. Por tanto el modelo juega un papel decisivo
en el controlador. El modelo elegido debe ser capaz de capturar la dinamica del proceso
para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo de usar
y de comprender.

El optimizador es otra parte fundamental de la estrategia pues proporciona las


acciones de control. Si la funcion de coste es cuadratica, el mnimo se puede obtener
como una funcion explcita de las entradas y salidas pasadas y de la trayectoria de
referencia. Sin embargo, cuando existen restricciones de desigualdad la solucion debe
ser calculada por metodos numericos con mas carga de calculo.
Tema 2

Controladores predictivos

2.1 Elementos basicos

Todos los controladores predictivos poseen elementos comunes y para cada uno de
estos elementos se pueden elegir diversas opciones, dando lugar a distintos algoritmos.
Estos elementos son:

 Modelo de prediccion

 Funcion objetivo

 Obtencion de la ley de control

2.1.1 Modelo de prediccion

La piedra angular del MPC es el modelo; un diseno completo debe incluir los me-
canismos necesarios para la obtencion del mejor modelo posible, el cual debe ser lo
suficientemente rico para capturar al maximo la dinamica del proceso y debe ser ca-
paz de permitir el calculo de las predicciones a la vez que sea intuitivo y permita un
analisis teorico. El uso del modelo del proceso viene determinado por la necesidad del
calculo de la salida predicha en instantes futuros y (t + k j t). Las diferentes estrategias
de MPC pueden usar distintos modelos para representar la relacion de las salidas con
las entradas medibles, algunas de las cuales seran variables manipuladas y otras se
pueden considerar como perturbaciones medibles, que pueden ser compensadas por
feedforward. Ademas se tendra en cuenta un modelo de las perturbaciones, para
accion
intentar describir el comportamiento que no aparece reflejado en el modelo del pro-
ceso, englobandose aqu el efecto de las entradas no medibles, el ruido y los errores de
modelado.

11
12 Elementos basicos

Para el estudio se puede separar el modelo en dos partes: el modelo del proceso
propiamente dicho y el modelo de las perturbaciones. Cualquier metodo usara ambas
partes para la prediccion.

Modelo del Proceso

Casi todas las formas posibles de modelar un proceso aparecen en alguna formu-
de MPC siendo las mas usadas las siguientes:
lacion

 Respuesta impulsional. Tambien conocida por secuencia de ponderacion o mo-


delo de convolucion. La salida viene relacionada con la entrada por la ecuacion
1
X
y(t) = hiu(t ; i)
i=1
donde hi son los valores muestreados obtenidos al someter al proceso a un impulso
unitario de amplitud igual al perodo de muestreo (ver figura 2.1a). Esta suma
es truncada y solo se consideran N valores (por tanto solo permite representar
procesos estables y sin integradores), teniendo
X
N
y(t) = hi u(t ; i) = H (z;1)u(t) (2:1)
i=1
donde H (z ;1 ) = h1 z ;1 + h2 z ;2 +    + hN z ;N . Un inconveniente de este metodo es

el gran numero de parametros que necesita, ya que N suele ser un valor elevado
(del orden de 40-50). La prediccion vendra dada por:
X
N
y(t + k j t) = hi u(t + k ; i j t) = H (z;1)u(t + k j t)
i =1
Este metodo es ampliamente aceptado en la practica industrial debido a que
es muy intuitivo y no requiere informacion previa sobre el proceso, con lo que
el procedimiento de identificacion se simplifica, a la vez que permite describir
facilmente dinamicas complejas como fase no mnima o retardos.
 Respuesta ante escalon. Es muy similar al anterior solo que ahora la senal de
entrada es un escalon. Para sistemas estables se tiene la respuesta truncada que
sera
XN
y(t) = y0 + gi 4 u(t ; i) = y0 + G(z;1)(1 ; z;1 )u(t) (2:2)
i=1
donde las gi son los valores muestreados ante la entrada en escalon y 4u(t) =
u(t) ; u(t ; 1), segun
se muestra en la figura 2.1b. El valor de y0 puede tomarse 0
sin perdida de generalidad, con lo cual el predictor sera:
X
N
y(t + k j t) = gi 4 u(t + k ; i j t)
i=1
Este metodo presenta las mismas ventajas e inconvenientes que el anterior.
Controladores predictivos 13

h2

N
i

g
g
hi
h1

g2
hN
y(t) y(t)

g1
t t+1 t+2 ... t+N t t+1 t+2 ... t+N
a) b)

Figura 2.1: Respuesta impulsional y ante escalon

 Funcion de transferencia. Se utiliza el concepto de funcion de transferencia


G = B=A con lo que la salida viene dada por:
A(z;1 )y(t) = B (z;1 )u(t)

A( z ; 1 ) = 1 + a1 z ;1 + a2 z ;2 +    + ana z ;na
B (z ;1 ) = b1 z;1 + b2 z;2 +    + bnb z;nb
Por tanto la prediccion vendra dada por

B (z ;1 )
y(t + k j t) = A(z;1 ) u(t + k j k)
Esta representacion es valida tambien para procesos inestables y posee la ventaja
de necesitar pocos parametros, aunque es fundamental un conocimiento a priori
del proceso sobre todo en cuanto al orden de los polinomios A y B .

 Espacio de estados. Tiene la siguiente representacion:

x(t) = Ax(t ; 1) + Bu(t ; 1)


y(t) = Cx(t)
siendo x el estado y A, B y C las matrices del sistema, de entrada y de salida
respectivamente. Para este modelo la prediccion viene dada por

X
k
y(t + k j t) = C x (t + k j t) = C Ak x(t) + Ai;1Bu(t + k ; i j t)]
i=1
14 Elementos basicos

Posee la ventaja de que sirve tambien para sistemas multivariables a la vez que
permite analizar la estructura interna del proceso (aunque a veces los estados
obtenidos al discretizar no tienen ningun significado fsico). Los calculos pueden
ser complicados, con la necesidad adicional de incluir un observador si los estados
no son accesibles.

Modelo de las perturbaciones

De tanta importancia como la eleccion de un determinado modelo del proceso


es la eleccion del modelo utilizado para representar la perturbaciones. Un modelo
bastante extendido es el Autorregresivo Integrado de Media Movil (Auto-Regressive
and Integrated Moving Average, ARIMA), en el que las perturbaciones, es decir, las
diferencias entre la salida medida y la calculada por el modelo vienen dadas por

(z ;1 )e(t)
n(t) = C D (z ;1 )

donde el polinomio D (z;1 ) incluye explcitamente el integrador 4 = 1 ; z;1 , e(t) es


un ruido de media cero y normalmente el polinomio C se considera igual a uno. Este
modelo se considera apropiado para dos tipos de perturbaciones: cambios aleatorios
ocurridos en instantes aleatorios (por ejemplo cambio en la calidad del material) y
movimiento browniano (en procesos con balance de energa) y es usado en varios
metodos. Notese que al incluir un integrador se consigue un control con error nulo en
regimen permanente (offset-free).

Como caso particular del ARIMA se puede incluir la perturbacion constante

n(t) = 1 ;e(tz);1
cuya mejor prediccion sera n (t + k j t) = n(t).

Respuestas libre y forzada

Una caracterstica tpica de la mayora de los controladores MPC es el empleo de los


conceptos de repuesta libre y forzada. La idea es expresar la secuencia de acciones de
control como la suma de dos senales:

u(t) = uf (t) + uc(t)


uf (t) corresponde a las entradas pasadas (anteriores al instante t) y en el futuro
La senal

se mantiene constante e igual al ultimo valor de la variable manipulada. Es decir,

uf (t ; j ) = u(t ; j ) para j = 1 2   
uf (t + j ) = u(t ; 1) para j = 0 1 2   
Controladores predictivos 15

uc (t) vale cero en el pasado y corresponde a las senales


La senal de control en los
instantes futuros:

uc(t ; j ) = 0 para j =1 2   


uc(t + j ) = u(t + j ) ; u(t ; 1) para j = 0 1 2   

La prediccion de la secuencia se salida se separa en dos partes, como se ve en la


figura 2.2. Una de ellas (yf (t)), la respuesta libre, corresponde a la prediccion de la
salida cuando la variable manipulada se hace igual a uf (t), y la otra, la repuesta forzada
(yc (t)), corresponde a la prediccion de la salida cuando la senal
de control es uc (t).
La respuesta libre corresponde a la evolucion del proceso debido a su estado actual
(incluido por tanto el efecto de acciones pasadas) mientras que la respuesta forzada es
la debida a las acciones de control futuras.

u y
Process

t t

u uc y yc
f f

t t t t

Figura 2.2: Respuestas libre y forzada

2.1.2 Funcion objetivo

Los diversos algoritmos de MPC proponen distintas funciones de coste para la obtencion
de la ley de control. En general se persigue que la salida futura en el horizonte
considerado siga a una determinada senal
de referencia al mismo tiempo que se puede
penalizar el esfuerzo de control requerido para hacerlo. La expresion general de tal
funcion objetivo sera:

X
N 2 X
Nu
J (N1  N2 Nu) = (j )y(t + j j t) ; w(t + j )]2 + (j )4u(t + j ; 1)]2 (2:3)
j =N1 j =1

En algunos metodos el segundo sumando, que considera el esfuerzo de control, no


se tiene en cuenta, mientras que en otros tambien aparecen directamente los valores de
la senal
de control (no sus incrementos). En la funcion de coste se pueden considerar:
16 Elementos basicos

 Parametros: N1 y N2 son los horizontes mnimo y maximo de coste (o de pre-


diccion) y Nu es el horizonte de control, que no tiene por que coincidir con el
horizonte maximo, como se vera posteriormente. El significado de N1 y N2 re-
sulta bastante intuitivo: marcan los lmites de los instantes en que se desea que
la salida siga a la referencia. As, si se toma un valor grande de N1 es porque
no importa que haya errores en los primeros instantes, lo cual provocara una
respuesta suave del proceso. Notese que para procesos con tiempo muerto d no
tiene sentido que N1 sea menor que dicho valor puesto que la salida no empezara
a evolucionar hasta el instante t + d. Ademas, si el proceso es de fase no mnima,
este parametro permite eliminar de la funcion objetivo los primeros instantes de
respuesta inversa.
Los coeficientes  (j ) y (j ) son secuencias que ponderan el comportamiento fu-
turo. Usualmente se consideran valores constantes o secuencias exponenciales.
Por ejemplo se puede conseguir un peso exponencial de  (j ) a lo largo del hori-
zonte usando:
(j ) = N2;j
Si  esta comprendido entre 0 y 1 indica que se penaliza mas a los errores mas
alejados del instante t que a los mas proximos, dando lugar a un control mas
suave y con menor esfuerzo. Si, por el contrario,  > 1 es que se penalizan mas
los primeros errores, provocando un control mas brusco.
Todos estos valores pueden ser usados como parametros de sintonizacion, ob-
teniendo un abanico muy amplio de posibilidades con las que se puede cubrir
una extensa gama de opciones, desde un control estandar hasta una estrategia
disenada
a medida para un proceso en particular.
 Trayectoria de referencia: Una de las ventajas del control predictivo es que si
se conoce a priori la evolucion futura de la referencia, el sistema puede empezar
a reaccionar antes de que el cambio se haya efectivamente realizado, evitando
los efectos del retardo en la respuesta del proceso. En muchas aplicaciones la
evolucion futura de la referencia r(t + k ) es conocida de antemano, como en

Robotica, servos o procesos en batch; en otras aplicaciones aunque la referencia sea
constante, se puede conseguir una sensible mejora de prestaciones simplemente
conociendo el instante de cambio de valor y adelantandose a esa circunstancia.
En el criterio de minimizacion (2.3), la mayora de los metodos suelen usar una
trayectoria de referencia w(t + k ) que no tiene por que coincidir con la referencia
real. Normalmente sera una suave aproximacion desde el valor actual de la salida
y(t) a la referencia conocida mediante un sistema de primer orden:
w(t) = y(t) w(t + k) = w(t + k ; 1) + (1 ; )r(t + k) k = 1 : : : N (2:4)
 es un parametro comprendido entre 0 y 1 (mientras mas proximo a 1 mas
suave sera la aproximacion) que constituye un valor ajustable que influira en
la respuesta dinamica del sistema. En la figura 2.3 se muestra la forma de la
trayectoria cuando la referencia r (t + k) es constante y para dos valores distintos
de ; para valores pequenos
de este parametro se tiene un seguimiento rapido
Controladores predictivos 17

(w1 ) mientras que si aumenta, la trayectoria de referencia sera w2 dando lugar a


una respuesta mas suave.

r(t+k)

w1(t+k)
w2 (t+k)

y(t)

Figura 2.3: Trayectoria de referencia

 Restricciones: En la practica, todos los procesos estan sujetos a restricciones. Los


actuadores tienen un campo limitado de accion as como una determinada ve-
locidad de cambio (slew rate), como es el caso de las valvulas, limitadas por las
posiciones de totalmente abierta o cerrada y por la velocidad de respuesta. Razo-
nes constructivas, de seguridad o medioambientales o bien los propios alcances de
los sensores pueden causar lmites en las variables de proceso, tales como niveles

en depositos, caudales en tuberas o temperaturas y presiones maximas. Ademas,
normalmente las condiciones de operacion vienen definidas por la interseccion
de ciertas restricciones por motivos fundamentalmente economicos, con lo que el
sistema de control operara cerca de los lmites. Todo lo expuesto anteriormente
hace necesaria la introduccion de restricciones en la funcion a minimizar.

Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo


cual han tenido gran e xito en la industria. Normalmente se consideraran lmites
en la amplitud y el slew rate de la senal
de control y lmites en las salidas:

umin  u(t)  umax 8t


dumin  u(t) ; u(t ; 1)  dumax 8t
ymin  y(t)  ymax 8t

con la adicion de estas restricciones a la funcion objetivo, la minimizacion resulta


mas compleja, no pudiendo obtenerse la solucion analticamente como en el caso
sin restringir.
18 de los principales algoritmos
Revision

2.1.3 Obtencion de la ley de control

Para obtener los valores u(t + k j t) sera necesario minimizar la funcional J de la


ecuacion (2.3). Para ello se calculan los valores de las salidas predichas y (t + k j t)
en funcion de valores pasados de entradas y salidas y de senales de control futuras,
haciendo uso del modelo que se haya elegido y se sustituyen en la funcion de coste,
obteniendo una expresion cuya minimizacion conduce a los valores buscados. Para el
criterio cuadratico si el modelo es lineal y no existen restricciones se puede obtener una
solucion analtica, en otro caso se debe usar un metodo iterativo de optimizacion.

De cualquiera de las maneras la obtencion de la solucion no resulta trivial pues


existiran N2 ; N1 + 1 variables independientes, valor que puede ser elevado (del orden
de 10 a 30). Con la idea de reducir estos grados de libertad se puede proponer cierta
estructura a la ley de control. Ademas se ha encontrado que esta estructuracion de la
ley de control produce una mejora en la robustez y en el comportamiento general del
sistema, debido fundamentalmente a que el hecho de permitir la libre evolucion de
las variables manipuladas (sin estructurar) puede conducir a senales
de control de alta
frecuencia no deseables y que en el peor de los casos podran conducir a la inestabilidad.

Esta estructura de la ley de control se plasma en el uso del concepto de horizonte de


control (Nu), que consiste en considerar que tras un cierto intervalo Nu < N2 no hay
variacion en las senales
de control propuestas, es decir:

4u(t + j ; 1) = 0 j > Nu
lo cual es equivalente a dar pesos infinitos a las cambios en el control a partir de cierto
instante. El caso lmite sera considerar Nu igual a 1 con lo que todas las acciones
futuras seran iguales a u(t)1 .

de los principales algoritmos


2.2 Revision

Se presentan a continuacion los principales algoritmos de control predictivo, mostrando


sus principales caractersticas pero sin entrar en detalles. Se pueden encontrar estudios
comparativos en [10], [7], [11] y [16]. En el tema siguiente se estudiaran en detalle los
dos metodos considerados mas representativos: DMC y GPC.

Dynamic Matrix Control

Este metodo usa la respuesta ante escalon (2.2) para modelar el proceso, considerando
los N primeros terminos, asumiendo por tanto que el proceso es estable. En
solo
1
Recuerdese que debido al horizonte deslizante, la senal
de control se recalcula en el siguiente
muestreo.
Controladores predictivos 19

cuanto a las perturbaciones, se considera que su valor permanence constante e igual al


existente en el instante actual durante todo el horizonte, es decir, igual al valor medido
de la salida (ym ) menos el estimado por el modelo y (t j t)).

n (t + k j t) = n (t j t) = ym(t) ; y(t j t)
y por tanto el valor predicho de la salida sera:

X
k X
N
y(t + k j t) = gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + n (t + k j t)
i=1 i=k+1

donde el primer termino contiene las acciones de control futuras (que seran calculadas),
el segundo los valores pasados de las acciones de control (conocidas) y el ultimo
representa las perturbaciones. La funcion de coste puede considerar solo errores futuros
o incluir tambien el esfuerzo de control, en cuyo caso toma la forma generica (2.3).

Una de las caractersticas de este metodo que lo ha hecho muy popular en la industria
es la inclusion de restricciones, que se traduce en inecuaciones de la forma generica:

X
N
Cyij y(t + k j t) + Cuij u(t + k ; i) + cj  0 j = 1 : : : Nc
i=1
En este caso la optimizacion debe ser numerica y se lleva a cabo en cada periodo de
u(t) y recalculando todo en el nuevo periodo de muestreo,
muestreo, enviandose la senal
como en todos los metodos MPC. Los principales inconvenientes de este metodo son el
tamano
del modelo empleado y la imposibilidad de tratar procesos inestables.

Model Algorithmic Control

Este metodo se conoce tambien como Model Predictive Heuristic Control y el producto
comercial se llama IDCOM (Identification-Command). Es muy similar al DMC con la
diferencia principal de usar un modelo de respuesta impulsional (2.1). Introduce el
concepto de trayectoria de referencia como un sistema de primer orden que evoluciona
desde la salida actual al setpoint segun una determinada constante de tiempo. La
varianza del error entre esta trayectoria y la salida es lo que marca la minimizacion de
la funcion objetivo. Las perturbaciones se pueden tratar como en el metodo anterior o
se pueden estimar segun la siguiente expresion:

n (t + k j t) = n (t + k ; 1 j t) + (1 ; )(ym(t) ; y(t j t))


con n (t j t) = 0.  es un parametro ajustable (0   < 1) relacionado con el tiempo de
respuesta, el ancho de banda y la robustez del bucle cerrado [7]. El metodo tambien
considera restricciones en los actuadores, en las variables internas o en salidas secun-
darias.
20 de los principales algoritmos
Revision

Puntos de coincidencia

Figura 2.4: Puntos de coincidencia

Predictive Functional Control

Este controlador fue desarrollado por Richalet [18] para procesos rapidos. Emplea un
modelo en el espacio de estados, por lo que permite el manejo de procesos inestables, y
tambien la extension al caso no lineal. Este esquema de control tiene dos caractersticas
que lo distinguen del resto de controladores de la familia: el uso de puntos de coincidencia
y de funciones base.

El concepto de puntos de coincidencia (ver figura 2.4) se emplea para simplificar


los calculos considerando solo un subconjunto de puntos en el horizonte de prediccion
hj , j = 1 : : :  nH . La salida deseada y la predicha deben coincidir en dichos puntos, no
en todo el horizonte de prediccion.

La otra idea innovadora de este metodo es la parametrizacion de la senal


de con-
trol como una combinacion lineal de ciertas funciones base, que son elegidas segun la
naturaleza del proceso y la referencia:

X
nB
u(t + k) = i(t)Bi(k)
i=1
Normalmente estas funciones son de tipo polinomico: escalones (B1 (k ) = 1), rampas
(B2 (k ) = k) o parabolas (B3 (k ) = k2 ), ya que la mayora de referencias se pueden
especificar como combinacion de estas funciones. Con esta estrategia, un perfil de
entrada complejo se puede especificar usando un pequeno numero de parametros
desconocidos i que son las incognitas del problema de minimizacion.

La funcion a minimizar es:


X
nH
J= y t hj ) ; w(t + hj )]2
 ( +
j =1

El algoritmo PFC tambien puede manejar restricciones de maximo y mnimo en la


aceleracion, que son practicas en aplicaciones de servocontrol.
Controladores predictivos 21

Extended Prediction Self Adaptive Control

El algoritmo EPSAC usa un modelo de funcion de transferencia

A(z;1 )y(t) = B (z;1 )u(t ; d) + v(t)


donde d es el retardo y v (t) la perturbacion. Este modelo puede ampliarse para tratar
perturbaciones medibles anadiendo
un termino D (z;1 )d(t) para incluir efecto feedfor-
ward. La prediccion se obtiene segun se muestra en [10] y la estructura de la ley de
control es muy simple, ya que se considera que la senal de control permanecera cons-
tante a partir del instante t (es decir, horizonte de control igual a 1): 4u(t + k ) = 0 para
k > 0. Para obtener la senal
de control de minimiza una funcion de coste de la forma:
XN

(k)w(t + k) ; P (z;1)y(t + k j t)]2
k=d
donde P (z ;1 ) es un polinomio de diseno
con ganancia unitaria y
(k) es una secuencia
de ponderacion. La senal
de control se puede calcular analticamente de la forma:
P
N
h
(k)w(t + k) ; P (z;1)y(t + k j t)]
k
u(t) = k=d P
N

(k)h2 k
k=d
siendo hk los coeficientes de la respuesta impulsional del sistema.

Extended Horizon Adaptive Control

Esta formulacion tambien emplea un modelo de funcion de transferencia y pretende


minimizar la discrepancia entre la salida calculada y la referencia en el instante t + N :
y(t + N j t) ; w(t + N ), con N  d. La solucion a este problema no es unica
(a menos
que N = d)[21]; una posible estrategia es considerar horizonte de control igual a 1:

4u(t + k ; 1) = 0 1<k N ;d

o minimizar el esfuerzo de control


;d
NX
J= u2(t + k)
k =0

Este metodo utiliza un predictor de N pasos de la forma

y(t + N j t) = y(t) + F (z;1) 4 y(t) + E (z;1 )B (z;1 ) 4 u(t + N ; d)


donde E (z ;1 ) y F (z ;1 ) son polinomios que satisfacen la relacion
;1 ;1 ;1 ;1 ;N F (z;1 )(1 ; z;1 )
(1 ; z ) = A(z )E (z )(1 ; z ) + z
22 de los principales algoritmos
Revision

con el grado de E igual a N ; 1. Una ventaja de este metodo es que se puede encontrar
facilmente una solucion explcita, dada por

u(t) = u(t ; 1) + 0(w(t + NNP


) ; y (t + N j t))
;d 2
i
k=0
siendo k el coeficiente correspondiente a 4u(t + k) en la ecuacion de prediccion. Por
tanto la ley de control depende solo de los parametros del proceso y puede hacerse

facilmente adaptativa si se emplea un identificador en lnea. El unico coeficiente de
ajuste es el horizonte de prediccion N , lo cual simplifica el uso pero proporciona poca
libertad para el diseno.
Observese que no puede usarse trayectoria de referencia porque
el error se considera solo en un instante (t + N ), ni tampoco la ponderacion del esfuerzo
de control.

Generalized Predictive Control

Este metodo propuesto por Clarke et al. [5] emplea un modelo CARIMA (Controlled
Auto-Regressive Integrated Moving Average) para la prediccion de la salida:

A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1 ) e4


(t)

donde la perturbacion viene dada por un ruido blanco coloreado por el polinomio
C (z;1 ). Como en la practica es difcil encontrar el verdadero valor de este polinomio, se
puede emplear como parametro de diseno para rechazo de perturbaciones o mejora de

la robustez. La prediccion optima se lleva a cabo resolviendo una ecuacion diofantica,
lo cual puede hacerse eficazmente de forma recursiva.

Este algoritmo, al igual que otros que usan el modelo de funcion de transferen-
cia, se puede implementar facilmente en forma adaptativa usando un algoritmo de
identificacion en lnea como los mnimos cuadrados recursivos.

GPCusa una funcion de coste cuadratica de la forma


XN2 X
Nu
J (N1  N2 Nu) = (j )y(t + j j t) ; w(t + j )]2 + (j )4u(t + j ; 1)]2
j =N1 j =1
donde las secuencia de ponderacion  (j ) y (j ) se eligen normalmente constantes
o exponenciales y la trayectoria de referencia w (t + j ) se puede generar como una
secuencia que empieza en el valor actual de la salida y tiende exponencialmente al
setpoint.

Las bases teoricas del algoritmo GPC has sido ampliamente estudiadas y se puede
demostrar (ver [4]) que, para distintos conjuntos de parametros, el algoritmo es estable
y que otros controladores como por ejemplo el dead beat son casos incluidos en e ste.
Controladores predictivos 23

2.3 Estado de la tecnologa

Se puede considerar que productos como el MAC-IDCOM o el DMC estan ampliamente in-
troducidos en la industria, proporcionando un buen control de sistemas multivariables
sin restricciones y constituyen la primera generacion de controladores predictivos.

Sin embargo, la gestion de restricciones es algo que todava no estaba bien resuelto
en estos productos hasta que aparecio una version de DMC denominada QDMC, ligera
variacion del algoritmo basico en el que se consideran restricciones duras y blandas de
forma sistematica. Este algoritmo se suele considerar como la segunda generacion.

Conforme la tecnologa MPC iba despertando mayor interes y aceptacion, los proble-
mas que se abordaban eran cada vez mas complejos, apareciendo nuevas problematicas
como el tratamiento de la no-factibilidad, la consideracion de modelos apropiados para
procesos inestables o la representacion de la perturbacion para la realimentacion de otra
forma mas adecuada que un valor constante. Tambien se consideraba importante la
respuesta ante fallos, de forma que el controlador fuera capaz de reconfigurarse si se
perdiera alguna senal,
o la dificultad de incluir diversos requerimientos de control en

una unica funcion objetivo.

Estos problemas motivaron el desarrollo de algoritmos como HIECON (Hierarchical


Constrained Control, por Adersa) o IDCOM-M (por parte de Setpoint). Este ultimo
incluye un supervisor para plantas mal condicionadas, funcion objetivo multicriterio o
jerarqua de restricciones. El SMOC de Shell es similar incluyendo caractersticas como
modelos en espacio de estados (validos para sistemas inestables) o la consideracion de
un observador extendido para la realimentacion de la salida en lugar del valor constante
empleado en los demas metodos. Estos metodos junto con el PCT de Profimatics, el
RMPCT de Honeywell o el PFC de Adersa constituyen la tercera generaci on.

Los productos que existen hoy da en el mercado comparten las ideas basicas de
DMC o MAC desarrollados hace m as de veinte anos y el mayor e nfasis en los ultimos

anos
se ha centrado en la consideracion de otros tipos de modelos, incluyendo modelos
no lineales, y en una mejor integracion del controlador con los equipos de control
existentes.

A pesar de su creciente implantacion, la tecnologa actual tiene todava ciertas


limitaciones, siendo las mas destacables las siguientes:

 Modelos sobre-parametrizados. La mayora de los productos comerciales usan


modelos de convolucion, que emplean una cantidad considerable de parametros
y no se pueden usar para representar dinamicas inestables.

 Sintonizacion. No existe una clara relacion entre los parametros de sintona y el


comportamiento del bucle cerrado. La garanta de estabilidad, sobre todo cuando
existen restricciones, es otro gran problema.
24 Estado de la tecnologa

 Optimalidad de la solucion. Muchos paquetes proporcionan una solucion sub-



optima para acelerar el calculo. En algunos casos este procedimiento no esta
justificado.

 Incertidumbres en el modelo. Normalmente no se tiene en cuenta la incertidum-


bre asociada a la identificacion, sino que se desintoniza el controlador intentando
aumentar la robustez.

 Perturbacion constante. Aunque es la hipotesis mas sensata a priori, se podra


obtener una mejor realimentacion si la distribucion de la perturbacion se estudiara
con mas cuidado.
Tema 3

Algoritmos

En este tema se tratan en profundidad los dos algoritmos considerados mas represen-
tativos de las metodologas existentes en Control Predictivo. Representan a las dos
familias de controladores predictivos, una de origen claramente industrial y la otra mas
academica.

3.1 Dynamic Matrix Control

El metodo DMC se desarrollo a finales de los setenta by Cutler and Ramaker [6] de Shell
Oil Co. y ha sido aceptado ampliamente en el mundo industrial, principalmente por
las industrias petroqumicas. Actualmente DMC es algo mas que un algoritmo y parte
de su e xito se debe al hecho de que el producto comercial resuelve otros temas como
identificacion u optimizacion global de la planta. En esta seccion solo se analiza el
algoritmo standard sin abordar detalles tecnicos propios del producto de mercado que
no son de dominio publico.

Pero a pesar de este e xito en la practica, este metodo adolece quizas de la ausencia
de un analisis teorico mas completo que estudie la influencia de los parametros de
diseno (horizontes, secuencias de ponderacion) sobre la estabilidad del bucle cerrado
as como de resultados de robustez.

3.1.1 Prediccion

El modelo de proceso que se emplea es el de respuesta temporal, considerando la


perturbacion como constante a lo largo del horizonte. El procedimiento para obtener
la prediccion se describe a continuacion.

25
26 Dynamic Matrix Control

Como se emplea un modelo de respuesta ante escalon:


1
X
y(t) = gi 4 u(t ; i)
i=1
los valores predichos a lo largo del horizonte seran:
1
X
y(t + k j t) =gi 4 u(t + k ; i) + n (t + k j t) =
i=1
X
k X1
= gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + n (t + k j t)
i=1 i=k+1

Las perturbaciones se consideran constantes, n (t + k j t) = n (t j t) = ym (t) ; y (t j t),


por lo que se puede escribir:

Xk X1
y(t + k j t) = gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + ym(t) ;
i=1 i=k+1
X1 X
k
; gi 4 u(t ; i) = gi 4 u(t + k ; i) + f (t + k)
i=1 i=1
donde f (t + k ) es la respuesta libre del proceso, es decir, la parte de la respuesta que no
depende de las acciones de control futuras, y viene dada por:

1
X
f (t + k) = ym(t) + gk+i ; gi) 4 u(t ; i)
( (3:1)
i=1

Si el proceso es asintoticamente estable, los coeficientes gi de la respuesta ante


tienden a un valor constante despues de N periodos de muestreo, por lo que
escalon
se puede considerar que
gk+i ; gi  0 i>N
y por tanto la respuesta libre se puede calcular como

X
N
f (t + k) = ym(t) + gk+i ; gi) 4 u(t ; i)
(
i=1


Notese que si el proceso no es estable, entonces no existe N y no se puede calcu-
lar f (t + k) (aunque existe una generalizacion en el caso de que la inestabilidad sea
producida por integradores puros).

Ahora las predicciones se pueden calcular a lo largo del horizonte de prediccion


(k =1 : : :  p), considerando m acciones de control.

y(t + 1 j t) = g1 4 u(t) + f (t + 1)
Algoritmos 27

y(t + 2 j t) = g2 4 u(t) + g1 4 u(t + 1) + f (t + 2)


..
.
X
p
y(t + p j t) = gi 4 u(t + p ; i) + f (t + p)
i=p;m+1

Si se define la matriz dinamica G como:


2 3
66 gg12 g01 

0
77
66 . . 0
77
66 .. .. ... ..
77
G = 66 gm gm;1 
.
g1 77
66 .. .. .. 77
4 . . ...
. 5
gp gp;1    gp;m+1

se puede escribir que:


y^ = Gu + f (3:2)

G
Observese que esta formada por m (horizonte de control) columnas de la respuesta
ante escalon apropiadamente desplazadas hacia abajo. y^
es un vector de dimension
u
p que contiene las predicciones de la salida, representa el vector de incrementos de
f
control y es el vector de respuestas libres. Esta es la expresion que relaciona las
respuestas futuras con los incrementos en las senales
de control, por lo que usara para
calcular las acciones necesarias para conseguir el comportamiento deseado del sistema.

3.1.2 Perturbaciones medibles

El efecto de las perturbaciones medibles se puede anadir facilmente a las anteriores


ecuaciones de prediccion, ya que e stas se pueden tratar como entradas al sistema. La
expresion (3.2) se puede usar para calcular la prediccion del efecto de las perturbaciones
en la salida de la siguiente forma:

y^d = Dd + fd
y^
donde d es la contribucion de las perturbaciones medibles a la salida, es una matriz D
similar a G
que contiene los coeficientes de la respuesta del sistema a un escalon en
d
la perturbacion, es el vector de incrementos en la perturbacion y d es la parte de laf
respuesta que no depende de la perturbacion.

En el caso mas general de perturbaciones medibles y no medibles, la respuesta libre


completa del sistema (la fraccion de la salida que no depende de la variable manipulada)
28 Dynamic Matrix Control

se puede considerar como la suma de cuatro efectos: la respuesta a la entrada u(t), a la


perturbacion medible d(t), a la perturbacion no medible y al estado actual del proceso:

f = fu + D d + fd + fn
Por tanto la prediccion se puede expresar en la forma general

y^ = Gu + f

3.1.3 Algoritmo de control

El e xito en la industria del DMC se ha debido principalmente a su aplicacion a siste-


mas multivariables de gran dimension con la consideracion de restricciones. En esta
seccion se describe el algoritmo de control comenzando por el caso mas simple de un
sistema monovariable sin restricciones y extendiendolo posteriormente al caso general
multivariable con restricciones.

El objetivo del controlador DMC es llevar el proceso los mas cerca posible al setpoint
en el sentido de mnimos cuadrados con la posibilidad de incluir una penalizacion en los
movimientos de la senal de control. Por ello se seleccionan las variables manipuladas
de forma que minimicen un objetivo cuadratico que puede incluir solo los errores
futuros p X
J= y t j j t) ; w(t + j )]2
 ( +
j =1
o tambien el esfuerzo de control, presentando la forma generica

X
p X
m
J= y t j j t) ; w(t + j )]
 ( +
2
+ 4u(t + j ; 1)]2
j =1 j =1

Si no existen restricciones, la minimizacion de la funcion de coste J = T +  T , ee uu


e
donde es el vector de errores futuros a lo largo del horizonte de prediccion y es el u
de control 4u(t) : : :  4u(t + m), se puede
vector de futuros incrementos en la senal
hacer de forma analtica calculando la derivada de J y haciendola igual a 0, lo que
proporciona el resultado general:

u = (GT G + I ); GT (w ; f )
1
(3:3)

Recuerdese que, como en todas las estrategias predictivas, solo se enva al proceso
u
el primer elemento del vector (4u(t)). No es aconsejable implementar la secuencia
completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma
exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que
provocan que la salida real difiera de las predicciones que se emplean para calcular la
Algoritmos 29

w +
u y
K Proceso
-

f
Calculo
Resp. libre

Figura 3.1: Ley de control

secuencia futura de acciones de control. Ademas, el setpoint puede cambiar durante


los proximos m intervalos.

Resulta interesante analizar en que consiste realmente la ley de control. Analizando


la expresion 3.3 se observa que el primer elemento del vector u, que es la senal que
efectivamente se enva a la planta, es el producto de la primera fila de la matriz
(GT G + I );1 GT (llam
emosle K ) por la diferencia entre la trayectoria de referencia y la
respuesta libre, que es el error futuro si no hubiera incrementos en la senal
de control.
Se puede decir por tanto que el incremento de la senal de control es proporcional (por
medio de K ) a los errores futuros y por tanto habra cambios en la senal de control
siempre que el controlador detecte que va a haber una discrepancia en el futuro entre el
objetivo deseado y el comportamiento esperado del sistema. Esta idea queda reflejada
en la figura 3.1.

El caso con restricciones

Aunque computacionalmente mas complicado que otros algoritmos mas simples, la


capacidad de manejar restricciones que posee este metodo (y MPC en general) lo hace
muy atractivo para aplicaciones practicas, ya que en general el punto de operacion

optimo segun criterios economicos se encuentra normalmente en la interseccion de las


restricciones, como se muestra en la figura 3.2. Por razones de seguridad, es necesario
mantener una zona segura alrededor del punto de operacion, ya que el efecto de las
perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona
se puede reducir (y por tanto aumentar los beneficios economicos) si el controlador es
capaz de manejar restricciones (punto de operacion 1).

Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades


de forma generica

X
N
Cyij y(t + k j t) + Cuij u(t + k ; i) + cj  0 j = 1 : : : Nc
i=1
30 Dynamic Matrix Control

P. operacion
Zona segura 1 optimo

Punto operacion 1
Restriccion
zona Punto operacion 2
segura 2

Restriccion


Figura 3.2: Punto de operacion optimo de un proceso tpico

que deben tenerse en cuenta para la minimizacion. Como se ha visto, las salidas se
pueden expresar en funcion del vector de incrementos de control a traves de la matriz
dinamica, por que las restricciones tanto en la entrada como en la salida se pueden
recoger en una desigualdad matricial de la forma Ru
 , como se vera con mas c
detalle en el tema dedicado a restricciones. Ahora la minimizacion es un problema de
Programacion Cuadratica QP, cuya solucion es numerica.

Todo lo relacionado con las restricciones sera abordado con mayor grado de detalle
en el tema dedicado a ello.

Extension al caso multivariable

El esquema previo se puede extender facilmente al caso de sistemas con varias entradas
y varias salidas. Las ecuaciones basicas se mantienen igual a excepcion de que las
matrices y vectores cambian de dimension para poder incluir todas las entradas y
salidas.

Al tratarse de modelos lineales, se puede aplicar el principio de superposicion para


obtener el valor de las salidas ante las diversas entradas. Para ello se define el vector
de salidas futuras como:

y^ = y (t + 1 j t) : : :  y (t + p j t) : : :  yny (t + 1 j t) : : :  yny(t + pny j t)T


1 1 1

y el de senales
de control de la forma:

u = [4u (t) : : :  4u (t + m
1 1 1 ; 1) : : :  4unu(t) : : :  4unu(t + mnu ; 1)]T

as como la respuesta libre:

f = f (t + 1 j t) : : :  f (t + p j t) : : :  fny (t + 1 j t) : : :  fny (t + pny j t)T


1 1 1

teniendo en cuenta que la respuesta libre de la salida i depende tanto de valores pasados
de yi como de valores pasados de todas las senales
de control.
Algoritmos 31

Con estas definiciones, la ecuacion de prediccion es igual que en el caso monova-


riable simplemente considerando que la matriz G toma la forma:

2 G G  G1nu 3
66 G1121 G1222  G2nu 77
G = 66 .. 77
4 . ..
.
... ..
. 5
Gny1 Gny2    Gnynu

Cada submatriz Gij contiene los coeficientes de la respuesta ante escalon i-esima
correspondiente a la entrada j-esima. El proceso de minimizacion es analogo solo que
la ponderacion tanto de los errores como de los esfuerzos de control se realiza con
matrices de peso.

3.2 Control Predictivo Generalizado

El Control Predictivo Generalizado GPC fue propuesto por Clarke et al. en 1987 y se ha
convertido en uno de los metodos mas populares en el a mbito del Control Predictivo
tanto en el mundo industrial como en el academico. Se ha empleado con e xito en
numerosas aplicaciones industriales, mostrando buenas prestaciones a la vez que un
cierto grado de robustez respecto a sobreparametrizacion o retardos mal conocidos.
Puede resolver muchos problemas de control diferentes para un amplio campo de
procesos con un numero razonable de variables de diseno, que son especificadas por
el operario dependiendo del conocimiento previo del proceso y de los objetivos de
control.

La idea basica del GPC es calcular una secuencia de futuras acciones de control
de tal forma que minimice una funcion de coste multipaso. El ndice a minimizar es
una funcion cuadratica que mide por un lado la distancia entre la salida predicha del
sistema y una cierta trayectoria de referencia hasta el horizonte de prediccion, y por
otro el esfuerzo de control necesario para obtener dicha salida.

El Control Predictivo Generalizado tiene muchas ideas en comun con otros contro-
ladores predictivos previamente mencionados ya que esta basado en las mismas ideas
pero posee a su vez algunas diferencias. Como se vera mas adelante, es capaz de
proporcionar una solucion explcita (en ausencia de restricciones), puede trabajar con
procesos inestables o de fase no mnima e incorpora el concepto de horizonte de control
as como la consideracion en la funcion de coste de ponderacion de los incrementos en
las acciones de control. Las diversas posibilidades disponibles para el GPC conducen a
una gran variedad de objetivos de control comparado con otras realizaciones, algunas
de las cuales pueden ser consideradas como subconjuntos o casos lmites del GPC.
32 Control Predictivo Generalizado

3.2.1 Formulacion del Control Predictivo Generalizado

La mayora de los procesos de una sola entrada y una sola salida (single-input single-
output, SISO), al ser considerados en torno a un determinado punto de trabajo y tras ser
linealizados, pueden ser descritos de la siguiente forma:

A(z;1 )y(t) = z;d B (z;1 )u(t ; 1) + C (z;1)e(t)


donde u(t) y y (t) son respectivamente la senal
de control y la salida del proceso y e(t) es
un ruido blanco de media cero. A, B y C son los siguientes polinomios en el operador
de desplazamiento hacia atras z ;1 :

A(z;1 ) = 1 + a1 z ;1 + a2 z ;2 + ::: + ana z ;na


B (z;1 ) = b0 + b1 z;1 + b2 z;2 + ::: + bnbz;nb
C (z;1) = 1 + c1 z ;1 + a2 z ;2 + ::: + cncz ;nc

donde d es el tiempo muerto del sistema.

Este modelo es conocido como Autorregresivo de Media Movil (Controller Auto-


Regressive Moving-Average CARMA). En muchas aplicaciones industriales en las que
las perturbaciones son no-estacionarias resulta mas conveniente el uso de un modelo
CARMA integrado, dando lugar al CARIMA, que viene descrito por:

A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1) e4


(t)
con 4 = 1 ; z;1 (3:4)

Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. Notese


que en el caso de que C ;1 pueda ser truncado se puede absorber en A y B .

El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia


de senales
de control que minimice una funcion de coste de la forma:

X
N 2 X
Nu
J (N1 N2  Nu) = (j )y(t + j j t) ; w(t + j )]
2
+ (j )4u(t + j ; 1)]2 (3:5)
j =N1 j =1

donde y (t + j j t) es la prediccion optima


j pasos hacia delante de la salida del proceso
con datos conocidos hasta el instante t, N1 y N2 son los horizontes mnimo y maximo
de coste, Nu es el horizonte de control y  (j ) y (j ) son las secuencias de ponderacion
mientras que w(t + j ) es la futura trayectoria de referencia, que se puede calcular segun
se muestra en la figura 2.3. En muchas situaciones se considera  (j ) igual a 1 y (j )
constante.

El objetivo es pues el calculo de la futura secuencia de control u(t), u(t + 1),... de tal
manera que la salida futura del proceso y (t + j ) permanezca proxima a w (t + j ). Esto
se logra minimizando J (N1  N2  Nu).
Algoritmos 33


Prediccion optima

Con la intencion de minimizar la funcion de coste, se obtendra previamente la pre-



diccion optima de y (t + j ) para j  N1 y j  N2 . Considerese la siguiente ecuacion
diofantica:
1 = Ej (z ;1 ) 4 A + z ;j Fj (z ;1 ) (3.6)
1 = Ej (z ;1 )A + z ;j Fj (z ;1 )

Los polinomios Ej y Fj estan unicamente


definidos con grados j ; 1 y na respec-
tivamente. Se pueden obtener dividiendo 1 entre A (z ;1 ) hasta que el resto pueda
ser factorizado como z;j Fj (z ;1 ). El cociente de la division es entonces el polinomio
Ej (z;1 ).
Si se multiplica la ecuacion (3.4) por Ej (z ;1 ) z j 4
A (z;1 )Ej (z;1 )y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j ) (3.7)

Teniendo en cuenta (3.6), la ecuacion (3.7) queda:


(1 ; z;j Fj (z;1 ))y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j )

La cual se puede escribir como


y(t + j ) = Fj (z;1 )y(t) + Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j ) (3:8)

Al ser el grado del polinomio Ej (z ;1 ) igual a j ; 1 los terminos del ruido en la


ecuacion (3.8) estan todos en el futuro. La mejor prediccion de y (t + j ) sera por
consiguiente:
y(t + j j t) = Gj (z;1 ) 4 u(t + j ; d ; 1) + Fj (z;1 )y(t)
donde Gj (z ;1 ) = Ej (z ;1 )B (z ;1 )

Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursiva-


mente, de forma que los nuevos valores en el paso j + 1 (Ej +1 y Fj +1) sean funcion de
los del paso j . A continuacion se muestra una demostracion simple de la recursividad
de la ecuacion diofantica. Existen otras formulaciones del GPC que no estan basadas en
la recursividad de esta ecuacion.

Considerense que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A (z ;1 )


hasta que el resto haya sido factorizado como z;j Fj (z ;1 ) .
Con:
Fj (z;1 ) = fj0 + fj1z;1 +    + fjnaz;na
Ej (z;1 ) = ej0 + ej1z;1 +    + ejj;1z;(j;1)
34 Control Predictivo Generalizado


Supongase que se utiliza el mismo procedimiento para obtener Ej +1 y Fj +1, es decir,
dividir 1 entre A (z ;1 ) hasta que el resto se pueda factorizar como z;(j +1) Fj +1 (z ;1 ) con

Fj+1(z;1 ) = fj+10 + fj+11z;1 +    + fj+1naz;na

Esta claro que solamente es necesario dar un paso mas en la division para obtener
los polinomios Ej +1 y Fj +1 . Al ser Ej +1 el nuevo cociente de la division, sera igual al
cociente que haba hasta el momento (Ej ) mas un nuevo termino, que sera el fj0 pues
el divisor (A ) es monico.
Por tanto:

Ej+1(z;1 ) = Ej (z;1 ) + ej+1j z;j con ej +1j = fj0


Teniendo en cuenta que el nuevo resto sera el resto anterior menos el producto del
cociente por el divisor, los coeficientes del polinomio Fj +1 se pueden expresar como:

fj+1i = fji+1 ; fj0 a i+1 i = 0    na

En resumen, la forma de obtener los polinmios Ej y Fj es la siguiente:

1. Comenzar con E1 = 1, F1 = z(1 ; A )


2. Ir anadiendo
nuevos terminos a Ej con ej +1j = fj0
3. Calcular fj +1i = fji+1 ; fj0 a i+1 i = 0    na, (siendo fjna+1 = 0).

El polinomio Gj +1 puede ser obtenido recursivamente como sigue:

Gj+1 = Ej+1B = (Ej + fj0z;j )B = Gj + fj0z;j B

Es decir, los primeros j coeficientes de Gj +1 seran identicos a los de Gj mientras que


el resto viene dado por:

gj+1j+i = gjj+i + fj0 bi para i = 0    nb

Para resolver el GPC es necesario obtener el conjunto de senales de control u(t),


u(t + 1), ...,u(t + N ) que minimizan la ecuacion (3.5). Al tener el proceso un retardo de
d perodos de muestreo, la salida solo se vera influenciada por la senal
u(t) despues del
instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes pueden ser definidos
como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido hacer N1 < d + 1 ya que
los terminos de (3.5) solo dependeran de las senales
de control pasadas. Por otro lado,
haciendo N1 > d + 1 los primeros puntos de la secuencia de salida, que seran los mejor
estimados, no se tendran en cuenta.
Algoritmos 35

El conjunto de las j predicciones optimas:



y(t + d + 1 j t) = Gd+1 4 u(t) + Fd+1 y(t)
y(t + d + 2 j t) = Gd+2 4 u(t + 1) + Fd+2 y(t)
..
.
y(t + d + N j t) = Gd+N 4 u(t + N ; 1) + Fd+N y(t)
puede ser escrito en forma matricial como:
y = Gu + F(z; )y(t) + G0(z; ) 4 u(t ; 1)
1 1
(3 :9)
Donde
2 y(t + d + 1 j t) 3 2 4u(t)
3
66 y(t + d + 2 j t) 77 66 4u(t + 1) 77
y = 66 7
7 u = 66 77
4 ..
. 5 4 ..
. 5
y(t + d + N j t) 4u(t + N ; 1)
2 g 0 ::: 0 3
66 g1 g0 ::: 0 77
0

G = 66 .. .. .. 77
4 . ..
. . . 5
g g ::: g
2 N ;1 N ;2 z(G0 (z;1 ) ; g ) 3
d+1
66 z2 (Gd+2 (z;1 ) ; g0 ; g1z;1 )
0
77
G0(z; )
1
= 66
4 ..
.
77
5
; ;
z (G (z ) ; g0 ; g1z ;    ; gN ;1z
N ;(N ; 1)
2 F (dz+;N1 ) 3
1 1
)

66 Fdd++12 (z;1 ) 77
F( z ; )
1
= 66
4 ..
.
77
5
Fd+N (z ) ; 1


Al depender los ultimos terminos de la ecuacion (3.9) solo del pasado, pueden
agruparse en f, dando lugar a:
= + y Gu f (3:10)

Observese que es la misma expresion que se obtuvo para el DMC, aunque en este
caso la respuesta libre es distinta.

Obtencion de la ley de control

Entonces la ecuacion (3.5) puede escribirse como:


Gu f w Gu f w) + uT u
J = ( + ; )T ( + ; (3:11)
36 Control Predictivo Generalizado

donde:
h iT
w = w(t + d + 1) w(t + d + 2)  w(t + d + N ) (3.12)

La ecuacion (3.11) se puede poner como:

J = 12 uT Hu + bu + f0 (3:13)

donde:

H = GG I
2( T +  )
b = f w G
2( ; )T
f0 = f w f w)
T
( ; ) ( ;

El mnimo de J , siempre que no existan restricciones en la senal


de control, puede
ser calculado igualando a cero el gradiente de J , lo cual conduce a:

u = ;H; bT1
(3:14)
Debido al uso de la estrategia deslizante, solo se aplica realmente el primer elemento del
vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo.
La solucion propuesta involucra la inversion (o al menos la triangularizacion) de una
matriz de dimension N N , lo cual conlleva una gran carga de calculo. El concepto ya
usado en otros metodos de horizonte de control se emplea con la finalidad de reducir
la cantidad de calculo, asumiendo que las senales
de control permaneceran en un valor
constante a partir del intervalo Nu < N . Por tanto la dimension de la matriz que hay
que invertir queda reducida a Nu Nu, quedando la carga de calculo reducida (en el
caso lmite de Nu = 1, se reduce al caso escalar) aunque restringiendo la optimalidad.

3.2.2 Ejemplo de calculo

Se presenta a continuacion un ejemplo de calculo de un Controlador Predictivo Ge-


neralizado en un caso sencillo. Se disenar
a el controlador para un sistema de primer
orden.

Al discretizar el proceso continuo se obtiene el siguiente equivalente discreto:

(1 + az;1 )y(t) = (b0 + b1 z;1 )u(t ; 1) + e4


(t)

Se va a considerar un retardo d igual a 0 y un polinomio de ruido C (z;1 ) igual a 1.

Se usara el algoritmo descrito previamente para obtener la ley de control, obteniendo


resultados numericos para valores de los paametros a = 0:8, b0 = 0:4 y b1 = 0:6, siendo
Algoritmos 37

los horizontes N1 = 1 y N = Nu = 3. Como se ha mostrado, se calcularan los valores


predichos de la salida del proceso en el horizonte haciendo uso de la ecuacion (3.9),
obteniendo la ley de control de la expresion (3.14).

Resolviendo la ecuacion (3.6) se obtienen los polinomios del predictor Ej (z;1 ),


Fj (z;1 ) desde j = 1 hasta j = 3, con
A (z;1 ) = A(z;1 )(1 ; z;1 ) = 1 ; 1:8z;1 + 0:8z;2
En este caso sencillo donde el horizonte no es demasiado largo, estos polinomios se
pueden obtener directamente dividiendo 1 por A (z ;1 ). Como se ha explicado antes,
tambien se pueden calcular recursivamente, comenzando con los valores obtenidos en
el primer paso de la division, es decir:

E1 (z;1 ) = 1 F1(z;1 ) = 1:8 ; 0:8z;1

Cualquiera que sea el metodo empleado, los valores obtenidos son:

E2 = 1 + 1:8z;1 F2 = 2:44 ; 1:44z;1


E3 = 1 + 1:8z;1 + 2:44z;2 F3 = 2:952 ; 1:952z;1
Con estos valores y el polinomio B (z;1 ) = 0:4 + 0:6z ;1 , los elementos Gi (z ;1 ) resultan
ser:

G1 = 0:4 + 0:6z;1 G2 = 0:4 + 1:32z;1 + 1:08z;2 G3 = 0:4 + 1:32z;1 + 2:056z;2 + 1:464z;3


y por tanto se pueden escribir las salidas predichas como:
2 3 2 32 3
y(t + 1 j t) 0:4 0 0 4u(t)
64 y(t + 2 j t) 75 =
64 1:32 0:4 0 75 64 4u(t + 1) 75 +
y(t + 3 j t) 2:056 1:32 0:4 4u(t + 2)
2 3
0:6 4 u(t ; 1) + 1:8y (t) ; 0:8y (t ; 1)
+
64 1:08 4 u(t ; 1) + 2:44y(t) ; 1:44y(t ; 1) 75
| 1:464 4 u(t ; 1) + 2:952
{z y(t) ; 1:952y(t ; 1) }
f

El paso siguiente es el calculo de H; b. Tomando  igual a 0:8 se tiene que:


1

2 3
0:133 0:286 0:147
;1 T 6
(G G + I) G = 4 ;0:154 ;0:165 0:286 5
T 7
;0:029 ;0:154 0:1334

Como solo se necesita el valor de 4u(t) para los calculos, solo se emplea realmente la
primera fila de la matriz, con lo que resulta la siguiente expresion para la ley de control:

4u(t) = ;0:6042 4 u(t ; 1) ; 1:371y (t) + 0:805y (t ; 1) +


+ 0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)
38 Control Predictivo Generalizado

donde w(t + i) es la trayectoria de referencia que se puede considerar bien constante


e igual a la referencia actual o bien una suave aproximacion de primer orden a e sta.
Entonces la senal
de control resulta ser una funcion de la referencia deseada y de
entradas y salidas pasadas, dada por:

u(t) = 0:3958u(t ; 1) + 0:6042u(t ; 2) ; 1:371y (t) + 0:805y (t ; 1) +


+ 0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)

Al mismo resultado se puede llegar sin emplear la ecuacion diofantica, calculando


G en base a los coeficientes de la respuesta ante escalon (que se pueden calcular en
funcion de los coeficientes de la funcion de transferencia) y calculando la respuesta
libre como se muestra en [2].

3.2.3 Caso multivariable

Al igual que en el DMC todo lo visto para el caso de sistemas con una sola entrada y
una sola salida se puede extender al caso multivariable, aunque los calculos son mas
complejos.

En este caso el modelo CARIMA para un sistema de m entradas y n salidas se puede


expresar como:
;1A ;1
(z )y (t) = (z )u(t ; 1) + B1 ;1
(z )e(t) C (3:15)
4
donde (z ;1 ) y (z ;1 ) son matrices polinomiales monicas de dimension n n y
A C B(z; )
1

es una matriz polinomial de dimension n m, definidos como:

A(z; )1
Inn + A1 z;1 + A2z;2 +    + Ana z;na
=
B(z; )
1
= B0 + B1 z
;1 + B2z;2 +    + Bnb z;nb
C(z; )
1
= Inn + C1 z
;1 + C2z;2 +    + Cnc z;nc
Las variablesy (t), u(t) y e(t) son de dimension n 1, m 1 y n 1 respectivamente.
La prediccion conlleva la resolucion de una ecuacion diofantina matricial, que tambien
puede calcularse de forma recursiva.

En muchas ocasiones el problema radica en la obtencion adecuada del modelo en


esta forma a partir de una matriz de transferencia en continuo que puede haberse
obtenido a partir de la curva de reaccion. Una forma de hacerlo se muestra en [2].

Una vez obtenido el modelo, el criterio a minimizar tendra la forma general

X
N 2 X
N 3

J (N1 N2 N3 ) = ky (t + j j t) ; w (t + j )k2R + k 4 u(t + j ; 1)k2Q


j =N1 j =1
Algoritmos 39

donde R y Q son matrices de ponderacion definidas positivas que normalmente se


eligen diagonales. La minimizacion se realiza igual que en el caso monovariable dando
como resultado un vector de senales
de control a enviar a la planta en el instante actual:
u1(t), u2(t) : : : um(t).
40 Control Predictivo Generalizado
Tema 4

Restricciones en Control Predictivo

En la practica todos los procesos estan sujetos a restricciones. Los actuadores tienen
un campo limitado de accion impuesto por lmites fsicos (por ejemplo una valvula no
puede abrir mas de un 100 % o un calentador no puede aportar mas de su potencia
maxima. Tambien existen lmites de seguridad (por ejemplo presiones o temperaturas
maximas), requerimientos tecnologicos (por ejemplo mantener temperaturas en un
rango dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa
medioambiental.

4.1 Tratamiento convencional de restricciones

El tratamiento convencional de restricciones en control de procesos se basa en que las


restricciones en la variable manipulada (entrada) se cumplen saturando la salida del
controlador. Sin embargo, las restricciones en la variable controlada (salida) no pueden
abordarse; se intenta evitar su violacion trabajando alejados de los lmites (en zona
segura), operando lejos de la restriccion. Por seguridad se trabaja con una consigna
inferior, mas lejos del punto de operacion o ptimo, lo que normalmente equivale a una
disminucion de la calidad y/o cantidad en la produccion, ya que normalmente el punto

optimo se encuentra en la interseccion de las restricciones obligando a acercarse lo mas


posible a las e stas pero sin superarlas.

Si el controlador fuera capaz de tener en cuenta las restricciones y evitar su violacion,


el proceso podra operar mas cerca de e stas y por tanto de forma mas eficiente. La figura
4.1 muestra un ejemplo donde existe una limitacion de presion maxima y se observa

como al alejar el punto de operacion del lmite la produccion Q disminuye.

En cuanto a la forma de operar de un controlador predictivo que no considera res-


tricciones el procedimiento es similar: si la senal
de control calculada viola la restriccion,
se satura. Las senales
futuras ni siquiera se tienen en cuenta, ya que normalmente no

41
42 Restricciones en Control Predictivo

P
Pmax

P1

P2

t Q1 Q2 Q


Figura 4.1: Restricciones y punto de operacion optimo


se calculan. Esta forma de proceder no garantiza el caracter optimo de la solucion y en
ningun caso garantiza el cumplimiento de las restricciones en la salida. La violacion de
los lmites de las variables controladas puede ser mas costoso y peligroso, produciendo
danos
en equipos y perdidas en la produccion.

La figura 4.2 muestra con claridad el fenomeno de perdida de la solucion optima


cuando las variables manipuladas se mantienen en sus lmites por el programa de
control o por el propio actuador. Este hecho puede llevar a valores mayores de la
funcion objetivo y a un comportamiento no deseado (incluso inestabiliad). En 4.2a se
muestra un caso con horizonte de control igual a 2, donde se observa que si se satura
de control u(t) a umax el valor de la funcion de coste no es el mejor que se
la senal
podra conseguir (que sera el correspondiente a uc ). Incluso puede que no se viole
la restriccion en el instante actual pero s en el futuro (figura 4.2b) con lo que la senal

enviada al sistema (sin saturar) no es la mejor para el problema de dimension 2 que se
esta optimizando.

4.2 Restricciones en Control Predictivo


En la actualidad el MPC es la unica metodologa capaz de incorporar las restricciones
de forma sistematica en la fase de diseno del controlador, siendo esta caracterstica una
de las razones de su gran e xito en la industria. Parece logico que al disponer de un
modelo dinamico del proceso se pueda conocer la evolucion futura de su salida y por
tanto se pueda saber si e sta va a violar o no las restricciones y actuar en consecuencia.

Para formular el algoritmo MPC con restricciones hay que expresar e stas en funcion
de la variable sobre la que se puede actuar, es decir, en funcion de u. Las restricciones
en la entrada estan ya expresadas en funcion de u y para las restricciones en la salida
se hace uso de las ecuaciones de prediccion que expresan el valor futuro de las salidas
Restricciones en Control Predictivo 43

u(t+1) u(t+1)

u max u max

uc u uc u

u max u(t) u max u(t)

a) b)

Figura 4.2: Restricciones en la senal


de control

en funcion de las senales


de control futuras y valores conocidos en el instante t.

Cualquier controlador predictivo calcula la prediccion como:


y = Gu + f
por lo que tanto entradas como salidas se pueden expresar en funcion del vector de
incrementos de la senal
de control.

Las restricciones que aparecen seran basicamente amplitud y velocidad de cambio


en la senal
de control y amplitud en la salida y se pueden expresar como:

U  u(t)  U 8t
u  u(t) ; u(t ; 1)  u 8t
y  y(t)  y 8t

Para un proceso de m entradas y n salidas y restricciones en el horizonte N , las


restricciones se pueden expresar como:
1U  T u + u(t ; 1) 1  1U
1u  u  1u
1y  Gu + f  1y
l
donde es una matriz de dimension (N n) m formada por N m m matrices
identidad y T es una matriz triangular inferior por bloques cuyos elementos no nulos
son matrices identidad de dimension m m. En forma condensada se pueden expresar
como:
 Ru c (4:1)
44 Resolucion del problema

siendo
2 I 3 2 l u 3
66 ;INNNN
77 66 7
66 T 77 66 l U ;;lul (ut ; 1) 777
R = 66 ;T 77 c = 66 7
66 77 66 ;l U + lu(t ; 1) 777
4 G 5 4 ly;f 5
;G ;l y + f

Aparte de las restricciones en amplitud, a la salida se le pueden aplicar otro tipo de


restricciones de para forzar un determinado comportamiento temporal (movimiento
dentro de una banda, comportamiento monotono, evitar respuesta inicial inversa, etc.)
como se muestra en [12], pudiendo expresarlas tambien de la forma generica (4.1).

Ademas de la clasificacion en restricciones en la entrada y en la salida segun a que


tipo de variable se apliquen, se puede hacer otra clasificacion atendiendo a la forma de
tratarlas. As, se puede hablar de:

 Restricciones duras como aquellas que no se pueden violar bajo ningun concepto.
En este grupo se incluyen las restricciones relacionadas con la operacion segura
del proceso.
 Restricciones blandas, que son aquellas que pueden ser violadas en un momento
dado por no ser cruciales, pero la violacion se penaliza en la funcion objetivo
como un termino mas. Es una forma de relajar la restriccion.

del problema
4.3 Resolucion

Con la adicion de restricciones el problema general de control predictivo cambia se


puede formular como

u)
minimizar J (
Ru c
sujeto a 

Es decir, el problema consiste en la minimizacion de una funcion cuadratica con


restricciones lineales, lo que se conoce como Programacion Cuadratica, QP. En este caso
no se puede encontrar una solucion analtica como en el caso sin restricciones, sino que
hay que recurrir a metodos iterativos.

Resulta evidente que la carga de calculo sera considerable, ya que hay que encontrar
la solucion resolviendo el algoritmo iterativo en cada periodo de muestreo. Normal-
mente el esfuerzo esta justificado por el beneficio economico obtenido al trabajar mas

cerca del punto de operacion optimo.
Restricciones en Control Predictivo 45

Para resolver el problema QP existen diversos algoritmos suficientemente probados.


Una revision de estos metodos se puede encontrar en [2].

Un problema asociado a la implementacion del control con restricciones es el analisis


de la estabilidad del bucle cerrado. Como es necesario utilizar metodos numericos
para resolver el problema de la optimizacion, la ley de control resultante no se puede
describir de forma explcita, haciendo el problema muy difcil de atacar mediante la
teora clasica de control.


En los ultimos anos
se ha trabajado mucho sobre la estabilidad en estas circuns-
tancias, proponiendose soluciones basadas en la teora de Lyapunov. La idea basica
consiste en que la funcion de coste cuando el horizonte es infinito es monotona decre-
ciente (si existe solucion factible) y se puede interpretar como funcion de Lyapunov
que garantiza por tanto la estabilidad. Sin embargo, como la solucion tiene que ser

numerica, el numero de variables de decision tiene que ser finito, por lo que se han pro-
puesto dos ideas. En la primera, se descompone la funcion objetivo en dos partes: una
con horizonte finito y restricciones y otra con horizonte infinito y sin restricciones. La
segunda idea es en esencia equivalente y consiste en imponer restricciones terminales
al estado y usar un horizonte infinito.

En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las
incertidumbres en el modelo y los temas asociados con la factiblidad.

de restricciones
4.4 Gestion

Durante la etapa de optimizacion puede aparecer problemas de no existencia de so-


optima
lucion para unas restricciones dadas (no existe compatibilidad entre las restric-
ciones), por ejemplo por el planteamiento de unos objetivos inalcanzables para unas
restricciones dadas. Existen otras posibles causas de inexistencia de solucion, como es
el caso de que una perturbacion saque al proceso fuera de la zona de trabajo usual.

La factibilidad de un problema de optimizacion significa que la funcion objetivo


este acotada y que todas las restricciones sean satisfechas.

La no factibilidad puede aparecer en regimen permanente o en el transitorio. El


problema de la falta de solucion en regimen permanente puede venir provocado por
un objetivo de control irrealizable. Sin embargo, este tipo de no factibilidad puede
ser facilmente eliminado en la etapa de diseno evitando la inclusion de tales objetivos.
Tambien puede ser debido a cambios en referencias que hagan incompatibles las res-
tricciones (se quiera llevar alguna variable a un punto que es imposible de alcanzar con
una entrada que esta acotada).

En el regimen transitorio puede aparecer no factibilidad incluso cuando las res-


tricciones impuestas parezcan razonables. Restricciones que no causan problemas en
46 Gestion de restricciones

operacion normal pueden producir problemas bajo ciertas circunstancias. Puede que
una perturbacion o cambio de referencia grande fuerce a una variable fuera de su lmite
y sea imposible introducirla de nuevo en su zona permitida con senales
de control de
energa limitada. En estos casos las restricciones se hacen temporalmente incompati-
bles.


Las soluciones no factibles aparecen con mayor frecuencia en casos en que el optimo
se encuentre cerca de las restricciones y el sistema este sujeto a perturbaciones, llevando
a la salida a "regiones prohibidas".

4.4.1
Tecnicas de busqueda de soluciones factibles

Los metodos de gestion de restricciones tratan de recuperar la factibilidad actuando


sobre las restricciones segun diferentes criterios.

Los lmites de las restricciones se pueden considerar de los siguientes tipos:

 Limites fisicos: nunca se pueden sobrepasar, principalmente por motivos de


seguridad o por la propia construccion de los equipos (p.ej. actuadores)

 Limites de operacion: son fijados por los operarios para mantener las condiciones
nominales de funcionamiento. Se pueden sobrepasar bajo ciertas circunstancias

 Limites reales: son los que usa el algoritmo de control en cada instante. Son los
que proporciona el gestor de restricciones, quien debe calcularlos de forma que
nunca superen los limites fsicos.

Es decir, el gestor de restricciones calculara los lmites reales (los que se envan al
algoritmo QP) en base a los lmites de operacion pero sin salirse nunca de los lmites
fsicos, segun se observa en la figura 4.3.

Se analizan a continuacion posibles soluciones para este problema, que se pueden


agrupar en:

1. Desconexion del controlador.

2. Eliminacion de restricciones.

de restricciones.
3. Relajacion

4. Otras tecnicas.
Restricciones en Control Predictivo 47

Lmites fsicos

Restricciones reales
Lmites de operacin

Figura 4.3: Gestion de restricciones

Desconexion del controlador

La forma mas sencilla de resolver de este tipo de problemas es pasar el controlador


a posicion manual cuando aparecen las incompatibilidades de restricciones y volver a
operacion automatica cuando se recupera la admisibilidad de la solucion.

Este metodo, como se puede comprender tiene serias desventajas. Normalmente,


cuando aparecen problemas de incompatibilidad de restricciones es porque el sistema
en bucle cerrado se encuentra en un estado crtico donde normalmente el operador
tendra muy poca experiencia en la operacion. Adicionalmente, si las restricciones estan
relacionadas con aspectos de seguridad o economicos, las decisiones llevadas a cabo
cuando aparecen problematicas de compatibilidad de restricciones suelen ser crticas
dado que en estos casos alguno de los objetivos del control no puede ser satisfecho.

El metodo suele ser utilizado cuando los problemas de incompatibilidad de restric-


ciones no son frecuentes.

Eliminacion de restricciones

La factibilidad se analiza en cada periodo de muestreo, por lo que la eliminacion de


restricciones se realiza de forma temporal. Periodicamente se chequea la factibilidad
para poder reinsertar restricciones eliminadas.

La eliminacion de un grupo de restricciones ha de realizarse en aquellos casos en que


el conjunto completo de restricciones que se imponen sobre el sistema sea incompatible.
Cada vez que existe un problema de incompatibilidad de restricciones, se forma un
conjunto de restricciones no admisibles que no se tienen en cuenta en el proceso de
48 Gestion de restricciones

optimizacion. Se pueden distinguir en la metodologa de eliminacion de restricciones


varios tipos.

Eliminacion indiscriminada Con esta estrategia todas las restricciones se eliminan


cada vez que aparezcan problemas de existencia de solucion factible, quedando la
optimizacion de un problema sin restricciones. No es un metodo muy optimo para
resolver el problema de la existencia de solucion admisible, pero es la forma mas rapida
de tener en cuenta incompatibilidad de restricciones.

La eliminacion indiscriminada de restricciones no es adecuada en todas las aplicacio-


nes. No debe ser por ejemplo usada en casos en que las restricciones esten directamente
relacionadas con lmites de seguridad.

Eliminacion jerarquica En este caso solo se eliminan las restricciones que provocan
problemas de incompatibilidad. En este metodo se asigna en la etapa de diseno una
prioridad a cada restriccion, que da un grado de importancia relativa de dicha res-
triccion frente a las otras. Esta prioridad se usara para clasificar las restricciones de una
forma jerarquica (se asigna un numero que indica su posicion en la jerarqua). De este
modo, cada vez que haya problemas de factibilidad o existencia de solucion el gestor
de restricciones va eliminando por orden las restricciones menos prioritarias hasta que
se restablece la factibilidad de la solucion, que se chequea cada periodo de muestreo
para reinsertar restricciones que hubieran sido temporalmente eliminadas.

En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes


tipos de reglas para establecer el numero de restricciones que se eliminan, si conviene
eliminar mas restricciones a costa de no eliminar una con prioridad superior, etc.

Relajacion de restricciones

Otro metodo para tener en cuenta el problema de existencia de solucion es la relajacion


de las restricciones. Se puede hacer una relajacion de los lmites de forma tempo-
ral o convertir restricciones duras ( Ru c
 ), cambiandolas en restricciones blandas
Ru c
(  + , con  0) para asegurar la existencia de solucion, anadiendo
un termino
T
T a la funcion de coste de forma que se penalice la violacion de la restriccion y
obtener un mejor comportamiento del sistema controlado. A largo plazo, el termino
en la funcion objetivo llevara las variables auxiliares a cero.
de penalizacion

Otras tecnicas

Existen tecnicas que se basan en la manipulacion del horizonte mnimo de las restriccio-
nes. Algunos controladores industriales como el QDMC usan el concepto de constraint
Restricciones en Control Predictivo 49

window. La constraint window comienza en algun punto en el futuro y continua hasta el


estado estacionario. Si existe dinamica del tipo de fase no mnima, se pueden mejorar
las prestaciones desplazando la ventana hacia el futuro, lo que equivale a ignorar las
restricciones duras en la salida durante la fase inicial de la respuesta.
50 Gestion de restricciones
Tema 5

Tendencias actuales y nuevas


perspectivas

En la actualidad existen muchos campos abiertos en Control Predictivo, tanto en lo


referente a aplicaciones practicas como a lneas de investigacion. Todava queda mucho
por estudiar en campos como identificacion de modelos, estimacion del estado y de
las perturbaciones no medibles o tratamiento sistematico de las incertidumbres. El
estudio de estabilidad o robustez de la solucion es complicado, sobre todo en el caso de
inclusion de restricciones, ya que la ley de control es en general variable con el tiempo
y no se puede representar el sistema de la forma clasica de bucle cerrado.


Este tema esta dedicado a dos areas de especial interes: la consideracion de funciones
objetivos multicriterio y un campo que esta empezando a tener gran relevancia en la
practica como es el Control Predictivo No lineal.

5.1 Multiobjetivo. Jerarqua de objetivos

Las estrategias que se han considerado hasta ahora estan basadas en la minimizacion

de una funcion de coste de un unico objetivo para la obtencion de la mejor secuencia
de acciones de control. Sin embargo, en muchas situaciones el comportamiento del
proceso no se puede medir con una sola funcion objetivo sino que, la mayora de las
veces, existen diversos (y a menudo contrapuestos) objetivos de control. Las razones
de la existencia de diversos objetivos de control pueden ser:

 Los procesos deben operar de forma diferente en distintos momentos. Por ejem-
plo, durante la fase de arranque puede interesar una estrategia de tiempo mnimo
y en el regimen nominal el objetivo puede ser reducir en lo posible la varianza de
las variables controladas.

51
52 Multiobjetivo. Jerarqua de objetivos

 El objetivo de control puede variar aun el caso de estar trabajando en regimen


nominal, dependiendo del valor de las variables. Por ejemplo, aunque el objetivo
de control sea minimizar la suma ponderada de los errores de las variables, si
una de ellas alcanza un valor muy alto (por ejemplo debido a una perturbacion)
el objetivo de control sera disminuir el valor de esta variable lo antes posible.

En muchas situaciones el objetivo de control no es minimizar la suma de errores, sino


mantener ciertas variables dentro de unos lmites especificados. Esto es equivalente
a las restricciones blandas. Este tipo de objetivo se puede expresar penalizando la
cantidad que se sobrepasa cada variable del setpoint. Considerese, por ejemplo, que el
objetivo es mantener la variable y (t) entre sus lmites yl e yh . En este caso, el objetivo
de control se puede escribir como:
XN2 XN2
J = p(y(t + j ) ; yh) (y(t + j ) ; yh)2 + p(yl ; y(t + j )) (y(t + j ) ; yl )2
j =N1 j =N1
siendo p la funcion escalon (vale 1 cuando el argumento es mayor o igual que 0 y vale
0 en caso contrario).


Notese que ahora la funcion objetivo no es cuadratica y por tanto no se puede
emplear para su minimizacion un algoritmo de programacion cuadratica, aunque se
puede transformar en uno de este tipo anadiendo
unas variables de holgura h (j ) y
l (j ):
y(t + j )  yh + h (j )
y(t + j )  yl ; h (j )

La secuencia optima de control se obtiene con la minimizacion de
XN2
J = ( h(j )2 + l (j )2)
j =N1
con la condicion de que las variables de holgura sean no negativas (y el resto de las
restricciones si las hubiera). En definitiva lo que se ha hecho es transformar el problema
en un QP con mas restricciones y variables.

En muchas ocasiones todos los objetivos de control se pueden agrupar en una sola
funcion de coste. Algunos de los objetivos pueden ser mantener las variables lo mas
cerca posible de los setpoints o dentro de unas determinadas regiones de operacion.
Cada uno de estos objetivos equivale a minimizar una cierta funcion Ji (sujeta a una serie
de restricciones). Entonces la secuencia de control se puede obtener de la minimizacion
de: mX
J= i Ji
i=1
sujeta a todo el conjunto de restricciones. La importancia relativa de cada objetivo se
puede ponderar mediante la adecuada eleccion de los i , aunque en la practica es difcil
encontrar estos pesos. Ademas, muchas veces los objetivos de control son cualitativos,
mas difcil.
haciendo la tarea aun
Tendencias actuales y nuevas perspectivas 53

5.1.1 Jerarqua de objetivos

En muchas situaciones, se puede establecer una importancia relativa de unos objetivos


sobre otros por medio de una priorizacion o jerarqua. Es decir, los objetivos de mayor
prioridad (por ejemplo los relacionados con la seguridad) se deben satisfacer antes que
otros con menor prioridad. Aunque esto se puede resolver con ponderaciones, no es
un asunto trivial.

Tyler y Morari [20] proponen una forma de introducir multiples objetivos jerarqui-
zados. Considerese un proceso con m objetivos Oi jerarquizados (el Oi+1 tiene mayor
prioridad que el Oi) que se pueden expresar como:

Riu  ai
La idea consiste en introducir variables enteras Li que toman valor 1 cuando se satisface
el correspondiente objetivo de control y cero en caso contrario. Los objetivos se expresan
entonces como:

Riu  ai + Ki(1 ; Li) (5:1)

donde Ki es una cota superior conservadora para Ri u ; ai . Si se cumple el objetivo i, se


tiene que Li = 1 y el objetivo reformulado coincide con el original. Con la introduccion
de Ki el objetivo reformulado se satisface incluso cuando el correspondiente objetivo
Oi no lo hace (Li = 0).
La jerarqua de objetivos se puede establecer imponiendo las restricciones siguien-
tes:
Li ; Li+1  0
PL .
El problema es maximizar el numero de objetivos de control satisfechos i
Si el modelo del proceso es lineal el problema se puede resolver con Programacion
Lineal Entera Mixta (MILP). El conjunto de restricciones 5.1 se puede modificar para
mejorar el grado de satisfaccion de restricciones de los objetivos que no pueden ser
satisfechos. Supongase que no todos los objetivos se pueden satisfacer y que el Of es
el primero que falla. Con la idea de acercarse todo lo posible a la satisfaccion de este
objetivo se introduce una variable de holgura  que cumpla el siguiente conjunto de
restricciones: 0 i;1
1
X
Ru a
i  i +  + Ki @(1 ; i) + (1 ; Li ) ; Lj A (5:2)
j =1
con la funcion objetivo
X
m
J = ;K Li + f ()
i=1
donde f es una funcion de penalizacion de la variable de holgura (positiva y monotona
creciente) y K es su cota superior. El algoritmo de optimizacion intentara maximizar
54 Control predictivo no lineal


el numero de objetivos satisfechos (Li = 1) antes de intentar reducir f () porque la
funcion objetivo global se puede hacer mas pequena incrementando el numero de
variables Li distintas de cero que reduciendo la funcion de penalizacion. Como todos
los objetivos Oi estan satisfechos para i < f , las restricciones (5.2) tambien se satisfacen.
Como Of es el primero que falla:
i;1
X
Li = f ; 1 para i  f
i=1
Es decir, el termino que multiplica a Ki es cero para i = f mientras que para ndices
mayores es mayor que uno. Esto implica que todas las restricciones se satisfaran para
i > f . La unica
Ru a
restriccion activa es f  f + .

O sea, el metodo de optimizacion intentara optimizar el grado de satisfaccion del


primer objetivo que falle solo despues de que todos los objetivos mas prioritarios se
hayan satisfecho. Notese que Li = 0 no implica que el objetivo i-esimo no sea satisfecho,
sino que indica que la restriccion correspondiente ha sido relajada.

Si el modelo del proceso y la funcion de penalizacion son lineales, el problema es del


tipo MILP, pero si f () es cuadratica se recurre a Programacion Cuadratica Entera Mixta
(MIQP). Aunque existen algoritmos para Programacion Mixta, el esfuerzo computacio-
nal es mucho mayor que el requerido para problemas LP o QP, por ello el numero de
objetivos debe ser pequeno para poder implementar el metodo en tiempo real.

5.2 Control predictivo no lineal


En los ultimos anos
el Control Predictivo Basado en Modelo se ha convertido en la
estrategia de control preferida para una gran cantidad de procesos industriales. Los
esquemas de MPC lineal, es decir, los vistos hasta ahora en los que la prediccion esta
basada en un modelo lineal del proceso, se usan de forma rutinaria como una opcion
de control mas a tener en cuenta en ciertos sectores de la industria y se puede decir que
sus fundamentos teoricos estan suficientemente estudiados.

Por su parte, el Control Predictivo No Lineal (Nonlinear Model Predictive Control,


NMPC) surgio hace relativamente poco tiempo y existen pocas referencias de aplicacio-
nes industriales. Pero debido a su capacidad para tener en cuenta las no-linealidades
del proceso se espera que se convierta en una opcion prometedora a corto plazo.

No hay nada en los conceptos basicos de MPC contra el uso de modelos no lineales,
por tanto la extension de tales conceptos a procesos no lineales es en principio sencilla.
Sin embargo, como se vera seguidamente esto no es un asunto trivial y aun hay muchos
temas abiertos como:

 La disponibilidad de modelos no lineales debido a la dificultad de tecnicas de


Tendencias actuales y nuevas perspectivas 55

identificacion para procesos no lineales.

 La complejidad de los calculos necesarios para resolver el problema del control


predictivo de procesos no lineales.

 La escasez de resultados de estabilidad y robustez.

En general los procesos industriales son no lineales, pero aun as la mayora de


las aplicaciones de control predictivo estan basadas en el uso de modelos lineales,
del tipo de los vistos hasta ahora. Existen varias razones para ello: por un lado
resulta relativamente facil identificar modelos lineales a partir de datos del proceso,
y por otro los modelos lineales dan buen resultado cuando el proceso opera en las
cercanas del punto de trabajo nominal. En el sector petroqumico, donde tiene lugar
la mayora de las aplicaciones de MPC, el objetivo es mantener el proceso en torno al
estado estacionario (problema del regulador) mas que realizar frecuentes cambios de un
punto de operacion a otro (problema del servo) y por tanto un modelo lineal preciso es
suficiente. Ademas el uso de un modelo lineal junto con una funcion objetivo cuadratica
da lugar a un problema convexo de programacion cuadratica (QP) cuya solucion esta
suficientemente estudiada en la actualidad, existiendo diversos productos comerciales
fiables. La existencia de algoritmos que garanticen una solucion que converja en un
corto tiempo (menor que el periodo de muestreo) resulta crucial en procesos en los que
interviene un gran numero de variables.

Sin embargo, existen situaciones en las que los efectos no lineales justifican el uso
de la tecnologa NMPC. Estas situaciones entran dentro de las dos categoras siguientes:

 Procesos fuertemente no lineales y sujetos a grandes perturbaciones, como por


ejemplo el control de pH.

 Problemas de seguimiento de consigna en los que el punto de operacion cambia


con frecuencia y estos cambios sacan a relucir la dinamica no lineal del proceso,
como en el caso de la fabricacion de polmeros.

En estas situaciones una ley de control lineal puede no ser efectiva siendo necesario
el empleo de un controlador no lineal para mejorar el comportamiento o simplemente
para una operacion estable del proceso. Es por tanto en este caso donde se puede
justificar el empleo de tecnicas de NMPC. Aunque en la actualidad el numero de
aplicaciones es aun reducido, el potencial es considerable, como se desprende del
informe de Qin y Badgwell [17], donde se observa que MPC no ha penetrado aun en
campos donde las no linealidades son fuertes y el mercado exige frecuentes cambios
del punto de operacion; es aqu donde se espera el auge del NMPC.
56 Control predictivo no lineal

5.2.1 Diferencias respecto al metodo lineal

Resulta evidente que la principal ventaja del NMPC frente al MPC radica en la posibilidad
de abordar dinamicas no lineales. A medida que aparecen nuevas herramientas que
hacen posible la obtencion y representacion de modelos no lineales, bien a partir de
primeros principios (leyes de conservacion) o bien a partir de datos experimentales
(modelos de Volterra o redes neuronales) el interes por su utilizacion en NMPC se va
acrecentando.

Aunque la extension de los conceptos de MPC al caso no lineal es directa, a la hora de


realizar el controlador aparecen una serie de problemas a tener en cuenta, que dan lugar
a una mayor dificultad en su implantacion. Las principales dificultades derivadas del
empleo de modelos no lineales son:

 La obtencion de un modelo no lineal a partir de datos experimentales es un


problema abierto. La utilizacion de redes neuronales o series de Volterra no
parecen solucionar el problema de forma general. Por otra parte, la obtencion de
modelos a partir de primeros principios no es siempre viable.

 El problema de optimizacion es no convexo, cuya resolucion es mucho mas difcil


que un problema de programacion cuadratica. Aparecen problemas relativos a la

obtencion del optimo global, lo que influye no solo en la calidad del control, sino
tambien en problemas relacionados con la estabilidad.

 La dificultad del problema de optimizacion se traduce en un aumento considera-


ble del tiempo de calculo, hecho que puede dar lugar a que la aplicacion de esta
tecnica quede restringida a un conjunto de sistemas con dinamica lenta.

 El estudio de temas fundamentales como estabilidad o robustez se complica


enormemente. Este tema constituye un campo abierto de gran interes para los
investigadores.

5.2.2 Fundamentos teoricos

Se puede definir un algoritmo generico NMPC que englobe a todas las tecnicas que
comparten las mismas ideas. El proceso (en general multivariable) se puede describir
por un modelo en el espacio de estados de la forma:

x(t + 1) = f (x(t) u(t) d(t) w(t))


y(t) = g(x(t)) + e(t)
donde x es el vector de estados de dimension n, u es el vector de mu entradas, d son las
perturbaciones medibles y w(t)) las no medibles. El vector de salidas es y de dimension
my , la misma que la del vector de ruidos de medida e.
Tendencias actuales y nuevas perspectivas 57

El problema que hay que resolver es el calculo de la secuencia de senales


de control
u x
que llevan al proceso desde su estado actual al estado deseado s . El punto de trabajo
y x u
deseado ( s , s , s ) viene en general determinado por una optimizacion estatica basada
normalmente en criterios economicos. Este punto de trabajo debe ser recalculado

periodicamente ya que las perturbaciones pueden hacer cambiar el punto o ptimo de
operacion.

Las perturbaciones medibles se pueden eliminar incluyendo su efecto en la funcion


f , mientras que el resto se rechaza con la realimentacion, normalmente considerando
que la perturbacion permanecera constante a lo largo del horizonte. Esto se formalizar
anadiendo
un termino constante (bias) e igual al error entre medida y salida calculada
a toda la prediccion:
y(t + j ) = g(x(t + j )) + b(t) donde b(t) = ym(t) ; y(t)
El problema consiste en la minimizacion de una funcion objetivo que de la forma
mas generica sera:
X
P ;1
MX ;1
MX
J= ky(t + j ) ; ys kq
Q+ u
k 4 (t + j )kqS + ku(t + j ) ; uskqR + kskqT (5:3)
j =1 j =1 j =1

donde q puede ser 1 o 2 segun


el tipo de norma que se este utilizando y Q, S, R y T
son matrices de ponderacion. La minimizacion estara sujeta a la restriccion del modelo:
x(t + j ) = f (x(t + j ; 1) u(t + j ; 1) d(t + j ; 1) w(t + j ; 1))y(t + j ) = g(x(t + j )) + b(t)
y al resto de restricciones en entradas y salidas que se quieran considerar:
y ; s  y(t + j )  y ; s 8j = 1 P
u  u(t + j )  u 8j = 1 M ; 1
4u  4u(t + j )  4u 8j = 1 M ; 1

Observese que se ha considerado la violacion de las restricciones en la salida con el


termino s, que entra en juego en la minimizacion apareciendo en la funcion de coste
con una penalizacion dada por la matriz T.

Igual que en caso lineal, la solucion del problema es una secuencia de acciones de
control de las cuales solo la primera de ellas es enviada a la planta, desechando el resto
y volviendo a la resolver el problema en el siguiente periodo de muestreo.

5.2.3 Problematica asociada al NMPC

La resolucion del NMPC plantea nuevos problemas que no existan en el caso lineal
relacionados por un lado con la metodologa de calculo de la senal
de control y por
otro con el comportamiento dinamico del bucle cerrado, basicamente su estabilidad.
58 Control predictivo no lineal

Resolucion

La introduccion de un modelo no lineal en el algoritmo de optimizacion conduce a la


perdida de convexidad, no pudiendo ser resuelto por los algoritmos de programacion
cuadratica (QP), para los cuales existen soluciones fiables y suficientemente estudiadas.
Esta perdida de convexidad hace que sea mucho mas difcil encontrar una solucion y
que, una vez encontrada, no se pueda garantizar que sea un optimo global.

En estas circunstancias el tiempo de calculo aumenta considerablemente debido


principalmente a dos motivos

 Para la obtencion de la secuencia de acciones de control optima,


el paquete de
programacion no lineal debe evaluar repetidamente la funcion objetivo y en cada
evaluacion se debe resolver el sistema de ecuaciones no lineales que componen
el modelo de prediccion, lo cual conlleva mucho tiempo de calculo.

 A partir de los datos obtenidos a traves de la evaluacion de la funcion objetivo, el


programa de optimizacion debe calcular el gradiente de la funcion y los proximos

puntos de busqueda, ademas de comprobar la violacion o no de las restricciones
y los criterios de finalizacion del algoritmo. Estas tareas consumen mas tiempo
de calculo que en el caso lineal.

Estabilidad de la solucion

El otro problema fundamental es el de la estabilidad de la solucion. Aun en el caso de



que el algoritmo de minimizacion encuentre la solucion optima, este hecho no garantiza
la estabilidad del bucle cerrado (incluso en el caso de que el modelo sea perfecto). Este
problema ha sido abordado desde distintos puntos de vistos de vista, existiendo en la
actualidad diferentes propuestas, las cuales se describen a continuacion.

1. Horizonte infinito

Existe una solucion propuesta por Meadows et al. ([13]) que consiste en ampliar
los horizontes de control y de prediccion hasta el infinito, P M ! 1. En este caso la
funcion objetivo tambien sirve como funcion de Lyapunov, dando lugar a la estabilidad
nominal. En el artculo citado se demuestra que si existe solucion inicial factible
entonces existe solucion en cada periodo de muestreo posterior.

La idea basica es que si el problema de minimizacion es factible en el instante t


entonces la funcion de coste es finita y

Jt+1  Jt + x(t)t Rx(t) + u(t)t Su(t)


Por tanto la funcion de coste es monotona decreciente y se puede interpretar como una
funcion de Lyapunov, garantizando por consiguiente la estabilidad asintotica.
Tendencias actuales y nuevas perspectivas 59

A la hora de la verdad este concepto tiene principalmente un interes teorico so-


bre el que basar un desarrollo practico, ya que no es viable una implementacion con
horizonte infinito. Para llevarlo a la practica se puede tomar un horizonte lo suficien-
temente grande, pero esta eleccion no tiene por que garantizar la estabilidad, ya que
las trayectorias de la entrada y el estado diferiran de las trayectorias predichas incluso
si no hay incertidumbres ni perturbaciones.

2. Restriccion terminal

Otra solucion al problema, propuesta por Keerthi y Gilbert ([8]) consiste en anadir

una restriccion terminal al estado en el algoritmo NMPC de la forma:

x(k + P ) = xs
Con la imposicion de esta restriccion, la funcion objetivo se convierte en una funcion
de Lyapunov para el sistema en bucle cerrado, conduciendo a la estabilidad nominal.
Con la introduccion de esta restriccion el estado al final del horizonte finito es cero y
por tanto tambien lo sera la senal
de control, con lo que el sistema (sin perturbaciones)
se queda para siempre en el origen. De esta forma es como si el horizonte de prediccion
fuera infinito.

El problema de este metodo es que en la practica la introduccion de esta restriccion


artificial anade
un coste computacional considerable y, lo que es mas importante aun,
da lugar a una region de operacion muy restrictiva, por lo que en la realidad resulta
muy difcil satisfacer esta condicion.

3. Control dual

La dificultad de la aproximacion anterior llevo a Michalska y Mayne ([14]) a buscar


una restriccion menos estricta. La idea es definir un entorno W alrededor del estado
x
final deseado s dentro del cual el sistema pueda ser llevado a dicho estado por medio de
un controlador lineal por realimentacion del vector de estados. Por tanto la restriccion
que se anade
a la formulacion es:

x t P ) ; xs ) 2 W
( ( +

Si el estado actual se encuentra fuera de esta region se usa el algoritmo NMPC con la
restriccion anterior. Una vez que el estado se encuentra en W , el control conmuta a una
estrategia lineal determinada previamente (estrategia del tipo dual-mode controller).

Este metodo conlleva por tanto la gestion de la conmutacion entre los dos controla-
dores y la determinacion de la region W y de la matriz de ganancia de la realimentacion
del vector de estados (una forma de hacerlo se puede encontrar en el artculo citado).

4. Horizonte casi-infinito

Chen y Allgower ([3]) extendieron el concepto anterior, proponiendo un esquema


de control con horizonte casi-infinito. Se hace uso de la idea de region terminal y
60 Control predictivo no lineal

controlador estabilizante, pero solo para el calculo del coste terminal. La senal
de
control se determina resolviendo el problema de optimizacion en lnea (con horizonte
finito) sin conmutar al controlador lineal incluso dentro de la region terminal.

El procedimiento consiste en anadir


el termino kx(t + Tp )k2P a la funcion de coste,
cuyo objetivo es extender el horizonte de prediccion hasta el infinito y por tanto evitar
la conmutacion del controlador. Se puede demostrar que, eligiendo adecuadamente la
matriz de ponderacion P , este termino es una cota superior de lo que costara llevar
al sistema no lineal con el controlador lineal hasta el origen partiendo de un estado
perteneciente a la region terminal y la funcion de coste con horizonte finito se aproxima
a una de horizonte infinito, en cuyo caso la estabilidad queda asegurada. Esto se puede
interpretar como si el horizonte de prediccion se expandiera casi hasta el infinito (es
decir, es como si se minimizara un coste de horizonte infinito resolviendo un problema
de horizonte finito).

5. Contraccion del estado

La idea consiste en imponer la siguiente restriccion:

kx(t + N )k2  kx(t)k2  2 (0 1)


Esta restriccion fuerza a la magnitud del vector de estado a contraerse segun el factor
elegido cada vez que se calcula la senal
de control. La estabilidad queda garantizada
siempre que el problema sea factible, lo que no viene impuesto necesariamente porque
sea factible en k = 0, ya que las restricciones que se le imponen al estado son muy
estrictas y pueden hacer perder factibilidad. Esto se puede mejorar con valores grandes
de , pero entonces la disminucion de la magnitud del estado es menor. En general
se puede decir que en muchas situaciones reales la condicion es muy restrictiva y la
no-factibilidad aparece con facilidad.

Robustez

lo es el de
Si el estudio de la estabilidad en NMPC resulta de por s complicado, mas aun
la robustez, es decir, la estabilidad cuando existen errores de modelado. Los resultados
de estabilidad de la seccion anterior son validos solo en el caso de que el modelo del
proceso sea perfecto. Resulta evidente que esto nunca va a ser cierto en la practica, por
lo que es necesario alguna forma de afrontar la existencia de incertidumbres.

Se puede considerar el problema de la robustez como algo todava sin resolver


para NMPC, aunque existen algunos resultados preliminares. Algunos de los esquemas
que garantizan establidad se pueden hacer robustos con algunos cambios, como por
ejemplo el uso de restricciones terminales conservadoras in el dual-mode. Pero en
general los resultados existentes solo indican que incertidumbres pequenas no amenazan
la estabilidad del bucle cerrado, sin permitir el diseno
del controlador que garantice la
estabilidad dada una incertidumbre descrita por sus lmites. Existen algunos resultados
Tendencias actuales y nuevas perspectivas 61

para casos muy simples como incertidumbre en la ganancia y se esta avanzando en


algunos campos como en LMI, pero todava queda mucho por hacer.

5.2.4 Modelos

Estos resultados teoricos proporcionan una base para poner en marcha un NMPC, aun-
que en la practica existen muchos temas abiertos, principalmente en lo referente a la
definicion e identificacion del modelo y al desarrollo de metodos de resolucion fiables.

La obtencion de modelos no lineales adecuados de forma emprica puede ser muy


difcil y no existe una formulacion que sea claramente adecuada para representar
procesos no lineales de forma generica. Parte del e xito del MPC se debe a la relativa
facilidad con la que se pueden obtener experimentalmente modelos del tipo respuesta
ante escalon o funciones de transferencia de bajo orden. En cambio los modelos no
lineales son mucho mas difciles de construir, tanto basandose en correlacion de datos
de entrada/salida como en principios basicos de conservacion de masa y energa.

Un gran obstaculo que se encuentra a la hora de desarrollar una teora de sistemas


no lineales es la ausencia de un principio de superposicion para este tipo de sistemas.
Debido a ello, la determinacion experimental de los modelos se convierte en una tarea
muy complicada, requiriendo una cantidad de ensayos mucho mayor que para una
planta no lineal.

Si el proceso es lineal en teora solo es necesario llevar a cabo un ensayo de res-


puesta ante escalon para calcular el modelo (aunque en la practica no sea realmente
as). Debido al principio de superposicion, la respuesta ante un escalon de diferente
amplitud se puede obtener escalando la salida convenientemente. Pero esto no es as
para procesos no lineales, donde se deben realizar ensayos con escalones de distinto
tamano. Ademas, si el proceso es multivariable, la diferencia en el numero de ensayos
necesarios es mucho mayor. En general, si un sistema lineal se ensaya con senales
de entrada u1 (t),u2 (t),...,un (t), y las correspondientes salidas son y1 (t),y2 (t),...,yn (t), la
respuesta a una senal
que se puede expresar como combinacion lineal de las senales de
prueba
u(t) = 1u1(t) + 2 u2(t) +    + nun(t)
es
y(t) = 1y1(t) + 2y2(t) +    + nyn(t)
Es decir, un sistema lineal no necesita ser probado con ninguna secuencia de senales

de entrada que sea una combinacion lineal de senales ya probada, mientras que no
ocurre lo mismo con un sistema no lineal, cuya respuesta debe ser analizada para todas
las posibles senales
de entrada.

Si la desviacion de la linealidad no es demasiado grande, se pueden hacer algu-


nas aproximaciones que tengan en cuenta el cambio de comportamiento de un punto
62 Control predictivo no lineal

de operacion a otro y asuman comportamiento lineal en las cercanas del punto de


operacion. Pero en general habra que recurrir a modelos especficos que reflejen la
dinamica no lineal. Existen diferentes aproximaciones que usan modelos de Wiener,
otras basadas en redes de neuronas, modelos de Volterra o de Hammerstein, mode-
los NARX, modelos borrosos, etc. Los modelos usados en la industria se detallan a
continuacion.

Modelos en el espacio de estados

Se puede usar un modelo formado por la combinacion de una ecuacion de estado lineal
con una relacion no lineal de salida:

x(t + 1) = Ax(t) + Bu(t) + Dd(t)y(t) = g(x(t))


A su vez la no linealidad de la salida se puede modelar con la superposicion de una
relacion lineal y una red neuronal no lineal:

g(x(t)) = Cx(t) + NN (x(t))


Al no estar el vector de estados limitado necesariamente a variables fsicas, este
modelo es muy generico y permite englobar mas efectos no lineales que los exclusivos
de las medidas.

Pero el principal problema en NMPC no es la eleccion del tipo de modelo, sino de


un metodo de identificacion fiable y robusto. Segun el modelo propuesto, se identifica
el sistema como lineal y los residuos de las salidas se ajustan a los estados con la red
neuronal. Se puede usar un ndice de confianza de modo que la prediccion se basa mas
o menos en la red neuronal segun este ndice, apagandose en caso de que su aportacion
no sea fiable. Tambien puede anadir
un filtro de Kalman extendido (EKF) para corregir
los errores de modelado y las perturbaciones no medibles, reemplazando de este modo
el error constante en la realimentacion que se emplea normalmente en el MPC.

Modelos de entrada/salida

Una idea adoptada por algunos fabricantes de controladores predictivos es usar un


modelo no lineal estatico junto con un modelo dinamico no lineal. Si se considera el
caso monovariables, definiendo las variables de desviacion como:

u(t) = u(t) ; us y(t) = y(t) ; ys


donde los valores en estado estacionario de entrada y salida cumplen:

ys = hs(us)
Tendencias actuales y nuevas perspectivas 63

Se considera que las variables de desviacion verifican la siguiente relacion dinamica


lineal:
Xn
y(t) = ai y(t ; i) + bi u(t ; i)
i=1

La identificacion del modelo lineal se lleva a cabo mediante ensayos ante escalon
mientras que a partir de datos historicos se obtiene la representacion de la relacion no
lineal por medio de una red de neuronas. Como el modelo dinamico tiene una ganancia
fija que en general sera distinta de la del modelo no lineal, la ganancia del submodelo
lineal se escala hasta ser igual a la ganancia local no lineal para la entrada actual:

dys j
Ks = du u(t)
s
Esto se consigue reescalando los coeficientes bi .

Para usar este modelo, un programa de optimizacion no lineal calcula los mejores
valores de entrada y salida ufs , ysf a partir del modelo estatico. Durante el calculo
dinamico del controlador, la ganancia estatica no lineal se aproxima por una interpo-
lineal de las ganancias inicial y final:
lacion

Ks(u(t)) = Ksi + Ksf ; Ki s u(t)


f i
(5 :4)
us ; us
siendo uis y ufs los valores estacionarios actual y proximo y Ksi y Ksf las ganancias
calculadas en esos puntos usando el modelo no lineal estatico. Sustituyendo la ganancia
dada por (5.4) en la ecuacion del submodelo lineal se obtiene:

X
n
y(t) = aiy(t ; i) + biu(t ; i) + giu2(t ; i) (5 :5)
i=1

biKsi (1 ; Pnj=1 aj ) bi (1 ; Pnj=1 aj )


donde
bi = Pn b gi = Pn Ksf ;K i
j =1 bj ufs ;uis
j =1 j s

con esto se consigue reducir la complejidad computacional.

Se puede observar que los valores en estado estacionario se calculan a partir del
modelo estatico no lineal, mientras que los movimientos dinamicos de control estan
basados en el modelo cuadratico de la ecuacion (5.5). Sin embargo, los coeficientes del
modelo cuadratico (la ganancia local) cambian de un periodo de muestro a otro, ya son
reescalados para ajustarse a la ganancia local del modelo no lineal. Esta estrategia se
puede interpretar como una sucesiva linealizacion de los estados inicial y final seguida
por una interpolacion lineal de las ganancias linealizadas, en una formulacion similar
al gain-scheduling, pero con un modelo global diferente debido el reescalado de la
ganancia.
64 Control predictivo no lineal

Modelos basados en primeros principios

En cualquier caso siempre es difcil obtener modelos empricos fiables a partir de


datos experimentales, por lo que en la practica existe la posibilidad de usar modelos
dados directamente de las ecuaciones de balance, llamados normalmente modelos
de primeros principios. Estas ecuaciones pueden ser ecuaciones estaticas de balance
o funciones no lineales de variables fsicas que generan otra variable. En este caso
el calculo de la prediccion se realiza mediante una simulacion de las ecuaciones no
lineales (integracion) que describen el proceso.

5.2.5 Otras formulaciones del problema

Se han propuesto diversas soluciones para intentar resolver los problemas que se
han visto, como por ejemplo en [1], donde la prediccion de la salida del proceso
se hace mediante la adicion de la respuesta libre (la respuesta futura que se obtiene
si la entrada se mantiene en un valor constante durante los horizontes de control y
prediccion) obtenida de un modelo no lineal de la planta, y la respuesta forzada (la
debida a los movimiento de control futuros), calculada con un modelo incremental de
la planta. Las predicciones obtenidas de esta manera son solo una aproximacion ya
que el principio de superposicion, que permite la descomposicion mencionada, solo
es valido para sistemas lineales. Sin embargo, la aproximacion que se obtiene de esta
forma se comporta mejor que cuando se usa un modelo linealizado del proceso para
obtener ambas respuestas.

Si se usa una funcion de coste cuadratica, la funcion objetivo es cuadratica en las


variables de decision (futuros movimientos de la senal de control) y la secuencia de
control se puede calcular (en caso de que no haya restricciones) como la solucion de
un conjunto de ecuaciones lineales, dando lugar a una ley de control simple. La unica
diferencia respecto a un MPC estandar es que la respuesta libre se calcula mediante un
modelo no lineal del proceso. Como el principio de superposicion no se cumple, la
aproximacion solo es valida cuando la secuencia de senales
de control es pequena.
Esta
circunstancia tendra lugar cuando el proceso opera en torno al punto de trabajo con
pequenas perturbaciones. Si el proceso cambia continuamente de punto de operacion
o las perturbaciones son considerables los incrementos de la senal de control seran en
general mayores y la aproximacion no sera muy buena.

Existe una forma de resolver este problema, propuesta en [9] para el EPSAC. La idea
basica es considerar la secuencia de senales
de control como la suma de una secuencia
de control base (ub (t + j )) y una secuencia de incrementos de la variable manipulada
(ui (t + j )). Es decir:

u(t + j ) = ub(t + j ) + ui(t + j )


Tendencias actuales y nuevas perspectivas 65

La prediccion j-esima de la salida del proceso se calcula como la suma de la respuesta


del proceso (yb (t + j )) debida a la secuencia base mas la respuesta (yi (t + j )) debida a
los futuros incrementos del control en la secuencia base de entrada ui (t + j ):

y(t + j ) = yb(t + j ) + yi(t + j )


Como se usa un modelo no lineal para calcular yb(t + j ) mientras que yi (t + j ) se
calcula a partir de un modelo lineal del proceso, la funcion de coste es cuadratica en
las variables de decision (ui (t + j )) y se puede resolver mediante un algoritmo QP como
en el MPC estandar. Como se ha indicado, el principio de superposicion no es valido
para procesos no lineales, y por ello la salida generada de esta forma solo coincidira
con la generada por el controlador no lineal en el caso de que la secuencia de futuros
movimientos de la senal de control sea cero.

Si e ste no es el caso, la secuencia de control base se hace igual a la ultima


secuencia

de control base mas los incrementos de control optimos que encuentre el algoritmo QP.
Este procedimiento se repite hasta que la secuencia de senales de control se lleva lo
suficientemente cerca de cero.

Las condiciones iniciales para la secuencia de control base se pueden hacer inicial-

mente iguales a la ultima senal
de control que se ha aplicado al proceso. Observese que
esto corresponde al calculo de la respuesta libre en el MPC. Se puede probar con una

secuencia inicial mejor haciendo la secuencia base igual a la optima que se obtuvo en

el ultimo periodo de muestreo (con el desplazamiento temporal correspondiente).

Las condiciones de convergencia del algoritmo son muy difciles de obtener ya que
dependen de la severidad de la caracterstica no lineal del proceso, de las entradas y
salidas pasadas, de las referencias futuras y de las perturbaciones.

Otra manera de atacar el problema es teniendo en cuenta que en algunas ocasiones,


el modelo no lineal se puede convertir en un modelo lineal mediante aproximaciones
apropiadas. Considerese por ejemplo el proceso descrito mediante la siguiente ecuacion
en el espacio de estados:

x(t + 1) = f (x(t) u(t))


y(t) = g(x(t))

El metodo consiste en encontrar funciones de transformacion de estados y entrada


z(t) = h(x(t)) y u(t) = p(x(t) v(t)) tales que:
z(t + 1) = Az(t) + Bv(t))
y(t) = Cz(t)
El metodo tiene dos importantes inconvenientes:
66 Control predictivo no lineal

 Las funciones de transformacion z(t) = h(x(t)) y u(t) = p(x(t) v(t)) solo se


pueden obtener en ciertos casos.

 Las restricciones, que usualmente son lineales, se convierten en no lineales.

Es decir, incluso en los casos en que el modelo pueda ser linealizado mediante
transformaciones adecuadas, el problema se transforma de minimizar una funcion no
lineal (no cuadratica) con restricciones lineales en minimizar una funcion cuadratica
con restricciones no lineales.

La forma general de resolver el problema es usar el modelo no lineal completo de


la planta para calcular la prediccion de la salida. Haciendo esto, se esta anadiendo

una restriccion no lineal a la minimizacion, con lo que los algoritmos QP no se pueden
usar. Sin embargo el problema se puede resolver en lnea, en algunos casos, gracias al
rapido desarrollo de algoritmos de programacion no lineal (nonlinear programming,
NLP) capaces de manejar un n umero grande de variables y restricciones.

5.2.6 Resolucion del problema. Productos comerciales

Muchos controladores comerciales dividen el algoritmo de control en una optimizacion


local estatica y una optimizacion dinamica. El primer modulo calcula los valores de
entrada y salida a los que es necesario llegar y el segundo calcula la secuencia de control
adecuada.

La optimizacion dinamica se lleva a cabo minimizando la funcion objetivo generica


(5.3) con las restricciones correspondientes. Los distintos esquemas comerciales hacen
simplificaciones respecto a la formulacion general.

La mayora de los productos (ver tabla 5.1) solo permiten matrices de peso cons-
tantes en todo el horizonte y solo el NOVA-NLC trabaja con norma 1. Por su parte, el
la salida pero con una matriz de peso que se incrementa
Process Perfecter minimiza solo
gradualmente con el horizonte, dando por tanto mas importancia a los errores mas
lejanos y en consecuencia dando lugar a una accion de control mas suave.

En cuanto a las restricciones, normalmente las correspondientes a la entrada se


tratan como restricciones duras, es decir, que nunca deben ser violadas. El PFC tambien

incluye restricciones de aceleracion, muy utiles para aplicaciones de servomecanismos.

Este metodo no trata estas restricciones de forma optima, sino que resuelve el problema
de optimizacion sin restricciones y luego satura a los lmites, produciendo por tanto

una solucion no optima.

Respecto a restricciones en la salida, la mayora de los productos comerciales las trata


como restricciones blandas, debido a que una perturbacion puede producir facilmente
una perdida de factibilidad. Una opcion ofertada por el Process Perfecter es considerar
Tendencias actuales y nuevas perspectivas 67

Empresa Adersa Aspen Tech. Continental DOT Products Pavillion Tech.


Producto PFC Aspen Target MVC NOVA NLC Process Perfecter
Modelo EE, PP EE E/S, PNE EE, PP RN, E/S
F. Objetivo Q Q Q Q, N1 Q
Restricciones S, BS DS, DE, BS DE, BS DE, BS DE, DS
Estructura u FB, UM MM UM MM MM

Met. solucion NLS QP GRG MINLP GD

Tabla 5.1: EE: espacio de estados no lineal. PP: primeros principios. E/S: en-
trada/salida. PNE: polinomio no lineal estatico. RN: red neuronal. N1: norma 1.
S: saturacion. BS: blandas (mnimo y maximo) en la salida. DS: duras en las salidas.

DE: duras en las entradas. FB: funciones base. UM: unico movimiento. MM: multiples
movimientos. NLS: mnimos cuadrados no lineales. GRG: Generalized Reduced Gra-
dient. MINLP: Mixed Integer Nonlinear Programming. GD: Gradient descent.

una restriccion dura en forma de embudo, de manera que se da mas libertad a la salida
al comienzo del horizonte que al final.

Parametros: normalmente se elige un horizonte de prediccion finito muy grande,


con la idea de capturar la dinamica hasta el permanente de las salidas para todas las
entradas. Esto se puede considerar una aproximacion al metodo de horizonte infinito
propuesto para garantizar la estabilidad del bucle cerrado y puede explicar por que
ninguno de los productos comerciales incluye restriccion terminal.

Una idea introducida en el PFC y adoptada por Aspen Target es el uso de puntos de
coincidencia, en los cuales deben coincidir la salida y la trayectoria de referencia. Esta
cuando las salidas responden con distinta velocidad y se pueden
idea puede ser util
definir distintos puntos de coincidencia para cada una de ellas.

En cuanto a la estructuracion de la senal de control, se puede encontrar desde


considerar el horizonte de control igual a 1, horizonte variable o funciones base. Esta

ultima idea, propia del PFC, parametriza la senal


de control usando un conjunto de
funciones polinomiales, permitiendo un perfil de entrada complejo para un horizonte
de control grande (en teora podra ser infinito) empleando un numero de incognitas
pequeno. Esto puede resultar una ventaja en el caso de sistemas no lineales. La
de la familia de funciones base establece muchas de las caractersticas del
eleccion
perfil de la entrada, pudiendo asegurar con una correcta eleccion una senal
de control
suave, por ejemplo. Si se eligen funciones base polinomicas, se puede seleccionar el
orden para seguir un setpoint polinomico sin retraso, lo cual puede ser importante para
aplicaciones de servosistemas mecanicos.

La solucion del problema no es tarea facil debido a la no convexidad del problema


generico. El PFC propone una solucion sencilla resolviendo el problema sin restricciones
usando un algoritmo de mnimos cuadrados no lineal y saturando las entradas a sus
68 Control predictivo no lineal

lmites si e stos se violan; logicamente no se asegura una solucion optima,


pero se gana
en velocidad, permitiendo que este controlador se use en aplicaciones con perodos de
muestreo pequenos, como el caso de seguimiento de missiles.

Para el caso generico se usan diversos algoritmos, algunos propietarios, basados


en metodos mas o menos conocidos de optimizacion. Entre ellos cabe destacar el
que usa Aspen Target, desarrollado por Oliveira y Biegler [15], que garantiza que las
soluciones intermedias, aunque no o ptimas, son factibles. Ello garantiza que una pronta
finalizacion del algoritmo por limitaciones de tiempo produce siempre una solucion
factible. En cualquier caso queda claro que el esfuerzo computacional es superior al
caso lineal, siendo e sta una de las principales razones la todava escasa implantacion
de estas tecnicas en la industria.

5.2.7 Necesidades futuras

Los temas que pueden considerarse abiertos en esta tecnica son:

 Modelado: los modelos no lineales son mas complejos que los lineales, pero
ademas el proceso de identificacion es mucho mas difcil. Se necesita una gran
batera de ensayos para capturar las no-linealidades del proceso, resultando en
un perodo de pruebas considerable. Por tanto, la forma de disponer de una
representacion correcta de la dinamica del proceso es un problema que no esta
completamente resuelto.

 Resolucion del problema: la inclusion del modelo no lineal en la optimizacion da


lugar a que e sta no sea convexa. Grandes esfuerzos deben hacerse todava para
encontrar algoritmos de optimizacion fiables que permitan la resolucion dentro
del tiempo asignado.

 Justificacion del esfuerzo: vistas las dificultades que aparecen en la aplicacion


de NMPC, debe poder justificarse el beneficio que este tipo de tecnica aporta.
Algunos fabricantes ofrecen un MPC de respaldo, de manera que en el caso de
que no se necesite ese esfuerzo adicional o el controlador no lineal sea realmente
complicado de poner en marcha, se aplicara la estrategia lineal.

 Otros temas: temas que son aplicables al Control Predictivo en general, funcio-
nes objetivos multicriterio, sintonizacion de parametros, mal condicionamiento o
tolerancia a fallos.

Es de destacar que ninguna de los productos comerciales incluye restriccion termi-


nal ni horizonte infinito, situaciones requeridas en teora para garantizar la estabilidad
nominal. En lugar de eso, se confa en que con un horizonte de prediccion lo suficien-
temente grande se consiga el mismo comportamiento que horizonte infinito.
Bibliografa

[1] E.F. Camacho, M. Berenguel y F.R. Rubio. Advanced Control of Solar Power Plants.
Springer-Verlag, London, 1997.
[2] E.F. Camacho y C. Bordons. Model Predictive Control. Springer-Verlag, 1999.
[3] H. Chen y F. Allgower. A quasi-infinite horizon nonlinear predictive control
scheme with guaranteed stability. Automatica, 34(10):12051218, 1998.
[4] D.W. Clarke y C. Mohtadi. Properties of Generalized Predictive Control. Automa-
tica, 25(6):859875, 1989.
[5] D.W. Clarke, C. Mohtadi y P.S. Tuffs. Generalized Predictive Control. Part I. The
Basic Algorithm. Automatica, 23(2):137148, 1987.
[6] C.R. Cutler y B.C. Ramaker. Dynamic Matrix Control- A Computer Control Algo-
rithm. En Automatic Control Conference, San Francisco, 1980.
[7] C.E. Garca, D.M. Prett y M. Morari. Model Predictive Control: Theory and
Practice-a Survey. Automatica, 25(3):335348, 1989.
[8] S.S. Keerthi y E.G. Gilbert. Optimal infinite-horizon feedback laws for a general
class of constrained discrete-time systems: Stability and moving-horizon appro-
ximations. J. Optim. Theory Appl., 57(2):265293, 1988.
[9] R. De Keyser. A Gentle Introduction to Model Based Predictive Control. En
PADI2 International Conference on Control Engineering and Signal Processing, Piura,
Peru, 1998.
[10] R.M.C. De Keyser, Ph.G.A. Van de Velde y F.G.A. Dumortier. A Comparative Study
of Self-adaptive Long-range Predictive Control Methods. Automatica, 24(2):149
163, 1988.
[11] K. Kramer y H. Ubehauen. Predictive Adaptive Control. Comparison of Main
Algorithms. En Proceedings 1st European Control Conference, Grenoble, paginas 327
332, julio 1991.
[12] A.G. Kutnetsov y D.W. Clarke. Advances in Model-Based Predictive Control, captulo
Application of constrained GPC for improving performance of controlled plants.
Oxford University Press, 1994.

69
70 Bibliografa

[13] E.S. Meadows, M.A. Henson, J.W. Eaton y J. Rawlings. Receding horizon control
and discontinuous state feedback stabilization. Int. Journal Control, paginas 1217
1229, 1995.

[14] H. Michalska y D.Q. Mayne. Robust receding horizon control of constrained


nonlinear systems. IEEE Trans. on Automatic Control, 38(11):16231633, 1993.

[15] N.M.C. Oliveira y L.T. Biegler. An extension of newton-type algorithms for non-
linear process control. Automatica, 31:281286, 1995.

[16] S.J. Qin y T.A. Badgwell. An Overview of Industrial Model Predictive Control
Technology. In Chemical Process Control: Assessment and New Directions for
Research. En AIChE Symposium Series 316, 93. Jeffrey C. Kantor, Carlos E. Garcia and
Brice Carnahan Eds. 232-256, 1997.

[17] S.J. Qin y Thomas A. Badgwell. An overview of nonlinear model predictive control
applications. En IFAC Workshop on Nonlinear Model Predictive Control. Assessment
and Future Directions. Ascona (Switzerland), 1998.

[18] J. Richalet. Practique de la commande predictive. Hermes, 1992.

[19] H. Takatsu, T. Itoh y M. Araki. Future needs for the control theory in industries.
report and topics of the control technology survey in japanese indsutry. Journal of
Process Control, 8:369374, 1998.

[20] M.L. Tyler y M. Morari. Propositional Logic in Control and Monitoring Problems.
Technical Report AUT96-15, Institut fur Automatik, ETH- Swiss Federal Institute of
Technology, Zurich, Switzerland, 1996.

[21] B.E. Ydstie. Extended Horizon Adaptive Control. En Proc. 9th IFAC World Congress,
Budapest, Hungary, 1984.

También podría gustarte