Está en la página 1de 73

Escuela Superior de Ingenieros Universidad de Sevilla

Control Predictivo: metodologı́a,


tecnologı́a y nuevas perspectivas

Carlos Bordóns Alba


Departamento de Ingenierı́a de Sistemas y Automática
Universidad de Sevilla

I Curso de Especialización en Automática


Aguadulce, Almerı́a, 2000
Índice general

Índice i

1 Fundamentos 1

1.1 Tendencias actuales en control de procesos ::::::::::::::::: 1

1.2 Perspectiva histórica :::::::::::::::::::::::::::::: 5

1.3 Situación actual :::::::::::::::::::::::::::::::: 6

1.4 Conceptos básicos de control predictivo ::::::::::::::::::: 7

1.5 Estrategia de los controladores :::::::::::::::::::::::: 8

2 Controladores predictivos 11

2.1 Elementos básicos ::::::::::::::::::::::::::::::: 11

2.1.1 Modelo de predicción ::::::::::::::::::::::::: 11

2.1.2 Función objetivo :::::::::::::::::::::::::::: 15

2.1.3 Obtención de la ley de control :::::::::::::::::::: 18

2.2 Revisión de los principales algoritmos :::::::::::::::::::: 18

2.3 Estado de la tecnologı́a :::::::::::::::::::::::::::: 23

3 Algoritmos 25

3.1 Dynamic Matrix Control ::::::::::::::::::::::::::: 25

3.1.1 Predicción ::::::::::::::::::::::::::::::: 25

i
ii Índice general

3.1.2 Perturbaciones medibles ::::::::::::::::::::::: 27

3.1.3 Algoritmo de control ::::::::::::::::::::::::: 28

3.2 Control Predictivo Generalizado ::::::::::::::::::::::: 31

3.2.1 Formulación del Control Predictivo Generalizado ::::::::: 32

3.2.2 Ejemplo de cálculo ::::::::::::::::::::::::::: 36

3.2.3 Caso multivariable ::::::::::::::::::::::::::: 38

4 Restricciones en Control Predictivo 41

4.1 Tratamiento convencional de restricciones :::::::::::::::::: 41

4.2 Restricciones en Control Predictivo ::::::::::::::::::::: 42

4.3 Resolución del problema ::::::::::::::::::::::::::: 44

4.4 Gestión de restricciones :::::::::::::::::::::::::::: 45

4.4.1 Técnicas de búsqueda de soluciones factibles :::::::::::: 46

5 Tendencias actuales y nuevas perspectivas 51

5.1 Multiobjetivo. Jerarquı́a de objetivos ::::::::::::::::::::: 51

5.1.1 Jerarquı́a de objetivos ::::::::::::::::::::::::: 53

5.2 Control predictivo no lineal :::::::::::::::::::::::::: 54

5.2.1 Diferencias respecto al método lineal :::::::::::::::: 56

5.2.2 Fundamentos teóricos ::::::::::::::::::::::::: 56

5.2.3 Problemática asociada al NMPC :::::::::::::::::::: 57

5.2.4 Modelos :::::::::::::::::::::::::::::::: 61

5.2.5 Otras formulaciones del problema :::::::::::::::::: 64

5.2.6 Resolución del problema. Productos comerciales :::::::::: 66

5.2.7 Necesidades futuras :::::::::::::::::::::::::: 68

Bibliografı́a 69
Tema 1

Fundamentos

1.1 Tendencias actuales en control de procesos

Aunque en el pasado podı́a considerarse que el único objetivo del control consistı́a en
mantener una operación estable del proceso, actualmente la industrias se enfrentan a
un mercado cambiante y difı́cil de predecir, lo que les obliga a operar sus procesos
productivos en consonancia con la evolución del mercado para poder mantenerse
competitivas y rentables.

La competencia en muchos sectores industriales ası́ como el creciente interés social


por los problemas medioambientales relacionados con los procesos de producción
provoca la necesidad de disponer de técnicas fiables que permitan la operación del
proceso con gran eficiencia y alto grado de flexibilidad.

Actualmente los sistemas de control en la industria de procesos deben satisfacer


criterios económicos, asociados con el mantenimiento de las variables de proceso en sus
referencias minimizando dinámicamente una función de coste de operación, criterios
de seguridad y medioambientales, y de calidad en la producción, la cual debe satisfacer
ciertas especificaciones sujetas a una demanda normalmente variable.

Por ello, se puede considerar que en la actualidad el objetivo de todo sistema de


control consiste en actuar sobre las variables manipuladas de forma que puedan satis-
facerse múltiples y cambiantes criterios de funcionamiento (económicos, de seguridad,
medioambientales o de calidad) en presencia de cambios en las caracterı́sticas del pro-
ceso.

El amplio abanico de metodologı́as actuales de control de procesos se enfrenta al


cumplimiento de este objetivo. La diferencia entre las diversas técnicas radica bási-
camente en los compromisos hechos en la formulación matemática de los criterios de
funcionamiento y en la elección de la manera de representar el proceso. La represen-

1
2 Tendencias actuales en control de procesos

1983 (%) 1989 (%) 1995 (%)


Retardo 24 Retardo 23 Interacción 24
Perturbaciones 21 Interacción 16 Perturbaciones 22
Interacción 17 Perturbaciones 15 Retardo 21
Respuesta 16 Cambios 12 Cambios 14
Estabilidad 11 No lineal 10 No lineal 7

Tabla 1.1: Principales problemas de control

tación matemática de muchos de estos criterios se lleva a cabo en la forma de funciones


objetivo dinámicas y de restricciones mientras que el proceso se representa como un
modelo dinámico con incertidumbres asociadas. La importancia de las incertidum-
bres está siendo cada vez más reconocida y por tanto incluida explı́citamente en la
formulación de los controladores.

Las técnicas de Control Predictivo Basado en Modelo (Model Based Predictive


Control, MPC) parecen constituir unas poderosas herramientas para afrontar estos retos.
MPC, en su forma más general, acepta cualquier tipo de modelos, funciones objetivo o
restricciones, siendo la metodologı́a que actualmente puede reflejar más directamente
los múltiples criterios de funcionamiento relevantes en la industria de procesos. Quizás
sea ésta la principal razón del éxito de estas técnicas en numerosas aplicaciones de la
industria de procesos, unida a que es la forma más general de formular el problema de
control en el dominio del tiempo, de manera que puede resultar fácil de aceptar por el
personal de la industria.

Los resultados de un estudio realizado por Takatsu et al. para la Society of Instru-
mentation and Control Engineering [19] son indicativos de las necesidades futuras de
la industria en el ámbito del control. En este informe se analizan los principales proble-
mas de control que se encuentran en la industria de procesos, el estado de aplicación
de las tecnologı́as avanzadas, el grado de satisfacción de los usuarios con cada una de
ellas y las expectativas que cada una genera.

La evolución en los últimos años de los principales problemas de control para los
usuarios se muestra en la tabla 1.1.

Obsérvese que los tres primeros problemas siguen siendo los mismos en los tres
años que se ha realizado la encuesta y parece que a lo largo del tiempo se resuelven
problemas básicos como estabilidad y respuesta y se atacan problemas más difı́ciles
como dinámica no lineal. Como se verá más adelante, el Control Predictivo es una
metodologı́a capaz de ofrecer soluciones a todos estos problemas.

También resulta interesante analizar los factores claves de éxito y fracaso de la


automatización del proceso (1.2 y 1.3). De estas tablas se desprende que la elección de
la estrategia de control no es el único factor a tener en cuenta para garantizar un buen
Fundamentos 3

Selección de la estrategia de control 14 %


Selección del equipo de control 12 %
Especificaciones apropiadas 10 %
Configuración flexible del sistema 10 %
Operación de emergencia 10 %
Interface con el operario 8%
Análisis de proceso 8%

Tabla 1.2: Principales factores claves de éxito

Ausencia de análisis del proceso. Inexactitud del modelo 21 %


Selección de los sensores 14 %
Falta de rechazo a las perturbaciones 10 %
Selección de la estrategia de control 7%
Selección de los actuadores 6%
Selección del equipo de control 5%
Especificaciones inapropiadas 5%
Configuración rı́gida del sistema 5%

Tabla 1.3: Principales factores claves de fracaso

funcionamiento del sistema de control.

Del informe citado se pueden extraer conclusiones interesante sobre el estado y el


grado de aceptación de las tecnologı́as consideradas avanzadas (ver tabla 1.4). En ella
se muestra el porcentaje de plantas que usaron cada técnica en 1989 y 1995. Obsérvese
que todas crecieron excepto el control adaptativo y el autoajuste que tuvieron un ligero
descenso.

Con el fin de evaluar el grado de satisfacción del usuario con las distintas técnicas,
se muestra en la tabla 1.5 el porcentaje de usuarios que están satisfechos con cada una
de las técnicas que han empleado. Como conclusión interesante destaca el hecho de
que prácticamente todos los usuarios de Control Predictivo están satisfechos.

También resulta interesante intentar cuantificar la evolución futura de las distintas


técnicas. Para ello, la figura 1.1 intenta mostrar las posibilidades técnicas y las expec-
tativas despertadas por cada una de ellas. Posibilidad técnica se refiere a la facilidad
de implementación y expectativas al efecto esperado de uso de cada técnica. El punto
de partida de cada flecha es la media de todas las respuestas a la encuesta, mientras
que su extremo corresponde a la media de las 15 plantas consideradas lı́deres en temas
de control. El citado artı́culo interpreta la flecha como tendencia futura. Según esto,
el PID avanzado, compensación de retardo, borroso, desacoplo y MPC serán técnicas
4 Tendencias actuales en control de procesos

Técnica 1989 1995


Compensación de retardo 29.6 52.4
Borroso 9.9 38
Control Predictivo 25.4 37.2
Gain-scheduling 25.7 32.5
PID avanzado 24.8 29.4
Autoajuste 32.2 29.1
Desacoplo 17.5 28.6
Basado en reglas 6.3 17.9
Filtro de Kalman 9.1 15.5
Neuronal 0 11.8
LQ 8.2 11
Observador 8.2 9.8
Control adaptativo 10.3 7
H1 0 9.3

Tabla 1.4: Estado de las distintas técnicas

Técnica 1989 1995


Control Predictivo 76 94
PID avanzado 77 89
Compensación de retardo 72 89
Gain-scheduling 78 87
Borroso 67 83
LQ 79 70
Neuronal - 69
Desacoplo 64 66
Filtro de Kalman 70 66
Autoajuste 60 65
Observador 67 62
Basado en reglas 43 61
Control adaptativo 50 56
H1 - 50

Tabla 1.5: Grado de satisfacción de las distintas técnicas


Fundamentos 5

ampliamente usadas con grandes expectativas. El control neuronal despierta grandes


expectativas pero tiene ciertas dificultades de implementación, mientras que el Autoa-
juste se implementa con facilidad pero pierde expectativas. Las técnicas como LQR,
filtro de Kalman, H1 o adaptativo se mantienen como "sin demasiadas expectativas y
no fácilmente implementables".

MPC

Retardo

Borroso

PID
Expectativas

Adaptativo
Neuronal

Hoo
Desacoplo
LQ Auto
ajuste
F. Kalman

Deslizante

Posibilidades técnicas

Figura 1.1: Expectativas y posibilidades técnicas

Este estado actual y futuras tendencias en el campo del control de procesos indus-
triales indican que el Control Predictivo Basado en Modelo se puede considerar una
tecnologı́a suficientemente introducida en la industria y que además sigue despertando
muchas expectativas. Estos hechos, unidos a la existencia de campos abiertos tanto en
investigación como en temas relacionados con la implementación justifica un estudio
más detallado de esta tecnologı́a.

1.2 Perspectiva histórica

El Control Predictivo se desarrolló en base a dos lı́neas básicas. Por un lado, a finales
de los años setenta surgieron diversos algoritmos que usaban explı́citamente un mo-
delo dinámico del proceso para predecir el efecto de las acciones de control futuras
en la salida, las cuales eran determinadas minimizando el error predicho sujeto a res-
tricciones de operación. La optimización se repetı́a en cada instante de muestreo con
información actualizada del proceso. Estas formulaciones eran de naturaleza heurı́stica
6 Situación actual

y algorı́tmica e intentaban aprovechar el creciente potencial de los computadores digi-


tales por aquélla época.

Rápidamente el MPC adquirió gran popularidad en las industrias de procesos


quı́micos principalmente debido a la simplicidad del algoritmo y al uso del modelo
de respuesta impulsional o en escalón, que aunque posea muchos más parámetros
que las formulaciones en el espacio de estados o función de transferencia suele ser
preferido por ser intuitivo y necesitar menos información a priori para identificar. La
mayorı́a de las aplicaciones fueron llevadas a cabo sobre sistemas multivariables in-
cluyendo restricciones. Los algoritmos utilizados fueron principalmente el IDCOM
(Identification-Command) y el DMC (Control con Matriz Dinámica, Dynamic Matrix
Control).

Independientemente fue surgiendo otra lı́nea de trabajo en torno a las ideas del con-
trol adaptativo, desarrollando estrategias esencialmente para procesos monovariables
formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del
Controlador de Mı́nima Varianza y se desarrolló el Control Predictivo Generalizado
(Generalized Predictive Control GPC) que es uno de los métodos más populares en la
actualidad.

1.3 Situación actual

La situación actual de aplicaciones de MPC en la industria está bien reflejada en la re-


copilación de Qin y Badgwell [16], que recoge unas 2200 aplicaciones, principalmente
en el sector petroquı́mico (desde entonces el número de aplicaciones puede estimarse
en torno a las 3000). La mayorı́a de las aplicaciones son en procesos multivariables,
registrándose casos como un controlador con 40 entradas y 80 salidas. Sorprendente-
mente, MPC ha tenido menor impacto en otro tipo de industrias, aunque estudios de
1993 sugieren que unas 20.000 aplicaciones podrı́an beneficiarse de esta técnica.

El éxito actual del MPC en la industria se debe a tres razones principales:

 La incorporación de un modelo explı́cito del proceso en los cálculos permite al


controlador tratar con todas las caracterı́sticas importantes de la dinámica del
proceso.

 La consideración del comportamiento del proceso a lo largo de un horizonte


futuro permite tener en cuenta el efecto de las perturbaciones en realimentación
y pre-alimentación, permitiendo al controlador conducir la salida a la trayectoria
de referencia deseada.

 La consideración de restricciones en la fase del diseño del controlador evita en


lo posible su violación, resultando en un control más preciso en torno al punto
Fundamentos 7

óptimo de operación. La inclusión de restricciones es quizás la caracterı́stica que


más distingue al MPC respecto a otras metodologı́as.

Otra de las razones que han contribuido a que el MPC se haya convertido en un éxito
comercial es el hecho de que existen unos 15 suministradores que instalan el producto
llave en mano, con periodos de amortización de entre 3 y 12 meses, permitiendo
que medianas empresas puedan tener acceso a esta tecnologı́a. Aparte de esto, los
nuevos Sistemas de Control Distribuido empiezan a ofertar productos MPC genéricos
que ofrecen al usuario la posibilidad de realizar futuras modificaciones sin depender
de un producto cerrado.

1.4 Conceptos básicos de control predictivo

El Control Predictivo Basado en Modelo, Model (Based) Predictive Control (MBPC ó


MPC) constituye un campo muy amplio de métodos de control desarrollados en torno
a ciertas ideas comunes e integra diversas disciplinas como control óptimo, control
estocástico, control de procesos con tiempos muertos, control multivariable o control
con restricciones.

El Control Predictivo no es una estrategia de control especı́fica, sino que se trata


más bien de un campo muy amplio de métodos de control desarrollados en torno a
ciertas ideas comunes. Estos métodos de diseño conducen a controladores lineales que
poseen prácticamente la misma estructura y presentan suficientes grados de libertad.
Las ideas que aparecen en mayor o menor medida en toda la familia de controladores
predictivos son básicamente:

 Uso explı́cito de un modelo para predecir la salida del proceso en futuros instantes
de tiempo (horizonte).
 Cálculo de las señales de control minimizando una cierta función objetivo.
 Estrategia deslizante, de forma que en cada instante el horizonte se va despla-
zando hacia el futuro, lo que implica aplicar la primera señal de control en cada
instante y desechar el resto, repitiendo el cálculo en cada instante de muestreo.

Los distintos algoritmos de MPC difieren entre sı́ casi exclusivamente en el modelo
usado para representar el proceso y los ruidos y en la función de coste a minimizar.
Aunque las diferencias puedan parecer pequeñas a priori, pueden provocar distintos
comportamientos en bucle cerrado, siendo crı́ticas para el éxito de un determinado
algoritmo en una determinada aplicación.

El Control Predictivo es un tipo de control de naturaleza abierta dentro del cual se


han desarrollado muchas realizaciones, encontrando gran aceptación tanto en aplica-
ciones industriales como en el mundo académico. En la actualidad existen numerosas
8 Estrategia de los controladores

aplicaciones de controladores predictivos funcionando con éxito, tanto en la industria


de procesos como en control de motores o Robótica. El buen funcionamiento de estas
aplicaciones muestra la capacidad del MPC para conseguir sistemas de control de ele-
vadas prestaciones capaces de operar sin apenas intervención durante largos perı́odos
de tiempo.

El MPC presenta una serie de ventajas sobre otros métodos, entre las que destacan:

 Resulta particularmente atractivo para personal sin un conocimiento profundo


de control, puesto que los conceptos resultan muy intuitivos, a la vez que la
sintonización es relativamente fácil.

 Puede ser usado para controlar una gran variedad de procesos, desde aquéllos con
dinámica relativamente simple hasta otros más complejos incluyendo sistemas
con grandes retardos, de fase no mı́nima o inestables.

 Permite tratar con facilidad el caso multivariable.

 Posee intrı́nsecamente compensación del retardo.

 Resulta conceptualmente simple la extensión al tratamiento de restricciones, que


pueden ser incluidas de forma sistemática durante el proceso de diseño.

 Es muy útil cuando se conocen las futuras referencias (robótica o procesos en


batch).

 Es una metodologı́a completamente abierta basada en algunos principios básicos


que permite futuras extensiones.

Pero, lógicamente, también presenta inconvenientes. Unos de ellos es la carga


de cálculo necesaria para la resolución de algunos algoritmos. Pero quizás el mayor
inconveniente venga marcado por la necesidad de disponer de un modelo apropiado del
proceso. El algoritmo de diseño está basado en el conocimiento previo del modelo y es
independiente de éste, pero resulta evidente que las prestaciones obtenidas dependerán
de las discrepancias existentes entre el proceso real y el modelo usado.

1.5 Estrategia de los controladores

La metodologı́a de todos los controladores pertenecientes a la familia del MPC se carac-


teriza por la estrategia siguiente, representada en la figura 1.2:

1. En cada instante t y haciendo uso del modelo del proceso se predicen las futuras
salidas para un determinado horizonte N , llamado horizonte de predicción. Estas
Fundamentos 9

u(t+k|t)

u(t)

^y(t+k|t)
y(t)
N

t-1 t t+1 ... t+k ... t+N

Figura 1.2: Estrategia del Control Predictivo

salidas predichas, ŷ (t + k j t)1 para k = 1 : : : N dependen de los valores conocidos


hasta el instante t (entradas y salidas pasadas) y de las señales de control futuras
u(t + k j t), k = 0 : : : N ; 1 que se pretenden mandar al sistema y que son las que
se quieren calcular.
2. El conjunto de señales de control futuras se calcula optimizando un determinado
criterio en el que se pretende mantener el proceso lo más próximo posible a la
trayectoria de referencia w (t + k ) (que puede ser directamente el setpoint o una
suave aproximación a éste). Este criterio suele tomar la forma de una función
cuadrática de los errores entre la salida predicha y la trayectoria de referencia
también predicha, incluyendo en muchos casos el esfuerzo de control. Si el criterio
es cuadrático, el modelo lineal y no existen restricciones se puede obtener una
solución explı́cita, en otro caso se debe usar un método iterativo de optimización.
Adicionalmente se hace alguna suposición sobre la estructura de la ley de control
futura, como por ejemplo que va a ser constante a partir de cierto instante.
3. La señal de control u(t j t) es enviada al proceso mientras que las siguientes
señales de control calculadas son desechadas, puesto que en el siguiente instante
de muestreo ya se conoce y (t + 1) y se repite el paso 1 con este nuevo valor y
todas las secuencias son actualizadas. Se calcula por tanto u(t + 1 j t + 1) (que en
principio será diferente al u(t + 1 j t) al disponer de nueva información), haciendo
uso del concepto de horizonte deslizante.

Para llevar a cabo esta estrategia, se usa una estructura como la mostrada en la
figura 1.3. Se hace uso de un modelo para predecir las salidas futuras del proceso,
1
la notación indica el valor de la variable en el instante t + k calculado en el instante t.
10 Estrategia de los controladores

Entradas y salidas Trayectoria


Salidas de referencia
pasadas predichas +
Modelo
-

Controles
futuros

Optimizador
Errores futuros

Funcion de coste Restricciones

Figura 1.3: Estructura básica del MPC

basándose en las futuras señales de control propuestas. Estas señales son calculadas
por el optimizador teniendo en cuenta la función de coste (donde aparece el futuro error
de seguimiento) ası́ como las restricciones. Por tanto el modelo juega un papel decisivo
en el controlador. El modelo elegido debe ser capaz de capturar la dinámica del proceso
para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo de usar
y de comprender.

El optimizador es otra parte fundamental de la estrategia pues proporciona las


acciones de control. Si la función de coste es cuadrática, el mı́nimo se puede obtener
como una función explı́cita de las entradas y salidas pasadas y de la trayectoria de
referencia. Sin embargo, cuando existen restricciones de desigualdad la solución debe
ser calculada por métodos numéricos con más carga de cálculo.
Tema 2

Controladores predictivos

2.1 Elementos básicos

Todos los controladores predictivos poseen elementos comunes y para cada uno de
estos elementos se pueden elegir diversas opciones, dando lugar a distintos algoritmos.
Estos elementos son:

 Modelo de predicción

 Función objetivo

 Obtención de la ley de control

2.1.1 Modelo de predicción

La piedra angular del MPC es el modelo; un diseño completo debe incluir los me-
canismos necesarios para la obtención del mejor modelo posible, el cual debe ser lo
suficientemente rico para capturar al maximo la dinámica del proceso y debe ser ca-
paz de permitir el cálculo de las predicciones a la vez que sea intuitivo y permita un
análisis teórico. El uso del modelo del proceso viene determinado por la necesidad del
cálculo de la salida predicha en instantes futuros ŷ (t + k j t). Las diferentes estrategias
de MPC pueden usar distintos modelos para representar la relación de las salidas con
las entradas medibles, algunas de las cuales serán variables manipuladas y otras se
pueden considerar como perturbaciones medibles, que pueden ser compensadas por
acción feedforward. Además se tendrá en cuenta un modelo de las perturbaciones, para
intentar describir el comportamiento que no aparece reflejado en el modelo del pro-
ceso, englobándose aquı́ el efecto de las entradas no medibles, el ruido y los errores de
modelado.

11
12 Elementos básicos

Para el estudio se puede separar el modelo en dos partes: el modelo del proceso
propiamente dicho y el modelo de las perturbaciones. Cualquier método usará ambas
partes para la predicción.

Modelo del Proceso

Casi todas las formas posibles de modelar un proceso aparecen en alguna formu-
lación de MPC siendo las más usadas las siguientes:

 Respuesta impulsional. También conocida por secuencia de ponderación o mo-


delo de convolución. La salida viene relacionada con la entrada por la ecuación
1
X
y(t) = hiu(t ; i)
i=1
donde hi son los valores muestreados obtenidos al someter al proceso a un impulso
unitario de amplitud igual al perı́odo de muestreo (ver figura 2.1a). Esta suma
es truncada y sólo se consideran N valores (por tanto sólo permite representar
procesos estables y sin integradores), teniendo
X
N
y(t) = hi u(t ; i) = H (z;1)u(t) (2:1)
i=1
donde H (z ;1 ) = h1 z ;1 + h2 z ;2 +    + hN z ;N . Un inconveniente de este método es
el gran número de parámetros que necesita, ya que N suele ser un valor elevado
(del orden de 40-50). La predicción vendrá dada por:
X
N
ŷ(t + k j t) = hi u(t + k ; i j t) = H (z;1)u(t + k j t)
i =1
Este método es ampliamente aceptado en la práctica industrial debido a que
es muy intuitivo y no requiere información previa sobre el proceso, con lo que
el procedimiento de identificación se simplifica, a la vez que permite describir
fácilmente dinámicas complejas como fase no mı́nima o retardos.
 Respuesta ante escalón. Es muy similar al anterior sólo que ahora la señal de
entrada es un escalón. Para sistemas estables se tiene la respuesta truncada que
será
XN
y(t) = y0 + gi 4 u(t ; i) = y0 + G(z;1)(1 ; z;1 )u(t) (2:2)
i=1
donde las gi son los valores muestreados ante la entrada en escalón y 4u(t) =
u(t) ; u(t ; 1), según se muestra en la figura 2.1b. El valor de y0 puede tomarse 0
sin pérdida de generalidad, con lo cual el predictor será:
X
N
ŷ(t + k j t) = gi 4 u(t + k ; i j t)
i=1
Este método presenta las mismas ventajas e inconvenientes que el anterior.
Controladores predictivos 13

h2

N
i

g
g
hi
h1

g2
hN
y(t) y(t)

g1
t t+1 t+2 ... t+N t t+1 t+2 ... t+N
a) b)

Figura 2.1: Respuesta impulsional y ante escalón

 Función de transferencia. Se utiliza el concepto de función de transferencia


G = B=A con lo que la salida viene dada por:
A(z;1 )y(t) = B (z;1 )u(t)

A( z ; 1 ) = 1 + a1 z ;1 + a2 z ;2 +    + ana z ;na
B (z ;1 ) = b1 z;1 + b2 z;2 +    + bnb z;nb
Por tanto la predicción vendrá dada por

B (z ;1 )
ŷ(t + k j t) = A(z;1 ) u(t + k j k)
Esta representación es válida también para procesos inestables y posee la ventaja
de necesitar pocos parámetros, aunque es fundamental un conocimiento a priori
del proceso sobre todo en cuanto al orden de los polinomios A y B .

 Espacio de estados. Tiene la siguiente representación:

x(t) = Ax(t ; 1) + Bu(t ; 1)


y(t) = Cx(t)
siendo x el estado y A, B y C las matrices del sistema, de entrada y de salida
respectivamente. Para este modelo la predicción viene dada por

X
k
ŷ(t + k j t) = C x̂(t + k j t) = C Ak x(t) + Ai;1Bu(t + k ; i j t)]
i=1
14 Elementos básicos

Posee la ventaja de que sirve también para sistemas multivariables a la vez que
permite analizar la estructura interna del proceso (aunque a veces los estados
obtenidos al discretizar no tienen ningún significado fı́sico). Los cálculos pueden
ser complicados, con la necesidad adicional de incluir un observador si los estados
no son accesibles.

Modelo de las perturbaciones

De tanta importancia como la elección de un determinado modelo del proceso


es la elección del modelo utilizado para representar la perturbaciones. Un modelo
bastante extendido es el Autorregresivo Integrado de Media Móvil (Auto-Regressive
and Integrated Moving Average, ARIMA), en el que las perturbaciones, es decir, las
diferencias entre la salida medida y la calculada por el modelo vienen dadas por

(z ;1 )e(t)
n(t) = C D (z ;1 )

donde el polinomio D (z;1 ) incluye explı́citamente el integrador 4 = 1 ; z;1 , e(t) es


un ruido de media cero y normalmente el polinomio C se considera igual a uno. Este
modelo se considera apropiado para dos tipos de perturbaciones: cambios aleatorios
ocurridos en instantes aleatorios (por ejemplo cambio en la calidad del material) y
movimiento browniano (en procesos con balance de energı́a) y es usado en varios
métodos. Nótese que al incluir un integrador se consigue un control con error nulo en
régimen permanente (offset-free).

Como caso particular del ARIMA se puede incluir la perturbación constante

n(t) = 1 ;e(tz);1
cuya mejor predicción será n̂(t + k j t) = n(t).

Respuestas libre y forzada

Una caracterı́stica tı́pica de la mayorı́a de los controladores MPC es el empleo de los


conceptos de repuesta libre y forzada. La idea es expresar la secuencia de acciones de
control como la suma de dos señales:

u(t) = uf (t) + uc(t)


La señal uf (t) corresponde a las entradas pasadas (anteriores al instante t) y en el futuro
se mantiene constante e igual al último valor de la variable manipulada. Es decir,

uf (t ; j ) = u(t ; j ) para j = 1 2   
uf (t + j ) = u(t ; 1) para j = 0 1 2   
Controladores predictivos 15

La señal uc (t) vale cero en el pasado y corresponde a las señales de control en los
instantes futuros:

uc(t ; j ) = 0 para j =1 2   


uc(t + j ) = u(t + j ) ; u(t ; 1) para j = 0 1 2   

La predicción de la secuencia se salida se separa en dos partes, como se ve en la


figura 2.2. Una de ellas (yf (t)), la respuesta libre, corresponde a la predicción de la
salida cuando la variable manipulada se hace igual a uf (t), y la otra, la repuesta forzada
(yc (t)), corresponde a la predicción de la salida cuando la señal de control es uc (t).
La respuesta libre corresponde a la evolución del proceso debido a su estado actual
(incluido por tanto el efecto de acciones pasadas) mientras que la respuesta forzada es
la debida a las acciones de control futuras.

u y
Process

t t

u uc y yc
f f

t t t t

Figura 2.2: Respuestas libre y forzada

2.1.2 Función objetivo

Los diversos algoritmos de MPC proponen distintas funciones de coste para la obtención
de la ley de control. En general se persigue que la salida futura en el horizonte
considerado siga a una determinada señal de referencia al mismo tiempo que se puede
penalizar el esfuerzo de control requerido para hacerlo. La expresión general de tal
función objetivo será:

X
N 2 X
Nu
J (N1  N2 Nu) = (j )ŷ(t + j j t) ; w(t + j )]2 + (j )4u(t + j ; 1)]2 (2:3)
j =N1 j =1

En algunos métodos el segundo sumando, que considera el esfuerzo de control, no


se tiene en cuenta, mientras que en otros también aparecen directamente los valores de
la señal de control (no sus incrementos). En la función de coste se pueden considerar:
16 Elementos básicos

 Parámetros: N1 y N2 son los horizontes mı́nimo y máximo de coste (o de pre-


dicción) y Nu es el horizonte de control, que no tiene por qué coincidir con el
horizonte máximo, como se verá posteriormente. El significado de N1 y N2 re-
sulta bastante intuitivo: marcan los lı́mites de los instantes en que se desea que
la salida siga a la referencia. Ası́, si se toma un valor grande de N1 es porque
no importa que haya errores en los primeros instantes, lo cual provocará una
respuesta suave del proceso. Nótese que para procesos con tiempo muerto d no
tiene sentido que N1 sea menor que dicho valor puesto que la salida no empezará
a evolucionar hasta el instante t + d. Además, si el proceso es de fase no mı́nima,
este parámetro permite eliminar de la función objetivo los primeros instantes de
respuesta inversa.
Los coeficientes  (j ) y (j ) son secuencias que ponderan el comportamiento fu-
turo. Usualmente se consideran valores constantes o secuencias exponenciales.
Por ejemplo se puede conseguir un peso exponencial de  (j ) a lo largo del hori-
zonte usando:
(j ) = N2;j
Si  está comprendido entre 0 y 1 indica que se penaliza más a los errores más
alejados del instante t que a los más próximos, dando lugar a un control más
suave y con menor esfuerzo. Si, por el contrario,  > 1 es que se penalizan más
los primeros errores, provocando un control más brusco.
Todos estos valores pueden ser usados como parámetros de sintonización, ob-
teniendo un abanico muy amplio de posibilidades con las que se puede cubrir
una extensa gama de opciones, desde un control estándar hasta una estrategia
diseñada a medida para un proceso en particular.
 Trayectoria de referencia: Una de las ventajas del control predictivo es que si
se conoce a priori la evolución futura de la referencia, el sistema puede empezar
a reaccionar antes de que el cambio se haya efectivamente realizado, evitando
los efectos del retardo en la respuesta del proceso. En muchas aplicaciones la
evolución futura de la referencia r(t + k ) es conocida de antemano, como en
Robótica, servos o procesos en batch; en otras aplicaciones aunque la referencia sea
constante, se puede conseguir una sensible mejora de prestaciones simplemente
conociendo el instante de cambio de valor y adelantándose a esa circunstancia.
En el criterio de minimización (2.3), la mayorı́a de los métodos suelen usar una
trayectoria de referencia w(t + k ) que no tiene por qué coincidir con la referencia
real. Normalmente será una suave aproximación desde el valor actual de la salida
y(t) a la referencia conocida mediante un sistema de primer orden:
w(t) = y(t) w(t + k) = w(t + k ; 1) + (1 ; )r(t + k) k = 1 : : : N (2:4)
 es un parámetro comprendido entre 0 y 1 (mientras más próximo a 1 más
suave será la aproximación) que constituye un valor ajustable que influirá en
la respuesta dinámica del sistema. En la figura 2.3 se muestra la forma de la
trayectoria cuando la referencia r (t + k) es constante y para dos valores distintos
de ; para valores pequeños de este parámetro se tiene un seguimiento rápido
Controladores predictivos 17

(w1 ) mientras que si aumenta, la trayectoria de referencia será w2 dando lugar a


una respuesta más suave.

r(t+k)

w1(t+k)
w2 (t+k)

y(t)

Figura 2.3: Trayectoria de referencia

 Restricciones: En la práctica, todos los procesos están sujetos a restricciones. Los


actuadores tienen un campo limitado de acción ası́ como una determinada ve-
locidad de cambio (slew rate), como es el caso de las válvulas, limitadas por las
posiciones de totalmente abierta o cerrada y por la velocidad de respuesta. Razo-
nes constructivas, de seguridad o medioambientales o bien los propios alcances de
los sensores pueden causar lı́mites en las variables de proceso, tales como niveles
en depósitos, caudales en tuberı́as o temperaturas y presiones máximas. Además,
normalmente las condiciones de operación vienen definidas por la intersección
de ciertas restricciones por motivos fundamentalmente económicos, con lo que el
sistema de control operará cerca de los lı́mites. Todo lo expuesto anteriormente
hace necesaria la introducción de restricciones en la función a minimizar.

Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo


cual han tenido gran éxito en la industria. Normalmente se considerarán lı́mites
en la amplitud y el slew rate de la señal de control y lı́mites en las salidas:

umin  u(t)  umax 8t


dumin  u(t) ; u(t ; 1)  dumax 8t
ymin  y(t)  ymax 8t

con la adición de estas restricciones a la función objetivo, la minimización resulta


más compleja, no pudiendo obtenerse la solución analı́ticamente como en el caso
sin restringir.
18 Revisión de los principales algoritmos

2.1.3 Obtención de la ley de control

Para obtener los valores u(t + k j t) será necesario minimizar la funcional J de la


ecuación (2.3). Para ello se calculan los valores de las salidas predichas ŷ (t + k j t)
en función de valores pasados de entradas y salidas y de señales de control futuras,
haciendo uso del modelo que se haya elegido y se sustituyen en la función de coste,
obteniendo una expresión cuya minimización conduce a los valores buscados. Para el
criterio cuadrático si el modelo es lineal y no existen restricciones se puede obtener una
solución analı́tica, en otro caso se debe usar un método iterativo de optimización.

De cualquiera de las maneras la obtención de la solución no resulta trivial pues


existirán N2 ; N1 + 1 variables independientes, valor que puede ser elevado (del orden
de 10 a 30). Con la idea de reducir estos grados de libertad se puede proponer cierta
estructura a la ley de control. Además se ha encontrado que esta estructuración de la
ley de control produce una mejora en la robustez y en el comportamiento general del
sistema, debido fundamentalmente a que el hecho de permitir la libre evolución de
las variables manipuladas (sin estructurar) puede conducir a señales de control de alta
frecuencia no deseables y que en el peor de los casos podrı́an conducir a la inestabilidad.

Esta estructura de la ley de control se plasma en el uso del concepto de horizonte de


control (Nu), que consiste en considerar que tras un cierto intervalo Nu < N2 no hay
variación en las señales de control propuestas, es decir:

4u(t + j ; 1) = 0 j > Nu
lo cual es equivalente a dar pesos infinitos a las cambios en el control a partir de cierto
instante. El caso lı́mite serı́a considerar Nu igual a 1 con lo que todas las acciones
futuras serı́an iguales a u(t)1 .

2.2 Revisión de los principales algoritmos

Se presentan a continuación los principales algoritmos de control predictivo, mostrando


sus principales caracterı́sticas pero sin entrar en detalles. Se pueden encontrar estudios
comparativos en [10], [7], [11] y [16]. En el tema siguiente se estudiarán en detalle los
dos métodos considerados más representativos: DMC y GPC.

Dynamic Matrix Control

Este método usa la respuesta ante escalón (2.2) para modelar el proceso, considerando
sólo los N primeros términos, asumiendo por tanto que el proceso es estable. En
1
Recuérdese que debido al horizonte deslizante, la señal de control se recalcula en el siguiente
muestreo.
Controladores predictivos 19

cuanto a las perturbaciones, se considera que su valor permanence constante e igual al


existente en el instante actual durante todo el horizonte, es decir, igual al valor medido
de la salida (ym ) menos el estimado por el modelo ŷ (t j t)).

n̂(t + k j t) = n̂(t j t) = ym(t) ; ŷ(t j t)


y por tanto el valor predicho de la salida será:

X
k X
N
ŷ(t + k j t) = gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + n̂(t + k j t)
i=1 i=k+1

donde el primer término contiene las acciones de control futuras (que serán calculadas),
el segundo los valores pasados de las acciones de control (conocidas) y el último
representa las perturbaciones. La función de coste puede considerar sólo errores futuros
o incluir también el esfuerzo de control, en cuyo caso toma la forma genérica (2.3).

Una de las caracterı́sticas de este método que lo ha hecho muy popular en la industria
es la inclusión de restricciones, que se traduce en inecuaciones de la forma genérica:

X
N
Cyij ŷ(t + k j t) + Cuij u(t + k ; i) + cj  0 j = 1 : : : Nc
i=1
En este caso la optimización debe ser numérica y se lleva a cabo en cada periodo de
muestreo, enviándose la señal u(t) y recalculando todo en el nuevo periodo de muestreo,
como en todos los métodos MPC. Los principales inconvenientes de este método son el
tamaño del modelo empleado y la imposibilidad de tratar procesos inestables.

Model Algorithmic Control

Este método se conoce también como Model Predictive Heuristic Control y el producto
comercial se llama IDCOM (Identification-Command). Es muy similar al DMC con la
diferencia principal de usar un modelo de respuesta impulsional (2.1). Introduce el
concepto de trayectoria de referencia como un sistema de primer orden que evoluciona
desde la salida actual al setpoint según una determinada constante de tiempo. La
varianza del error entre esta trayectoria y la salida es lo que marca la minimización de
la función objetivo. Las perturbaciones se pueden tratar como en el método anterior o
se pueden estimar según la siguiente expresión:

n̂(t + k j t) = n̂(t + k ; 1 j t) + (1 ; )(ym(t) ; ŷ(t j t))


con n̂(t j t) = 0.  es un parámetro ajustable (0   < 1) relacionado con el tiempo de
respuesta, el ancho de banda y la robustez del bucle cerrado [7]. El método también
considera restricciones en los actuadores, en las variables internas o en salidas secun-
darias.
20 Revisión de los principales algoritmos

Puntos de coincidencia

Figura 2.4: Puntos de coincidencia

Predictive Functional Control

Este controlador fue desarrollado por Richalet [18] para procesos rápidos. Emplea un
modelo en el espacio de estados, por lo que permite el manejo de procesos inestables, y
también la extensión al caso no lineal. Este esquema de control tiene dos caracterı́sticas
que lo distinguen del resto de controladores de la familia: el uso de puntos de coincidencia
y de funciones base.

El concepto de puntos de coincidencia (ver figura 2.4) se emplea para simplificar


los cálculos considerando sólo un subconjunto de puntos en el horizonte de predicción
hj , j = 1 : : :  nH . La salida deseada y la predicha deben coincidir en dichos puntos, no
en todo el horizonte de predicción.

La otra idea innovadora de este método es la parametrización de la señal de con-


trol como una combinación lineal de ciertas funciones base, que son elegidas según la
naturaleza del proceso y la referencia:

X
nB
u(t + k) = i(t)Bi(k)
i=1
Normalmente estas funciones son de tipo polinómico: escalones (B1 (k ) = 1), rampas
(B2 (k ) = k) o parábolas (B3 (k ) = k2 ), ya que la mayorı́a de referencias se pueden
especificar como combinación de estas funciones. Con esta estrategia, un perfil de
entrada complejo se puede especificar usando un pequeño número de parámetros
desconocidos i que son las incógnitas del problema de minimización.

La función a minimizar es:


X
nH
J= ŷ t hj ) ; w(t + hj )]2
 ( +
j =1

El algoritmo PFC también puede manejar restricciones de máximo y mı́nimo en la


aceleración, que son prácticas en aplicaciones de servocontrol.
Controladores predictivos 21

Extended Prediction Self Adaptive Control

El algoritmo EPSAC usa un modelo de función de transferencia

A(z;1 )y(t) = B (z;1 )u(t ; d) + v(t)


donde d es el retardo y v (t) la perturbación. Este modelo puede ampliarse para tratar
perturbaciones medibles añadiendo un término D (z;1 )d(t) para incluir efecto feedfor-
ward. La predicción se obtiene según se muestra en [10] y la estructura de la ley de
control es muy simple, ya que se considera que la señal de control permanecerá cons-
tante a partir del instante t (es decir, horizonte de control igual a 1): 4u(t + k ) = 0 para
k > 0. Para obtener la señal de control de minimiza una función de coste de la forma:
XN

(k)w(t + k) ; P (z;1)ŷ(t + k j t)]2
k=d
donde P (z ;1 ) es un polinomio de diseño con ganancia unitaria y
(k) es una secuencia
de ponderación. La señal de control se puede calcular analı́ticamente de la forma:
P
N
h
(k)w(t + k) ; P (z;1)ŷ(t + k j t)]
k
u(t) = k=d P
N

(k)h2 k
k=d
siendo hk los coeficientes de la respuesta impulsional del sistema.

Extended Horizon Adaptive Control

Esta formulación también emplea un modelo de función de transferencia y pretende


minimizar la discrepancia entre la salida calculada y la referencia en el instante t + N :
ŷ(t + N j t) ; w(t + N ), con N  d. La solución a este problema no es única (a menos
que N = d)[21]; una posible estrategia es considerar horizonte de control igual a 1:

4u(t + k ; 1) = 0 1<k N ;d

o minimizar el esfuerzo de control


;d
NX
J= u2(t + k)
k =0

Este método utiliza un predictor de N pasos de la forma

ŷ(t + N j t) = y(t) + F (z;1) 4 y(t) + E (z;1 )B (z;1 ) 4 u(t + N ; d)


donde E (z ;1 ) y F (z ;1 ) son polinomios que satisfacen la relación
;1 ;1 ;1 ;1 ;N F (z;1 )(1 ; z;1 )
(1 ; z ) = A(z )E (z )(1 ; z ) + z
22 Revisión de los principales algoritmos

con el grado de E igual a N ; 1. Una ventaja de este método es que se puede encontrar
fácilmente una solución explı́cita, dada por

u(t) = u(t ; 1) + 0(w(t + NNP


) ; ŷ (t + N j t))
;d 2
i
k=0
siendo k el coeficiente correspondiente a 4u(t + k) en la ecuación de predicción. Por
tanto la ley de control depende sólo de los parámetros del proceso y puede hacerse
fácilmente adaptativa si se emplea un identificador en lı́nea. El único coeficiente de
ajuste es el horizonte de predicción N , lo cual simplifica el uso pero proporciona poca
libertad para el diseño. Obsérvese que no puede usarse trayectoria de referencia porque
el error se considera sólo en un instante (t + N ), ni tampoco la ponderación del esfuerzo
de control.

Generalized Predictive Control

Este método propuesto por Clarke et al. [5] emplea un modelo CARIMA (Controlled
Auto-Regressive Integrated Moving Average) para la predicción de la salida:

A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1 ) e4


(t)

donde la perturbación viene dada por un ruido blanco coloreado por el polinomio
C (z;1 ). Como en la práctica es difı́cil encontrar el verdadero valor de este polinomio, se
puede emplear como parámetro de diseño para rechazo de perturbaciones o mejora de
la robustez. La predicción óptima se lleva a cabo resolviendo una ecuación diofántica,
lo cual puede hacerse eficazmente de forma recursiva.

Este algoritmo, al igual que otros que usan el modelo de función de transferen-
cia, se puede implementar fácilmente en forma adaptativa usando un algoritmo de
identificación en lı́nea como los mı́nimos cuadrados recursivos.

GPCusa una función de coste cuadrática de la forma


XN2 X
Nu
J (N1  N2 Nu) = (j )ŷ(t + j j t) ; w(t + j )]2 + (j )4u(t + j ; 1)]2
j =N1 j =1
donde las secuencia de ponderación  (j ) y (j ) se eligen normalmente constantes
o exponenciales y la trayectoria de referencia w (t + j ) se puede generar como una
secuencia que empieza en el valor actual de la salida y tiende exponencialmente al
setpoint.

Las bases teóricas del algoritmo GPC has sido ampliamente estudiadas y se puede
demostrar (ver [4]) que, para distintos conjuntos de parámetros, el algoritmo es estable
y que otros controladores como por ejemplo el dead beat son casos incluidos en éste.
Controladores predictivos 23

2.3 Estado de la tecnologı́a

Se puede considerar que productos como el MAC-IDCOM o el DMC están ampliamente in-
troducidos en la industria, proporcionando un buen control de sistemas multivariables
sin restricciones y constituyen la primera generación de controladores predictivos.

Sin embargo, la gestión de restricciones es algo que todavı́a no estaba bien resuelto
en estos productos hasta que apareció una versión de DMC denominada QDMC, ligera
variación del algoritmo básico en el que se consideran restricciones duras y blandas de
forma sistemática. Este algoritmo se suele considerar como la segunda generación.

Conforme la tecnologı́a MPC iba despertando mayor interés y aceptación, los proble-
mas que se abordaban eran cada vez más complejos, apareciendo nuevas problemáticas
como el tratamiento de la no-factibilidad, la consideración de modelos apropiados para
procesos inestables o la representación de la perturbación para la realimentación de otra
forma más adecuada que un valor constante. También se consideraba importante la
respuesta ante fallos, de forma que el controlador fuera capaz de reconfigurarse si se
perdiera alguna señal, o la dificultad de incluir diversos requerimientos de control en
una única función objetivo.

Estos problemas motivaron el desarrollo de algoritmos como HIECON (Hierarchical


Constrained Control, por Adersa) o IDCOM-M (por parte de Setpoint). Este último
incluye un supervisor para plantas mal condicionadas, función objetivo multicriterio o
jerarquı́a de restricciones. El SMOC de Shell es similar incluyendo caracterı́sticas como
modelos en espacio de estados (válidos para sistemas inestables) o la consideración de
un observador extendido para la realimentación de la salida en lugar del valor constante
empleado en los demás métodos. Estos métodos junto con el PCT de Profimatics, el
RMPCT de Honeywell o el PFC de Adersa constituyen la tercera generación.

Los productos que existen hoy dı́a en el mercado comparten las ideas básicas de
DMC o MAC desarrollados hace más de veinte años y el mayor énfasis en los últimos
años se ha centrado en la consideración de otros tipos de modelos, incluyendo modelos
no lineales, y en una mejor integración del controlador con los equipos de control
existentes.

A pesar de su creciente implantación, la tecnologı́a actual tiene todavı́a ciertas


limitaciones, siendo las más destacables las siguientes:

 Modelos sobre-parametrizados. La mayorı́a de los productos comerciales usan


modelos de convolución, que emplean una cantidad considerable de parámetros
y no se pueden usar para representar dinámicas inestables.

 Sintonización. No existe una clara relación entre los parámetros de sintonı́a y el


comportamiento del bucle cerrado. La garantı́a de estabilidad, sobre todo cuando
existen restricciones, es otro gran problema.
24 Estado de la tecnologı́a

 Optimalidad de la solución. Muchos paquetes proporcionan una solución sub-


óptima para acelerar el cálculo. En algunos casos este procedimiento no está
justificado.

 Incertidumbres en el modelo. Normalmente no se tiene en cuenta la incertidum-


bre asociada a la identificación, sino que se desintoniza el controlador intentando
aumentar la robustez.

 Perturbación constante. Aunque es la hipótesis más sensata a priori, se podrı́a


obtener una mejor realimentación si la distribución de la perturbación se estudiara
con más cuidado.
Tema 3

Algoritmos

En este tema se tratan en profundidad los dos algoritmos considerados más represen-
tativos de las metodologı́as existentes en Control Predictivo. Representan a las dos
familias de controladores predictivos, una de origen claramente industrial y la otra más
académica.

3.1 Dynamic Matrix Control

El método DMC se desarrolló a finales de los setenta by Cutler and Ramaker [6] de Shell
Oil Co. y ha sido aceptado ampliamente en el mundo industrial, principalmente por
las industrias petroquı́micas. Actualmente DMC es algo más que un algoritmo y parte
de su éxito se debe al hecho de que el producto comercial resuelve otros temas como
identificación u optimización global de la planta. En esta sección sólo se analiza el
algoritmo standard sin abordar detalles técnicos propios del producto de mercado que
no son de dominio público.

Pero a pesar de este éxito en la práctica, este método adolece quizás de la ausencia
de un análisis teórico maś completo que estudie la influencia de los parámetros de
diseño (horizontes, secuencias de ponderación) sobre la estabilidad del bucle cerrado
ası́ como de resultados de robustez.

3.1.1 Predicción

El modelo de proceso que se emplea es el de respuesta temporal, considerando la


perturbación como constante a lo largo del horizonte. El procedimiento para obtener
la predicción se describe a continuación.

25
26 Dynamic Matrix Control

Como se emplea un modelo de respuesta ante escalón:


1
X
y(t) = gi 4 u(t ; i)
i=1
los valores predichos a lo largo del horizonte serán:
1
X
ŷ(t + k j t) =gi 4 u(t + k ; i) + n̂(t + k j t) =
i=1
X
k X1
= gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + n̂(t + k j t)
i=1 i=k+1

Las perturbaciones se consideran constantes, n̂(t + k j t) = n̂(t j t) = ym (t) ; ŷ(t j t),


por lo que se puede escribir:

Xk X1
ŷ(t + k j t) = gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + ym(t) ;
i=1 i=k+1
X1 X
k
; gi 4 u(t ; i) = gi 4 u(t + k ; i) + f (t + k)
i=1 i=1
donde f (t + k ) es la respuesta libre del proceso, es decir, la parte de la respuesta que no
depende de las acciones de control futuras, y viene dada por:

1
X
f (t + k) = ym(t) + gk+i ; gi) 4 u(t ; i)
( (3:1)
i=1

Si el proceso es asintóticamente estable, los coeficientes gi de la respuesta ante


escalón tienden a un valor constante después de N periodos de muestreo, por lo que
se puede considerar que
gk+i ; gi  0 i>N
y por tanto la respuesta libre se puede calcular como

X
N
f (t + k) = ym(t) + gk+i ; gi) 4 u(t ; i)
(
i=1

Nótese que si el proceso no es estable, entonces no existe N y no se puede calcu-


lar f (t + k) (aunque existe una generalización en el caso de que la inestabilidad sea
producida por integradores puros).

Ahora las predicciones se pueden calcular a lo largo del horizonte de predicción


(k =1 : : :  p), considerando m acciones de control.

ŷ(t + 1 j t) = g1 4 u(t) + f (t + 1)
Algoritmos 27

ŷ(t + 2 j t) = g2 4 u(t) + g1 4 u(t + 1) + f (t + 2)


..
.
X
p
ŷ(t + p j t) = gi 4 u(t + p ; i) + f (t + p)
i=p;m+1

Si se define la matriz dinámica G como:


2 3
66 gg12 g01 

0
77
66 . . 0
77
66 .. .. ... ..
77
G = 66 gm gm;1 
.
g1 77
66 .. .. .. 77
4 . . ...
. 5
gp gp;1    gp;m+1

se puede escribir que:


y^ = Gu + f (3:2)

G
Obsérvese que está formada por m (horizonte de control) columnas de la respuesta
ante escalón apropiadamente desplazadas hacia abajo. y^
es un vector de dimensión
u
p que contiene las predicciones de la salida, representa el vector de incrementos de
f
control y es el vector de respuestas libres. Esta es la expresión que relaciona las
respuestas futuras con los incrementos en las señales de control, por lo que usará para
calcular las acciones necesarias para conseguir el comportamiento deseado del sistema.

3.1.2 Perturbaciones medibles

El efecto de las perturbaciones medibles se puede añadir fácilmente a las anteriores


ecuaciones de predicción, ya que éstas se pueden tratar como entradas al sistema. La
expresión (3.2) se puede usar para calcular la predicción del efecto de las perturbaciones
en la salida de la siguiente forma:

y^d = Dd + fd
y^
donde d es la contribución de las perturbaciones medibles a la salida, es una matriz D
similar a G
que contiene los coeficientes de la respuesta del sistema a un escalón en
d
la perturbación, es el vector de incrementos en la perturbación y d es la parte de laf
respuesta que no depende de la perturbación.

En el caso más general de perturbaciones medibles y no medibles, la respuesta libre


completa del sistema (la fracción de la salida que no depende de la variable manipulada)
28 Dynamic Matrix Control

se puede considerar como la suma de cuatro efectos: la respuesta a la entrada u(t), a la


perturbación medible d(t), a la perturbación no medible y al estado actual del proceso:

f = fu + D d + fd + fn
Por tanto la predicción se puede expresar en la forma general

y^ = Gu + f

3.1.3 Algoritmo de control

El éxito en la industria del DMC se ha debido principalmente a su aplicación a siste-


mas multivariables de gran dimensión con la consideración de restricciones. En esta
sección se describe el algoritmo de control comenzando por el caso más simple de un
sistema monovariable sin restricciones y extendiéndolo posteriormente al caso general
multivariable con restricciones.

El objetivo del controlador DMC es llevar el proceso los más cerca posible al setpoint
en el sentido de mı́nimos cuadrados con la posibilidad de incluir una penalización en los
movimientos de la señal de control. Por ello se seleccionan las variables manipuladas
de forma que minimicen un objetivo cuadrático que puede incluir sólo los errores
futuros p X
J= ŷ t j j t) ; w(t + j )]2
 ( +
j =1
o también el esfuerzo de control, presentando la forma genérica

X
p X
m
J= ŷ t j j t) ; w(t + j )]
 ( +
2
+ 4u(t + j ; 1)]2
j =1 j =1

Si no existen restricciones, la minimización de la función de coste J = T +  T , ee uu


e
donde es el vector de errores futuros a lo largo del horizonte de predicción y es el u
vector de futuros incrementos en la señal de control 4u(t) : : :  4u(t + m), se puede
hacer de forma analı́tica calculando la derivada de J y haciéndola igual a 0, lo que
proporciona el resultado general:

u = (GT G + I ); GT (w ; f )
1
(3:3)

Recuérdese que, como en todas las estrategias predictivas, sólo se envı́a al proceso
u
el primer elemento del vector (4u(t)). No es aconsejable implementar la secuencia
completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma
exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que
provocan que la salida real difiera de las predicciones que se emplean para calcular la
Algoritmos 29

w +
u y
K Proceso
-

f
Calculo
Resp. libre

Figura 3.1: Ley de control

secuencia futura de acciones de control. Además, el setpoint puede cambiar durante


los próximos m intervalos.

Resulta interesante analizar en qué consiste realmente la ley de control. Analizando


la expresión 3.3 se observa que el primer elemento del vector u, que es la señal que
efectivamente se envı́a a la planta, es el producto de la primera fila de la matriz
(GT G + I );1 GT (llamémosle K ) por la diferencia entre la trayectoria de referencia y la
respuesta libre, que es el error futuro si no hubiera incrementos en la señal de control.
Se puede decir por tanto que el incremento de la señal de control es proporcional (por
medio de K ) a los errores futuros y por tanto habrá cambios en la señal de control
siempre que el controlador detecte que va a haber una discrepancia en el futuro entre el
objetivo deseado y el comportamiento esperado del sistema. Esta idea queda reflejada
en la figura 3.1.

El caso con restricciones

Aunque computacionalmente más complicado que otros algoritmos más simples, la


capacidad de manejar restricciones que posee este método (y MPC en general) lo hace
muy atractivo para aplicaciones prácticas, ya que en general el punto de operación
óptimo según criterios económicos se encuentra normalmente en la intersección de las
restricciones, como se muestra en la figura 3.2. Por razones de seguridad, es necesario
mantener una zona segura alrededor del punto de operación, ya que el efecto de las
perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona
se puede reducir (y por tanto aumentar los beneficios económicos) si el controlador es
capaz de manejar restricciones (punto de operación 1).

Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades


de forma genérica

X
N
Cyij ŷ(t + k j t) + Cuij u(t + k ; i) + cj  0 j = 1 : : : Nc
i=1
30 Dynamic Matrix Control

P. operacion
Zona segura 1 optimo

Punto operacion 1
Restriccion
zona Punto operacion 2
segura 2

Restriccion

Figura 3.2: Punto de operación óptimo de un proceso tı́pico

que deben tenerse en cuenta para la minimización. Como se ha visto, las salidas se
pueden expresar en función del vector de incrementos de control a través de la matriz
dinámica, por que las restricciones tanto en la entrada como en la salida se pueden
recoger en una desigualdad matricial de la forma Ru
 , como se verá con más c
detalle en el tema dedicado a restricciones. Ahora la minimización es un problema de
Programación Cuadrática QP, cuya solución es numérica.

Todo lo relacionado con las restricciones será abordado con mayor grado de detalle
en el tema dedicado a ello.

Extensión al caso multivariable

El esquema previo se puede extender fácilmente al caso de sistemas con varias entradas
y varias salidas. Las ecuaciones básicas se mantienen igual a excepción de que las
matrices y vectores cambian de dimensión para poder incluir todas las entradas y
salidas.

Al tratarse de modelos lineales, se puede aplicar el principio de superposición para


obtener el valor de las salidas ante las diversas entradas. Para ello se define el vector
de salidas futuras como:

y^ = y (t + 1 j t) : : :  y (t + p j t) : : :  yny (t + 1 j t) : : :  yny(t + pny j t)T


1 1 1

y el de señales de control de la forma:

u = [4u (t) : : :  4u (t + m
1 1 1 ; 1) : : :  4unu(t) : : :  4unu(t + mnu ; 1)]T

ası́ como la respuesta libre:

f = f (t + 1 j t) : : :  f (t + p j t) : : :  fny (t + 1 j t) : : :  fny (t + pny j t)T


1 1 1

teniendo en cuenta que la respuesta libre de la salida i depende tanto de valores pasados
de yi como de valores pasados de todas las señales de control.
Algoritmos 31

Con estas definiciones, la ecuación de predicción es igual que en el caso monova-


riable simplemente considerando que la matriz G toma la forma:

2 G G  G1nu 3
66 G1121 G1222  G2nu 77
G = 66 .. 77
4 . ..
.
... ..
. 5
Gny1 Gny2    Gnynu

Cada submatriz Gij contiene los coeficientes de la respuesta ante escalón i-ésima
correspondiente a la entrada j-ésima. El proceso de minimización es análogo sólo que
la ponderación tanto de los errores como de los esfuerzos de control se realiza con
matrices de peso.

3.2 Control Predictivo Generalizado

El Control Predictivo Generalizado GPC fue propuesto por Clarke et al. en 1987 y se ha
convertido en uno de los métodos más populares en el ámbito del Control Predictivo
tanto en el mundo industrial como en el académico. Se ha empleado con éxito en
numerosas aplicaciones industriales, mostrando buenas prestaciones a la vez que un
cierto grado de robustez respecto a sobreparametrización o retardos mal conocidos.
Puede resolver muchos problemas de control diferentes para un amplio campo de
procesos con un número razonable de variables de diseño, que son especificadas por
el operario dependiendo del conocimiento previo del proceso y de los objetivos de
control.

La idea básica del GPC es calcular una secuencia de futuras acciones de control
de tal forma que minimice una función de coste multipaso. El ı́ndice a minimizar es
una función cuadrática que mide por un lado la distancia entre la salida predicha del
sistema y una cierta trayectoria de referencia hasta el horizonte de predicción, y por
otro el esfuerzo de control necesario para obtener dicha salida.

El Control Predictivo Generalizado tiene muchas ideas en común con otros contro-
ladores predictivos previamente mencionados ya que está basado en las mismas ideas
pero posee a su vez algunas diferencias. Como se verá más adelante, es capaz de
proporcionar una solución explı́cita (en ausencia de restricciones), puede trabajar con
procesos inestables o de fase no mı́nima e incorpora el concepto de horizonte de control
ası́ como la consideración en la función de coste de ponderación de los incrementos en
las acciones de control. Las diversas posibilidades disponibles para el GPC conducen a
una gran variedad de objetivos de control comparado con otras realizaciones, algunas
de las cuales pueden ser consideradas como subconjuntos o casos lı́mites del GPC.
32 Control Predictivo Generalizado

3.2.1 Formulación del Control Predictivo Generalizado

La mayorı́a de los procesos de una sola entrada y una sola salida (single-input single-
output, SISO), al ser considerados en torno a un determinado punto de trabajo y tras ser
linealizados, pueden ser descritos de la siguiente forma:

A(z;1 )y(t) = z;d B (z;1 )u(t ; 1) + C (z;1)e(t)


donde u(t) y y (t) son respectivamente la señal de control y la salida del proceso y e(t) es
un ruido blanco de media cero. A, B y C son los siguientes polinomios en el operador
de desplazamiento hacia atrás z ;1 :

A(z;1 ) = 1 + a1 z ;1 + a2 z ;2 + ::: + ana z ;na


B (z;1 ) = b0 + b1 z;1 + b2 z;2 + ::: + bnbz;nb
C (z;1) = 1 + c1 z ;1 + a2 z ;2 + ::: + cncz ;nc

donde d es el tiempo muerto del sistema.

Este modelo es conocido como Autorregresivo de Media Móvil (Controller Auto-


Regressive Moving-Average CARMA). En muchas aplicaciones industriales en las que
las perturbaciones son no-estacionarias resulta más conveniente el uso de un modelo
CARMA integrado, dando lugar al CARIMA, que viene descrito por:

A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1) e4


(t)
con 4 = 1 ; z;1 (3:4)

Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. Nótese


que en el caso de que C ;1 pueda ser truncado se puede absorber en A y B .

El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia


de señales de control que minimice una función de coste de la forma:

X
N 2 X
Nu
J (N1 N2  Nu) = (j )ŷ(t + j j t) ; w(t + j )]
2
+ (j )4u(t + j ; 1)]2 (3:5)
j =N1 j =1

donde ŷ (t + j j t) es la predicción óptima j pasos hacia delante de la salida del proceso


con datos conocidos hasta el instante t, N1 y N2 son los horizontes mı́nimo y máximo
de coste, Nu es el horizonte de control y  (j ) y (j ) son las secuencias de ponderación
mientras que w(t + j ) es la futura trayectoria de referencia, que se puede calcular según
se muestra en la figura 2.3. En muchas situaciones se considera  (j ) igual a 1 y (j )
constante.

El objetivo es pues el cálculo de la futura secuencia de control u(t), u(t + 1),... de tal
manera que la salida futura del proceso y (t + j ) permanezca próxima a w (t + j ). Esto
se logra minimizando J (N1  N2  Nu).
Algoritmos 33

Predicción óptima

Con la intención de minimizar la función de coste, se obtendrá previamente la pre-


dicción óptima de y (t + j ) para j  N1 y j  N2 . Considérese la siguiente ecuación
diofántica:
1 = Ej (z ;1 ) 4 A + z ;j Fj (z ;1 ) (3.6)
1 = Ej (z ;1 )Ã + z ;j Fj (z ;1 )

Los polinomios Ej y Fj están únicamente definidos con grados j ; 1 y na respec-


tivamente. Se pueden obtener dividiendo 1 entre Ã(z ;1 ) hasta que el resto pueda
ser factorizado como z;j Fj (z ;1 ). El cociente de la división es entonces el polinomio
Ej (z;1 ).
Si se multiplica la ecuación (3.4) por Ej (z ;1 ) z j 4
Ã(z;1 )Ej (z;1 )y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j ) (3.7)

Teniendo en cuenta (3.6), la ecuación (3.7) queda:


(1 ; z;j Fj (z;1 ))y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j )

La cual se puede escribir como


y(t + j ) = Fj (z;1 )y(t) + Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j ) (3:8)

Al ser el grado del polinomio Ej (z ;1 ) igual a j ; 1 los términos del ruido en la


ecuación (3.8) están todos en el futuro. La mejor predicción de y (t + j ) será por
consiguiente:
ŷ(t + j j t) = Gj (z;1 ) 4 u(t + j ; d ; 1) + Fj (z;1 )y(t)
donde Gj (z ;1 ) = Ej (z ;1 )B (z ;1 )

Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursiva-


mente, de forma que los nuevos valores en el paso j + 1 (Ej +1 y Fj +1) sean función de
los del paso j . A continuación se muestra una demostración simple de la recursividad
de la ecuación diofántica. Existen otras formulaciones del GPC que no están basadas en
la recursividad de esta ecuación.

Considérense que los polinomios Ej y Fj se han obtenido dividiendo 1 entre Ã(z ;1 )


hasta que el resto haya sido factorizado como z;j Fj (z ;1 ) .
Con:
Fj (z;1 ) = fj0 + fj1z;1 +    + fjnaz;na
Ej (z;1 ) = ej0 + ej1z;1 +    + ejj;1z;(j;1)
34 Control Predictivo Generalizado

Supóngase que se utiliza el mismo procedimiento para obtener Ej +1 y Fj +1, es decir,


dividir 1 entre Ã(z ;1 ) hasta que el resto se pueda factorizar como z;(j +1) Fj +1 (z ;1 ) con

Fj+1(z;1 ) = fj+10 + fj+11z;1 +    + fj+1naz;na

Está claro que solamente es necesario dar un paso más en la división para obtener
los polinomios Ej +1 y Fj +1 . Al ser Ej +1 el nuevo cociente de la división, será igual al
cociente que habı́a hasta el momento (Ej ) más un nuevo término, que será el fj0 pues
el divisor (Ã) es mónico. Por tanto:

Ej+1(z;1 ) = Ej (z;1 ) + ej+1j z;j con ej +1j = fj0


Teniendo en cuenta que el nuevo resto será el resto anterior menos el producto del
cociente por el divisor, los coeficientes del polinomio Fj +1 se pueden expresar como:

fj+1i = fji+1 ; fj0 ãi+1 i = 0    na

En resumen, la forma de obtener los polinmios Ej y Fj es la siguiente:

1. Comenzar con E1 = 1, F1 = z(1 ; Ã)


2. Ir añadiendo nuevos términos a Ej con ej +1j = fj0
3. Calcular fj +1i = fji+1 ; fj0 ãi+1 i = 0    na, (siendo fjna+1 = 0).

El polinomio Gj +1 puede ser obtenido recursivamente como sigue:

Gj+1 = Ej+1B = (Ej + fj0z;j )B = Gj + fj0z;j B

Es decir, los primeros j coeficientes de Gj +1 serán idénticos a los de Gj mientras que


el resto viene dado por:

gj+1j+i = gjj+i + fj0 bi para i = 0    nb

Para resolver el GPC es necesario obtener el conjunto de señales de control u(t),


u(t + 1), ...,u(t + N ) que minimizan la ecuación (3.5). Al tener el proceso un retardo de
d perı́odos de muestreo, la salida sólo se verá influenciada por la señal u(t) después del
instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes pueden ser definidos
como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido hacer N1 < d + 1 ya que
los términos de (3.5) sólo dependerán de las señales de control pasadas. Por otro lado,
haciendo N1 > d + 1 los primeros puntos de la secuencia de salida, que serán los mejor
estimados, no se tendrán en cuenta.
Algoritmos 35

El conjunto de las j predicciones óptimas:


ŷ(t + d + 1 j t) = Gd+1 4 u(t) + Fd+1 y(t)
ŷ(t + d + 2 j t) = Gd+2 4 u(t + 1) + Fd+2 y(t)
..
.
ŷ(t + d + N j t) = Gd+N 4 u(t + N ; 1) + Fd+N y(t)
puede ser escrito en forma matricial como:
y = Gu + F(z; )y(t) + G0(z; ) 4 u(t ; 1)
1 1
(3 :9)
Donde
2 ŷ(t + d + 1 j t) 3 2 4u(t)
3
66 ŷ(t + d + 2 j t) 77 66 4u(t + 1) 77
y = 66 7
7 u = 66 77
4 ..
. 5 4 ..
. 5
ŷ(t + d + N j t) 4u(t + N ; 1)
2 g 0 ::: 0 3
66 g1 g0 ::: 0 77
0

G = 66 .. .. .. 77
4 . ..
. . . 5
g g ::: g
2 N ;1 N ;2 z(G0 (z;1 ) ; g ) 3
d+1
66 z2 (Gd+2 (z;1 ) ; g0 ; g1z;1 )
0
77
G0(z; )
1
= 66
4 ..
.
77
5
; ;
z (G (z ) ; g0 ; g1z ;    ; gN ;1z
N ;(N ; 1)
2 F (dz+;N1 ) 3
1 1
)

66 Fdd++12 (z;1 ) 77
F( z ; )
1
= 66
4 ..
.
77
5
Fd+N (z ) ; 1

Al depender los últimos términos de la ecuación (3.9) sólo del pasado, pueden
agruparse en f, dando lugar a:
= + y Gu f (3:10)

Obsérvese que es la misma expresión que se obtuvo para el DMC, aunque en este
caso la respuesta libre es distinta.

Obtención de la ley de control

Entonces la ecuación (3.5) puede escribirse como:


Gu f w Gu f w) + uT u
J = ( + ; )T ( + ; (3:11)
36 Control Predictivo Generalizado

donde:
h iT
w = w(t + d + 1) w(t + d + 2)  w(t + d + N ) (3.12)

La ecuación (3.11) se puede poner como:

J = 12 uT Hu + bu + f0 (3:13)

donde:

H = GG I
2( T +  )
b = f w G
2( ; )T
f0 = f w f w)
T
( ; ) ( ;

El mı́nimo de J , siempre que no existan restricciones en la señal de control, puede


ser calculado igualando a cero el gradiente de J , lo cual conduce a:

u = ;H; bT1
(3:14)
Debido al uso de la estrategia deslizante, sólo se aplica realmente el primer elemento del
vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo.
La solución propuesta involucra la inversión (o al menos la triangularización) de una
matriz de dimensión N N , lo cual conlleva una gran carga de cálculo. El concepto ya
usado en otros métodos de horizonte de control se emplea con la finalidad de reducir
la cantidad de cálculo, asumiendo que las señales de control permanecerán en un valor
constante a partir del intervalo Nu < N . Por tanto la dimensión de la matriz que hay
que invertir queda reducida a Nu Nu, quedando la carga de cálculo reducida (en el
caso lı́mite de Nu = 1, se reduce al caso escalar) aunque restringiendo la optimalidad.

3.2.2 Ejemplo de cálculo

Se presenta a continuación un ejemplo de cálculo de un Controlador Predictivo Ge-


neralizado en un caso sencillo. Se diseñará el controlador para un sistema de primer
orden.

Al discretizar el proceso continuo se obtiene el siguiente equivalente discreto:

(1 + az;1 )y(t) = (b0 + b1 z;1 )u(t ; 1) + e4


(t)

Se va a considerar un retardo d igual a 0 y un polinomio de ruido C (z;1 ) igual a 1.

Se usará el algoritmo descrito previamente para obtener la ley de control, obteniendo


resultados numéricos para valores de los paámetros a = 0:8, b0 = 0:4 y b1 = 0:6, siendo
Algoritmos 37

los horizontes N1 = 1 y N = Nu = 3. Como se ha mostrado, se calcularán los valores


predichos de la salida del proceso en el horizonte haciendo uso de la ecuación (3.9),
obteniendo la ley de control de la expresión (3.14).

Resolviendo la ecuación (3.6) se obtienen los polinomios del predictor Ej (z;1 ),


Fj (z;1 ) desde j = 1 hasta j = 3, con
Ã(z;1 ) = A(z;1 )(1 ; z;1 ) = 1 ; 1:8z;1 + 0:8z;2
En este caso sencillo donde el horizonte no es demasiado largo, estos polinomios se
pueden obtener directamente dividiendo 1 por Ã(z ;1 ). Como se ha explicado antes,
también se pueden calcular recursivamente, comenzando con los valores obtenidos en
el primer paso de la división, es decir:

E1 (z;1 ) = 1 F1(z;1 ) = 1:8 ; 0:8z;1

Cualquiera que sea el método empleado, los valores obtenidos son:

E2 = 1 + 1:8z;1 F2 = 2:44 ; 1:44z;1


E3 = 1 + 1:8z;1 + 2:44z;2 F3 = 2:952 ; 1:952z;1
Con estos valores y el polinomio B (z;1 ) = 0:4 + 0:6z ;1 , los elementos Gi (z ;1 ) resultan
ser:

G1 = 0:4 + 0:6z;1 G2 = 0:4 + 1:32z;1 + 1:08z;2 G3 = 0:4 + 1:32z;1 + 2:056z;2 + 1:464z;3


y por tanto se pueden escribir las salidas predichas como:
2 3 2 32 3
ŷ(t + 1 j t) 0:4 0 0 4u(t)
64 ŷ(t + 2 j t) 75 =
64 1:32 0:4 0 75 64 4u(t + 1) 75 +
ŷ(t + 3 j t) 2:056 1:32 0:4 4u(t + 2)
2 3
0:6 4 u(t ; 1) + 1:8y (t) ; 0:8y (t ; 1)
+
64 1:08 4 u(t ; 1) + 2:44y(t) ; 1:44y(t ; 1) 75
| 1:464 4 u(t ; 1) + 2:952
{z y(t) ; 1:952y(t ; 1) }
f

El paso siguiente es el cálculo de H; b. Tomando  igual a 0:8 se tiene que:


1

2 3
0:133 0:286 0:147
;1 T 6
(G G + I) G = 4 ;0:154 ;0:165 0:286 5
T 7
;0:029 ;0:154 0:1334

Como sólo se necesita el valor de 4u(t) para los cálculos, sólo se emplea realmente la
primera fila de la matriz, con lo que resulta la siguiente expresión para la ley de control:

4u(t) = ;0:6042 4 u(t ; 1) ; 1:371y (t) + 0:805y (t ; 1) +


+ 0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)
38 Control Predictivo Generalizado

donde w(t + i) es la trayectoria de referencia que se puede considerar bien constante


e igual a la referencia actual o bien una suave aproximación de primer orden a ésta.
Entonces la señal de control resulta ser una función de la referencia deseada y de
entradas y salidas pasadas, dada por:

u(t) = 0:3958u(t ; 1) + 0:6042u(t ; 2) ; 1:371y (t) + 0:805y (t ; 1) +


+ 0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)

Al mismo resultado se puede llegar sin emplear la ecuación diofántica, calculando


G en base a los coeficientes de la respuesta ante escalón (que se pueden calcular en
función de los coeficientes de la función de transferencia) y calculando la respuesta
libre como se muestra en [2].

3.2.3 Caso multivariable

Al igual que en el DMC todo lo visto para el caso de sistemas con una sola entrada y
una sola salida se puede extender al caso multivariable, aunque los cálculos son más
complejos.

En este caso el modelo CARIMA para un sistema de m entradas y n salidas se puede


expresar como:
;1A ;1
(z )y (t) = (z )u(t ; 1) + B1 ;1
(z )e(t) C (3:15)
4
donde (z ;1 ) y (z ;1 ) son matrices polinomiales mónicas de dimensión n n y
A C B(z; )
1

es una matriz polinomial de dimensión n m, definidos como:

A(z; )1
Inn + A1 z;1 + A2z;2 +    + Ana z;na
=
B(z; )
1
= B0 + B1 z
;1 + B2z;2 +    + Bnb z;nb
C(z; )
1
= Inn + C1 z
;1 + C2z;2 +    + Cnc z;nc
Las variablesy (t), u(t) y e(t) son de dimensión n 1, m 1 y n 1 respectivamente.
La predicción conlleva la resolución de una ecuación diofantina matricial, que también
puede calcularse de forma recursiva.

En muchas ocasiones el problema radica en la obtención adecuada del modelo en


esta forma a partir de una matriz de transferencia en continuo que puede haberse
obtenido a partir de la curva de reacción. Una forma de hacerlo se muestra en [2].

Una vez obtenido el modelo, el criterio a minimizar tendrá la forma general

X
N 2 X
N 3

J (N1 N2 N3 ) = kŷ (t + j j t) ; w (t + j )k2R + k 4 u(t + j ; 1)k2Q


j =N1 j =1
Algoritmos 39

donde R y Q son matrices de ponderación definidas positivas que normalmente se


eligen diagonales. La minimización se realiza igual que en el caso monovariable dando
como resultado un vector de señales de control a enviar a la planta en el instante actual:
u1(t), u2(t) : : : um(t).
40 Control Predictivo Generalizado
Tema 4

Restricciones en Control Predictivo

En la práctica todos los procesos están sujetos a restricciones. Los actuadores tienen
un campo limitado de acción impuesto por lı́mites fı́sicos (por ejemplo una válvula no
puede abrir más de un 100 % o un calentador no puede aportar más de su potencia
máxima. También existen lı́mites de seguridad (por ejemplo presiones o temperaturas
máximas), requerimientos tecnológicos (por ejemplo mantener temperaturas en un
rango dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa
medioambiental.

4.1 Tratamiento convencional de restricciones

El tratamiento convencional de restricciones en control de procesos se basa en que las


restricciones en la variable manipulada (entrada) se cumplen saturando la salida del
controlador. Sin embargo, las restricciones en la variable controlada (salida) no pueden
abordarse; se intenta evitar su violación trabajando alejados de los lı́mites (en zona
segura), operando lejos de la restricción. Por seguridad se trabaja con una consigna
inferior, más lejos del punto de operación óptimo, lo que normalmente equivale a una
disminución de la calidad y/o cantidad en la producción, ya que normalmente el punto
óptimo se encuentra en la intersección de las restricciones obligando a acercarse lo más
posible a las éstas pero sin superarlas.

Si el controlador fuera capaz de tener en cuenta las restricciones y evitar su violación,


el proceso podrı́a operar más cerca de éstas y por tanto de forma más eficiente. La figura
4.1 muestra un ejemplo donde existe una limitación de presión máxima y se observa
cómo al alejar el punto de operación del lı́mite la producción Q disminuye.

En cuanto a la forma de operar de un controlador predictivo que no considera res-


tricciones el procedimiento es similar: si la señal de control calculada viola la restricción,
se satura. Las señales futuras ni siquiera se tienen en cuenta, ya que normalmente no

41
42 Restricciones en Control Predictivo

P
Pmax

P1

P2

t Q1 Q2 Q

Figura 4.1: Restricciones y punto de operación óptimo

se calculan. Esta forma de proceder no garantiza el carácter óptimo de la solución y en


ningún caso garantiza el cumplimiento de las restricciones en la salida. La violación de
los lı́mites de las variables controladas puede ser más costoso y peligroso, produciendo
daños en equipos y pérdidas en la producción.

La figura 4.2 muestra con claridad el fenómeno de pérdida de la solución óptima


cuando las variables manipuladas se mantienen en sus lı́mites por el programa de
control o por el propio actuador. Este hecho puede llevar a valores mayores de la
función objetivo y a un comportamiento no deseado (incluso inestabiliad). En 4.2a se
muestra un caso con horizonte de control igual a 2, donde se observa que si se satura
la señal de control u(t) a umax el valor de la función de coste no es el mejor que se
podrı́a conseguir (que serı́a el correspondiente a uc ). Incluso puede que no se viole
la restricción en el instante actual pero sı́ en el futuro (figura 4.2b) con lo que la señal
enviada al sistema (sin saturar) no es la mejor para el problema de dimensión 2 que se
está optimizando.

4.2 Restricciones en Control Predictivo

En la actualidad el MPC es la única metodologı́a capaz de incorporar las restricciones


de forma sistemática en la fase de diseño del controlador, siendo esta caracterı́stica una
de las razones de su gran éxito en la industria. Parece lógico que al disponer de un
modelo dinámico del proceso se pueda conocer la evolución futura de su salida y por
tanto se pueda saber si ésta va a violar o no las restricciones y actuar en consecuencia.

Para formular el algoritmo MPC con restricciones hay que expresar éstas en función
de la variable sobre la que se puede actuar, es decir, en función de u. Las restricciones
en la entrada están ya expresadas en función de u y para las restricciones en la salida
se hace uso de las ecuaciones de predicción que expresan el valor futuro de las salidas
Restricciones en Control Predictivo 43

u(t+1) u(t+1)

u max u max

uc u uc u

u max u(t) u max u(t)

a) b)

Figura 4.2: Restricciones en la señal de control

en función de las señales de control futuras y valores conocidos en el instante t.

Cualquier controlador predictivo calcula la predicción como:


y = Gu + f
por lo que tanto entradas como salidas se pueden expresar en función del vector de
incrementos de la señal de control.

Las restricciones que aparecen serán básicamente amplitud y velocidad de cambio


en la señal de control y amplitud en la salida y se pueden expresar como:

U  u(t)  U 8t
u  u(t) ; u(t ; 1)  u 8t
y  y(t)  y 8t

Para un proceso de m entradas y n salidas y restricciones en el horizonte N , las


restricciones se pueden expresar como:
1U  T u + u(t ; 1) 1  1U
1u  u  1u
1y  Gu + f  1y
l
donde es una matriz de dimensión (N n) m formada por N m m matrices
identidad y T es una matriz triangular inferior por bloques cuyos elementos no nulos
son matrices identidad de dimensión m m. En forma condensada se pueden expresar
como:
 Ru c (4:1)
44 Resolución del problema

siendo
2 I 3 2 l u 3
66 ;INNNN
77 66 7
66 T 77 66 l U ;;lul (ut ; 1) 777
R = 66 ;T 77 c = 66 7
66 77 66 ;l U + lu(t ; 1) 777
4 G 5 4 ly;f 5
;G ;l y + f

Aparte de las restricciones en amplitud, a la salida se le pueden aplicar otro tipo de


restricciones de para forzar un determinado comportamiento temporal (movimiento
dentro de una banda, comportamiento monótono, evitar respuesta inicial inversa, etc.)
como se muestra en [12], pudiendo expresarlas también de la forma genérica (4.1).

Además de la clasificación en restricciones en la entrada y en la salida según a qué


tipo de variable se apliquen, se puede hacer otra clasificación atendiendo a la forma de
tratarlas. Ası́, se puede hablar de:

 Restricciones duras como aquéllas que no se pueden violar bajo ningún concepto.
En este grupo se incluyen las restricciones relacionadas con la operación segura
del proceso.
 Restricciones blandas, que son aquéllas que pueden ser violadas en un momento
dado por no ser cruciales, pero la violación se penaliza en la función objetivo
como un término más. Es una forma de relajar la restricción.

4.3 Resolución del problema

Con la adición de restricciones el problema general de control predictivo cambia se


puede formular como

u)
minimizar J (
Ru c
sujeto a 

Es decir, el problema consiste en la minimización de una función cuadrática con


restricciones lineales, lo que se conoce como Programación Cuadrática, QP. En este caso
no se puede encontrar una solución analı́tica como en el caso sin restricciones, sino que
hay que recurrir a métodos iterativos.

Resulta evidente que la carga de cálculo será considerable, ya que hay que encontrar
la solución resolviendo el algoritmo iterativo en cada periodo de muestreo. Normal-
mente el esfuerzo está justificado por el beneficio económico obtenido al trabajar más
cerca del punto de operación óptimo.
Restricciones en Control Predictivo 45

Para resolver el problema QP existen diversos algoritmos suficientemente probados.


Una revisión de estos métodos se puede encontrar en [2].

Un problema asociado a la implementación del control con restricciones es el análisis


de la estabilidad del bucle cerrado. Como es necesario utilizar métodos numéricos
para resolver el problema de la optimización, la ley de control resultante no se puede
describir de forma explı́cita, haciendo el problema muy difı́cil de atacar mediante la
teorı́a clásica de control.

En los últimos años se ha trabajado mucho sobre la estabilidad en estas circuns-


tancias, proponiéndose soluciones basadas en la teorı́a de Lyapunov. La idea básica
consiste en que la función de coste cuando el horizonte es infinito es monótona decre-
ciente (si existe solución factible) y se puede interpretar como función de Lyapunov
que garantiza por tanto la estabilidad. Sin embargo, como la solución tiene que ser
numérica, el número de variables de decisión tiene que ser finito, por lo que se han pro-
puesto dos ideas. En la primera, se descompone la función objetivo en dos partes: una
con horizonte finito y restricciones y otra con horizonte infinito y sin restricciones. La
segunda idea es en esencia equivalente y consiste en imponer restricciones terminales
al estado y usar un horizonte infinito.

En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las
incertidumbres en el modelo y los temas asociados con la factiblidad.

4.4 Gestión de restricciones

Durante la etapa de optimización puede aparecer problemas de no existencia de so-


lución óptima para unas restricciones dadas (no existe compatibilidad entre las restric-
ciones), por ejemplo por el planteamiento de unos objetivos inalcanzables para unas
restricciones dadas. Existen otras posibles causas de inexistencia de solución, como es
el caso de que una perturbación saque al proceso fuera de la zona de trabajo usual.

La factibilidad de un problema de optimización significa que la función objetivo


esté acotada y que todas las restricciones sean satisfechas.

La no factibilidad puede aparecer en régimen permanente o en el transitorio. El


problema de la falta de solución en régimen permanente puede venir provocado por
un objetivo de control irrealizable. Sin embargo, este tipo de no factibilidad puede
ser fácilmente eliminado en la etapa de diseño evitando la inclusión de tales objetivos.
También puede ser debido a cambios en referencias que hagan incompatibles las res-
tricciones (se quiera llevar alguna variable a un punto que es imposible de alcanzar con
una entrada que está acotada).

En el régimen transitorio puede aparecer no factibilidad incluso cuando las res-


tricciones impuestas parezcan razonables. Restricciones que no causan problemas en
46 Gestión de restricciones

operación normal pueden producir problemas bajo ciertas circunstancias. Puede que
una perturbación o cambio de referencia grande fuerce a una variable fuera de su lı́mite
y sea imposible introducirla de nuevo en su zona permitida con señales de control de
energı́a limitada. En estos casos las restricciones se hacen temporalmente incompati-
bles.

Las soluciones no factibles aparecen con mayor frecuencia en casos en que el óptimo
se encuentre cerca de las restricciones y el sistema esté sujeto a perturbaciones, llevando
a la salida a "regiones prohibidas".

4.4.1 Técnicas de búsqueda de soluciones factibles

Los métodos de gestión de restricciones tratan de recuperar la factibilidad actuando


sobre las restricciones según diferentes criterios.

Los lı́mites de las restricciones se pueden considerar de los siguientes tipos:

 Limites fisicos: nunca se pueden sobrepasar, principalmente por motivos de


seguridad o por la propia construcción de los equipos (p.ej. actuadores)

 Limites de operación: son fijados por los operarios para mantener las condiciones
nominales de funcionamiento. Se pueden sobrepasar bajo ciertas circunstancias

 Limites reales: son los que usa el algoritmo de control en cada instante. Son los
que proporciona el gestor de restricciones, quien debe calcularlos de forma que
nunca superen los limites fı́sicos.

Es decir, el gestor de restricciones calculará los lı́mites reales (los que se envı́an al
algoritmo QP) en base a los lı́mites de operación pero sin salirse nunca de los lı́mites
fı́sicos, según se observa en la figura 4.3.

Se analizan a continuación posibles soluciones para este problema, que se pueden


agrupar en:

1. Desconexión del controlador.

2. Eliminación de restricciones.

3. Relajación de restricciones.

4. Otras técnicas.
Restricciones en Control Predictivo 47

Límites físicos

Restricciones reales
Límites de operación

Figura 4.3: Gestión de restricciones

Desconexión del controlador

La forma más sencilla de resolver de este tipo de problemas es pasar el controlador


a posición manual cuando aparecen las incompatibilidades de restricciones y volver a
operación automática cuando se recupera la admisibilidad de la solución.

Este método, como se puede comprender tiene serias desventajas. Normalmente,


cuando aparecen problemas de incompatibilidad de restricciones es porque el sistema
en bucle cerrado se encuentra en un estado crı́tico donde normalmente el operador
tendrá muy poca experiencia en la operación. Adicionalmente, si las restricciones están
relacionadas con aspectos de seguridad o económicos, las decisiones llevadas a cabo
cuando aparecen problemáticas de compatibilidad de restricciones suelen ser crı́ticas
dado que en estos casos alguno de los objetivos del control no puede ser satisfecho.

El método suele ser utilizado cuando los problemas de incompatibilidad de restric-


ciones no son frecuentes.

Eliminación de restricciones

La factibilidad se analiza en cada periodo de muestreo, por lo que la eliminación de


restricciones se realiza de forma temporal. Periódicamente se chequea la factibilidad
para poder reinsertar restricciones eliminadas.

La eliminación de un grupo de restricciones ha de realizarse en aquellos casos en que


el conjunto completo de restricciones que se imponen sobre el sistema sea incompatible.
Cada vez que existe un problema de incompatibilidad de restricciones, se forma un
conjunto de restricciones no admisibles que no se tienen en cuenta en el proceso de
48 Gestión de restricciones

optimización. Se pueden distinguir en la metodologı́a de eliminación de restricciones


varios tipos.

Eliminación indiscriminada Con esta estrategia todas las restricciones se eliminan


cada vez que aparezcan problemas de existencia de solución factible, quedando la
optimización de un problema sin restricciones. No es un método muy óptimo para
resolver el problema de la existencia de solución admisible, pero es la forma más rápida
de tener en cuenta incompatibilidad de restricciones.

La eliminación indiscriminada de restricciones no es adecuada en todas las aplicacio-


nes. No debe ser por ejemplo usada en casos en que las restricciones estén directamente
relacionadas con lı́mites de seguridad.

Eliminación jerárquica En este caso sólo se eliminan las restricciones que provocan
problemas de incompatibilidad. En este método se asigna en la etapa de diseño una
prioridad a cada restricción, que da un grado de importancia relativa de dicha res-
tricción frente a las otras. Esta prioridad se usará para clasificar las restricciones de una
forma jerárquica (se asigna un número que indica su posición en la jerarquı́a). De este
modo, cada vez que haya problemas de factibilidad o existencia de solución el gestor
de restricciones va eliminando por orden las restricciones menos prioritarias hasta que
se restablece la factibilidad de la solución, que se chequea cada periodo de muestreo
para reinsertar restricciones que hubieran sido temporalmente eliminadas.

En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes


tipos de reglas para establecer el número de restricciones que se eliminan, si conviene
eliminar más restricciones a costa de no eliminar una con prioridad superior, etc.

Relajación de restricciones

Otro método para tener en cuenta el problema de existencia de solución es la relajación


de las restricciones. Se puede hacer una relajación de los lı́mites de forma tempo-
ral o convertir restricciones duras ( Ru c
 ), cambiándolas en restricciones blandas
Ru c
(  + , con  0) para asegurar la existencia de solución, añadiendo un término
T
T a la función de coste de forma que se penalice la violación de la restricción y
obtener un mejor comportamiento del sistema controlado. A largo plazo, el término
de penalización en la función objetivo llevará las variables auxiliares a cero.

Otras técnicas

Existen técnicas que se basan en la manipulación del horizonte mı́nimo de las restriccio-
nes. Algunos controladores industriales como el QDMC usan el concepto de constraint
Restricciones en Control Predictivo 49

window. La constraint window comienza en algún punto en el futuro y continúa hasta el


estado estacionario. Si existe dinámica del tipo de fase no mı́nima, se pueden mejorar
las prestaciones desplazando la ventana hacia el futuro, lo que equivale a ignorar las
restricciones duras en la salida durante la fase inicial de la respuesta.
50 Gestión de restricciones
Tema 5

Tendencias actuales y nuevas


perspectivas

En la actualidad existen muchos campos abiertos en Control Predictivo, tanto en lo


referente a aplicaciones prácticas como a lı́neas de investigación. Todavı́a queda mucho
por estudiar en campos como identificación de modelos, estimación del estado y de
las perturbaciones no medibles o tratamiento sistemático de las incertidumbres. El
estudio de estabilidad o robustez de la solución es complicado, sobre todo en el caso de
inclusión de restricciones, ya que la ley de control es en general variable con el tiempo
y no se puede representar el sistema de la forma clásica de bucle cerrado.

Este tema está dedicado a dos áreas de especial interés: la consideración de funciones
objetivos multicriterio y un campo que está empezando a tener gran relevancia en la
práctica como es el Control Predictivo No lineal.

5.1 Multiobjetivo. Jerarquı́a de objetivos

Las estrategias que se han considerado hasta ahora están basadas en la minimización
de una función de coste de un único objetivo para la obtención de la mejor secuencia
de acciones de control. Sin embargo, en muchas situaciones el comportamiento del
proceso no se puede medir con una sola función objetivo sino que, la mayorı́a de las
veces, existen diversos (y a menudo contrapuestos) objetivos de control. Las razones
de la existencia de diversos objetivos de control pueden ser:

 Los procesos deben operar de forma diferente en distintos momentos. Por ejem-
plo, durante la fase de arranque puede interesar una estrategia de tiempo mı́nimo
y en el régimen nominal el objetivo puede ser reducir en lo posible la varianza de
las variables controladas.

51
52 Multiobjetivo. Jerarquı́a de objetivos

 El objetivo de control puede variar aun el caso de estar trabajando en régimen


nominal, dependiendo del valor de las variables. Por ejemplo, aunque el objetivo
de control sea minimizar la suma ponderada de los errores de las variables, si
una de ellas alcanza un valor muy alto (por ejemplo debido a una perturbación)
el objetivo de control será disminuir el valor de esta variable lo antes posible.

En muchas situaciones el objetivo de control no es minimizar la suma de errores, sino


mantener ciertas variables dentro de unos lı́mites especificados. Esto es equivalente
a las restricciones blandas. Este tipo de objetivo se puede expresar penalizando la
cantidad que se sobrepasa cada variable del setpoint. Considérese, por ejemplo, que el
objetivo es mantener la variable y (t) entre sus lı́mites yl e yh . En este caso, el objetivo
de control se puede escribir como:
XN2 XN2
J = p(y(t + j ) ; yh) (y(t + j ) ; yh)2 + p(yl ; y(t + j )) (y(t + j ) ; yl )2
j =N1 j =N1
siendo p la función escalón (vale 1 cuando el argumento es mayor o igual que 0 y vale
0 en caso contrario).

Nótese que ahora la función objetivo no es cuadrática y por tanto no se puede


emplear para su minimización un algoritmo de programación cuadrática, aunque se
puede transformar en uno de este tipo añadiendo unas variables de holgura h (j ) y
l (j ):
y(t + j )  yh + h (j )
y(t + j )  yl ; h (j )
La secuencia óptima de control se obtiene con la minimización de
XN2
J = ( h(j )2 + l (j )2)
j =N1
con la condición de que las variables de holgura sean no negativas (y el resto de las
restricciones si las hubiera). En definitiva lo que se ha hecho es transformar el problema
en un QP con más restricciones y variables.

En muchas ocasiones todos los objetivos de control se pueden agrupar en una sola
función de coste. Algunos de los objetivos pueden ser mantener las variables lo más
cerca posible de los setpoints o dentro de unas determinadas regiones de operación.
Cada uno de estos objetivos equivale a minimizar una cierta función Ji (sujeta a una serie
de restricciones). Entonces la secuencia de control se puede obtener de la minimización
de: mX
J= i Ji
i=1
sujeta a todo el conjunto de restricciones. La importancia relativa de cada objetivo se
puede ponderar mediante la adecuada elección de los i , aunque en la práctica es difı́cil
encontrar estos pesos. Además, muchas veces los objetivos de control son cualitativos,
haciendo la tarea aún más difı́cil.
Tendencias actuales y nuevas perspectivas 53

5.1.1 Jerarquı́a de objetivos

En muchas situaciones, se puede establecer una importancia relativa de unos objetivos


sobre otros por medio de una priorización o jerarquı́a. Es decir, los objetivos de mayor
prioridad (por ejemplo los relacionados con la seguridad) se deben satisfacer antes que
otros con menor prioridad. Aunque esto se puede resolver con ponderaciones, no es
un asunto trivial.

Tyler y Morari [20] proponen una forma de introducir múltiples objetivos jerarqui-
zados. Considérese un proceso con m objetivos Oi jerarquizados (el Oi+1 tiene mayor
prioridad que el Oi) que se pueden expresar como:

Riu  ai
La idea consiste en introducir variables enteras Li que toman valor 1 cuando se satisface
el correspondiente objetivo de control y cero en caso contrario. Los objetivos se expresan
entonces como:

Riu  ai + Ki(1 ; Li) (5:1)

donde Ki es una cota superior conservadora para Ri u ; ai . Si se cumple el objetivo i, se


tiene que Li = 1 y el objetivo reformulado coincide con el original. Con la introducción
de Ki el objetivo reformulado se satisface incluso cuando el correspondiente objetivo
Oi no lo hace (Li = 0).
La jerarquı́a de objetivos se puede establecer imponiendo las restricciones siguien-
tes:
Li ; Li+1  0
PL .
El problema es maximizar el número de objetivos de control satisfechos i
Si el modelo del proceso es lineal el problema se puede resolver con Programación
Lineal Entera Mixta (MILP). El conjunto de restricciones 5.1 se puede modificar para
mejorar el grado de satisfacción de restricciones de los objetivos que no pueden ser
satisfechos. Supóngase que no todos los objetivos se pueden satisfacer y que el Of es
el primero que falla. Con la idea de acercarse todo lo posible a la satisfacción de este
objetivo se introduce una variable de holgura  que cumpla el siguiente conjunto de
restricciones: 0 i;1
1
X
Ru a
i  i +  + Ki @(1 ; i) + (1 ; Li ) ; Lj A (5:2)
j =1
con la función objetivo
X
m
J = ;K Li + f ()
i=1
donde f es una función de penalización de la variable de holgura (positiva y monótona
creciente) y K es su cota superior. El algoritmo de optimización intentará maximizar
54 Control predictivo no lineal

el número de objetivos satisfechos (Li = 1) antes de intentar reducir f () porque la


función objetivo global se puede hacer más pequeña incrementando el número de
variables Li distintas de cero que reduciendo la función de penalización. Como todos
los objetivos Oi están satisfechos para i < f , las restricciones (5.2) también se satisfacen.
Como Of es el primero que falla:
i;1
X
Li = f ; 1 para i  f
i=1
Es decir, el término que multiplica a Ki es cero para i = f mientras que para ı́ndices
mayores es mayor que uno. Esto implica que todas las restricciones se satisfarán para
Ru a
i > f . La única restricción activa es f  f + .
O sea, el método de optimización intentará optimizar el grado de satisfacción del
primer objetivo que falle sólo después de que todos los objetivos más prioritarios se
hayan satisfecho. Nótese que Li = 0 no implica que el objetivo i-ésimo no sea satisfecho,
sino que indica que la restricción correspondiente ha sido relajada.

Si el modelo del proceso y la función de penalización son lineales, el problema es del


tipo MILP, pero si f () es cuadrática se recurre a Programación Cuadrática Entera Mixta
(MIQP). Aunque existen algoritmos para Programación Mixta, el esfuerzo computacio-
nal es mucho mayor que el requerido para problemas LP o QP, por ello el número de
objetivos debe ser pequeño para poder implementar el método en tiempo real.

5.2 Control predictivo no lineal

En los últimos años el Control Predictivo Basado en Modelo se ha convertido en la


estrategia de control preferida para una gran cantidad de procesos industriales. Los
esquemas de MPC lineal, es decir, los vistos hasta ahora en los que la predicción está
basada en un modelo lineal del proceso, se usan de forma rutinaria como una opción
de control más a tener en cuenta en ciertos sectores de la industria y se puede decir que
sus fundamentos teóricos están suficientemente estudiados.

Por su parte, el Control Predictivo No Lineal (Nonlinear Model Predictive Control,


NMPC) surgió hace relativamente poco tiempo y existen pocas referencias de aplicacio-
nes industriales. Pero debido a su capacidad para tener en cuenta las no-linealidades
del proceso se espera que se convierta en una opción prometedora a corto plazo.

No hay nada en los conceptos básicos de MPC contra el uso de modelos no lineales,
por tanto la extensión de tales conceptos a procesos no lineales es en principio sencilla.
Sin embargo, como se verá seguidamente esto no es un asunto trivial y aún hay muchos
temas abiertos como:

 La disponibilidad de modelos no lineales debido a la dificultad de técnicas de


Tendencias actuales y nuevas perspectivas 55

identificación para procesos no lineales.

 La complejidad de los cálculos necesarios para resolver el problema del control


predictivo de procesos no lineales.

 La escasez de resultados de estabilidad y robustez.

En general los procesos industriales son no lineales, pero aún ası́ la mayorı́a de
las aplicaciones de control predictivo están basadas en el uso de modelos lineales,
del tipo de los vistos hasta ahora. Existen varias razones para ello: por un lado
resulta relativamente fácil identificar modelos lineales a partir de datos del proceso,
y por otro los modelos lineales dan buen resultado cuando el proceso opera en las
cercanı́as del punto de trabajo nominal. En el sector petroquı́mico, donde tiene lugar
la mayorı́a de las aplicaciones de MPC, el objetivo es mantener el proceso en torno al
estado estacionario (problema del regulador) más que realizar frecuentes cambios de un
punto de operación a otro (problema del servo) y por tanto un modelo lineal preciso es
suficiente. Además el uso de un modelo lineal junto con una función objetivo cuadrática
da lugar a un problema convexo de programación cuadrática (QP) cuya solución está
suficientemente estudiada en la actualidad, existiendo diversos productos comerciales
fiables. La existencia de algoritmos que garanticen una solución que converja en un
corto tiempo (menor que el periodo de muestreo) resulta crucial en procesos en los que
interviene un gran número de variables.

Sin embargo, existen situaciones en las que los efectos no lineales justifican el uso
de la tecnologı́a NMPC. Estas situaciones entran dentro de las dos categorı́as siguientes:

 Procesos fuertemente no lineales y sujetos a grandes perturbaciones, como por


ejemplo el control de pH.

 Problemas de seguimiento de consigna en los que el punto de operación cambia


con frecuencia y estos cambios sacan a relucir la dinámica no lineal del proceso,
como en el caso de la fabricación de polı́meros.

En estas situaciones una ley de control lineal puede no ser efectiva siendo necesario
el empleo de un controlador no lineal para mejorar el comportamiento o simplemente
para una operación estable del proceso. Es por tanto en este caso donde se puede
justificar el empleo de técnicas de NMPC. Aunque en la actualidad el número de
aplicaciones es aún reducido, el potencial es considerable, como se desprende del
informe de Qin y Badgwell [17], donde se observa que MPC no ha penetrado aún en
campos donde las no linealidades son fuertes y el mercado exige frecuentes cambios
del punto de operación; es aquı́ donde se espera el auge del NMPC.
56 Control predictivo no lineal

5.2.1 Diferencias respecto al método lineal

Resulta evidente que la principal ventaja del NMPC frente al MPC radica en la posibilidad
de abordar dinámicas no lineales. A medida que aparecen nuevas herramientas que
hacen posible la obtención y representación de modelos no lineales, bien a partir de
primeros principios (leyes de conservación) o bien a partir de datos experimentales
(modelos de Volterra o redes neuronales) el interés por su utilización en NMPC se va
acrecentando.

Aunque la extensión de los conceptos de MPC al caso no lineal es directa, a la hora de


realizar el controlador aparecen una serie de problemas a tener en cuenta, que dan lugar
a una mayor dificultad en su implantación. Las principales dificultades derivadas del
empleo de modelos no lineales son:

 La obtención de un modelo no lineal a partir de datos experimentales es un


problema abierto. La utilización de redes neuronales o series de Volterra no
parecen solucionar el problema de forma general. Por otra parte, la obtención de
modelos a partir de primeros principios no es siempre viable.

 El problema de optimización es no convexo, cuya resolución es mucho más difı́cil


que un problema de programación cuadrática. Aparecen problemas relativos a la
obtención del óptimo global, lo que influye no sólo en la calidad del control, sino
también en problemas relacionados con la estabilidad.

 La dificultad del problema de optimización se traduce en un aumento considera-


ble del tiempo de cálculo, hecho que puede dar lugar a que la aplicación de esta
técnica quede restringida a un conjunto de sistemas con dinámica lenta.

 El estudio de temas fundamentales como estabilidad o robustez se complica


enormemente. Este tema constituye un campo abierto de gran interés para los
investigadores.

5.2.2 Fundamentos teóricos

Se puede definir un algoritmo genérico NMPC que englobe a todas las técnicas que
comparten las mismas ideas. El proceso (en general multivariable) se puede describir
por un modelo en el espacio de estados de la forma:

x(t + 1) = f (x(t) u(t) d(t) w(t))


y(t) = g(x(t)) + e(t)
donde x es el vector de estados de dimensión n, u es el vector de mu entradas, d son las
perturbaciones medibles y w(t)) las no medibles. El vector de salidas es y de dimensión
my , la misma que la del vector de ruidos de medida e.
Tendencias actuales y nuevas perspectivas 57

El problema que hay que resolver es el cálculo de la secuencia de señales de control


u x
que llevan al proceso desde su estado actual al estado deseado s . El punto de trabajo
y x u
deseado ( s , s , s ) viene en general determinado por una optimización estática basada
normalmente en criterios económicos. Este punto de trabajo debe ser recalculado
periódicamente ya que las perturbaciones pueden hacer cambiar el punto óptimo de
operación.

Las perturbaciones medibles se pueden eliminar incluyendo su efecto en la función


f , mientras que el resto se rechaza con la realimentación, normalmente considerando
que la perturbación permanecerá constante a lo largo del horizonte. Esto se formalizar
añadiendo un término constante (bias) e igual al error entre medida y salida calculada
a toda la predicción:
y(t + j ) = g(x(t + j )) + b(t) donde b(t) = ym(t) ; y(t)
El problema consiste en la minimización de una función objetivo que de la forma
más genérica será:
X
P ;1
MX ;1
MX
J= ky(t + j ) ; ys kq
Q+ u
k 4 (t + j )kqS + ku(t + j ) ; uskqR + kskqT (5:3)
j =1 j =1 j =1

donde q puede ser 1 ó 2 según el tipo de norma que se esté utilizando y Q, S, R y T


son matrices de ponderación. La minimización estará sujeta a la restricción del modelo:
x(t + j ) = f (x(t + j ; 1) u(t + j ; 1) d(t + j ; 1) w(t + j ; 1))y(t + j ) = g(x(t + j )) + b(t)
y al resto de restricciones en entradas y salidas que se quieran considerar:
y ; s  y(t + j )  y ; s 8j = 1 P
u  u(t + j )  u 8j = 1 M ; 1
4u  4u(t + j )  4u 8j = 1 M ; 1

Obsérvese que se ha considerado la violación de las restricciones en la salida con el


término s, que entra en juego en la minimización apareciendo en la función de coste
con una penalización dada por la matriz T.

Igual que en caso lineal, la solución del problema es una secuencia de acciones de
control de las cuales sólo la primera de ellas es enviada a la planta, desechando el resto
y volviendo a la resolver el problema en el siguiente periodo de muestreo.

5.2.3 Problemática asociada al NMPC

La resolución del NMPC plantea nuevos problemas que no existı́an en el caso lineal
relacionados por un lado con la metodologı́a de cálculo de la señal de control y por
otro con el comportamiento dinámico del bucle cerrado, básicamente su estabilidad.
58 Control predictivo no lineal

Resolución

La introducción de un modelo no lineal en el algoritmo de optimización conduce a la


pérdida de convexidad, no pudiendo ser resuelto por los algoritmos de programación
cuadrática (QP), para los cuales existen soluciones fiables y suficientemente estudiadas.
Esta pérdida de convexidad hace que sea mucho más difı́cil encontrar una solución y
que, una vez encontrada, no se pueda garantizar que sea un óptimo global.

En estas circunstancias el tiempo de cálculo aumenta considerablemente debido


principalmente a dos motivos

 Para la obtención de la secuencia de acciones de control óptima, el paquete de


programación no lineal debe evaluar repetidamente la función objetivo y en cada
evaluación se debe resolver el sistema de ecuaciones no lineales que componen
el modelo de predicción, lo cual conlleva mucho tiempo de cálculo.

 A partir de los datos obtenidos a través de la evaluación de la función objetivo, el


programa de optimización debe calcular el gradiente de la función y los próximos
puntos de búsqueda, además de comprobar la violación o no de las restricciones
y los criterios de finalización del algoritmo. Estas tareas consumen más tiempo
de cálculo que en el caso lineal.

Estabilidad de la solución

El otro problema fundamental es el de la estabilidad de la solución. Aún en el caso de


que el algoritmo de minimización encuentre la solución óptima, este hecho no garantiza
la estabilidad del bucle cerrado (incluso en el caso de que el modelo sea perfecto). Este
problema ha sido abordado desde distintos puntos de vistos de vista, existiendo en la
actualidad diferentes propuestas, las cuales se describen a continuación.

1. Horizonte infinito

Existe una solución propuesta por Meadows et al. ([13]) que consiste en ampliar
los horizontes de control y de predicción hasta el infinito, P M ! 1. En este caso la
función objetivo también sirve como función de Lyapunov, dando lugar a la estabilidad
nominal. En el artı́culo citado se demuestra que si existe solución inicial factible
entonces existe solución en cada periodo de muestreo posterior.

La idea básica es que si el problema de minimización es factible en el instante t


entonces la función de coste es finita y

Jt+1  Jt + x(t)t Rx(t) + u(t)t Su(t)


Por tanto la función de coste es monótona decreciente y se puede interpretar como una
función de Lyapunov, garantizando por consiguiente la estabilidad asintótica.
Tendencias actuales y nuevas perspectivas 59

A la hora de la verdad este concepto tiene principalmente un interés teórico so-


bre el que basar un desarrollo práctico, ya que no es viable una implementación con
horizonte infinito. Para llevarlo a la práctica se puede tomar un horizonte lo suficien-
temente grande, pero esta elección no tiene por qué garantizar la estabilidad, ya que
las trayectorias de la entrada y el estado diferirán de las trayectorias predichas incluso
si no hay incertidumbres ni perturbaciones.

2. Restricción terminal

Otra solución al problema, propuesta por Keerthi y Gilbert ([8]) consiste en añadir
una restricción terminal al estado en el algoritmo NMPC de la forma:

x(k + P ) = xs
Con la imposición de esta restricción, la función objetivo se convierte en una función
de Lyapunov para el sistema en bucle cerrado, conduciendo a la estabilidad nominal.
Con la introducción de esta restricción el estado al final del horizonte finito es cero y
por tanto también lo será la señal de control, con lo que el sistema (sin perturbaciones)
se queda para siempre en el origen. De esta forma es como si el horizonte de predicción
fuera infinito.

El problema de este método es que en la práctica la introducción de esta restricción


artificial añade un coste computacional considerable y, lo que es más importante aún,
da lugar a una región de operación muy restrictiva, por lo que en la realidad resulta
muy difı́cil satisfacer esta condición.

3. Control dual

La dificultad de la aproximación anterior llevó a Michalska y Mayne ([14]) a buscar


una restricción menos estricta. La idea es definir un entorno W alrededor del estado
x
final deseado s dentro del cual el sistema pueda ser llevado a dicho estado por medio de
un controlador lineal por realimentación del vector de estados. Por tanto la restricción
que se añade a la formulación es:

x t P ) ; xs ) 2 W
( ( +

Si el estado actual se encuentra fuera de esta región se usa el algoritmo NMPC con la
restricción anterior. Una vez que el estado se encuentra en W , el control conmuta a una
estrategia lineal determinada previamente (estrategia del tipo dual-mode controller).

Este método conlleva por tanto la gestión de la conmutación entre los dos controla-
dores y la determinación de la región W y de la matriz de ganancia de la realimentación
del vector de estados (una forma de hacerlo se puede encontrar en el artı́culo citado).

4. Horizonte casi-infinito

Chen y Allgower ([3]) extendieron el concepto anterior, proponiendo un esquema


de control con horizonte casi-infinito. Se hace uso de la idea de región terminal y
60 Control predictivo no lineal

controlador estabilizante, pero sólo para el cálculo del coste terminal. La señal de
control se determina resolviendo el problema de optimización en lı́nea (con horizonte
finito) sin conmutar al controlador lineal incluso dentro de la región terminal.

El procedimiento consiste en añadir el término kx(t + Tp )k2P a la función de coste,


cuyo objetivo es extender el horizonte de predicción hasta el infinito y por tanto evitar
la conmutación del controlador. Se puede demostrar que, eligiendo adecuadamente la
matriz de ponderación P , este término es una cota superior de lo que costarı́a llevar
al sistema no lineal con el controlador lineal hasta el origen partiendo de un estado
perteneciente a la región terminal y la función de coste con horizonte finito se aproxima
a una de horizonte infinito, en cuyo caso la estabilidad queda asegurada. Esto se puede
interpretar como si el horizonte de predicción se expandiera casi hasta el infinito (es
decir, es como si se minimizara un coste de horizonte infinito resolviendo un problema
de horizonte finito).

5. Contracción del estado

La idea consiste en imponer la siguiente restricción:

kx(t + N )k2  kx(t)k2  2 (0 1)


Esta restricción fuerza a la magnitud del vector de estado a contraerse según el factor
elegido cada vez que se calcula la señal de control. La estabilidad queda garantizada
siempre que el problema sea factible, lo que no viene impuesto necesariamente porque
sea factible en k = 0, ya que las restricciones que se le imponen al estado son muy
estrictas y pueden hacer perder factibilidad. Esto se puede mejorar con valores grandes
de , pero entonces la disminución de la magnitud del estado es menor. En general
se puede decir que en muchas situaciones reales la condición es muy restrictiva y la
no-factibilidad aparece con facilidad.

Robustez

Si el estudio de la estabilidad en NMPC resulta de por sı́ complicado, más aún lo es el de


la robustez, es decir, la estabilidad cuando existen errores de modelado. Los resultados
de estabilidad de la sección anterior son válidos sólo en el caso de que el modelo del
proceso sea perfecto. Resulta evidente que esto nunca va a ser cierto en la práctica, por
lo que es necesario alguna forma de afrontar la existencia de incertidumbres.

Se puede considerar el problema de la robustez como algo todavı́a sin resolver


para NMPC, aunque existen algunos resultados preliminares. Algunos de los esquemas
que garantizan establidad se pueden hacer robustos con algunos cambios, como por
ejemplo el uso de restricciones terminales conservadoras in el dual-mode. Pero en
general los resultados existentes sólo indican que incertidumbres pequeñas no amenazan
la estabilidad del bucle cerrado, sin permitir el diseño del controlador que garantice la
estabilidad dada una incertidumbre descrita por sus lı́mites. Existen algunos resultados
Tendencias actuales y nuevas perspectivas 61

para casos muy simples como incertidumbre en la ganancia y se está avanzando en


algunos campos como en LMI, pero todavı́a queda mucho por hacer.

5.2.4 Modelos

Estos resultados teóricos proporcionan una base para poner en marcha un NMPC, aun-
que en la práctica existen muchos temas abiertos, principalmente en lo referente a la
definición e identificación del modelo y al desarrollo de métodos de resolución fiables.

La obtención de modelos no lineales adecuados de forma empı́rica puede ser muy


difı́cil y no existe una formulación que sea claramente adecuada para representar
procesos no lineales de forma genérica. Parte del éxito del MPC se debe a la relativa
facilidad con la que se pueden obtener experimentalmente modelos del tipo respuesta
ante escalón o funciones de transferencia de bajo orden. En cambio los modelos no
lineales son mucho más difı́ciles de construir, tanto basándose en correlación de datos
de entrada/salida como en principios básicos de conservación de masa y energı́a.

Un gran obstáculo que se encuentra a la hora de desarrollar una teorı́a de sistemas


no lineales es la ausencia de un principio de superposición para este tipo de sistemas.
Debido a ello, la determinación experimental de los modelos se convierte en una tarea
muy complicada, requiriendo una cantidad de ensayos mucho mayor que para una
planta no lineal.

Si el proceso es lineal en teorı́a sólo es necesario llevar a cabo un ensayo de res-


puesta ante escalón para calcular el modelo (aunque en la práctica no sea realmente
ası́). Debido al principio de superposición, la respuesta ante un escalón de diferente
amplitud se puede obtener escalando la salida convenientemente. Pero esto no es ası́
para procesos no lineales, donde se deben realizar ensayos con escalones de distinto
tamaño. Además, si el proceso es multivariable, la diferencia en el número de ensayos
necesarios es mucho mayor. En general, si un sistema lineal se ensaya con señales
de entrada u1 (t),u2 (t),...,un (t), y las correspondientes salidas son y1 (t),y2 (t),...,yn (t), la
respuesta a una señal que se puede expresar como combinación lineal de las señales de
prueba
u(t) = 1u1(t) + 2 u2(t) +    + nun(t)
es
y(t) = 1y1(t) + 2y2(t) +    + nyn(t)
Es decir, un sistema lineal no necesita ser probado con ninguna secuencia de señales
de entrada que sea una combinación lineal de señales ya probada, mientras que no
ocurre lo mismo con un sistema no lineal, cuya respuesta debe ser analizada para todas
las posibles señales de entrada.

Si la desviación de la linealidad no es demasiado grande, se pueden hacer algu-


nas aproximaciones que tengan en cuenta el cambio de comportamiento de un punto
62 Control predictivo no lineal

de operación a otro y asuman comportamiento lineal en las cercanı́as del punto de


operación. Pero en general habrá que recurrir a modelos especı́ficos que reflejen la
dinámica no lineal. Existen diferentes aproximaciones que usan modelos de Wiener,
otras basadas en redes de neuronas, modelos de Volterra o de Hammerstein, mode-
los NARX, modelos borrosos, etc. Los modelos usados en la industria se detallan a
continuación.

Modelos en el espacio de estados

Se puede usar un modelo formado por la combinación de una ecuación de estado lineal
con una relación no lineal de salida:

x(t + 1) = Ax(t) + Bu(t) + Dd(t)y(t) = g(x(t))


A su vez la no linealidad de la salida se puede modelar con la superposición de una
relación lineal y una red neuronal no lineal:

g(x(t)) = Cx(t) + NN (x(t))


Al no estar el vector de estados limitado necesariamente a variables fı́sicas, este
modelo es muy genérico y permite englobar más efectos no lineales que los exclusivos
de las medidas.

Pero el principal problema en NMPC no es la elección del tipo de modelo, sino de


un método de identificación fiable y robusto. Según el modelo propuesto, se identifica
el sistema como lineal y los residuos de las salidas se ajustan a los estados con la red
neuronal. Se puede usar un ı́ndice de confianza de modo que la predicción se basa más
o menos en la red neuronal según este ı́ndice, apagándose en caso de que su aportación
no sea fiable. También puede añadir un filtro de Kalman extendido (EKF) para corregir
los errores de modelado y las perturbaciones no medibles, reemplazando de este modo
el error constante en la realimentación que se emplea normalmente en el MPC.

Modelos de entrada/salida

Una idea adoptada por algunos fabricantes de controladores predictivos es usar un


modelo no lineal estático junto con un modelo dinámico no lineal. Si se considera el
caso monovariables, definiendo las variables de desviación como:

u(t) = u(t) ; us y(t) = y(t) ; ys


donde los valores en estado estacionario de entrada y salida cumplen:

ys = hs(us)
Tendencias actuales y nuevas perspectivas 63

Se considera que las variables de desviación verifican la siguiente relación dinámica


lineal:
Xn
y(t) = ai y(t ; i) + bi u(t ; i)
i=1

La identificación del modelo lineal se lleva a cabo mediante ensayos ante escalón
mientras que a partir de datos históricos se obtiene la representación de la relación no
lineal por medio de una red de neuronas. Como el modelo dinámico tiene una ganancia
fija que en general será distinta de la del modelo no lineal, la ganancia del submodelo
lineal se escala hasta ser igual a la ganancia local no lineal para la entrada actual:

dys j
Ks = du u(t)
s
Esto se consigue reescalando los coeficientes bi .

Para usar este modelo, un programa de optimización no lineal calcula los mejores
valores de entrada y salida ufs , ysf a partir del modelo estático. Durante el cálculo
dinámico del controlador, la ganancia estática no lineal se aproxima por una interpo-
lación lineal de las ganancias inicial y final:

Ks(u(t)) = Ksi + Ksf ; Ki s u(t)


f i
(5 :4)
us ; us
siendo uis y ufs los valores estacionarios actual y próximo y Ksi y Ksf las ganancias
calculadas en esos puntos usando el modelo no lineal estático. Sustituyendo la ganancia
dada por (5.4) en la ecuación del submodelo lineal se obtiene:

X
n
y(t) = aiy(t ; i) + biu(t ; i) + giu2(t ; i) (5 :5)
i=1

biKsi (1 ; Pnj=1 aj ) bi (1 ; Pnj=1 aj )


donde
bi = Pn b gi = Pn Ksf ;K i
j =1 bj ufs ;uis
j =1 j s

con esto se consigue reducir la complejidad computacional.

Se puede observar que los valores en estado estacionario se calculan a partir del
modelo estático no lineal, mientras que los movimientos dinámicos de control están
basados en el modelo cuadrático de la ecuación (5.5). Sin embargo, los coeficientes del
modelo cuadrático (la ganancia local) cambian de un periodo de muestro a otro, ya son
reescalados para ajustarse a la ganancia local del modelo no lineal. Esta estrategia se
puede interpretar como una sucesiva linealización de los estados inicial y final seguida
por una interpolación lineal de las ganancias linealizadas, en una formulación similar
al gain-scheduling, pero con un modelo global diferente debido el reescalado de la
ganancia.
64 Control predictivo no lineal

Modelos basados en primeros principios

En cualquier caso siempre es difı́cil obtener modelos empı́ricos fiables a partir de


datos experimentales, por lo que en la práctica existe la posibilidad de usar modelos
dados directamente de las ecuaciones de balance, llamados normalmente modelos
de primeros principios. Estas ecuaciones pueden ser ecuaciones estáticas de balance
o funciones no lineales de variables fı́sicas que generan otra variable. En este caso
el cálculo de la predicción se realiza mediante una simulación de las ecuaciones no
lineales (integración) que describen el proceso.

5.2.5 Otras formulaciones del problema

Se han propuesto diversas soluciones para intentar resolver los problemas que se
han visto, como por ejemplo en [1], donde la predicción de la salida del proceso
se hace mediante la adición de la respuesta libre (la respuesta futura que se obtiene
si la entrada se mantiene en un valor constante durante los horizontes de control y
predicción) obtenida de un modelo no lineal de la planta, y la respuesta forzada (la
debida a los movimiento de control futuros), calculada con un modelo incremental de
la planta. Las predicciones obtenidas de esta manera son sólo una aproximación ya
que el principio de superposición, que permite la descomposición mencionada, sólo
es válido para sistemas lineales. Sin embargo, la aproximación que se obtiene de esta
forma se comporta mejor que cuando se usa un modelo linealizado del proceso para
obtener ambas respuestas.

Si se usa una función de coste cuadrática, la función objetivo es cuadrática en las


variables de decisión (futuros movimientos de la señal de control) y la secuencia de
control se puede calcular (en caso de que no haya restricciones) como la solución de
un conjunto de ecuaciones lineales, dando lugar a una ley de control simple. La única
diferencia respecto a un MPC estándar es que la respuesta libre se calcula mediante un
modelo no lineal del proceso. Como el principio de superposición no se cumple, la
aproximación sólo es válida cuando la secuencia de señales de control es pequeña. Esta
circunstancia tendrá lugar cuando el proceso opera en torno al punto de trabajo con
pequeñas perturbaciones. Si el proceso cambia continuamente de punto de operación
o las perturbaciones son considerables los incrementos de la señal de control serán en
general mayores y la aproximación no será muy buena.

Existe una forma de resolver este problema, propuesta en [9] para el EPSAC. La idea
básica es considerar la secuencia de señales de control como la suma de una secuencia
de control base (ub (t + j )) y una secuencia de incrementos de la variable manipulada
(ui (t + j )). Es decir:

u(t + j ) = ub(t + j ) + ui(t + j )


Tendencias actuales y nuevas perspectivas 65

La predicción j-ésima de la salida del proceso se calcula como la suma de la respuesta


del proceso (yb (t + j )) debida a la secuencia base más la respuesta (yi (t + j )) debida a
los futuros incrementos del control en la secuencia base de entrada ui (t + j ):

y(t + j ) = yb(t + j ) + yi(t + j )


Como se usa un modelo no lineal para calcular yb(t + j ) mientras que yi (t + j ) se
calcula a partir de un modelo lineal del proceso, la función de coste es cuadrática en
las variables de decisión (ui (t + j )) y se puede resolver mediante un algoritmo QP como
en el MPC estándar. Como se ha indicado, el principio de superposición no es válido
para procesos no lineales, y por ello la salida generada de esta forma sólo coincidirá
con la generada por el controlador no lineal en el caso de que la secuencia de futuros
movimientos de la señal de control sea cero.

Si éste no es el caso, la secuencia de control base se hace igual a la última secuencia


de control base más los incrementos de control óptimos que encuentre el algoritmo QP.
Este procedimiento se repite hasta que la secuencia de señales de control se lleva lo
suficientemente cerca de cero.

Las condiciones iniciales para la secuencia de control base se pueden hacer inicial-
mente iguales a la última señal de control que se ha aplicado al proceso. Obsérvese que
esto corresponde al cálculo de la respuesta libre en el MPC. Se puede probar con una
secuencia inicial mejor haciendo la secuencia base igual a la óptima que se obtuvo en
el último periodo de muestreo (con el desplazamiento temporal correspondiente).

Las condiciones de convergencia del algoritmo son muy difı́ciles de obtener ya que
dependen de la severidad de la caracterı́stica no lineal del proceso, de las entradas y
salidas pasadas, de las referencias futuras y de las perturbaciones.

Otra manera de atacar el problema es teniendo en cuenta que en algunas ocasiones,


el modelo no lineal se puede convertir en un modelo lineal mediante aproximaciones
apropiadas. Considérese por ejemplo el proceso descrito mediante la siguiente ecuación
en el espacio de estados:

x(t + 1) = f (x(t) u(t))


y(t) = g(x(t))

El método consiste en encontrar funciones de transformación de estados y entrada


z(t) = h(x(t)) y u(t) = p(x(t) v(t)) tales que:
z(t + 1) = Az(t) + Bv(t))
y(t) = Cz(t)
El método tiene dos importantes inconvenientes:
66 Control predictivo no lineal

 Las funciones de transformación z(t) = h(x(t)) y u(t) = p(x(t) v(t)) sólo se


pueden obtener en ciertos casos.

 Las restricciones, que usualmente son lineales, se convierten en no lineales.

Es decir, incluso en los casos en que el modelo pueda ser linealizado mediante
transformaciones adecuadas, el problema se transforma de minimizar una función no
lineal (no cuadrática) con restricciones lineales en minimizar una función cuadrática
con restricciones no lineales.

La forma general de resolver el problema es usar el modelo no lineal completo de


la planta para calcular la predicción de la salida. Haciendo esto, se está añadiendo
una restricción no lineal a la minimización, con lo que los algoritmos QP no se pueden
usar. Sin embargo el problema se puede resolver en lı́nea, en algunos casos, gracias al
rápido desarrollo de algoritmos de programación no lineal (nonlinear programming,
NLP) capaces de manejar un número grande de variables y restricciones.

5.2.6 Resolución del problema. Productos comerciales

Muchos controladores comerciales dividen el algoritmo de control en una optimización


local estática y una optimización dinámica. El primer módulo calcula los valores de
entrada y salida a los que es necesario llegar y el segundo calcula la secuencia de control
adecuada.

La optimización dinámica se lleva a cabo minimizando la función objetivo genérica


(5.3) con las restricciones correspondientes. Los distintos esquemas comerciales hacen
simplificaciones respecto a la formulación general.

La mayorı́a de los productos (ver tabla 5.1) sólo permiten matrices de peso cons-
tantes en todo el horizonte y sólo el NOVA-NLC trabaja con norma 1. Por su parte, el
Process Perfecter minimiza sólo la salida pero con una matriz de peso que se incrementa
gradualmente con el horizonte, dando por tanto más importancia a los errores más
lejanos y en consecuencia dando lugar a una acción de control más suave.

En cuanto a las restricciones, normalmente las correspondientes a la entrada se


tratan como restricciones duras, es decir, que nunca deben ser violadas. El PFC también
incluye restricciones de aceleración, muy útiles para aplicaciones de servomecanismos.
Este método no trata estas restricciones de forma óptima, sino que resuelve el problema
de optimización sin restricciones y luego satura a los lı́mites, produciendo por tanto
una solución no óptima.

Respecto a restricciones en la salida, la mayorı́a de los productos comerciales las trata


como restricciones blandas, debido a que una perturbación puede producir fácilmente
una pérdida de factibilidad. Una opción ofertada por el Process Perfecter es considerar
Tendencias actuales y nuevas perspectivas 67

Empresa Adersa Aspen Tech. Continental DOT Products Pavillion Tech.


Producto PFC Aspen Target MVC NOVA NLC Process Perfecter
Modelo EE, PP EE E/S, PNE EE, PP RN, E/S
F. Objetivo Q Q Q Q, N1 Q
Restricciones S, BS DS, DE, BS DE, BS DE, BS DE, DS
Estructura u FB, UM MM UM MM MM
Mét. solución NLS QP GRG MINLP GD

Tabla 5.1: EE: espacio de estados no lineal. PP: primeros principios. E/S: en-
trada/salida. PNE: polinomio no lineal estático. RN: red neuronal. N1: norma 1.
S: saturación. BS: blandas (mı́nimo y máximo) en la salida. DS: duras en las salidas.
DE: duras en las entradas. FB: funciones base. UM: único movimiento. MM: múltiples
movimientos. NLS: mı́nimos cuadrados no lineales. GRG: Generalized Reduced Gra-
dient. MINLP: Mixed Integer Nonlinear Programming. GD: Gradient descent.

una restricción dura en forma de embudo, de manera que se da más libertad a la salida
al comienzo del horizonte que al final.

Parámetros: normalmente se elige un horizonte de predicción finito muy grande,


con la idea de capturar la dinámica hasta el permanente de las salidas para todas las
entradas. Esto se puede considerar una aproximación al método de horizonte infinito
propuesto para garantizar la estabilidad del bucle cerrado y puede explicar por qué
ninguno de los productos comerciales incluye restricción terminal.

Una idea introducida en el PFC y adoptada por Aspen Target es el uso de puntos de
coincidencia, en los cuales deben coincidir la salida y la trayectoria de referencia. Esta
idea puede ser útil cuando las salidas responden con distinta velocidad y se pueden
definir distintos puntos de coincidencia para cada una de ellas.

En cuanto a la estructuración de la señal de control, se puede encontrar desde


considerar el horizonte de control igual a 1, horizonte variable o funciones base. Esta
última idea, propia del PFC, parametriza la señal de control usando un conjunto de
funciones polinomiales, permitiendo un perfil de entrada complejo para un horizonte
de control grande (en teorı́a podrı́a ser infinito) empleando un número de incógnitas
pequeño. Esto puede resultar una ventaja en el caso de sistemas no lineales. La
elección de la familia de funciones base establece muchas de las caracterı́sticas del
perfil de la entrada, pudiendo asegurar con una correcta elección una señal de control
suave, por ejemplo. Si se eligen funciones base polinómicas, se puede seleccionar el
orden para seguir un setpoint polinómico sin retraso, lo cual puede ser importante para
aplicaciones de servosistemas mecánicos.

La solución del problema no es tarea fácil debido a la no convexidad del problema


genérico. El PFC propone una solución sencilla resolviendo el problema sin restricciones
usando un algoritmo de mı́nimos cuadrados no lineal y saturando las entradas a sus
68 Control predictivo no lineal

lı́mites si éstos se violan; lógicamente no se asegura una solución óptima, pero se gana
en velocidad, permitiendo que este controlador se use en aplicaciones con perı́odos de
muestreo pequeños, como el caso de seguimiento de missiles.

Para el caso genérico se usan diversos algoritmos, algunos propietarios, basados


en métodos más o menos conocidos de optimización. Entre ellos cabe destacar el
que usa Aspen Target, desarrollado por Oliveira y Biegler [15], que garantiza que las
soluciones intermedias, aunque no óptimas, son factibles. Ello garantiza que una pronta
finalización del algoritmo por limitaciones de tiempo produce siempre una solución
factible. En cualquier caso queda claro que el esfuerzo computacional es superior al
caso lineal, siendo ésta una de las principales razones la todavı́a escasa implantación
de estas técnicas en la industria.

5.2.7 Necesidades futuras

Los temas que pueden considerarse abiertos en esta técnica son:

 Modelado: los modelos no lineales son más complejos que los lineales, pero
además el proceso de identificación es mucho más difı́cil. Se necesita una gran
baterı́a de ensayos para capturar las no-linealidades del proceso, resultando en
un perı́odo de pruebas considerable. Por tanto, la forma de disponer de una
representación correcta de la dinámica del proceso es un problema que no está
completamente resuelto.

 Resolución del problema: la inclusión del modelo no lineal en la optimización da


lugar a que ésta no sea convexa. Grandes esfuerzos deben hacerse todavı́a para
encontrar algoritmos de optimización fiables que permitan la resolución dentro
del tiempo asignado.

 Justificación del esfuerzo: vistas las dificultades que aparecen en la aplicación


de NMPC, debe poder justificarse el beneficio que este tipo de técnica aporta.
Algunos fabricantes ofrecen un MPC de respaldo, de manera que en el caso de
que no se necesite ese esfuerzo adicional o el controlador no lineal sea realmente
complicado de poner en marcha, se aplicarı́a la estrategia lineal.

 Otros temas: temas que son aplicables al Control Predictivo en general, funcio-
nes objetivos multicriterio, sintonización de parámetros, mal condicionamiento o
tolerancia a fallos.

Es de destacar que ninguna de los productos comerciales incluye restricción termi-


nal ni horizonte infinito, situaciones requeridas en teorı́a para garantizar la estabilidad
nominal. En lugar de eso, se confı́a en que con un horizonte de predicción lo suficien-
temente grande se consiga el mismo comportamiento que horizonte infinito.
Bibliografı́a

[1] E.F. Camacho, M. Berenguel y F.R. Rubio. Advanced Control of Solar Power Plants.
Springer-Verlag, London, 1997.
[2] E.F. Camacho y C. Bordons. Model Predictive Control. Springer-Verlag, 1999.
[3] H. Chen y F. Allgower. A quasi-infinite horizon nonlinear predictive control
scheme with guaranteed stability. Automatica, 34(10):1205–1218, 1998.
[4] D.W. Clarke y C. Mohtadi. Properties of Generalized Predictive Control. Automa-
tica, 25(6):859–875, 1989.
[5] D.W. Clarke, C. Mohtadi y P.S. Tuffs. Generalized Predictive Control. Part I. The
Basic Algorithm. Automatica, 23(2):137–148, 1987.
[6] C.R. Cutler y B.C. Ramaker. Dynamic Matrix Control- A Computer Control Algo-
rithm. En Automatic Control Conference, San Francisco, 1980.
[7] C.E. Garcı́a, D.M. Prett y M. Morari. Model Predictive Control: Theory and
Practice-a Survey. Automatica, 25(3):335–348, 1989.
[8] S.S. Keerthi y E.G. Gilbert. Optimal infinite-horizon feedback laws for a general
class of constrained discrete-time systems: Stability and moving-horizon appro-
ximations. J. Optim. Theory Appl., 57(2):265–293, 1988.
[9] R. De Keyser. A Gentle Introduction to Model Based Predictive Control. En
PADI2 International Conference on Control Engineering and Signal Processing, Piura,
Peru, 1998.
[10] R.M.C. De Keyser, Ph.G.A. Van de Velde y F.G.A. Dumortier. A Comparative Study
of Self-adaptive Long-range Predictive Control Methods. Automatica, 24(2):149–
163, 1988.
[11] K. Krämer y H. Ubehauen. Predictive Adaptive Control. Comparison of Main
Algorithms. En Proceedings 1st European Control Conference, Grenoble, páginas 327–
332, julio 1991.
[12] A.G. Kutnetsov y D.W. Clarke. Advances in Model-Based Predictive Control, capı́tulo
Application of constrained GPC for improving performance of controlled plants.
Oxford University Press, 1994.

69
70 Bibliografı́a

[13] E.S. Meadows, M.A. Henson, J.W. Eaton y J. Rawlings. Receding horizon control
and discontinuous state feedback stabilization. Int. Journal Control, páginas 1217–
1229, 1995.

[14] H. Michalska y D.Q. Mayne. Robust receding horizon control of constrained


nonlinear systems. IEEE Trans. on Automatic Control, 38(11):1623–1633, 1993.

[15] N.M.C. Oliveira y L.T. Biegler. An extension of newton-type algorithms for non-
linear process control. Automatica, 31:281–286, 1995.

[16] S.J. Qin y T.A. Badgwell. An Overview of Industrial Model Predictive Control
Technology. In Chemical Process Control: Assessment and New Directions for
Research. En AIChE Symposium Series 316, 93. Jeffrey C. Kantor, Carlos E. Garcia and
Brice Carnahan Eds. 232-256, 1997.

[17] S.J. Qin y Thomas A. Badgwell. An overview of nonlinear model predictive control
applications. En IFAC Workshop on Nonlinear Model Predictive Control. Assessment
and Future Directions. Ascona (Switzerland), 1998.

[18] J. Richalet. Practique de la commande predictive. Hermes, 1992.

[19] H. Takatsu, T. Itoh y M. Araki. Future needs for the control theory in industries.
report and topics of the control technology survey in japanese indsutry. Journal of
Process Control, 8:369–374, 1998.

[20] M.L. Tyler y M. Morari. Propositional Logic in Control and Monitoring Problems.
Technical Report AUT96-15, Institut fur Automatik, ETH- Swiss Federal Institute of
Technology, Zurich, Switzerland, 1996.

[21] B.E. Ydstie. Extended Horizon Adaptive Control. En Proc. 9th IFAC World Congress,
Budapest, Hungary, 1984.

También podría gustarte