Bases PDF

Escuela Superior de Ingenieros Universidad de Sevilla
Control Predictivo: metodologı́a,

tecnologı́a y nuevas perspectivas
Carlos Bordóns Alba

Departamento de Ingenierı́a de Sistemas y Automática
Universidad de Sevilla
I Curso de Especialización en Automática

Aguadulce, Almerı́a, 2000
Índice general
Índice i
1 Fundamentos 1
1.1 Tendencias actuales en control de procesos ::::::::::::::::: 1
1.2 Perspectiva histórica :::::::::::::::::::::::::::::: 5
1.3 Situación actual :::::::::::::::::::::::::::::::: 6
1.4 Conceptos básicos de control predictivo ::::::::::::::::::: 7
1.5 Estrategia de los controladores :::::::::::::::::::::::: 8
2 Controladores predictivos 11
2.1 Elementos básicos ::::::::::::::::::::::::::::::: 11
2.1.1 Modelo de predicción ::::::::::::::::::::::::: 11
2.1.2 Función objetivo :::::::::::::::::::::::::::: 15
2.1.3 Obtención de la ley de control :::::::::::::::::::: 18
2.2 Revisión de los principales algoritmos :::::::::::::::::::: 18
2.3 Estado de la tecnologı́a :::::::::::::::::::::::::::: 23
3 Algoritmos 25
3.1 Dynamic Matrix Control ::::::::::::::::::::::::::: 25
3.1.1 Predicción ::::::::::::::::::::::::::::::: 25
i
ii Índice general
3.1.2 Perturbaciones medibles ::::::::::::::::::::::: 27
3.1.3 Algoritmo de control ::::::::::::::::::::::::: 28
3.2 Control Predictivo Generalizado ::::::::::::::::::::::: 31
3.2.1 Formulación del Control Predictivo Generalizado ::::::::: 32
3.2.2 Ejemplo de cálculo ::::::::::::::::::::::::::: 36
3.2.3 Caso multivariable ::::::::::::::::::::::::::: 38
4 Restricciones en Control Predictivo 41
4.1 Tratamiento convencional de restricciones :::::::::::::::::: 41
4.2 Restricciones en Control Predictivo ::::::::::::::::::::: 42
4.3 Resolución del problema ::::::::::::::::::::::::::: 44
4.4 Gestión de restricciones :::::::::::::::::::::::::::: 45
4.4.1 Técnicas de búsqueda de soluciones factibles :::::::::::: 46
5 Tendencias actuales y nuevas perspectivas 51
5.1 Multiobjetivo. Jerarquı́a de objetivos ::::::::::::::::::::: 51
5.1.1 Jerarquı́a de objetivos ::::::::::::::::::::::::: 53
5.2 Control predictivo no lineal :::::::::::::::::::::::::: 54
5.2.1 Diferencias respecto al método lineal :::::::::::::::: 56
5.2.2 Fundamentos teóricos ::::::::::::::::::::::::: 56
5.2.3 Problemática asociada al NMPC :::::::::::::::::::: 57
5.2.4 Modelos :::::::::::::::::::::::::::::::: 61
5.2.5 Otras formulaciones del problema :::::::::::::::::: 64
5.2.6 Resolución del problema. Productos comerciales :::::::::: 66
5.2.7 Necesidades futuras :::::::::::::::::::::::::: 68
Bibliografı́a 69
Tema 1
Fundamentos
1.1 Tendencias actuales en control de procesos
Aunque en el pasado podı́a considerarse que el único objetivo del control consistı́a en
mantener una operación estable del proceso, actualmente la industrias se enfrentan a
un mercado cambiante y difı́cil de predecir, lo que les obliga a operar sus procesos
productivos en consonancia con la evolución del mercado para poder mantenerse
competitivas y rentables.
La competencia en muchos sectores industriales ası́ como el creciente interés social

por los problemas medioambientales relacionados con los procesos de producción
provoca la necesidad de disponer de técnicas fiables que permitan la operación del
proceso con gran eficiencia y alto grado de flexibilidad.
Actualmente los sistemas de control en la industria de procesos deben satisfacer

criterios económicos, asociados con el mantenimiento de las variables de proceso en sus
referencias minimizando dinámicamente una función de coste de operación, criterios
de seguridad y medioambientales, y de calidad en la producción, la cual debe satisfacer
ciertas especificaciones sujetas a una demanda normalmente variable.
Por ello, se puede considerar que en la actualidad el objetivo de todo sistema de

control consiste en actuar sobre las variables manipuladas de forma que puedan satis-
facerse múltiples y cambiantes criterios de funcionamiento (económicos, de seguridad,
medioambientales o de calidad) en presencia de cambios en las caracterı́sticas del pro-
ceso.
El amplio abanico de metodologı́as actuales de control de procesos se enfrenta al

cumplimiento de este objetivo. La diferencia entre las diversas técnicas radica bási-
camente en los compromisos hechos en la formulación matemática de los criterios de
funcionamiento y en la elección de la manera de representar el proceso. La represen-
1
2 Tendencias actuales en control de procesos
1983 (%) 1989 (%) 1995 (%)

Retardo 24 Retardo 23 Interacción 24
Perturbaciones 21 Interacción 16 Perturbaciones 22
Interacción 17 Perturbaciones 15 Retardo 21
Respuesta 16 Cambios 12 Cambios 14
Estabilidad 11 No lineal 10 No lineal 7
Tabla 1.1: Principales problemas de control
tación matemática de muchos de estos criterios se lleva a cabo en la forma de funciones

objetivo dinámicas y de restricciones mientras que el proceso se representa como un
modelo dinámico con incertidumbres asociadas. La importancia de las incertidum-
bres está siendo cada vez más reconocida y por tanto incluida explı́citamente en la
formulación de los controladores.
Las técnicas de Control Predictivo Basado en Modelo (Model Based Predictive

Control, MPC) parecen constituir unas poderosas herramientas para afrontar estos retos.
MPC, en su forma más general, acepta cualquier tipo de modelos, funciones objetivo o
restricciones, siendo la metodologı́a que actualmente puede reflejar más directamente
los múltiples criterios de funcionamiento relevantes en la industria de procesos. Quizás
sea ésta la principal razón del éxito de estas técnicas en numerosas aplicaciones de la
industria de procesos, unida a que es la forma más general de formular el problema de
control en el dominio del tiempo, de manera que puede resultar fácil de aceptar por el
personal de la industria.
Los resultados de un estudio realizado por Takatsu et al. para la Society of Instru-
mentation and Control Engineering [19] son indicativos de las necesidades futuras de
la industria en el ámbito del control. En este informe se analizan los principales proble-
mas de control que se encuentran en la industria de procesos, el estado de aplicación
de las tecnologı́as avanzadas, el grado de satisfacción de los usuarios con cada una de
ellas y las expectativas que cada una genera.
La evolución en los últimos años de los principales problemas de control para los
usuarios se muestra en la tabla 1.1.
Obsérvese que los tres primeros problemas siguen siendo los mismos en los tres
años que se ha realizado la encuesta y parece que a lo largo del tiempo se resuelven
problemas básicos como estabilidad y respuesta y se atacan problemas más difı́ciles
como dinámica no lineal. Como se verá más adelante, el Control Predictivo es una
metodologı́a capaz de ofrecer soluciones a todos estos problemas.
También resulta interesante analizar los factores claves de éxito y fracaso de la

automatización del proceso (1.2 y 1.3). De estas tablas se desprende que la elección de
la estrategia de control no es el único factor a tener en cuenta para garantizar un buen
Fundamentos 3
Selección de la estrategia de control 14 %

Selección del equipo de control 12 %
Especificaciones apropiadas 10 %
Configuración flexible del sistema 10 %
Operación de emergencia 10 %
Interface con el operario 8%
Análisis de proceso 8%
Tabla 1.2: Principales factores claves de éxito
Ausencia de análisis del proceso. Inexactitud del modelo 21 %

Selección de los sensores 14 %
Falta de rechazo a las perturbaciones 10 %
Selección de la estrategia de control 7%
Selección de los actuadores 6%
Selección del equipo de control 5%
Especificaciones inapropiadas 5%
Configuración rı́gida del sistema 5%
Tabla 1.3: Principales factores claves de fracaso
funcionamiento del sistema de control.
Del informe citado se pueden extraer conclusiones interesante sobre el estado y el

grado de aceptación de las tecnologı́as consideradas avanzadas (ver tabla 1.4). En ella
se muestra el porcentaje de plantas que usaron cada técnica en 1989 y 1995. Obsérvese
que todas crecieron excepto el control adaptativo y el autoajuste que tuvieron un ligero
descenso.
Con el fin de evaluar el grado de satisfacción del usuario con las distintas técnicas,
se muestra en la tabla 1.5 el porcentaje de usuarios que están satisfechos con cada una
de las técnicas que han empleado. Como conclusión interesante destaca el hecho de
que prácticamente todos los usuarios de Control Predictivo están satisfechos.
También resulta interesante intentar cuantificar la evolución futura de las distintas

técnicas. Para ello, la figura 1.1 intenta mostrar las posibilidades técnicas y las expec-
tativas despertadas por cada una de ellas. Posibilidad técnica se refiere a la facilidad
de implementación y expectativas al efecto esperado de uso de cada técnica. El punto
de partida de cada flecha es la media de todas las respuestas a la encuesta, mientras
que su extremo corresponde a la media de las 15 plantas consideradas lı́deres en temas
de control. El citado artı́culo interpreta la flecha como tendencia futura. Según esto,
el PID avanzado, compensación de retardo, borroso, desacoplo y MPC serán técnicas
4 Tendencias actuales en control de procesos
Técnica 1989 1995

Compensación de retardo 29.6 52.4
Borroso 9.9 38
Control Predictivo 25.4 37.2
Gain-scheduling 25.7 32.5
PID avanzado 24.8 29.4
Autoajuste 32.2 29.1
Desacoplo 17.5 28.6
Basado en reglas 6.3 17.9
Filtro de Kalman 9.1 15.5
Neuronal 0 11.8
LQ 8.2 11
Observador 8.2 9.8
Control adaptativo 10.3 7
H1 0 9.3
Tabla 1.4: Estado de las distintas técnicas
Técnica 1989 1995

Control Predictivo 76 94
PID avanzado 77 89
Compensación de retardo 72 89
Gain-scheduling 78 87
Borroso 67 83
LQ 79 70
Neuronal - 69
Desacoplo 64 66
Filtro de Kalman 70 66
Autoajuste 60 65
Observador 67 62
Basado en reglas 43 61
Control adaptativo 50 56
H1 - 50
Tabla 1.5: Grado de satisfacción de las distintas técnicas

Fundamentos 5
ampliamente usadas con grandes expectativas. El control neuronal despierta grandes

expectativas pero tiene ciertas dificultades de implementación, mientras que el Autoa-
juste se implementa con facilidad pero pierde expectativas. Las técnicas como LQR,
filtro de Kalman, H1 o adaptativo se mantienen como "sin demasiadas expectativas y
no fácilmente implementables".
MPC
Retardo
Borroso
PID
Expectativas
Adaptativo
Neuronal
Hoo
Desacoplo
LQ Auto
ajuste
F. Kalman
Deslizante
Posibilidades técnicas
Figura 1.1: Expectativas y posibilidades técnicas
Este estado actual y futuras tendencias en el campo del control de procesos indus-
triales indican que el Control Predictivo Basado en Modelo se puede considerar una
tecnologı́a suficientemente introducida en la industria y que además sigue despertando
muchas expectativas. Estos hechos, unidos a la existencia de campos abiertos tanto en
investigación como en temas relacionados con la implementación justifica un estudio
más detallado de esta tecnologı́a.
1.2 Perspectiva histórica
El Control Predictivo se desarrolló en base a dos lı́neas básicas. Por un lado, a finales
de los años setenta surgieron diversos algoritmos que usaban explı́citamente un mo-
delo dinámico del proceso para predecir el efecto de las acciones de control futuras
en la salida, las cuales eran determinadas minimizando el error predicho sujeto a res-
tricciones de operación. La optimización se repetı́a en cada instante de muestreo con
información actualizada del proceso. Estas formulaciones eran de naturaleza heurı́stica
6 Situación actual
y algorı́tmica e intentaban aprovechar el creciente potencial de los computadores digi-

tales por aquélla época.
Rápidamente el MPC adquirió gran popularidad en las industrias de procesos

quı́micos principalmente debido a la simplicidad del algoritmo y al uso del modelo
de respuesta impulsional o en escalón, que aunque posea muchos más parámetros
que las formulaciones en el espacio de estados o función de transferencia suele ser
preferido por ser intuitivo y necesitar menos información a priori para identificar. La
mayorı́a de las aplicaciones fueron llevadas a cabo sobre sistemas multivariables in-
cluyendo restricciones. Los algoritmos utilizados fueron principalmente el IDCOM
(Identification-Command) y el DMC (Control con Matriz Dinámica, Dynamic Matrix
Control).
Independientemente fue surgiendo otra lı́nea de trabajo en torno a las ideas del con-
trol adaptativo, desarrollando estrategias esencialmente para procesos monovariables
formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del
Controlador de Mı́nima Varianza y se desarrolló el Control Predictivo Generalizado
(Generalized Predictive Control GPC) que es uno de los métodos más populares en la
actualidad.
1.3 Situación actual
La situación actual de aplicaciones de MPC en la industria está bien reflejada en la re-

copilación de Qin y Badgwell [16], que recoge unas 2200 aplicaciones, principalmente
en el sector petroquı́mico (desde entonces el número de aplicaciones puede estimarse
en torno a las 3000). La mayorı́a de las aplicaciones son en procesos multivariables,
registrándose casos como un controlador con 40 entradas y 80 salidas. Sorprendente-
mente, MPC ha tenido menor impacto en otro tipo de industrias, aunque estudios de
1993 sugieren que unas 20.000 aplicaciones podrı́an beneficiarse de esta técnica.
El éxito actual del MPC en la industria se debe a tres razones principales:
La incorporación de un modelo explı́cito del proceso en los cálculos permite al

controlador tratar con todas las caracterı́sticas importantes de la dinámica del
proceso.
La consideración del comportamiento del proceso a lo largo de un horizonte

futuro permite tener en cuenta el efecto de las perturbaciones en realimentación
y pre-alimentación, permitiendo al controlador conducir la salida a la trayectoria
de referencia deseada.
La consideración de restricciones en la fase del diseño del controlador evita en

lo posible su violación, resultando en un control más preciso en torno al punto
Fundamentos 7
óptimo de operación. La inclusión de restricciones es quizás la caracterı́stica que

más distingue al MPC respecto a otras metodologı́as.
Otra de las razones que han contribuido a que el MPC se haya convertido en un éxito
comercial es el hecho de que existen unos 15 suministradores que instalan el producto
llave en mano, con periodos de amortización de entre 3 y 12 meses, permitiendo
que medianas empresas puedan tener acceso a esta tecnologı́a. Aparte de esto, los
nuevos Sistemas de Control Distribuido empiezan a ofertar productos MPC genéricos
que ofrecen al usuario la posibilidad de realizar futuras modificaciones sin depender
de un producto cerrado.
1.4 Conceptos básicos de control predictivo
El Control Predictivo Basado en Modelo, Model (Based) Predictive Control (MBPC ó

MPC) constituye un campo muy amplio de métodos de control desarrollados en torno
a ciertas ideas comunes e integra diversas disciplinas como control óptimo, control
estocástico, control de procesos con tiempos muertos, control multivariable o control
con restricciones.
El Control Predictivo no es una estrategia de control especı́fica, sino que se trata

más bien de un campo muy amplio de métodos de control desarrollados en torno a
ciertas ideas comunes. Estos métodos de diseño conducen a controladores lineales que
poseen prácticamente la misma estructura y presentan suficientes grados de libertad.
Las ideas que aparecen en mayor o menor medida en toda la familia de controladores
predictivos son básicamente:
Uso explı́cito de un modelo para predecir la salida del proceso en futuros instantes
de tiempo (horizonte).
Cálculo de las señales de control minimizando una cierta función objetivo.
Estrategia deslizante, de forma que en cada instante el horizonte se va despla-
zando hacia el futuro, lo que implica aplicar la primera señal de control en cada
instante y desechar el resto, repitiendo el cálculo en cada instante de muestreo.
Los distintos algoritmos de MPC difieren entre sı́ casi exclusivamente en el modelo
usado para representar el proceso y los ruidos y en la función de coste a minimizar.
Aunque las diferencias puedan parecer pequeñas a priori, pueden provocar distintos
comportamientos en bucle cerrado, siendo crı́ticas para el éxito de un determinado
algoritmo en una determinada aplicación.
El Control Predictivo es un tipo de control de naturaleza abierta dentro del cual se

han desarrollado muchas realizaciones, encontrando gran aceptación tanto en aplica-
ciones industriales como en el mundo académico. En la actualidad existen numerosas
8 Estrategia de los controladores
aplicaciones de controladores predictivos funcionando con éxito, tanto en la industria

de procesos como en control de motores o Robótica. El buen funcionamiento de estas
aplicaciones muestra la capacidad del MPC para conseguir sistemas de control de ele-
vadas prestaciones capaces de operar sin apenas intervención durante largos perı́odos
de tiempo.
El MPC presenta una serie de ventajas sobre otros métodos, entre las que destacan:
Resulta particularmente atractivo para personal sin un conocimiento profundo

de control, puesto que los conceptos resultan muy intuitivos, a la vez que la
sintonización es relativamente fácil.
Puede ser usado para controlar una gran variedad de procesos, desde aquéllos con
dinámica relativamente simple hasta otros más complejos incluyendo sistemas
con grandes retardos, de fase no mı́nima o inestables.
Permite tratar con facilidad el caso multivariable.
Posee intrı́nsecamente compensación del retardo.
Resulta conceptualmente simple la extensión al tratamiento de restricciones, que

pueden ser incluidas de forma sistemática durante el proceso de diseño.
Es muy útil cuando se conocen las futuras referencias (robótica o procesos en

batch).
Es una metodologı́a completamente abierta basada en algunos principios básicos

que permite futuras extensiones.
Pero, lógicamente, también presenta inconvenientes. Unos de ellos es la carga

de cálculo necesaria para la resolución de algunos algoritmos. Pero quizás el mayor
inconveniente venga marcado por la necesidad de disponer de un modelo apropiado del
proceso. El algoritmo de diseño está basado en el conocimiento previo del modelo y es
independiente de éste, pero resulta evidente que las prestaciones obtenidas dependerán
de las discrepancias existentes entre el proceso real y el modelo usado.
1.5 Estrategia de los controladores
La metodologı́a de todos los controladores pertenecientes a la familia del MPC se carac-

teriza por la estrategia siguiente, representada en la figura 1.2:
1. En cada instante t y haciendo uso del modelo del proceso se predicen las futuras
salidas para un determinado horizonte N , llamado horizonte de predicción. Estas
Fundamentos 9
u(t+k|t)
u(t)
^y(t+k|t)
y(t)
N
t-1 t t+1 ... t+k ... t+N
Figura 1.2: Estrategia del Control Predictivo
salidas predichas, ŷ (t + k j t)1 para k = 1 : : : N dependen de los valores conocidos

hasta el instante t (entradas y salidas pasadas) y de las señales de control futuras
u(t + k j t), k = 0 : : : N ; 1 que se pretenden mandar al sistema y que son las que
se quieren calcular.
2. El conjunto de señales de control futuras se calcula optimizando un determinado
criterio en el que se pretende mantener el proceso lo más próximo posible a la
trayectoria de referencia w (t + k ) (que puede ser directamente el setpoint o una
suave aproximación a éste). Este criterio suele tomar la forma de una función
cuadrática de los errores entre la salida predicha y la trayectoria de referencia
también predicha, incluyendo en muchos casos el esfuerzo de control. Si el criterio
es cuadrático, el modelo lineal y no existen restricciones se puede obtener una
solución explı́cita, en otro caso se debe usar un método iterativo de optimización.
Adicionalmente se hace alguna suposición sobre la estructura de la ley de control
futura, como por ejemplo que va a ser constante a partir de cierto instante.
3. La señal de control u(t j t) es enviada al proceso mientras que las siguientes
señales de control calculadas son desechadas, puesto que en el siguiente instante
de muestreo ya se conoce y (t + 1) y se repite el paso 1 con este nuevo valor y
todas las secuencias son actualizadas. Se calcula por tanto u(t + 1 j t + 1) (que en
principio será diferente al u(t + 1 j t) al disponer de nueva información), haciendo
uso del concepto de horizonte deslizante.
Para llevar a cabo esta estrategia, se usa una estructura como la mostrada en la
figura 1.3. Se hace uso de un modelo para predecir las salidas futuras del proceso,
1
la notación indica el valor de la variable en el instante t + k calculado en el instante t.
10 Estrategia de los controladores
Entradas y salidas Trayectoria

Salidas de referencia
pasadas predichas +
Modelo
-
Controles
futuros
Optimizador
Errores futuros
Funcion de coste Restricciones
Figura 1.3: Estructura básica del MPC
basándose en las futuras señales de control propuestas. Estas señales son calculadas
por el optimizador teniendo en cuenta la función de coste (donde aparece el futuro error
de seguimiento) ası́ como las restricciones. Por tanto el modelo juega un papel decisivo
en el controlador. El modelo elegido debe ser capaz de capturar la dinámica del proceso
para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo de usar
y de comprender.
El optimizador es otra parte fundamental de la estrategia pues proporciona las

acciones de control. Si la función de coste es cuadrática, el mı́nimo se puede obtener
como una función explı́cita de las entradas y salidas pasadas y de la trayectoria de
referencia. Sin embargo, cuando existen restricciones de desigualdad la solución debe
ser calculada por métodos numéricos con más carga de cálculo.
Tema 2
Controladores predictivos
2.1 Elementos básicos
Todos los controladores predictivos poseen elementos comunes y para cada uno de
estos elementos se pueden elegir diversas opciones, dando lugar a distintos algoritmos.
Estos elementos son:
Modelo de predicción
Función objetivo
Obtención de la ley de control
2.1.1 Modelo de predicción
La piedra angular del MPC es el modelo; un diseño completo debe incluir los me-
canismos necesarios para la obtención del mejor modelo posible, el cual debe ser lo
suficientemente rico para capturar al maximo la dinámica del proceso y debe ser ca-
paz de permitir el cálculo de las predicciones a la vez que sea intuitivo y permita un
análisis teórico. El uso del modelo del proceso viene determinado por la necesidad del
cálculo de la salida predicha en instantes futuros ŷ (t + k j t). Las diferentes estrategias
de MPC pueden usar distintos modelos para representar la relación de las salidas con
las entradas medibles, algunas de las cuales serán variables manipuladas y otras se
pueden considerar como perturbaciones medibles, que pueden ser compensadas por
acción feedforward. Además se tendrá en cuenta un modelo de las perturbaciones, para
intentar describir el comportamiento que no aparece reflejado en el modelo del pro-
ceso, englobándose aquı́ el efecto de las entradas no medibles, el ruido y los errores de
modelado.
11
12 Elementos básicos
Para el estudio se puede separar el modelo en dos partes: el modelo del proceso
propiamente dicho y el modelo de las perturbaciones. Cualquier método usará ambas
partes para la predicción.
Modelo del Proceso
Casi todas las formas posibles de modelar un proceso aparecen en alguna formu-
lación de MPC siendo las más usadas las siguientes:
Respuesta impulsional. También conocida por secuencia de ponderación o mo-

delo de convolución. La salida viene relacionada con la entrada por la ecuación
1
X
y(t) = hiu(t ; i)
i=1
donde hi son los valores muestreados obtenidos al someter al proceso a un impulso
unitario de amplitud igual al perı́odo de muestreo (ver figura 2.1a). Esta suma
es truncada y sólo se consideran N valores (por tanto sólo permite representar
procesos estables y sin integradores), teniendo
X
N
y(t) = hi u(t ; i) = H (z;1)u(t) (2:1)
i=1
donde H (z ;1 ) = h1 z ;1 + h2 z ;2 + + hN z ;N . Un inconveniente de este método es
el gran número de parámetros que necesita, ya que N suele ser un valor elevado
(del orden de 40-50). La predicción vendrá dada por:
X
N
ŷ(t + k j t) = hi u(t + k ; i j t) = H (z;1)u(t + k j t)
i =1
Este método es ampliamente aceptado en la práctica industrial debido a que
es muy intuitivo y no requiere información previa sobre el proceso, con lo que
el procedimiento de identificación se simplifica, a la vez que permite describir
fácilmente dinámicas complejas como fase no mı́nima o retardos.
Respuesta ante escalón. Es muy similar al anterior sólo que ahora la señal de
entrada es un escalón. Para sistemas estables se tiene la respuesta truncada que
será
XN
y(t) = y0 + gi 4 u(t ; i) = y0 + G(z;1)(1 ; z;1 )u(t) (2:2)
i=1
donde las gi son los valores muestreados ante la entrada en escalón y 4u(t) =
u(t) ; u(t ; 1), según se muestra en la figura 2.1b. El valor de y0 puede tomarse 0
sin pérdida de generalidad, con lo cual el predictor será:
X
N
ŷ(t + k j t) = gi 4 u(t + k ; i j t)
i=1
Este método presenta las mismas ventajas e inconvenientes que el anterior.
Controladores predictivos 13
h2
N
i
g
g
hi
h1
g2
hN
y(t) y(t)
g1
t t+1 t+2 ... t+N t t+1 t+2 ... t+N
a) b)
Figura 2.1: Respuesta impulsional y ante escalón
Función de transferencia. Se utiliza el concepto de función de transferencia

G = B=A con lo que la salida viene dada por:
A(z;1 )y(t) = B (z;1 )u(t)
A( z ; 1 ) = 1 + a1 z ;1 + a2 z ;2 + + ana z ;na
B (z ;1 ) = b1 z;1 + b2 z;2 + + bnb z;nb
Por tanto la predicción vendrá dada por
B (z ;1 )
ŷ(t + k j t) = A(z;1 ) u(t + k j k)
Esta representación es válida también para procesos inestables y posee la ventaja
de necesitar pocos parámetros, aunque es fundamental un conocimiento a priori
del proceso sobre todo en cuanto al orden de los polinomios A y B .
Espacio de estados. Tiene la siguiente representación:
x(t) = Ax(t ; 1) + Bu(t ; 1)

y(t) = Cx(t)
siendo x el estado y A, B y C las matrices del sistema, de entrada y de salida
respectivamente. Para este modelo la predicción viene dada por
X
k
ŷ(t + k j t) = C x̂(t + k j t) = C Ak x(t) + Ai;1Bu(t + k ; i j t)]
i=1
Posee la ventaja de que sirve también para sistemas multivariables a la vez que
permite analizar la estructura interna del proceso (aunque a veces los estados
obtenidos al discretizar no tienen ningún significado fı́sico). Los cálculos pueden
ser complicados, con la necesidad adicional de incluir un observador si los estados
no son accesibles.
Modelo de las perturbaciones
De tanta importancia como la elección de un determinado modelo del proceso

es la elección del modelo utilizado para representar la perturbaciones. Un modelo
bastante extendido es el Autorregresivo Integrado de Media Móvil (Auto-Regressive
and Integrated Moving Average, ARIMA), en el que las perturbaciones, es decir, las
diferencias entre la salida medida y la calculada por el modelo vienen dadas por
(z ;1 )e(t)
n(t) = C D (z ;1 )
donde el polinomio D (z;1 ) incluye explı́citamente el integrador 4 = 1 ; z;1 , e(t) es

un ruido de media cero y normalmente el polinomio C se considera igual a uno. Este
modelo se considera apropiado para dos tipos de perturbaciones: cambios aleatorios
ocurridos en instantes aleatorios (por ejemplo cambio en la calidad del material) y
movimiento browniano (en procesos con balance de energı́a) y es usado en varios
métodos. Nótese que al incluir un integrador se consigue un control con error nulo en
régimen permanente (offset-free).
Como caso particular del ARIMA se puede incluir la perturbación constante
n(t) = 1 ;e(tz);1
cuya mejor predicción será n̂(t + k j t) = n(t).
Respuestas libre y forzada
Una caracterı́stica tı́pica de la mayorı́a de los controladores MPC es el empleo de los

conceptos de repuesta libre y forzada. La idea es expresar la secuencia de acciones de
control como la suma de dos señales:
u(t) = uf (t) + uc(t)

La señal uf (t) corresponde a las entradas pasadas (anteriores al instante t) y en el futuro
se mantiene constante e igual al último valor de la variable manipulada. Es decir,
uf (t ; j ) = u(t ; j ) para j = 1 2
uf (t + j ) = u(t ; 1) para j = 0 1 2
La señal uc (t) vale cero en el pasado y corresponde a las señales de control en los
instantes futuros:
uc(t ; j ) = 0 para j =1 2

uc(t + j ) = u(t + j ) ; u(t ; 1) para j = 0 1 2
La predicción de la secuencia se salida se separa en dos partes, como se ve en la

figura 2.2. Una de ellas (yf (t)), la respuesta libre, corresponde a la predicción de la
salida cuando la variable manipulada se hace igual a uf (t), y la otra, la repuesta forzada
(yc (t)), corresponde a la predicción de la salida cuando la señal de control es uc (t).
La respuesta libre corresponde a la evolución del proceso debido a su estado actual
(incluido por tanto el efecto de acciones pasadas) mientras que la respuesta forzada es
la debida a las acciones de control futuras.
u y
Process
t t
u uc y yc
f f
t t t t
Figura 2.2: Respuestas libre y forzada
2.1.2 Función objetivo
Los diversos algoritmos de MPC proponen distintas funciones de coste para la obtención
de la ley de control. En general se persigue que la salida futura en el horizonte
considerado siga a una determinada señal de referencia al mismo tiempo que se puede
penalizar el esfuerzo de control requerido para hacerlo. La expresión general de tal
función objetivo será:
X
N 2 X
Nu
J (N1 N2 Nu) = (j )ŷ(t + j j t) ; w(t + j )]2 + (j )4u(t + j ; 1)]2 (2:3)
j =N1 j =1
En algunos métodos el segundo sumando, que considera el esfuerzo de control, no

se tiene en cuenta, mientras que en otros también aparecen directamente los valores de
la señal de control (no sus incrementos). En la función de coste se pueden considerar:
Parámetros: N1 y N2 son los horizontes mı́nimo y máximo de coste (o de pre-

dicción) y Nu es el horizonte de control, que no tiene por qué coincidir con el
horizonte máximo, como se verá posteriormente. El significado de N1 y N2 re-
sulta bastante intuitivo: marcan los lı́mites de los instantes en que se desea que
la salida siga a la referencia. Ası́, si se toma un valor grande de N1 es porque
no importa que haya errores en los primeros instantes, lo cual provocará una
respuesta suave del proceso. Nótese que para procesos con tiempo muerto d no
tiene sentido que N1 sea menor que dicho valor puesto que la salida no empezará
a evolucionar hasta el instante t + d. Además, si el proceso es de fase no mı́nima,
este parámetro permite eliminar de la función objetivo los primeros instantes de
respuesta inversa.
Los coeficientes (j ) y (j ) son secuencias que ponderan el comportamiento fu-
turo. Usualmente se consideran valores constantes o secuencias exponenciales.
Por ejemplo se puede conseguir un peso exponencial de (j ) a lo largo del hori-
zonte usando:
(j ) = N2;j
Si está comprendido entre 0 y 1 indica que se penaliza más a los errores más
alejados del instante t que a los más próximos, dando lugar a un control más
suave y con menor esfuerzo. Si, por el contrario, > 1 es que se penalizan más
los primeros errores, provocando un control más brusco.
Todos estos valores pueden ser usados como parámetros de sintonización, ob-
teniendo un abanico muy amplio de posibilidades con las que se puede cubrir
una extensa gama de opciones, desde un control estándar hasta una estrategia
diseñada a medida para un proceso en particular.
Trayectoria de referencia: Una de las ventajas del control predictivo es que si
se conoce a priori la evolución futura de la referencia, el sistema puede empezar
a reaccionar antes de que el cambio se haya efectivamente realizado, evitando
los efectos del retardo en la respuesta del proceso. En muchas aplicaciones la
evolución futura de la referencia r(t + k ) es conocida de antemano, como en
Robótica, servos o procesos en batch; en otras aplicaciones aunque la referencia sea
constante, se puede conseguir una sensible mejora de prestaciones simplemente
conociendo el instante de cambio de valor y adelantándose a esa circunstancia.
En el criterio de minimización (2.3), la mayorı́a de los métodos suelen usar una
trayectoria de referencia w(t + k ) que no tiene por qué coincidir con la referencia
real. Normalmente será una suave aproximación desde el valor actual de la salida
y(t) a la referencia conocida mediante un sistema de primer orden:
w(t) = y(t) w(t + k) = w(t + k ; 1) + (1 ; )r(t + k) k = 1 : : : N (2:4)
es un parámetro comprendido entre 0 y 1 (mientras más próximo a 1 más
suave será la aproximación) que constituye un valor ajustable que influirá en
la respuesta dinámica del sistema. En la figura 2.3 se muestra la forma de la
trayectoria cuando la referencia r (t + k) es constante y para dos valores distintos
de ; para valores pequeños de este parámetro se tiene un seguimiento rápido
(w1 ) mientras que si aumenta, la trayectoria de referencia será w2 dando lugar a

una respuesta más suave.
r(t+k)
w1(t+k)
w2 (t+k)
y(t)
Figura 2.3: Trayectoria de referencia
Restricciones: En la práctica, todos los procesos están sujetos a restricciones. Los

actuadores tienen un campo limitado de acción ası́ como una determinada ve-
locidad de cambio (slew rate), como es el caso de las válvulas, limitadas por las
posiciones de totalmente abierta o cerrada y por la velocidad de respuesta. Razo-
nes constructivas, de seguridad o medioambientales o bien los propios alcances de
los sensores pueden causar lı́mites en las variables de proceso, tales como niveles
en depósitos, caudales en tuberı́as o temperaturas y presiones máximas. Además,
normalmente las condiciones de operación vienen definidas por la intersección
de ciertas restricciones por motivos fundamentalmente económicos, con lo que el
sistema de control operará cerca de los lı́mites. Todo lo expuesto anteriormente
hace necesaria la introducción de restricciones en la función a minimizar.
Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo

cual han tenido gran éxito en la industria. Normalmente se considerarán lı́mites
en la amplitud y el slew rate de la señal de control y lı́mites en las salidas:
umin u(t) umax 8t

dumin u(t) ; u(t ; 1) dumax 8t
ymin y(t) ymax 8t
con la adición de estas restricciones a la función objetivo, la minimización resulta

más compleja, no pudiendo obtenerse la solución analı́ticamente como en el caso
sin restringir.
18 Revisión de los principales algoritmos
2.1.3 Obtención de la ley de control
Para obtener los valores u(t + k j t) será necesario minimizar la funcional J de la

ecuación (2.3). Para ello se calculan los valores de las salidas predichas ŷ (t + k j t)
en función de valores pasados de entradas y salidas y de señales de control futuras,
haciendo uso del modelo que se haya elegido y se sustituyen en la función de coste,
obteniendo una expresión cuya minimización conduce a los valores buscados. Para el
criterio cuadrático si el modelo es lineal y no existen restricciones se puede obtener una
solución analı́tica, en otro caso se debe usar un método iterativo de optimización.
De cualquiera de las maneras la obtención de la solución no resulta trivial pues

existirán N2 ; N1 + 1 variables independientes, valor que puede ser elevado (del orden
de 10 a 30). Con la idea de reducir estos grados de libertad se puede proponer cierta
estructura a la ley de control. Además se ha encontrado que esta estructuración de la
ley de control produce una mejora en la robustez y en el comportamiento general del
sistema, debido fundamentalmente a que el hecho de permitir la libre evolución de
las variables manipuladas (sin estructurar) puede conducir a señales de control de alta
frecuencia no deseables y que en el peor de los casos podrı́an conducir a la inestabilidad.
Esta estructura de la ley de control se plasma en el uso del concepto de horizonte de

control (Nu), que consiste en considerar que tras un cierto intervalo Nu < N2 no hay
variación en las señales de control propuestas, es decir:
4u(t + j ; 1) = 0 j > Nu
lo cual es equivalente a dar pesos infinitos a las cambios en el control a partir de cierto
instante. El caso lı́mite serı́a considerar Nu igual a 1 con lo que todas las acciones
futuras serı́an iguales a u(t)1 .
2.2 Revisión de los principales algoritmos
Se presentan a continuación los principales algoritmos de control predictivo, mostrando

sus principales caracterı́sticas pero sin entrar en detalles. Se pueden encontrar estudios
comparativos en [10], [7], [11] y [16]. En el tema siguiente se estudiarán en detalle los
dos métodos considerados más representativos: DMC y GPC.
Dynamic Matrix Control
Este método usa la respuesta ante escalón (2.2) para modelar el proceso, considerando
sólo los N primeros términos, asumiendo por tanto que el proceso es estable. En
1
Recuérdese que debido al horizonte deslizante, la señal de control se recalcula en el siguiente
muestreo.
cuanto a las perturbaciones, se considera que su valor permanence constante e igual al

existente en el instante actual durante todo el horizonte, es decir, igual al valor medido
de la salida (ym ) menos el estimado por el modelo ŷ (t j t)).
n̂(t + k j t) = n̂(t j t) = ym(t) ; ŷ(t j t)

y por tanto el valor predicho de la salida será:
X
k X
N
ŷ(t + k j t) = gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + n̂(t + k j t)
i=1 i=k+1
donde el primer término contiene las acciones de control futuras (que serán calculadas),
el segundo los valores pasados de las acciones de control (conocidas) y el último
representa las perturbaciones. La función de coste puede considerar sólo errores futuros
o incluir también el esfuerzo de control, en cuyo caso toma la forma genérica (2.3).
Una de las caracterı́sticas de este método que lo ha hecho muy popular en la industria
es la inclusión de restricciones, que se traduce en inecuaciones de la forma genérica:
X
N
Cyij ŷ(t + k j t) + Cuij u(t + k ; i) + cj 0 j = 1 : : : Nc
i=1
En este caso la optimización debe ser numérica y se lleva a cabo en cada periodo de
muestreo, enviándose la señal u(t) y recalculando todo en el nuevo periodo de muestreo,
como en todos los métodos MPC. Los principales inconvenientes de este método son el
tamaño del modelo empleado y la imposibilidad de tratar procesos inestables.
Model Algorithmic Control
Este método se conoce también como Model Predictive Heuristic Control y el producto
comercial se llama IDCOM (Identification-Command). Es muy similar al DMC con la
diferencia principal de usar un modelo de respuesta impulsional (2.1). Introduce el
concepto de trayectoria de referencia como un sistema de primer orden que evoluciona
desde la salida actual al setpoint según una determinada constante de tiempo. La
varianza del error entre esta trayectoria y la salida es lo que marca la minimización de
la función objetivo. Las perturbaciones se pueden tratar como en el método anterior o
se pueden estimar según la siguiente expresión:
n̂(t + k j t) = n̂(t + k ; 1 j t) + (1 ; )(ym(t) ; ŷ(t j t))

con n̂(t j t) = 0. es un parámetro ajustable (0 < 1) relacionado con el tiempo de
respuesta, el ancho de banda y la robustez del bucle cerrado [7]. El método también
considera restricciones en los actuadores, en las variables internas o en salidas secun-
darias.
Puntos de coincidencia
Figura 2.4: Puntos de coincidencia
Predictive Functional Control
Este controlador fue desarrollado por Richalet [18] para procesos rápidos. Emplea un
modelo en el espacio de estados, por lo que permite el manejo de procesos inestables, y
también la extensión al caso no lineal. Este esquema de control tiene dos caracterı́sticas
que lo distinguen del resto de controladores de la familia: el uso de puntos de coincidencia
y de funciones base.
El concepto de puntos de coincidencia (ver figura 2.4) se emplea para simplificar

los cálculos considerando sólo un subconjunto de puntos en el horizonte de predicción
hj , j = 1 : : : nH . La salida deseada y la predicha deben coincidir en dichos puntos, no
en todo el horizonte de predicción.
La otra idea innovadora de este método es la parametrización de la señal de con-

trol como una combinación lineal de ciertas funciones base, que son elegidas según la
naturaleza del proceso y la referencia:
X
nB
u(t + k) = i(t)Bi(k)
i=1
Normalmente estas funciones son de tipo polinómico: escalones (B1 (k ) = 1), rampas
(B2 (k ) = k) o parábolas (B3 (k ) = k2 ), ya que la mayorı́a de referencias se pueden
especificar como combinación de estas funciones. Con esta estrategia, un perfil de
entrada complejo se puede especificar usando un pequeño número de parámetros
desconocidos i que son las incógnitas del problema de minimización.
La función a minimizar es:

X
nH
J= ŷ t hj ) ; w(t + hj )]2
( +
j =1
El algoritmo PFC también puede manejar restricciones de máximo y mı́nimo en la

aceleración, que son prácticas en aplicaciones de servocontrol.
Extended Prediction Self Adaptive Control
El algoritmo EPSAC usa un modelo de función de transferencia
A(z;1 )y(t) = B (z;1 )u(t ; d) + v(t)

donde d es el retardo y v (t) la perturbación. Este modelo puede ampliarse para tratar
perturbaciones medibles añadiendo un término D (z;1 )d(t) para incluir efecto feedfor-
ward. La predicción se obtiene según se muestra en [10] y la estructura de la ley de
control es muy simple, ya que se considera que la señal de control permanecerá cons-
tante a partir del instante t (es decir, horizonte de control igual a 1): 4u(t + k ) = 0 para
k > 0. Para obtener la señal de control de minimiza una función de coste de la forma:
XN

(k)w(t + k) ; P (z;1)ŷ(t + k j t)]2
k=d
donde P (z ;1 ) es un polinomio de diseño con ganancia unitaria y
(k) es una secuencia
de ponderación. La señal de control se puede calcular analı́ticamente de la forma:
P
N
h
(k)w(t + k) ; P (z;1)ŷ(t + k j t)]
k
u(t) = k=d P
N

(k)h2 k
k=d
siendo hk los coeficientes de la respuesta impulsional del sistema.
Extended Horizon Adaptive Control
Esta formulación también emplea un modelo de función de transferencia y pretende

minimizar la discrepancia entre la salida calculada y la referencia en el instante t + N :
ŷ(t + N j t) ; w(t + N ), con N d. La solución a este problema no es única (a menos
que N = d)[21]; una posible estrategia es considerar horizonte de control igual a 1:
4u(t + k ; 1) = 0 1<k N ;d
o minimizar el esfuerzo de control

;d
NX
J= u2(t + k)
k =0
Este método utiliza un predictor de N pasos de la forma
ŷ(t + N j t) = y(t) + F (z;1) 4 y(t) + E (z;1 )B (z;1 ) 4 u(t + N ; d)

donde E (z ;1 ) y F (z ;1 ) son polinomios que satisfacen la relación
;1 ;1 ;1 ;1 ;N F (z;1 )(1 ; z;1 )
(1 ; z ) = A(z )E (z )(1 ; z ) + z
con el grado de E igual a N ; 1. Una ventaja de este método es que se puede encontrar
fácilmente una solución explı́cita, dada por
u(t) = u(t ; 1) + 0(w(t + NNP

) ; ŷ (t + N j t))
;d 2
i
k=0
siendo k el coeficiente correspondiente a 4u(t + k) en la ecuación de predicción. Por
tanto la ley de control depende sólo de los parámetros del proceso y puede hacerse
fácilmente adaptativa si se emplea un identificador en lı́nea. El único coeficiente de
ajuste es el horizonte de predicción N , lo cual simplifica el uso pero proporciona poca
libertad para el diseño. Obsérvese que no puede usarse trayectoria de referencia porque
el error se considera sólo en un instante (t + N ), ni tampoco la ponderación del esfuerzo
de control.
Generalized Predictive Control
Este método propuesto por Clarke et al. [5] emplea un modelo CARIMA (Controlled
Auto-Regressive Integrated Moving Average) para la predicción de la salida:
A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1 ) e4

(t)
donde la perturbación viene dada por un ruido blanco coloreado por el polinomio
C (z;1 ). Como en la práctica es difı́cil encontrar el verdadero valor de este polinomio, se
puede emplear como parámetro de diseño para rechazo de perturbaciones o mejora de
la robustez. La predicción óptima se lleva a cabo resolviendo una ecuación diofántica,
lo cual puede hacerse eficazmente de forma recursiva.
Este algoritmo, al igual que otros que usan el modelo de función de transferen-
cia, se puede implementar fácilmente en forma adaptativa usando un algoritmo de
identificación en lı́nea como los mı́nimos cuadrados recursivos.
GPCusa una función de coste cuadrática de la forma

XN2 X
Nu
J (N1 N2 Nu) = (j )ŷ(t + j j t) ; w(t + j )]2 + (j )4u(t + j ; 1)]2
j =N1 j =1
donde las secuencia de ponderación (j ) y (j ) se eligen normalmente constantes
o exponenciales y la trayectoria de referencia w (t + j ) se puede generar como una
secuencia que empieza en el valor actual de la salida y tiende exponencialmente al
setpoint.
Las bases teóricas del algoritmo GPC has sido ampliamente estudiadas y se puede
demostrar (ver [4]) que, para distintos conjuntos de parámetros, el algoritmo es estable
y que otros controladores como por ejemplo el dead beat son casos incluidos en éste.
2.3 Estado de la tecnologı́a
Se puede considerar que productos como el MAC-IDCOM o el DMC están ampliamente in-
troducidos en la industria, proporcionando un buen control de sistemas multivariables
sin restricciones y constituyen la primera generación de controladores predictivos.
Sin embargo, la gestión de restricciones es algo que todavı́a no estaba bien resuelto
en estos productos hasta que apareció una versión de DMC denominada QDMC, ligera
variación del algoritmo básico en el que se consideran restricciones duras y blandas de
forma sistemática. Este algoritmo se suele considerar como la segunda generación.
Conforme la tecnologı́a MPC iba despertando mayor interés y aceptación, los proble-
mas que se abordaban eran cada vez más complejos, apareciendo nuevas problemáticas
como el tratamiento de la no-factibilidad, la consideración de modelos apropiados para
procesos inestables o la representación de la perturbación para la realimentación de otra
forma más adecuada que un valor constante. También se consideraba importante la
respuesta ante fallos, de forma que el controlador fuera capaz de reconfigurarse si se
perdiera alguna señal, o la dificultad de incluir diversos requerimientos de control en
una única función objetivo.
Estos problemas motivaron el desarrollo de algoritmos como HIECON (Hierarchical

Constrained Control, por Adersa) o IDCOM-M (por parte de Setpoint). Este último
incluye un supervisor para plantas mal condicionadas, función objetivo multicriterio o
jerarquı́a de restricciones. El SMOC de Shell es similar incluyendo caracterı́sticas como
modelos en espacio de estados (válidos para sistemas inestables) o la consideración de
un observador extendido para la realimentación de la salida en lugar del valor constante
empleado en los demás métodos. Estos métodos junto con el PCT de Profimatics, el
RMPCT de Honeywell o el PFC de Adersa constituyen la tercera generación.
Los productos que existen hoy dı́a en el mercado comparten las ideas básicas de
DMC o MAC desarrollados hace más de veinte años y el mayor énfasis en los últimos
años se ha centrado en la consideración de otros tipos de modelos, incluyendo modelos
no lineales, y en una mejor integración del controlador con los equipos de control
existentes.
A pesar de su creciente implantación, la tecnologı́a actual tiene todavı́a ciertas

limitaciones, siendo las más destacables las siguientes:
Modelos sobre-parametrizados. La mayorı́a de los productos comerciales usan

modelos de convolución, que emplean una cantidad considerable de parámetros
y no se pueden usar para representar dinámicas inestables.
Sintonización. No existe una clara relación entre los parámetros de sintonı́a y el

comportamiento del bucle cerrado. La garantı́a de estabilidad, sobre todo cuando
existen restricciones, es otro gran problema.
24 Estado de la tecnologı́a
Optimalidad de la solución. Muchos paquetes proporcionan una solución sub-

óptima para acelerar el cálculo. En algunos casos este procedimiento no está
justificado.
Incertidumbres en el modelo. Normalmente no se tiene en cuenta la incertidum-

bre asociada a la identificación, sino que se desintoniza el controlador intentando
aumentar la robustez.
Perturbación constante. Aunque es la hipótesis más sensata a priori, se podrı́a

obtener una mejor realimentación si la distribución de la perturbación se estudiara
con más cuidado.
Tema 3
Algoritmos
En este tema se tratan en profundidad los dos algoritmos considerados más represen-
tativos de las metodologı́as existentes en Control Predictivo. Representan a las dos
familias de controladores predictivos, una de origen claramente industrial y la otra más
académica.
3.1 Dynamic Matrix Control
El método DMC se desarrolló a finales de los setenta by Cutler and Ramaker [6] de Shell
Oil Co. y ha sido aceptado ampliamente en el mundo industrial, principalmente por
las industrias petroquı́micas. Actualmente DMC es algo más que un algoritmo y parte
de su éxito se debe al hecho de que el producto comercial resuelve otros temas como
identificación u optimización global de la planta. En esta sección sólo se analiza el
algoritmo standard sin abordar detalles técnicos propios del producto de mercado que
no son de dominio público.
Pero a pesar de este éxito en la práctica, este método adolece quizás de la ausencia
de un análisis teórico maś completo que estudie la influencia de los parámetros de
diseño (horizontes, secuencias de ponderación) sobre la estabilidad del bucle cerrado
ası́ como de resultados de robustez.
3.1.1 Predicción
El modelo de proceso que se emplea es el de respuesta temporal, considerando la

perturbación como constante a lo largo del horizonte. El procedimiento para obtener
la predicción se describe a continuación.
25
26 Dynamic Matrix Control
Como se emplea un modelo de respuesta ante escalón:

1
X
y(t) = gi 4 u(t ; i)
i=1
los valores predichos a lo largo del horizonte serán:
1
X
ŷ(t + k j t) =gi 4 u(t + k ; i) + n̂(t + k j t) =
i=1
X
k X1
= gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + n̂(t + k j t)
i=1 i=k+1
Las perturbaciones se consideran constantes, n̂(t + k j t) = n̂(t j t) = ym (t) ; ŷ(t j t),

por lo que se puede escribir:
Xk X1
ŷ(t + k j t) = gi 4 u(t + k ; i) + gi 4 u(t + k ; i) + ym(t) ;
i=1 i=k+1
X1 X
k
; gi 4 u(t ; i) = gi 4 u(t + k ; i) + f (t + k)
i=1 i=1
donde f (t + k ) es la respuesta libre del proceso, es decir, la parte de la respuesta que no
depende de las acciones de control futuras, y viene dada por:
1
X
f (t + k) = ym(t) + gk+i ; gi) 4 u(t ; i)
( (3:1)
i=1
Si el proceso es asintóticamente estable, los coeficientes gi de la respuesta ante

escalón tienden a un valor constante después de N periodos de muestreo, por lo que
se puede considerar que
gk+i ; gi 0 i>N
y por tanto la respuesta libre se puede calcular como
X
N
f (t + k) = ym(t) + gk+i ; gi) 4 u(t ; i)
(
i=1
Nótese que si el proceso no es estable, entonces no existe N y no se puede calcu-

lar f (t + k) (aunque existe una generalización en el caso de que la inestabilidad sea
producida por integradores puros).
Ahora las predicciones se pueden calcular a lo largo del horizonte de predicción

(k =1 : : : p), considerando m acciones de control.
ŷ(t + 1 j t) = g1 4 u(t) + f (t + 1)
Algoritmos 27
ŷ(t + 2 j t) = g2 4 u(t) + g1 4 u(t + 1) + f (t + 2)

..
.
X
p
ŷ(t + p j t) = gi 4 u(t + p ; i) + f (t + p)
i=p;m+1
Si se define la matriz dinámica G como:

2 3
66 gg12 g01

0
77
66 . . 0
77
66 .. .. ... ..
77
G = 66 gm gm;1
.
g1 77
66 .. .. .. 77
4 . . ...
. 5
gp gp;1 gp;m+1
se puede escribir que:

y^ = Gu + f (3:2)
G
Obsérvese que está formada por m (horizonte de control) columnas de la respuesta
ante escalón apropiadamente desplazadas hacia abajo. y^
es un vector de dimensión
u
p que contiene las predicciones de la salida, representa el vector de incrementos de
f
control y es el vector de respuestas libres. Esta es la expresión que relaciona las
respuestas futuras con los incrementos en las señales de control, por lo que usará para
calcular las acciones necesarias para conseguir el comportamiento deseado del sistema.
3.1.2 Perturbaciones medibles
El efecto de las perturbaciones medibles se puede añadir fácilmente a las anteriores

ecuaciones de predicción, ya que éstas se pueden tratar como entradas al sistema. La
expresión (3.2) se puede usar para calcular la predicción del efecto de las perturbaciones
en la salida de la siguiente forma:
y^d = Dd + fd
y^
donde d es la contribución de las perturbaciones medibles a la salida, es una matriz D
similar a G
que contiene los coeficientes de la respuesta del sistema a un escalón en
d
la perturbación, es el vector de incrementos en la perturbación y d es la parte de laf
respuesta que no depende de la perturbación.
En el caso más general de perturbaciones medibles y no medibles, la respuesta libre

completa del sistema (la fracción de la salida que no depende de la variable manipulada)
se puede considerar como la suma de cuatro efectos: la respuesta a la entrada u(t), a la

perturbación medible d(t), a la perturbación no medible y al estado actual del proceso:
f = fu + D d + fd + fn
Por tanto la predicción se puede expresar en la forma general
y^ = Gu + f
3.1.3 Algoritmo de control
El éxito en la industria del DMC se ha debido principalmente a su aplicación a siste-

mas multivariables de gran dimensión con la consideración de restricciones. En esta
sección se describe el algoritmo de control comenzando por el caso más simple de un
sistema monovariable sin restricciones y extendiéndolo posteriormente al caso general
multivariable con restricciones.
El objetivo del controlador DMC es llevar el proceso los más cerca posible al setpoint
en el sentido de mı́nimos cuadrados con la posibilidad de incluir una penalización en los
movimientos de la señal de control. Por ello se seleccionan las variables manipuladas
de forma que minimicen un objetivo cuadrático que puede incluir sólo los errores
futuros p X
J= ŷ t j j t) ; w(t + j )]2
( +
j =1
o también el esfuerzo de control, presentando la forma genérica
X
p X
m
J= ŷ t j j t) ; w(t + j )]
( +
2
+ 4u(t + j ; 1)]2
j =1 j =1
Si no existen restricciones, la minimización de la función de coste J = T + T , ee uu

e
donde es el vector de errores futuros a lo largo del horizonte de predicción y es el u
vector de futuros incrementos en la señal de control 4u(t) : : : 4u(t + m), se puede
hacer de forma analı́tica calculando la derivada de J y haciéndola igual a 0, lo que
proporciona el resultado general:
u = (GT G + I ); GT (w ; f )
1
(3:3)
Recuérdese que, como en todas las estrategias predictivas, sólo se envı́a al proceso
u
el primer elemento del vector (4u(t)). No es aconsejable implementar la secuencia
completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma
exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que
provocan que la salida real difiera de las predicciones que se emplean para calcular la
Algoritmos 29
w +
u y
K Proceso
-
f
Calculo
Resp. libre
Figura 3.1: Ley de control
secuencia futura de acciones de control. Además, el setpoint puede cambiar durante

los próximos m intervalos.
Resulta interesante analizar en qué consiste realmente la ley de control. Analizando

la expresión 3.3 se observa que el primer elemento del vector u, que es la señal que
efectivamente se envı́a a la planta, es el producto de la primera fila de la matriz
(GT G + I );1 GT (llamémosle K ) por la diferencia entre la trayectoria de referencia y la
respuesta libre, que es el error futuro si no hubiera incrementos en la señal de control.
Se puede decir por tanto que el incremento de la señal de control es proporcional (por
medio de K ) a los errores futuros y por tanto habrá cambios en la señal de control
siempre que el controlador detecte que va a haber una discrepancia en el futuro entre el
objetivo deseado y el comportamiento esperado del sistema. Esta idea queda reflejada
en la figura 3.1.
El caso con restricciones
Aunque computacionalmente más complicado que otros algoritmos más simples, la

capacidad de manejar restricciones que posee este método (y MPC en general) lo hace
muy atractivo para aplicaciones prácticas, ya que en general el punto de operación
óptimo según criterios económicos se encuentra normalmente en la intersección de las
restricciones, como se muestra en la figura 3.2. Por razones de seguridad, es necesario
mantener una zona segura alrededor del punto de operación, ya que el efecto de las
perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona
se puede reducir (y por tanto aumentar los beneficios económicos) si el controlador es
capaz de manejar restricciones (punto de operación 1).
Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades

de forma genérica
X
N
Cyij ŷ(t + k j t) + Cuij u(t + k ; i) + cj 0 j = 1 : : : Nc
i=1
P. operacion
Zona segura 1 optimo
Punto operacion 1
Restriccion
zona Punto operacion 2
segura 2
Restriccion
Figura 3.2: Punto de operación óptimo de un proceso tı́pico
que deben tenerse en cuenta para la minimización. Como se ha visto, las salidas se
pueden expresar en función del vector de incrementos de control a través de la matriz
dinámica, por que las restricciones tanto en la entrada como en la salida se pueden
recoger en una desigualdad matricial de la forma Ru
, como se verá con más c
detalle en el tema dedicado a restricciones. Ahora la minimización es un problema de
Programación Cuadrática QP, cuya solución es numérica.
Todo lo relacionado con las restricciones será abordado con mayor grado de detalle
en el tema dedicado a ello.
Extensión al caso multivariable
El esquema previo se puede extender fácilmente al caso de sistemas con varias entradas
y varias salidas. Las ecuaciones básicas se mantienen igual a excepción de que las
matrices y vectores cambian de dimensión para poder incluir todas las entradas y
salidas.
Al tratarse de modelos lineales, se puede aplicar el principio de superposición para

obtener el valor de las salidas ante las diversas entradas. Para ello se define el vector
de salidas futuras como:
y^ = y (t + 1 j t) : : : y (t + p j t) : : : yny (t + 1 j t) : : : yny(t + pny j t)T

1 1 1
y el de señales de control de la forma:
u = [4u (t) : : : 4u (t + m
1 1 1 ; 1) : : : 4unu(t) : : : 4unu(t + mnu ; 1)]T
ası́ como la respuesta libre:
f = f (t + 1 j t) : : : f (t + p j t) : : : fny (t + 1 j t) : : : fny (t + pny j t)T

1 1 1
teniendo en cuenta que la respuesta libre de la salida i depende tanto de valores pasados
de yi como de valores pasados de todas las señales de control.
Algoritmos 31
Con estas definiciones, la ecuación de predicción es igual que en el caso monova-

riable simplemente considerando que la matriz G toma la forma:
2 G G G1nu 3
66 G1121 G1222 G2nu 77
G = 66 .. 77
4 . ..
.
... ..
. 5
Gny1 Gny2 Gnynu
Cada submatriz Gij contiene los coeficientes de la respuesta ante escalón i-ésima
correspondiente a la entrada j-ésima. El proceso de minimización es análogo sólo que
la ponderación tanto de los errores como de los esfuerzos de control se realiza con
matrices de peso.
3.2 Control Predictivo Generalizado
El Control Predictivo Generalizado GPC fue propuesto por Clarke et al. en 1987 y se ha
convertido en uno de los métodos más populares en el ámbito del Control Predictivo
tanto en el mundo industrial como en el académico. Se ha empleado con éxito en
numerosas aplicaciones industriales, mostrando buenas prestaciones a la vez que un
cierto grado de robustez respecto a sobreparametrización o retardos mal conocidos.
Puede resolver muchos problemas de control diferentes para un amplio campo de
procesos con un número razonable de variables de diseño, que son especificadas por
el operario dependiendo del conocimiento previo del proceso y de los objetivos de
control.
La idea básica del GPC es calcular una secuencia de futuras acciones de control
de tal forma que minimice una función de coste multipaso. El ı́ndice a minimizar es
una función cuadrática que mide por un lado la distancia entre la salida predicha del
sistema y una cierta trayectoria de referencia hasta el horizonte de predicción, y por
otro el esfuerzo de control necesario para obtener dicha salida.
El Control Predictivo Generalizado tiene muchas ideas en común con otros contro-
ladores predictivos previamente mencionados ya que está basado en las mismas ideas
pero posee a su vez algunas diferencias. Como se verá más adelante, es capaz de
proporcionar una solución explı́cita (en ausencia de restricciones), puede trabajar con
procesos inestables o de fase no mı́nima e incorpora el concepto de horizonte de control
ası́ como la consideración en la función de coste de ponderación de los incrementos en
las acciones de control. Las diversas posibilidades disponibles para el GPC conducen a
una gran variedad de objetivos de control comparado con otras realizaciones, algunas
de las cuales pueden ser consideradas como subconjuntos o casos lı́mites del GPC.
32 Control Predictivo Generalizado
3.2.1 Formulación del Control Predictivo Generalizado
La mayorı́a de los procesos de una sola entrada y una sola salida (single-input single-
output, SISO), al ser considerados en torno a un determinado punto de trabajo y tras ser
linealizados, pueden ser descritos de la siguiente forma:
A(z;1 )y(t) = z;d B (z;1 )u(t ; 1) + C (z;1)e(t)

donde u(t) y y (t) son respectivamente la señal de control y la salida del proceso y e(t) es
un ruido blanco de media cero. A, B y C son los siguientes polinomios en el operador
de desplazamiento hacia atrás z ;1 :
A(z;1 ) = 1 + a1 z ;1 + a2 z ;2 + ::: + ana z ;na

B (z;1 ) = b0 + b1 z;1 + b2 z;2 + ::: + bnbz;nb
C (z;1) = 1 + c1 z ;1 + a2 z ;2 + ::: + cncz ;nc
donde d es el tiempo muerto del sistema.
Este modelo es conocido como Autorregresivo de Media Móvil (Controller Auto-

Regressive Moving-Average CARMA). En muchas aplicaciones industriales en las que
las perturbaciones son no-estacionarias resulta más conveniente el uso de un modelo
CARMA integrado, dando lugar al CARIMA, que viene descrito por:
A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1) e4

(t)
con 4 = 1 ; z;1 (3:4)
Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. Nótese

que en el caso de que C ;1 pueda ser truncado se puede absorber en A y B .
El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia

de señales de control que minimice una función de coste de la forma:
X
N 2 X
Nu
J (N1 N2 Nu) = (j )ŷ(t + j j t) ; w(t + j )]
2
+ (j )4u(t + j ; 1)]2 (3:5)
j =N1 j =1
donde ŷ (t + j j t) es la predicción óptima j pasos hacia delante de la salida del proceso

con datos conocidos hasta el instante t, N1 y N2 son los horizontes mı́nimo y máximo
de coste, Nu es el horizonte de control y (j ) y (j ) son las secuencias de ponderación
mientras que w(t + j ) es la futura trayectoria de referencia, que se puede calcular según
se muestra en la figura 2.3. En muchas situaciones se considera (j ) igual a 1 y (j )
constante.
El objetivo es pues el cálculo de la futura secuencia de control u(t), u(t + 1),... de tal
manera que la salida futura del proceso y (t + j ) permanezca próxima a w (t + j ). Esto
se logra minimizando J (N1 N2 Nu).
Algoritmos 33
Predicción óptima
Con la intención de minimizar la función de coste, se obtendrá previamente la pre-

dicción óptima de y (t + j ) para j N1 y j N2 . Considérese la siguiente ecuación
diofántica:
1 = Ej (z ;1 ) 4 A + z ;j Fj (z ;1 ) (3.6)
1 = Ej (z ;1 )Ã + z ;j Fj (z ;1 )
Los polinomios Ej y Fj están únicamente definidos con grados j ; 1 y na respec-

tivamente. Se pueden obtener dividiendo 1 entre Ã(z ;1 ) hasta que el resto pueda
ser factorizado como z;j Fj (z ;1 ). El cociente de la división es entonces el polinomio
Ej (z;1 ).
Si se multiplica la ecuación (3.4) por Ej (z ;1 ) z j 4
Ã(z;1 )Ej (z;1 )y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j ) (3.7)
Teniendo en cuenta (3.6), la ecuación (3.7) queda:

(1 ; z;j Fj (z;1 ))y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j )
La cual se puede escribir como

y(t + j ) = Fj (z;1 )y(t) + Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j ) (3:8)
Al ser el grado del polinomio Ej (z ;1 ) igual a j ; 1 los términos del ruido en la

ecuación (3.8) están todos en el futuro. La mejor predicción de y (t + j ) será por
consiguiente:
ŷ(t + j j t) = Gj (z;1 ) 4 u(t + j ; d ; 1) + Fj (z;1 )y(t)
donde Gj (z ;1 ) = Ej (z ;1 )B (z ;1 )
Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursiva-

mente, de forma que los nuevos valores en el paso j + 1 (Ej +1 y Fj +1) sean función de
los del paso j . A continuación se muestra una demostración simple de la recursividad
de la ecuación diofántica. Existen otras formulaciones del GPC que no están basadas en
la recursividad de esta ecuación.
Considérense que los polinomios Ej y Fj se han obtenido dividiendo 1 entre Ã(z ;1 )

hasta que el resto haya sido factorizado como z;j Fj (z ;1 ) .
Con:
Fj (z;1 ) = fj0 + fj1z;1 + + fjnaz;na
Ej (z;1 ) = ej0 + ej1z;1 + + ejj;1z;(j;1)
Supóngase que se utiliza el mismo procedimiento para obtener Ej +1 y Fj +1, es decir,

dividir 1 entre Ã(z ;1 ) hasta que el resto se pueda factorizar como z;(j +1) Fj +1 (z ;1 ) con
Fj+1(z;1 ) = fj+10 + fj+11z;1 + + fj+1naz;na
Está claro que solamente es necesario dar un paso más en la división para obtener
los polinomios Ej +1 y Fj +1 . Al ser Ej +1 el nuevo cociente de la división, será igual al
cociente que habı́a hasta el momento (Ej ) más un nuevo término, que será el fj0 pues
el divisor (Ã) es mónico. Por tanto:
Ej+1(z;1 ) = Ej (z;1 ) + ej+1j z;j con ej +1j = fj0

Teniendo en cuenta que el nuevo resto será el resto anterior menos el producto del
cociente por el divisor, los coeficientes del polinomio Fj +1 se pueden expresar como:
fj+1i = fji+1 ; fj0 ãi+1 i = 0 na
En resumen, la forma de obtener los polinmios Ej y Fj es la siguiente:
1. Comenzar con E1 = 1, F1 = z(1 ; Ã)

2. Ir añadiendo nuevos términos a Ej con ej +1j = fj0
3. Calcular fj +1i = fji+1 ; fj0 ãi+1 i = 0 na, (siendo fjna+1 = 0).
El polinomio Gj +1 puede ser obtenido recursivamente como sigue:
Gj+1 = Ej+1B = (Ej + fj0z;j )B = Gj + fj0z;j B
Es decir, los primeros j coeficientes de Gj +1 serán idénticos a los de Gj mientras que

el resto viene dado por:
gj+1j+i = gjj+i + fj0 bi para i = 0 nb
Para resolver el GPC es necesario obtener el conjunto de señales de control u(t),

u(t + 1), ...,u(t + N ) que minimizan la ecuación (3.5). Al tener el proceso un retardo de
d perı́odos de muestreo, la salida sólo se verá influenciada por la señal u(t) después del
instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes pueden ser definidos
como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido hacer N1 < d + 1 ya que
los términos de (3.5) sólo dependerán de las señales de control pasadas. Por otro lado,
haciendo N1 > d + 1 los primeros puntos de la secuencia de salida, que serán los mejor
estimados, no se tendrán en cuenta.
Algoritmos 35
El conjunto de las j predicciones óptimas:

ŷ(t + d + 1 j t) = Gd+1 4 u(t) + Fd+1 y(t)
ŷ(t + d + 2 j t) = Gd+2 4 u(t + 1) + Fd+2 y(t)
..
.
ŷ(t + d + N j t) = Gd+N 4 u(t + N ; 1) + Fd+N y(t)
puede ser escrito en forma matricial como:
y = Gu + F(z; )y(t) + G0(z; ) 4 u(t ; 1)
1 1
(3 :9)
Donde
2 ŷ(t + d + 1 j t) 3 2 4u(t)
3
66 ŷ(t + d + 2 j t) 77 66 4u(t + 1) 77
y = 66 7
7 u = 66 77
4 ..
. 5 4 ..
. 5
ŷ(t + d + N j t) 4u(t + N ; 1)
2 g 0 ::: 0 3
66 g1 g0 ::: 0 77
0
G = 66 .. .. .. 77
4 . ..
. . . 5
g g ::: g
2 N ;1 N ;2 z(G0 (z;1 ) ; g ) 3
d+1
66 z2 (Gd+2 (z;1 ) ; g0 ; g1z;1 )
0
77
G0(z; )
1
= 66
4 ..
.
77
5
; ;
z (G (z ) ; g0 ; g1z ; ; gN ;1z
N ;(N ; 1)
2 F (dz+;N1 ) 3
1 1
)
66 Fdd++12 (z;1 ) 77
F( z ; )
1
= 66
4 ..
.
77
5
Fd+N (z ) ; 1
Al depender los últimos términos de la ecuación (3.9) sólo del pasado, pueden
agruparse en f, dando lugar a:
= + y Gu f (3:10)
Obsérvese que es la misma expresión que se obtuvo para el DMC, aunque en este
caso la respuesta libre es distinta.
Obtención de la ley de control
Entonces la ecuación (3.5) puede escribirse como:

Gu f w Gu f w) + uT u
J = ( + ; )T ( + ; (3:11)
donde:
h iT
w = w(t + d + 1) w(t + d + 2) w(t + d + N ) (3.12)
La ecuación (3.11) se puede poner como:
J = 12 uT Hu + bu + f0 (3:13)
donde:
H = GG I
2( T + )
b = f w G
2( ; )T
f0 = f w f w)
T
( ; ) ( ;
El mı́nimo de J , siempre que no existan restricciones en la señal de control, puede

ser calculado igualando a cero el gradiente de J , lo cual conduce a:
u = ;H; bT1
(3:14)
Debido al uso de la estrategia deslizante, sólo se aplica realmente el primer elemento del
vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo.
La solución propuesta involucra la inversión (o al menos la triangularización) de una
matriz de dimensión N N , lo cual conlleva una gran carga de cálculo. El concepto ya
usado en otros métodos de horizonte de control se emplea con la finalidad de reducir
la cantidad de cálculo, asumiendo que las señales de control permanecerán en un valor
constante a partir del intervalo Nu < N . Por tanto la dimensión de la matriz que hay
que invertir queda reducida a Nu Nu, quedando la carga de cálculo reducida (en el
caso lı́mite de Nu = 1, se reduce al caso escalar) aunque restringiendo la optimalidad.
3.2.2 Ejemplo de cálculo
Se presenta a continuación un ejemplo de cálculo de un Controlador Predictivo Ge-

neralizado en un caso sencillo. Se diseñará el controlador para un sistema de primer
orden.
Al discretizar el proceso continuo se obtiene el siguiente equivalente discreto:
(1 + az;1 )y(t) = (b0 + b1 z;1 )u(t ; 1) + e4

(t)
Se va a considerar un retardo d igual a 0 y un polinomio de ruido C (z;1 ) igual a 1.
Se usará el algoritmo descrito previamente para obtener la ley de control, obteniendo

resultados numéricos para valores de los paámetros a = 0:8, b0 = 0:4 y b1 = 0:6, siendo
Algoritmos 37
los horizontes N1 = 1 y N = Nu = 3. Como se ha mostrado, se calcularán los valores

predichos de la salida del proceso en el horizonte haciendo uso de la ecuación (3.9),
obteniendo la ley de control de la expresión (3.14).
Resolviendo la ecuación (3.6) se obtienen los polinomios del predictor Ej (z;1 ),

Fj (z;1 ) desde j = 1 hasta j = 3, con
Ã(z;1 ) = A(z;1 )(1 ; z;1 ) = 1 ; 1:8z;1 + 0:8z;2
En este caso sencillo donde el horizonte no es demasiado largo, estos polinomios se
pueden obtener directamente dividiendo 1 por Ã(z ;1 ). Como se ha explicado antes,
también se pueden calcular recursivamente, comenzando con los valores obtenidos en
el primer paso de la división, es decir:
E1 (z;1 ) = 1 F1(z;1 ) = 1:8 ; 0:8z;1
Cualquiera que sea el método empleado, los valores obtenidos son:
E2 = 1 + 1:8z;1 F2 = 2:44 ; 1:44z;1

E3 = 1 + 1:8z;1 + 2:44z;2 F3 = 2:952 ; 1:952z;1
Con estos valores y el polinomio B (z;1 ) = 0:4 + 0:6z ;1 , los elementos Gi (z ;1 ) resultan
ser:
G1 = 0:4 + 0:6z;1 G2 = 0:4 + 1:32z;1 + 1:08z;2 G3 = 0:4 + 1:32z;1 + 2:056z;2 + 1:464z;3

y por tanto se pueden escribir las salidas predichas como:
2 3 2 32 3
ŷ(t + 1 j t) 0:4 0 0 4u(t)
64 ŷ(t + 2 j t) 75 =
64 1:32 0:4 0 75 64 4u(t + 1) 75 +
ŷ(t + 3 j t) 2:056 1:32 0:4 4u(t + 2)
2 3
0:6 4 u(t ; 1) + 1:8y (t) ; 0:8y (t ; 1)
+
64 1:08 4 u(t ; 1) + 2:44y(t) ; 1:44y(t ; 1) 75
| 1:464 4 u(t ; 1) + 2:952
{z y(t) ; 1:952y(t ; 1) }
f
El paso siguiente es el cálculo de H; b. Tomando igual a 0:8 se tiene que:

1
2 3
0:133 0:286 0:147
;1 T 6
(G G + I) G = 4 ;0:154 ;0:165 0:286 5
T 7
;0:029 ;0:154 0:1334
Como sólo se necesita el valor de 4u(t) para los cálculos, sólo se emplea realmente la
primera fila de la matriz, con lo que resulta la siguiente expresión para la ley de control:
4u(t) = ;0:6042 4 u(t ; 1) ; 1:371y (t) + 0:805y (t ; 1) +

+ 0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)
donde w(t + i) es la trayectoria de referencia que se puede considerar bien constante

e igual a la referencia actual o bien una suave aproximación de primer orden a ésta.
Entonces la señal de control resulta ser una función de la referencia deseada y de
entradas y salidas pasadas, dada por:
u(t) = 0:3958u(t ; 1) + 0:6042u(t ; 2) ; 1:371y (t) + 0:805y (t ; 1) +

+ 0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)
Al mismo resultado se puede llegar sin emplear la ecuación diofántica, calculando

G en base a los coeficientes de la respuesta ante escalón (que se pueden calcular en
función de los coeficientes de la función de transferencia) y calculando la respuesta
libre como se muestra en [2].
3.2.3 Caso multivariable
Al igual que en el DMC todo lo visto para el caso de sistemas con una sola entrada y
una sola salida se puede extender al caso multivariable, aunque los cálculos son más
complejos.
En este caso el modelo CARIMA para un sistema de m entradas y n salidas se puede

expresar como:
;1A ;1
(z )y (t) = (z )u(t ; 1) + B1 ;1
(z )e(t) C (3:15)
4
donde (z ;1 ) y (z ;1 ) son matrices polinomiales mónicas de dimensión n n y
A C B(z; )
1
es una matriz polinomial de dimensión n m, definidos como:
A(z; )1
Inn + A1 z;1 + A2z;2 + + Ana z;na
=
B(z; )
1
= B0 + B1 z
;1 + B2z;2 + + Bnb z;nb
C(z; )
1
= Inn + C1 z
;1 + C2z;2 + + Cnc z;nc
Las variablesy (t), u(t) y e(t) son de dimensión n 1, m 1 y n 1 respectivamente.
La predicción conlleva la resolución de una ecuación diofantina matricial, que también
puede calcularse de forma recursiva.
En muchas ocasiones el problema radica en la obtención adecuada del modelo en

esta forma a partir de una matriz de transferencia en continuo que puede haberse
obtenido a partir de la curva de reacción. Una forma de hacerlo se muestra en [2].
Una vez obtenido el modelo, el criterio a minimizar tendrá la forma general
X
N 2 X
N 3
J (N1 N2 N3 ) = kŷ (t + j j t) ; w (t + j )k2R + k 4 u(t + j ; 1)k2Q

j =N1 j =1
Algoritmos 39
donde R y Q son matrices de ponderación definidas positivas que normalmente se

eligen diagonales. La minimización se realiza igual que en el caso monovariable dando
como resultado un vector de señales de control a enviar a la planta en el instante actual:
u1(t), u2(t) : : : um(t).
Tema 4
Restricciones en Control Predictivo
En la práctica todos los procesos están sujetos a restricciones. Los actuadores tienen
un campo limitado de acción impuesto por lı́mites fı́sicos (por ejemplo una válvula no
puede abrir más de un 100 % o un calentador no puede aportar más de su potencia
máxima. También existen lı́mites de seguridad (por ejemplo presiones o temperaturas
máximas), requerimientos tecnológicos (por ejemplo mantener temperaturas en un
rango dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa
medioambiental.
4.1 Tratamiento convencional de restricciones
El tratamiento convencional de restricciones en control de procesos se basa en que las

restricciones en la variable manipulada (entrada) se cumplen saturando la salida del
controlador. Sin embargo, las restricciones en la variable controlada (salida) no pueden
abordarse; se intenta evitar su violación trabajando alejados de los lı́mites (en zona
segura), operando lejos de la restricción. Por seguridad se trabaja con una consigna
inferior, más lejos del punto de operación óptimo, lo que normalmente equivale a una
disminución de la calidad y/o cantidad en la producción, ya que normalmente el punto
óptimo se encuentra en la intersección de las restricciones obligando a acercarse lo más
posible a las éstas pero sin superarlas.
Si el controlador fuera capaz de tener en cuenta las restricciones y evitar su violación,

el proceso podrı́a operar más cerca de éstas y por tanto de forma más eficiente. La figura
4.1 muestra un ejemplo donde existe una limitación de presión máxima y se observa
cómo al alejar el punto de operación del lı́mite la producción Q disminuye.
En cuanto a la forma de operar de un controlador predictivo que no considera res-

tricciones el procedimiento es similar: si la señal de control calculada viola la restricción,
se satura. Las señales futuras ni siquiera se tienen en cuenta, ya que normalmente no
41
42 Restricciones en Control Predictivo
P
Pmax
P1
P2
t Q1 Q2 Q
Figura 4.1: Restricciones y punto de operación óptimo
se calculan. Esta forma de proceder no garantiza el carácter óptimo de la solución y en

ningún caso garantiza el cumplimiento de las restricciones en la salida. La violación de
los lı́mites de las variables controladas puede ser más costoso y peligroso, produciendo
daños en equipos y pérdidas en la producción.
La figura 4.2 muestra con claridad el fenómeno de pérdida de la solución óptima

cuando las variables manipuladas se mantienen en sus lı́mites por el programa de
control o por el propio actuador. Este hecho puede llevar a valores mayores de la
función objetivo y a un comportamiento no deseado (incluso inestabiliad). En 4.2a se
muestra un caso con horizonte de control igual a 2, donde se observa que si se satura
la señal de control u(t) a umax el valor de la función de coste no es el mejor que se
podrı́a conseguir (que serı́a el correspondiente a uc ). Incluso puede que no se viole
la restricción en el instante actual pero sı́ en el futuro (figura 4.2b) con lo que la señal
enviada al sistema (sin saturar) no es la mejor para el problema de dimensión 2 que se
está optimizando.
4.2 Restricciones en Control Predictivo
En la actualidad el MPC es la única metodologı́a capaz de incorporar las restricciones

de forma sistemática en la fase de diseño del controlador, siendo esta caracterı́stica una
de las razones de su gran éxito en la industria. Parece lógico que al disponer de un
modelo dinámico del proceso se pueda conocer la evolución futura de su salida y por
tanto se pueda saber si ésta va a violar o no las restricciones y actuar en consecuencia.
Para formular el algoritmo MPC con restricciones hay que expresar éstas en función
de la variable sobre la que se puede actuar, es decir, en función de u. Las restricciones
en la entrada están ya expresadas en función de u y para las restricciones en la salida
se hace uso de las ecuaciones de predicción que expresan el valor futuro de las salidas
Restricciones en Control Predictivo 43
u(t+1) u(t+1)
u max u max
uc u uc u
u max u(t) u max u(t)
a) b)
Figura 4.2: Restricciones en la señal de control
en función de las señales de control futuras y valores conocidos en el instante t.
Cualquier controlador predictivo calcula la predicción como:

y = Gu + f
por lo que tanto entradas como salidas se pueden expresar en función del vector de
incrementos de la señal de control.
Las restricciones que aparecen serán básicamente amplitud y velocidad de cambio

en la señal de control y amplitud en la salida y se pueden expresar como:
U u(t) U 8t
u u(t) ; u(t ; 1) u 8t
y y(t) y 8t
Para un proceso de m entradas y n salidas y restricciones en el horizonte N , las

restricciones se pueden expresar como:
1U T u + u(t ; 1) 1 1U
1u u 1u
1y Gu + f 1y
l
donde es una matriz de dimensión (N n) m formada por N m m matrices
identidad y T es una matriz triangular inferior por bloques cuyos elementos no nulos
son matrices identidad de dimensión m m. En forma condensada se pueden expresar
como:
Ru c (4:1)
44 Resolución del problema
siendo
2 I 3 2 l u 3
66 ;INNNN
77 66 7
66 T 77 66 l U ;;lul (ut ; 1) 777
R = 66 ;T 77 c = 66 7
66 77 66 ;l U + lu(t ; 1) 777
4 G 5 4 ly;f 5
;G ;l y + f
Aparte de las restricciones en amplitud, a la salida se le pueden aplicar otro tipo de

restricciones de para forzar un determinado comportamiento temporal (movimiento
dentro de una banda, comportamiento monótono, evitar respuesta inicial inversa, etc.)
como se muestra en [12], pudiendo expresarlas también de la forma genérica (4.1).
Además de la clasificación en restricciones en la entrada y en la salida según a qué

tipo de variable se apliquen, se puede hacer otra clasificación atendiendo a la forma de
tratarlas. Ası́, se puede hablar de:
Restricciones duras como aquéllas que no se pueden violar bajo ningún concepto.
En este grupo se incluyen las restricciones relacionadas con la operación segura
del proceso.
Restricciones blandas, que son aquéllas que pueden ser violadas en un momento
dado por no ser cruciales, pero la violación se penaliza en la función objetivo
como un término más. Es una forma de relajar la restricción.
4.3 Resolución del problema
Con la adición de restricciones el problema general de control predictivo cambia se

puede formular como
u)
minimizar J (
Ru c
sujeto a
Es decir, el problema consiste en la minimización de una función cuadrática con

restricciones lineales, lo que se conoce como Programación Cuadrática, QP. En este caso
no se puede encontrar una solución analı́tica como en el caso sin restricciones, sino que
hay que recurrir a métodos iterativos.
Resulta evidente que la carga de cálculo será considerable, ya que hay que encontrar
la solución resolviendo el algoritmo iterativo en cada periodo de muestreo. Normal-
mente el esfuerzo está justificado por el beneficio económico obtenido al trabajar más
cerca del punto de operación óptimo.
Para resolver el problema QP existen diversos algoritmos suficientemente probados.

Una revisión de estos métodos se puede encontrar en [2].
Un problema asociado a la implementación del control con restricciones es el análisis

de la estabilidad del bucle cerrado. Como es necesario utilizar métodos numéricos
para resolver el problema de la optimización, la ley de control resultante no se puede
describir de forma explı́cita, haciendo el problema muy difı́cil de atacar mediante la
teorı́a clásica de control.
En los últimos años se ha trabajado mucho sobre la estabilidad en estas circuns-

tancias, proponiéndose soluciones basadas en la teorı́a de Lyapunov. La idea básica
consiste en que la función de coste cuando el horizonte es infinito es monótona decre-
ciente (si existe solución factible) y se puede interpretar como función de Lyapunov
que garantiza por tanto la estabilidad. Sin embargo, como la solución tiene que ser
numérica, el número de variables de decisión tiene que ser finito, por lo que se han pro-
puesto dos ideas. En la primera, se descompone la función objetivo en dos partes: una
con horizonte finito y restricciones y otra con horizonte infinito y sin restricciones. La
segunda idea es en esencia equivalente y consiste en imponer restricciones terminales
al estado y usar un horizonte infinito.
En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las
incertidumbres en el modelo y los temas asociados con la factiblidad.
4.4 Gestión de restricciones
Durante la etapa de optimización puede aparecer problemas de no existencia de so-

lución óptima para unas restricciones dadas (no existe compatibilidad entre las restric-
ciones), por ejemplo por el planteamiento de unos objetivos inalcanzables para unas
restricciones dadas. Existen otras posibles causas de inexistencia de solución, como es
el caso de que una perturbación saque al proceso fuera de la zona de trabajo usual.
La factibilidad de un problema de optimización significa que la función objetivo

esté acotada y que todas las restricciones sean satisfechas.
La no factibilidad puede aparecer en régimen permanente o en el transitorio. El

problema de la falta de solución en régimen permanente puede venir provocado por
un objetivo de control irrealizable. Sin embargo, este tipo de no factibilidad puede
ser fácilmente eliminado en la etapa de diseño evitando la inclusión de tales objetivos.
También puede ser debido a cambios en referencias que hagan incompatibles las res-
tricciones (se quiera llevar alguna variable a un punto que es imposible de alcanzar con
una entrada que está acotada).
En el régimen transitorio puede aparecer no factibilidad incluso cuando las res-

tricciones impuestas parezcan razonables. Restricciones que no causan problemas en
46 Gestión de restricciones
operación normal pueden producir problemas bajo ciertas circunstancias. Puede que
una perturbación o cambio de referencia grande fuerce a una variable fuera de su lı́mite
y sea imposible introducirla de nuevo en su zona permitida con señales de control de
energı́a limitada. En estos casos las restricciones se hacen temporalmente incompati-
bles.
Las soluciones no factibles aparecen con mayor frecuencia en casos en que el óptimo
se encuentre cerca de las restricciones y el sistema esté sujeto a perturbaciones, llevando
a la salida a "regiones prohibidas".
4.4.1 Técnicas de búsqueda de soluciones factibles
Los métodos de gestión de restricciones tratan de recuperar la factibilidad actuando

sobre las restricciones según diferentes criterios.
Los lı́mites de las restricciones se pueden considerar de los siguientes tipos:
Limites fisicos: nunca se pueden sobrepasar, principalmente por motivos de

seguridad o por la propia construcción de los equipos (p.ej. actuadores)
Limites de operación: son fijados por los operarios para mantener las condiciones
nominales de funcionamiento. Se pueden sobrepasar bajo ciertas circunstancias
Limites reales: son los que usa el algoritmo de control en cada instante. Son los
que proporciona el gestor de restricciones, quien debe calcularlos de forma que
nunca superen los limites fı́sicos.
Es decir, el gestor de restricciones calculará los lı́mites reales (los que se envı́an al
algoritmo QP) en base a los lı́mites de operación pero sin salirse nunca de los lı́mites
fı́sicos, según se observa en la figura 4.3.
Se analizan a continuación posibles soluciones para este problema, que se pueden

agrupar en:
1. Desconexión del controlador.
2. Eliminación de restricciones.
3. Relajación de restricciones.
4. Otras técnicas.
Límites físicos
Restricciones reales
Límites de operación
Figura 4.3: Gestión de restricciones
Desconexión del controlador
La forma más sencilla de resolver de este tipo de problemas es pasar el controlador

a posición manual cuando aparecen las incompatibilidades de restricciones y volver a
operación automática cuando se recupera la admisibilidad de la solución.
Este método, como se puede comprender tiene serias desventajas. Normalmente,

cuando aparecen problemas de incompatibilidad de restricciones es porque el sistema
en bucle cerrado se encuentra en un estado crı́tico donde normalmente el operador
tendrá muy poca experiencia en la operación. Adicionalmente, si las restricciones están
relacionadas con aspectos de seguridad o económicos, las decisiones llevadas a cabo
cuando aparecen problemáticas de compatibilidad de restricciones suelen ser crı́ticas
dado que en estos casos alguno de los objetivos del control no puede ser satisfecho.
El método suele ser utilizado cuando los problemas de incompatibilidad de restric-

ciones no son frecuentes.
Eliminación de restricciones
La factibilidad se analiza en cada periodo de muestreo, por lo que la eliminación de

restricciones se realiza de forma temporal. Periódicamente se chequea la factibilidad
para poder reinsertar restricciones eliminadas.
La eliminación de un grupo de restricciones ha de realizarse en aquellos casos en que

el conjunto completo de restricciones que se imponen sobre el sistema sea incompatible.
Cada vez que existe un problema de incompatibilidad de restricciones, se forma un
conjunto de restricciones no admisibles que no se tienen en cuenta en el proceso de
optimización. Se pueden distinguir en la metodologı́a de eliminación de restricciones

varios tipos.
Eliminación indiscriminada Con esta estrategia todas las restricciones se eliminan

cada vez que aparezcan problemas de existencia de solución factible, quedando la
optimización de un problema sin restricciones. No es un método muy óptimo para
resolver el problema de la existencia de solución admisible, pero es la forma más rápida
de tener en cuenta incompatibilidad de restricciones.
La eliminación indiscriminada de restricciones no es adecuada en todas las aplicacio-

nes. No debe ser por ejemplo usada en casos en que las restricciones estén directamente
relacionadas con lı́mites de seguridad.
Eliminación jerárquica En este caso sólo se eliminan las restricciones que provocan
problemas de incompatibilidad. En este método se asigna en la etapa de diseño una
prioridad a cada restricción, que da un grado de importancia relativa de dicha res-
tricción frente a las otras. Esta prioridad se usará para clasificar las restricciones de una
forma jerárquica (se asigna un número que indica su posición en la jerarquı́a). De este
modo, cada vez que haya problemas de factibilidad o existencia de solución el gestor
de restricciones va eliminando por orden las restricciones menos prioritarias hasta que
se restablece la factibilidad de la solución, que se chequea cada periodo de muestreo
para reinsertar restricciones que hubieran sido temporalmente eliminadas.
En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes

tipos de reglas para establecer el número de restricciones que se eliminan, si conviene
eliminar más restricciones a costa de no eliminar una con prioridad superior, etc.
Relajación de restricciones
Otro método para tener en cuenta el problema de existencia de solución es la relajación

de las restricciones. Se puede hacer una relajación de los lı́mites de forma tempo-
ral o convertir restricciones duras ( Ru c
), cambiándolas en restricciones blandas
Ru c
( + , con 0) para asegurar la existencia de solución, añadiendo un término
T
T a la función de coste de forma que se penalice la violación de la restricción y
obtener un mejor comportamiento del sistema controlado. A largo plazo, el término
de penalización en la función objetivo llevará las variables auxiliares a cero.
Otras técnicas
Existen técnicas que se basan en la manipulación del horizonte mı́nimo de las restriccio-
nes. Algunos controladores industriales como el QDMC usan el concepto de constraint
window. La constraint window comienza en algún punto en el futuro y continúa hasta el

estado estacionario. Si existe dinámica del tipo de fase no mı́nima, se pueden mejorar
las prestaciones desplazando la ventana hacia el futuro, lo que equivale a ignorar las
restricciones duras en la salida durante la fase inicial de la respuesta.
Tema 5
Tendencias actuales y nuevas

perspectivas
En la actualidad existen muchos campos abiertos en Control Predictivo, tanto en lo

referente a aplicaciones prácticas como a lı́neas de investigación. Todavı́a queda mucho
por estudiar en campos como identificación de modelos, estimación del estado y de
las perturbaciones no medibles o tratamiento sistemático de las incertidumbres. El
estudio de estabilidad o robustez de la solución es complicado, sobre todo en el caso de
inclusión de restricciones, ya que la ley de control es en general variable con el tiempo
y no se puede representar el sistema de la forma clásica de bucle cerrado.
Este tema está dedicado a dos áreas de especial interés: la consideración de funciones
objetivos multicriterio y un campo que está empezando a tener gran relevancia en la
práctica como es el Control Predictivo No lineal.
5.1 Multiobjetivo. Jerarquı́a de objetivos
Las estrategias que se han considerado hasta ahora están basadas en la minimización
de una función de coste de un único objetivo para la obtención de la mejor secuencia
de acciones de control. Sin embargo, en muchas situaciones el comportamiento del
proceso no se puede medir con una sola función objetivo sino que, la mayorı́a de las
veces, existen diversos (y a menudo contrapuestos) objetivos de control. Las razones
de la existencia de diversos objetivos de control pueden ser:
Los procesos deben operar de forma diferente en distintos momentos. Por ejem-
plo, durante la fase de arranque puede interesar una estrategia de tiempo mı́nimo
y en el régimen nominal el objetivo puede ser reducir en lo posible la varianza de
las variables controladas.
51
52 Multiobjetivo. Jerarquı́a de objetivos
El objetivo de control puede variar aun el caso de estar trabajando en régimen

nominal, dependiendo del valor de las variables. Por ejemplo, aunque el objetivo
de control sea minimizar la suma ponderada de los errores de las variables, si
una de ellas alcanza un valor muy alto (por ejemplo debido a una perturbación)
el objetivo de control será disminuir el valor de esta variable lo antes posible.
En muchas situaciones el objetivo de control no es minimizar la suma de errores, sino

mantener ciertas variables dentro de unos lı́mites especificados. Esto es equivalente
a las restricciones blandas. Este tipo de objetivo se puede expresar penalizando la
cantidad que se sobrepasa cada variable del setpoint. Considérese, por ejemplo, que el
objetivo es mantener la variable y (t) entre sus lı́mites yl e yh . En este caso, el objetivo
de control se puede escribir como:
XN2 XN2
J = p(y(t + j ) ; yh) (y(t + j ) ; yh)2 + p(yl ; y(t + j )) (y(t + j ) ; yl )2
j =N1 j =N1
siendo p la función escalón (vale 1 cuando el argumento es mayor o igual que 0 y vale
0 en caso contrario).
Nótese que ahora la función objetivo no es cuadrática y por tanto no se puede

emplear para su minimización un algoritmo de programación cuadrática, aunque se
puede transformar en uno de este tipo añadiendo unas variables de holgura h (j ) y
l (j ):
y(t + j ) yh + h (j )
y(t + j ) yl ; h (j )
La secuencia óptima de control se obtiene con la minimización de
XN2
J = (h(j )2 + l (j )2)
j =N1
con la condición de que las variables de holgura sean no negativas (y el resto de las
restricciones si las hubiera). En definitiva lo que se ha hecho es transformar el problema
en un QP con más restricciones y variables.
En muchas ocasiones todos los objetivos de control se pueden agrupar en una sola
función de coste. Algunos de los objetivos pueden ser mantener las variables lo más
cerca posible de los setpoints o dentro de unas determinadas regiones de operación.
Cada uno de estos objetivos equivale a minimizar una cierta función Ji (sujeta a una serie
de restricciones). Entonces la secuencia de control se puede obtener de la minimización
de: mX
J= i Ji
i=1
sujeta a todo el conjunto de restricciones. La importancia relativa de cada objetivo se
puede ponderar mediante la adecuada elección de los i , aunque en la práctica es difı́cil
encontrar estos pesos. Además, muchas veces los objetivos de control son cualitativos,
haciendo la tarea aún más difı́cil.
Tendencias actuales y nuevas perspectivas 53
5.1.1 Jerarquı́a de objetivos
En muchas situaciones, se puede establecer una importancia relativa de unos objetivos

sobre otros por medio de una priorización o jerarquı́a. Es decir, los objetivos de mayor
prioridad (por ejemplo los relacionados con la seguridad) se deben satisfacer antes que
otros con menor prioridad. Aunque esto se puede resolver con ponderaciones, no es
un asunto trivial.
Tyler y Morari [20] proponen una forma de introducir múltiples objetivos jerarqui-
zados. Considérese un proceso con m objetivos Oi jerarquizados (el Oi+1 tiene mayor
prioridad que el Oi) que se pueden expresar como:
Riu ai
La idea consiste en introducir variables enteras Li que toman valor 1 cuando se satisface
el correspondiente objetivo de control y cero en caso contrario. Los objetivos se expresan
entonces como:
Riu ai + Ki(1 ; Li) (5:1)
donde Ki es una cota superior conservadora para Ri u ; ai . Si se cumple el objetivo i, se

tiene que Li = 1 y el objetivo reformulado coincide con el original. Con la introducción
de Ki el objetivo reformulado se satisface incluso cuando el correspondiente objetivo
Oi no lo hace (Li = 0).
La jerarquı́a de objetivos se puede establecer imponiendo las restricciones siguien-
tes:
Li ; Li+1 0
PL .
El problema es maximizar el número de objetivos de control satisfechos i
Si el modelo del proceso es lineal el problema se puede resolver con Programación
Lineal Entera Mixta (MILP). El conjunto de restricciones 5.1 se puede modificar para
mejorar el grado de satisfacción de restricciones de los objetivos que no pueden ser
satisfechos. Supóngase que no todos los objetivos se pueden satisfacer y que el Of es
el primero que falla. Con la idea de acercarse todo lo posible a la satisfacción de este
objetivo se introduce una variable de holgura que cumpla el siguiente conjunto de
restricciones: 0 i;1
1
X
Ru a
i i + + Ki @(1 ; i) + (1 ; Li ) ; Lj A (5:2)
j =1
con la función objetivo
X
m
J = ;K Li + f ()
i=1
donde f es una función de penalización de la variable de holgura (positiva y monótona
creciente) y K es su cota superior. El algoritmo de optimización intentará maximizar
54 Control predictivo no lineal
el número de objetivos satisfechos (Li = 1) antes de intentar reducir f () porque la

función objetivo global se puede hacer más pequeña incrementando el número de
variables Li distintas de cero que reduciendo la función de penalización. Como todos
los objetivos Oi están satisfechos para i < f , las restricciones (5.2) también se satisfacen.
Como Of es el primero que falla:
i;1
X
Li = f ; 1 para i f
i=1
Es decir, el término que multiplica a Ki es cero para i = f mientras que para ı́ndices
mayores es mayor que uno. Esto implica que todas las restricciones se satisfarán para
Ru a
i > f . La única restricción activa es f f + .
O sea, el método de optimización intentará optimizar el grado de satisfacción del
primer objetivo que falle sólo después de que todos los objetivos más prioritarios se
hayan satisfecho. Nótese que Li = 0 no implica que el objetivo i-ésimo no sea satisfecho,
sino que indica que la restricción correspondiente ha sido relajada.
Si el modelo del proceso y la función de penalización son lineales, el problema es del

tipo MILP, pero si f () es cuadrática se recurre a Programación Cuadrática Entera Mixta
(MIQP). Aunque existen algoritmos para Programación Mixta, el esfuerzo computacio-
nal es mucho mayor que el requerido para problemas LP o QP, por ello el número de
objetivos debe ser pequeño para poder implementar el método en tiempo real.
5.2 Control predictivo no lineal
En los últimos años el Control Predictivo Basado en Modelo se ha convertido en la

estrategia de control preferida para una gran cantidad de procesos industriales. Los
esquemas de MPC lineal, es decir, los vistos hasta ahora en los que la predicción está
basada en un modelo lineal del proceso, se usan de forma rutinaria como una opción
de control más a tener en cuenta en ciertos sectores de la industria y se puede decir que
sus fundamentos teóricos están suficientemente estudiados.
Por su parte, el Control Predictivo No Lineal (Nonlinear Model Predictive Control,

NMPC) surgió hace relativamente poco tiempo y existen pocas referencias de aplicacio-
nes industriales. Pero debido a su capacidad para tener en cuenta las no-linealidades
del proceso se espera que se convierta en una opción prometedora a corto plazo.
No hay nada en los conceptos básicos de MPC contra el uso de modelos no lineales,
por tanto la extensión de tales conceptos a procesos no lineales es en principio sencilla.
Sin embargo, como se verá seguidamente esto no es un asunto trivial y aún hay muchos
temas abiertos como:
La disponibilidad de modelos no lineales debido a la dificultad de técnicas de

identificación para procesos no lineales.
La complejidad de los cálculos necesarios para resolver el problema del control

predictivo de procesos no lineales.
La escasez de resultados de estabilidad y robustez.
En general los procesos industriales son no lineales, pero aún ası́ la mayorı́a de
las aplicaciones de control predictivo están basadas en el uso de modelos lineales,
del tipo de los vistos hasta ahora. Existen varias razones para ello: por un lado
resulta relativamente fácil identificar modelos lineales a partir de datos del proceso,
y por otro los modelos lineales dan buen resultado cuando el proceso opera en las
cercanı́as del punto de trabajo nominal. En el sector petroquı́mico, donde tiene lugar
la mayorı́a de las aplicaciones de MPC, el objetivo es mantener el proceso en torno al
estado estacionario (problema del regulador) más que realizar frecuentes cambios de un
punto de operación a otro (problema del servo) y por tanto un modelo lineal preciso es
suficiente. Además el uso de un modelo lineal junto con una función objetivo cuadrática
da lugar a un problema convexo de programación cuadrática (QP) cuya solución está
suficientemente estudiada en la actualidad, existiendo diversos productos comerciales
fiables. La existencia de algoritmos que garanticen una solución que converja en un
corto tiempo (menor que el periodo de muestreo) resulta crucial en procesos en los que
interviene un gran número de variables.
Sin embargo, existen situaciones en las que los efectos no lineales justifican el uso
de la tecnologı́a NMPC. Estas situaciones entran dentro de las dos categorı́as siguientes:
Procesos fuertemente no lineales y sujetos a grandes perturbaciones, como por

ejemplo el control de pH.
Problemas de seguimiento de consigna en los que el punto de operación cambia

con frecuencia y estos cambios sacan a relucir la dinámica no lineal del proceso,
como en el caso de la fabricación de polı́meros.
En estas situaciones una ley de control lineal puede no ser efectiva siendo necesario
el empleo de un controlador no lineal para mejorar el comportamiento o simplemente
para una operación estable del proceso. Es por tanto en este caso donde se puede
justificar el empleo de técnicas de NMPC. Aunque en la actualidad el número de
aplicaciones es aún reducido, el potencial es considerable, como se desprende del
informe de Qin y Badgwell [17], donde se observa que MPC no ha penetrado aún en
campos donde las no linealidades son fuertes y el mercado exige frecuentes cambios
del punto de operación; es aquı́ donde se espera el auge del NMPC.
5.2.1 Diferencias respecto al método lineal
Resulta evidente que la principal ventaja del NMPC frente al MPC radica en la posibilidad
de abordar dinámicas no lineales. A medida que aparecen nuevas herramientas que
hacen posible la obtención y representación de modelos no lineales, bien a partir de
primeros principios (leyes de conservación) o bien a partir de datos experimentales
(modelos de Volterra o redes neuronales) el interés por su utilización en NMPC se va
acrecentando.
Aunque la extensión de los conceptos de MPC al caso no lineal es directa, a la hora de

realizar el controlador aparecen una serie de problemas a tener en cuenta, que dan lugar
a una mayor dificultad en su implantación. Las principales dificultades derivadas del
empleo de modelos no lineales son:
La obtención de un modelo no lineal a partir de datos experimentales es un

problema abierto. La utilización de redes neuronales o series de Volterra no
parecen solucionar el problema de forma general. Por otra parte, la obtención de
modelos a partir de primeros principios no es siempre viable.
El problema de optimización es no convexo, cuya resolución es mucho más difı́cil

que un problema de programación cuadrática. Aparecen problemas relativos a la
obtención del óptimo global, lo que influye no sólo en la calidad del control, sino
también en problemas relacionados con la estabilidad.
La dificultad del problema de optimización se traduce en un aumento considera-

ble del tiempo de cálculo, hecho que puede dar lugar a que la aplicación de esta
técnica quede restringida a un conjunto de sistemas con dinámica lenta.
El estudio de temas fundamentales como estabilidad o robustez se complica

enormemente. Este tema constituye un campo abierto de gran interés para los
investigadores.
5.2.2 Fundamentos teóricos
Se puede definir un algoritmo genérico NMPC que englobe a todas las técnicas que
comparten las mismas ideas. El proceso (en general multivariable) se puede describir
por un modelo en el espacio de estados de la forma:
x(t + 1) = f (x(t) u(t) d(t) w(t))

y(t) = g(x(t)) + e(t)
donde x es el vector de estados de dimensión n, u es el vector de mu entradas, d son las
perturbaciones medibles y w(t)) las no medibles. El vector de salidas es y de dimensión
my , la misma que la del vector de ruidos de medida e.
El problema que hay que resolver es el cálculo de la secuencia de señales de control

u x
que llevan al proceso desde su estado actual al estado deseado s . El punto de trabajo
y x u
deseado ( s , s , s ) viene en general determinado por una optimización estática basada
normalmente en criterios económicos. Este punto de trabajo debe ser recalculado
periódicamente ya que las perturbaciones pueden hacer cambiar el punto óptimo de
operación.
Las perturbaciones medibles se pueden eliminar incluyendo su efecto en la función

f , mientras que el resto se rechaza con la realimentación, normalmente considerando
que la perturbación permanecerá constante a lo largo del horizonte. Esto se formalizar
añadiendo un término constante (bias) e igual al error entre medida y salida calculada
a toda la predicción:
y(t + j ) = g(x(t + j )) + b(t) donde b(t) = ym(t) ; y(t)
El problema consiste en la minimización de una función objetivo que de la forma
más genérica será:
X
P ;1
MX ;1
MX
J= ky(t + j ) ; ys kq
Q+ u
k 4 (t + j )kqS + ku(t + j ) ; uskqR + kskqT (5:3)
j =1 j =1 j =1
donde q puede ser 1 ó 2 según el tipo de norma que se esté utilizando y Q, S, R y T

son matrices de ponderación. La minimización estará sujeta a la restricción del modelo:
x(t + j ) = f (x(t + j ; 1) u(t + j ; 1) d(t + j ; 1) w(t + j ; 1))y(t + j ) = g(x(t + j )) + b(t)
y al resto de restricciones en entradas y salidas que se quieran considerar:
y ; s y(t + j ) y ; s 8j = 1 P
u u(t + j ) u 8j = 1 M ; 1
4u 4u(t + j ) 4u 8j = 1 M ; 1
Obsérvese que se ha considerado la violación de las restricciones en la salida con el

término s, que entra en juego en la minimización apareciendo en la función de coste
con una penalización dada por la matriz T.
Igual que en caso lineal, la solución del problema es una secuencia de acciones de
control de las cuales sólo la primera de ellas es enviada a la planta, desechando el resto
y volviendo a la resolver el problema en el siguiente periodo de muestreo.
5.2.3 Problemática asociada al NMPC
La resolución del NMPC plantea nuevos problemas que no existı́an en el caso lineal
relacionados por un lado con la metodologı́a de cálculo de la señal de control y por
otro con el comportamiento dinámico del bucle cerrado, básicamente su estabilidad.
Resolución
La introducción de un modelo no lineal en el algoritmo de optimización conduce a la

pérdida de convexidad, no pudiendo ser resuelto por los algoritmos de programación
cuadrática (QP), para los cuales existen soluciones fiables y suficientemente estudiadas.
Esta pérdida de convexidad hace que sea mucho más difı́cil encontrar una solución y
que, una vez encontrada, no se pueda garantizar que sea un óptimo global.
En estas circunstancias el tiempo de cálculo aumenta considerablemente debido

principalmente a dos motivos
Para la obtención de la secuencia de acciones de control óptima, el paquete de

programación no lineal debe evaluar repetidamente la función objetivo y en cada
evaluación se debe resolver el sistema de ecuaciones no lineales que componen
el modelo de predicción, lo cual conlleva mucho tiempo de cálculo.
A partir de los datos obtenidos a través de la evaluación de la función objetivo, el

programa de optimización debe calcular el gradiente de la función y los próximos
puntos de búsqueda, además de comprobar la violación o no de las restricciones
y los criterios de finalización del algoritmo. Estas tareas consumen más tiempo
de cálculo que en el caso lineal.
Estabilidad de la solución
El otro problema fundamental es el de la estabilidad de la solución. Aún en el caso de

que el algoritmo de minimización encuentre la solución óptima, este hecho no garantiza
la estabilidad del bucle cerrado (incluso en el caso de que el modelo sea perfecto). Este
problema ha sido abordado desde distintos puntos de vistos de vista, existiendo en la
actualidad diferentes propuestas, las cuales se describen a continuación.
1. Horizonte infinito
Existe una solución propuesta por Meadows et al. ([13]) que consiste en ampliar
los horizontes de control y de predicción hasta el infinito, P M ! 1. En este caso la
función objetivo también sirve como función de Lyapunov, dando lugar a la estabilidad
nominal. En el artı́culo citado se demuestra que si existe solución inicial factible
entonces existe solución en cada periodo de muestreo posterior.
La idea básica es que si el problema de minimización es factible en el instante t

entonces la función de coste es finita y
Jt+1 Jt + x(t)t Rx(t) + u(t)t Su(t)

Por tanto la función de coste es monótona decreciente y se puede interpretar como una
función de Lyapunov, garantizando por consiguiente la estabilidad asintótica.
A la hora de la verdad este concepto tiene principalmente un interés teórico so-

bre el que basar un desarrollo práctico, ya que no es viable una implementación con
horizonte infinito. Para llevarlo a la práctica se puede tomar un horizonte lo suficien-
temente grande, pero esta elección no tiene por qué garantizar la estabilidad, ya que
las trayectorias de la entrada y el estado diferirán de las trayectorias predichas incluso
si no hay incertidumbres ni perturbaciones.
2. Restricción terminal
Otra solución al problema, propuesta por Keerthi y Gilbert ([8]) consiste en añadir
una restricción terminal al estado en el algoritmo NMPC de la forma:
x(k + P ) = xs
Con la imposición de esta restricción, la función objetivo se convierte en una función
de Lyapunov para el sistema en bucle cerrado, conduciendo a la estabilidad nominal.
Con la introducción de esta restricción el estado al final del horizonte finito es cero y
por tanto también lo será la señal de control, con lo que el sistema (sin perturbaciones)
se queda para siempre en el origen. De esta forma es como si el horizonte de predicción
fuera infinito.
El problema de este método es que en la práctica la introducción de esta restricción

artificial añade un coste computacional considerable y, lo que es más importante aún,
da lugar a una región de operación muy restrictiva, por lo que en la realidad resulta
muy difı́cil satisfacer esta condición.
3. Control dual
La dificultad de la aproximación anterior llevó a Michalska y Mayne ([14]) a buscar

una restricción menos estricta. La idea es definir un entorno W alrededor del estado
x
final deseado s dentro del cual el sistema pueda ser llevado a dicho estado por medio de
un controlador lineal por realimentación del vector de estados. Por tanto la restricción
que se añade a la formulación es:
x t P ) ; xs ) 2 W
( ( +
Si el estado actual se encuentra fuera de esta región se usa el algoritmo NMPC con la
restricción anterior. Una vez que el estado se encuentra en W , el control conmuta a una
estrategia lineal determinada previamente (estrategia del tipo dual-mode controller).
Este método conlleva por tanto la gestión de la conmutación entre los dos controla-
dores y la determinación de la región W y de la matriz de ganancia de la realimentación
del vector de estados (una forma de hacerlo se puede encontrar en el artı́culo citado).
4. Horizonte casi-infinito
Chen y Allgower ([3]) extendieron el concepto anterior, proponiendo un esquema

de control con horizonte casi-infinito. Se hace uso de la idea de región terminal y
controlador estabilizante, pero sólo para el cálculo del coste terminal. La señal de
control se determina resolviendo el problema de optimización en lı́nea (con horizonte
finito) sin conmutar al controlador lineal incluso dentro de la región terminal.
El procedimiento consiste en añadir el término kx(t + Tp )k2P a la función de coste,

cuyo objetivo es extender el horizonte de predicción hasta el infinito y por tanto evitar
la conmutación del controlador. Se puede demostrar que, eligiendo adecuadamente la
matriz de ponderación P , este término es una cota superior de lo que costarı́a llevar
al sistema no lineal con el controlador lineal hasta el origen partiendo de un estado
perteneciente a la región terminal y la función de coste con horizonte finito se aproxima
a una de horizonte infinito, en cuyo caso la estabilidad queda asegurada. Esto se puede
interpretar como si el horizonte de predicción se expandiera casi hasta el infinito (es
decir, es como si se minimizara un coste de horizonte infinito resolviendo un problema
de horizonte finito).
5. Contracción del estado
La idea consiste en imponer la siguiente restricción:
kx(t + N )k2 kx(t)k2 2 (0 1)

Esta restricción fuerza a la magnitud del vector de estado a contraerse según el factor
elegido cada vez que se calcula la señal de control. La estabilidad queda garantizada
siempre que el problema sea factible, lo que no viene impuesto necesariamente porque
sea factible en k = 0, ya que las restricciones que se le imponen al estado son muy
estrictas y pueden hacer perder factibilidad. Esto se puede mejorar con valores grandes
de , pero entonces la disminución de la magnitud del estado es menor. En general
se puede decir que en muchas situaciones reales la condición es muy restrictiva y la
no-factibilidad aparece con facilidad.
Robustez
Si el estudio de la estabilidad en NMPC resulta de por sı́ complicado, más aún lo es el de

la robustez, es decir, la estabilidad cuando existen errores de modelado. Los resultados
de estabilidad de la sección anterior son válidos sólo en el caso de que el modelo del
proceso sea perfecto. Resulta evidente que esto nunca va a ser cierto en la práctica, por
lo que es necesario alguna forma de afrontar la existencia de incertidumbres.
Se puede considerar el problema de la robustez como algo todavı́a sin resolver

para NMPC, aunque existen algunos resultados preliminares. Algunos de los esquemas
que garantizan establidad se pueden hacer robustos con algunos cambios, como por
ejemplo el uso de restricciones terminales conservadoras in el dual-mode. Pero en
general los resultados existentes sólo indican que incertidumbres pequeñas no amenazan
la estabilidad del bucle cerrado, sin permitir el diseño del controlador que garantice la
estabilidad dada una incertidumbre descrita por sus lı́mites. Existen algunos resultados
para casos muy simples como incertidumbre en la ganancia y se está avanzando en

algunos campos como en LMI, pero todavı́a queda mucho por hacer.
5.2.4 Modelos
Estos resultados teóricos proporcionan una base para poner en marcha un NMPC, aun-
que en la práctica existen muchos temas abiertos, principalmente en lo referente a la
definición e identificación del modelo y al desarrollo de métodos de resolución fiables.
La obtención de modelos no lineales adecuados de forma empı́rica puede ser muy

difı́cil y no existe una formulación que sea claramente adecuada para representar
procesos no lineales de forma genérica. Parte del éxito del MPC se debe a la relativa
facilidad con la que se pueden obtener experimentalmente modelos del tipo respuesta
ante escalón o funciones de transferencia de bajo orden. En cambio los modelos no
lineales son mucho más difı́ciles de construir, tanto basándose en correlación de datos
de entrada/salida como en principios básicos de conservación de masa y energı́a.
Un gran obstáculo que se encuentra a la hora de desarrollar una teorı́a de sistemas

no lineales es la ausencia de un principio de superposición para este tipo de sistemas.
Debido a ello, la determinación experimental de los modelos se convierte en una tarea
muy complicada, requiriendo una cantidad de ensayos mucho mayor que para una
planta no lineal.
Si el proceso es lineal en teorı́a sólo es necesario llevar a cabo un ensayo de res-

puesta ante escalón para calcular el modelo (aunque en la práctica no sea realmente
ası́). Debido al principio de superposición, la respuesta ante un escalón de diferente
amplitud se puede obtener escalando la salida convenientemente. Pero esto no es ası́
para procesos no lineales, donde se deben realizar ensayos con escalones de distinto
tamaño. Además, si el proceso es multivariable, la diferencia en el número de ensayos
necesarios es mucho mayor. En general, si un sistema lineal se ensaya con señales
de entrada u1 (t),u2 (t),...,un (t), y las correspondientes salidas son y1 (t),y2 (t),...,yn (t), la
respuesta a una señal que se puede expresar como combinación lineal de las señales de
prueba
u(t) = 1u1(t) + 2 u2(t) + + nun(t)
es
y(t) = 1y1(t) + 2y2(t) + + nyn(t)
Es decir, un sistema lineal no necesita ser probado con ninguna secuencia de señales
de entrada que sea una combinación lineal de señales ya probada, mientras que no
ocurre lo mismo con un sistema no lineal, cuya respuesta debe ser analizada para todas
las posibles señales de entrada.
Si la desviación de la linealidad no es demasiado grande, se pueden hacer algu-

nas aproximaciones que tengan en cuenta el cambio de comportamiento de un punto
de operación a otro y asuman comportamiento lineal en las cercanı́as del punto de

operación. Pero en general habrá que recurrir a modelos especı́ficos que reflejen la
dinámica no lineal. Existen diferentes aproximaciones que usan modelos de Wiener,
otras basadas en redes de neuronas, modelos de Volterra o de Hammerstein, mode-
los NARX, modelos borrosos, etc. Los modelos usados en la industria se detallan a
continuación.
Modelos en el espacio de estados
Se puede usar un modelo formado por la combinación de una ecuación de estado lineal
con una relación no lineal de salida:
x(t + 1) = Ax(t) + Bu(t) + Dd(t)y(t) = g(x(t))

A su vez la no linealidad de la salida se puede modelar con la superposición de una
relación lineal y una red neuronal no lineal:
g(x(t)) = Cx(t) + NN (x(t))

Al no estar el vector de estados limitado necesariamente a variables fı́sicas, este
modelo es muy genérico y permite englobar más efectos no lineales que los exclusivos
de las medidas.
Pero el principal problema en NMPC no es la elección del tipo de modelo, sino de

un método de identificación fiable y robusto. Según el modelo propuesto, se identifica
el sistema como lineal y los residuos de las salidas se ajustan a los estados con la red
neuronal. Se puede usar un ı́ndice de confianza de modo que la predicción se basa más
o menos en la red neuronal según este ı́ndice, apagándose en caso de que su aportación
no sea fiable. También puede añadir un filtro de Kalman extendido (EKF) para corregir
los errores de modelado y las perturbaciones no medibles, reemplazando de este modo
el error constante en la realimentación que se emplea normalmente en el MPC.
Modelos de entrada/salida
Una idea adoptada por algunos fabricantes de controladores predictivos es usar un

modelo no lineal estático junto con un modelo dinámico no lineal. Si se considera el
caso monovariables, definiendo las variables de desviación como:
u(t) = u(t) ; us y(t) = y(t) ; ys

donde los valores en estado estacionario de entrada y salida cumplen:
ys = hs(us)
Se considera que las variables de desviación verifican la siguiente relación dinámica

lineal:
Xn
y(t) = ai y(t ; i) + bi u(t ; i)
i=1
La identificación del modelo lineal se lleva a cabo mediante ensayos ante escalón
mientras que a partir de datos históricos se obtiene la representación de la relación no
lineal por medio de una red de neuronas. Como el modelo dinámico tiene una ganancia
fija que en general será distinta de la del modelo no lineal, la ganancia del submodelo
lineal se escala hasta ser igual a la ganancia local no lineal para la entrada actual:
dys j
Ks = du u(t)
s
Esto se consigue reescalando los coeficientes bi .
Para usar este modelo, un programa de optimización no lineal calcula los mejores
valores de entrada y salida ufs , ysf a partir del modelo estático. Durante el cálculo
dinámico del controlador, la ganancia estática no lineal se aproxima por una interpo-
lación lineal de las ganancias inicial y final:
Ks(u(t)) = Ksi + Ksf ; Ki s u(t)

f i
(5 :4)
us ; us
siendo uis y ufs los valores estacionarios actual y próximo y Ksi y Ksf las ganancias
calculadas en esos puntos usando el modelo no lineal estático. Sustituyendo la ganancia
dada por (5.4) en la ecuación del submodelo lineal se obtiene:
X
n
y(t) = aiy(t ; i) + biu(t ; i) + giu2(t ; i) (5 :5)
i=1
biKsi (1 ; Pnj=1 aj ) bi (1 ; Pnj=1 aj )

donde
bi = Pn b gi = Pn Ksf ;K i
j =1 bj ufs ;uis
j =1 j s
con esto se consigue reducir la complejidad computacional.
Se puede observar que los valores en estado estacionario se calculan a partir del
modelo estático no lineal, mientras que los movimientos dinámicos de control están
basados en el modelo cuadrático de la ecuación (5.5). Sin embargo, los coeficientes del
modelo cuadrático (la ganancia local) cambian de un periodo de muestro a otro, ya son
reescalados para ajustarse a la ganancia local del modelo no lineal. Esta estrategia se
puede interpretar como una sucesiva linealización de los estados inicial y final seguida
por una interpolación lineal de las ganancias linealizadas, en una formulación similar
al gain-scheduling, pero con un modelo global diferente debido el reescalado de la
ganancia.
Modelos basados en primeros principios
En cualquier caso siempre es difı́cil obtener modelos empı́ricos fiables a partir de

datos experimentales, por lo que en la práctica existe la posibilidad de usar modelos
dados directamente de las ecuaciones de balance, llamados normalmente modelos
de primeros principios. Estas ecuaciones pueden ser ecuaciones estáticas de balance
o funciones no lineales de variables fı́sicas que generan otra variable. En este caso
el cálculo de la predicción se realiza mediante una simulación de las ecuaciones no
lineales (integración) que describen el proceso.
5.2.5 Otras formulaciones del problema
Se han propuesto diversas soluciones para intentar resolver los problemas que se
han visto, como por ejemplo en [1], donde la predicción de la salida del proceso
se hace mediante la adición de la respuesta libre (la respuesta futura que se obtiene
si la entrada se mantiene en un valor constante durante los horizontes de control y
predicción) obtenida de un modelo no lineal de la planta, y la respuesta forzada (la
debida a los movimiento de control futuros), calculada con un modelo incremental de
la planta. Las predicciones obtenidas de esta manera son sólo una aproximación ya
que el principio de superposición, que permite la descomposición mencionada, sólo
es válido para sistemas lineales. Sin embargo, la aproximación que se obtiene de esta
forma se comporta mejor que cuando se usa un modelo linealizado del proceso para
obtener ambas respuestas.
Si se usa una función de coste cuadrática, la función objetivo es cuadrática en las

variables de decisión (futuros movimientos de la señal de control) y la secuencia de
control se puede calcular (en caso de que no haya restricciones) como la solución de
un conjunto de ecuaciones lineales, dando lugar a una ley de control simple. La única
diferencia respecto a un MPC estándar es que la respuesta libre se calcula mediante un
modelo no lineal del proceso. Como el principio de superposición no se cumple, la
aproximación sólo es válida cuando la secuencia de señales de control es pequeña. Esta
circunstancia tendrá lugar cuando el proceso opera en torno al punto de trabajo con
pequeñas perturbaciones. Si el proceso cambia continuamente de punto de operación
o las perturbaciones son considerables los incrementos de la señal de control serán en
general mayores y la aproximación no será muy buena.
Existe una forma de resolver este problema, propuesta en [9] para el EPSAC. La idea
básica es considerar la secuencia de señales de control como la suma de una secuencia
de control base (ub (t + j )) y una secuencia de incrementos de la variable manipulada
(ui (t + j )). Es decir:
u(t + j ) = ub(t + j ) + ui(t + j )

La predicción j-ésima de la salida del proceso se calcula como la suma de la respuesta

del proceso (yb (t + j )) debida a la secuencia base más la respuesta (yi (t + j )) debida a
los futuros incrementos del control en la secuencia base de entrada ui (t + j ):
y(t + j ) = yb(t + j ) + yi(t + j )

Como se usa un modelo no lineal para calcular yb(t + j ) mientras que yi (t + j ) se
calcula a partir de un modelo lineal del proceso, la función de coste es cuadrática en
las variables de decisión (ui (t + j )) y se puede resolver mediante un algoritmo QP como
en el MPC estándar. Como se ha indicado, el principio de superposición no es válido
para procesos no lineales, y por ello la salida generada de esta forma sólo coincidirá
con la generada por el controlador no lineal en el caso de que la secuencia de futuros
movimientos de la señal de control sea cero.
Si éste no es el caso, la secuencia de control base se hace igual a la última secuencia

de control base más los incrementos de control óptimos que encuentre el algoritmo QP.
Este procedimiento se repite hasta que la secuencia de señales de control se lleva lo
suficientemente cerca de cero.
Las condiciones iniciales para la secuencia de control base se pueden hacer inicial-
mente iguales a la última señal de control que se ha aplicado al proceso. Obsérvese que
esto corresponde al cálculo de la respuesta libre en el MPC. Se puede probar con una
secuencia inicial mejor haciendo la secuencia base igual a la óptima que se obtuvo en
el último periodo de muestreo (con el desplazamiento temporal correspondiente).
Las condiciones de convergencia del algoritmo son muy difı́ciles de obtener ya que
dependen de la severidad de la caracterı́stica no lineal del proceso, de las entradas y
salidas pasadas, de las referencias futuras y de las perturbaciones.
Otra manera de atacar el problema es teniendo en cuenta que en algunas ocasiones,

el modelo no lineal se puede convertir en un modelo lineal mediante aproximaciones
apropiadas. Considérese por ejemplo el proceso descrito mediante la siguiente ecuación
en el espacio de estados:
x(t + 1) = f (x(t) u(t))

y(t) = g(x(t))
El método consiste en encontrar funciones de transformación de estados y entrada

z(t) = h(x(t)) y u(t) = p(x(t) v(t)) tales que:
z(t + 1) = Az(t) + Bv(t))
y(t) = Cz(t)
El método tiene dos importantes inconvenientes:
Las funciones de transformación z(t) = h(x(t)) y u(t) = p(x(t) v(t)) sólo se

pueden obtener en ciertos casos.
Las restricciones, que usualmente son lineales, se convierten en no lineales.
Es decir, incluso en los casos en que el modelo pueda ser linealizado mediante
transformaciones adecuadas, el problema se transforma de minimizar una función no
lineal (no cuadrática) con restricciones lineales en minimizar una función cuadrática
con restricciones no lineales.
La forma general de resolver el problema es usar el modelo no lineal completo de

la planta para calcular la predicción de la salida. Haciendo esto, se está añadiendo
una restricción no lineal a la minimización, con lo que los algoritmos QP no se pueden
usar. Sin embargo el problema se puede resolver en lı́nea, en algunos casos, gracias al
rápido desarrollo de algoritmos de programación no lineal (nonlinear programming,
NLP) capaces de manejar un número grande de variables y restricciones.
5.2.6 Resolución del problema. Productos comerciales
Muchos controladores comerciales dividen el algoritmo de control en una optimización

local estática y una optimización dinámica. El primer módulo calcula los valores de
entrada y salida a los que es necesario llegar y el segundo calcula la secuencia de control
adecuada.
La optimización dinámica se lleva a cabo minimizando la función objetivo genérica

(5.3) con las restricciones correspondientes. Los distintos esquemas comerciales hacen
simplificaciones respecto a la formulación general.
La mayorı́a de los productos (ver tabla 5.1) sólo permiten matrices de peso cons-
tantes en todo el horizonte y sólo el NOVA-NLC trabaja con norma 1. Por su parte, el
Process Perfecter minimiza sólo la salida pero con una matriz de peso que se incrementa
gradualmente con el horizonte, dando por tanto más importancia a los errores más
lejanos y en consecuencia dando lugar a una acción de control más suave.
En cuanto a las restricciones, normalmente las correspondientes a la entrada se

tratan como restricciones duras, es decir, que nunca deben ser violadas. El PFC también
incluye restricciones de aceleración, muy útiles para aplicaciones de servomecanismos.
Este método no trata estas restricciones de forma óptima, sino que resuelve el problema
de optimización sin restricciones y luego satura a los lı́mites, produciendo por tanto
una solución no óptima.
Respecto a restricciones en la salida, la mayorı́a de los productos comerciales las trata

como restricciones blandas, debido a que una perturbación puede producir fácilmente
una pérdida de factibilidad. Una opción ofertada por el Process Perfecter es considerar
Empresa Adersa Aspen Tech. Continental DOT Products Pavillion Tech.

Producto PFC Aspen Target MVC NOVA NLC Process Perfecter
Modelo EE, PP EE E/S, PNE EE, PP RN, E/S
F. Objetivo Q Q Q Q, N1 Q
Restricciones S, BS DS, DE, BS DE, BS DE, BS DE, DS
Estructura u FB, UM MM UM MM MM
Mét. solución NLS QP GRG MINLP GD
Tabla 5.1: EE: espacio de estados no lineal. PP: primeros principios. E/S: en-
trada/salida. PNE: polinomio no lineal estático. RN: red neuronal. N1: norma 1.
S: saturación. BS: blandas (mı́nimo y máximo) en la salida. DS: duras en las salidas.
DE: duras en las entradas. FB: funciones base. UM: único movimiento. MM: múltiples
movimientos. NLS: mı́nimos cuadrados no lineales. GRG: Generalized Reduced Gra-
dient. MINLP: Mixed Integer Nonlinear Programming. GD: Gradient descent.
una restricción dura en forma de embudo, de manera que se da más libertad a la salida
al comienzo del horizonte que al final.
Parámetros: normalmente se elige un horizonte de predicción finito muy grande,

con la idea de capturar la dinámica hasta el permanente de las salidas para todas las
entradas. Esto se puede considerar una aproximación al método de horizonte infinito
propuesto para garantizar la estabilidad del bucle cerrado y puede explicar por qué
ninguno de los productos comerciales incluye restricción terminal.
Una idea introducida en el PFC y adoptada por Aspen Target es el uso de puntos de
coincidencia, en los cuales deben coincidir la salida y la trayectoria de referencia. Esta
idea puede ser útil cuando las salidas responden con distinta velocidad y se pueden
definir distintos puntos de coincidencia para cada una de ellas.
En cuanto a la estructuración de la señal de control, se puede encontrar desde

considerar el horizonte de control igual a 1, horizonte variable o funciones base. Esta
última idea, propia del PFC, parametriza la señal de control usando un conjunto de
funciones polinomiales, permitiendo un perfil de entrada complejo para un horizonte
de control grande (en teorı́a podrı́a ser infinito) empleando un número de incógnitas
pequeño. Esto puede resultar una ventaja en el caso de sistemas no lineales. La
elección de la familia de funciones base establece muchas de las caracterı́sticas del
perfil de la entrada, pudiendo asegurar con una correcta elección una señal de control
suave, por ejemplo. Si se eligen funciones base polinómicas, se puede seleccionar el
orden para seguir un setpoint polinómico sin retraso, lo cual puede ser importante para
aplicaciones de servosistemas mecánicos.
La solución del problema no es tarea fácil debido a la no convexidad del problema

genérico. El PFC propone una solución sencilla resolviendo el problema sin restricciones
usando un algoritmo de mı́nimos cuadrados no lineal y saturando las entradas a sus
lı́mites si éstos se violan; lógicamente no se asegura una solución óptima, pero se gana
en velocidad, permitiendo que este controlador se use en aplicaciones con perı́odos de
muestreo pequeños, como el caso de seguimiento de missiles.
Para el caso genérico se usan diversos algoritmos, algunos propietarios, basados

en métodos más o menos conocidos de optimización. Entre ellos cabe destacar el
que usa Aspen Target, desarrollado por Oliveira y Biegler [15], que garantiza que las
soluciones intermedias, aunque no óptimas, son factibles. Ello garantiza que una pronta
finalización del algoritmo por limitaciones de tiempo produce siempre una solución
factible. En cualquier caso queda claro que el esfuerzo computacional es superior al
caso lineal, siendo ésta una de las principales razones la todavı́a escasa implantación
de estas técnicas en la industria.
5.2.7 Necesidades futuras
Los temas que pueden considerarse abiertos en esta técnica son:
Modelado: los modelos no lineales son más complejos que los lineales, pero
además el proceso de identificación es mucho más difı́cil. Se necesita una gran
baterı́a de ensayos para capturar las no-linealidades del proceso, resultando en
un perı́odo de pruebas considerable. Por tanto, la forma de disponer de una
representación correcta de la dinámica del proceso es un problema que no está
completamente resuelto.
Resolución del problema: la inclusión del modelo no lineal en la optimización da

lugar a que ésta no sea convexa. Grandes esfuerzos deben hacerse todavı́a para
encontrar algoritmos de optimización fiables que permitan la resolución dentro
del tiempo asignado.
Justificación del esfuerzo: vistas las dificultades que aparecen en la aplicación

de NMPC, debe poder justificarse el beneficio que este tipo de técnica aporta.
Algunos fabricantes ofrecen un MPC de respaldo, de manera que en el caso de
que no se necesite ese esfuerzo adicional o el controlador no lineal sea realmente
complicado de poner en marcha, se aplicarı́a la estrategia lineal.
Otros temas: temas que son aplicables al Control Predictivo en general, funcio-
nes objetivos multicriterio, sintonización de parámetros, mal condicionamiento o
tolerancia a fallos.
Es de destacar que ninguna de los productos comerciales incluye restricción termi-

nal ni horizonte infinito, situaciones requeridas en teorı́a para garantizar la estabilidad
nominal. En lugar de eso, se confı́a en que con un horizonte de predicción lo suficien-
temente grande se consiga el mismo comportamiento que horizonte infinito.
Bibliografı́a
[1] E.F. Camacho, M. Berenguel y F.R. Rubio. Advanced Control of Solar Power Plants.
Springer-Verlag, London, 1997.
[2] E.F. Camacho y C. Bordons. Model Predictive Control. Springer-Verlag, 1999.
[3] H. Chen y F. Allgower. A quasi-infinite horizon nonlinear predictive control
scheme with guaranteed stability. Automatica, 34(10):1205–1218, 1998.
[4] D.W. Clarke y C. Mohtadi. Properties of Generalized Predictive Control. Automa-
tica, 25(6):859–875, 1989.
[5] D.W. Clarke, C. Mohtadi y P.S. Tuffs. Generalized Predictive Control. Part I. The
Basic Algorithm. Automatica, 23(2):137–148, 1987.
[6] C.R. Cutler y B.C. Ramaker. Dynamic Matrix Control- A Computer Control Algo-
rithm. En Automatic Control Conference, San Francisco, 1980.
[7] C.E. Garcı́a, D.M. Prett y M. Morari. Model Predictive Control: Theory and
Practice-a Survey. Automatica, 25(3):335–348, 1989.
[8] S.S. Keerthi y E.G. Gilbert. Optimal infinite-horizon feedback laws for a general
class of constrained discrete-time systems: Stability and moving-horizon appro-
ximations. J. Optim. Theory Appl., 57(2):265–293, 1988.
[9] R. De Keyser. A Gentle Introduction to Model Based Predictive Control. En
PADI2 International Conference on Control Engineering and Signal Processing, Piura,
Peru, 1998.
[10] R.M.C. De Keyser, Ph.G.A. Van de Velde y F.G.A. Dumortier. A Comparative Study
of Self-adaptive Long-range Predictive Control Methods. Automatica, 24(2):149–
163, 1988.
[11] K. Krämer y H. Ubehauen. Predictive Adaptive Control. Comparison of Main
Algorithms. En Proceedings 1st European Control Conference, Grenoble, páginas 327–
332, julio 1991.
[12] A.G. Kutnetsov y D.W. Clarke. Advances in Model-Based Predictive Control, capı́tulo
Application of constrained GPC for improving performance of controlled plants.
Oxford University Press, 1994.
69
70 Bibliografı́a
[13] E.S. Meadows, M.A. Henson, J.W. Eaton y J. Rawlings. Receding horizon control
and discontinuous state feedback stabilization. Int. Journal Control, páginas 1217–
1229, 1995.
[14] H. Michalska y D.Q. Mayne. Robust receding horizon control of constrained

nonlinear systems. IEEE Trans. on Automatic Control, 38(11):1623–1633, 1993.
[15] N.M.C. Oliveira y L.T. Biegler. An extension of newton-type algorithms for non-
linear process control. Automatica, 31:281–286, 1995.
[16] S.J. Qin y T.A. Badgwell. An Overview of Industrial Model Predictive Control
Technology. In Chemical Process Control: Assessment and New Directions for
Research. En AIChE Symposium Series 316, 93. Jeffrey C. Kantor, Carlos E. Garcia and
Brice Carnahan Eds. 232-256, 1997.
[17] S.J. Qin y Thomas A. Badgwell. An overview of nonlinear model predictive control
applications. En IFAC Workshop on Nonlinear Model Predictive Control. Assessment
and Future Directions. Ascona (Switzerland), 1998.
[18] J. Richalet. Practique de la commande predictive. Hermes, 1992.
[19] H. Takatsu, T. Itoh y M. Araki. Future needs for the control theory in industries.
report and topics of the control technology survey in japanese indsutry. Journal of
Process Control, 8:369–374, 1998.
[20] M.L. Tyler y M. Morari. Propositional Logic in Control and Monitoring Problems.
Technical Report AUT96-15, Institut fur Automatik, ETH- Swiss Federal Institute of
Technology, Zurich, Switzerland, 1996.
[21] B.E. Ydstie. Extended Horizon Adaptive Control. En Proc. 9th IFAC World Congress,
Budapest, Hungary, 1984.

Bases PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Bases PDF

Cargado por

Copyright:

Formatos disponibles

Escuela Superior de Ingenieros Universidad de Sevilla

Control Predictivo: metodologı́a,

Carlos Bordóns Alba

I Curso de Especialización en Automática

1.1 Tendencias actuales en control de procesos ::::::::::::::::: 1

1.2 Perspectiva histórica :::::::::::::::::::::::::::::: 5

1.3 Situación actual :::::::::::::::::::::::::::::::: 6

1.4 Conceptos básicos de control predictivo ::::::::::::::::::: 7

1.5 Estrategia de los controladores :::::::::::::::::::::::: 8

2.1 Elementos básicos ::::::::::::::::::::::::::::::: 11

2.1.1 Modelo de predicción ::::::::::::::::::::::::: 11

2.1.2 Función objetivo :::::::::::::::::::::::::::: 15

2.1.3 Obtención de la ley de control :::::::::::::::::::: 18

2.2 Revisión de los principales algoritmos :::::::::::::::::::: 18

2.3 Estado de la tecnologı́a :::::::::::::::::::::::::::: 23

3.1 Dynamic Matrix Control ::::::::::::::::::::::::::: 25

3.1.1 Predicción ::::::::::::::::::::::::::::::: 25

3.1.2 Perturbaciones medibles ::::::::::::::::::::::: 27

3.1.3 Algoritmo de control ::::::::::::::::::::::::: 28

3.2 Control Predictivo Generalizado ::::::::::::::::::::::: 31

3.2.1 Formulación del Control Predictivo Generalizado ::::::::: 32

3.2.2 Ejemplo de cálculo ::::::::::::::::::::::::::: 36

3.2.3 Caso multivariable ::::::::::::::::::::::::::: 38

4 Restricciones en Control Predictivo 41

4.1 Tratamiento convencional de restricciones :::::::::::::::::: 41

4.2 Restricciones en Control Predictivo ::::::::::::::::::::: 42

4.3 Resolución del problema ::::::::::::::::::::::::::: 44

4.4 Gestión de restricciones :::::::::::::::::::::::::::: 45

4.4.1 Técnicas de búsqueda de soluciones factibles :::::::::::: 46

5 Tendencias actuales y nuevas perspectivas 51

5.1 Multiobjetivo. Jerarquı́a de objetivos ::::::::::::::::::::: 51

5.1.1 Jerarquı́a de objetivos ::::::::::::::::::::::::: 53

5.2 Control predictivo no lineal :::::::::::::::::::::::::: 54

5.2.1 Diferencias respecto al método lineal :::::::::::::::: 56

5.2.2 Fundamentos teóricos ::::::::::::::::::::::::: 56

5.2.3 Problemática asociada al NMPC :::::::::::::::::::: 57

5.2.4 Modelos :::::::::::::::::::::::::::::::: 61

5.2.5 Otras formulaciones del problema :::::::::::::::::: 64

5.2.6 Resolución del problema. Productos comerciales :::::::::: 66

5.2.7 Necesidades futuras :::::::::::::::::::::::::: 68

1.1 Tendencias actuales en control de procesos

La competencia en muchos sectores industriales ası́ como el creciente interés social

Actualmente los sistemas de control en la industria de procesos deben satisfacer

Por ello, se puede considerar que en la actualidad el objetivo de todo sistema de

El amplio abanico de metodologı́as actuales de control de procesos se enfrenta al

1983 (%) 1989 (%) 1995 (%)

Tabla 1.1: Principales problemas de control

tación matemática de muchos de estos criterios se lleva a cabo en la forma de funciones

Las técnicas de Control Predictivo Basado en Modelo (Model Based Predictive

También resulta interesante analizar los factores claves de éxito y fracaso de la

Selección de la estrategia de control 14 %

Tabla 1.2: Principales factores claves de éxito

Ausencia de análisis del proceso. Inexactitud del modelo 21 %

Tabla 1.3: Principales factores claves de fracaso

funcionamiento del sistema de control.

Del informe citado se pueden extraer conclusiones interesante sobre el estado y el

También resulta interesante intentar cuantificar la evolución futura de las distintas

Técnica 1989 1995

Tabla 1.4: Estado de las distintas técnicas

Técnica 1989 1995

Tabla 1.5: Grado de satisfacción de las distintas técnicas

ampliamente usadas con grandes expectativas. El control neuronal despierta grandes

Figura 1.1: Expectativas y posibilidades técnicas

umin u(t) umax 8t

n̂(t + k j t) = n̂(t + k ; 1 j t) + (1 ; )(ym(t) ; ŷ(t j t))