Está en la página 1de 73

Escuela Superior de Ingenieros

Universidad de Sevilla

Control Predictivo: metodologa,


tecnologa y nuevas perspectivas

Carlos Bordons Alba


Departamento de Ingeniera de Sistemas y Automatica
Universidad de Sevilla

I Curso de Especializacion en Automatica


Aguadulce, Almera, 2000


Indice
general

Indice

Fundamentos

::::::::::::::::::::::::::::::

::::::::::::::::::::::::::::::::

:::::::::::::::::::

::::::::::::::::::::::::

Tendencias actuales en control de procesos

1.2

Perspectiva historica

1.3

Situacion actual

1.4

Conceptos basicos de control predictivo

1.5

Estrategia de los controladores

Controladores predictivos
2.1

:::::::::::::::::

1.1

Elementos basicos

11

:::::::::::::::::::::::::::::::

11

:::::::::::::::::::::::::

11

::::::::::::::::::::::::::::

15

::::::::::::::::::::

18

::::::::::::::::::::

18

::::::::::::::::::::::::::::

23

2.1.1

Modelo de prediccion

2.1.2

Funcion objetivo

2.1.3

Obtencion de la ley de control

2.2

de los principales algoritmos


Revision

2.3

Estado de la tecnologa

Algoritmos
3.1

25

:::::::::::::::::::::::::::

25

:::::::::::::::::::::::::::::::

25

Dynamic Matrix Control


3.1.1

Prediccion


Indice
general

ii

3.2

:::::::::::::::::::::::

27

:::::::::::::::::::::::::

28

:::::::::::::::::::::::

31

:::::::::

32

3.1.2

Perturbaciones medibles

3.1.3

Algoritmo de control

Control Predictivo Generalizado


3.2.1

Formulacion del Control Predictivo Generalizado

3.2.2

Ejemplo de calculo

:::::::::::::::::::::::::::

36

3.2.3

Caso multivariable

:::::::::::::::::::::::::::

38

4 Restricciones en Control Predictivo

41

::::::::::::::::::

41

:::::::::::::::::::::

42

:::::::::::::::::::::::::::

44

::::::::::::::::::::::::::::

45

::::::::::::

46

4.1

Tratamiento convencional de restricciones

4.2

Restricciones en Control Predictivo

4.3

Resolucion del problema

4.4

Gestion de restricciones
4.4.1

Tecnicas de busqueda
de soluciones factibles

5 Tendencias actuales y nuevas perspectivas


5.1

5.2

:::::::::::::::::::::

51

:::::::::::::::::::::::::

53

::::::::::::::::::::::::::

54

::::::::::::::::

56

:::::::::::::::::::::::::

56

::::::::::::::::::::

57

::::::::::::::::::::::::::::::::

61

::::::::::::::::::

64

::::::::::

66

::::::::::::::::::::::::::

68

Multiobjetivo. Jerarqua de objetivos


5.1.1

51

Jerarqua de objetivos

Control predictivo no lineal


5.2.1

Diferencias respecto al metodo lineal

5.2.2

Fundamentos teoricos

5.2.3

Problematica asociada al NMPC

5.2.4

Modelos

5.2.5

Otras formulaciones del problema

5.2.6

Resolucion del problema. Productos comerciales

5.2.7

Necesidades futuras

Bibliografa

69

Tema 1
Fundamentos
1.1 Tendencias actuales en control de procesos

Aunque en el pasado poda considerarse que el unico


objetivo del control consista en
mantener una operacion estable del proceso, actualmente la industrias se enfrentan a
un mercado cambiante y difcil de predecir, lo que les obliga a operar sus procesos
productivos en consonancia con la evolucion del mercado para poder mantenerse
competitivas y rentables.
La competencia en muchos sectores industriales as como el creciente interes social
por los problemas medioambientales relacionados con los procesos de produccion
provoca la necesidad de disponer de tecnicas fiables que permitan la operacion del
proceso con gran eficiencia y alto grado de flexibilidad.
Actualmente los sistemas de control en la industria de procesos deben satisfacer
criterios economicos, asociados con el mantenimiento de las variables de proceso en sus
referencias minimizando dinamicamente una funcion de coste de operacion, criterios
de seguridad y medioambientales, y de calidad en la produccion, la cual debe satisfacer
ciertas especificaciones sujetas a una demanda normalmente variable.
Por ello, se puede considerar que en la actualidad el objetivo de todo sistema de
control consiste en actuar sobre las variables manipuladas de forma que puedan satis
facerse multiples
y cambiantes criterios de funcionamiento (economicos, de seguridad,
medioambientales o de calidad) en presencia de cambios en las caractersticas del proceso.
El amplio abanico de metodologas actuales de control de procesos se enfrenta al
cumplimiento de este objetivo. La diferencia entre las diversas tecnicas radica basicamente en los compromisos hechos en la formulacion matematica de los criterios de
funcionamiento y en la eleccion de la manera de representar el proceso. La represen1

Tendencias actuales en control de procesos

1983
Retardo
Perturbaciones
Interaccion
Respuesta
Estabilidad

(%)
24
21
17
16
11

1989
Retardo
Interaccion
Perturbaciones
Cambios
No lineal

(%)
23
16
15
12
10

1995
Interaccion
Perturbaciones
Retardo
Cambios
No lineal

(%)
24
22
21
14
7

Tabla 1.1: Principales problemas de control

tacion matematica de muchos de estos criterios se lleva a cabo en la forma de funciones


objetivo dinamicas y de restricciones mientras que el proceso se representa como un
modelo dinamico con incertidumbres asociadas. La importancia de las incertidumbres esta siendo cada vez mas reconocida y por tanto incluida explcitamente en la
formulacion de los controladores.
Las tecnicas de Control Predictivo Basado en Modelo (Model Based Predictive
Control, MPC) parecen constituir unas poderosas herramientas para afrontar estos retos.
MPC, en su forma mas general, acepta cualquier tipo de modelos, funciones objetivo o
restricciones, siendo la metodologa que actualmente puede reflejar mas directamente

los multiples
criterios de funcionamiento relevantes en la industria de procesos. Quizas
sea e sta la principal razon del e xito de estas tecnicas en numerosas aplicaciones de la
industria de procesos, unida a que es la forma mas general de formular el problema de
control en el dominio del tiempo, de manera que puede resultar facil de aceptar por el
personal de la industria.
Los resultados de un estudio realizado por Takatsu et al. para la Society of Instrumentation and Control Engineering [19] son indicativos de las necesidades futuras de
la industria en el a mbito del control. En este informe se analizan los principales problemas de control que se encuentran en la industria de procesos, el estado de aplicacion
de las tecnologas avanzadas, el grado de satisfaccion de los usuarios con cada una de
ellas y las expectativas que cada una genera.

La evolucion en los ultimos


anos
de los principales problemas de control para los
usuarios se muestra en la tabla 1.1.
Observese que los tres primeros problemas siguen siendo los mismos en los tres
anos
que se ha realizado la encuesta y parece que a lo largo del tiempo se resuelven
problemas basicos como estabilidad y respuesta y se atacan problemas mas difciles
como dinamica no lineal. Como se vera mas adelante, el Control Predictivo es una
metodologa capaz de ofrecer soluciones a todos estos problemas.
Tambien resulta interesante analizar los factores claves de e xito y fracaso de la
automatizacion del proceso (1.2 y 1.3). De estas tablas se desprende que la eleccion de

la estrategia de control no es el unico


factor a tener en cuenta para garantizar un buen

Fundamentos

Seleccion de la estrategia de control 14 %


Seleccion del equipo de control
12 %
Especificaciones apropiadas
10 %
Configuracion flexible del sistema
10 %
Operacion de emergencia
10 %
Interface con el operario
8%
Analisis de proceso
8%
Tabla 1.2: Principales factores claves de e xito

Ausencia de analisis del proceso. Inexactitud del modelo 21 %


Seleccion de los sensores
14 %
Falta de rechazo a las perturbaciones
10 %
Seleccion de la estrategia de control
7%
Seleccion de los actuadores
6%
Seleccion del equipo de control
5%
Especificaciones inapropiadas
5%
Configuracion rgida del sistema
5%
Tabla 1.3: Principales factores claves de fracaso

funcionamiento del sistema de control.


Del informe citado se pueden extraer conclusiones interesante sobre el estado y el
grado de aceptacion de las tecnologas consideradas avanzadas (ver tabla 1.4). En ella
se muestra el porcentaje de plantas que usaron cada tecnica en 1989 y 1995. Observese
que todas crecieron excepto el control adaptativo y el autoajuste que tuvieron un ligero
descenso.
Con el fin de evaluar el grado de satisfaccion del usuario con las distintas tecnicas,
se muestra en la tabla 1.5 el porcentaje de usuarios que estan satisfechos con cada una
de las tecnicas que han empleado. Como conclusion interesante destaca el hecho de
que practicamente todos los usuarios de Control Predictivo estan satisfechos.
Tambien resulta interesante intentar cuantificar la evolucion futura de las distintas
tecnicas. Para ello, la figura 1.1 intenta mostrar las posibilidades tecnicas y las expectativas despertadas por cada una de ellas. Posibilidad tecnica se refiere a la facilidad
de implementacion y expectativas al efecto esperado de uso de cada tecnica. El punto
de partida de cada flecha es la media de todas las respuestas a la encuesta, mientras
que su extremo corresponde a la media de las 15 plantas consideradas lderes en temas
de control. El citado artculo interpreta la flecha como tendencia futura. Segun esto,
el PID avanzado, compensacion de retardo, borroso, desacoplo y MPC seran tecnicas

Tendencias actuales en control de procesos

Tecnica
1989 1995
Compensacion de retardo 29.6 52.4
Borroso
9.9
38
Control Predictivo
25.4 37.2
Gain-scheduling
25.7 32.5
PID avanzado
24.8 29.4
Autoajuste
32.2 29.1
Desacoplo
17.5 28.6
Basado en reglas
6.3 17.9
Filtro de Kalman
9.1 15.5
Neuronal
0 11.8
LQ
8.2
11
Observador
8.2
9.8
Control adaptativo
10.3
7
H1
0
9.3
Tabla 1.4: Estado de las distintas tecnicas

Tecnica
1989 1995
Control Predictivo
76
94
PID avanzado
77
89
Compensacion de retardo
72
89
Gain-scheduling
78
87
Borroso
67
83
LQ
79
70
Neuronal
69
Desacoplo
64
66
Filtro de Kalman
70
66
Autoajuste
60
65
Observador
67
62
Basado en reglas
43
61
Control adaptativo
50
56
H1
50
Tabla 1.5: Grado de satisfaccion de las distintas tecnicas

Fundamentos

ampliamente usadas con grandes expectativas. El control neuronal despierta grandes


expectativas pero tiene ciertas dificultades de implementacion, mientras que el Autoajuste se implementa con facilidad pero pierde expectativas. Las tecnicas como LQR,
filtro de Kalman, H1 o adaptativo se mantienen como "sin demasiadas expectativas y
no facilmente implementables".

MPC
Retardo

Expectativas

Borroso
PID

Adaptativo
Neuronal
Hoo

Desacoplo

LQ
F. Kalman

Auto
ajuste

Deslizante

Posibilidades tcnicas

Figura 1.1: Expectativas y posibilidades tecnicas


Este estado actual y futuras tendencias en el campo del control de procesos industriales indican que el Control Predictivo Basado en Modelo se puede considerar una
tecnologa suficientemente introducida en la industria y que ademas sigue despertando
muchas expectativas. Estos hechos, unidos a la existencia de campos abiertos tanto en
investigacion como en temas relacionados con la implementacion justifica un estudio
mas detallado de esta tecnologa.

1.2 Perspectiva historica


El Control Predictivo se desarrollo en base a dos lneas basicas. Por un lado, a finales
de los anos
setenta surgieron diversos algoritmos que usaban explcitamente un modelo dinamico del proceso para predecir el efecto de las acciones de control futuras
en la salida, las cuales eran determinadas minimizando el error predicho sujeto a restricciones de operacion. La optimizacion se repeta en cada instante de muestreo con
informacion actualizada del proceso. Estas formulaciones eran de naturaleza heurstica

Situacion actual

y algortmica e intentaban aprovechar el creciente potencial de los computadores digitales por aquella e poca.
Rapidamente el MPC adquirio gran popularidad en las industrias de procesos
qumicos principalmente debido a la simplicidad del algoritmo y al uso del modelo
de respuesta impulsional o en escalon, que aunque posea muchos mas parametros
que las formulaciones en el espacio de estados o funcion de transferencia suele ser
preferido por ser intuitivo y necesitar menos informacion a priori para identificar. La
mayora de las aplicaciones fueron llevadas a cabo sobre sistemas multivariables incluyendo restricciones. Los algoritmos utilizados fueron principalmente el IDCOM
(Identification-Command) y el DMC (Control con Matriz Dinamica, Dynamic Matrix
Control).
Independientemente fue surgiendo otra lnea de trabajo en torno a las ideas del control adaptativo, desarrollando estrategias esencialmente para procesos monovariables
formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del
Controlador de Mnima Varianza y se desarrollo el Control Predictivo Generalizado
(Generalized Predictive Control GPC) que es uno de los metodos mas populares en la
actualidad.

actual
1.3 Situacion
La situacion actual de aplicaciones de MPC en la industria esta bien reflejada en la recopilacion de Qin y Badgwell [16], que recoge unas 2200 aplicaciones, principalmente
en el sector petroqumico (desde entonces el numero de aplicaciones puede estimarse
en torno a las 3000). La mayora de las aplicaciones son en procesos multivariables,
registrandose casos como un controlador con 40 entradas y 80 salidas. Sorprendentemente, MPC ha tenido menor impacto en otro tipo de industrias, aunque estudios de
1993 sugieren que unas 20.000 aplicaciones podran beneficiarse de esta tecnica.
El e xito actual del MPC en la industria se debe a tres razones principales:

 La incorporacion de un modelo explcito del proceso en los calculos permite al


controlador tratar con todas las caractersticas importantes de la dinamica del
proceso.
 La consideracion del comportamiento del proceso a lo largo de un horizonte
futuro permite tener en cuenta el efecto de las perturbaciones en realimentacion
y pre-alimentacion, permitiendo al controlador conducir la salida a la trayectoria
de referencia deseada.
 La consideracion de restricciones en la fase del diseno
del controlador evita en
lo posible su violacion, resultando en un control mas preciso en torno al punto

Fundamentos

optimo
de operacion. La inclusion de restricciones es quizas la caracterstica que
mas distingue al MPC respecto a otras metodologas.
Otra de las razones que han contribuido a que el MPC se haya convertido en un e xito
comercial es el hecho de que existen unos 15 suministradores que instalan el producto
llave en mano, con periodos de amortizacion de entre 3 y 12 meses, permitiendo
que medianas empresas puedan tener acceso a esta tecnologa. Aparte de esto, los
nuevos Sistemas de Control Distribuido empiezan a ofertar productos MPC genericos
que ofrecen al usuario la posibilidad de realizar futuras modificaciones sin depender
de un producto cerrado.

1.4 Conceptos basicos de control predictivo


El Control Predictivo Basado en Modelo, Model (Based) Predictive Control (MBPC o
MPC) constituye un campo muy amplio de m
etodos de control desarrollados en torno
a ciertas ideas comunes e integra diversas disciplinas como control o ptimo, control
estocastico, control de procesos con tiempos muertos, control multivariable o control
con restricciones.
El Control Predictivo no es una estrategia de control especfica, sino que se trata
mas bien de un campo muy amplio de metodos de control desarrollados en torno a
ciertas ideas comunes. Estos metodos de diseno
conducen a controladores lineales que
poseen practicamente la misma estructura y presentan suficientes grados de libertad.
Las ideas que aparecen en mayor o menor medida en toda la familia de controladores
predictivos son basicamente:

 Uso explcito de un modelo para predecir la salida del proceso en futuros instantes
de tiempo (horizonte).
 Calculo de las senales

de control minimizando una cierta funcion objetivo.


 Estrategia deslizante, de forma que en cada instante el horizonte se va desplazando hacia el futuro, lo que implica aplicar la primera senal
de control en cada
instante y desechar el resto, repitiendo el calculo en cada instante de muestreo.
Los distintos algoritmos de MPC difieren entre s casi exclusivamente en el modelo
usado para representar el proceso y los ruidos y en la funcion de coste a minimizar.
Aunque las diferencias puedan parecer pequenas
a priori, pueden provocar distintos
comportamientos en bucle cerrado, siendo crticas para el e xito de un determinado
algoritmo en una determinada aplicacion.
El Control Predictivo es un tipo de control de naturaleza abierta dentro del cual se
han desarrollado muchas realizaciones, encontrando gran aceptacion tanto en aplicaciones industriales como en el mundo academico. En la actualidad existen numerosas

Estrategia de los controladores

aplicaciones de controladores predictivos funcionando con e xito, tanto en la industria


de procesos como en control de motores o Robotica. El buen funcionamiento de estas
aplicaciones muestra la capacidad del MPC para conseguir sistemas de control de elevadas prestaciones capaces de operar sin apenas intervencion durante largos perodos
de tiempo.
El MPC presenta una serie de ventajas sobre otros metodos, entre las que destacan:

 Resulta particularmente atractivo para personal sin un conocimiento profundo


de control, puesto que los conceptos resultan muy intuitivos, a la vez que la
sintonizacion es relativamente facil.
 Puede ser usado para controlar una gran variedad de procesos, desde aquellos con
dinamica relativamente simple hasta otros mas complejos incluyendo sistemas
con grandes retardos, de fase no mnima o inestables.
 Permite tratar con facilidad el caso multivariable.
 Posee intrnsecamente compensacion del retardo.
 Resulta conceptualmente simple la extension al tratamiento de restricciones, que
pueden ser incluidas de forma sistematica durante el proceso de diseno.

cuando se conocen las futuras referencias (robotica o procesos en


 Es muy util
batch).

 Es una metodologa completamente abierta basada en algunos principios basicos


que permite futuras extensiones.
Pero, logicamente, tambien presenta inconvenientes. Unos de ellos es la carga
de calculo necesaria para la resolucion de algunos algoritmos. Pero quizas el mayor
inconveniente venga marcado por la necesidad de disponer de un modelo apropiado del
proceso. El algoritmo de diseno
esta basado en el conocimiento previo del modelo y es
independiente de e ste, pero resulta evidente que las prestaciones obtenidas dependeran
de las discrepancias existentes entre el proceso real y el modelo usado.

1.5 Estrategia de los controladores


La metodologa de todos los controladores pertenecientes a la familia del MPC se caracteriza por la estrategia siguiente, representada en la figura 1.2:
1. En cada instante t y haciendo uso del modelo del proceso se predicen las futuras
salidas para un determinado horizonte N , llamado horizonte de prediccion. Estas

Fundamentos

u(t+k|t)
u(t)

^y(t+k|t)
y(t)
N

t-1

t+1

...

t+k

...

t+N

Figura 1.2: Estrategia del Control Predictivo


salidas predichas, y (t + k j t)1 para k = 1 : : : N dependen de los valores conocidos
hasta el instante t (entradas y salidas pasadas) y de las senales

de control futuras
u(t + k j t), k = 0 : : : N ; 1 que se pretenden mandar al sistema y que son las que
se quieren calcular.
2. El conjunto de senales

de control futuras se calcula optimizando un determinado


criterio en el que se pretende mantener el proceso lo mas proximo posible a la
trayectoria de referencia w (t + k ) (que puede ser directamente el setpoint o una
suave aproximacion a e ste). Este criterio suele tomar la forma de una funcion
cuadratica de los errores entre la salida predicha y la trayectoria de referencia
tambien predicha, incluyendo en muchos casos el esfuerzo de control. Si el criterio
es cuadratico, el modelo lineal y no existen restricciones se puede obtener una
solucion explcita, en otro caso se debe usar un metodo iterativo de optimizacion.
Adicionalmente se hace alguna suposicion sobre la estructura de la ley de control
futura, como por ejemplo que va a ser constante a partir de cierto instante.
3. La senal
de control u(t j t) es enviada al proceso mientras que las siguientes
senales

de control calculadas son desechadas, puesto que en el siguiente instante


de muestreo ya se conoce y (t + 1) y se repite el paso 1 con este nuevo valor y
todas las secuencias son actualizadas. Se calcula por tanto u(t + 1 j t + 1) (que en
principio sera diferente al u(t + 1 j t) al disponer de nueva informacion), haciendo
uso del concepto de horizonte deslizante.
Para llevar a cabo esta estrategia, se usa una estructura como la mostrada en la
figura 1.3. Se hace uso de un modelo para predecir las salidas futuras del proceso,
1

la notacion indica el valor de la variable en el instante t + k calculado en el instante t.

Estrategia de los controladores

10

Entradas y salidas
pasadas

Trayectoria
de referencia

Salidas
predichas

Modelo

+
-

Controles
futuros

Optimizador
Errores futuros
Funcion de coste

Restricciones

Figura 1.3: Estructura basica del MPC


basandose en las futuras senales

de control propuestas. Estas senales

son calculadas
por el optimizador teniendo en cuenta la funcion de coste (donde aparece el futuro error
de seguimiento) as como las restricciones. Por tanto el modelo juega un papel decisivo
en el controlador. El modelo elegido debe ser capaz de capturar la dinamica del proceso
para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo de usar
y de comprender.
El optimizador es otra parte fundamental de la estrategia pues proporciona las
acciones de control. Si la funcion de coste es cuadratica, el mnimo se puede obtener
como una funcion explcita de las entradas y salidas pasadas y de la trayectoria de
referencia. Sin embargo, cuando existen restricciones de desigualdad la solucion debe
ser calculada por metodos numericos con mas carga de calculo.

Tema 2
Controladores predictivos
2.1 Elementos basicos
Todos los controladores predictivos poseen elementos comunes y para cada uno de
estos elementos se pueden elegir diversas opciones, dando lugar a distintos algoritmos.
Estos elementos son:

 Modelo de prediccion
 Funcion objetivo
 Obtencion de la ley de control

2.1.1

Modelo de prediccion

La piedra angular del MPC es el modelo; un diseno


completo debe incluir los mecanismos necesarios para la obtencion del mejor modelo posible, el cual debe ser lo
suficientemente rico para capturar al maximo la dinamica del proceso y debe ser capaz de permitir el calculo de las predicciones a la vez que sea intuitivo y permita un
analisis teorico. El uso del modelo del proceso viene determinado por la necesidad del
calculo de la salida predicha en instantes futuros y (t + k j t). Las diferentes estrategias
de MPC pueden usar distintos modelos para representar la relacion de las salidas con
las entradas medibles, algunas de las cuales seran variables manipuladas y otras se
pueden considerar como perturbaciones medibles, que pueden ser compensadas por
feedforward. Ademas se tendra en cuenta un modelo de las perturbaciones, para
accion
intentar describir el comportamiento que no aparece reflejado en el modelo del proceso, englobandose aqu el efecto de las entradas no medibles, el ruido y los errores de
modelado.
11

Elementos basicos

12

Para el estudio se puede separar el modelo en dos partes: el modelo del proceso
propiamente dicho y el modelo de las perturbaciones. Cualquier metodo usara ambas
partes para la prediccion.
Modelo del Proceso
Casi todas las formas posibles de modelar un proceso aparecen en alguna formu de MPC siendo las mas usadas las siguientes:
lacion

 Respuesta impulsional. Tambien conocida por secuencia de ponderacion o modelo de convolucion. La salida viene relacionada con la entrada por la ecuacion

y(t) =

1
X
i=1

hiu(t ; i)

donde hi son los valores muestreados obtenidos al someter al proceso a un impulso


unitario de amplitud igual al perodo de muestreo (ver figura 2.1a). Esta suma
es truncada y solo se consideran N valores (por tanto solo permite representar
procesos estables y sin integradores), teniendo

y(t) =

N
X
i=1

hi u(t ; i) = H (z;1)u(t)

:1)

(2

donde H (z ;1 ) = h1 z ;1 + h2 z ;2 +    + hN z ;N . Un inconveniente de este metodo es

el gran numero
de parametros que necesita, ya que N suele ser un valor elevado
(del orden de 40-50). La prediccion vendra dada por:

y(t + k j t) =

N
X
i =1

hi u(t + k ; i j t) = H (z;1)u(t + k j t)

Este metodo es ampliamente aceptado en la practica industrial debido a que


es muy intuitivo y no requiere informacion previa sobre el proceso, con lo que
el procedimiento de identificacion se simplifica, a la vez que permite describir
facilmente dinamicas complejas como fase no mnima o retardos.

 Respuesta ante escalon. Es muy similar al anterior solo que ahora la senal
de
entrada es un escalon. Para sistemas estables se tiene la respuesta truncada que
sera
N
X
y(t) = y0 + gi 4 u(t ; i) = y0 + G(z;1)(1 ; z;1 )u(t)
(2:2)
i=1
donde las gi son los valores muestreados ante la entrada en escalon y 4u(t) =
se muestra en la figura 2.1b. El valor de y0 puede tomarse 0
u(t) ; u(t ; 1), segun
sin perdida de generalidad, con lo cual el predictor sera:

y(t + k j t) =

N
X
i=1

gi 4 u(t + k ; i j t)

Este metodo presenta las mismas ventajas e inconvenientes que el anterior.

Controladores predictivos

g2

y(t)
g1

y(t)

hN

h1

hi

h2

13

...

t+1 t+2

t+N

...

t+1 t+2

t+N

b)

a)

Figura 2.1: Respuesta impulsional y ante escalon

 Funcion de transferencia. Se utiliza el concepto de funcion de transferencia


G = B=A con lo que la salida viene dada por:

A(z;1 )y(t) = B (z;1 )u(t)

A( z ; 1 )
B (z ;1 )

=
=

1 + a1 z ;1 + a2 z ;2 +    + ana z ;na
b1 z;1 + b2 z;2 +    + bnb z;nb

Por tanto la prediccion vendra dada por

B
(z ;1 )
y(t + k j t) = A(z;1 ) u(t + k j k)
Esta representacion es valida tambien para procesos inestables y posee la ventaja
de necesitar pocos parametros, aunque es fundamental un conocimiento a priori
del proceso sobre todo en cuanto al orden de los polinomios A y B .

 Espacio de estados. Tiene la siguiente representacion:

x(t) = Ax(t ; 1) + Bu(t ; 1)


y(t) = Cx(t)
siendo x el estado y A, B y C las matrices del sistema, de entrada y de salida

respectivamente. Para este modelo la prediccion viene dada por

y(t + k j t) = C x (t + k j t) = C Ak x(t) +

k
X
Ai;1Bu(t + k ; i j t)]
i=1

Elementos basicos

14

Posee la ventaja de que sirve tambien para sistemas multivariables a la vez que
permite analizar la estructura interna del proceso (aunque a veces los estados
obtenidos al discretizar no tienen ningun significado fsico). Los calculos pueden
ser complicados, con la necesidad adicional de incluir un observador si los estados
no son accesibles.
Modelo de las perturbaciones
De tanta importancia como la eleccion de un determinado modelo del proceso
es la eleccion del modelo utilizado para representar la perturbaciones. Un modelo
bastante extendido es el Autorregresivo Integrado de Media Movil (Auto-Regressive
and Integrated Moving Average, ARIMA), en el que las perturbaciones, es decir, las
diferencias entre la salida medida y la calculada por el modelo vienen dadas por
(z ;1 )e(t)
n(t) = C D
(z ;1 )

donde el polinomio D (z;1 ) incluye explcitamente el integrador 4 = 1 ; z;1 , e(t) es


un ruido de media cero y normalmente el polinomio C se considera igual a uno. Este
modelo se considera apropiado para dos tipos de perturbaciones: cambios aleatorios
ocurridos en instantes aleatorios (por ejemplo cambio en la calidad del material) y
movimiento browniano (en procesos con balance de energa) y es usado en varios
metodos. Notese que al incluir un integrador se consigue un control con error nulo en
regimen permanente (offset-free).
Como caso particular del ARIMA se puede incluir la perturbacion constante

n(t) = 1 ;e(tz);1
cuya mejor prediccion sera n (t + k j t) = n(t).
Respuestas libre y forzada
Una caracterstica tpica de la mayora de los controladores MPC es el empleo de los
conceptos de repuesta libre y forzada. La idea es expresar la secuencia de acciones de
control como la suma de dos senales:

u(t) = uf (t) + uc(t)


La senal
uf (t) corresponde a las entradas pasadas (anteriores al instante t) y en el futuro

se mantiene constante e igual al ultimo


valor de la variable manipulada. Es decir,

uf (t ; j )
uf (t + j )

=
=

u(t ; j ) para j = 1 2   
u(t ; 1) para j = 0 1 2   

Controladores predictivos

15

La senal
uc (t) vale cero en el pasado y corresponde a las senales

de control en los
instantes futuros:

uc(t ; j )
uc(t + j )

=
=

0 para j

1 2   
u(t + j ) ; u(t ; 1) para j
=

0 1 2   

La prediccion de la secuencia se salida se separa en dos partes, como se ve en la


figura 2.2. Una de ellas (yf (t)), la respuesta libre, corresponde a la prediccion de la
salida cuando la variable manipulada se hace igual a uf (t), y la otra, la repuesta forzada
(yc (t)), corresponde a la prediccion de la salida cuando la senal
de control es uc (t).
La respuesta libre corresponde a la evolucion del proceso debido a su estado actual
(incluido por tanto el efecto de acciones pasadas) mientras que la respuesta forzada es
la debida a las acciones de control futuras.
y

Process

uc

y
f

yc

Figura 2.2: Respuestas libre y forzada

2.1.2

Funcion objetivo

Los diversos algoritmos de MPC proponen distintas funciones de coste para la obtencion
de la ley de control. En general se persigue que la salida futura en el horizonte
considerado siga a una determinada senal
de referencia al mismo tiempo que se puede
penalizar el esfuerzo de control requerido para hacerlo. La expresion general de tal
funcion objetivo sera:

J (N1  N2 Nu) =

N
X
2

j =N1

(j )y(t + j j t) ; w(t + j )]2 +

Nu
X
j =1

(j )4u(t + j ; 1)]2

:3)

(2

En algunos metodos el segundo sumando, que considera el esfuerzo de control, no


se tiene en cuenta, mientras que en otros tambien aparecen directamente los valores de
la senal
de control (no sus incrementos). En la funcion de coste se pueden considerar:

Elementos basicos

16

 Parametros: N1 y N2 son los horizontes mnimo y maximo de coste (o de prediccion) y Nu es el horizonte de control, que no tiene por que coincidir con el
horizonte maximo, como se vera posteriormente. El significado de N1 y N2 resulta bastante intuitivo: marcan los lmites de los instantes en que se desea que
la salida siga a la referencia. As, si se toma un valor grande de N1 es porque
no importa que haya errores en los primeros instantes, lo cual provocara una
respuesta suave del proceso. Notese que para procesos con tiempo muerto d no
tiene sentido que N1 sea menor que dicho valor puesto que la salida no empezara
a evolucionar hasta el instante t + d. Ademas, si el proceso es de fase no mnima,
este parametro permite eliminar de la funcion objetivo los primeros instantes de
respuesta inversa.

Los coeficientes  (j ) y (j ) son secuencias que ponderan el comportamiento futuro. Usualmente se consideran valores constantes o secuencias exponenciales.
Por ejemplo se puede conseguir un peso exponencial de  (j ) a lo largo del horizonte usando:
(j ) = N2;j
Si  esta comprendido entre 0 y 1 indica que se penaliza mas a los errores mas
alejados del instante t que a los mas proximos, dando lugar a un control mas
suave y con menor esfuerzo. Si, por el contrario,  > 1 es que se penalizan mas
los primeros errores, provocando un control mas brusco.

Todos estos valores pueden ser usados como parametros de sintonizacion, obteniendo un abanico muy amplio de posibilidades con las que se puede cubrir
una extensa gama de opciones, desde un control estandar hasta una estrategia
disenada

a medida para un proceso en particular.

 Trayectoria de referencia: Una de las ventajas del control predictivo es que si


se conoce a priori la evolucion futura de la referencia, el sistema puede empezar
a reaccionar antes de que el cambio se haya efectivamente realizado, evitando
los efectos del retardo en la respuesta del proceso. En muchas aplicaciones la
evolucion futura de la referencia r(t + k ) es conocida de antemano, como en

Robotica,
servos o procesos en batch; en otras aplicaciones aunque la referencia sea
constante, se puede conseguir una sensible mejora de prestaciones simplemente
conociendo el instante de cambio de valor y adelantandose a esa circunstancia.
En el criterio de minimizacion (2.3), la mayora de los metodos suelen usar una
trayectoria de referencia w(t + k ) que no tiene por que coincidir con la referencia
real. Normalmente sera una suave aproximacion desde el valor actual de la salida
y(t) a la referencia conocida mediante un sistema de primer orden:

w(t) = y(t)

w(t + k) = w(t + k ; 1) + (1 ; )r(t + k) k = 1 : : : N

:4)

(2

 es un parametro comprendido entre 0 y 1 (mientras mas proximo a 1 mas

suave sera la aproximacion) que constituye un valor ajustable que influira en


la respuesta dinamica del sistema. En la figura 2.3 se muestra la forma de la
trayectoria cuando la referencia r (t + k) es constante y para dos valores distintos
de ; para valores pequenos
de este parametro se tiene un seguimiento rapido

Controladores predictivos

17

(w1 ) mientras que si aumenta, la trayectoria de referencia sera w2 dando lugar a


una respuesta mas suave.

r(t+k)
w1(t+k)

w2 (t+k)

y(t)

Figura 2.3: Trayectoria de referencia

 Restricciones: En la practica, todos los procesos estan sujetos a restricciones. Los


actuadores tienen un campo limitado de accion as como una determinada velocidad de cambio (slew rate), como es el caso de las valvulas, limitadas por las
posiciones de totalmente abierta o cerrada y por la velocidad de respuesta. Razones constructivas, de seguridad o medioambientales o bien los propios alcances de
los sensores pueden causar lmites en las variables de proceso, tales como niveles

en depositos,
caudales en tuberas o temperaturas y presiones maximas. Ademas,
normalmente las condiciones de operacion vienen definidas por la interseccion
de ciertas restricciones por motivos fundamentalmente economicos, con lo que el
sistema de control operara cerca de los lmites. Todo lo expuesto anteriormente
hace necesaria la introduccion de restricciones en la funcion a minimizar.
Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo
cual han tenido gran e xito en la industria. Normalmente se consideraran lmites
en la amplitud y el slew rate de la senal
de control y lmites en las salidas:

umin 
u(t)
dumin  u(t) ; u(t ; 1)
ymin 
y(t)

 umax
 dumax
 ymax

8t
8t
8t

con la adicion de estas restricciones a la funcion objetivo, la minimizacion resulta


mas compleja, no pudiendo obtenerse la solucion analticamente como en el caso
sin restringir.

de los principales algoritmos


Revision

18

2.1.3

Obtencion de la ley de control

Para obtener los valores u(t + k j t) sera necesario minimizar la funcional J de la


ecuacion (2.3). Para ello se calculan los valores de las salidas predichas y (t + k j t)
en funcion de valores pasados de entradas y salidas y de senales

de control futuras,
haciendo uso del modelo que se haya elegido y se sustituyen en la funcion de coste,
obteniendo una expresion cuya minimizacion conduce a los valores buscados. Para el
criterio cuadratico si el modelo es lineal y no existen restricciones se puede obtener una
solucion analtica, en otro caso se debe usar un metodo iterativo de optimizacion.
De cualquiera de las maneras la obtencion de la solucion no resulta trivial pues
existiran N2 ; N1 + 1 variables independientes, valor que puede ser elevado (del orden
de 10 a 30). Con la idea de reducir estos grados de libertad se puede proponer cierta
estructura a la ley de control. Ademas se ha encontrado que esta estructuracion de la
ley de control produce una mejora en la robustez y en el comportamiento general del
sistema, debido fundamentalmente a que el hecho de permitir la libre evolucion de
las variables manipuladas (sin estructurar) puede conducir a senales

de control de alta
frecuencia no deseables y que en el peor de los casos podran conducir a la inestabilidad.
Esta estructura de la ley de control se plasma en el uso del concepto de horizonte de
control (Nu), que consiste en considerar que tras un cierto intervalo Nu < N2 no hay
variacion en las senales

de control propuestas, es decir:

4u(t + j ; 1) = 0

j > Nu

lo cual es equivalente a dar pesos infinitos a las cambios en el control a partir de cierto
instante. El caso lmite sera considerar Nu igual a 1 con lo que todas las acciones
futuras seran iguales a u(t)1 .

de los principales algoritmos


2.2 Revision
Se presentan a continuacion los principales algoritmos de control predictivo, mostrando
sus principales caractersticas pero sin entrar en detalles. Se pueden encontrar estudios
comparativos en [10], [7], [11] y [16]. En el tema siguiente se estudiaran en detalle los
dos metodos considerados mas representativos: DMC y GPC.

Dynamic Matrix Control


Este metodo usa la respuesta ante escalon (2.2) para modelar el proceso, considerando
los N primeros terminos, asumiendo por tanto que el proceso es estable. En
solo
1

Recuerdese que debido al horizonte deslizante, la senal


de control se recalcula en el siguiente
muestreo.

Controladores predictivos

19

cuanto a las perturbaciones, se considera que su valor permanence constante e igual al


existente en el instante actual durante todo el horizonte, es decir, igual al valor medido
de la salida (ym ) menos el estimado por el modelo y (t j t)).

n (t + k j t) = n (t j t) = ym(t) ; y(t j t)
y por tanto el valor predicho de la salida sera:

y(t + k j t) =

k
X
i=1

gi 4 u(t + k ; i) +

N
X
i=k+1

gi 4 u(t + k ; i) + n (t + k j t)

donde el primer termino contiene las acciones de control futuras (que seran calculadas),

el segundo los valores pasados de las acciones de control (conocidas) y el ultimo


representa las perturbaciones. La funcion de coste puede considerar solo errores futuros
o incluir tambien el esfuerzo de control, en cuyo caso toma la forma generica (2.3).
Una de las caractersticas de este metodo que lo ha hecho muy popular en la industria
es la inclusion de restricciones, que se traduce en inecuaciones de la forma generica:

N
X
i=1

Cyij y(t + k j t) + Cuij u(t + k ; i) + cj  0

j = 1 : : : Nc

En este caso la optimizacion debe ser numerica y se lleva a cabo en cada periodo de
muestreo, enviandose la senal
u(t) y recalculando todo en el nuevo periodo de muestreo,
como en todos los metodos MPC. Los principales inconvenientes de este metodo son el
tamano
del modelo empleado y la imposibilidad de tratar procesos inestables.

Model Algorithmic Control


Este metodo se conoce tambien como Model Predictive Heuristic Control y el producto
comercial se llama IDCOM (Identification-Command). Es muy similar al DMC con la
diferencia principal de usar un modelo de respuesta impulsional (2.1). Introduce el
concepto de trayectoria de referencia como un sistema de primer orden que evoluciona
desde la salida actual al setpoint segun una determinada constante de tiempo. La
varianza del error entre esta trayectoria y la salida es lo que marca la minimizacion de
la funcion objetivo. Las perturbaciones se pueden tratar como en el metodo anterior o
se pueden estimar segun la siguiente expresion:

n (t + k j t) = n (t + k ; 1 j t) + (1 ; )(ym(t) ; y(t j t))


con n (t j t) = 0.  es un parametro ajustable (0   < 1) relacionado con el tiempo de
respuesta, el ancho de banda y la robustez del bucle cerrado [7]. El metodo tambien
considera restricciones en los actuadores, en las variables internas o en salidas secundarias.

de los principales algoritmos


Revision

20

Puntos de coincidencia

Figura 2.4: Puntos de coincidencia


Predictive Functional Control
Este controlador fue desarrollado por Richalet [18] para procesos rapidos. Emplea un
modelo en el espacio de estados, por lo que permite el manejo de procesos inestables, y
tambien la extension al caso no lineal. Este esquema de control tiene dos caractersticas
que lo distinguen del resto de controladores de la familia: el uso de puntos de coincidencia
y de funciones base.
El concepto de puntos de coincidencia (ver figura 2.4) se emplea para simplificar
los calculos considerando solo un subconjunto de puntos en el horizonte de prediccion
hj , j = 1 : : :  nH . La salida deseada y la predicha deben coincidir en dichos puntos, no
en todo el horizonte de prediccion.
La otra idea innovadora de este metodo es la parametrizacion de la senal
de control como una combinacion lineal de ciertas funciones base, que son elegidas segun la
naturaleza del proceso y la referencia:

u(t + k) =

nB
X
i=1

i(t)Bi(k)

Normalmente estas funciones son de tipo polinomico: escalones (B1 (k ) = 1), rampas
(B2 (k ) = k) o parabolas (B3 (k ) = k2 ), ya que la mayora de referencias se pueden
especificar como combinacion de estas funciones. Con esta estrategia, un perfil de
entrada complejo se puede especificar usando un pequeno
numero de parametros
desconocidos i que son las incognitas del problema de minimizacion.
La funcion a minimizar es:

J=

nH
X

y t hj ) ; w(t + hj )]2

 ( +

j =1

El algoritmo PFC tambien puede manejar restricciones de maximo y mnimo en la


aceleracion, que son practicas en aplicaciones de servocontrol.

Controladores predictivos

21

Extended Prediction Self Adaptive Control


El algoritmo EPSAC usa un modelo de funcion de transferencia

A(z;1 )y(t) = B (z;1 )u(t ; d) + v(t)


donde d es el retardo y v (t) la perturbacion. Este modelo puede ampliarse para tratar
perturbaciones medibles anadiendo

un termino D (z;1 )d(t) para incluir efecto feedfor-

ward. La prediccion se obtiene segun se muestra en [10] y la estructura de la ley de


control es muy simple, ya que se considera que la senal
de control permanecera constante a partir del instante t (es decir, horizonte de control igual a 1): 4u(t + k ) = 0 para
k > 0. Para obtener la senal
de control de minimiza una funcion de coste de la forma:
N
X

(k)w(t + k) ; P (z;1)y(t + k j t)]2


k=d
donde P (z ;1 ) es un polinomio de diseno
con ganancia unitaria y
(k) es una secuencia
de ponderacion. La senal
de control se puede calcular analticamente de la forma:

N
P
h
(k)w(t + k) ; P (z;1)y(t + k j t)]

u(t) = k=d

N
P

(k)h2

k=d

siendo hk los coeficientes de la respuesta impulsional del sistema.


Extended Horizon Adaptive Control
Esta formulacion tambien emplea un modelo de funcion de transferencia y pretende
minimizar la discrepancia entre la salida calculada y la referencia en el instante t + N :

y(t + N j t) ; w(t + N ), con N  d. La solucion a este problema no es unica


(a menos
que N = d)[21]; una posible estrategia es considerar horizonte de control igual a 1:

4u(t + k ; 1) = 0
o minimizar el esfuerzo de control

J=

NX
;d
k =0

1<k N ;d

u2(t + k)

Este metodo utiliza un predictor de N pasos de la forma

y(t + N j t) = y(t) + F (z;1) 4 y(t) + E (z;1 )B (z;1 ) 4 u(t + N ; d)


donde E (z ;1 ) y F (z ;1 ) son polinomios que satisfacen la relacion
;1
;1 ;1
;1 ;N F (z;1 )(1 ; z;1 )
(1 ; z ) = A(z )E (z )(1 ; z ) + z

de los principales algoritmos


Revision

22

con el grado de E igual a N ; 1. Una ventaja de este metodo es que se puede encontrar
facilmente una solucion explcita, dada por
) ; y (t + N j t))
u(t) = u(t ; 1) + 0(w(t + NNP
;d 2
i

k=0

siendo k el coeficiente correspondiente a 4u(t + k) en la ecuacion de prediccion. Por


tanto la ley de control depende solo de los parametros del proceso y puede hacerse

facilmente adaptativa si se emplea un identificador en lnea. El unico


coeficiente de
ajuste es el horizonte de prediccion N , lo cual simplifica el uso pero proporciona poca
libertad para el diseno.
Observese que no puede usarse trayectoria de referencia porque
el error se considera solo en un instante (t + N ), ni tampoco la ponderacion del esfuerzo
de control.

Generalized Predictive Control


Este metodo propuesto por Clarke et al. [5] emplea un modelo CARIMA (Controlled
Auto-Regressive Integrated Moving Average) para la prediccion de la salida:
(t)
A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1 ) e4

donde la perturbacion viene dada por un ruido blanco coloreado por el polinomio
C (z;1 ). Como en la practica es difcil encontrar el verdadero valor de este polinomio, se
puede emplear como parametro de diseno
para rechazo de perturbaciones o mejora de

la robustez. La prediccion optima


se lleva a cabo resolviendo una ecuacion diofantica,
lo cual puede hacerse eficazmente de forma recursiva.
Este algoritmo, al igual que otros que usan el modelo de funcion de transferencia, se puede implementar facilmente en forma adaptativa usando un algoritmo de
identificacion en lnea como los mnimos cuadrados recursivos.
usa una funcion de coste cuadratica de la forma
N2
Nu
X
X
J (N1  N2 Nu) =
(j )y(t + j j t) ; w(t + j )]2 + (j )4u(t + j ; 1)]2
j =N1
j =1

GPC

donde las secuencia de ponderacion  (j ) y (j ) se eligen normalmente constantes


o exponenciales y la trayectoria de referencia w (t + j ) se puede generar como una
secuencia que empieza en el valor actual de la salida y tiende exponencialmente al
setpoint.
Las bases teoricas del algoritmo GPC has sido ampliamente estudiadas y se puede
demostrar (ver [4]) que, para distintos conjuntos de parametros, el algoritmo es estable
y que otros controladores como por ejemplo el dead beat son casos incluidos en e ste.

Controladores predictivos

23

2.3 Estado de la tecnologa


Se puede considerar que productos como el MAC-IDCOM o el DMC estan ampliamente introducidos en la industria, proporcionando un buen control de sistemas multivariables
sin restricciones y constituyen la primera generacion de controladores predictivos.
Sin embargo, la gestion de restricciones es algo que todava no estaba bien resuelto
en estos productos hasta que aparecio una version de DMC denominada QDMC, ligera
variacion del algoritmo basico en el que se consideran restricciones duras y blandas de
forma sistematica. Este algoritmo se suele considerar como la segunda generacion.
Conforme la tecnologa MPC iba despertando mayor interes y aceptacion, los problemas que se abordaban eran cada vez mas complejos, apareciendo nuevas problematicas
como el tratamiento de la no-factibilidad, la consideracion de modelos apropiados para
procesos inestables o la representacion de la perturbacion para la realimentacion de otra
forma mas adecuada que un valor constante. Tambien se consideraba importante la
respuesta ante fallos, de forma que el controlador fuera capaz de reconfigurarse si se
perdiera alguna senal,
o la dificultad de incluir diversos requerimientos de control en

una unica
funcion objetivo.
Estos problemas motivaron el desarrollo de algoritmos como HIECON (Hierarchical

Constrained Control, por Adersa) o IDCOM-M (por parte de Setpoint). Este ultimo
incluye un supervisor para plantas mal condicionadas, funcion objetivo multicriterio o
jerarqua de restricciones. El SMOC de Shell es similar incluyendo caractersticas como
modelos en espacio de estados (validos para sistemas inestables) o la consideracion de
un observador extendido para la realimentacion de la salida en lugar del valor constante
empleado en los demas metodos. Estos metodos junto con el PCT de Profimatics, el
RMPCT de Honeywell o el PFC de Adersa constituyen la tercera generaci
on.
Los productos que existen hoy da en el mercado comparten las ideas basicas de

DMC o MAC desarrollados hace m


as de veinte anos
y el mayor e nfasis en los ultimos
anos
se ha centrado en la consideracion de otros tipos de modelos, incluyendo modelos
no lineales, y en una mejor integracion del controlador con los equipos de control
existentes.
A pesar de su creciente implantacion, la tecnologa actual tiene todava ciertas
limitaciones, siendo las mas destacables las siguientes:

 Modelos sobre-parametrizados. La mayora de los productos comerciales usan


modelos de convolucion, que emplean una cantidad considerable de parametros
y no se pueden usar para representar dinamicas inestables.
 Sintonizacion. No existe una clara relacion entre los parametros de sintona y el
comportamiento del bucle cerrado. La garanta de estabilidad, sobre todo cuando
existen restricciones, es otro gran problema.

24

Estado de la tecnologa
 Optimalidad de la solucion. Muchos paquetes proporcionan una solucion sub
optima
para acelerar el calculo. En algunos casos este procedimiento no esta
justificado.
 Incertidumbres en el modelo. Normalmente no se tiene en cuenta la incertidumbre asociada a la identificacion, sino que se desintoniza el controlador intentando
aumentar la robustez.
 Perturbacion constante. Aunque es la hipotesis mas sensata a priori, se podra
obtener una mejor realimentacion si la distribucion de la perturbacion se estudiara
con mas cuidado.

Tema 3
Algoritmos
En este tema se tratan en profundidad los dos algoritmos considerados mas representativos de las metodologas existentes en Control Predictivo. Representan a las dos
familias de controladores predictivos, una de origen claramente industrial y la otra mas
academica.

3.1 Dynamic Matrix Control


El metodo DMC se desarrollo a finales de los setenta by Cutler and Ramaker [6] de Shell
Oil Co. y ha sido aceptado ampliamente en el mundo industrial, principalmente por
las industrias petroqumicas. Actualmente DMC es algo mas que un algoritmo y parte
de su e xito se debe al hecho de que el producto comercial resuelve otros temas como
identificacion u optimizacion global de la planta. En esta seccion solo se analiza el
algoritmo standard sin abordar detalles tecnicos propios del producto de mercado que
no son de dominio publico.
Pero a pesar de este e xito en la practica, este metodo adolece quizas de la ausencia
de un analisis teorico mas completo que estudie la influencia de los parametros de
diseno
(horizontes, secuencias de ponderacion) sobre la estabilidad del bucle cerrado
as como de resultados de robustez.

3.1.1

Prediccion

El modelo de proceso que se emplea es el de respuesta temporal, considerando la


perturbacion como constante a lo largo del horizonte. El procedimiento para obtener
la prediccion se describe a continuacion.
25

Dynamic Matrix Control

26
Como se emplea un modelo de respuesta ante escalon:

y(t) =

1
X
i=1

gi 4 u(t ; i)

los valores predichos a lo largo del horizonte seran:

y(t + k j t) =

1
X

gi 4 u(t + k ; i) + n (t + k j t) =
1
k
X
X
gi 4 u(t + k ; i) +
gi 4 u(t + k ; i) + n (t + k j t)
=
i=1

i=k+1

i=1

Las perturbaciones se consideran constantes, n (t + k j t) = n (t j t) = ym (t) ; y (t j t),


por lo que se puede escribir:

k
1
X
X
y(t + k j t) = gi 4 u(t + k ; i) +
gi 4 u(t + k ; i) + ym(t) ;
i=1
i=k+1
1
k
X
X
;
gi 4 u(t ; i) = gi 4 u(t + k ; i) + f (t + k)
i=1

i=1

donde f (t + k ) es la respuesta libre del proceso, es decir, la parte de la respuesta que no


depende de las acciones de control futuras, y viene dada por:

f (t + k) = ym(t) +

1
X
i=1

gk+i ; gi) 4 u(t ; i)

:1)

(3

Si el proceso es asintoticamente estable, los coeficientes gi de la respuesta ante


tienden a un valor constante despues de N periodos de muestreo, por lo que
escalon
se puede considerar que
gk+i ; gi  0
i>N
y por tanto la respuesta libre se puede calcular como

f (t + k) = ym(t) +

N
X
i=1

gk+i ; gi) 4 u(t ; i)

Notese
que si el proceso no es estable, entonces no existe N y no se puede calcular f (t + k) (aunque existe una generalizacion en el caso de que la inestabilidad sea
producida por integradores puros).
(k

Ahora las predicciones se pueden calcular a lo largo del horizonte de prediccion


1 : : :  p), considerando m acciones de control.

y(t + 1 j t)

g1 4 u(t) + f (t + 1)

Algoritmos

27

y(t + 2 j t)

y(t + p j t)

..
.

g2 4 u(t) + g1 4 u(t + 1) + f (t + 2)
p
X
gi 4 u(t + p ; i) + f (t + p)
i=p;m+1

Si se define la matriz dinamica G como:

se puede escribir que:

2
66 gg12 g01
66 . .
66 .. ..
66 gm gm;1
66 .. ..
4 . .
gp gp;1



...

...

0
0
..
.

g1

..
.
   gp;m+1

3
77
77
77
77
77
5

y^ = Gu + f

:2)

(3

Observese que esta formada por m (horizonte de control) columnas de la respuesta


ante escalon apropiadamente desplazadas hacia abajo.
es un vector de dimension
p que contiene las predicciones de la salida, representa el vector de incrementos de
control y es el vector de respuestas libres. Esta es la expresion que relaciona las
respuestas futuras con los incrementos en las senales

de control, por lo que usara para


calcular las acciones necesarias para conseguir el comportamiento deseado del sistema.

3.1.2

y^

Perturbaciones medibles

El efecto de las perturbaciones medibles se puede anadir

facilmente a las anteriores


ecuaciones de prediccion, ya que e stas se pueden tratar como entradas al sistema. La
expresion (3.2) se puede usar para calcular la prediccion del efecto de las perturbaciones
en la salida de la siguiente forma:

y^d = Dd + fd
y^

donde d es la contribucion de las perturbaciones medibles a la salida, es una matriz


similar a
que contiene los coeficientes de la respuesta del sistema a un escalon en
la perturbacion, es el vector de incrementos en la perturbacion y d es la parte de la
respuesta que no depende de la perturbacion.

En el caso mas general de perturbaciones medibles y no medibles, la respuesta libre


completa del sistema (la fraccion de la salida que no depende de la variable manipulada)

Dynamic Matrix Control

28

se puede considerar como la suma de cuatro efectos: la respuesta a la entrada u(t), a la


perturbacion medible d(t), a la perturbacion no medible y al estado actual del proceso:

f = fu + D d + fd + fn
Por tanto la prediccion se puede expresar en la forma general

y^ = Gu + f
3.1.3

Algoritmo de control

El e xito en la industria del DMC se ha debido principalmente a su aplicacion a sistemas multivariables de gran dimension con la consideracion de restricciones. En esta
seccion se describe el algoritmo de control comenzando por el caso mas simple de un
sistema monovariable sin restricciones y extendiendolo posteriormente al caso general
multivariable con restricciones.
El objetivo del controlador DMC es llevar el proceso los mas cerca posible al setpoint
en el sentido de mnimos cuadrados con la posibilidad de incluir una penalizacion en los
movimientos de la senal
de control. Por ello se seleccionan las variables manipuladas
de forma que minimicen un objetivo cuadratico que puede incluir solo los errores
futuros
p

J=

y t j j t) ; w(t + j )]2

 ( +

j =1
o tambien el esfuerzo de control, presentando la forma generica

J=

p
X

y t j j t) ; w(t + j )]

 ( +

j =1

m
X
j =1

4u(t + j ; 1)]2

ee

uu

Si no existen restricciones, la minimizacion de la funcion de coste J = T +  T ,


donde es el vector de errores futuros a lo largo del horizonte de prediccion y es el
vector de futuros incrementos en la senal
de control 4u(t) : : :  4u(t + m), se puede
hacer de forma analtica calculando la derivada de J y haciendola igual a 0, lo que
proporciona el resultado general:

u = (GT G + I ); GT (w ; f )
1

:3)

(3

Recuerdese que, como en todas las estrategias predictivas, solo se enva al proceso
el primer elemento del vector (4u(t)). No es aconsejable implementar la secuencia
completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma
exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que
provocan que la salida real difiera de las predicciones que se emplean para calcular la

Algoritmos

29
w

u
K

Proceso

f
Calculo
Resp. libre

Figura 3.1: Ley de control


secuencia futura de acciones de control. Ademas, el setpoint puede cambiar durante
los proximos m intervalos.
Resulta interesante analizar en que consiste realmente la ley de control. Analizando
la expresion 3.3 se observa que el primer elemento del vector u, que es la senal
que
efectivamente se enva a la planta, es el producto de la primera fila de la matriz
(GT G + I );1 GT (llam
emosle K ) por la diferencia entre la trayectoria de referencia y la
respuesta libre, que es el error futuro si no hubiera incrementos en la senal
de control.
Se puede decir por tanto que el incremento de la senal
de control es proporcional (por
medio de K ) a los errores futuros y por tanto habra cambios en la senal
de control
siempre que el controlador detecte que va a haber una discrepancia en el futuro entre el
objetivo deseado y el comportamiento esperado del sistema. Esta idea queda reflejada
en la figura 3.1.

El caso con restricciones


Aunque computacionalmente mas complicado que otros algoritmos mas simples, la
capacidad de manejar restricciones que posee este metodo (y MPC en general) lo hace
muy atractivo para aplicaciones practicas, ya que en general el punto de operacion

optimo
segun criterios economicos se encuentra normalmente en la interseccion de las
restricciones, como se muestra en la figura 3.2. Por razones de seguridad, es necesario
mantener una zona segura alrededor del punto de operacion, ya que el efecto de las
perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona
se puede reducir (y por tanto aumentar los beneficios economicos) si el controlador es
capaz de manejar restricciones (punto de operacion 1).
Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades
de forma generica

N
X
i=1

Cyij y(t + k j t) + Cuij u(t + k ; i) + cj  0

j = 1 : : : Nc

Dynamic Matrix Control

30

Zona segura 1

P. operacion
optimo

Punto operacion 1
Restriccion
zona
segura 2

Punto operacion 2

Restriccion

Figura 3.2: Punto de operacion optimo


de un proceso tpico
que deben tenerse en cuenta para la minimizacion. Como se ha visto, las salidas se
pueden expresar en funcion del vector de incrementos de control a traves de la matriz
dinamica, por que las restricciones tanto en la entrada como en la salida se pueden
 , como se vera con mas
recoger en una desigualdad matricial de la forma
detalle en el tema dedicado a restricciones. Ahora la minimizacion es un problema de
Programacion Cuadratica QP, cuya solucion es numerica.

Ru

Todo lo relacionado con las restricciones sera abordado con mayor grado de detalle
en el tema dedicado a ello.

Extension al caso multivariable


El esquema previo se puede extender facilmente al caso de sistemas con varias entradas
y varias salidas. Las ecuaciones basicas se mantienen igual a excepcion de que las
matrices y vectores cambian de dimension para poder incluir todas las entradas y
salidas.
Al tratarse de modelos lineales, se puede aplicar el principio de superposicion para
obtener el valor de las salidas ante las diversas entradas. Para ello se define el vector
de salidas futuras como:

y^ = y (t + 1 j t) : : :  y (t + p j t) : : :  yny (t + 1 j t) : : :  yny(t + pny j t)T


1

y el de senales

de control de la forma:

u = [4u (t) : : :  4u (t + m
1

; 1) : : :  4unu(t) : : :  4unu(t + mnu ; 1)]T

as como la respuesta libre:

f = f (t + 1 j t) : : :  f (t + p j t) : : :  fny (t + 1 j t) : : :  fny (t + pny j t)T


1

teniendo en cuenta que la respuesta libre de la salida i depende tanto de valores pasados
de yi como de valores pasados de todas las senales

de control.

Algoritmos

31

Con estas definiciones, la ecuacion de prediccion es igual que en el caso monovariable simplemente considerando que la matriz G toma la forma:

2 G G
66 G1121 G1222
66 ..
..
4 .
.
Gny1 Gny2



...

G1nu
G2nu

..
.
   Gnynu

3
77
77
5

Cada submatriz Gij contiene los coeficientes de la respuesta ante escalon i-esima
correspondiente a la entrada j-esima. El proceso de minimizacion es analogo solo que
la ponderacion tanto de los errores como de los esfuerzos de control se realiza con
matrices de peso.

3.2 Control Predictivo Generalizado


El Control Predictivo Generalizado GPC fue propuesto por Clarke et al. en 1987 y se ha
convertido en uno de los metodos mas populares en el a mbito del Control Predictivo
tanto en el mundo industrial como en el academico. Se ha empleado con e xito en
numerosas aplicaciones industriales, mostrando buenas prestaciones a la vez que un
cierto grado de robustez respecto a sobreparametrizacion o retardos mal conocidos.
Puede resolver muchos problemas de control diferentes para un amplio campo de
procesos con un numero razonable de variables de diseno,
que son especificadas por
el operario dependiendo del conocimiento previo del proceso y de los objetivos de
control.
La idea basica del GPC es calcular una secuencia de futuras acciones de control
de tal forma que minimice una funcion de coste multipaso. El ndice a minimizar es
una funcion cuadratica que mide por un lado la distancia entre la salida predicha del
sistema y una cierta trayectoria de referencia hasta el horizonte de prediccion, y por
otro el esfuerzo de control necesario para obtener dicha salida.
El Control Predictivo Generalizado tiene muchas ideas en comun con otros controladores predictivos previamente mencionados ya que esta basado en las mismas ideas
pero posee a su vez algunas diferencias. Como se vera mas adelante, es capaz de
proporcionar una solucion explcita (en ausencia de restricciones), puede trabajar con
procesos inestables o de fase no mnima e incorpora el concepto de horizonte de control
as como la consideracion en la funcion de coste de ponderacion de los incrementos en
las acciones de control. Las diversas posibilidades disponibles para el GPC conducen a
una gran variedad de objetivos de control comparado con otras realizaciones, algunas
de las cuales pueden ser consideradas como subconjuntos o casos lmites del GPC.

Control Predictivo Generalizado

32

3.2.1

Formulacion del Control Predictivo Generalizado

La mayora de los procesos de una sola entrada y una sola salida (single-input singleoutput, SISO), al ser considerados en torno a un determinado punto de trabajo y tras ser
linealizados, pueden ser descritos de la siguiente forma:

A(z;1 )y(t) = z;d B (z;1 )u(t ; 1) + C (z;1)e(t)


donde u(t) y y (t) son respectivamente la senal
de control y la salida del proceso y e(t) es
un ruido blanco de media cero. A, B y C son los siguientes polinomios en el operador
de desplazamiento hacia atras z ;1 :

A(z;1 )
B (z;1 )
C (z;1)

=
=
=

1 + a1 z ;1 + a2 z ;2 + ::: + ana z ;na


b0 + b1 z;1 + b2 z;2 + ::: + bnbz;nb
1 + c1 z ;1 + a2 z ;2 + ::: + cncz ;nc

donde d es el tiempo muerto del sistema.


Este modelo es conocido como Autorregresivo de Media Movil (Controller AutoRegressive Moving-Average CARMA). En muchas aplicaciones industriales en las que
las perturbaciones son no-estacionarias resulta mas conveniente el uso de un modelo
CARMA integrado, dando lugar al CARIMA, que viene descrito por:
(t)
A(z;1 )y(t) = B (z;1 )z;d u(t ; 1) + C (z;1) e4

con

4 = 1 ; z;1

:4)

(3

Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. Notese


que en el caso de que C ;1 pueda ser truncado se puede absorber en A y B .
El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia
de senales

de control que minimice una funcion de coste de la forma:

J (N1 N2  Nu) =

N
X
2

j =N1

(j )y(t + j j t) ; w(t + j )]

Nu
X
j =1

(j )4u(t + j ; 1)]2

:5)

(3

donde y (t + j j t) es la prediccion optima


j pasos hacia delante de la salida del proceso
con datos conocidos hasta el instante t, N1 y N2 son los horizontes mnimo y maximo
de coste, Nu es el horizonte de control y  (j ) y (j ) son las secuencias de ponderacion
mientras que w(t + j ) es la futura trayectoria de referencia, que se puede calcular segun
se muestra en la figura 2.3. En muchas situaciones se considera  (j ) igual a 1 y (j )
constante.
El objetivo es pues el calculo de la futura secuencia de control u(t), u(t + 1),... de tal
manera que la salida futura del proceso y (t + j ) permanezca proxima a w (t + j ). Esto
se logra minimizando J (N1  N2  Nu).

Algoritmos

33

Prediccion optima
Con la intencion de minimizar la funcion de coste, se obtendra previamente la pre
diccion optima
de y (t + j ) para j  N1 y j  N2 . Considerese la siguiente ecuacion
diofantica:
1 = Ej (z ;1 ) 4 A + z ;j Fj (z ;1 )
1 = Ej (z ;1 )A + z ;j Fj (z ;1 )

(3.6)

Los polinomios Ej y Fj estan unicamente


definidos con grados j ; 1 y na respectivamente. Se pueden obtener dividiendo 1 entre A (z ;1 ) hasta que el resto pueda
ser factorizado como z;j Fj (z ;1 ). El cociente de la division es entonces el polinomio
Ej (z;1 ).
Si se multiplica la ecuacion (3.4) por Ej (z ;1 ) z j 4

A (z;1 )Ej (z;1 )y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j )

(3.7)

Teniendo en cuenta (3.6), la ecuacion (3.7) queda:


(1 ;

z;j Fj (z;1 ))y(t + j ) = Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j )

La cual se puede escribir como

y(t + j ) = Fj (z;1 )y(t) + Ej (z;1 )B (z;1 ) 4 u(t + j ; d ; 1) + Ej (z;1 )e(t + j )

:8)

(3

Al ser el grado del polinomio Ej (z ;1 ) igual a j ; 1 los terminos del ruido en la


ecuacion (3.8) estan todos en el futuro. La mejor prediccion de y (t + j ) sera por
consiguiente:

y(t + j j t) = Gj (z;1 ) 4 u(t + j ; d ; 1) + Fj (z;1 )y(t)


donde Gj (z ;1 ) = Ej (z ;1 )B (z ;1 )

Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursivamente, de forma que los nuevos valores en el paso j + 1 (Ej +1 y Fj +1) sean funcion de
los del paso j . A continuacion se muestra una demostracion simple de la recursividad
de la ecuacion diofantica. Existen otras formulaciones del GPC que no estan basadas en
la recursividad de esta ecuacion.
Considerense que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A (z ;1 )
hasta que el resto haya sido factorizado como z;j Fj (z ;1 ) .
Con:

Fj (z;1 )
Ej (z;1 )

=
=

fj0 + fj1z;1 +    + fjnaz;na


ej0 + ej1z;1 +    + ejj;1z;(j;1)

Control Predictivo Generalizado

34

Supongase
que se utiliza el mismo procedimiento para obtener Ej +1 y Fj +1, es decir,
dividir 1 entre A (z ;1 ) hasta que el resto se pueda factorizar como z;(j +1) Fj +1 (z ;1 ) con

Fj+1(z;1 ) = fj+10 + fj+11z;1 +    + fj+1naz;na


Esta claro que solamente es necesario dar un paso mas en la division para obtener
los polinomios Ej +1 y Fj +1 . Al ser Ej +1 el nuevo cociente de la division, sera igual al
cociente que haba hasta el momento (Ej ) mas un nuevo termino, que sera el fj0 pues

Por tanto:
el divisor (A ) es monico.

Ej+1(z;1 ) = Ej (z;1 ) + ej+1j z;j

con ej +1j

fj0

Teniendo en cuenta que el nuevo resto sera el resto anterior menos el producto del
cociente por el divisor, los coeficientes del polinomio Fj +1 se pueden expresar como:

fj+1i = fji+1 ; fj0 a i+1 i = 0    na


En resumen, la forma de obtener los polinmios Ej y Fj es la siguiente:
1. Comenzar con E1

1, F1

z(1 ; A )

2. Ir anadiendo

nuevos terminos a Ej con ej +1j


3. Calcular fj +1i

fj0

fji+1 ; fj0 a i+1 i = 0    na, (siendo fjna+1 = 0).

El polinomio Gj +1 puede ser obtenido recursivamente como sigue:

Gj+1 = Ej+1B = (Ej + fj0z;j )B = Gj + fj0z;j B


Es decir, los primeros j coeficientes de Gj +1 seran identicos a los de Gj mientras que
el resto viene dado por:

gj+1j+i = gjj+i + fj0 bi

para i = 0    nb

Para resolver el GPC es necesario obtener el conjunto de senales

de control u(t),
u(t + 1), ...,u(t + N ) que minimizan la ecuacion (3.5). Al tener el proceso un retardo de
d perodos de muestreo, la salida solo se vera influenciada por la senal
u(t) despues del
instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes pueden ser definidos
como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido hacer N1 < d + 1 ya que
los terminos de (3.5) solo dependeran de las senales

de control pasadas. Por otro lado,


haciendo N1 > d + 1 los primeros puntos de la secuencia de salida, que seran los mejor
estimados, no se tendran en cuenta.

Algoritmos

35

El conjunto de las j predicciones optimas:

y(t + d + 1 j t)
y(t + d + 2 j t)

y(t + d + N j t)

=
=

..
.
=

Gd+1 4 u(t) + Fd+1 y(t)


Gd+2 4 u(t + 1) + Fd+2 y(t)
Gd+N 4 u(t + N ; 1) + Fd+N y(t)

puede ser escrito en forma matricial como:

y = Gu + F(z; )y(t) + G0(z; ) 4 u(t ; 1)


1

Donde

G0(z; )

F( z ; )

:9)

(3

2 y(t + d + 1 j t) 3
2
3
4u(t)
66 y(t + d + 2 j t) 77
66 4u(t + 1) 77
66
7
66
77
u
=
..
..
7
4
5
4
5
.
.
y(t + d + N j t)
4u(t + N ; 1)
2 g
0
::: 0 3
0
66 g1 g0 ::: 0 77
66 ..
..
.. .. 7
7
4 .
.
. . 5
g
g
::: g
3
2 N ;1 N ;2 z(G0 (z;1 ) ; g )
0
d+1
77
66
z2 (Gd+2 (z;1 ) ; g0 ; g1z;1 )
77
66
..
5
4
.
N
;
1
;
1
;
(
N
;
1)
z (G (z ) ; g0 ; g1z ;    ; gN ;1z
)
2 F (dz+;N1 ) 3
66 Fdd++12 (z;1 ) 77
66
77
..
4
5
.
;
1
Fd+N (z )

Al depender los ultimos


terminos de la ecuacion (3.9) solo del pasado, pueden
agruparse en f, dando lugar a:
=
+
(3:10)

y Gu f

Observese que es la misma expresion que se obtuvo para el


caso la respuesta libre es distinta.

DMC,

aunque en este

Obtencion de la ley de control


Entonces la ecuacion (3.5) puede escribirse como:
J = ( + ; )T ( + ;

Gu f w Gu f w) + uT u

:11)

(3

Control Predictivo Generalizado

36
donde:

w = w(t + d + 1) w(t + d + 2)



w(t + d + N )

iT

(3.12)

La ecuacion (3.11) se puede poner como:

J = 12 uT Hu + bu + f0

:13)

(3

donde:

H
b
f
0

=
=
=

GG I
f w G
f w f w)

2( T +  )
2( ; )T
T
( ; ) ( ;

El mnimo de J , siempre que no existan restricciones en la senal


de control, puede
ser calculado igualando a cero el gradiente de J , lo cual conduce a:

u = ;H; bT
1

:14)

(3

Debido al uso de la estrategia deslizante, solo se aplica realmente el primer elemento del
vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo.
La solucion propuesta involucra la inversion (o al menos la triangularizacion) de una
matriz de dimension N N , lo cual conlleva una gran carga de calculo. El concepto ya
usado en otros metodos de horizonte de control se emplea con la finalidad de reducir
la cantidad de calculo, asumiendo que las senales

de control permaneceran en un valor


constante a partir del intervalo Nu < N . Por tanto la dimension de la matriz que hay
que invertir queda reducida a Nu Nu, quedando la carga de calculo reducida (en el
caso lmite de Nu = 1, se reduce al caso escalar) aunque restringiendo la optimalidad.

3.2.2

Ejemplo de calculo

Se presenta a continuacion un ejemplo de calculo de un Controlador Predictivo Generalizado en un caso sencillo. Se disenar
a el controlador para un sistema de primer
orden.
Al discretizar el proceso continuo se obtiene el siguiente equivalente discreto:
(1 +

(t)
az;1 )y(t) = (b0 + b1 z;1 )u(t ; 1) + e4

Se va a considerar un retardo d igual a 0 y un polinomio de ruido C (z;1 ) igual a 1.


Se usara el algoritmo descrito previamente para obtener la ley de control, obteniendo
resultados numericos para valores de los paametros a = 0:8, b0 = 0:4 y b1 = 0:6, siendo

Algoritmos

37

los horizontes N1 = 1 y N = Nu = 3. Como se ha mostrado, se calcularan los valores


predichos de la salida del proceso en el horizonte haciendo uso de la ecuacion (3.9),
obteniendo la ley de control de la expresion (3.14).
Resolviendo la ecuacion (3.6) se obtienen los polinomios del predictor
Fj (z;1 ) desde j = 1 hasta j = 3, con

Ej (z;1 ),

A (z;1 ) = A(z;1 )(1 ; z;1 ) = 1 ; 1:8z;1 + 0:8z;2

En este caso sencillo donde el horizonte no es demasiado largo, estos polinomios se


pueden obtener directamente dividiendo 1 por A (z ;1 ). Como se ha explicado antes,
tambien se pueden calcular recursivamente, comenzando con los valores obtenidos en
el primer paso de la division, es decir:

E1 (z;1 ) = 1

F1(z;1 ) = 1:8 ; 0:8z;1

Cualquiera que sea el metodo empleado, los valores obtenidos son:

E2 = 1 + 1:8z;1
F2 = 2:44 ; 1:44z;1
E3 = 1 + 1:8z;1 + 2:44z;2 F3 = 2:952 ; 1:952z;1
Con estos valores y el polinomio B (z;1 ) = 0:4 + 0:6z ;1 , los elementos Gi (z ;1 ) resultan

ser:

G1 = 0:4 + 0:6z;1 G2 = 0:4 + 1:32z;1 + 1:08z;2 G3 = 0:4 + 1:32z;1 + 2:056z;2 + 1:464z;3


y por tanto se pueden escribir las salidas predichas como:

3
2
y(t + 1 j t)
64 y(t + 2 j t) 75
y(t + 3 j t)

2
3
32
0:4
0
0
4u(t)
64 1:32 0:4 0 75 64 4u(t + 1) 75 +
2:056 1:32 0:4
4u(t + 2)
2
3
0:6 4 u(t ; 1) + 1:8y (t) ; 0:8y (t ; 1)
64 1:08 4 u(t ; 1) + 2:44y(t) ; 1:44y(t ; 1) 75
| 1:464 4 u(t ; 1) + 2:952
{z y(t) ; 1:952y(t ; 1) }
f

El paso siguiente es el calculo de

H; b. Tomando  igual a 0:8 se tiene que:


1

2
3
0:133
0:286 0:147
7
T
;1 T 6
(G G + I) G = 4 ;0:154 ;0:165 0:286 5
;0:029 ;0:154 0:1334
Como solo se necesita el valor de 4u(t) para los calculos, solo se emplea realmente la

primera fila de la matriz, con lo que resulta la siguiente expresion para la ley de control:

4u(t)

=
+

;0:6042 4 u(t ; 1) ; 1:371y (t) + 0:805y (t ; 1) +


0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)

Control Predictivo Generalizado

38

donde w(t + i) es la trayectoria de referencia que se puede considerar bien constante


e igual a la referencia actual o bien una suave aproximacion de primer orden a e sta.
Entonces la senal
de control resulta ser una funcion de la referencia deseada y de
entradas y salidas pasadas, dada por:

u(t)

=
+

0:3958u(t ; 1) + 0:6042u(t ; 2) ; 1:371y (t) + 0:805y (t ; 1) +


0:133w(t + 1) + 0:286w(t + 2) + 0:147w(t + 3)

Al mismo resultado se puede llegar sin emplear la ecuacion diofantica, calculando


G en base a los coeficientes de la respuesta ante escalon (que se pueden calcular en
funcion de los coeficientes de la funcion de transferencia) y calculando la respuesta
libre como se muestra en [2].

3.2.3

Caso multivariable

Al igual que en el DMC todo lo visto para el caso de sistemas con una sola entrada y
una sola salida se puede extender al caso multivariable, aunque los calculos son mas
complejos.
En este caso el modelo CARIMA para un sistema de m entradas y n salidas se puede
expresar como:
1
;1
;1
;1
(z )e(t)
(z )y (t) = (z )u(t ; 1) +
(3:15)
4

donde (z ;1 ) y (z ;1 ) son matrices polinomiales monicas de dimension n n y


es una matriz polinomial de dimension n m, definidos como:

A(z; )
B(z; )
C(z; )

B(z; )
1

Inn + A1 z;1 + A2z;2 +    + Ana z;na


1
;1 + B2z;2 +    + Bnb z;nb
= B0 + B1 z
1
;1 + C2z;2 +    + Cnc z;nc
= Inn + C1 z
Las variablesy (t), u(t) y e(t) son de dimension n 1, m 1 y n 1 respectivamente.
1

La prediccion conlleva la resolucion de una ecuacion diofantina matricial, que tambien


puede calcularse de forma recursiva.

En muchas ocasiones el problema radica en la obtencion adecuada del modelo en


esta forma a partir de una matriz de transferencia en continuo que puede haberse
obtenido a partir de la curva de reaccion. Una forma de hacerlo se muestra en [2].
Una vez obtenido el modelo, el criterio a minimizar tendra la forma general

J (N1 N2 N3 ) =

N
X
2

j =N1

ky (t + j j t) ; w (t + j )k2R +

N
X
3

j =1

k 4 u(t + j ; 1)k2Q

Algoritmos

39

donde R y Q son matrices de ponderacion definidas positivas que normalmente se


eligen diagonales. La minimizacion se realiza igual que en el caso monovariable dando
como resultado un vector de senales

de control a enviar a la planta en el instante actual:


u1(t), u2(t) : : : um(t).

40

Control Predictivo Generalizado

Tema 4
Restricciones en Control Predictivo
En la practica todos los procesos estan sujetos a restricciones. Los actuadores tienen
un campo limitado de accion impuesto por lmites fsicos (por ejemplo una valvula no
puede abrir mas de un 100 % o un calentador no puede aportar mas de su potencia
maxima. Tambien existen lmites de seguridad (por ejemplo presiones o temperaturas
maximas), requerimientos tecnologicos (por ejemplo mantener temperaturas en un
rango dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa
medioambiental.

4.1 Tratamiento convencional de restricciones


El tratamiento convencional de restricciones en control de procesos se basa en que las
restricciones en la variable manipulada (entrada) se cumplen saturando la salida del
controlador. Sin embargo, las restricciones en la variable controlada (salida) no pueden
abordarse; se intenta evitar su violacion trabajando alejados de los lmites (en zona
segura), operando lejos de la restriccion. Por seguridad se trabaja con una consigna
inferior, mas lejos del punto de operacion o ptimo, lo que normalmente equivale a una
disminucion de la calidad y/o cantidad en la produccion, ya que normalmente el punto

optimo
se encuentra en la interseccion de las restricciones obligando a acercarse lo mas
posible a las e stas pero sin superarlas.
Si el controlador fuera capaz de tener en cuenta las restricciones y evitar su violacion,
el proceso podra operar mas cerca de e stas y por tanto de forma mas eficiente. La figura
4.1 muestra un ejemplo donde existe una limitacion de presion maxima y se observa

como
al alejar el punto de operacion del lmite la produccion Q disminuye.
En cuanto a la forma de operar de un controlador predictivo que no considera restricciones el procedimiento es similar: si la senal
de control calculada viola la restriccion,
se satura. Las senales

futuras ni siquiera se tienen en cuenta, ya que normalmente no


41

Restricciones en Control Predictivo

42
P
Pmax
P1
P2

Q1 Q2

Figura 4.1: Restricciones y punto de operacion optimo

se calculan. Esta forma de proceder no garantiza el caracter optimo


de la solucion y en
caso garantiza el cumplimiento de las restricciones en la salida. La violacion de
ningun
los lmites de las variables controladas puede ser mas costoso y peligroso, produciendo
danos
en equipos y perdidas en la produccion.

La figura 4.2 muestra con claridad el fenomeno de perdida de la solucion optima


cuando las variables manipuladas se mantienen en sus lmites por el programa de
control o por el propio actuador. Este hecho puede llevar a valores mayores de la
funcion objetivo y a un comportamiento no deseado (incluso inestabiliad). En 4.2a se
muestra un caso con horizonte de control igual a 2, donde se observa que si se satura
la senal
de control u(t) a umax el valor de la funcion de coste no es el mejor que se
podra conseguir (que sera el correspondiente a uc ). Incluso puede que no se viole
la restriccion en el instante actual pero s en el futuro (figura 4.2b) con lo que la senal

enviada al sistema (sin saturar) no es la mejor para el problema de dimension 2 que se


esta optimizando.

4.2 Restricciones en Control Predictivo

En la actualidad el MPC es la unica


metodologa capaz de incorporar las restricciones
de forma sistematica en la fase de diseno
del controlador, siendo esta caracterstica una
de las razones de su gran e xito en la industria. Parece logico que al disponer de un
modelo dinamico del proceso se pueda conocer la evolucion futura de su salida y por
tanto se pueda saber si e sta va a violar o no las restricciones y actuar en consecuencia.
Para formular el algoritmo MPC con restricciones hay que expresar e stas en funcion
de la variable sobre la que se puede actuar, es decir, en funcion de u. Las restricciones
en la entrada estan ya expresadas en funcion de u y para las restricciones en la salida
se hace uso de las ecuaciones de prediccion que expresan el valor futuro de las salidas

Restricciones en Control Predictivo

43

u(t+1)

u(t+1)

u max

u max

uc

u
u max

uc

u
u max

u(t)

a)

u(t)

b)

Figura 4.2: Restricciones en la senal


de control
en funcion de las senales

de control futuras y valores conocidos en el instante t.


Cualquier controlador predictivo calcula la prediccion como:

y = Gu + f

por lo que tanto entradas como salidas se pueden expresar en funcion del vector de
incrementos de la senal
de control.
Las restricciones que aparecen seran basicamente amplitud y velocidad de cambio
en la senal
de control y amplitud en la salida y se pueden expresar como:

U
u
y





u(t)
u(t) ; u(t ; 1)
y(t)





U
u
y

8t
8t
8t

Para un proceso de m entradas y n salidas y restricciones en el horizonte


restricciones se pueden expresar como:

1U
1u
1y





T u + u(t ; 1) 1

u
Gu + f





N , las

1U
1u
1y

donde es una matriz de dimension (N n) m formada por N m m matrices


identidad y T es una matriz triangular inferior por bloques cuyos elementos no nulos
son matrices identidad de dimension m m. En forma condensada se pueden expresar
como:

(4:1)

Ru c

Resolucion del problema

44
siendo

2 I
66 ;INNNN
66 T
R = 66 ;T
66
4 G

3
2
3
l
u
77
66
7
77
66 l U ;;lul (ut ; 1) 777
77 c = 66
7
77
66 ;l U + lu(t ; 1) 777
5
4
5
ly;f
;G
;l y + f

Aparte de las restricciones en amplitud, a la salida se le pueden aplicar otro tipo de


restricciones de para forzar un determinado comportamiento temporal (movimiento
dentro de una banda, comportamiento monotono, evitar respuesta inicial inversa, etc.)
como se muestra en [12], pudiendo expresarlas tambien de la forma generica (4.1).
Ademas de la clasificacion en restricciones en la entrada y en la salida segun a que
tipo de variable se apliquen, se puede hacer otra clasificacion atendiendo a la forma de
tratarlas. As, se puede hablar de:

 Restricciones duras como aquellas que no se pueden violar bajo ningun concepto.
En este grupo se incluyen las restricciones relacionadas con la operacion segura
del proceso.
 Restricciones blandas, que son aquellas que pueden ser violadas en un momento
dado por no ser cruciales, pero la violacion se penaliza en la funcion objetivo
como un termino mas. Es una forma de relajar la restriccion.

del problema
4.3 Resolucion
Con la adicion de restricciones el problema general de control predictivo cambia se
puede formular como

u)
Ru c

minimizar J (
sujeto a


Es decir, el problema consiste en la minimizacion de una funcion cuadratica con


restricciones lineales, lo que se conoce como Programacion Cuadratica, QP. En este caso
no se puede encontrar una solucion analtica como en el caso sin restricciones, sino que
hay que recurrir a metodos iterativos.
Resulta evidente que la carga de calculo sera considerable, ya que hay que encontrar
la solucion resolviendo el algoritmo iterativo en cada periodo de muestreo. Normalmente el esfuerzo esta justificado por el beneficio economico obtenido al trabajar mas

cerca del punto de operacion optimo.

Restricciones en Control Predictivo

45

Para resolver el problema QP existen diversos algoritmos suficientemente probados.


Una revision de estos metodos se puede encontrar en [2].
Un problema asociado a la implementacion del control con restricciones es el analisis
de la estabilidad del bucle cerrado. Como es necesario utilizar metodos numericos
para resolver el problema de la optimizacion, la ley de control resultante no se puede
describir de forma explcita, haciendo el problema muy difcil de atacar mediante la
teora clasica de control.

En los ultimos
anos
se ha trabajado mucho sobre la estabilidad en estas circunstancias, proponiendose soluciones basadas en la teora de Lyapunov. La idea basica
consiste en que la funcion de coste cuando el horizonte es infinito es monotona decreciente (si existe solucion factible) y se puede interpretar como funcion de Lyapunov
que garantiza por tanto la estabilidad. Sin embargo, como la solucion tiene que ser

numerica, el numero
de variables de decision tiene que ser finito, por lo que se han propuesto dos ideas. En la primera, se descompone la funcion objetivo en dos partes: una
con horizonte finito y restricciones y otra con horizonte infinito y sin restricciones. La
segunda idea es en esencia equivalente y consiste en imponer restricciones terminales
al estado y usar un horizonte infinito.
En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las
incertidumbres en el modelo y los temas asociados con la factiblidad.

de restricciones
4.4 Gestion
Durante la etapa de optimizacion puede aparecer problemas de no existencia de so optima

lucion
para unas restricciones dadas (no existe compatibilidad entre las restricciones), por ejemplo por el planteamiento de unos objetivos inalcanzables para unas
restricciones dadas. Existen otras posibles causas de inexistencia de solucion, como es
el caso de que una perturbacion saque al proceso fuera de la zona de trabajo usual.
La factibilidad de un problema de optimizacion significa que la funcion objetivo
este acotada y que todas las restricciones sean satisfechas.
La no factibilidad puede aparecer en regimen permanente o en el transitorio. El
problema de la falta de solucion en regimen permanente puede venir provocado por
un objetivo de control irrealizable. Sin embargo, este tipo de no factibilidad puede
ser facilmente eliminado en la etapa de diseno
evitando la inclusion de tales objetivos.
Tambien puede ser debido a cambios en referencias que hagan incompatibles las restricciones (se quiera llevar alguna variable a un punto que es imposible de alcanzar con
una entrada que esta acotada).
En el regimen transitorio puede aparecer no factibilidad incluso cuando las restricciones impuestas parezcan razonables. Restricciones que no causan problemas en

Gestion de restricciones

46

operacion normal pueden producir problemas bajo ciertas circunstancias. Puede que
una perturbacion o cambio de referencia grande fuerce a una variable fuera de su lmite
y sea imposible introducirla de nuevo en su zona permitida con senales

de control de
energa limitada. En estos casos las restricciones se hacen temporalmente incompatibles.

Las soluciones no factibles aparecen con mayor frecuencia en casos en que el optimo
se encuentre cerca de las restricciones y el sistema este sujeto a perturbaciones, llevando
a la salida a "regiones prohibidas".

4.4.1

Tecnicas de busqueda
de soluciones factibles

Los metodos de gestion de restricciones tratan de recuperar la factibilidad actuando


sobre las restricciones segun diferentes criterios.
Los lmites de las restricciones se pueden considerar de los siguientes tipos:

 Limites fisicos: nunca se pueden sobrepasar, principalmente por motivos de


seguridad o por la propia construccion de los equipos (p.ej. actuadores)
 Limites de operacion: son fijados por los operarios para mantener las condiciones
nominales de funcionamiento. Se pueden sobrepasar bajo ciertas circunstancias
 Limites reales: son los que usa el algoritmo de control en cada instante. Son los
que proporciona el gestor de restricciones, quien debe calcularlos de forma que
nunca superen los limites fsicos.
Es decir, el gestor de restricciones calculara los lmites reales (los que se envan al
algoritmo QP) en base a los lmites de operacion pero sin salirse nunca de los lmites
fsicos, segun se observa en la figura 4.3.
Se analizan a continuacion posibles soluciones para este problema, que se pueden
agrupar en:

1. Desconexion del controlador.


2. Eliminacion de restricciones.
de restricciones.
3. Relajacion
4. Otras tecnicas.

Restricciones en Control Predictivo

47

Lmites fsicos

Restricciones reales
Lmites de operacin

Figura 4.3: Gestion de restricciones


Desconexion del controlador
La forma mas sencilla de resolver de este tipo de problemas es pasar el controlador
a posicion manual cuando aparecen las incompatibilidades de restricciones y volver a
operacion automatica cuando se recupera la admisibilidad de la solucion.
Este metodo, como se puede comprender tiene serias desventajas. Normalmente,
cuando aparecen problemas de incompatibilidad de restricciones es porque el sistema
en bucle cerrado se encuentra en un estado crtico donde normalmente el operador
tendra muy poca experiencia en la operacion. Adicionalmente, si las restricciones estan
relacionadas con aspectos de seguridad o economicos, las decisiones llevadas a cabo
cuando aparecen problematicas de compatibilidad de restricciones suelen ser crticas
dado que en estos casos alguno de los objetivos del control no puede ser satisfecho.
El metodo suele ser utilizado cuando los problemas de incompatibilidad de restricciones no son frecuentes.

Eliminacion de restricciones
La factibilidad se analiza en cada periodo de muestreo, por lo que la eliminacion de
restricciones se realiza de forma temporal. Periodicamente se chequea la factibilidad
para poder reinsertar restricciones eliminadas.
La eliminacion de un grupo de restricciones ha de realizarse en aquellos casos en que
el conjunto completo de restricciones que se imponen sobre el sistema sea incompatible.
Cada vez que existe un problema de incompatibilidad de restricciones, se forma un
conjunto de restricciones no admisibles que no se tienen en cuenta en el proceso de

Gestion de restricciones

48

optimizacion. Se pueden distinguir en la metodologa de eliminacion de restricciones


varios tipos.

Eliminacion indiscriminada Con esta estrategia todas las restricciones se eliminan


cada vez que aparezcan problemas de existencia de solucion factible, quedando la

optimizacion de un problema sin restricciones. No es un metodo muy optimo


para
resolver el problema de la existencia de solucion admisible, pero es la forma mas rapida
de tener en cuenta incompatibilidad de restricciones.
La eliminacion indiscriminada de restricciones no es adecuada en todas las aplicaciones. No debe ser por ejemplo usada en casos en que las restricciones esten directamente
relacionadas con lmites de seguridad.

Eliminacion jerarquica En este caso solo se eliminan las restricciones que provocan
problemas de incompatibilidad. En este metodo se asigna en la etapa de diseno
una
prioridad a cada restriccion, que da un grado de importancia relativa de dicha restriccion frente a las otras. Esta prioridad se usara para clasificar las restricciones de una
forma jerarquica (se asigna un numero que indica su posicion en la jerarqua). De este
modo, cada vez que haya problemas de factibilidad o existencia de solucion el gestor
de restricciones va eliminando por orden las restricciones menos prioritarias hasta que
se restablece la factibilidad de la solucion, que se chequea cada periodo de muestreo
para reinsertar restricciones que hubieran sido temporalmente eliminadas.
En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes
tipos de reglas para establecer el numero de restricciones que se eliminan, si conviene
eliminar mas restricciones a costa de no eliminar una con prioridad superior, etc.

Relajacion de restricciones
Otro metodo para tener en cuenta el problema de existencia de solucion es la relajacion
de las restricciones. Se puede hacer una relajacion de los lmites de forma temporal o convertir restricciones duras (
 ), cambiandolas en restricciones blandas
(
 + , con  0) para asegurar la existencia de solucion, anadiendo

un termino
T a la funcion de coste de forma que se penalice la violacion de la restriccion y
obtener un mejor comportamiento del sistema controlado. A largo plazo, el termino
en la funcion objetivo llevara las variables auxiliares a cero.
de penalizacion

Ru c
T

Ru

Otras tecnicas
Existen tecnicas que se basan en la manipulacion del horizonte mnimo de las restricciones. Algunos controladores industriales como el QDMC usan el concepto de constraint

Restricciones en Control Predictivo

49

window. La constraint window comienza en algun punto en el futuro y continua hasta el


estado estacionario. Si existe dinamica del tipo de fase no mnima, se pueden mejorar
las prestaciones desplazando la ventana hacia el futuro, lo que equivale a ignorar las
restricciones duras en la salida durante la fase inicial de la respuesta.

50

Gestion de restricciones

Tema 5
Tendencias actuales y nuevas
perspectivas
En la actualidad existen muchos campos abiertos en Control Predictivo, tanto en lo
referente a aplicaciones practicas como a lneas de investigacion. Todava queda mucho
por estudiar en campos como identificacion de modelos, estimacion del estado y de
las perturbaciones no medibles o tratamiento sistematico de las incertidumbres. El
estudio de estabilidad o robustez de la solucion es complicado, sobre todo en el caso de
inclusion de restricciones, ya que la ley de control es en general variable con el tiempo
y no se puede representar el sistema de la forma clasica de bucle cerrado.

Este tema esta dedicado a dos areas


de especial interes: la consideracion de funciones
objetivos multicriterio y un campo que esta empezando a tener gran relevancia en la
practica como es el Control Predictivo No lineal.

5.1 Multiobjetivo. Jerarqua de objetivos


Las estrategias que se han considerado hasta ahora estan basadas en la minimizacion

de una funcion de coste de un unico


objetivo para la obtencion de la mejor secuencia
de acciones de control. Sin embargo, en muchas situaciones el comportamiento del
proceso no se puede medir con una sola funcion objetivo sino que, la mayora de las
veces, existen diversos (y a menudo contrapuestos) objetivos de control. Las razones
de la existencia de diversos objetivos de control pueden ser:

 Los procesos deben operar de forma diferente en distintos momentos. Por ejemplo, durante la fase de arranque puede interesar una estrategia de tiempo mnimo
y en el regimen nominal el objetivo puede ser reducir en lo posible la varianza de
las variables controladas.
51

Multiobjetivo. Jerarqua de objetivos

52

 El objetivo de control puede variar aun el caso de estar trabajando en regimen


nominal, dependiendo del valor de las variables. Por ejemplo, aunque el objetivo
de control sea minimizar la suma ponderada de los errores de las variables, si
una de ellas alcanza un valor muy alto (por ejemplo debido a una perturbacion)
el objetivo de control sera disminuir el valor de esta variable lo antes posible.
En muchas situaciones el objetivo de control no es minimizar la suma de errores, sino
mantener ciertas variables dentro de unos lmites especificados. Esto es equivalente
a las restricciones blandas. Este tipo de objetivo se puede expresar penalizando la
cantidad que se sobrepasa cada variable del setpoint. Considerese, por ejemplo, que el
objetivo es mantener la variable y (t) entre sus lmites yl e yh . En este caso, el objetivo
de control se puede escribir como:
N2
N2
X
X
J = p(y(t + j ) ; yh) (y(t + j ) ; yh)2 + p(yl ; y(t + j )) (y(t + j ) ; yl )2
j =N1
j =N1
siendo p la funcion escalon (vale 1 cuando el argumento es mayor o igual que 0 y vale
0 en caso contrario).

Notese
que ahora la funcion objetivo no es cuadratica y por tanto no se puede
emplear para su minimizacion un algoritmo de programacion cuadratica, aunque se
puede transformar en uno de este tipo anadiendo

unas variables de holgura h (j ) y


l (j ):

y(t + j )  yh + h (j )
y(t + j )  yl ; h (j )

La secuencia optima
de control se obtiene con la minimizacion de
N2
X
J = ( h(j )2 + l (j )2)
j =N1
con la condicion de que las variables de holgura sean no negativas (y el resto de las
restricciones si las hubiera). En definitiva lo que se ha hecho es transformar el problema
en un QP con mas restricciones y variables.
En muchas ocasiones todos los objetivos de control se pueden agrupar en una sola
funcion de coste. Algunos de los objetivos pueden ser mantener las variables lo mas
cerca posible de los setpoints o dentro de unas determinadas regiones de operacion.
Cada uno de estos objetivos equivale a minimizar una cierta funcion Ji (sujeta a una serie
de restricciones). Entonces la secuencia de control se puede obtener de la minimizacion
de:
m

J=

i Ji
i=1
sujeta a todo el conjunto de restricciones. La importancia relativa de cada objetivo se
puede ponderar mediante la adecuada eleccion de los i , aunque en la practica es difcil
encontrar estos pesos. Ademas, muchas veces los objetivos de control son cualitativos,
mas difcil.
haciendo la tarea aun

Tendencias actuales y nuevas perspectivas

5.1.1

53

Jerarqua de objetivos

En muchas situaciones, se puede establecer una importancia relativa de unos objetivos


sobre otros por medio de una priorizacion o jerarqua. Es decir, los objetivos de mayor
prioridad (por ejemplo los relacionados con la seguridad) se deben satisfacer antes que
otros con menor prioridad. Aunque esto se puede resolver con ponderaciones, no es
un asunto trivial.
Tyler y Morari [20] proponen una forma de introducir multiples objetivos jerarquizados. Considerese un proceso con m objetivos Oi jerarquizados (el Oi+1 tiene mayor
prioridad que el Oi) que se pueden expresar como:

Riu  ai
La idea consiste en introducir variables enteras Li que toman valor 1 cuando se satisface
el correspondiente objetivo de control y cero en caso contrario. Los objetivos se expresan
entonces como:

Riu  ai + Ki(1 ; Li)


(5:1)
donde Ki es una cota superior conservadora para Ri u ; ai . Si se cumple el objetivo i, se

tiene que Li = 1 y el objetivo reformulado coincide con el original. Con la introduccion


de Ki el objetivo reformulado se satisface incluso cuando el correspondiente objetivo
Oi no lo hace (Li = 0).
La jerarqua de objetivos se puede establecer imponiendo las restricciones siguientes:
Li ; Li+1  0
El problema es maximizar el numero de objetivos de control satisfechos

PL .
i

Si el modelo del proceso es lineal el problema se puede resolver con Programacion


Lineal Entera Mixta (MILP). El conjunto de restricciones 5.1 se puede modificar para
mejorar el grado de satisfaccion de restricciones de los objetivos que no pueden ser
satisfechos. Supongase que no todos los objetivos se pueden satisfacer y que el Of es
el primero que falla. Con la idea de acercarse todo lo posible a la satisfaccion de este
objetivo se introduce una variable de holgura  que cumpla el siguiente conjunto de
restricciones:
0
1
i;1
X
Lj A
(5:2)
i  i +  + Ki @(1 ; i) + (1 ; Li ) ;
j =1

Ru a

con la funcion objetivo

J = ;K

m
X

Li + f ()
i=1
donde f es una funcion de penalizacion de la variable de holgura (positiva y monotona
creciente) y K es su cota superior. El algoritmo de optimizacion intentara maximizar

Control predictivo no lineal

54

el numero
de objetivos satisfechos (Li = 1) antes de intentar reducir f () porque la
funcion objetivo global se puede hacer mas pequena
incrementando el numero de
variables Li distintas de cero que reduciendo la funcion de penalizacion. Como todos
los objetivos Oi estan satisfechos para i < f , las restricciones (5.2) tambien se satisfacen.
Como Of es el primero que falla:

i;1
X
i=1

Li = f ; 1 para i  f

Es decir, el termino que multiplica a Ki es cero para i = f mientras que para ndices
mayores es mayor que uno. Esto implica que todas las restricciones se satisfaran para

i > f . La unica
restriccion activa es f  f + .

Ru a

O sea, el metodo de optimizacion intentara optimizar el grado de satisfaccion del


primer objetivo que falle solo despues de que todos los objetivos mas prioritarios se
hayan satisfecho. Notese que Li = 0 no implica que el objetivo i-esimo no sea satisfecho,
sino que indica que la restriccion correspondiente ha sido relajada.
Si el modelo del proceso y la funcion de penalizacion son lineales, el problema es del
tipo MILP, pero si f () es cuadratica se recurre a Programacion Cuadratica Entera Mixta
(MIQP). Aunque existen algoritmos para Programacion Mixta, el esfuerzo computacional es mucho mayor que el requerido para problemas LP o QP, por ello el numero de
objetivos debe ser pequeno
para poder implementar el metodo en tiempo real.

5.2 Control predictivo no lineal

En los ultimos
anos
el Control Predictivo Basado en Modelo se ha convertido en la
estrategia de control preferida para una gran cantidad de procesos industriales. Los
esquemas de MPC lineal, es decir, los vistos hasta ahora en los que la prediccion esta
basada en un modelo lineal del proceso, se usan de forma rutinaria como una opcion
de control mas a tener en cuenta en ciertos sectores de la industria y se puede decir que
sus fundamentos teoricos estan suficientemente estudiados.
Por su parte, el Control Predictivo No Lineal (Nonlinear Model Predictive Control,
NMPC) surgi
o hace relativamente poco tiempo y existen pocas referencias de aplicaciones industriales. Pero debido a su capacidad para tener en cuenta las no-linealidades
del proceso se espera que se convierta en una opcion prometedora a corto plazo.
No hay nada en los conceptos basicos de MPC contra el uso de modelos no lineales,
por tanto la extension de tales conceptos a procesos no lineales es en principio sencilla.
Sin embargo, como se vera seguidamente esto no es un asunto trivial y aun hay muchos
temas abiertos como:

 La disponibilidad de modelos no lineales debido a la dificultad de tecnicas de

Tendencias actuales y nuevas perspectivas

55

identificacion para procesos no lineales.

 La complejidad de los calculos necesarios para resolver el problema del control


predictivo de procesos no lineales.
 La escasez de resultados de estabilidad y robustez.

En general los procesos industriales son no lineales, pero aun as la mayora de


las aplicaciones de control predictivo estan basadas en el uso de modelos lineales,
del tipo de los vistos hasta ahora. Existen varias razones para ello: por un lado
resulta relativamente facil identificar modelos lineales a partir de datos del proceso,
y por otro los modelos lineales dan buen resultado cuando el proceso opera en las
cercanas del punto de trabajo nominal. En el sector petroqumico, donde tiene lugar
la mayora de las aplicaciones de MPC, el objetivo es mantener el proceso en torno al
estado estacionario (problema del regulador) mas que realizar frecuentes cambios de un
punto de operacion a otro (problema del servo) y por tanto un modelo lineal preciso es
suficiente. Ademas el uso de un modelo lineal junto con una funcion objetivo cuadratica
da lugar a un problema convexo de programacion cuadratica (QP) cuya solucion esta
suficientemente estudiada en la actualidad, existiendo diversos productos comerciales
fiables. La existencia de algoritmos que garanticen una solucion que converja en un
corto tiempo (menor que el periodo de muestreo) resulta crucial en procesos en los que
interviene un gran numero de variables.
Sin embargo, existen situaciones en las que los efectos no lineales justifican el uso
de la tecnologa NMPC. Estas situaciones entran dentro de las dos categoras siguientes:

 Procesos fuertemente no lineales y sujetos a grandes perturbaciones, como por


ejemplo el control de pH.
 Problemas de seguimiento de consigna en los que el punto de operacion cambia
con frecuencia y estos cambios sacan a relucir la dinamica no lineal del proceso,
como en el caso de la fabricacion de polmeros.

En estas situaciones una ley de control lineal puede no ser efectiva siendo necesario
el empleo de un controlador no lineal para mejorar el comportamiento o simplemente
para una operacion estable del proceso. Es por tanto en este caso donde se puede
justificar el empleo de tecnicas de NMPC. Aunque en la actualidad el numero de
reducido, el potencial es considerable, como se desprende del
aplicaciones es aun
informe de Qin y Badgwell [17], donde se observa que MPC no ha penetrado aun en
campos donde las no linealidades son fuertes y el mercado exige frecuentes cambios
del punto de operacion; es aqu donde se espera el auge del NMPC.

Control predictivo no lineal

56

5.2.1

Diferencias respecto al metodo lineal

Resulta evidente que la principal ventaja del NMPC frente al MPC radica en la posibilidad
de abordar dinamicas no lineales. A medida que aparecen nuevas herramientas que
hacen posible la obtencion y representacion de modelos no lineales, bien a partir de
primeros principios (leyes de conservacion) o bien a partir de datos experimentales
(modelos de Volterra o redes neuronales) el interes por su utilizacion en NMPC se va
acrecentando.
Aunque la extension de los conceptos de MPC al caso no lineal es directa, a la hora de
realizar el controlador aparecen una serie de problemas a tener en cuenta, que dan lugar
a una mayor dificultad en su implantacion. Las principales dificultades derivadas del
empleo de modelos no lineales son:

 La obtencion de un modelo no lineal a partir de datos experimentales es un


problema abierto. La utilizacion de redes neuronales o series de Volterra no
parecen solucionar el problema de forma general. Por otra parte, la obtencion de
modelos a partir de primeros principios no es siempre viable.
 El problema de optimizacion es no convexo, cuya resolucion es mucho mas difcil
que un problema de programacion cuadratica. Aparecen problemas relativos a la

obtencion del optimo


global, lo que influye no solo en la calidad del control, sino
tambien en problemas relacionados con la estabilidad.
 La dificultad del problema de optimizacion se traduce en un aumento considerable del tiempo de calculo, hecho que puede dar lugar a que la aplicacion de esta
tecnica quede restringida a un conjunto de sistemas con dinamica lenta.
 El estudio de temas fundamentales como estabilidad o robustez se complica
enormemente. Este tema constituye un campo abierto de gran interes para los
investigadores.

5.2.2

Fundamentos teoricos

Se puede definir un algoritmo generico NMPC que englobe a todas las tecnicas que
comparten las mismas ideas. El proceso (en general multivariable) se puede describir
por un modelo en el espacio de estados de la forma:

x(t + 1) = f (x(t) u(t) d(t) w(t))


y(t) = g(x(t)) + e(t)
donde x es el vector de estados de dimension n, u es el vector de mu entradas, d son las
perturbaciones medibles y w(t)) las no medibles. El vector de salidas es y de dimension
my , la misma que la del vector de ruidos de medida e.

Tendencias actuales y nuevas perspectivas

57

El problema que hay que resolver es el calculo de la secuencia de senales

de control
que llevan al proceso desde su estado actual al estado deseado s . El punto de trabajo
deseado ( s , s , s ) viene en general determinado por una optimizacion estatica basada
normalmente en criterios economicos. Este punto de trabajo debe ser recalculado

periodicamente
ya que las perturbaciones pueden hacer cambiar el punto o ptimo de
operacion.

y x u

Las perturbaciones medibles se pueden eliminar incluyendo su efecto en la funcion

f , mientras que el resto se rechaza con la realimentacion, normalmente considerando

que la perturbacion permanecera constante a lo largo del horizonte. Esto se formalizar


anadiendo

un termino constante (bias) e igual al error entre medida y salida calculada


a toda la prediccion:

y(t + j ) = g(x(t + j )) + b(t)

donde

b(t) = ym(t) ; y(t)

El problema consiste en la minimizacion de una funcion objetivo que de la forma


mas generica sera:

J=

P
X
j =1

y(t + j ) ; ys

kq

Q+

MX
;1
j =1

k 4 (t + j )kqS +

MX
;1
j =1

u(t + j ) ; uskqR + kskqT

:3)

(5

el tipo de norma que se este utilizando y Q, S, R y T


donde q puede ser 1 o 2 segun
son matrices de ponderacion. La minimizacion estara sujeta a la restriccion del modelo:

x(t + j ) = f (x(t + j ; 1) u(t + j ; 1) d(t + j ; 1) w(t + j ; 1))y(t + j ) = g(x(t + j )) + b(t)
y al resto de restricciones en entradas y salidas que se quieran considerar:

y ; s  y(t + j )  y ; s 8j = 1 P
u  u(t + j )  u 8j = 1 M ; 1
4u  4u(t + j )  4u 8j = 1 M ; 1

Observese que se ha considerado la violacion de las restricciones en la salida con el


termino s, que entra en juego en la minimizacion apareciendo en la funcion de coste
con una penalizacion dada por la matriz T.
Igual que en caso lineal, la solucion del problema es una secuencia de acciones de
control de las cuales solo la primera de ellas es enviada a la planta, desechando el resto
y volviendo a la resolver el problema en el siguiente periodo de muestreo.

5.2.3

Problematica asociada al NMPC

La resolucion del NMPC plantea nuevos problemas que no existan en el caso lineal
relacionados por un lado con la metodologa de calculo de la senal
de control y por
otro con el comportamiento dinamico del bucle cerrado, basicamente su estabilidad.

Control predictivo no lineal

58
Resolucion

La introduccion de un modelo no lineal en el algoritmo de optimizacion conduce a la


perdida de convexidad, no pudiendo ser resuelto por los algoritmos de programacion
cuadratica (QP), para los cuales existen soluciones fiables y suficientemente estudiadas.
Esta perdida de convexidad hace que sea mucho mas difcil encontrar una solucion y

que, una vez encontrada, no se pueda garantizar que sea un optimo


global.
En estas circunstancias el tiempo de calculo aumenta considerablemente debido
principalmente a dos motivos

 Para la obtencion de la secuencia de acciones de control optima,


el paquete de
programacion no lineal debe evaluar repetidamente la funcion objetivo y en cada
evaluacion se debe resolver el sistema de ecuaciones no lineales que componen
el modelo de prediccion, lo cual conlleva mucho tiempo de calculo.

 A partir de los datos obtenidos a traves de la evaluacion de la funcion objetivo, el


programa de optimizacion debe calcular el gradiente de la funcion y los proximos

puntos de busqueda,
ademas de comprobar la violacion o no de las restricciones
y los criterios de finalizacion del algoritmo. Estas tareas consumen mas tiempo
de calculo que en el caso lineal.

Estabilidad de la solucion
en el caso de
El otro problema fundamental es el de la estabilidad de la solucion. Aun

que el algoritmo de minimizacion encuentre la solucion optima, este hecho no garantiza


la estabilidad del bucle cerrado (incluso en el caso de que el modelo sea perfecto). Este
problema ha sido abordado desde distintos puntos de vistos de vista, existiendo en la
actualidad diferentes propuestas, las cuales se describen a continuacion.
1. Horizonte infinito
Existe una solucion propuesta por Meadows et al. ([13]) que consiste en ampliar
los horizontes de control y de prediccion hasta el infinito, P M ! 1. En este caso la
funcion objetivo tambien sirve como funcion de Lyapunov, dando lugar a la estabilidad
nominal. En el artculo citado se demuestra que si existe solucion inicial factible
entonces existe solucion en cada periodo de muestreo posterior.
La idea basica es que si el problema de minimizacion es factible en el instante
entonces la funcion de coste es finita y

Jt+1  Jt + x(t)t Rx(t) + u(t)t Su(t)


Por tanto la funcion de coste es monotona decreciente y se puede interpretar como una
funcion de Lyapunov, garantizando por consiguiente la estabilidad asintotica.

Tendencias actuales y nuevas perspectivas

59

A la hora de la verdad este concepto tiene principalmente un interes teorico


sobre el que basar un desarrollo practico, ya que no es viable una implementacion con
horizonte infinito. Para llevarlo a la practica se puede tomar un horizonte lo suficientemente grande, pero esta eleccion no tiene por que garantizar la estabilidad, ya que
las trayectorias de la entrada y el estado diferiran de las trayectorias predichas incluso
si no hay incertidumbres ni perturbaciones.
2. Restriccion terminal
Otra solucion al problema, propuesta por Keerthi y Gilbert ([8]) consiste en anadir

una restriccion terminal al estado en el algoritmo NMPC de la forma:

x(k + P ) = xs
Con la imposicion de esta restriccion, la funcion objetivo se convierte en una funcion
de Lyapunov para el sistema en bucle cerrado, conduciendo a la estabilidad nominal.
Con la introduccion de esta restriccion el estado al final del horizonte finito es cero y
por tanto tambien lo sera la senal
de control, con lo que el sistema (sin perturbaciones)
se queda para siempre en el origen. De esta forma es como si el horizonte de prediccion
fuera infinito.
El problema de este metodo es que en la practica la introduccion de esta restriccion
artificial anade

un coste computacional considerable y, lo que es mas importante aun,


da lugar a una region de operacion muy restrictiva, por lo que en la realidad resulta
muy difcil satisfacer esta condicion.
3. Control dual
La dificultad de la aproximacion anterior llevo a Michalska y Mayne ([14]) a buscar
una restriccion menos estricta. La idea es definir un entorno W alrededor del estado
final deseado s dentro del cual el sistema pueda ser llevado a dicho estado por medio de
un controlador lineal por realimentacion del vector de estados. Por tanto la restriccion
que se anade

a la formulacion es:

x t P ) ; xs ) 2 W

( ( +

Si el estado actual se encuentra fuera de esta region se usa el algoritmo NMPC con la
restriccion anterior. Una vez que el estado se encuentra en W , el control conmuta a una
estrategia lineal determinada previamente (estrategia del tipo dual-mode controller).
Este metodo conlleva por tanto la gestion de la conmutacion entre los dos controladores y la determinacion de la region W y de la matriz de ganancia de la realimentacion
del vector de estados (una forma de hacerlo se puede encontrar en el artculo citado).
4. Horizonte casi-infinito
Chen y Allgower ([3]) extendieron el concepto anterior, proponiendo un esquema
de control con horizonte casi-infinito. Se hace uso de la idea de region terminal y

Control predictivo no lineal

60

controlador estabilizante, pero solo para el calculo del coste terminal. La senal
de
control se determina resolviendo el problema de optimizacion en lnea (con horizonte
finito) sin conmutar al controlador lineal incluso dentro de la region terminal.
El procedimiento consiste en anadir

el termino kx(t + Tp )k2P a la funcion de coste,


cuyo objetivo es extender el horizonte de prediccion hasta el infinito y por tanto evitar
la conmutacion del controlador. Se puede demostrar que, eligiendo adecuadamente la
matriz de ponderacion P , este termino es una cota superior de lo que costara llevar
al sistema no lineal con el controlador lineal hasta el origen partiendo de un estado
perteneciente a la region terminal y la funcion de coste con horizonte finito se aproxima
a una de horizonte infinito, en cuyo caso la estabilidad queda asegurada. Esto se puede
interpretar como si el horizonte de prediccion se expandiera casi hasta el infinito (es
decir, es como si se minimizara un coste de horizonte infinito resolviendo un problema
de horizonte finito).
5. Contraccion del estado
La idea consiste en imponer la siguiente restriccion:

kx(t + N )k2  kx(t)k2

 2 (0 1)

Esta restriccion fuerza a la magnitud del vector de estado a contraerse segun el factor
elegido cada vez que se calcula la senal
de control. La estabilidad queda garantizada
siempre que el problema sea factible, lo que no viene impuesto necesariamente porque
sea factible en k = 0, ya que las restricciones que se le imponen al estado son muy
estrictas y pueden hacer perder factibilidad. Esto se puede mejorar con valores grandes
de , pero entonces la disminucion de la magnitud del estado es menor. En general
se puede decir que en muchas situaciones reales la condicion es muy restrictiva y la
no-factibilidad aparece con facilidad.

Robustez
lo es el de
Si el estudio de la estabilidad en NMPC resulta de por s complicado, mas aun
la robustez, es decir, la estabilidad cuando existen errores de modelado. Los resultados
de estabilidad de la seccion anterior son validos solo en el caso de que el modelo del
proceso sea perfecto. Resulta evidente que esto nunca va a ser cierto en la practica, por
lo que es necesario alguna forma de afrontar la existencia de incertidumbres.
Se puede considerar el problema de la robustez como algo todava sin resolver
para NMPC, aunque existen algunos resultados preliminares. Algunos de los esquemas
que garantizan establidad se pueden hacer robustos con algunos cambios, como por
ejemplo el uso de restricciones terminales conservadoras in el dual-mode. Pero en
general los resultados existentes solo indican que incertidumbres pequenas no amenazan
la estabilidad del bucle cerrado, sin permitir el diseno
del controlador que garantice la
estabilidad dada una incertidumbre descrita por sus lmites. Existen algunos resultados

Tendencias actuales y nuevas perspectivas

61

para casos muy simples como incertidumbre en la ganancia y se esta avanzando en


algunos campos como en LMI, pero todava queda mucho por hacer.

5.2.4

Modelos

Estos resultados teoricos proporcionan una base para poner en marcha un NMPC, aunque en la practica existen muchos temas abiertos, principalmente en lo referente a la
definicion e identificacion del modelo y al desarrollo de metodos de resolucion fiables.
La obtencion de modelos no lineales adecuados de forma emprica puede ser muy
difcil y no existe una formulacion que sea claramente adecuada para representar
procesos no lineales de forma generica. Parte del e xito del MPC se debe a la relativa
facilidad con la que se pueden obtener experimentalmente modelos del tipo respuesta
ante escalon o funciones de transferencia de bajo orden. En cambio los modelos no
lineales son mucho mas difciles de construir, tanto basandose en correlacion de datos
de entrada/salida como en principios basicos de conservacion de masa y energa.
Un gran obstaculo que se encuentra a la hora de desarrollar una teora de sistemas
no lineales es la ausencia de un principio de superposicion para este tipo de sistemas.
Debido a ello, la determinacion experimental de los modelos se convierte en una tarea
muy complicada, requiriendo una cantidad de ensayos mucho mayor que para una
planta no lineal.
Si el proceso es lineal en teora solo es necesario llevar a cabo un ensayo de respuesta ante escalon para calcular el modelo (aunque en la practica no sea realmente
as). Debido al principio de superposicion, la respuesta ante un escalon de diferente
amplitud se puede obtener escalando la salida convenientemente. Pero esto no es as
para procesos no lineales, donde se deben realizar ensayos con escalones de distinto
tamano.
Ademas, si el proceso es multivariable, la diferencia en el numero de ensayos
necesarios es mucho mayor. En general, si un sistema lineal se ensaya con senales

de entrada u1 (t),u2 (t),...,un (t), y las correspondientes salidas son y1 (t),y2 (t),...,yn (t), la
respuesta a una senal
que se puede expresar como combinacion lineal de las senales

de
prueba
u(t) = 1u1(t) + 2 u2(t) +    + nun(t)
es

y(t) = 1y1(t) + 2y2(t) +    + nyn(t)

Es decir, un sistema lineal no necesita ser probado con ninguna secuencia de senales

de entrada que sea una combinacion lineal de senales

ya probada, mientras que no


ocurre lo mismo con un sistema no lineal, cuya respuesta debe ser analizada para todas
las posibles senales

de entrada.
Si la desviacion de la linealidad no es demasiado grande, se pueden hacer algunas aproximaciones que tengan en cuenta el cambio de comportamiento de un punto

Control predictivo no lineal

62

de operacion a otro y asuman comportamiento lineal en las cercanas del punto de


operacion. Pero en general habra que recurrir a modelos especficos que reflejen la
dinamica no lineal. Existen diferentes aproximaciones que usan modelos de Wiener,
otras basadas en redes de neuronas, modelos de Volterra o de Hammerstein, modelos NARX, modelos borrosos, etc. Los modelos usados en la industria se detallan a
continuacion.

Modelos en el espacio de estados


Se puede usar un modelo formado por la combinacion de una ecuacion de estado lineal
con una relacion no lineal de salida:

x(t + 1) = Ax(t) + Bu(t) + Dd(t)y(t) = g(x(t))


A su vez la no linealidad de la salida se puede modelar con la superposicion de una
relacion lineal y una red neuronal no lineal:

g(x(t)) = Cx(t) + NN (x(t))


Al no estar el vector de estados limitado necesariamente a variables fsicas, este
modelo es muy generico y permite englobar mas efectos no lineales que los exclusivos
de las medidas.
Pero el principal problema en NMPC no es la eleccion del tipo de modelo, sino de
un metodo de identificacion fiable y robusto. Segun el modelo propuesto, se identifica
el sistema como lineal y los residuos de las salidas se ajustan a los estados con la red
neuronal. Se puede usar un ndice de confianza de modo que la prediccion se basa mas
o menos en la red neuronal segun este ndice, apagandose en caso de que su aportacion
no sea fiable. Tambien puede anadir

un filtro de Kalman extendido (EKF) para corregir


los errores de modelado y las perturbaciones no medibles, reemplazando de este modo
el error constante en la realimentacion que se emplea normalmente en el MPC.

Modelos de entrada/salida
Una idea adoptada por algunos fabricantes de controladores predictivos es usar un
modelo no lineal estatico junto con un modelo dinamico no lineal. Si se considera el
caso monovariables, definiendo las variables de desviacion como:

u(t) = u(t) ; us

y(t) = y(t) ; ys

donde los valores en estado estacionario de entrada y salida cumplen:

ys = hs(us)

Tendencias actuales y nuevas perspectivas

63

Se considera que las variables de desviacion verifican la siguiente relacion dinamica


lineal:
n
X
y(t) = ai y(t ; i) + bi u(t ; i)
i=1
La identificacion del modelo lineal se lleva a cabo mediante ensayos ante escalon
mientras que a partir de datos historicos se obtiene la representacion de la relacion no
lineal por medio de una red de neuronas. Como el modelo dinamico tiene una ganancia
fija que en general sera distinta de la del modelo no lineal, la ganancia del submodelo
lineal se escala hasta ser igual a la ganancia local no lineal para la entrada actual:

dys j
Ks = du
u(t)
s

Esto se consigue reescalando los coeficientes bi .


Para usar este modelo, un programa de optimizacion no lineal calcula los mejores
valores de entrada y salida ufs , ysf a partir del modelo estatico. Durante el calculo
dinamico del controlador, la ganancia estatica no lineal se aproxima por una interpo lineal de las ganancias inicial y final:
lacion

Ks(u(t)) = Ksi + Ksf ; Ki s u(t)


us ; us
f

:4)

(5

siendo uis y ufs los valores estacionarios actual y proximo y Ksi y Ksf las ganancias
calculadas en esos puntos usando el modelo no lineal estatico. Sustituyendo la ganancia
dada por (5.4) en la ecuacion del submodelo lineal se obtiene:

y(t) =
donde

n
X
i=1

aiy(t ; i) + biu(t ; i) + giu2(t ; i)

:5)

(5

biKsi (1 ; Pnj=1 aj )
bi (1 ; Pnj=1 aj )
gi = Pn Ksf ;K i
bi =
Pn b
s
j =1 j
j =1 bj ufs ;uis

con esto se consigue reducir la complejidad computacional.


Se puede observar que los valores en estado estacionario se calculan a partir del
modelo estatico no lineal, mientras que los movimientos dinamicos de control estan
basados en el modelo cuadratico de la ecuacion (5.5). Sin embargo, los coeficientes del
modelo cuadratico (la ganancia local) cambian de un periodo de muestro a otro, ya son
reescalados para ajustarse a la ganancia local del modelo no lineal. Esta estrategia se
puede interpretar como una sucesiva linealizacion de los estados inicial y final seguida
por una interpolacion lineal de las ganancias linealizadas, en una formulacion similar
al gain-scheduling, pero con un modelo global diferente debido el reescalado de la
ganancia.

Control predictivo no lineal

64
Modelos basados en primeros principios

En cualquier caso siempre es difcil obtener modelos empricos fiables a partir de


datos experimentales, por lo que en la practica existe la posibilidad de usar modelos
dados directamente de las ecuaciones de balance, llamados normalmente modelos
de primeros principios. Estas ecuaciones pueden ser ecuaciones estaticas de balance
o funciones no lineales de variables fsicas que generan otra variable. En este caso
el calculo de la prediccion se realiza mediante una simulacion de las ecuaciones no
lineales (integracion) que describen el proceso.

5.2.5

Otras formulaciones del problema

Se han propuesto diversas soluciones para intentar resolver los problemas que se
han visto, como por ejemplo en [1], donde la prediccion de la salida del proceso
se hace mediante la adicion de la respuesta libre (la respuesta futura que se obtiene
si la entrada se mantiene en un valor constante durante los horizontes de control y
prediccion) obtenida de un modelo no lineal de la planta, y la respuesta forzada (la
debida a los movimiento de control futuros), calculada con un modelo incremental de
la planta. Las predicciones obtenidas de esta manera son solo una aproximacion ya
que el principio de superposicion, que permite la descomposicion mencionada, solo
es valido para sistemas lineales. Sin embargo, la aproximacion que se obtiene de esta
forma se comporta mejor que cuando se usa un modelo linealizado del proceso para
obtener ambas respuestas.
Si se usa una funcion de coste cuadratica, la funcion objetivo es cuadratica en las
variables de decision (futuros movimientos de la senal
de control) y la secuencia de
control se puede calcular (en caso de que no haya restricciones) como la solucion de

un conjunto de ecuaciones lineales, dando lugar a una ley de control simple. La unica
diferencia respecto a un MPC estandar es que la respuesta libre se calcula mediante un
modelo no lineal del proceso. Como el principio de superposicion no se cumple, la
aproximacion solo es valida cuando la secuencia de senales

de control es pequena.
Esta
circunstancia tendra lugar cuando el proceso opera en torno al punto de trabajo con
pequenas
perturbaciones. Si el proceso cambia continuamente de punto de operacion
o las perturbaciones son considerables los incrementos de la senal
de control seran en
general mayores y la aproximacion no sera muy buena.
Existe una forma de resolver este problema, propuesta en [9] para el EPSAC. La idea
basica es considerar la secuencia de senales

de control como la suma de una secuencia


de control base (ub (t + j )) y una secuencia de incrementos de la variable manipulada
(ui (t + j )). Es decir:

u(t + j ) = ub(t + j ) + ui(t + j )

Tendencias actuales y nuevas perspectivas

65

La prediccion j-esima de la salida del proceso se calcula como la suma de la respuesta


del proceso (yb (t + j )) debida a la secuencia base mas la respuesta (yi (t + j )) debida a
los futuros incrementos del control en la secuencia base de entrada ui (t + j ):

y(t + j ) = yb(t + j ) + yi(t + j )


Como se usa un modelo no lineal para calcular yb(t + j ) mientras que yi (t + j ) se
calcula a partir de un modelo lineal del proceso, la funcion de coste es cuadratica en
las variables de decision (ui (t + j )) y se puede resolver mediante un algoritmo QP como
en el MPC estandar. Como se ha indicado, el principio de superposicion no es valido
para procesos no lineales, y por ello la salida generada de esta forma solo coincidira
con la generada por el controlador no lineal en el caso de que la secuencia de futuros
movimientos de la senal
de control sea cero.

Si e ste no es el caso, la secuencia de control base se hace igual a la ultima


secuencia

de control base mas los incrementos de control optimos que encuentre el algoritmo QP.
Este procedimiento se repite hasta que la secuencia de senales

de control se lleva lo
suficientemente cerca de cero.
Las condiciones iniciales para la secuencia de control base se pueden hacer inicial
mente iguales a la ultima
senal
de control que se ha aplicado al proceso. Observese que
esto corresponde al calculo de la respuesta libre en el MPC. Se puede probar con una

secuencia inicial mejor haciendo la secuencia base igual a la optima


que se obtuvo en

el ultimo
periodo de muestreo (con el desplazamiento temporal correspondiente).
Las condiciones de convergencia del algoritmo son muy difciles de obtener ya que
dependen de la severidad de la caracterstica no lineal del proceso, de las entradas y
salidas pasadas, de las referencias futuras y de las perturbaciones.
Otra manera de atacar el problema es teniendo en cuenta que en algunas ocasiones,
el modelo no lineal se puede convertir en un modelo lineal mediante aproximaciones
apropiadas. Considerese por ejemplo el proceso descrito mediante la siguiente ecuacion
en el espacio de estados:

x(t + 1)
y(t)

=
=

f (x(t) u(t))
g(x(t))

El metodo consiste en encontrar funciones de transformacion de estados y entrada


z(t) = h(x(t)) y u(t) = p(x(t) v(t)) tales que:

z(t + 1)
y(t)

=
=

Az(t) + Bv(t))
Cz(t)

El metodo tiene dos importantes inconvenientes:

Control predictivo no lineal

66

 Las funciones de transformacion


pueden obtener en ciertos casos.

z(t)

h(x(t))

u(t)

p(x(t) v(t))

solo se

 Las restricciones, que usualmente son lineales, se convierten en no lineales.


Es decir, incluso en los casos en que el modelo pueda ser linealizado mediante
transformaciones adecuadas, el problema se transforma de minimizar una funcion no
lineal (no cuadratica) con restricciones lineales en minimizar una funcion cuadratica
con restricciones no lineales.
La forma general de resolver el problema es usar el modelo no lineal completo de
la planta para calcular la prediccion de la salida. Haciendo esto, se esta anadiendo

una restriccion no lineal a la minimizacion, con lo que los algoritmos QP no se pueden


usar. Sin embargo el problema se puede resolver en lnea, en algunos casos, gracias al
rapido desarrollo de algoritmos de programacion no lineal (nonlinear programming,
NLP) capaces de manejar un n
umero grande de variables y restricciones.

5.2.6

Resolucion del problema. Productos comerciales

Muchos controladores comerciales dividen el algoritmo de control en una optimizacion


local estatica y una optimizacion dinamica. El primer modulo calcula los valores de
entrada y salida a los que es necesario llegar y el segundo calcula la secuencia de control
adecuada.
La optimizacion dinamica se lleva a cabo minimizando la funcion objetivo generica
(5.3) con las restricciones correspondientes. Los distintos esquemas comerciales hacen
simplificaciones respecto a la formulacion general.
La mayora de los productos (ver tabla 5.1) solo permiten matrices de peso constantes en todo el horizonte y solo el NOVA-NLC trabaja con norma 1. Por su parte, el
la salida pero con una matriz de peso que se incrementa
Process Perfecter minimiza solo
gradualmente con el horizonte, dando por tanto mas importancia a los errores mas
lejanos y en consecuencia dando lugar a una accion de control mas suave.
En cuanto a las restricciones, normalmente las correspondientes a la entrada se
tratan como restricciones duras, es decir, que nunca deben ser violadas. El PFC tambien

incluye restricciones de aceleracion, muy utiles


para aplicaciones de servomecanismos.

Este metodo no trata estas restricciones de forma optima,


sino que resuelve el problema
de optimizacion sin restricciones y luego satura a los lmites, produciendo por tanto

una solucion no optima.


Respecto a restricciones en la salida, la mayora de los productos comerciales las trata
como restricciones blandas, debido a que una perturbacion puede producir facilmente
una perdida de factibilidad. Una opcion ofertada por el Process Perfecter es considerar

Tendencias actuales y nuevas perspectivas

Empresa
Producto
Modelo
F. Objetivo
Restricciones
Estructura u

Met. solucion

Adersa
PFC
EE, PP
Q
S, BS
FB, UM
NLS

Aspen Tech.
Aspen Target
EE
Q
DS, DE, BS
MM
QP

Continental
MVC
E/S, PNE
Q
DE, BS
UM
GRG

67

DOT Products
NOVA NLC
EE, PP
Q, N1
DE, BS
MM
MINLP

Pavillion Tech.
Process Perfecter
RN, E/S
Q
DE, DS
MM
GD

Tabla 5.1: EE: espacio de estados no lineal. PP: primeros principios. E/S: entrada/salida. PNE: polinomio no lineal estatico. RN: red neuronal. N1: norma 1.
S: saturacion. BS: blandas (mnimo y maximo) en la salida. DS: duras en las salidas.

DE: duras en las entradas. FB: funciones base. UM: unico


movimiento. MM: multiples
movimientos. NLS: mnimos cuadrados no lineales. GRG: Generalized Reduced Gradient. MINLP: Mixed Integer Nonlinear Programming. GD: Gradient descent.

una restriccion dura en forma de embudo, de manera que se da mas libertad a la salida
al comienzo del horizonte que al final.
Parametros: normalmente se elige un horizonte de prediccion finito muy grande,
con la idea de capturar la dinamica hasta el permanente de las salidas para todas las
entradas. Esto se puede considerar una aproximacion al metodo de horizonte infinito
propuesto para garantizar la estabilidad del bucle cerrado y puede explicar por que
ninguno de los productos comerciales incluye restriccion terminal.
Una idea introducida en el PFC y adoptada por Aspen Target es el uso de puntos de
coincidencia, en los cuales deben coincidir la salida y la trayectoria de referencia. Esta
cuando las salidas responden con distinta velocidad y se pueden
idea puede ser util
definir distintos puntos de coincidencia para cada una de ellas.
En cuanto a la estructuracion de la senal
de control, se puede encontrar desde
considerar el horizonte de control igual a 1, horizonte variable o funciones base. Esta

de control usando un conjunto de


ultima
idea, propia del PFC, parametriza la senal
funciones polinomiales, permitiendo un perfil de entrada complejo para un horizonte
de control grande (en teora podra ser infinito) empleando un numero de incognitas
pequeno.

Esto puede resultar una ventaja en el caso de sistemas no lineales. La


de la familia de funciones base establece muchas de las caractersticas del
eleccion
perfil de la entrada, pudiendo asegurar con una correcta eleccion una senal
de control
suave, por ejemplo. Si se eligen funciones base polinomicas, se puede seleccionar el
orden para seguir un setpoint polinomico sin retraso, lo cual puede ser importante para
aplicaciones de servosistemas mecanicos.
La solucion del problema no es tarea facil debido a la no convexidad del problema
generico. El PFC propone una solucion sencilla resolviendo el problema sin restricciones
usando un algoritmo de mnimos cuadrados no lineal y saturando las entradas a sus

Control predictivo no lineal

68

lmites si e stos se violan; logicamente no se asegura una solucion optima,


pero se gana
en velocidad, permitiendo que este controlador se use en aplicaciones con perodos de
muestreo pequenos,

como el caso de seguimiento de missiles.


Para el caso generico se usan diversos algoritmos, algunos propietarios, basados
en metodos mas o menos conocidos de optimizacion. Entre ellos cabe destacar el
que usa Aspen Target, desarrollado por Oliveira y Biegler [15], que garantiza que las
soluciones intermedias, aunque no o ptimas, son factibles. Ello garantiza que una pronta
finalizacion del algoritmo por limitaciones de tiempo produce siempre una solucion
factible. En cualquier caso queda claro que el esfuerzo computacional es superior al
caso lineal, siendo e sta una de las principales razones la todava escasa implantacion
de estas tecnicas en la industria.

5.2.7

Necesidades futuras

Los temas que pueden considerarse abiertos en esta tecnica son:

 Modelado: los modelos no lineales son mas complejos que los lineales, pero
ademas el proceso de identificacion es mucho mas difcil. Se necesita una gran
batera de ensayos para capturar las no-linealidades del proceso, resultando en
un perodo de pruebas considerable. Por tanto, la forma de disponer de una
representacion correcta de la dinamica del proceso es un problema que no esta
completamente resuelto.
 Resolucion del problema: la inclusion del modelo no lineal en la optimizacion da
lugar a que e sta no sea convexa. Grandes esfuerzos deben hacerse todava para
encontrar algoritmos de optimizacion fiables que permitan la resolucion dentro
del tiempo asignado.
 Justificacion del esfuerzo: vistas las dificultades que aparecen en la aplicacion
de NMPC, debe poder justificarse el beneficio que este tipo de tecnica aporta.
Algunos fabricantes ofrecen un MPC de respaldo, de manera que en el caso de
que no se necesite ese esfuerzo adicional o el controlador no lineal sea realmente
complicado de poner en marcha, se aplicara la estrategia lineal.
 Otros temas: temas que son aplicables al Control Predictivo en general, funciones objetivos multicriterio, sintonizacion de parametros, mal condicionamiento o
tolerancia a fallos.
Es de destacar que ninguna de los productos comerciales incluye restriccion terminal ni horizonte infinito, situaciones requeridas en teora para garantizar la estabilidad
nominal. En lugar de eso, se confa en que con un horizonte de prediccion lo suficientemente grande se consiga el mismo comportamiento que horizonte infinito.

Bibliografa
[1] E.F. Camacho, M. Berenguel y F.R. Rubio. Advanced Control of Solar Power Plants.
Springer-Verlag, London, 1997.
[2] E.F. Camacho y C. Bordons. Model Predictive Control. Springer-Verlag, 1999.
[3] H. Chen y F. Allgower. A quasi-infinite horizon nonlinear predictive control
scheme with guaranteed stability. Automatica, 34(10):12051218, 1998.
[4] D.W. Clarke y C. Mohtadi. Properties of Generalized Predictive Control. Automatica, 25(6):859875, 1989.
[5] D.W. Clarke, C. Mohtadi y P.S. Tuffs. Generalized Predictive Control. Part I. The
Basic Algorithm. Automatica, 23(2):137148, 1987.
[6] C.R. Cutler y B.C. Ramaker. Dynamic Matrix Control- A Computer Control Algorithm. En Automatic Control Conference, San Francisco, 1980.
[7] C.E. Garca, D.M. Prett y M. Morari. Model Predictive Control: Theory and
Practice-a Survey. Automatica, 25(3):335348, 1989.
[8] S.S. Keerthi y E.G. Gilbert. Optimal infinite-horizon feedback laws for a general
class of constrained discrete-time systems: Stability and moving-horizon approximations. J. Optim. Theory Appl., 57(2):265293, 1988.
[9] R. De Keyser. A Gentle Introduction to Model Based Predictive Control. En
PADI2 International Conference on Control Engineering and Signal Processing, Piura,
Peru, 1998.
[10] R.M.C. De Keyser, Ph.G.A. Van de Velde y F.G.A. Dumortier. A Comparative Study
of Self-adaptive Long-range Predictive Control Methods. Automatica, 24(2):149
163, 1988.
[11] K. Kramer y H. Ubehauen. Predictive Adaptive Control. Comparison of Main
Algorithms. En Proceedings 1st European Control Conference, Grenoble, paginas 327
332, julio 1991.
[12] A.G. Kutnetsov y D.W. Clarke. Advances in Model-Based Predictive Control, captulo
Application of constrained GPC for improving performance of controlled plants.
Oxford University Press, 1994.
69

70

Bibliografa

[13] E.S. Meadows, M.A. Henson, J.W. Eaton y J. Rawlings. Receding horizon control
and discontinuous state feedback stabilization. Int. Journal Control, paginas 1217
1229, 1995.
[14] H. Michalska y D.Q. Mayne. Robust receding horizon control of constrained
nonlinear systems. IEEE Trans. on Automatic Control, 38(11):16231633, 1993.
[15] N.M.C. Oliveira y L.T. Biegler. An extension of newton-type algorithms for nonlinear process control. Automatica, 31:281286, 1995.
[16] S.J. Qin y T.A. Badgwell. An Overview of Industrial Model Predictive Control
Technology. In Chemical Process Control: Assessment and New Directions for
Research. En AIChE Symposium Series 316, 93. Jeffrey C. Kantor, Carlos E. Garcia and
Brice Carnahan Eds. 232-256, 1997.
[17] S.J. Qin y Thomas A. Badgwell. An overview of nonlinear model predictive control
applications. En IFAC Workshop on Nonlinear Model Predictive Control. Assessment
and Future Directions. Ascona (Switzerland), 1998.
[18] J. Richalet. Practique de la commande predictive. Hermes, 1992.
[19] H. Takatsu, T. Itoh y M. Araki. Future needs for the control theory in industries.
report and topics of the control technology survey in japanese indsutry. Journal of
Process Control, 8:369374, 1998.
[20] M.L. Tyler y M. Morari. Propositional Logic in Control and Monitoring Problems.
Technical Report AUT96-15, Institut fur Automatik, ETH- Swiss Federal Institute of
Technology, Zurich, Switzerland, 1996.
[21] B.E. Ydstie. Extended Horizon Adaptive Control. En Proc. 9th IFAC World Congress,
Budapest, Hungary, 1984.

También podría gustarte