Está en la página 1de 317

TESIS DOCTORAL

Control predictivo de sistemas


no lineales con restricciones:
estabilidad y robustez

Daniel Lim
on Marruedo
Sevilla, Septiembre de 2002

TESIS DOCTORAL

Control predictivo de sistemas


no lineales con restricciones:
estabilidad y robustez
por
Daniel Lim
on Marruedo
Ingeniero Industrial por la Escuela Superior de Ingenieros
de la Universidad de Sevilla
Presentada en la
Escuela Superior de Ingenieros
de la
Universidad de Sevilla
para la obtencion del
Grado de Doctor Ingeniero Industrial

Sevilla, Septiembre de 2002

TESIS DOCTORAL

Control predictivo de sistemas


no lineales con restricciones:
estabilidad y robustez

Autor: Daniel Limon Marruedo

Directores: Teodoro Alamo


Cantarero
Eduardo Fernandez Camacho

Indice general

Notaci
on

1. Introducci
on

1.1. Introduccion al control predictivo . . . . . . . . . . . . . . . . . . . . .

1.1.1. Formulacion del control predictivo . . . . . . . . . . . . . . . . .

1.1.2. Ventajas e inconvenientes del MPC . . . . . . . . . . . . . . . .

1.2. Motivacion de la investigacion . . . . . . . . . . . . . . . . . . . . . . .

1.3. Objetivos y estructura de la tesis . . . . . . . . . . . . . . . . . . . . .

2. Estabilidad y robustez del control predictivo basado en modelo

13

2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

2.2. Controladores predictivos en la industria. . . . . . . . . . . . . . . . . .

14

2.3. El problema de la estabilidad: optimalidad no implica estabilidad . . .

15

2.3.1. Un ejemplo ilustrativo . . . . . . . . . . . . . . . . . . . . . . .

19

2.4. Controladores predictivos con estabilidad garantizada . . . . . . . . . .

20

2.5. Formulacion general del MPC: necesidad de la region terminal y el coste


terminal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

ii

INDICE GENERAL

2.5.1. Un ejemplo ilustrativo . . . . . . . . . . . . . . . . . . . . . . .

26

2.6. Robustez de los controladores MPC . . . . . . . . . . . . . . . . . . . .

28

2.6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

28

2.6.2. Analisis de robustez de los controladores MPC . . . . . . . . . .

28

2.6.3. Formulaciones robustas del MPC . . . . . . . . . . . . . . . . .

30

2.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

33

3. Nuevas formulaciones del MPC con estabilidad garantizada

35

3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

3.2. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . .

37

3.3. Formulacion general del MPC . . . . . . . . . . . . . . . . . . . . . . .

37

3.3.1. Condiciones suficientes de estabilidad . . . . . . . . . . . . . . .

39

3.3.2. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . .

44

3.4. MPC con horizonte de prediccion mayor que el de control . . . . . . . .

45

3.4.1. Formulacion del controlador . . . . . . . . . . . . . . . . . . . .

47

3.4.2. Condiciones suficientes de estabilidad . . . . . . . . . . . . . . .

48

3.4.3. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . .

50

3.5. MPC con coste terminal cuasi-infinito . . . . . . . . . . . . . . . . . . .

52

3.5.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . .

57

3.6. El MPC como controlador optimo cuasi-infinito . . . . . . . . . . . . .

58

3.6.1. El MPC general como controlador con horizonte cuasi-infinito .

60

INDICE GENERAL

iii

3.6.2. Influencia de los horizontes en el coste optimo del MPC . . . . .

61

3.6.3. El MPC como aproximacion al controlador con horizonte infinito

62

3.6.4. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . .

65

3.7. Calculo de la region terminal . . . . . . . . . . . . . . . . . . . . . . . .

67

3.7.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . .

70

3.8. Analisis de estabilidad del MPC suboptimo . . . . . . . . . . . . . . . .

72

3.8.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . .

76

3.9. Eliminacion de la restriccion terminal . . . . . . . . . . . . . . . . . . .

77

3.9.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . .

85

3.10. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86

4. Aumento del dominio de atracci


on del MPC

89

4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

89

4.2. El dominio de atraccion del MPC . . . . . . . . . . . . . . . . . . . . .

91

4.3. Aumento del dominio de atraccion mediante los horizontes . . . . . . .

93

4.3.1. Aumento mediante el horizonte de control . . . . . . . . . . . .

93

4.3.1.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . .

96

4.3.2. Aumento mediante el horizonte de prediccion . . . . . . . . . .

97

4.3.2.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . .

99

4.4. Aumento del dominio de atraccion mediante el coste terminal . . . . . 100


4.4.1. Incorporacion del coste terminal cuasi-infinito . . . . . . . . . . 100

INDICE GENERAL

iv

4.4.2. Aumento de la region terminal ponderando el coste terminal . . 102


4.4.2.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 103
4.5. Aumento del dominio de atraccion mediante la restriccion terminal . . 105
4.5.1. Aumento del dominio de atraccion mediante una region terminal
contractiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.5.1.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 108
4.5.2. MPC con region terminal contractiva basada en invariantes de
control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.5.2.1. Obtencion de una secuencia de invariantes de control . 110
4.5.2.2. MPC con restriccion terminal contractiva . . . . . . . 112
4.5.2.3. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . 116
4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal . . 119
4.6.1. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 122
4.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

5. An
alisis de robustez del MPC nominal

127

5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127


5.2. Sistemas con incertidumbres aditivas . . . . . . . . . . . . . . . . . . . 129
5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas . . . . . 131
5.4. Aplicacion al analisis de robustez del MPC . . . . . . . . . . . . . . . . 138
5.4.1. Factibilidad robusta del MPC . . . . . . . . . . . . . . . . . . . 139
5.4.1.1. Invariancia robusta del dominio de atraccion . . . . . . 141

INDICE GENERAL

5.5. Estabilidad entrada a estado (ISS) del MPC . . . . . . . . . . . . . . . 143


5.5.1. Estabilidad entrada a estado . . . . . . . . . . . . . . . . . . . . 144
5.5.2. Aplicacion al MPC . . . . . . . . . . . . . . . . . . . . . . . . . 146
5.6. Suboptimalidad y robustez en el MPC . . . . . . . . . . . . . . . . . . 148
5.6.1. Estabilidad robusta del MPC suboptimo . . . . . . . . . . . . . 149
5.7. Robustez del controlador MPC sin restriccion terminal . . . . . . . . . 153
5.8. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . . . . . 155
5.9. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

6. MPC ISS con satisfacci


on robusta de las restricciones

159

6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159


6.2. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
6.3. Acotacion del efecto de las incertidumbres en la prediccion . . . . . . . 161
6.3.1. Acotacion basada en la continuidad Lipschitz . . . . . . . . . . 164
6.3.2. Reduccion del conservadurismo . . . . . . . . . . . . . . . . . . 164
6.4. Controlador MPC con estabilidad entrada a estado . . . . . . . . . . . 167
6.4.1. Determinacion de la region terminal . . . . . . . . . . . . . . . . 168
6.4.2. Formulacion del MPC . . . . . . . . . . . . . . . . . . . . . . . 170
6.4.3. Analisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . 171
6.5. Robustez de la formulacion con Np > Nc . . . . . . . . . . . . . . . . . 175
6.6. MPC robusto con restricciones en el estado . . . . . . . . . . . . . . . . 177

INDICE GENERAL

vi

6.6.1. Factibilidad del MPC basada en restricciones conservadoras . . 178


6.7. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . . . . . 182
6.8. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

7. MPC robusto basado en regiones de evoluci


on incierta

185

7.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185


7.2. Regiones de evolucion incierta . . . . . . . . . . . . . . . . . . . . . . . 186
7.2.1. Descripcion del sistema . . . . . . . . . . . . . . . . . . . . . . . 186
7.2.2. Notacion y definicion de operaciones sobre conjuntos . . . . . . 187
7.2.3. Regiones de evolucion incierta . . . . . . . . . . . . . . . . . . . 188
7.2.4. Un procedimiento de calculo basado en el algebra intervalar . . 192
7.3. Controlador MPC dual robusto . . . . . . . . . . . . . . . . . . . . . . 194
7.3.1. Analisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . 196
7.4. Controlador MPC robusto no dual

. . . . . . . . . . . . . . . . . . . . 199

7.5. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . . . . . 203


7.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

8. MPC robusto basado en conjuntos invariantes robustos

209

8.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209


8.2. MPC robusto en bucle cerrado . . . . . . . . . . . . . . . . . . . . . . . 210
8.2.1. Necesidad de controladores MPC en bucle cerrado . . . . . . . . 211
8.2.2. Formulacion del MPC robusto en bucle cerrado . . . . . . . . . 213

INDICE GENERAL

vii

8.3. Analisis de estabilidad del MPC robusto en bucle cerrado . . . . . . . . 214


8.3.1. Aproximacion desde la programacion dinamica . . . . . . . . . . 214
8.3.2. Estabilidad del MPC robusto en bucle cerrado con horizonte fijo
e incertidumbres que decaen con el estado . . . . . . . . . . . . 216
8.3.3. Estabilidad del MPC robusto en bucle cerrado con horizonte fijo
e incertidumbres acotadas . . . . . . . . . . . . . . . . . . . . . 219
8.4. Transformacion de la formulacion en bucle cerrado en restriccion estabilizante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
8.5. MPC robusto basado en conjuntos invariantes de control . . . . . . . . 223
8.5.1. Determinacion de una secuencia de invariantes de control robustos224
8.5.2. Formulacion del MPC robusto . . . . . . . . . . . . . . . . . . . 226
8.5.3. Analisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . 227
8.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
8.6.1. El sistema de Scokaert y Mayne . . . . . . . . . . . . . . . . . . 229
8.6.2. Ejemplo de aplicacion al reactor . . . . . . . . . . . . . . . . . . 231
8.7. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

9. Conclusiones y futuras lneas de investigaci


on

237

9.1. Conclusiones y aportaciones originales . . . . . . . . . . . . . . . . . . 237


9.2. Futuras lneas de investigacion . . . . . . . . . . . . . . . . . . . . . . . 240

A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

243

A.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243


A.2. Estabilidad de sistemas no lineales en tiempo discreto . . . . . . . . . . 244

INDICE GENERAL

viii

A.2.1. Definiciones previas . . . . . . . . . . . . . . . . . . . . . . . . . 245


A.2.2. Estabilidad de un sistema . . . . . . . . . . . . . . . . . . . . . 247
A.2.3. Teora de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . 248
A.2.4. Estabilidad de sistemas con restricciones . . . . . . . . . . . . . 253
A.2.5. Generalizacion a sistemas no autonomos: funciones de Lyapunov
de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
A.2.5.1. Sistema sujeto a restricciones en el estado . . . . . . . 256
A.3. Teora de conjuntos invariantes . . . . . . . . . . . . . . . . . . . . . . 257
A.3.1. Determinacion del conjunto a un paso

. . . . . . . . . . . . . . 265

A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado268


A.4.1. Suavidad implica robustez . . . . . . . . . . . . . . . . . . . . . 271
A.4.2. Robustez de sistemas no autonomos . . . . . . . . . . . . . . . . 272
A.5. Conjuntos invariantes robustos . . . . . . . . . . . . . . . . . . . . . . . 273

B. Un ejemplo ilustrativo: el reactor continuamente agitado (CSTR)

277

C. An
alisis de la continuidad del coste
optimo

281

C.1. El problema de programacion matematica en el MPC . . . . . . . . . . 281


C.2. Analisis de sensibilidad de un problema NLP

. . . . . . . . . . . . . . 283

C.3. Continuidad Lipschitz del coste optimo JN (xk ) . . . . . . . . . . . . . . 286


C.3.1. MPC con restricciones en el estado . . . . . . . . . . . . . . . . 286
C.3.2. MPC sin restricciones en el estado . . . . . . . . . . . . . . . . . 291

INDICE GENERAL

ix

C.4. Continuidad Lipschitz local del coste optimo JN (xk ) ante incertidumbres
parametricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293

Bibliografa

295

INDICE GENERAL

Notaci
on
En el presente documento se utilizara la siguiente notacion:
JN (x)

Coste optimo del problema de optimizacion del MPC con horizonte


N , en el estado x.

JNs (x)

Coste suboptimo del problema de optimizacion del MPC con horizonte N , en el estado x.

JN c ,Np (x)

Coste optimo del problema de optimizacion del MPC en el estado


x, con horizonte de control Nc y horizonte de prediccion Np .

JNMc ,Np (x)

Coste optimo del problema de optimizacion del MPC en el estado


x, con horizonte de control Nc , horizonte de prediccion Np y coste
terminal VM (x).

J
(x)

J (x)
MPC

Coste optimo, con horizonte infinito, en el estado x.


Coste asociado a la evolucion del sistema controlado por el MPC.

uF (k)

Secuencia optima, solucion del problema de optimizacion del MPC


con horizonte N , en el instante k.

x (k + j|k)

Estado del sistema predicho para el instante k+j a partir del estado
xk , utilizando el modelo de prediccion.

u (k + j|k)

Actuacion futura correspondiente al instante k + j de la secuencia


de actuaciones considerada en el instante k, uF (k).

xh (i + j|j)

Estado del sistema predicho para el instante i + j a partir del instante j, considerando el sistema controlado por la ley de control
u = h(x).

(x, u)
f

()

(f (x, u)) (x), siendo xk+1 = f (xk , uk ) el modelo del sistema.


Funcion inversa. Es una funcion tal que f 1 f (x) = x

f n ()

Funcion resultante de la composicion n veces de la funcion f (), es


decir, tal que f n (x) = f (f n1 (x)), siendo f 1 (x) = f (x)

Vecindad del origen dada por {x IRn : kxk } (el orden se


infiere del contexto).

INDICE GENERAL

AB

Diferencia de Pontryagin entre los conjuntos A IRn y B IRn .


Viene dada por {c IRn : b + c A, b B}.

AB

Suma de Minkowski de dos conjuntos A IRn y B IRn . Viene


dada por {c IRn : a A, b B|c = a + b}.

A\B

representa el conjunto de estados que pertenecen a A pero no a B.

Q()

Conjunto a un paso del conjunto a un paso. Vease la definicion en


la seccion A.3.

Ki (X, )

Conjunto controlable en i pasos al conjunto . Vease la definicion


en la seccion A.3.

Ci (X)

Conjunto admisible en i pasos. Vease la definicion en la seccion A.3.

Si (X, )

Conjunto estabilizable en i pasos al conjunto . Vease la definicion


en la seccion A.3.

IR+
Acr
onimos

Conjunto de n
umeros reales no negativos.

MPC

Control predictivo basado en modelo.

LQR

Regulador lineal cuadratico.

CLF

Funcion de Lyapunov de control.

ISS

Estabilidad (o estable) entrada a estado.

Captulo 1
Introducci
on
1.1.

Introducci
on al control predictivo

Esta tesis se centra en la estabilidad y robustez de una tecnica denominada genericamente control predictivo basado en modelo o MPC 1 . Esta estrategia tambien se
conoce como control por horizonte deslizante, por ser esta la forma en la que se aplican
las actuaciones.
El MPC se enmarca dentro de los controladores optimos, es decir, aquellos en los
que las actuaciones responden a la optimizacion de un criterio. El criterio a optimizar,
o funcion de coste, esta relacionado con el comportamiento futuro del sistema, que se
predice gracias a un modelo dinamico del mismo, denominado modelo de prediccion
(de ah el termino predictivo basado en modelo). El intervalo de tiempo futuro que se
considera en la optimizacion se denomina horizonte de predicci
on.
Dado que el comportamiento futuro del sistema depende de las actuaciones que
se aplican a lo largo del horizonte de prediccion, son estas las variables de decision
respecto a las que se optimiza el criterio. La aplicacion de estas actuaciones sobre
el sistema conducen a un control en bucle abierto. La posible discrepancia entre el
comportamiento predicho y el comportamiento real del sistema crean la necesidad
de imponer cierta robustez al sistema incorporando realimentacion del mismo. Esta
realimentacion se consigue gracias a la tecnica del horizonte deslizante que consiste en
aplicar las actuaciones obtenidas durante un periodo de tiempo, tras el cual se muestrea
el estado del sistema y se resuelve un nuevo problema de optimizacion. De esta manera,
1

Acronimo derivado del termino ingles Model Predictive Control. Dado que estas siglas son con las
que se denomina frecuentemente esta tecnica de control en la literatura, se utilizaran para designarla
a lo largo de este documento.

1.1. Introduccion al control predictivo

el horizonte de prediccion se va deslizando a lo largo del tiempo.


Una de las propiedades mas atractivas del MPC es su formulacion abierta, que
permite la incorporacion de distintos tipos de modelos de prediccion, sean lineales o no
lineales, monovariables o multivariables, y la consideracion de restricciones sobre las
se
nales del sistema. Esto hace que sea una estrategia utilizada en muy diversas areas del
control, como se pone de manifiesto en los trabajos preliminares a esta tesis (Ramrez,
Limon Marruedo, Gomez Ortega & Camacho 1999b, Gomez Ortega, Ramrez, Limon
Marruedo & Camacho 2001, Ramrez, Limon Marruedo, Gomez Ortega & Camacho
1999a). Ademas es una de las pocas tecnicas que permiten controlar sistemas con
restricciones incorporando estas en el propio dise
no del controlador.
Estas caractersticas han hecho del control predictivo una de las escasas estrategias
de control avanzado con un impacto importante en problemas de ambito industrial
(J.Qin & Badgwell 1997). En este sentido es importante resaltar que el control predictivo se ha desarrollado en el mundo de la industria, y ha sido la comunidad investigadora
la que se ha esforzado en dar un soporte teorico a los resultados practicos obtenidos.

1.1.1.

Formulaci
on del control predictivo

El control predictivo esta formado por los siguientes elementos (Camacho & Bordons
1999):
Modelo de predicci
on : es el modelo matematico que describe el comportamiento
esperado del sistema. Este modelo puede ser lineal o no lineal, en tiempo continuo
o en tiempo discreto, en variables de estado o en entrada salida.
El hecho de que el problema de optimizacion implicado se resuelva mediante el
computador, as como la tecnica de horizonte deslizante con la que se aplica la
solucion, hace que sea mas natural considerar modelos discretos que continuos.
Por ello, en lo que sigue se consideran modelos en tiempo discreto 2 . Asimismo,
dado que los modelos en el espacio de estados son mas generales que los modelos
entrada-salida, en lo que sigue se adopta dicha formulacion. Se considera ademas
que el origen es el punto de equilibrio en el que se quiere regular el sistema, lo
cual no resta generalidad pues se puede conseguir con un cambio de variables
adecuado. As el modelo de prediccion considerado tiene la forma
xk+1 = f (xk , uk )
2

Esto no supone una merma en la variedad de modelos sobre los que se puede aplicar, pues, dado que
el controlador requiere de algoritmos de optimizacion a implementar sobre un computador, utilizando
alg
un procedimiento de integraci
on de ecuaciones diferenciales se puede obtener implcitamente una
descripcion en tiempo discreto a partir del modelo en tiempo continuo.

Captulo 1. Introduccion

siendo xk IRn el estado y uk IRm las actuaciones sobre el sistema en el


instante k.
A lo largo de esta tesis, se denota x(k + j|k) al estado del sistema predicho en el
instante k + j a partir del estado conocido en el instante k. Por lo tanto
x(k + j + 1|k) = f (x(k + j|k), u(k + j|k))
siendo x(k|k) = xk . Como se puede ver, la prediccion depende ademas de la
secuencia de actuaciones aplicadas desde el instante k hasta el instante k + j, y
por lo tanto futuras.
En el contexto de control predictivo, se denomina estado terminal al estado predicho al final del horizonte de prediccion, es decir x(k + N |k).
En el caso en que el sistema presente incertidumbres, estas pueden aparecer en
el modelo de prediccion. En consecuencia, se considera su efecto en la prediccion
del comportamiento futuro del sistema, dependiendo este del valor futuro de las
incertidumbres que se consideren. A esta secuencia de incertidumbres futuras se
denomina realizacion de las mismas.
Funci
on de coste : es la funcion que indica el criterio a optimizar. Es una funcion
definida positiva que expresa el coste asociado a una determinada evolucion del
sistema a lo largo del horizonte de prediccion N . Esta funcion suele tener la forma
JN (xk , uF (k)) =

N
1
X

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

i=0

siendo L(, ) la funcion de coste de etapa y V () la funcion de coste terminal.


Estas funciones son definidas positivas.
Dado que el coste considera el comportamiento del sistema hasta un horizonte N ,
este depende del estado actual del sistema xk y de la secuencia de N actuaciones
que se aplican durante el horizonte de prediccion uF (k), siendo
uF (k) = {u(k|k), u(k + 1|k), , u(k + N 1|k)}
Restricciones : indican los lmites dentro de los cuales debe discurrir la evolucion del
sistema. La evolucion de las se
nales de un sistema no debe exceder determinadas
restricciones que, ya sea por lmites fsicos o bien por motivos de seguridad, se
imponen al sistema. Por ejemplo, los lmites de los actuadores forman parte de
estas restricciones. La necesidad, generalmente por motivos economicos, de trabajar en puntos de operacion cercanos a los lmites fsicos admisibles del sistema
han provocado la necesidad de incorporar dichas restricciones en la sntesis de los
controladores.
Estas restricciones se suelen expresar como conjuntos X y U , generalmente cerrados y acotados, en los cuales deben estar contenidos los estados del sistema y

1.1. Introduccion al control predictivo

las actuaciones3 en cada instante, de forma que


xk X
uk U

k
k

Es habitual imponer una restriccion sobre el estado terminal del sistema llama
da restriccion terminal. Esta
viene dada por un conjunto X denominado
conjunto o region terminal. As, esta restriccion tiene la forma
x(k + N |k)
Teniendo en cuenta todos estos elementos, el problema de optimizacion asociado al
controlador predictivo que se debe resolver en cada instante es:
mn JN (xk , uF (k))

uF (k)

s.a
u(k + j|k) U

j = 0, , N 1

x(k + j|k) X

j = 0, , N 1

x(k + N |k)
Este problema de optimizacion tiene como variables de decision las actuaciones a
lo largo del horizonte de prediccion y depende de forma parametrica del estado del
sistema. Una vez obtenida la solucion, seg
un la estrategia del horizonte deslizante, se
aplica la actuacion obtenida para el instante siguiente u (k|k)4 y se vuelve a resolver
en el siguiente periodo de muestreo. As la ley de control del MPC viene dada por
uk = KMPC (xk ) = u (k|k)

1.1.2.

Ventajas e inconvenientes del MPC

Los controladores predictivos han tenido un notable exito en el campo de la industria


as como en la comunidad investigadora. Esto se debe a las propiedades que tienen estas
tecnicas de control, no exentas, por otro lado, de desventajas (Camacho & Bordons
1999, Mayne, Rawlings, Rao & Scokaert 2000).
Entre las ventajas del MPC se pueden destacar:
3

Tambien se pueden considerar restricciones que relacionen estados y entradas, si bien, en la formulacion tpica del MPC no se suelen a
nadir.
4
A lo largo de esta tesis, el superndice indica que el valor es el optimo del problema de minimizacion asociado.

Captulo 1. Introduccion

Formulacion en el dominio del tiempo, flexible, abierta e intuitiva.


Permite tratar con sistemas lineales y no lineales, monovariables y multivariables
utilizando la misma formulacion del controlador.
La ley de control responde a criterios optimos.
Permite la incorporacion de restricciones en la sntesis del controlador.
De todas estas ventajas, sin duda la mas importante es la posibilidad de incorporar
restricciones en el calculo de las actuaciones, aspecto que las tecnicas clasicas de control
no permiten.
Entre las desventajas de esta tecnica de control se pueden citar las siguientes:
Requiere el conocimiento de un modelo dinamico del sistema suficientemente
preciso.
Requiere un algoritmo de optimizacion, por lo que solo puede implementarse por
computador 5 .
Requiere un alto coste computacional, lo que hace difcil su aplicacion a sistemas
rapidos.
Hasta hace relativamente poco, no se poda garantizar la estabilidad de los controladores, especialmente en el caso con restricciones. Esto haca que el ajuste de
estos controladores fuese heurstico y sin un conocimiento de como podan influir
los parametros en la estabilidad.
Resulta muy compleja la consideracion de incertidumbres en
Merece la pena destacar que el control predictivo es una tecnica muy potente que
permite formular controladores para sistemas complejos y con restricciones. Esta potencia tiene un precio asociado: el coste computacional y la sintonizacion del controlador.
Recientes avances en el campo del MPC proveen un conocimiento mas profundo de estos controladores, obteniendose resultados que permiten relajar estos requerimientos.
As por ejemplo, se han establecido condiciones generales para garantizar la estabilidad (Mayne 2001), condiciones bajo las cuales se puede relajar la optimalidad del
controlador garantizando su estabilidad (Scokaert & Mayne 1998) y se han desarrollado algoritmos eficientes para la resolucion del problema (Biegler 1998).
5

Para evitar esta necesidad, se han utilizado aproximaciones neuronales del controlador realizadas
fuera de lnea (Gomez Ortega 1994, Parisini & Zoppoli 1995) , o bien se ha recurrido al calculo
explcito del controlador cuando este es posible, como en (Ramrez 2002, Bemporad, Morari, Dua &
Pistikopoulos 2000).

1.2.

1.2. Motivacion de la investigacion

Motivaci
on de la investigaci
on

El campo del control predictivo se puede dividir en dos areas: el control predictivo
de sistemas lineales y de sistemas no lineales. La facilidad y sencillez de tratamiento
de los sistemas lineales y la existencia de herramientas eficientes de analisis hicieron
que este area tomase un protagonismo inicial. Sin embargo, la incorporacion de las
restricciones en el controlador hacen que el sistema en bucle cerrado sea no lineal, por
lo que estas herramientas de analisis dejaron de ser u
tiles.
As, el area de control predictivo no lineal ha ido tomando una importancia creciente en los u
ltimos a
nos, y como consecuencia, un n
umero creciente de resultados
y publicaciones han aparecido en la literatura. Todo este desarrollo ha provocado un
conocimiento cada vez mas profundo de la estabilidad y robustez de esta tecnica de control, resolviendose problemas existentes y apareciendo nuevos retos. Entre los problemas
que se consideran maduros se encuentra la estabilidad de los controladores. Gracias a
recientes trabajos como (Mayne et al. 2000), se conocen procedimientos de ajuste del
controlador para garantizar la estabilidad del mismo, pero quedan aspectos interesantes
que tratar como el estudio del dominio de atraccion de los controladores, su desempe
no,
tecnicas que permitan mejorar la implementacion de los mismos, formulacion para el
seguimiento de trayectorias, etc.
Otro importante campo abierto de investigacion es el analisis y sobre todo el dise
no
de controladores predictivos robustos. La madurez alcanzada en la estabilidad ha suscitado una revision de la robustez a la luz de esta. Esto ha permitido detectar deficiencias
de los controladores propuestos, apareciendo nuevas formas de plantear el problema del
control robusto. Quiza la mas relevante sea la formulacion en bucle cerrado. Esto ha
motivado la aparicion de nuevos controladores y por lo tanto de nuevos problemas que
resolver.
En este contexto se enmarca la investigacion fruto de la cual ha surgido esta tesis,
cuyos objetivos se detallan a continuacion.

1.3.

Objetivos y estructura de la tesis

El objetivo de esta tesis se puede situar en la profundizacion en el conocimiento de


la estabilidad y robustez de los controladores predictivos de sistemas no lineales sujetos
a restricciones. El analisis llevado a cabo se fundamenta en la teora de Lyapunov (y
sus variantes) y en la teora de los conjuntos invariantes. Estas dos teoras conjugadas
proveen el soporte teorico para comprender en profundidad la estabilidad del control
predictivo con restricciones, con o sin incertidumbres.

Captulo 1. Introduccion

As, a la luz de estas, se han analizado los distintos aspectos del control predictivo: el dise
no de controladores estabilizantes, el analisis de su robustez y el dise
no de
controladores robustos. Fruto de este analisis han surgido las ideas que se presentan y
desarrollan en esta tesis.
El desarrollo de la tesis, y en consecuencia el presente documento, sigue la estructuracion que se indica a continuacion (vease la figura 1.1), donde se mencionan las
aportaciones originales de la misma:
En el captulo 2 se hace un recorrido por las distintas formulaciones existentes de
los controladores predictivos en relacion a la estabilidad. El objetivo del captulo
es poner de manifiesto el origen de la perdida de estabilidad de los controladores
predictivos, y el camino seguido hasta recuperarla. Tambien se hace un recorrido
por los resultados existentes en la literatura sobre el analisis de robustez de los
controladores predictivos y sus formulaciones robustas.
El captulo 3 se centra en el analisis y el dise
no de controladores MPC estabilizantes. Para ello se parte del estudio de la formulacion general del MPC
propuesta en (Mayne et al. 2000). A partir de esta, se presentan dos nuevos
controladores basados en el aumento del horizonte de prediccion y en la consideracion de un coste terminal cuasi-infinito. A continuacion se pone de manifiesto
que ambos controladores mejoran el comportamiento del sistema. As mismo, se
analizan tecnicas encaminadas a una mejora en la implementacion de los controladores predictivos: la suboptimalidad y la eliminacion de la restriccion terminal,
obteniendose nuevos resultados.
Continuando con el analisis de los controladores predictivos, en el captulo 4 se
estudia el dominio de atraccion de estos y se proponen tecnicas para su aumento.
Estas tecnicas tienen un denominador com
un: aumentar el dominio de atraccion
sin aumento considerable del coste computacional. Se proponen procedimientos
de ajuste del controlador encaminados a este fin y se presentan dos controladores
nuevos basados en una restriccion terminal contractiva. En el primero, la restriccion esta basada en invariantes positivos y en el segundo, dicha restriccion se
basa en una secuencia de conjuntos invariantes de control. Este u
ltimo ha sido

publicado en (Limon Marruedo, Alamo & Camacho 2002a).


A partir del captulo 5, la tesis se centra en la robustez de los controladores
predictivos, comenzando por el analisis de la estabilidad de los controladores
predictivos nominales en presencia de incertidumbres en la planta. As, se hace
una primer analisis basado en la continuidad Lipschitz del coste optimo y la
teora de Lyapunov y cuyos resultados se han publicado en (Limon Marruedo,

Alamo
& Camacho 2002c). A raz de estos, se incorpora un concepto novedoso
en el contexto del control predictivo: la estabilidad entrada a estado. Esta teora
permite el analisis de la robustez del MPC de una manera sencilla y permite
generalizar resultados anteriores.

10

1.3. Objetivos y estructura de la tesis

En el captulo 6 se propone un nuevo controlador MPC robusto. Este controlador


parte de una acotacion de las discrepancias que existen entre el comportamiento
de la planta y la evolucion predicha por el modelo. A partir de esta, se propone un
procedimiento sencillo para garantizar la satisfaccion robusta de las restricciones y
ademas la convergencia del controlador, gracias a la estabilidad entrada a estado.
Los resultados obtenidos han dado como fruto la publicacion (Limon Marruedo,

Alamo
& Camacho 2002b).
En el captulo 7 se propone un procedimiento para estimar la acotacion de las
discrepancias entre la planta y el modelo de una forma local. Dicha acotacion
depende del estado del sistema y de la actuacion aplicada sobre el mismo. Esto
da lugar a las denominas regiones de evolucion incierta, que permiten calcular en
lnea acotaciones de las discrepancias. Estas regiones, incorporadas en la formulacion del problema, dan lugar a un nuevo controlador MPC robusto. Este con
trolador se ha publicado en (Limon Marruedo, Bravo, Alamo
& Camacho 2002).
En el captulo siguiente se abordan las denominadas formulaciones del MPC en
bucle cerrado. Se parte de un analisis de la estabilidad y factibilidad de los controladores min-max en bucle cerrado y se extienden estos resultados a la garanta
de estabilidad en caso de incertidumbres acotadas. Se pone de manifiesto un procedimiento para garantizar la estabilidad y factibilidad a partir de una restriccion
estabilizante impuesta sobre un controlador formulado en bucle abierto. Esto da
lugar a un nuevo controlador robusto basado en una restriccion estabilizante
contractiva, que se obtiene a partir de una secuencia de invariantes de control
robustos.
Por u
ltimo se presentan conclusiones de esta tesis y futuras lneas de investigacion.
Con el fin de articular el documento, los controladores propuestos se han aplicado
sobre un mismo banco de ensayo: un reactor continuamente agitado (CSTR) muy
utilizado en la literatura.
Esta tesis se complementa mediante los apendices: en el primero se presenta un
compendio de resultados sobre la teora de estabilidad y teora de los conjuntos invariantes utilizadas a lo largo de la tesis. El fin de este apendice es hacer un balance
de los conocimientos necesarios para el analisis de la estabilidad y robustez de los
controladores predictivos.
En el segundo apendice se presenta el modelo del reactor utilizado en los ejemplos,
y en el tercer apendice se trata del analisis de la continuidad del coste optimo basado
en la sensibilidad del problema de optimizacion.
Con el fin de facilitar la lectura del documento se presentan a continuacion un
diagrama con la estructura del mismo

Captulo 1. Introduccion

11

Captulo 6
MPC ISS
con factibilidad
robusta

Captulo 2

Captulo 3

Estabilidad
y robustez del
MPC

Nuevas
formulaciones
del MPC

Captulo 5

Captulo 7

Apndice A

Captulo 4

Anlisis de
robustez del
MPC nominal

MPC robusto
basado en
regiones de
evolucin incierta

Teora de
Lyapunov y teora
de conjuntos
invariantes

Aumento del
dominio de
atraccin

Captulo 8
MPC robusto
basado en
invariantes
robustos

Fundamentos

Anlisis y diseo
de controladores
MPC nominales

Anlisis
de
robustez

Figura 1.1: Organizacion de la tesis

Anlisis y diseo
de controladores
MPC robustos

12

1.3. Objetivos y estructura de la tesis

Captulo 2
Estabilidad y robustez del control
predictivo basado en modelo
2.1.

Introducci
on

En este captulo se hace un recorrido por la evolucion del control predictivo desde
la perspectiva de la estabilidad y de la robustez. Comienza poniendo de manifiesto el
origen de la perdida de la garanta de estabilidad en las formulaciones originales del
controlador. Este hecho apareca como un problema importante y una merma de los
beneficios de esta tecnica de control. La incorporacion de la teora de Lyapunov y la
teora de conjuntos invariantes arroja una nueva luz sobre el problema. Esto provoca
la aparicion de trabajos que profundizan en el conocimiento y solucion del mismo, los
cuales se recogen en una seccion del captulo.
La evolucion de este estudio termina en la presentacion de la denominada formulacion general del control predictivo. Esta formulacion viene a recoger la esencia de
los controladores con estabilidad garantizada y tal y como se muestra, resuelve los
problemas que originalmente provocaron la perdida de la garanta de estabilidad.
A continuacion se hace un balance de los principales resultados en la robustez de
controladores predictivos, centrandose en el caso de sistemas no lineales, por ser esta
el area objeto del estudio realizado.
Antes de adentrarse en el captulo, merece la pena destacar que el recorrido por la
estabilidad y robustez de los controladores MPC que se va a exponer, se hace a la luz
de la teora de estabilidad de Lyapunov y de la teora de los conjuntos invariantes. Por
ello, a lo largo del captulo se hacen numerosas referencias al apendice A, en el cual se
13

14

2.2. Controladores predictivos en la industria.

recopilan los principales resultados en estos campos.

2.2.

Controladores predictivos en la industria.

El control predictivo ha tenido una evolucion peculiar en la disciplina del control en


tanto en cuanto ha sido una estrategia en la cual el campo industrial ha ido por delante
de la comunidad investigadora. Si bien los controladores predictivos tienen su origen en
el control optimo (Propoi 1963, Lee & Markus 1967, Kwon & Pearson 1977), nuevas y
mas avanzadas formulaciones surgieron en el seno de la industria, principalmente en la
industria petroqumica y de procesos. La necesidad de controlar procesos en puntos de
operacion lmites con el objetivo de optimizar el proceso productivo llevo a la aparicion
de controladores predictivos basados en modelos sencillos, orientados a la resolucion
de los problemas de control asociados, tales como la consideracion de restricciones,
incertidumbres y no linealidades. Entre otras formulaciones destacan las siguientes:
IDCOM o MPHC : (Identification-Command o Model Predictive Heuristic Control )
propuesto en (Richalet, Rault, Testud & Papon 1978), utiliza como modelo de
prediccion la respuesta impulsional (FIR), funcion de coste cuadratica, y restricciones en las entradas y salidas. El algoritmo de optimizacion es heurstico.
DMC : (Dynamic Matrix Control ) propuesto en (Cutler & Ramaker 1980), utiliza
como modelo de prediccion la respuesta ante escalon, lo cual limita su aplicacion a
plantas estables, considera un coste cuadratico penalizando el esfuerzo de control
y no considera restricciones en la optimizacion.
QDMC : (Quadratic Dynamic Matrix Control ) propuesto en (Garca & Morshedi
1986), surge de la extension del DMC al caso con restricciones. Este controlador
forma parte de la denominada segunda generacion de controladores predictivos,
en los que el problema de optimizacion asociado se resuelve utilizando la programacion matematica. Establece dos tipos de restricciones: duras y blandas,
permitiendo la violacion de estas u
ltimas durante alg
un periodo de tiempo.
SMOC : (Shell Multivariable Optimizing Control ) propuesto en (Marquis & Broustail
1988), forma parte de la tercera generacion de controladores predictivos. Permite
la utilizacion de modelos en espacios de estados e incorpora observadores y modelos de perturbaciones. Introduce tambien restricciones duras, blandas y con
niveles de prioridad.
GPC : (Generalized Predictive Control ) propuesto en (Clarke, Mohtadi & Tuffs 1987a,
Clarke, Mohtadi & Tuffs 1987b), utiliza como modelo de prediccion la formulacion
CARIMA, que incorpora una perturbacion modelada como ruido blanco. Incorpora restricciones y existen resultados asociados a la estabilidad.

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

15

Se han propuesto otras formulaciones de controladores predictivos tales como el


RMPCT, el PCT o el PFC. Una lectura mas profunda sobre todos estos controladores
se puede encontrar en (Camacho & Bordons 1999), donde se analizan tanto en aspectos
practicos, como en los relativos a la estabilidad y robustez.
En la mayora de estos controladores, la estabilidad no esta garantizada, requiriendose un ajuste especfico para cada sistema de una forma heurstica y sin garantas de
exito. Por ello, se establecen reglas practicas de ajuste, como la eleccion de un horizonte
de prediccion del orden del tiempo de establecimiento de la planta en sistemas estables.
El problema de la estabilidad no estaba resuelto en general y resultaba de hecho
una suerte de barrera psicologica que los investigadores en control predictivo ni siquiera
intentaban superar 1 , produciendose un vaco teorico que mermaba las caractersticas
de estos controladores.

2.3.

El problema de la estabilidad: optimalidad no


implica estabilidad

La ley de control obtenida en un controlador predictivo surge de la optimizacion


de un criterio relacionado con el comportamiento del sistema, en el que se penaliza
tanto el error respecto al punto de equilibrio como el esfuerzo de control necesario para
alcanzar dicho equilibrio. Contrariamente a lo que dicta el sentido com
un, el hecho
de que la actuacion aplicada sea optima no garantiza que el sistema en bucle cerrado
alcance el punto de equilibrio tal y como se desea. El problema de la estabilidad tiene su
origen en el desarrollo propio de los controladores predictivos: la necesidad de utilizar
un horizonte de prediccion finito e invariante en el tiempo y la estrategia de horizonte
deslizante.
El origen de los controladores predictivos esta en el control optimo en el cual se
pretende calcular la ley de control u = K (x) que minimiza el coste de regular el
sistema al punto de equilibrio a lo largo de toda la evolucion del mismo. As, la funcion
de coste a optimizar es:
J (xk ) =

L(x(k + i|k), K (x(k + i|k)))

i=0
1

Morari en (Morari 1994) hace la siguiente afirmacion en relacion a la estabilidad de los controladores predictivos the recent work has removed this technical and to some extent psycologycal barrier
(people did not even try) and started wide spread efforts to tackle extensions of these basic problems
with the new tools.

16

2.3. El problema de la estabilidad: optimalidad no implica estabilidad

y el problema de optimizacion a resolver viene dado por


mn

K (x)

J (xk )

s.a
u(k + j|k) U

j 0

x(k + j|k) X

j 0

siendo x(k + j|k) la prediccion del estado del sistema en el instante k + j a partir del
estado en xk . Los conjuntos U y X definen las restricciones, de forma que X es un
conjunto acotado, U compacto y ambos contienen el origen en su interior.
Este problema de control, bajo ciertas condiciones de observabilidad relacionadas
con la funcion de coste de etapa 2 , estabiliza asintoticamente todo estado en cual exista
una solucion con un coste asociado acotado. De hecho, todo punto asintoticamente
estabilizable, se puede estabilizar por esta estrategia de control.
El problema del control optimo se puede resolver utilizando dos tecnicas: la primera
se deriva del principio de optimalidad de Bellman (Bellman 1957, Bryson & Ho 1969),
seg
un el cual

J
(x) = mn{L(x, u) + J
(f (x, u))| f (x, u) X }
uU

siendo la ley de control la solucion de este problema de optimizacion en cada estado


K (x) = u (x). El conjunto X es el conjunto de estados asintoticamente estabilizables al origen de una forma admisible, y por lo tanto el conjunto estabilizable en
infinitos pasos al origen X = S (X, {0}). Es en este conjunto en el que esta definido

J
(x).
La solucion de este problema se puede obtener a partir de las ecuaciones de HamiltonJacobi-Bellman, cuya resolucion es muy compleja, si no imposible, salvo en casos especiales como el problema de regulacion de un sistema lineal sin restricciones con una
funcion de coste de etapa cuadratica, que da lugar al regulador lineal cuadratico o LQR
(Bryson & Ho 1969).
Otro procedimiento para resolver este problema es la aplicacion del calculo variacional, que conduce a las ecuaciones de Euler-Lagrange. La gran diferencia entre ambas
resoluciones es que en las ecuaciones de H-J-B la solucion es la ley de control, conduciendo a soluciones globales y en bucle cerrado, mientras la formulacion de E-L conduce a
soluciones locales y en bucle abierto, si bien la resolucion de estas ecuaciones es mas
2

La condicion de observabilidad consiste en L(x, u) lk(h(x), u)k siendo 1 y h(x) una

funcion detectable con el modelo, y garantiza que si JN


(xk ) 0 cuando k , entonces xk 0
(Keerthi & Gilbert 1988).

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

17

sencilla que la de H-J-B. Un analisis mas exhaustivo, pero con un caracter didactico,
sobre control optimo puede encontrarse en (Nevistic 1997).
La dificultad en la resolucion de este problema llevo a adoptar soluciones practicas

que hiciesen mas sencilla su realizacion. Estas


ideas son basicamente las siguientes:

Horizonte finito y fijo : considerando un horizonte finito, el problema de optimizacion


toma la forma habitual del control predictivo:
mn JN (xk , uF (k))

uF (k)

s.a
u(k + j|k) U

j = 0, , N 1

x(k + j|k) X

j = 0, , N 1

x(k + N |k)
donde el coste a optimizar
JN (xk , uF (k)) =

N
1
X

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

i=0

siendo V (x) una funcion que penaliza el coste estado final de la prediccion (estado terminal), denominada funcion de coste terminal. Al conjunto al que se
restringe dicho estado se denomina region terminal.
La principal ventaja de la adopcion del horizonte finito reside en que el problema
de optimizacion tiene la forma de un problema de programacion matematica,
el cual admite solucion numerica gracias a los algoritmos existentes (Luenberger
1989). Notese que el coste computacional de la resolucion de este problema puede
ser muy elevado si el modelo es no lineal.
Estrategia de horizonte deslizante : seg
un esta tecnica, en cada periodo de muestreo se resuelve el problema de optimizacion y se aplica tan solo la actuacion
obtenida para el siguiente periodo de muestreo. En el siguiente periodo de muestreo
se toma un nuevo estado del sistema y se repite la operacion. Esto dota de realimentacion a la formulacion basada en el problema de optimizacion en bucle
abierto, lo cual le confiere cierto grado de robustez.

El problema de control optimo con horizonte finito i se puede resolver mediante el


problema de programacion dinamica asociado:

(f (x, u))| f (x, u) Xi1 }


Ji (x) = mn{L(x, u) + Ji1
u

18

2.3. El problema de la estabilidad: optimalidad no implica estabilidad

siendo J0 (x) = V (x) y X0 = . De la solucion de este problema se deriva la ley de


control Ki (x) = u . El conjunto Xi1 es el conjunto de estados que pueden ser llevados
por una ley de control admisible siguiendo una trayectoria admisible hasta el conjunto
en i 1 pasos. Por tanto este conjunto es el conjunto controlable en i 1 pasos, es
decir, Xi1 = Ki1 (X, ) 3 . Este problema de optimizacion es factible en el conjunto
Xi = Ki (X, ), siendo este el dominio de definicion del controlador Ki (x) y por lo
tanto de Ji (x).
Considerese un estado inicial tal que el problema de optimizacion con horizonte N
es factible, es decir, x0 XN . Entonces, aplicando sobre el sistema la actuacion optima
u0 = KN (x0 ), el estado evoluciona a x1 . En ese instante, la actuacion optima viene
dada por la ley de control optima con un horizonte N 1, por tanto u1 = KN 1 (x1 ).
Esto se debe al principio de optimalidad de Bellman. Entonces, en el instante k, la
actuacion optima vendra dada por uk = KN k (xk ), que es el controlador optimo para
conducir al sistema en N k pasos al conjunto terminal .
En consecuencia, el horizonte de prediccion se va reduciendo en cada instante, hasta el instante N en el cual el sistema alcanza la region terminal . En esta region,
el problema de optimizacion dinamica no esta definido, requiriendose un controlador
alternativo.
Sin embargo, en el control predictivo la estrategia de horizonte deslizante y horizonte
finito e invariante hace que siempre se aplique el controlador con horizonte N . Por lo
tanto, la ley de control del MPC es invariante en el tiempo y viene dada por
uk = KMPC (xk ) = KN (xk )
Esto hace que la convergencia del controlador optimo con horizonte finito se pierda,
pues no se reduce el horizonte y este controlador no garantiza que el sistema evolucione
hacia el punto de equilibrio, ni siquiera que alcance la region terminal.
Una segunda consecuencia es la posible perdida de la factibilidad del problema.
En efecto, el hecho de que el problema tenga solucion factible en el instante k (xk
KN (X, )) no garantiza la factibilidad del problema en el instante k+1. Lo que s garantiza el controlador predictivo es que xk+1 pertenece al conjunto KN 1 (X, ). El conjunto
KN 1 (X, ) no tiene por que estar contenido en KN (X, ) (salvo en el caso en que el
conjunto sea un conjunto invariante positivo o de control). Por lo tanto puede ocurrir
que el estado xk+1 este en el conjunto KN 1 (X, ) pero no este contenido en KN (X, ),
por lo que el problema de optimizacion no tendra solucion factible.
3

El conjunto controlable en i pasos, Ki (X, ) viene dado por:


Ki (X, ) = {x0 X : para todo k = 0, , i 1, uk U tal que xk X, y xi }
En el caso en que no hubiese restriccion terminal equivale a considerar = X, por lo que en este
caso, Xi = Ki (X, X) = Ci (X) que es el conjunto admisible. Vease la seccion A.3.

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

19

Por tanto, a pesar de que en cada instante se aplica una actuacion optima, en el
sentido que optimiza un coste y satisface unas restricciones, esta actuacion no garantiza
ni la factibilidad ni la convergencia del sistema en bucle cerrado.
Esta perdida de la estabilidad supuso un grave problema de los controladores predictivos, haciendo necesario un ajuste del controlador particular para cada sistema con
el fin de garantizar la estabilidad, con el temor a
nadido sobre como poda influir la
variacion de un parametro sobre esta. Por ello los controladores predictivos contaban
entre sus desventajas la dificultad del ajuste.
La comunidad investigadora tomo el reto del analisis de estabilidad de los controladores predictivos, que dio como fruto una serie de formulaciones que garantizan la
estabilidad.

2.3.1.

Un ejemplo ilustrativo

Para ilustrar como el MPC con restriccion terminal no garantiza la estabilidad, se


va a considerar un sistema lineal correspondiente a un doble integrador muestreado
con Tm = 1s. Su modelo es xk+1 = Axk + Buk siendo

A=

1,0 1,0

B=

0,0 1,0

0,5

1,0

y esta sujeto a las restricciones


x1 [5, 5]
x2 [5, 5]
u [0,3, 0,3]

Este sistema se va a controlar con un MPC con horizonte de prediccion N = 4, y se va


a considerar un coste de etapa cuadratico
L(x, u) = xT Qx + uT Ru
siendo

Q=

0,01

0,0

0,0

0,01

R=1

y no se a
nade coste terminal. En el ejemplo se va a considerar una region terminal
= {x IR2 : kxk 1}

20

2.4. Controladores predictivos con estabilidad garantizada

x2

K1
K2

K3
K4

0
x1

Figura 2.1: Evolucion de un sistema controlado por un MPC sin garanta de estabilidad

que no es un invariante positivo del sistema. Notese que conjunto en que este controlador es factible es K4 (X, ).
En la figura 2.1 se muestran los conjuntos controlables desde 1 paso hasta 4 pasos.
Dado que la region terminal no es un invariante positivo del sistema, estas regiones
no tienen por que estar anidadas y, de hecho, no lo estan. Esto hace que puedan
existir estados iniciales factibles para los cuales el controlador no estabiliza el sistema,
perdiendose en alg
un instante la factibilidad (vease el recuadro aumentado). Notese
que esto ocurre a pesar de que el problema es inicialmente factible, es decir, que existe
una secuencia admisible que conduce el sistema hacia . Sin embargo, estas actuaciones
no son las que proporciona el controlador MPC.
Esto no quiere decir, como tambien se muestra en la figura, que el controlador no
estabilice al sistema en ciertos estados iniciales. El problema es que no se sabe a priori
cuales son.

2.4.

Controladores predictivos con estabilidad garantizada

El rapido desarrollo de los controladores predictivos supuso un reto en la comunidad


investigadora para dar un soporte teorico bajo el cual se garantizase la estabilidad. Esto

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

21

dio lugar a una serie de formulaciones con estabilidad garantizada, cuyo denominador
com
un es la utilizacion de la teora de Lyapunov, y en particular, el coste optimo como
funcion de Lyapunov. Estas formulaciones se pueden agrupar de la siguiente forma:

MPC con restricci


on terminal de igualdad : fue propuesto para garantizar estabilidad del problema LQR con restricciones en (Kwon & Pearson 1977) y extendido en (Keerthi & Gilbert 1988) a sistemas no lineales con modelo en espacio de
estados, en tiempo discreto, sujetos a restricciones. La estabilidad se garantiza
imponiendo como restriccion terminal
x(k + N |k) = 0
bajo ciertas condiciones de controlabilidad y observabilidad del sistema. En este
caso, la funcion de coste optimo es estrictamente decreciente con el tiempo, por
lo que es una funcion de Lyapunov del sistema.
En (Mayne & Michalska 1990), se formula este controlador para sistemas en
tiempo continuo y se relajan las condiciones para garantizar la estabilidad.
En (Chisci, & Mosca 1994, Bemporad, Chisci & Mosca 1995) se extiende esta
condicion a sistemas lineales descritos por un modelo CARMA, sin restricciones.
En este caso, la restriccion terminal se traduce en una condicion sobre las salidas
y las entradas del sistema.
MPC con coste terminal : la estabilidad se logra incorporando en la funcion de
coste, un termino que penalice el estado terminal mediante el denominado coste
terminal. En (Bitmead, Gervers & Wertz 1990) se propone, para sistemas lineales
sin restricciones un coste terminal cuadratico cuya matriz de ponderacion se
obtiene de la resolucion de una ecuacion de Riccati.
En (Rawlings & Muske 1993), en el caso de un sistema lineal estable con restricciones politopicas, se propone tomar como coste terminal el coste infinito
resultante de aplicar la actuacion nula.
En (Alamir & Bornard 1995) se utiliza esta tecnica para sistemas no lineales
tomando como coste terminal el coste de un controlador localmente estabilizante
durante un periodo suficientemente largo.
MPC con restricci
on terminal de desigualdad : los problemas computacionales
que supone el cumplimiento de una restriccion de igualdad, llevaron a relajar esta
condicion, extendiendo la restriccion terminal a una vecindad del origen. As, se
establece una restriccion terminal de desigualdad de la forma
x(k + N |k)
siendo el conjunto el denominado conjunto terminal.

22

2.4. Controladores predictivos con estabilidad garantizada

Esta estrategia fue propuesta en (Michalska & Mayne 1993) para sistemas no
lineales en tiempo continuo y sujeto a restricciones. En este trabajo, se elige como region terminal un invariante positivo del sistema no lineal controlado por un
controlador local. Ademas, para garantizar la factibilidad se introduce como variable de decision el horizonte de prediccion. El controlador as formulado garantiza
que conduce al sistema a la region terminal, donde el sistema pasa a regularse
por el controlador local que lo estabiliza al origen. De ah que este controlador
se denomine controlador MPC dual. Las bondades de esta formulacion son tan
notables, que marco las futuras lneas de investigacion en estabilidad.
En (Chisci, Lombardi & Mosca 1996) se extiende el control predictivo dual al
caso de sistemas lineales con restricciones.
En esta misma lnea, se enmarcan los denominados controladores predictivos
con estabilidad forzada, en los que esta se garantiza por la satisfaccion de una
restriccion estabilizante. En (De Oliveira Kothare & Morari 2000) se presenta
el denominado control predictivo contractivo. Esta estrategia esta basada en el
trabajo anterior (Yang & Polak 1993) e incorpora como restriccion terminal una
restriccion que fuerza al estado terminal x(k + N |k) a tener una norma inferior
a la del estado actual xk
kx(k + N |k)kP < kxk kP
La secuencia obtenida se aplica en bucle abierto desde el instante k hasta hasta
el k + N , en el que se vuelve a resolver el problema. Esta formulacion tiene dos
problemas: el funcionamiento en bucle abierto durante el horizonte de prediccion,
que se resuelve con un procedimiento de realimentacion extra, y el hecho de que
la factibilidad esta garantizada tan solo en una vecindad del origen, que puede
ser peque
na y no se conoce a priori.
En (Primbs, Nevistic & Doyle 2000), se garantiza la estabilidad forzando que una
funcion de control de Lyapunov conocida a priori, sea estrictamente decreciente
V (x(k + 1|k)) < V (xk )
Esta restriccion se impone en la actuacion para el instante actual uk , y garantiza
estabilidad para todo horizonte de prediccion N 1.
MPC con coste y restricci
on terminal : esta es la estructura en la que se enmarcan las mas recientes formulaciones del MPC. Es importante decir que en algunas
de las formulaciones propuestas en las que se garantiza estabilidad con la adicion
u
nicamente de una funcion de coste terminal, implcitamente se impone que la
prediccion alcance una vecindad del origen. En consecuencia se deben considerar
tambien como formulaciones con restriccion terminal.
El primer trabajo en el que se garantiza estabilidad incorporando ambos ingredientes es en (Sznaier & Damborg 1987) en el cual, para sistemas lineales sujetos
a restricciones politopicas, se considera como controlador local el LQR y como

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

23

region terminal un invariante asociado. En este trabajo se demuestra que para


cada estado, existe un horizonte de prediccion suficientemente largo, tal que la
solucion optima garantiza la satisfaccion de la restriccion terminal, lo que permite
eliminarla.
Esta misma lnea se sigue en (Parisini & Zoppoli 1995) para sistemas no lineales en tiempo discreto con restricciones. Se calcula un controlador lineal basado
en la linealizacion del modelo en torno al punto de equilibrio (analogamente al
procedimiento presentado en (Michalska & Mayne 1993) para el calculo de la
region terminal) y se toma como coste terminal una funcion proporcional a la
funcion de Lyapunov asociada al sistema linealizado en torno al origen en bucle
cerrado V (x) = axT P x. La estabilidad se garantiza demostrando que existe
una combinacion de la constante a y del horizonte de prediccion N tal que el
estado terminal resultante del problema de optimizacion (sin restriccion terminal) alcanza un invariante positivo del sistema y la funcion de coste optimo es
estrictamente decreciente.
En (De Nicolao, Magni & Scattolini 1998) se propone como coste terminal el
coste infinito incurrido por el sistema controlado por el controlador local. Esta
opcion es una aproximacion razonable al coste optimo en el estado terminal, por
lo que el coste del MPC sera proximo al del controlador optimo. La imposicion
de que el estado terminal alcance la region terminal se impone implcitamente
en la suposicion de que la funcion de coste terminal solo esta definida en la
region terminal, tomando un valor infinito fuera de ella. La region terminal es un
invariante positivo del sistema controlado por el controlador local. En (Magni, De
Nicolao, Magnani & Scattolini 2001), se propone una formulacion implementable
del controlador predictivo anterior. Se basa en considerar como funcion de coste
terminal una aproximacion truncada del coste infinito. Pero lo mas destacable de
este trabajo es que considera un horizonte de prediccion mayor que el de control
gracias a la incorporacion del controlador local.
En (Jadbabaie, Yu & Hauser 2001) se establece la estabilidad de un controlador predictivo para sistemas sin restricciones, tomando como coste terminal
una funcion de Lyapunov de control y sin restriccion terminal. En este trabajo
se demuestra que existe una vecindad del origen en la cual la solucion optima
del problema sin restricciones, garantiza la satisfaccion de la restriccion terminal. As, de una forma implcita, se considera dicha restriccion. La eliminacion
de la restriccion terminal hace que el controlador se formule como un problema
de optimizacion sin restricciones, lo que permite su implementacion en sistemas
rapidos, como sistemas aeronauticos.
La formulacion del MPC incluyendo explcitamente la restriccion terminal y la
funcion de coste terminal no se alcanza hasta el denominado MPC con horizonte
quasi-infinito (Chen & Allgower 1998b). Para el calculo de estos, se propone un
controlador local lineal con una funcion de Lyapunov cuadratica asociada tal que
garantiza que el coste terminal es una cota superior del coste optimo del estado
terminal controlado por el controlador local. De ah la denominacion horizonte

24

2.5. Formulacion general del MPC: necesidad de la region terminal y el coste terminal

cuasi-infinito, pues el coste optimo del MPC es una cota superior del coste optimo
(con horizonte infinito).

2.5.

Formulaci
on general del MPC: necesidad de la
regi
on terminal y el coste terminal

Como se ha mostrado anteriormente, las formulaciones del control predictivo con


garanta de estabilidad han ido evolucionando hasta llegar a la necesidad de la region
terminal y del coste terminal de una u otra forma. Sorprendentemente, todas las estrategias responden a unas condiciones generales de estabilidad. Este importante resultado
es el que se propuso en (Mayne et al. 2000). Este trabajo, a juicio del autor de esta
tesis, constituye una piedra angular del control predictivo y una referencia obligada
para futuros desarrollos en este campo.
En este trabajo se analizan las formulaciones existentes de controladores predictivos
con estabilidad garantizada y se establece que el control predictivo con coste terminal
y restriccion terminal puede, bajo ciertas condiciones, estabilizar asintoticamente un
sistema no lineal sujeto a restricciones. Ademas se establecen condiciones suficientes
sobre la funcion de coste terminal y la region terminal para garantizar dicha estabilidad.
Estas condiciones son las siguientes:
La region terminal debe ser un conjunto invariante positivo admisible del sistema. Es decir, que debe existir una ley de control local u = h(x) tal que estabiliza
el sistema en y ademas la evolucion del sistema y las actuaciones en dicho conjunto son admisibles.
El coste terminal V (x) es una funcion de Lyapunov 4 asociada al sistema regulado
por el controlador local, tal que
V (f (x, h(x))) V (x) L(x, h(x))
para todo x . Por lo tanto, la ley de control local estabiliza asintoticamente
el sistema.
Esta formulacion del predictivo se denomina a lo largo de esta tesis formulaci
on
general del MPC. Esto se debe al hecho de que, como se demuestra en el artculo,
4

En el artculo (Mayne 2001), inspirado por (Jadbabaie et al. 2001), se extiende esta condicion a
funciones de Lyapunov de control (CLF), que son mas generales que las funciones de Lyapunov. Vease
la seccion A.2.5.

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

25

todas las formulaciones existentes hasta entonces se reducen a casos particulares de


estas condiciones.
Considerando el analisis realizado en la seccion 2.3, se puede ver como las hipotesis
impuestas resuelven los problemas existentes y garantizan la estabilidad.
Necesidad de la regi
on terminal invariante : Si la region terminal es un invariante positivo, entonces el conjunto de estados factibles es el conjunto de estados estabilizables en N pasos XN = SN (X, ). Considerese xk XN . Dada la ausencia
de discrepancias entre el modelo de prediccion y el sistema, se tiene que el estado
al que evoluciona el sistema es el predicho xk+1 = x(k + 1|k). Este estado puede
alcanzar la region en N 1 pasos, luego xk+1 XN 1 . Gracias a que es un
conjunto invariante, este conjunto tiene la propiedad que XN 1 XN y por lo
tanto XN es un conjunto invariante positivo del sistema en bucle cerrado, lo que
garantiza la factibilidad del controlador en todo instante.
Necesidad del coste terminal como funci
on de Lyapunov : bajo esta condicion
se garantiza que el coste optimo es estrictamente decreciente, y por lo tanto es
una funcion de Lyapunov del sistema. Esto garantiza la estabilidad asintotica del
sistema en bucle cerrado con restricciones.
La monotona de la funcion de coste optimo se basa en la existencia de una
secuencia de actuaciones factibles uF (k+1) basada en la solucion optima obtenida
en el instante anterior uF (k). Esta secuencia no es mas que los N 1 terminos
que restan de la secuencia anterior mas la actuacion obtenida de la ley de control
local. As, la diferencia entre el coste de esta secuencia, JN (xk+1 ), y el coste
optimo anterior, JN (xk ), es
n

JN (xk+1 ) JN (xk ) = L(xk , u (k|k)) + L(x (k + N |k), h(x (k + N |k)))

+V (f (x (k + N |k), h(x (k + N |k)))) V (x (k + N |k))

La incorporacion del coste terminal garantiza que el termino entre llaves es negativo, y por lo tanto la secuencia factible tiene un coste menor que el optimo
anterior, por lo que la solucion optima tambien lo tendra. En consecuencia
JN (xk+1 ) JN (xk ) L(xk , KMPC (xk ))
y por lo tanto el coste optimo es una funcion de Lyapunov que decrece a lo
largo de la evolucion del sistema, lo que garantiza la estabilidad asintotica. Esta
demostracion se hace con mas detalle en el captulo siguiente, dedicado al analisis
de estabilidad del MPC.
Es importante resaltar que, aun en el caso en el que el controlador garantice la
estabilidad en bucle cerrado del sistema, la trayectoria seguida por el mismo no es

26

2.5. Formulacion general del MPC: necesidad de la region terminal y el coste terminal

optima, en el sentido de que puede existir otra cuyo coste total a lo largo de la misma
sea inferior. Esto se deriva del horizonte finito considerado en la formulacion del problema. As, la trayectoria del sistema difiere de la trayectoria resultante de la secuencia
optima calculada en un instante (consecuencia derivada del principio de optimalidad
de Bellman).
Un resultado muy interesante relacionado con la estabilidad de los controladores
MPC es el denominado MPC suboptimo que se presenta en (Scokaert, Mayne &
Rawlings. 1999). En este trabajo se demuestra que es la factibilidad de la solucion
la que garantiza la estabilidad, siempre que esta garantice un decrecimiento de la funcion de coste, no siendo necesaria la optimalidad de la solucion obtenida al problema de
optimizacion. Esta consideracion es trascendental para la implementacion de controladores MPC en sistemas no lineales. En efecto, el problema de optimizacion implicado
en el MPC es en general no convexo, y por lo tanto el problema puede presentar mnimos locales. La obtencion del mnimo global es sumamente costosa comparada con la
obtencion de un mnimo local, y tanto mas comparada con la obtencion de una solucion
que simplemente presente un menor coste que la anterior.

2.5.1.

Un ejemplo ilustrativo

Retomando el ejemplo del doble intergrador utilizado en la seccion 2.3.1, se va a


aplicar sobre el sistema un controlador MPC siguiendo la formulacion general, es decir,
a
nadiendo un coste terminal y una region terminal adecuados.
Para ello se ha calculado un controlador LQR para el sistema con las mismas matrices de ponderacion que el MPC y, asociado a el, un invariante positivo . Dada la
optimalidad del LQR, la funcion de Lyapunov asociada V (x) = xT P x, siendo

P =

0,0511 0,1001

0,1001 0,4668

representa el coste infinito de la evolucion del sistema en bucle cerrado para todos los
estados de . En consecuencia satisface las condiciones de estabilidad.
En la figura 2.2 se muestran los conjuntos estabilizables desde 1 paso hasta 4 pasos.
En este caso, al contrario que el mostrado anteriormente, los conjuntos estan anidados,
por lo que S3 (X, ) S4 (X, ) lo que garantiza la factibilidad. Ademas el coste
terminal a
nadido garantiza la convergencia asintotica del sistema al origen, como se
muestra en la figura.
En la figura 2.3 se muestran las curvas de nivel de la funcion de coste optimo, junto
con las trayectorias del sistema. Se puede comprobar que el coste es una funcion de

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

27

Lyapunov del sistema observando como la evolucion del sistema es tal que el coste
asociado decrece con el tiempo.

S4

S2

S1

2
6

0
x1

Figura 2.2: Evolucion de un sistema controlado por un MPC con garanta de estabilidad

2
6

0
x1

Figura 2.3: Evolucion del coste optimo en las trayectorias del sistema

28

2.6. Robustez de los controladores MPC

2.6.

Robustez de los controladores MPC

2.6.1.

Introducci
on

La estabilidad de los controladores predictivos se garantiza bajo la hipotesis de que


el modelo de prediccion coincide con el modelo del sistema a controlar. Sin embargo,
todo sistema tiene asociado un error con el modelo que representa su dinamica. Por ello,
para que un controlador sea aplicable debe poseer ciertas caractersticas de robustez.
En el caso en que no hubiese incertidumbres, si se aplica la secuencia de actuaciones
obtenida en bucle abierto, el sistema evoluciona de una manera admisible hasta alcanzar
el conjunto terminal. Sin embargo, las posibles discrepancias existentes entre el modelo
de prediccion y el sistema real pueden hacer que su evolucion viole las restricciones o
bien que el controlador deje de ser factible o incluso que se pierda la convergencia del
sistema en bucle cerrado. El hecho de que el MPC se aplique mediante la estrategia de
horizonte deslizante hace que la actuacion se recalcule en cada periodo de muestreo, lo
que dota de realimentacion al sistema y por lo tanto de cierta robustez.
El estudio de la robustez se puede realizar desde dos puntos de vista: el del analisis
de robustez y el de la sntesis de controladores robustos. En el primero, se parte de un
controlador MPC obtenido para un sistema sin considerar el efecto de las incertidumbres en su dise
no y se determina que grado de incertidumbres es capaz de soportar
dicho controlador conservando la estabilidad del sistema.
El segundo enfoque es el de la sntesis, por el cual se establecen formulaciones
del controlador que consideran en el calculo de las actuaciones el efecto que tienen las
incertidumbres sobre el sistema. El objetivo es por lo tanto garantizar, para cierto grado
de incertidumbres, la estabilidad, la satisfaccion de las restricciones y, a ser posible,
alguna especificacion sobre el desempe
no.
A continuacion se trata el primer aspecto, abordandose la sntesis de controladores
robustos en el siguiente apartado.

2.6.2.

An
alisis de robustez de los controladores MPC

En el caso de sistemas lineales, existen numerosas tecnicas de analisis de robustez de


sistemas sin restricciones, pero pocas en el caso de sistemas con restricciones, pues, en
este caso el sistema en bucle cerrado puede ser no lineal. En (Zafiriou 1990) se presentan
condiciones suficientes (y tambien necesarias) para garantizar la estabilidad nominal

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

29

y robusta del MPC. En (Genceli & Nikolau 1993) se dan condiciones suficientes de
estabilidad robusta del DMC y se analiza el comportamiento del sistema en presencia de
incertidumbres. En (Primbs et al. 2000) se presenta un procedimiento para comprobar
la robustez de controladores predictivos de sistemas lineales con restricciones en las
entradas, basado en la solucion de una serie de desigualdades matriciales lineales (LMI).
La robustez de los controladores predictivos de sistemas no lineales se ha analizado
siguiendo dos lneas: una en la que se explota la optimalidad del controlador, y otra
basada en la teora de Lyapunov.
En la lnea basada en la optimalidad del controlador, en (Glad 1987) se presenta un
compendio de resultados de estabilidad robusta de controladores optimos para sistemas
no lineales en tiempo continuo, afines en la actuacion y sin restricciones. En este trabajo
se considera u
nicamente incertidumbres en las actuaciones de dos tipos: incertidumbres
en la ganancia, de forma que la actuacion real ur = (u) es una funcion (estatica) de
la actuacion que se aplica, e incertidumbres aditivas, de forma que ur = u + (x). El
principal resultado de este trabajo es la demostracion de que el controlador optimo
estabiliza al sistema con incertidumbres de ganancia contenidas en el sector (1/2, ),
es decir tal que
1 2
u < u(u) <
2
Este resultado se demuestra para el caso de una entrada y se extiende al caso de
m
ultiples entradas, garantizandose la robustez en otro sector.
Este trabajo se extendio en (Geromel & Da Cruz 1987) al caso de sistemas discretos afines en la actuacion, sin restricciones y con incertidumbres en las actuaciones,
considerando tambien horizonte infinito. En este trabajo se analiza la estabilidad del
sistema ante incertidumbres en la ganancia del controlador, obteniendose bajo ciertas
condiciones, un margen de estabilidad, que en el caso de una u
nica entrada, se reduce
al sector (0,5, ), como en los sistemas continuos. En este trabajo tambien se analiza
el caso de incertidumbres aditivas en la ganancia.
En (De Nicolao, Magni & Scattolini 1996) se extiende el trabajo de (Geromel &
Da Cruz 1987) al analisis de robustez de sistemas discretos sin restricciones controlados con un MPC con restriccion terminal. Si bien el trabajo original esta formulado
para el caso de restriccion terminal nula, esta se puede extender al caso general pues
esta basado en el principio de optimalidad (De Nicolao et al. 1998). Siguiendo un desarrollo practicamente paralelo al desarrollado en (Geromel & Da Cruz 1987), se obtienen
resultados semejantes.
Otra forma de demostrar la robustez del MPC general basada en la optimalidad
es la presentada en (Magni & Sepulchre 1997). En este trabajo se demuestra la optimalidad inversa del MPC: el controlador obtenido de un MPC con horizonte finito

30

2.6. Robustez de los controladores MPC

y estabilidad garantizada para un sistema sin restricciones se puede considerar como


un controlador optimo con horizonte infinito considerando un coste de etapa modificado. En consecuencia, todo controlador MPC hereda las propiedades de robustez de los
controladores optimos, y en particular, el margen de incertidumbre en la ganancia de
(0,5, ).
El segundo enfoque para el analisis de robustez de los controladores es la teora de
Lyapunov, y se basa en la estabilidad asintotica (o bien, exponencial) que presentan estos controladores. La idea basica consiste en garantizar que el coste optimo sigue siendo
una funcion de Lyapunov estrictamente decreciente a pesar de las incertidumbres. Es
por tanto una herramienta general y no aprovecha la optimalidad de los controladores,
sin embargo permite el analisis en presencia de restricciones, no consideradas en el
enfoque de la optimalidad. Es importante resaltar que la presencia de restricciones en
el controlador, en especial sobre los estados, impone un grado de complejidad mayor a
la robustez del controlador, pues se debe garantizar la satisfaccion de las restricciones
en presencia de las incertidumbres.
En (Scokaert, Rawlings & Meadows 1997) se analiza la estabilidad robusta de los
controladores MPC con horizonte finito para sistemas en tiempo discreto con restricciones bajo incertidumbres aditivas que decaen con el tiempo. Este analisis se orienta
a la estabilidad del MPC cuando se conecta en cascada un observador para estimar
los estados del sistema, suponiendo que el error en la estimacion de los estados decae
con el tiempo. Basandose en las propiedades de los sistemas exponencialmente estables
y bajo la continuidad Lipschitz de la ley de control, se demuestra que el controlador
MPC soporta cierto grado de incertidumbre.
En (De Nicolao et al. 1998) se presenta una formulacion estable del MPC y ademas
se analiza la estabilidad del controlador siguiendo la lnea de (Scokaert et al. 1997),
considerando incertidumbres aditivas que decaen y cierta condicion de continuidad
sobre el coste optimo.
Todos estos trabajos demuestran que los controladores predictivos tienen cierto
grado de robustez de forma inherente, es decir, que ante cierto grado de incertidumbres,
el sistema mantiene la estabilidad. Otro problema distinto es la sntesis de controladores
considerando las incertidumbres que presenta el sistema, el cual se trata en la siguiente
seccion.

2.6.3.

Formulaciones robustas del MPC

Dado el alto grado de complejidad de los controladores predictivos (que incorporan


optimalidad y satisfaccion de restricciones en el control de sistemas no lineales), la in-

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

31

corporacion de las incertidumbres en el dise


no es muy costosa, por lo que la mayor parte
de las formulaciones propuestas (con estabilidad garantizada) constituyen soluciones
meramente teoricas.
La forma habitual de considerar las incertidumbres en predictivo es incorporando
todas las posibles realizaciones de estas en la solucion del problema de optimizacion.
As, si el sistema incierto responde a un modelo
xk+1 = f (xk , uk , wk )
siendo wk el vector de incertidumbres tal que wk W IRp . La prediccion de la
evolucion del sistema incierto a lo largo del horizonte depende de la realizacion de las
incertidumbres wF = {wi } con wi W para i = 0, , N 1. Considerando esta, el
controlador tiene la forma
mn JN (xk , uF (k), W )

uF (k)

s.a
u(k + j|k) U

j = 0, , N 1

x(k + j|k) X

j = 0, , N 1, wF

x(k + N |k)

wF

siendo el estado predicho


x(k + j + 1|k) = f (x(k + j|k), u(k + j|k), wk+j )
con x(k|k) = xk .
Notese que las restricciones en la evolucion de los estados se deben satisfacer de una
forma robusta, es decir, para todas las posibles realizaciones de las incertidumbres. La
incorporacion de restricciones en el estado complica notablemente el problema, pero,
a
un en el caso en el que no haya restricciones sobre los estados, la restriccion terminal
siempre esta presente en el problema de optimizacion pues se a
nade para garantizar la
estabilidad del controlador.
El coste a optimizar JN (xk , uF (k), W ) puede basarse en las predicciones nominales
del sistema o bien considerar el efecto de las incertidumbres tomando, por ejemplo, la
peor situacion posible. Esto da lugar a la denominada formulacion min-max
JN (xk , uF (k), W ) = m
ax
w
F

(N 1
X

L(x(k + i|k), u(k + i|k), wk+i ) + V (x(k + N |k))

i=0

Otra formulacion consiste en a


nadir un termino en la funcion de coste de etapa que
pondera la posible incertidumbre, como en la formulacion H .

32

2.6. Robustez de los controladores MPC

Esta forma de considerar las incertidumbres es intuitiva y razonable, pero puede


conducir a soluciones muy conservadoras. Este conservadurismo radica en la naturaleza
misma del control predictivo: la prediccion en bucle abierto.
En efecto, el control predictivo surge como solucion practica e implementable de
controladores optimos, evitando la resolucion del problema de programacion dinamica
gracias a la resolucion en cada instante del problema de optimizacion asociado. Eso
hace que, en vez de obtener una ley de control uk = KN (xk ), se obtiene una secuencia
actuaciones asociada al estado actual, xk . En el caso en que haya incertidumbres, la
factibilidad del problema se debe garantizar para todas las posibles incertidumbres.
Por tanto, para que la secuencia obtenida sea factible, debe garantizar que la evolucion
del sistema incierto satisfaga las restricciones para toda posible incertidumbre. En
consecuencia, el conjunto de estados para los cuales existe una solucion factible Xba ,
puede ser muy reducido.
Entre los controladores predictivos que se pueden englobar en esta formulacion
esta el controlador min-max propuesto en (Campo & Morari 1987) para sistemas lineales, y el controlador dual robusto presentado en (Michalska & Mayne 1993). En
este trabajo se presenta el denominado MPC dual y se propone un procedimiento
que garantiza robustez. Este procedimiento parte de un controlador local robusto con
un invariante positivo robusto asociado . Sin embargo, considera en el problema de
optimizacion un conjunto , de forma que la secuencia optima para la region
conservadora garantice que el estado terminal incierto este contenido en . Esta idea
permite garantizar la satisfaccion robusta de la restriccion terminal.
Si se considera, en vez de una secuencia de actuaciones, una ley de control en la
optimizacion, la actuacion a aplicar en cada estado predicho para una determinada
realizacion de las incertidumbres, depende del estado en que se encuentra y en consecuencia, de la realizacion de las incertidumbres. Por tanto la actuacion puede compensar el efecto de las mismas con el fin de satisfacer las restricciones. En consecuencia, el
conjunto de estados que pueden satisfacer las restricciones de este modo Xbc es mucho
mayor, de forma que
Xba Xbc
La incorporacion de esta idea en el controlador MPC da lugar a la denominada
formulacion en bucle cerrado y fue introducida en (Scokaert & Mayne 1998, Lee &
Yu 1997) en el contexto del min-max. En esta formulacion, el problema de control no
esta planteado en terminos de una secuencia de actuaciones, sino de una secuencia de
leyes de control
F = {u, 1 (x) , N 1 (x)}
lo cual hace que el problema de optimizacion implicado sea infinito-dimensional. En
consecuencia estos controladores constituyen (por ahora) una herramienta meramente

Captulo 2. Estabilidad y robustez del control predictivo basado en modelo

33

teorica (Mayne et al. 2000). Sin embargo, estas consideraciones han permitido enfocar
mejor el problema de la robustez, dando un giro en la investigacion en este campo.
Esta formulacion se sigue tambien en (Magni, Nijmeijer & van der Shaft 2001),
donde se propone un controlador H con horizonte deslizante para un sistema no
lineal, afn en la actuacion y sin restricciones.
Dentro del control predictivo en bucle cerrado se pueden considerar otras formulaciones como por ejemplo el trabajo presentado en (Kothare, Balakrishnan &
Morari 1996). En este se propone un controlador que estabiliza una planta incierta
tal que se puede expresar en cada instante como una combinacion convexa de una serie
de plantas lineales y que presenta restricciones en los estados y en las actuaciones. En
esta formulacion se considera como variable de optimizacion un controlador lineal que
estabiliza todas las plantas y se puede plantear como un LMI que se resuelve en cada
instante.
Tambien se pueden considerar dentro de los controladores en bucle cerrado los trabajos (Bemporad 1998) y (Chisci, Rossiter & Zappa 2001) en los cuales se parametriza
la ley de control como uk = Kxk + vk , siendo Kx una ley de control que estabiliza la
planta nominal. El controlador predictivo se formula en terminos de vk . Las restricciones en los estados y en las actuaciones son politopicas, y por lo tanto, tras el cambio de
variables siguen siendo politopicas. Esta tecnica mejora el condicionamiento numerico
del problema de optimizacion y en cierta forma, el controlador a
nadido reduce el efecto
de las incertidumbres, pues a
nade cierta realimentacion en las predicciones en bucle
abierto.
Ademas, en (Chisci & Zappa 1999) se a
nade una restriccion adicional con el fin
de garantizar la satisfaccion robusta de las incertidumbres. Esta idea se generaliza al
caso no lineal en (Kerrigan 2000), donde se analiza utilizando la teora de conjuntos
invariantes la satisfaccion robusta de las restricciones.
Todas estos controladores reducen el conservadurismo de la formulacion en bucle
abierto, pero siguen siendo mas conservadoras que la formulacion en bucle cerrado. A
su favor tienen que son controladores mas facilmente implementables.

2.7.

Conclusiones

En este captulo se ha hecho un repaso de las formulaciones del control predictivo,


especialmente enfocado al analisis de la estabilidad y la robustez, por ser estos los
aspectos que se tratan en esta tesis. Existen en la literatura publicaciones en las que

34

2.7. Conclusiones

se hace un balance y se resumen las distintas estrategias de controladores predictivos


existentes. Entre ellas caben citar (Camacho & Bordons 1999, Garca, Prett & Morari
1989, Mayne 2000, De Nicolao, Magni & Scattolini 2000, Chen & Allgower 1998a,
Mayne et al. 2000, Mayne 2001).
Se ha puesto de manifiesto que el origen de la perdida de estabilidad de los controladores predictivos radica en la formulacion con horizonte finito, fijo y aplicado en
modo deslizante, y como las soluciones propuestas en la literatura, resumidas en la
denominada formulacion general del predictivo, resuelven los problemas derivados de
esta formulacion.
Tambien se muestra la robustez de los controladores predictivos desde dos puntos
de vista: el analisis de la estabilidad del MPC ante incertidumbres en la planta y el
dise
no de controladores MPC robustos. La incorporacion de las incertidumbres en el
dise
no de controladores es uno de los grandes temas de investigacion abiertos en MPC,
en los que se han realizado avances significativos, como la formulacion en bucle cerrado
del MPC.
En el captulo siguiente se presenta con mayor profundidad la denominada formulacion general del MPC que sirve de base para un posterior analisis de la estabilidad de
estos controladores. En este captulo se introducen nuevas formulaciones del MPC con
estabilidad garantizada que son aportaciones originales de esta tesis. Ademas se analizan aspectos como el comportamiento y la optimalidad de los controladores. Tambien
se analiza la posibilidad de garantizar estabilidad en ausencia de la restriccion terminal,
obteniendose una serie de resultados originales y generalizando otros existentes.

Captulo 3
Nuevas formulaciones del MPC con
estabilidad garantizada
3.1.

Introducci
on

El control predictivo basado en modelo es una de las pocas tecnicas de control que
permite la incorporacion de restricciones en su formulacion. Ademas esta estrategia de
control es valida para un amplio abanico de sistemas, tanto lineales como no lineales
y ha tenido una importante repercusion en la industria.
Un aspecto primordial en el dise
no de un controlador es la garanta de estabilidad
del sistema en bucle cerrado. El estudio de la estabilidad en el MPC es un aspecto que
ha ido evolucionando hasta llegar al estado actual, en el que se considera una materia
madura. Esto se debe en gran parte al establecimiento de unas condiciones generales
(validas para la mayora de sistemas) bajo las cuales se garantiza la estabilidad del
controlador MPC (Mayne et al. 2000). Estas condiciones parten de una formulacion
del controlador que incluye el coste terminal as como la restriccion terminal y que se
denomina a lo largo de este documento, formulacion general del MPC.
Este captulo comienza estableciendo las condiciones de estabilidad del MPC general, pues sirven de base para las posteriores secciones. A continuacion se presentan
nuevas formulaciones del MPC con estabilidad garantizada: en la primera de ella se
propone un controlador MPC con un horizonte de prediccion mayor que el horizonte
de control. Esta es una aportacion original de esta tesis y supone una generalizacion
de la formulacion propuesta en (Magni, De Nicolao, Magnani & Scattolini 2001).
Otro nuevo controlador propuesto en este captulo considera un coste terminal basa35

36

3.1. Introduccion

do en una funcion de Lyapunov del sistema, el cual, ademas de garantizar estabilidad,


mejora la optimalidad del controlador. Este coste es una aproximacion finita al coste
(con horizonte infinito) del sistema regulado por el controlador local, y por ello se ha
denominado coste terminal con horizonte cuasi-infinito (o simplemente coste terminal
cuasi-infinito). Este resultado es una generalizacion del controlador propuesto en (De
Nicolao et al. 1998).
A continuacion se realiza un analisis del comportamiento de los controladores desde
el punto de vista de la optimalidad, donde se demuestra que las dos formulaciones
anteriores mejoran la optimalidad del controlador.
Tambien se analiza la estabilidad de los controladores en caso de la suboptimalidad del controlador, y se imponen unas condiciones mas suaves que las originalmente
propuestas en (Scokaert et al. 1999).
Por u
ltimo se analizan bajo que condiciones se puede eliminar la restriccion terminal
conservandose la estabilidad y se caracteriza una region en la cual se garantiza la estabilidad asintotica. Este analisis es una generalizacion de trabajos anteriores (Parisini &
Zoppoli 1995, Jadbabaie et al. 2001) a la formulacion general del MPC, constituyendo
una aportacion original de esta tesis. Estos resultados han dado lugar a la publicacion

(Limon Marruedo, Alamo


& Camacho 2003) que esta pendiente de revision.
As, la organizacion de este captulo se ilustra en el siguiente diagrama:
Controlador MPC
con mayor
horizonte de
prediccin
Formulacin
general del MPC

Estabilidad
MPC subptimo
Anlisis de
optimalidad

Controlador MPC
con coste
terminal
cuasi-infinito

Fundamentos

Nuevos
controladores MPC

Eliminacin
de la restriccin
terminal

Anlisis
de los nuevos
controladores

Aspectos de
implementacin

Figura 3.1: Organizaci


on del captulo

Es importante indicar que todo el analisis llevado a cabo en este captulo, y en


general a lo largo de la tesis, se basa en la teora de Lyapunov y en la teora de conjuntos
invariantes, cuyos resultados mas importantes estan recopilados en el apendice A. Cabe
resaltar que para el analisis y el dise
no de los controladores se considera que el sistema
no presenta incertidumbres. En captulos posteriores se analizara la robustez de los
controladores MPC.

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

3.2.

37

Descripci
on del sistema

A lo largo de este captulo, se considera un sistema descrito por un modelo no lineal


en tiempo discreto de la forma
xk+1 = f (xk , uk )

(3.1)

siendo xk IRn el estado del sistema y uk IRm el vector de actuaciones sobre el


sistema en el instante k. El sistema presenta un punto de equilibrio en el origen, por
tanto f (0, 0) = 0.
Cada una de estas se
nales estan confinadas en una serie de restricciones a lo largo
del tiempo. Estas restricciones tienen la forma
xk X
uk U

(3.2)
(3.3)

donde el conjunto X se considera generalmente cerrado y U compacto. Para que el


sistema pueda evolucionar al punto de equilibrio, los conjuntos X y U deben contener
el vector nulo en su interior.

3.3.

Formulaci
on general del MPC

Como se comento en el captulo anterior, la evolucion que han experimentado los


controladores MPC en busca de la estabilidad ha convergido en la denominada formulacion general del MPC 1 . Esta formulacion establece unas condiciones suficientes de
estabilidad del MPC genericas que, como demuestran en el artculo, re
une la mayora
de las formulaciones existentes hasta la fecha. En esta seccion se hace un analisis de
estabilidad de esta formulacion analogo al realizado en (Mayne et al. 2000), que sirve
de introduccion e inicio al analisis de los controladores posteriores.
La formulacion del problema de optimizacion del MPC es
mn JN (xk , uF (k))

uF (k)

s.a
u(k + j|k) U

j = 0, , N 1

x(k + j|k) X

j = 0, , N 1

x(k + N |k)
1

De esta forma se refiere en este documento a la formulacion del MPC propuesta en (Mayne
et al. 2000).

38

3.3. Formulacion general del MPC

siendo el funcional a optimizar


JN (xk , uF (k)) =

N
1
X

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

i=0

El vector uF (k) denota la secuencia de N actuaciones futuras


uF (k) = {u(k|k), , u(k + N 1|k)}
siendo u(k + j|k) la actuacion en el instante k + j calculada en el instante actual k.
Ante esta secuencia de actuaciones, la evolucion predicha del sistema en el instante
k + j + 1 a partir del modelo (3.1) se denota como x(k + j + 1|k) y viene dada por
x(k + j + 1|k) = f (x(k + j|k), u(k + j|k))
de modo que x(k|k) = xk es el estado muestreado del sistema en el instante actual.
El problema de optimizacion es un problema de programacion matematica cuyas
variables de decision son las componentes del vector de actuaciones futuras uF (k) de
tama
no N m. Si las funciones que intervienen en el problema de optimizacion, f (, ),
V () y L(, ) son funciones continuas y si el conjunto U es compacto y los conjuntos
X y son cerrados, entonces se puede garantizar que el problema de optimizacion, en
caso de ser factible, presenta al menos un mnimo (Mayne et al. 2000).
Este problema depende del estado del sistema en cada instante, siendo por tanto
un problema parametrizado en xk . La solucion del problema dependera por tanto del
valor de xk . Dado que la solucion obtenida que se aplica mediante la estrategia de
horizonte deslizante, en cada instante k se calcula la secuencia optima uF (k). De esta
secuencia tan solo se aplica la actuacion correspondiente al instante k, es decir, u (k|k)
desechandose, por tanto, el resto de la secuencia de actuaciones. Dado que esta solucion
depende del estado de la planta, la ley de control del MPC viene dada implcitamente
por
KMPC (xk ) = u (k|k)
Es interesante resaltar que, debido a la ausencia de discrepancias entre el modelo
de prediccion y el del sistema, el estado al que evoluciona el sistema es el predicho, es
decir, xk+1 = x(k + 1|k). Pero, dado que el problema a resolver depende del estado, la
actuacion optima en el instante k + j solucion en xk puede ser distinta a la actuacion
optima para ese mismo instante en xk+1 , es decir, u (k+j|k) 6= u (k+j|k+1). Por tanto,
las trayectorias optimas predichas en cada instante son distintas y, en consecuencia, la
evolucion del sistema en bucle cerrado difiere de la evolucion predicha en la resolucion
del sistema. Tan solo en el caso de horizonte infinito se verifica que la evolucion real
coincide con la predicha, por el principio de optimalidad de Bellman.

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

3.3.1.

39

Condiciones suficientes de estabilidad

La formulacion general del MPC comprende los siguientes parametros de dise


no:

Horizonte de predicci
on (N ) : es el horizonte temporal en el que se considera la
evolucion futura de la planta para el calculo de la actuacion.
Coste de etapa (L(x, u)) : es la funcion que penaliza el estado y la actuacion sobre
el sistema en el funcional a optimizar. Esta funcion es continua y definida positiva
tal que L(0, 0) = 0 y ademas L(x, u) (k(x, u)k), siendo () una funcion K .
Generalmente se impone que L(x, u) lk(x, u)k para ciertas constantes l > 0
y > 0.
Esta condicion se puede relajar tomando L(x, u) lk(g(x), u)k satisfaciendo
g(x) ciertas condiciones de observabilidad (Keerthi & Gilbert 1988).
Las funciones de coste pueden estar basadas en norma infinito, en norma 1, si
bien lo mas habitual es considerar norma 2 ponderada, lo que da lugar al coste
cuadratico
L(x, u) = xT Qx + uT Ru
siendo Q una matriz semidefinida positiva y R una matriz definida positiva.
Coste terminal (V (x)) : es la funcion que penaliza el estado terminal, es decir, el
estado predicho al final del horizonte de prediccion.
Regi
on terminal () : es un conjunto cerrado, vecindad del origen, que el estado
terminal debe alcanzar. Para garantizar esto, se impone como restriccion en el
problema de optimizacion denominada restriccion terminal.

Estos son los parametros del controlador MPC sobre los cuales se imponen condiciones para garantizar la estabilidad del sistema. En esta seccion se presentan condiciones suficientes incorporando los resultados presentados por Mayne en (Mayne 2001).
Para una mayor sencillez en la exposicion de los resultados, se incorpora la siguiente
notacion: sea (x) una funcion IRn 7 IR, en lo que sigue se denota
(x, u) = (f (x, u)) (x)
que representa el incremento que experimenta la funcion al evolucionar el sistema que
se encuentra en un estado x al aplicar una actuacion u. Analogamente se denota
[ + L](x, u) = (x, u) + L(x, u)

40

3.3. Formulacion general del MPC

Hip
otesis 3.1 (Regi
on y coste terminal) El sistema es tal que existe una vecindad
del origen X que es un conjunto invariante de control del sistema 2 y ademas tiene
asociada una funcion de Lyapunov de control (CLF) 3 V (x) tal que
mn {V (f (x, u)) V (x) + L(x, u), sujeto a f (x, u) } 0
uU

(3.4)

Esta hipotesis suele formularse en terminos de funcion de Lyapunov. Pero el concepto de CLF es mas general y engloba a las funciones de Lyapunov, dado que estas se
pueden considerar funciones de Lyapunov de control particularizadas para una cierta
ley de control. Esta generalidad se plasmara en una mayor diversidad de funciones y
sobre todo en mayores regiones invariantes. Notese tambien que toda region del tipo
= {x IRn : V (x) }
contenida en la region factible del problema (3.4) es un invariante de control del sistema.
Sea u = hV (x) la ley de control formada por las actuaciones optimas de (3.4) en
cada estado, entonces, esta condicion se puede reescribir de una forma mas compacta
como
[V + L](x, hV (x)) 0
para todo x .
A partir de las condiciones anteriormente expuestas se puede establecer el siguiente
resultado:
Teorema 3.2 (Estabilidad asint
otica) (Mayne et al. 2000)
Sea un sistema xk+1 = f (xk , uk ), tal que f (0, 0) = 0 y esta sujeto a las restricciones
x k X y uk U .
Sea un problema de optimizacion MPC con una funcion de coste terminal y una regi
on
terminal tales que satisfacen la hipotesis 3.1.
Entonces el sistema controlado por la ley de control uk = KMPC (xk ) es asintoticamente
estable con un dominio de atracci
on XN que es el conjunto de estados para los que el
problema de optimizacion es factible.

Demostraci
on:
Factibilidad:
La estabilidad se basa en probar que el conjunto factible XN es un invariante positivo
2
3

Vease la seccion A.3.


Vease la seccion A.2.5.

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

41

del sistema en bucle cerrado. El conjunto XN es el conjunto de estados para los cuales
existe una secuencia de N actuaciones admisibles tales que el sistema evoluciona dentro
de X hasta alcanzar el conjunto terminal . Este conjunto es el conjunto estabilizable
en N pasos 4 , SN (X, ). Por tanto el dominio de atraccion es XN = SN (X, ).
Sea xk SN (X, ), entonces el estado siguiente puede alcanzar en N 1 pasos,
por lo que xk+1 = x(k +1|k) SN 1 (X, ) SN (X, ). Por tanto, verifica la condicion
de invariancia y el conjunto SN (X, ) es un invariante positivo del sistema en bucle
cerrado.
Convergencia:
Se demuestra comprobando que el coste optimo es una funcion de Lyapunov del sistema
en bucle cerrado.
Sea uF (k) la solucion optima del sistema en xk , con un coste optimo JN (xk ) y una
secuencia predicha optima x (k+j|k) para j = 1, , N . Es facil comprobar que JN (xk )
es una funcion definida positiva por serlo L(, ), ya que
JN (xk ) L(xk , u (k|k)) lk(xk , u (k|k))k lkxk k
Considerese la secuencia uF (k + 1) dada por:

u (k + j|k)
u(k + j|k + 1) =
h (
V x(k + N |k + 1))

j = 1, , N 1
j=N

siendo hV () la actuacion optima de (3.4) para el coste terminal y x(k+j|k+1) el estado


predicho en el instante k + j a partir del estado xk+1 aplicando la secuencia uF (k + 1).
Notese que esta secuencia esta formada por los terminos que restan de la secuencia
optima anterior completada por la actuacion que satisface la condicion terminal (3.4).
Dado que no hay discrepancias entre el modelo de prediccion y el sistema real, se
tiene que xk+1 = x (k + 1|k). As, aplicando la secuencia uF (k + 1), el estado predicho
x(k + j|k + 1) satisface que
x(k + j|k + 1) = x (k + j|k) para j = 1, , N
Por lo tanto, x(k + j|k + 1) X para todo j = 1, , N . Ademas, de la factibilidad
de la secuencia optima se deduce que x(k + N |k + 1) y por lo tanto la actuacion
u(k +N |k +1) = hV (
x(k +N |k +1)) esta definida y es admisible y ademas satisface que
x(k + N + 1|k + 1) por la hipotesis 3.1 . De todo esto se deduce que la secuencia
uF (k + 1) es una secuencia de actuaciones factible.
4

Vease la seccion A.3.

42

3.3. Formulacion general del MPC

Sea JN (xk+1 ) el coste asociado a la secuencia factible uF (k + 1). Entonces se tiene


que
n

JN (xk+1 ) JN (xk ) = L(xk , u (k|k)) + L(


x(k + N |k + 1), hV (
x(k + N |k + 1))
+V (
x(k + N + 1|k + 1)) V (x (k + N |k))

dado que x(k + N |k + 1) = x (k + N |k) , que


x(k + N + 1|k + 1) = f (x (k + N |k), hV (x (k + N |k)))
y que hV () satisface (3.4), se deduce que
JN (xk+1 ) JN (xk ) = L(xk , u (k|k)) + [V + L](x (k + N |k), hV (x (k + N |k))
L(xk , u (k|k))
Por tanto, del principio de optimalidad se tiene que
JN (xk+1 ) JN (xk ) JN (xk+1 ) JN (xk ) L(xk , u (k|k)) lkxk k
Por tanto JN (x) es una funcion de Lyapunov y el sistema es asintoticamente estable.

Esta demostracion es la base de resultados posteriores y se divide en dos partes:


la factibilidad que garantiza que el controlador esta definido en todo instante y que
la evolucion del sistema satisface las restricciones, y la convergencia, que se deriva de
que el coste optimo es una funcion de Lyapunov. La mayora de las demostraciones de
estabilidad en el campo de predictivo siguen esta lnea.
Nota 3.3 La demostraci
on de estabilidad asintotica se basa en que el coste optimo es
una funcion de Lyapunov del sistema. Es interesante resaltar que para completar la
demostraci
on con rigor, es necesario encontrar una funcion K que acote superiormente
el coste optimo en una vecindad del origen. Esta condici
on se puede inferir de la continuidad del coste optimo. Tambien se podra derivar de la continuidad de la funcion
de coste terminal, pues para todo estado en se tiene que JN (x) V (x), como se
demostrar
a posteriormente.
A continuacion se establecen condiciones suficientes para garantizar la estabilidad
exponencial del sistema en bucle cerrado.

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

43

Corolario 3.4 (Estabilidad exponencial) (Scokaert et al. 1997)


Sea la funcion de coste tal que L(x, u) cx kxk + cu kuk
Sea la secuencia optima uF (k) para la cual existe una constante bu > 0 tal que
ku (k + j|k)k bu kxk k
Sea el modelo f (, ) para el cual existen unas constantes ax > 0 y au > 0 tales que
kf (x, u)k ax kxk + au kuk
Sea el coste terminal V (x) tal que V (x) dx kxk .
Entonces el sistema controlado por el MPC, bajo las hipotesis del teorema 3.2, es exponencialmente estable en XN .

Demostraci
on:
Del teorema 3.2 se tiene que el coste optimo JN (x) es una funcion de Lyapunov del
sistema. Ademas verifica que
J (x) lkxk
J (x, KMPC (x)) lkxk
Entonces, si existe una constante r tal que JN (xk ) rkxk k , seg
un la teora de Lyapunov el sistema sea exponencialmente estable (ver apendice A). Para ello se va a
demostrar primero que
kx(k + 1|k)k ax kxk k + au ku (k|k)k (ax + au bu )kxk k = 1 kxk k
kx(k + 2|k)k ax kx(k + 1|k)k + au ku (k + 1|k)k
(ax 1 + au bu )kxk k = 2 kxk k
..
.
kx(k + j|k)k ax kx(k + j + 1|k)k + au ku (k + j 1|k)k
(ax j1 + au bu )kxk k = j kxk k
Entonces se tiene que
JN (xk )

N
1
X
i=0
N
1
X

L(x(k + i|k), u (k + i|k)) + V (x(k + N |k))

kxk k
{cx i kxk k + cu bu kxk k } + dx N

i=0

cx

N
1
X
i=0

i + N cu bu + dx N
kxk k = rkxk k

44

3.3. Formulacion general del MPC

Las condiciones anteriores son suaves en general, salvo la impuesta sobre la secuencia
de actuaciones, que esta relacionada con su continuidad Lipschitz. Esta condicion se
satisface bajo ciertas condiciones de regularidad del problema de optimizacion. En el
apendice C se hace un analisis de esta propiedad.

3.3.2.

Ejemplo de aplicaci
on al reactor

Para ilustrar el controlador MPC general se aplica este controlador sobre el reactor
continuamente agitado que se muestra en el apendice B. Se va a considerar una funcion
de coste cuadratica
L(x, u) = xT Qx + uT Ru
siendo las matrices de ponderacion

Q=

10 0
0

R=1

Para poder aplicar esta estrategia de control, es necesario calcular un invariante


positivo del sistema as como una funcion de Lyapunov, o bien una CLF, asociada que
satisfagan la hipotesis 3.1. Como se muestra en la seccion 3.7, si el sistema linealizado en
el punto de equilibrio es controlable, se puede establecer un procedimiento sistematico
para el calculo de un invariante positivo basado en la funcion de Lyapunov del sistema
linealizado. Procediendo de esta forma se dise
na un controlador por la tecnica LQR
obteniendose el controlador uk = Kxk siendo
K=

1,6154 3,6644

para este controlador se calcula la funcion de Lyapunov V (x) = xT P x, que satisface la condicion (3.4) en la region invariante
= {x IRn : V (x) }
siendo

P =

265,8811

49,3961

49,3961

125,9963

= 9,3353

Considerando V (x) y como funcion de coste terminal y region terminal, y tomando


un horizonte de prediccion N = 5, se aplica el controlador MPC al sistema, partiendo

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

45

de diversos estados iniciales. De esta forma se ha obtenido el retrato de estados que


se muestra en la figura 3.2 en la que tambien se puede observar la region terminal
calculada para el sistema .
0.4

0.2

x2

0.2

0.4

0.6

0.8
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 3.2: Retrato de estados del reactor en bucle cerrado con N = 5.

En la figura 3.3 se muestra la evolucion a lo largo del tiempo de las se


nales del
sistema partiendo de una concentracion inicial CA = 0,4 mol/l (x1 = 0,1) y una
temperatura inicial T = 357,6 K (x2 = 0,38). Considerando un horizonte de control
N = 5, el estado inicial es factible, por lo que es asintoticamente estabilizado por
el controlador. Notese como el controlador satura la actuacion durante los primeros
instantes para no violar las restricciones impuestas.
Tal y como se demuestra en el teorema 3.2, la secuencia de valores del coste optimo
es estrictamente decreciente a lo largo de la trayectoria optima como se puede ver en
la figura 3.4.

3.4.

MPC con horizonte de predicci


on mayor que
el de control

En la formulacion general del MPC se considera como variables de decision las


actuaciones aplicadas a lo largo del horizonte de prediccion. Sin embargo, en la tradicion
de los controladores predictivos lineales se encuentra la consideracion de un horizonte de
prediccion mayor que el horizonte de control (Camacho & Bordons 1999). El horizonte

46

3.4. MPC con horizonte de prediccion mayor que el de control

0.05

x1

0
0.05
0.1
0

10

15

20

25

30

35

40

45

50

10

15

20

25

30

35

40

45

50

10

15

20

25
muestras

30

35

40

45

50

x2

0.3
0.2
0.1
0
0.1

0
0.5
1
0

Figura 3.3: Evolucion de las se


nales del reactor en bucle cerrado.
1.5

log10 J5

0.5

0.5

1.5

10

15

20

25
muestras

30

35

40

45

50

Figura 3.4: Evolucion del logaritmo decimal del coste optimo del reactor.

de control se refiere al n
umero de variables de decision consideradas en el problema de
optimizacion. Esta medida permite considerar en el controlador el comportamiento del
sistema en un horizonte mayor sin aumentar el n
umero de variables de decision, si bien
es necesario fijar las actuaciones a considerar en la porcion de horizonte de prediccion
que es mayor que el horizonte de control.
Esta medida fue traslada a sistemas no lineales en (Chen & Allgower 1997, Zheng
2000), limitandose al caso de sistemas estables. En (Magni, De Nicolao, Magnani &
Scattolini 2001) se generalizo para una formulacion particular del MPC, en la que se
considera como funcion de coste terminal el coste de la evolucion del sistema controlado

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

47

por la ley de control local u = h(x) en un horizonte finito suficientemente largo. Esta
aproximacion es una version implementable de la formulacion propuesta por los autores
en (De Nicolao et al. 1998) en la cual consideran como coste terminal el coste infinito
del sistema controlado por un controlador local.
En esta seccion se extiende la formulacion general del MPC a la formulacion con
mayor horizonte de prediccion y se establecen condiciones de estabilidad del controlador. Esta formulacion, no solo conserva las propiedades del controlador propuesto
en (Magni, De Nicolao, Magnani & Scattolini 2001), sino que ademas posee algunas
nuevas. Todas estas propiedades se analizan en secciones posteriores. Esta formulacion
y su analisis posterior son una de las contribuciones originales de esta tesis.

3.4.1.

Formulaci
on del controlador

Supongamos que el sistema satisface las siguientes hipotesis:


Hip
otesis 3.5 El sistema es tal que existe un conjunto que es un conjunto invariante
positivo del sistema controlado por una ley de control uk = h(xk ), que verifica
(i) X h = {x X : h(x) U }.
(ii) El sistema en bucle cerrado tiene una funcion de Lyapunov asociada V (x) tal que
V (f (x, h(x))) V (x) L(x, h(x)) x
Notese que esta hipotesis es la particularizacion de la hipotesis 3.1 al caso de una
funcion de Lyapunov, para la cual se conoce una ley de control estabilizante. La condicion terminal puede reescribirse como
[V + L](x, h(x)) 0

En lo que sigue se denota Lh (x) = L(x, h(x)) al coste de etapa asociado al estado
de la planta x aplicando la ley de control local u = h(x).
El funcional considerado en el MPC con un horizonte de prediccion Np y un horizonte de control Nc viene dado por
JNc ,Np (xk , uF (k)) =

NX
c 1
i=0

Np 1

L(x(k + i|k), u(k + i|k)) +

i=Nc

Lh (x(k + i|k)) + V (x(k + Np |k))

48

3.4. MPC con horizonte de prediccion mayor que el de control

Notese que en este caso las variables de optimizacion son las Nc acciones de control a
lo largo del horizonte de control. A partir de entonces se considera que el sistema se
controla con la ley de control local uk = h(xk ). Por tanto, el problema de optimizacion
se formula de la siguiente manera:
mn JNc ,Np (xk , uF (k))

uF (k)

s.a
u(k + j|k) U

j = 0, , Nc 1

h(x(k + j|k)) U j = Nc , , Np 1
x(k + j|k) X

j = 0, , Np 1

x(k + Np |k)
En este caso las predicciones se realizan de forma que
x(k + j + 1|k) = f (x(k + j|k), u(k + j|k)) j = 0, Nc 1
x(k + j + 1|k) = f (x(k + j|k), h(x(k + j|k))) j = Nc , Np 1
siendo x(k|k) = xk .
En cada instante se resuelve este problema de optimizacion y se aplica sobre el
sistema seg
un la estrategia de horizonte deslizante. Por tanto, la ley de control viene
dada por
KMPC (xk ) = u (k|k)

3.4.2.

Condiciones suficientes de estabilidad

A continuacion se va a demostrar que el nuevo controlador estabiliza asintoticamente


el sistema bajo las mismas hipotesis que el MPC general. Esto permite extender la
formulacion general del MPC a horizontes de prediccion mayores que el de control, lo
cual es una contribucion de esta tesis.

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

49

Teorema 3.6 (Estabilidad asint


otica)
Sea un sistema xk+1 = f (xk , uk ), tal que f (0, 0) = 0 y esta sujeto a las restricciones
x k X y uk U .
Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y una
regi
on terminal tales que satisfacen la hipotesis 3.5.
Entonces el sistema controlado por la ley de control uk = KMPC (xk ) con un horizonte de
predicci
on Np y un horizonte de control Nc es asintoticamente estable con un dominio de
atracci
on XNc ,Np que es el conjunto de estados para los que el problema de optimizacion
es factible.

Demostraci
on:
La demostracion es similar a la del teorema 3.2, por lo que habra razonamientos que
se infieran de esta.
Factibilidad:
Al igual que en el MPC general, se puede obtener una solucion factible u
F (k + 1) a

partir de la solucion optima anterior uF (k). Esta viene dada por

u (k + j|k)
u(k + j|k + 1) =
h(x(k + Nc |k + 1))

j = 1, , Nc 1
j = Nc

La secuencia de estados predichos obtenida al aplicar la secuencia de actuaciones


uF (k + 1) se denota x(k + j|k + 1).
Dado que el sistema no discrepa del modelo, se tiene que xk+1 = x(k+1|k). Entonces
la prediccion nominal en k + 1 a partir de la secuencia factible satisface que x(k + j|k +
1) = x (k + j|k) para j = 1, , Nc . Ademas, dado que x(k + Nc |k + 1) = x (k + Nc |k),
y que a partir de este instante se aplica la ley de control local u = h(x), se tiene que
x(k + j|k + 1) = x (k + j|k) para j = Nc + 1, , Np . Por lo tanto x(k + Np |k + 1) ,
y de la hipotesis 3.5 se tiene que la ley de control local proporciona una actuacion
admisible tal que x(k + Np + 1|k + 1) X.
Por tanto, la restriccion en el estado, as como la restriccion terminal, y la restriccion
sobre las actuaciones se satisfacen, y en consecuencia la secuencia uF (k + 1) es factible.
De aqu se deduce que para todo xk XNc ,Np , el estado siguiente xk+1 XNc ,Np ,
luego el conjunto factible XNc ,Np es un invariante positivo del sistema en bucle cerrado.
Convergencia:
Sea JNc ,Np (xk+1 ) el coste en el estado xk+1 asociado a la actuacion factible uF (k + 1),

50

3.4. MPC con horizonte de prediccion mayor que el de control

entonces dado que x (k + Np |k) y considerando la hipotesis 3.5, se tiene que


n

JNc ,Np (xk+1 ) JN c ,Np (xk ) = L(xk , u (k|k)) + Lh (


x(k + Np |k + 1))
+V (
x(k + Np + 1|k + 1)) V (x (k + Np |k))

= L(xk , u (k|k))
+[V + L](x (k + Np |k), h(x (k + Np |k)))
L(xk , u (k|k))
Por tanto, del principio de optimalidad se tiene que
JN c ,Np (xk+1 ) JN c ,Np (xk ) JNc ,Np (xk+1 ) JN c ,Np (xk ) L(xk , u (k|k))
De aqu se deduce que el coste optimo es una funcion de Lyapunov estrictamente
decreciente y, por tanto, el sistema es asintoticamente estable.
Como se comento anteriormente, esta formulacion es una generalizacion de la propuesta en (Magni, De Nicolao, Magnani & Scattolini 2001). En dicho trabajo se utiliza
como coste terminal, una version truncada del coste infinito del sistema controlado
por la ley de control local. El n
umero de terminos considerados en el coste terminal
se calcula para garantizar que el sistema en bucle cerrado sea asintoticamente estable.
Estas condiciones dan como resultados altos valores del horizonte y ademas, dicho
horizonte depende del estado terminal del sistema, y del estado inicial de la planta.
Esto es un gran inconveniente, pues la sintonizacion del controlador depende de la
evolucion del sistema. Estas desventajas se mitigan en la formulacion propuesta, en la
que se demuestra estabilidad para un coste terminal fijo.
Si bien la formulacion propuesta en (Magni, De Nicolao, Magnani & Scattolini 2001)
presenta ciertas propiedades entre las que destacan un mayor dominio de atraccion y
un mejor desempe
no debido al mayor grado de optimalidad. Esta u
ltima tan solo se
verifica en el caso de coste terminal con horizonte infinito (que es irrealizable desde un
punto de vista practico, salvo en el caso de sistemas lineales). En secciones posteriores
y en el captulo siguiente, se demuestra que la formulacion que se propone en esta tesis
conserva las propiedades del controlador anterior y ademas presenta un mayor grado
de optimalidad sin tener que recurrir a soluciones meramente teoricas.

3.4.3.

Ejemplo de aplicaci
on al reactor

El controlador MPC propuesto se aplica al reactor utilizando los parametros del


controlador (coste de etapa, region y coste terminal) presentados en el ejemplo de la
seccion 3.3.2. Considerando en este caso un horizonte de control Nc = 3 y un horizonte

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

51

0.4

0.2

x2

0.2

0.4

0.6

0.8
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 3.5: Retrato de estados del sistema en bucle cerrado.

de prediccion Np = 15, se aplica el MPC al sistema partiendo de diversos estados


iniciales, dando como resultado el retrato de estados que se muestra en la figura 3.5.
En la figura 3.6 se muestra la evolucion a lo largo del tiempo de las se
nales del
sistema partiendo de una concentracion inicial CA = 0,4 mol/l (x1 = 0,1) y una
temperatura inicial T = 357,6 K (x2 = 0,38).
0.05
0

0.05
0.1
0.15
0.2

10

15

20

25

30

35

40

45

50

10

15

20

25

30

35

40

45

50

10

15

20

25
muestras

30

35

40

45

50

x2

0.4
0.2
0

0.5

0
0.5
1

Figura 3.6: Evoluci


on de las se
nales del sistema en bucle cerrado.

52

3.5. MPC con coste terminal cuasi-infinito

Tal y como se demuestra, la secuencia de valores del coste optimo es estrictamente


decreciente a lo largo de la trayectoria optima como se puede ver en la figura 3.7.
1.5

0.5

log10 J*

0.5

1.5

2.5

10

15

20

25
muestras

30

35

40

45

50

Figura 3.7: Evolucion del logaritmo decimal del coste optimo.

Notese que manteniendo una complejidad de calculo similar a la formulacion general, se extienden los estados futuros a considerar en el controlador de 3 a 15. Esto
confiere un mejor comportamiento al sistema y un mayor dominio de atraccion como
se demostrara posteriormente.

3.5.

MPC con coste terminal cuasi-infinito

En el artculo (De Nicolao et al. 1998) se presenta una formulacion del MPC con

estabilidad garantizada. Esta


emplea como coste terminal el coste con horizonte infinito
del controlador local, es decir,
V (x) =

i=
X

L(xh (i + j|j), h(xh (i + j|j)))

i=0

siendo xh (i + j|j) la prediccion del estado del sistema en el instante i + j, controlado


por la ley de control local u = h(x), partiendo de xh (j|j) = x .
Esta eleccion de coste terminal satisface la hipotesis 3.5 pues, si la ley local es
asintoticamente estabilizable, se verifica que
V (f (x, h(x))) V (x) = L(x, h(x))
y por tanto garantiza la estabilidad asintotica del sistema en bucle cerrado. Sin embargo, esta es una solucion meramente teorica pues es practicamente imposible calcular el

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

53

coste infinito V (x) de forma analtica, salvo en el caso de sistemas lineales. Este coste
se podra calcular en lnea de forma numerica, pero el horizonte infinito hace que sea
imposible a menos que se aproxime por el coste en un horizonte finito suficientemente
largo. En este caso, podra no estar garantizada la estabilidad del controlador.
Esta limitacion se resolvio en un trabajo posterior (Magni, De Nicolao, Magnani
& Scattolini 2001) limitando el coste a un horizonte finito. Esta solucion garantiza
estabilidad para un horizonte suficientemente largo como para que sea una aproximacion suficientemente precisa. Este horizonte se fija a partir de una condicion que
depende del estado terminal predicho en cada instante y del estado en que se encuentra
el sistema. Por lo tanto depende de la evolucion del sistema, lo que la hace muy difcil de
comprobar a priori. Esta condicion, que en el artculo se presenta como una condicion
tecnica, es clave para la demostracion de la estabilidad del controlador, no estando
garantizada si esta no se cumple.
En esta seccion se presenta un coste terminal con horizonte finito de la forma5
VM (x) =

j=M
X1

Lh (xh (i + j|i)) + V (xh (i + M |i))

(3.5)

j=0

siendo V () una funcion de Lyapunov del sistema que satisface la hipotesis 3.5. Este
coste terminal se denomina coste terminal con horizonte cuasi-infinito, o simplemente
coste terminal cuasi-infinito.
Este coste terminal garantiza la estabilidad del MPC para cualquier horizonte
M 1 y ademas puede aproximar arbitrariamente bien el coste infinito. Esta formulacion conserva, como se vera, la optimalidad de la formulacion de (Magni, De Nicolao,
Magnani & Scattolini 2001) sin los problemas que esta presenta. Este controlador y
sus resultados asociados constituye una de las aportaciones originales de esta tesis.
El nuevo controlador que se presenta en esta seccion se basa en el siguiente resultado:

Lema 3.7 Sea la funcion V (x) y la regi


on tales que satisfacen la hipotesis 3.5. Sea
la funcion
VM (x) =

j=M
X1

Lh (xh (i + j|i)) + V (xh (i + M |i))

(3.6)

j=0

siendo xh (i+j|i) la predicci


on del sistema controlado por la ley de control local u = h(x)
considerando x(i|i) = x, de forma que
xh (i + j + 1|i) = f (xh (i + j|i), h(xh (i + j|i)))
5

En lo que sigue y por sencillez en la presentacion de los resultados se denota Lh (x) = L(x, h(x)).

54

3.5. MPC con coste terminal cuasi-infinito

h
Entonces la funcion VM (x) y la regi
on SM
(X, )

tambien satisfacen la hipotesis 3.5.

Demostraci
on:
h
De la teora de conjuntos invariantes se deduce que el conjunto SM
(X, ) X h es un
h
invariante positivo del sistema por serlo . Entonces, para todo x SM
(X, ) se tiene
que

VM (f (x, h(x))) VM (x) = V (xh (i + M + 1|i)) + Lh (xh (i + M |i))


Lh (x) V (xh (i + M |i))
Lh (x) + {V (xh (i + M |i)) + Lh (x(i + M |i))}
h
Dado que x SM
(X, ), entonces xh (i + M |i) , y por lo tanto por la hipotesis
3.5 se tiene que
VM (f (x, h(x))) VM (x) Lh (x)

con lo que se demuestra el lema.

Nota 3.8 Bajo las condiciones del lema 3.7, es facil demostrar que para cualquier
conjunto invariante positivo del sistema controlado por la ley de control local u = h(x),
h
SM
(X, ), la funcion de Lyapunov VM (x) y el conjunto tambien satisfacen la
hipotesis 3.5. En particular tambien se satisface con el conjunto .

La funcion VM (x) tiene una serie de propiedades que se establecen en el siguiente


teorema:

Teorema 3.9 Sea V (x) la funcion de Lyapunov de la hipotesis 3.5 y sea VM (x) la
funcion de Lyapunov definida a partir de V (x) como en el lema 3.7. Entonces se tiene
que:
(i) V (x) VM (x), para todo M 1, para todo x .
(ii) VM (x)

P
j=0

h
(X, ).
Lh (xh (i + j|i)) = V (x) siendo x(i|i) = x, para todo x SM

h
(X, ).
(iii) VM (x) VM +1 (x) para todo x SM
6

h
La region SM
(X, ) es el conjunto de estados del sistema controlado por la ley de control u = h(x)
tales que la evolucion del sistema es admisible y ademas alcanzan en M pasos. Vease la seccion A.3.

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

55

h
(iv) VM (x) V (x) VM (f (x, h(x))) V (f (x, h(x))) para todo x SM
(X, ).

Demostraci
on:
(i) De la hipotesis 3.5 se tiene que para todo x se verifica
V (xh (i + j|i)) V (xh (i + j + 1|i)) Lh (xh (i + j|i))
siendo x(i|i) = x. De aqu se deduce que
V (x) V (xh (i + M |i)) =

j=M
X1

{V (xh (i + j|i)) V (xh (i + j + 1|i))}

j=0

j=M
X1

Lh (xh (i + j|i))

j=0

Por tanto V (x) VM (x), lo que demuestra la primera afirmacion del teorema.
h
h
(ii) De la invariancia positiva de SM
(X, ), se tiene que para todo x SM
(X, )
h
implica que xh (i + j|i) SM
(X, ) para todo i 0. Entonces, aplicando el lema
3.7 se tiene que

VM (xh (i + j|i)) VM (xh (i + j + 1|i)) Lh (xh (i + j|i))


siendo xh (i|i) = x. De aqu se deduce que
j=
X
j=0

{VM (xh (i + j|i)) VM (xh (i + j + 1|i))}

j=
X

Lh (xh (i + j|i))

j=0

= V (x)
dado que el sistema controlado con la ley de control u = h(x) es asintoticamente
estable en , el termino de la izquierda se reduce a VM (x), lo que demuestra la
propiedad.
(iii) Para demostrar la tercera consecuencia basta con considerar que
VM +1 (x) VM (x) = Lh (xh (i + M |i)) + V (xh (i + M + 1|i)) V (xh (i + M |i))
= V (xh (i + M |i), h(xh (i + M |i))) + Lh (xh (i + M |i))
dado que xh (i + M |i) , de la hipotesis 3.5 se demuestra la propiedad.
(iv) La cuarta propiedad surge inmediatamente considerando que
VM (x) VM (f (x, h(x))) Lh (x) = V (x) V (f (x, h(x)))

56

3.5. MPC con coste terminal cuasi-infinito

De estos resultados se deriva que para todo x , la diferencia


VM (x) V (x)
se puede hacer tan peque
na como se desee tomando un valor de M suficientemente
grande.
Por ejemplo, supongamos que el controlador local u = h(x) de la hipotesis 3.5
estabiliza exponencialmente al sistema en = {x : V (x) }. Por tanto existe una
constante [0, 1) tal que
V (f (x, h(x)) V (x)
Si se quiere que la diferencia sea
VM (x) V (x)
se puede encontrar un valor de M () tal que para todo M M () se verifique la
condicion anterior.
En efecto, de las propiedades de VM (x) se tiene que
VM (x) V (x) = V (xh (i + M |i)) V (xh (i + M |i))
dado que x , se tiene que
V (xh (i + M |i)) M V (x) M
por lo tanto, considerando que V (x) 0, se verifica que
VM (x) V (x) M
En consecuencia considerando un M tal que M , se satisface la condicion.
Por lo tanto, de aqu se deduce que para todo M tal que
M M () =

log () log ()
log (1/)

la diferencia VM (x) V (x) .


A continuacion se presenta un corolario que establece que considerando como coste
terminal VM (x), el MPC es asintoticamente estable para cualquier valor del n
umero de
muestras consideradas en el coste terminal M . Esto generaliza el resultado de (Magni,
De Nicolao, Magnani & Scattolini 2001), pues la estabilidad se conserva para cualquier
valor de M considerado, independientemente del estado en el que se encuentre el sistema. Ademas puede aproximar el coste infinito con la precision que se desee, sin
condicionar el valor de M tomado, la estabilidad del controlador.

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

57

Corolario 3.10 Sea V (x) y tales que satisfacen la hip


otesis 3.5. Sea un controlador
MPC de horizonte de control Nc y horizonte de predicci
on Np tal que la regi
on terminal
es y el coste terminal
VM (x) =

j=M
X1

Lh (xh (i + j|i)) + V (xh (i + M |i))

(3.7)

j=0

siendo xh (i + j|i) la predicci


on del sistema controlado por la ley de control local u =
h(x) considerando x(i|i) = x. Entonces el controlador predictivo anterior estabiliza
asint
oticamente el sistema para todo M 1 y el dominio de atracci
on XNc ,Np es el
conjunto de estados para los que el problema es factible.
La demostracion es consecuencia inmediata del teorema 3.6, dado que por el lema
3.7 la region terminal VM (x) y satisfacen la hipotesis 3.5.
Este controlador propuesto permite observar el efecto del aumento del horizonte de
prediccion desde una nueva perspectiva.
El controlador MPC con horizonte de control Nc y horizonte de prediccion Np =
Nc + M formulado con region terminal y coste terminal V (x), puede considerarse
como un controlador MPC general con horizonte Nc tal que la funcion de coste terminal
h
es VM (x) y la region terminal SM
(X, ).
El caracter no lineal del modelo hace que en general sea imposible calcular con
exactitud dicho conjunto. Por tanto, la ventaja de la formulacion con un mayor horih
zonte de prediccion Np es basicamente que evita el calculo del conjunto SM
(X, ). As,
permite considerar una mayor region terminal (y en consecuencia, un mayor dominio
de atraccion) sin necesidad de calcular dicho invariante.

3.5.1.

Ejemplo de aplicaci
on al reactor

El controlador propuesto se aplica al control del reactor sintonizado con el mismo


coste de etapa y el invariante positivo y la funcion de Lyapunov utilizadas como region
y coste terminal en la seccion 3.3.2.
Para comprobar las propiedades demostradas de la funcion de coste terminal VM (x)
se ha calculado, para un estado contenido en , el valor de VM (x) frente a M . El resultado obtenido se muestra en la figura 3.8(a). Se puede comprobar el caracter estrictamente decreciente de VM (x) al aumentar M , evolucionando hacia V (x) tomando
valores siempre superiores. Notese como, considerando un M suficientemente largo, el
coste VM (x) aproxima arbitrariamente bien el coste infinito V (x).

58

3.6. El MPC como controlador optimo cuasi-infinito

Otra propiedad interesante es que V (x) VM (x) para todo x y para todo
M 1. Para ilustrar esto, en la figura 3.8 (b) se muestra la evolucion del coste VM (xk )
con M = 10, junto con el de V (xk ) a lo largo de la evolucion del sistema regulado con el
controlador local. En esta figura se observa como la evolucion de ambas funciones son
estrictamente decrecientes, por ser ambas funciones de Lyapunov del sistema y ademas
V (xk ) VM (xk ) y su diferencia se reduce a medida que se acerca el sistema al punto
de equilibrio.
1

0.95

log V (x )
10 10 k
log10 V(xk)

0.9
1

log10 VM(x)

0.85
2
0.8
3

0.75
4
0.7

0.65

0.6

10

15

20

25
M

(a)

30

35

40

45

50

10

20

30

40

50
muestras

60

70

80

90

100

(b)

Figura 3.8: (a) Variacion de VM (x) frente a M , (b) Evoluci


on de V10 (xk ) y V (xk ).

A continuacion se muestra la evolucion del sistema controlado con el controlador


MPC propuesto considerando Nc = 5, Np = 5 y M = 10. En la figura 3.9 se puede
observar el plano de fases del sistema en bucle cerrado. En la figura 3.10 se muestra
la evolucion de las se
nales del sistema partiendo de un estado inicial x1 = 0,1 y
x2 = 0,38.

3.6.

El MPC como controlador


optimo cuasi-infinito

El MPC es una formulacion implementable de los controladores optimos con horizonte infinito. Estos controladores tratan de optimizar el coste del comportamiento del
sistema a lo largo de toda su evolucion. Esto confiere propiedades muy interesantes a
estos controladores como optimalidad, robustez y ademas la posibilidad de conducir
hacia el origen al sistema partiendo de cualquier estado asintoticamente estabilizable.
La trayectoria del sistema as controlado es aquella que minimiza el coste de su evolucion, no existiendo otra con menor coste. Por ello, es la trayectoria que optimiza el
desempe
no impuesto sobre el sistema mediante el coste de etapa.
El horizonte finito y fijo con el que se resuelve el MPC hace que la trayectoria
que sigue el sistema pueda diferir de la obtenida por el controlador con horizonte

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

59

0.4

0.2

x2

0.2

0.4

0.6

0.8
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 3.9: Retrato de estados del sistema con M = 10.


0.05

0
0.05
0.1
0

10

15

20

25

30

35

40

45

50

10

15

20

25

30

35

40

45

50

10

15

20

25
muestras

30

35

40

45

50

x2

0.4
0.2
0

0
0.5
1

Figura 3.10: Evoluci


on de las se
nales del sistema en bucle cerrado.

infinito. Por consiguiente la trayectoria no es optima y por lo tanto presenta un peor


comportamiento.
En esta seccion se analiza la relacion que existe entre ambas soluciones desde un
punto de vista de la optimalidad. Ademas se analiza como influyen los distintos elementos del controlador sobre esta, demostrandose que las formulaciones presentadas
anteriormente proveen de un mejor comportamiento al sistema en bucle cerrado. Este

60

3.6. El MPC como controlador optimo cuasi-infinito

analisis se realiza para la formulacion con Np Nc por ser esta mas general, pues los
resultados son extrapolables al caso de Nc = Np .

En lo que sigue se denota J


(x) al coste optimo con horizonte infinito. Se denomina

JNc , (x) al coste optimo del MPC con horizonte de control Nc y horizonte de prediccion
MPC
infinito. Por u
ltimo, J
(x) representa el coste asociado a la evolucion del sistema
controlado por el MPC, partiendo del estado x.

3.6.1.

El MPC general como controlador con horizonte cuasiinfinito

En (Chen & Allgower 1998b) se presenta una formulacion denominada MPC con

horizonte cuasi-infinito. Esta


se basa en la incorporacion en el funcional de una funcion
de coste terminal que es una cota superior del coste optimo del estado terminal. En este
apartado se comprueba que esta propiedad tambien la satisface la formulacion general
del MPC. Para ello, en el siguiente lema se muestra una propiedad interesante de la
funcion de coste.
Lema 3.11 Sea V (x) una funcion de Lyapunov de control tal que satisface la hipotesis

3.5, entonces se tiene que V (x) J


(x) para todo x .

Demostraci
on:
Sea u = h(x) la ley de control local asociada a V (x). Entonces del teorema 3.9 se tiene
que para todo x
V (x) V (x)
por otro lado, de la optimalidad del control con horizonte infinito se deduce que

V (x) J
(x), y por lo tanto

V (x) J
(x)
lo que demuestra el lema.
De esta propiedad se puede inferir el siguiente resultado:

Propiedad 3.12 Del lema anterior se deduce que para todo xk XNc ,Np

JN c ,Np (xk ) J
(xk )

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

61

Por tanto la hipotesis 3.5 garantiza que el coste a optimizar es una cota superior del
coste infinito, de forma que la convergencia del coste del MPC garantiza en cierta forma
la convergencia del coste infinito.

3.6.2.

Influencia de los horizontes en el coste


optimo del MPC

A continuacion se analiza como influye un incremento en los horizontes de control


y de prediccion sobre el coste optimo del MPC.
Teorema 3.13 Sea un sistema y un controlador MPC tal que satisfacen las hipotesis
del teorema 3.6, entonces se tiene que para todo xk XNc ,Np
JN c ,Np (xk ) JN c +1,Np (xk )

Demostraci
on:
Sea uF (k) la solucion optima del MPC en el estado xk con horizontes Nc y Np , con un
coste asociado JN c ,Np (xk ). Entonces la secuencia uF (k) dada por

u (k + j|k)
j = 0, , Nc 1
u(k + j|k) =

h(x (k + N |k)) j = N
c
c

es factible en el mismo estado xk , para unos horizontes Nc + 1 y Np . Esto se deriva


del hecho que x(k + j|k) = x (k + j|k) para todo j = 0, , Np . Ademas, dado que
h
x (k + Nc |k) SN
(X, ) la actuacion, h(x (k + Nc |k)) es admisible.
p Nc
Sea el JNc +1,Np (xk ) el coste asociado a la actuacion factible. Entonces se tiene que
JN c ,Np (xk ) = JNc +1,Np (xk )
y del principio de optimalidad se deduce que
JN c +1,Np (xk ) JNc +1,Np (xk ) = JN c ,Np (xk )

En consecuencia, cuanto mayor es el horizonte de control, menor sera el coste optimo. Por tanto al aumentar el horizonte de control se gana en optimalidad de la solucion
pero a costa de aumentar el coste computacional en la resolucion del problema. Analogo
resultado se obtiene a continuacion al aumentar el horizonte de prediccion.

62

3.6. El MPC como controlador optimo cuasi-infinito

Teorema 3.14 Sea un sistema y un controlador MPC tal que satisfacen las hipotesis
del teorema 3.6, entonces se tiene que
JN c ,Np (xk ) JN c ,Np +1 (xk )

Demostraci
on:
Sea uF (k) la solucion optima del MPC con coste JNc ,N p (xk , uF ), entonces, dado que la
ley de control local u = h(x) es estabilizante, uF (k) = uF (k) es una solucion factible
del problema de optimizacion con horizonte Np +1. Por lo tanto x(k +j|k) = x (k +j|k)
para todo j = 1, , Np . Ademas se tiene que
x(k + Np + 1|k) = f (x (k + Np |k), h(x (k + Np |k)))
Entonces se tiene que
JNc ,N p+1 (xk ) JN c ,Np (xk ) = Lh (x (k + Np |k)) + V (
x(k + Np + 1|k))

V (x (k + Np |k)) 0
dado que x (k + Np |k) . Del principio de optimalidad se deduce que
JN c ,Np +1 (xk ) JNc ,Np +1 (xk ) JN c ,Np (xk )

Notese que el controlador propuesto verifica que un aumento del horizonte de prediccion reduce el coste optimo y por lo tanto se aproxima mas a la optimalidad, mejorando
el comportamiento del sistema en bucle cerrado. Esta mejora se consigue sin un incremento apreciable del coste computacional.

3.6.3.

El MPC como aproximaci


on al controlador con horizonte infinito

A continuacion se analizan propiedades de los nuevos controladores MPC propuestos en relacion a su aproximacion al controlador con horizonte infinito, es decir, a
la optimalidad de la solucion. As, cuanto mayor sea la optimalidad de la solucion
obtenida, mejor sera el comportamiento del sistema en bucle cerrado. Este analisis es
una de las contribuciones de esta tesis.
Corolario 3.15 Sea V (x) y tales que satisfacen la hipotesis 3.5. Sea uF (k) una
secuencia factible del MPC en el estado xk con horizonte de predicci
on Np y de control

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

63

Nc . Sea JNMc ,Np (xk , uF (k)) el coste de dicha secuencia considerando como coste terminal
VM () y sea JNc ,Np (xk , uF (k)) el coste considerando como coste terminal V (). Entonces
JNc ,Np (xk , uF (k)) JNMc ,Np (xk , uF (k))
Es decir, que considerar como coste terminal VM () en el MPC reduce el coste
optimo y por tanto se acerca mas a la evolucion optima. Este corolario se deduce de la
propiedad
V (x) VM (x)
para todo M 1 y para todo x , demostrada en el teorema 3.9.
Corolario 3.16 Bajo las hipotesis del teorema 3.6, para cualquier secuencia factible
uF (k), la funcion de coste con horizonte de predicci
on Np es una cota superior del coste
con horizonte de predicci
on infinito
JNc ,Np (xk , uF (k)) JNc , (xk , uF (k))
Esto es consecuencia inmediata del corolario anterior, de la propiedad VM (x) V (x)
demostrada en el teorema 3.9.
Corolario 3.17 De las propiedades anteriores se deduce que, para toda secuencia
factible uF (k)
JNc ,Np (xk , uF (k)) JNMc ,Np (xk , uF (k)) JNc , (xk , uF (k))
y ademas la diferencia JNMc ,Np (xk , uF ) JNc , (xk , uF ) se puede reducir arbitrariamente
tomando un valor de M suficientemente grande.
Esto se deduce de que
JNMc ,Np (xk , uF ) JNc , (xk , uF ) = VM (x(k + Np |k)) V (x(k + Np |k))
y de que esta diferencia se puede hacer tan peque
na como se desee tomando un valor
de M suficientemente grande.
A continuacion se va a analizar la relacion del coste optimo del MPC obtenido en xk
con el coste en que incurre la evolucion del sistema controlado por el MPC a partir de
ese estado, lo cual forma parte del trabajo original realizado en la tesis. As, se denota
MPC
(xk ) al coste infinito asociado al sistema controlado por el MPC, es decir,
J
J (xk ) =
MPC

j=
X
j=0

L(xk+j , KMPC (xk+j ))

64

3.6. El MPC como controlador optimo cuasi-infinito

Teorema 3.18 Sea un sistema tal que satisface la hipotesis 3.5. Sea un controlador
MPC tal que la regi
on terminal es y el coste terminal V (x), la funcion de Lyapunov
asociada. Entonces se verifica que
MPC
(xk )
JN c ,Np (xk ) J

y ademas, la diferencia entre ambas es monotonamente decreciente con el tiempo


MPC
MPC
JN c ,Np (xk ) J
(xk ) JN c ,Np (xk+1 ) J
(xk+1 )

Demostraci
on:
Por las hipotesis se tiene que el sistema controlado por el MPC es asintoticamente
estable y ademas el coste optimo satisface
JN c ,Np (xk+j ) JN c ,Np (xk+j+1 ) L(xk+j , KMPC (xk+j ))
por tanto
j=
X n
j=0

JN c ,Np (xk+j ) JN c ,Np (xk+j+1 )

j=
X

MPC
L(xk+j , KMPC (xk+j )) = J
(xk )

j=0

dado que el sistema controlado por el MPC es asintoticamente estable, el termino de


la izquierda se reduce a JN c ,Np (xk ), lo que demuestra la primera afirmacion del teorema.
La monotona se deduce de
JN c ,Np (xk ) JN c ,Np (xk+1 ) L(xk , KMPC (xk ))
MPC
MPC
= J
(xk ) J
(xk+1 )
de donde se tiene que
MPC
MPC
JN c ,Np (xk ) J
(xk ) JN c ,Np (xk+1 ) J
(xk+1 )

y por recurrencia se demuestra la propiedad.

Nota 3.19 De todo lo expuesto hasta ahora se puede obtener el siguiente balance:
MPC

JN c (x) JN c ,Np (x) JNMc ,Np (x) J


(x) J
(x)
MPC
(x) el coste de la evolucion del sistema controlado por la ley de control
siendo J
obtenida con Nc , Np y M .

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

65

Este es quiza el resultado mas importante de todo este analisis: las nuevas formulaciones propuestas consistentes en el aumento del horizonte de prediccion, as como
la consideracion como coste terminal VM () producen una reduccion del coste optimo
del MPC y por lo tanto un comportamiento del sistema mas optimo y un mejor comportamiento del sistema en bucle cerrado. Ademas el coste computacional en el que se
incurre por la incorporacion de estas medidas no es grande y, dado que la estabilidad
esta garantizada para todo Np Nc y M 0, estos elementos se pueden a
nadir en
funcion del tiempo de calculo disponible sin peligrar la estabilidad.

3.6.4.

Ejemplo de aplicaci
on al reactor

Para ilustrar las propiedades de optimalidad del MPC se va a analizar como influyen
los distintos parametros sobre el sistema partiendo del estado inicial CA = 0,2 mol/l y
T = 340 K que equivale a x1 = 0,3 y x2 = 0,5.
En la figura 3.11 se muestra la variacion del coste optimo del MPC en un estado
determinado al variar el horizonte de control (considerando Np = Nc ). Como se puede
observar, el coste optimo disminuye al aumentar el horizonte de control tal y como se
demostro.
45

40

J*N

35

30

25

20

10

11

12

13

14

15

16

17

18

19

20

Nc

Figura 3.11: Variaci


on del coste optimo con Nc .

En la figura 3.12 se puede observar la variacion del coste optimo del MPC con un
horizonte de control fijo Nc = 5, para una serie de valores del horizonte de prediccion.
Tal y como se demostro, el coste optimo disminuye monotonamente al aumentar Np .
En el analisis realizado anteriormente se ha demostrado que al aumentar el horizonte
de control, o el de prediccion o bien tomando como coste terminal el cuasi-infinito, el

66

3.6. El MPC como controlador optimo cuasi-infinito

45

40

J*5,N

35

30

25

20

10

15

20

25

30

35

40

45

50

Np

Figura 3.12: Variaci


on del coste optimo con Np .

coste del MPC se reduce tendiendo a la optimalidad. En consecuencia, la evolucion


del sistema en cada una de estas situaciones debe tender a la trayectoria optima del
sistema. Esto se ilustra en la figura 3.13, en la que se muestran las trayectorias del
sistema controlado con un horizonte de control Nc = 4 y Np = 4, otra con un horizonte
de control Nc = 4 y un horizonte de prediccion Np = 10, otra igual a la anterior pero
considerando como coste terminal V10 (x) y por u
ltimo la evolucion optima.
0.3

0.2

0.1

Nc=4
Nc=4, Np=10
Nc=4, Np=10, M=10
Nc=

0.1

0.2

0.3

0.4

0.5

0.4

0.3

0.2

0.1
x1

0.1

0.2

Figura 3.13: Tendencia a la optimalidad al variar Nc , Np y M .

Ademas se han calculado los costes optimos en el estado inicial, obteniendose los
siguientes resultados

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

J4 (x0 )

33.5711

(x0 )
J4,10

29.4109

10
J4,10
(x0 )

25.7196

MPC
J
(x0 )

23.6733

J
(x0 )

23.5891

67

MPC
siendo J
(x0 ) el coste de la evolucion del MPC con Nc = 4, Np = 10 y M = 10.
En esta tabla se puede comprobar como un aumento del horizonte de prediccion y/o
del n
umero de terminos del coste terminal cuasi-infinito, hacen que el coste optimo
disminuya, aproximandose el controlador al optimo. Tambien el aumento del horizonte
de control aproxima el controlador, pero al contrario que las medidas anteriores, esta
supone una mayor carga computacional.

3.7.

C
alculo de la regi
on terminal

El elemento esencial en la sintonizacion de un controlador MPC con estabilidad


garantizada para un sistema es, sin duda, el calculo de la region terminal y una funcion
de Lyapunov asociada tales que satisfagan la hipotesis 3.5. En la literatura se han
propuesto metodos para su calculo en el caso de sistemas continuos (Michalska &
Mayne 1993, Chen & Allgower 1998b) y discretos (Parisini & Zoppoli 1995, Magni, De
Nicolao, Magnani & Scattolini 2001) garantizando la existencia de ambos. Sin embargo,
la necesidad de calcular y V (x) se presenta habitualmente como una desventaja del
MPC, por la complejidad que ello entra
na. Teniendo en cuenta que con ello se obtiene
estabilidad de un sistema no lineal sujeto a restricciones, el calculo de esta region es
insignificante comparado con las ventajas que ofrece el controlador MPC. Ademas,
dado que el invariante es una vecindad de un punto de equilibrio, permite el uso de
tecnicas locales. Por u
ltimo, hay que resaltar, que el calculo se hace fuera de lnea, por
lo que no supone un mayor coste computacional del controlador.
Con el fin de mostrar que el calculo de la region y coste terminal es una tarea
abordable, aunque costosa, se presenta aqu un procedimiento de calculo para el caso
de coste de etapa cuadratico
L(x, u) = kxk2Q + kuk2R
siendo la matriz Q semidefinida positiva y R definida positiva. En este procedimiento,
similar al presentado en (Magni, De Nicolao, Magnani & Scattolini 2001), se supone
que el modelo del sistema
xk+1 = f (xk , uk )

68

3.7. Calculo de la region terminal

es una funcion C 2 y ademas que el sistema linealizado en el origen es estabilizable.


Para la determinacion del coste terminal y de la region terminal deben seguirse los
siguientes pasos:

1. Sea el sistema linealizado en el origen xk+1 = Axk + Buk siendo

f (x, u)
A=

x (0,0)

f (x, u)
y B=

u (0,0)

Calcular un controlador uk = Kxk por cualquier procedimiento habitual (LQR,


PID, asignacion de polos, etc.), tal que estabilice asintoticamente el sistema linealizado.
Q (por
2. Sea AK = A + BK y sea Q = Q + K T RK. Tomese una matriz Q
= Q para cierto > 1) y calc
ejemplo Q
ulese la matriz P tal que

ATK P AK P = Q
3. Sea V (x) = xT P x. Calcular la constante > 0 tal que para todo
x = {x IRn : V (x) }
se satisfaga
X K = {x X : u = Kx U }
V (f (x, Kx)) V (x) xT Q x
4. Si se desea calcular el invariante positivo en el cual el sistema es asintoticamente
estable pero en el que no se verifica la hipotesis 3.5, tomese una constante
[0, min (Q )] arbitrariamente peque
na. Calcular la constante > 0 tal que para
n
todo x = {x IR : V (x) } se satisface
X K
V (f (x, Kx)) V (x) xT x

El calculo del paso 3 se puede realizar resolviendo el problema de optimizacion no


lineal
= mn V (x)
x

s.a
V (f (x, Kx)) V (x) > xT Q x

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

69

Para todo x = {x IRn : V (x) }, se satisface la condicion V (f (x, Kx))


V (x) xT Q x.
Este problema tiene solucion factible ya que, definiendo
(x) = f (x, Kx) AK x
la condicion V (f (x, Kx)) V (x) xT Q x se puede reescribir como
((x) + AK x)T P ((x) + AK x) xT P x =
(x)T P (x) + 2(x)T P AK x + {xT (ATK P AK )x xT P x} xT Q x
se tiene que
Teniendo en cuenta que ATK P AK P = Q
Q )x
(x)T P (x) + 2(x)T P AK x xT (Q
Dado que el modelo es dos veces continuamente diferenciable, existe una constante
Lr =
siendo kxkP =

k(x)kP
0<kxkP r
kxkP
max

xT P x. Esta constante satisface que Lr 0 cuando r 0.

A continuacion se va a demostrar las siguientes propiedades


(i) (x)T P (x) L2r kxk2P .
Es consecuencia inmediata de la definicion de la constante Lr .
(ii) 2(x)T P AK x 2Lr kAkP kxkP .
Para ello basta comprobar que,

2(x)T P AK x = 2 (x)T P 1/2 P 1/2 AK x

2kP 1/2 (x)kkP 1/2 AK xk


2k(x)kP kAK xkP
2Lr kxkP kAK kP kxkP = 2Lr kAK kP kxk2P
Q )P 1/2 ).
Q )x kxk2P , siendo = min (P 1/2 (Q
(iii) xT (Q
En efecto,
Q )x = xT P 1/2 P 1/2 (Q
Q )P 1/2 P 1/2 x
xT (Q
Q )P 1/2 )P 1/2 x
xT P 1/2 min (P 1/2 (Q
Q )P 1/2 )kxk2P
= min (P 1/2 (Q

70

3.7. Calculo de la region terminal

Entonces, de estas tres propiedades se tiene que


Q )x (L2r + 2Lr kAK kP )kxk2P
(x)T P (x) + 2(x)T P AK x xT (Q
Dado que Lr 0 cuando r 0, existira un r suficientemente peque
no tal que
L2r + 2Lr kAK kP
y por lo tanto, para todo x tal que V (x) = kxk2P r2 se satisface la condicion. En
consecuencia, siempre existe una vecindad del origen en la que se cumple la hipotesis
3.5.
Habitualmente las restricciones en las actuaciones y en el estado son politopicas, con
lo que el conjunto X K tambien es un politopo. Dado que el invariante es un elipsoide,
es posible calcular el maximo elipsoide contenido en X K . Sea el conjunto X K formado
por nr restricciones lineales aTi x bi . Entonces esta contenido en X K siendo
(

b2i
= mn T 1
i
ai P ai

Por tanto, la region = {x IRn : xT P x = mn(, )} es un invariante


positivo admisible del sistema.
En caso de que los conjuntos de restricciones no sean politopicos, entonces habra que
calcular el maximo elipsoide que satisface las restricciones, que se obtiene resolviendo
uno o varios problemas de optimizacion analogos al propuesto (siempre que X K sea
convexo). Por tanto se deben resolver una serie de problemas de optimizacion y se
tomara como el menor de los argumentos obtenidos.

3.7.1.

Ejemplo de aplicaci
on al reactor

Para ilustrar el calculo de la region terminal, se va aplicar el procedimiento presentado al ejemplo del reactor. En este caso se obtiene el controlador local linealizando el
sistema en torno al origen obteniendose

A=

0,9385 0,0443
0,1624

1,1365

B=

0,0013

0,0668

y calculando el controlador lineal mediante la tecnica del LQR con los mismos factores
de ponderacion que los utilizados en la seccion 3.3.2, se obtiene
K=

1,6154 3,6644

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

71

Para esta ley de control se calcula la matriz P que resuelve la ecuacion de Lyapunov
ATK P AK P = Q
siendo

0,9406 0,0396

AK = A + BK =

0,0545

0,8918

la matriz del sistema en bucle cerrado linealizado, y la matriz Q

Q = Q + K T QK =

12,6095

5,9195

5,9195

14,4279

y el parametro > 1.
Para calcular el conjunto invariante hay que calcular el maximo tal que se verifique la condicion
f (x, Kx)T P f (x, Kx) xT P x xT Q x
En el caso de = 2, se obtiene la solucion utilizada en los ejemplos realizados a lo
largo de este captulo: 2 = 9,3353 y

P2 =

265,8811

49,3961

49,3961

125,9963

Analizando la ecuacion de Lyapunov del sistema linealizado se observa que


P = P1
relacion que al sustituirse en la condicion de Lyapunov se tiene que
1
f (x, Kx)T P1 f (x.Kx) xT P1 x xT Q x

por lo que al aumentar disminuye la tasa de decrecimiento de la funcion de Lyapunov,


es decir, se relaja la condicion, lo que conduce a regiones invariantes mayores. Este
hecho se ilustra en la figura 3.14, en la que se muestra el conjunto factible X K , que es
un politopo, y las regiones para distintos valores de : 1,1, 1,25 y 1,5. Como se puede
observar, la region crece hasta alcanzar el maximo que esta limitado por su pertenencia
al conjunto X K .
En la figura 3.15 se muestra el valor de (referido a P1 ) para distintos valores de ,
en la que se puede observar que el tama
no del invariante crece hasta llegar a su lmite.

72

3.8. Analisis de estabilidad del MPC suboptimo

0.5

x2

0.5

1.5

0.8

0.6

0.4

0.2

0.2

0.4

0.6

0.8

x1

Figura 3.14: Invariantes positivos del sistema para = 1,1, 1,25 y 1,5.
5

4.5

3.5

2.5

1.5

0.5

0
1.1

1.15

1.2

1.25

1.3

1.35

1.4

1.45

1.5

1.55

1.6

Figura 3.15: Evoluci


on de en funcion de .

3.8.

An
alisis de estabilidad del MPC sub
optimo

El controlador MPC se basa en la solucion global de un problema de optimizacion


que es no lineal. Existen algoritmos eficientes como el denominado Sequential Quadratic
Programming (SQP) que solucionan estos problemas en un tiempo computacionalmente
aceptable para la implementacion en sistemas no muy rapidos (Luenberger 1989, Biegler
1998). Pero el caracter no lineal del problema conlleva normalmente la no convexidad
del mismo, por lo que podra presentar mnimos locales que el algoritmo puede dar como
solucion al problema. El calculo de la solucion global es posible, pero el incremento de
tiempo de calculo que esto conlleva puede ser excesivo y, en consecuencia, dejar de ser
implementable (ya que el tiempo de calculo esta limitado por el periodo de muestreo,
y en consecuencia, por la dinamica de la planta a controlar).

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

73

Por tanto, para que un controlador MPC sea implementable debe ser capaz de
conservar la estabilidad asintotica en bucle cerrado del sistema en el caso de soluciones
suboptimas del problema de optimizacion.
Como se puede observar en los teoremas de estabilidad del MPC, esta surge de la
posibilidad de calcular una solucion factible uF (k) a partir de la solucion factible (la
optima, por ejemplo) obtenida en el instante anterior uF (k 1) que ademas incurre en
un menor coste. Por tanto, la convergencia esta garantizada tomando como solucion
en cada instante la factible uF (k), si no se calcula una mejor. Esto es teoricamente
posible, dada la ausencia de errores entre la prediccion y el comportamiento real de la
planta, y puede conducir a un control en bucle abierto de la planta. En consecuencia, la
optimalidad de la solucion se puede relajar dando lugar al denominado MPC suboptimo.
Como se mostrara en el captulo 5, esta propiedad toma un mayor sentido cuando el
sistema presenta incertidumbres, pues estas pueden hacer que la solucion factible tenga
un coste superior al anterior.
A continuacion se demuestra la estabilidad del MPC suboptimo. Esta formulacion
fue propuesta inicialmente en (Scokaert et al. 1999) para unas formulaciones del MPC
y extendida a la formulacion general en (Mayne et al. 2000). La demostracion presentada aqu se basa en la teora de conjuntos invariantes y en la convergencia del coste
suboptimo.
Para esta demostracion se ha considerado la formulacion general del MPC, si bien es extensible a las otras formulaciones presentadas. A lo largo de esta seccion, el
superndice s denota sub
optimo, en oposicion al asterisco que denota optimo.

Teorema 3.20 (Estabilidad asint


otica del MPC Sub
optimo)
Sea un sistema xk+1 = f (xk , uk ), tal que f (0, 0) = 0 y esta sujeto a las restricciones
x k X y uk U .
Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y una
regi
on terminal tales que satisfacen la hipotesis 3.5.
Sea usF (xk ) una solucion suboptima del MPC tal que
JNs (xk ) JNs (xk1 ) L(xk1 , usk1 )
siendo un par
ametro libre tal que 0 < 1.
s
s
oticamente
Entonces el controlador predictivo KM
P C (xk ) = u (k|k) estabiliza asint
el sistema y el dominio de atracci
on XN es el conjunto de estados para los que el
problema es factible.

74

3.8. Analisis de estabilidad del MPC suboptimo

Demostraci
on:
Factibilidad:
Analogamente a la demostracion del teorema 3.6, conocida una solucion factible en
k, usF (k), se puede obtener una secuencia de actuaciones uF (k + 1) dada por

us (k + j|k)
u(k + j|k + 1) =
h(x(k + Nc |k + 1))

j = 1, , N 1
j=N

que es una solucion factible en k + 1. Esto es consecuencia de que x(k + j|k + 1) =


xs (k + j|k) para todo j = 1, , N 1 y de la hipotesis 3.5.
Por tanto XN es un invariante positivo del sistema. As, si el conjunto XN es acotado, entonces el sistema en bucle cerrado es estable.

Convergencia:

Analogamente al teorema 3.6 se puede comprobar que la secuencia uF (k + 1) tiene


un coste asociado tal que
JN (xk+1 ) JNs (xk ) L(xk , us (k|k))
Por lo tanto existe una secuencia de actuaciones que satisface la condicion
JNs (xk ) JNs (xk1 ) L(xk1 , usk1 )
Ademas, se tiene que la secuencia de n
umeros positivos JNs (xk ) es estrictamente decreciente para todo xk 6= 0. Entonces, cuando k , JNs (xk ) JNs (xk+1 ) 0. Por lo
tanto L(xk , usk ) 0 por lo que, dado que L(x, u) lkxk , se tiene que xk 0 y el
sistema es asintoticamente estable.
Con esta demostracion se demuestra que el controlador esta definido a lo largo
de la evolucion del sistema, satisface las restricciones y ademas converge al origen.
Sin embargo, para demostrar con rigor la estabilidad asintotica hay que probar que
el origen es un punto de equilibrio estable. Notese que la funcion de coste suboptimo
no puede considerarse como una funcion de Lyapunov estricta y ademas no tiene por
que ser continua.
Para ello en (Scokaert et al. 1999) se propone imponer una restriccion adicional sobre

el sistema. Esta
garantiza que en una vecindad del origen, la secuencia suboptima de

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

75

actuaciones decrezca en norma con el estado, es decir que existe una funcion K , (),
tal que
kusF (k)k (kxk k)
Esta condicion no es muy restrictiva, pero dado que no se puede demostrar, hay que
imponerla como restriccion.
Esta restriccion se puede evitar imponiendo unas condiciones mas suaves que las
anteriores. En efecto, para garantizar la estabilidad del origen es suficiente encontrar
una funcion K que acote superiormente el coste suboptimo en una vecindad del mismo.
Esto se puede garantizar si para todo xk , se satisface que JNs (xk ) V (xk ). Esta
condicion es muy suave, y se debe satisfacer en la mayora de los casos, siempre que el
grado de suboptimalidad no sea alto.
Si para xk esta condicion no se satisface, esta se puede imponer simplemente
tomando como secuencia suboptima, la derivada de aplicar la ley de control local, pues
en este caso, JNs (xk ) = VN (xk ) V (xk ).
As, para todo x0 tal que kx0 k = 1 (l ), siendo () la funcion K tal que
V (x) (kxk) y tal que esta bola esta contenida en , se tiene que

lkxk k JNs (xk ) < JNs (x0 ) V (x0 ) (kx0 k) l

y por lo tanto kxk k , lo que demuestra la estabilidad.


Un procedimiento mas sencillo para garantizar la estabilidad consiste en partir de
la solucion optima en el estado inicial. As, dado que JN (x) V (x) para todo x ,
se satisface la condicion anterior.
En (Scokaert et al. 1999) los autores resaltan que la suboptimalidad no es deseable
en un controlador pues, aunque hace el controlador mas facilmente implementable,
tiene asociado una perdida de optimalidad y por lo tanto un peor comportamiento. La
suboptimalidad es, por tanto, una deficiencia en el control optimo y no un objetivo

en s. Esta
puede estar motivada por diversas razones: un algoritmo de optimizacion
deficiente, insuficiente tiempo de calculo o bien discrepancias entre los estados predichos
y reales. Bajo estas circunstancias, la condicion de convergencia impuesta garantiza
la estabilidad asintotica del sistema en bucle cerrado. El parametro [0, 1] es un
factor de convergencia mnimo del sistema en bucle cerrado, que permite establecer un
compromiso entre suboptimalidad y comportamiento.

76

3.8. Analisis de estabilidad del MPC suboptimo

3.8.1.

Ejemplo de aplicaci
on al reactor

Para ilustrar el efecto de la suboptimalidad de la solucion del problema de optimizacion, se ha aplicado esta estrategia al reactor con los mismos parametros de
ejemplos anteriores, con un horizonte de prediccion igual al de control Nc = 5 y partiendo de un estado inicial x1 = 0,3 y x2 = 0,5. Para poder mostrar el efecto de
la suboptimalidad, la resolucion del problema de optimizacion no se ha iniciado con la
solucion inicial factible y se ha reducido el n
umero de iteraciones hasta lograr la condicion de convergencia con un valor del parametro = 0,1. La trayectoria resultante se
puede observar en la figura 3.16 junto con la obtenida por el controlador optimo.
En la figura 3.17 se puede ver la evolucion de los estados y la actuacion a lo largo
del tiempo.

0.1
trayectoria ptima
trayectoria subptima
0

0.1

0.2

0.3

0.4

0.5

0.6
0.4

0.3

0.2

0.1

0.1

x1

Figura 3.16: Trayectorias optima y suboptima del sistema en bucle cerrado.

Como se puede observar, la trayectoria obtenida difiere en gran medida del comportamiento optimo, presentado un peor comportamiento en cuanto a desempe
no se
refiere. Observese ademas la evolucion de la actuacion sobre el sistema: aparecen cambios bruscos en la entrada, perdiendose la suavidad que presenta en el caso optimo.
Este efecto no es deseable pues puede someter a los actuadores a cambios bruscos.
En la figura 3.18 se muestra la evolucion del coste suboptimo en escala logartmica.
Como se puede observar, esta evolucion es monotonamente decreciente, lo que garantiza
la convergencia del sistema.

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

77

0.1
0

x1

0.1
0.2
0.3
0.4

10

15

20

25

30

35

40

45

50

10

15

20

25

30

35

40

45

50

10

15

20

25
muestras

30

35

40

45

50

x2

0.2
0.4
0.6
2.5

1.5
0.5
0.5

Figura 3.17: Evoluci


on de la se
nales del sistema con MPC suboptimo.
2

1.5

log10 J*

0.5

0.5

1.5

10

15

20

25
muestras

30

35

40

45

50

Figura 3.18: Evoluci


on del logaritmo decimal del coste suboptimo.

3.9.

Eliminaci
on de la restricci
on terminal

En la literatura existen resultados de estabilidad en MPC formulado con coste


terminal pero sin restriccion terminal. En estos controladores la restriccion terminal
esta implcitamente considerada pues se establecen hipotesis bajo las cuales la solucion
del MPC sin restriccion terminal satisface dicha restriccion. En (Parisini & Zoppoli
1995) se establecen condiciones bajo las cuales un MPC con coste terminal cuadratico
estabiliza asintoticamente un sistema discreto con restricciones y en (Jadbabaie et al.
2001) se analiza la estabilidad del MPC para sistemas continuos sin restricciones. En

78

3.9. Eliminacion de la restriccion terminal

estos se demuestra que existe una vecindad del origen que contiene a la region terminal
en la cual el MPC sin restriccion terminal estabiliza asintoticamente el sistema. Ademas
se comprueba que, bajo ciertas condiciones, existe un horizonte de control tal que
el controlador predictivo sin restriccion terminal es capaz de estabilizar todo estado
asintoticamente estabilizable.
En esta seccion los resultados anteriores se trasladan a la formulacion general del
MPC con restricciones, estableciendose condiciones bajo las cuales se puede eliminar
del problema de optimizacion la restriccion terminal sin que el controlador pierda su
caracterstica estabilizante. Tambien se demuestra que todo estado asintoticamente
estabilizable se puede estabilizar con un MPC con un horizonte suficientemente largo.
De las demostraciones anteriores, se extrae un resultado muy interesante y que
dota de una originalidad mayor al analisis de esta seccion: la caracterizacion de una
region en la que el controlador MPC sin restriccion terminal estabiliza el sistema. Este
resultado permite ademas analizar como sintonizar el MPC para que la region en la
que se puede eliminar la restriccion terminal sea mayor. Estos resultados se muestran
en el captulo siguiente, dedicado al analisis del dominio de atraccion del MPC. Por
u
ltimo, tambien se demuestra la estabilidad del controlador sin restriccion terminal en
el caso suboptimo. Estos resultados son contribuciones originales de esta tesis.
La eliminacion de esta restriccion es especialmente interesante en sistemas sin restricciones en el estado del sistema, pues hace que el problema de optimizacion tan solo
presente restricciones sobre las variables de decision, reduciendose considerablemente
la complejidad en la resolucion de dicho problema. As, dado que el tiempo de calculo
se reduce, se podra aplicar a sistemas mas rapidos.
Esta seccion comienza generalizando los resultados obtenidos en (Jadbabaie et al.
2001) de sistemas en tiempo continuo sin restricciones, a sistemas en tiempo discreto
con restricciones en las actuaciones y en el estado.
Teorema 3.21
Sea un sistema xk+1 = f (xk , uk ), tal que f (0, 0) = 0 y que esta sujeto a las restricciones
x k X y uk U .
Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y una
regi
on terminal dada por
= {x IRn : V (x) }
tales que satisfacen la hipotesis 3.1.
Entonces el MPC general sin restricci
on terminal estabiliza asintoticamente el sistema
para todo estado inicial tal que x0 , siendo
= {x IRn : JN (x) }

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

79

Demostraci
on:
Estabilidad:
Dado que el coste de etapa es definido positivo, se tiene que
V (x (k + N |k)) JN (xk )
y por tanto, para todo xk , resulta que V (x (k + N |k)) JN (xk ) , lo que
implica que x (k + N |k) , y se satisface la restriccion terminal.
A continuacion se va a comprobar que xk+1 tambien esta contenido en .
Sea uF (k) la solucion optima del sistema en xk , con un coste optimo JN (xk ) y sea
la secuencia uF (k + 1) dada por

u (k + j|k)
u(k + j|k + 1) =
hV (
x(k + N |k + 1))

j = 1, , N 1
j=N

siendo hV () la actuacion optima de (3.4) para el coste terminal. Dado que xk+1 = x (k+
1|k), para esta secuencia el estado predicho satisface que x(k + j|k + 1) = x (k + j|k)
para j = 1, , N . En consecuencia x(k + N |k + 1) = x (k + N |k) y por lo tanto
esta definida hV () para ese estado.
Es inmediato comprobar que la ausencia de incertidumbres, la factibilidad de uF (k)
y la hipotesis 3.1 garantizan la factibilidad de uF (k + 1) aplicada en xk+1 . Entonces se
tiene que el coste de la secuencia optima verifica que
JN (xk+1 ) JN (xk ) = L(xk , u (k|k)) + [V + L](x (k + N |k), hV (x (k + N |k)))
L(xk , u (k|k))
dado que x(k + N |k + 1) = x (k + N |k) y que hV () satisface (3.4). Por tanto, del
principio de optimalidad se tiene que
JN (xk+1 ) JN (xk ) JN (xk+1 ) JN (xk ) L(xk , u (k|k)) lkxk k
Por tanto JN (xk+1 ) < JN (xk ) lo que implica que xk+1 . En consecuencia
este conjunto es un invariante positivo del sistema.
Convergencia:
Es consecuencia inmediata de lo anterior que JN (x) es una funcion de Lyapunov y que
el sistema es asintoticamente estable.

Lema 3.22 Sea V (x) y tales que satisfacen la hipotesis 3.1. Entonces JN (x) V (x)
para todo x .

80

3.9. Eliminacion de la restriccion terminal

Demostraci
on:
De la hipotesis 3.1 se tiene que para x , el sistema controlado por u = hV (x)
satisface
V (x(k + j|k)) V (x(k + j + 1|k)) L(x, hV (x))
entonces
N
1
X

{V (x(k + j|k)) V (x(k + j + 1|k))} = V (x) V (x(k + N |k))

j=0

N
1
X

L(x, hV (x))

j=0

Del principio de optimalidad se tiene que


V (x)

N
1
X

L(x, hV (x)) + V (x(k + N |k)) JN (x)

j=0

De este lema se deduce que para todo x , resulta que JN (x) V (x) y por
lo tanto x . En consecuencia

Con los resultados anteriores se ha demostrado que existe una vecindad del origen
tal que para todo estado inicial contenido en ella, el MPC sin la restriccion terminal
estabiliza el sistema. En (Jadbabaie et al. 2001) se demuestra que para todo estado
asintoticamente estabilizable existe un horizonte N tal que el MPC sin restricciones y
sin restriccion terminal estabiliza el sistema. En (Parisini & Zoppoli 1995) se demuestra
que para un MPC con restricciones, sin restriccion terminal y con un coste terminal
V (x) = axT P x existe un valor de la constante a, la matriz P y del horizonte N , tales
que el MPC estabiliza cualquier estado asintoticamente estabilizable.
A continuacion se extienden ambos resultados a la formulacion general del MPC,
demostrando que todo estado asintoticamente estabilizable es estabilizable por el MPC
sin restriccion terminal, para un horizonte N suficientemente largo. Para ello primero
es necesario establecer el siguiente resultado.
Lema 3.23 Sea V (x) y = {x IRn : V (x) } tales que satisfacen la hipotesis
on terminal en xk SN (X, ).
3.1. Sea uF (k) la secuencia optima del MPC sin restricci

Entonces si x (k +N |k)
/ , ning
un otro estado x (k +j|k)
/ , para j = 0, , N 1.

Demostraci
on:
Se procede por reduccion al absurdo. Supongamos que x (k + N |k)
/ , pero existe

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

81

un i tal que x (k + i|k) . Por optimalidad se tiene que la solucion optima del MPC
con horizonte N i en x (k + i|k) es la secuencia [u (k + i|k), , u (k + N 1|k)].
Entonces, en virtud del lema 3.22:
V (x (k + i|k)) JN i (x (k + i|k)) V (x (k + N |k)) >
luego x (k + i|k)
/ lo que es una contradiccion, demostrandose el lema.
A la luz de este lema se puede demostrar este otro:

Lema 3.24 Para todo x asintoticamente estabilizable existe un horizonte N finito tal
que la solucion optima del MPC con horizonte N y sin restricci
on terminal satisface
la restricci
on terminal.

Demostraci
on:
Dado el caracter definido positivo del coste de etapa L(x, u), y teniendo en cuenta
que el invariante es una vecindad del origen, existe una constante d > 0 tal que
L(x, u) d para todo x
/ .
Por otro lado, para todo estado asintoticamente estabilizable, el coste con horizonte
finito esta acotado.
Para demostrar el lema se va a proceder por reduccion al absurdo. Supongamos que
para un estado xk estabilizable no existe un N tal que la solucion del MPC verifica que
x (k + N |k) pertenece a . Entonces, del lema anterior se tiene que x (k + j|k)
/ ,
para j = 0, , N 1. Por tanto,
JN (xk ) N d + N 1

(xk ) no esta acotado y por lo tanto


Haciendo N se deduce que el coste optimo J
no es estabilizable asintoticamente, lo que es una contradiccion.

A partir de este lema se puede establecer el siguiente resultado:

Teorema 3.25 (Estabilidad asint


otica)
Sea un sistema xk+1 = f (xk , uk ), tal que f (0, 0) = 0 y esta sujeto a las restricciones
x k X y uk U .

82

3.9. Eliminacion de la restriccion terminal

Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y una
regi
on terminal dada por
= {x IRn : V (x) }
tales que satisfacen la hipotesis 3.1.
Entonces, para todo x0 asint
oticamente estabilizable existe un horizonte finito N tal que
el controlador MPC con horizonte N y sin restricci
on terminal estabiliza asintoticamente el sistema.

Demostraci
on:
Sea un N tal que satisface esta condicion
JN (x0 ) N d +
entonces del lema anterior se deduce que la solucion optima en x0 satisface la restriccion
terminal. Ademas para todo estado tal que x = {x IRm : JN (x) J (x0 )}
tambien se verifica, y por tanto la solucion optima alcanza la region terminal. Tambien
se verificara para todo horizonte mayor que N .
Considerando este valor de N , se puede comprobar que es un invariante positivo
del sistema. Para ello se demuestra que si xk entonces xk+1 .
El procedimiento es similar a las demostraciones de estabilidad anteriores. Sea uF (k)
la solucion optima del sistema en xk , con un coste optimo JN (xk ) y sea la secuencia
uF (k + 1) dada por

u (k + j|k)
u(k + j|k + 1) =
hV (
x(k + N |k + 1))

j = 1, , N 1
j=N

siendo hV () la actuacion optima de (3.4) para el estado terminal. Es inmediato comprobar que la ausencia de incertidumbres, la factibilidad de uF (k) y la hipotesis 3.1
garantizan la factibilidad de uF (k + 1) aplicada en xk+1 = x (k + 1|k).
Entonces se tiene que el coste de la secuencia factible verifica que
JN (xk+1 ) JN (xk ) = L(xk , u (k|k)) + [V + L](x (k + N |k), hV (x (k + N |k)))
L(xk , u (k|k))
dado que x(k + N |k + 1) = x (k + N |k) y que hV () satisface (3.4). Por tanto, del
principio de optimalidad se tiene que
JN (xk+1 ) JN (xk ) JN (xk+1 ) JN (xk ) L(xk , u (k|k)) lkxk k

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

83

Por tanto JN (xk+1 ) JN (xk ) JN (x0 ).


En consecuencia, para el horizonte N la solucion optima del MPC satisface la restriccion terminal a lo largo de la evolucion del sistema en bucle cerrado. Por tanto el
conjunto es un invariante positivo, lo que garantiza estabilidad. La convergencia es
consecuencia de la monotona del coste optimo.
De los resultados obtenidos hasta ahora se puede caracterizar una zona en la que
el controlador MPC sin restriccion terminal estabiliza asintoticamente el sistema. Esta
caracterizacion no esta hecha en (Jadbabaie et al. 2001) ni en (Parisini & Zoppoli 1995).
En esta tesis se presenta el siguiente teorema en el cual se determina una vecindad del
origen, que crece con el horizonte de control, en la que el controlador sin restriccion
terminal estabiliza el sistema. De esta forma se extiende el resultado presentado en el
teorema 3.21.

Teorema 3.26 (Caracterizaci


on del dominio de atracci
on)
Sea un sistema xk+1 = f (xk , uk ), tal que f (0, 0) = 0 y esta sujeto a las restricciones
x k X y uk U .
Sea un problema de optimizacion MPC con una funcion de coste terminal V (x) y una
regi
on terminal dada por
= {x IRn : V (x) }
tales que satisfacen la hipotesis 3.1.
Entonces el MPC general sin restricci
on terminal estabiliza asintoticamente el sistema,
para todo estado inicial tal que x0 , siendo esta regi
on
= {x IRn : JN (x) L (x) + (N 1)d + }
siendo L (x) = L(x, KMPC (x)) el coste de etapa optimo.

Demostraci
on:
Como ya se ha demostrado anteriormente, si xk es tal que la solucion optima no conduce
al sistema hasta la region terminal, entonces ning
un estado de la trayectoria optima
entra en la region terminal. As, por el principio de optimalidad de Bellman se tiene
que
JN (xk ) L (xk ) = JN 1 (x (k + 1|k)) (N 1)d +

84

3.9. Eliminacion de la restriccion terminal

siendo L (xk ) = L(xk , u (k|k)). Por tanto si xk es tal que


J (xk ) L (xk ) + (N 1)d +
entonces la solucion optima conduce al sistema a la region terminal.
Se va a demostrar que si xk satisface la condicion anterior, entonces xk+1 tambien.
Dado que la solucion optima en xk es tal que x (k + N |k) , se tiene que la secuencia
uF (k + 1) dada por

u (k + j|k)
u(k + j|k + 1) =
hV (
x(k + N |k + 1))

j = 1, , N 1
j=N

siendo hV () la actuacion optima de (3.4) para el coste terminal, es factible y ademas


la trayectoria tambien satisface la condicion terminal. Entonces se tiene que
JN (xk+1 ) JN (xk+1 ) JN (xk ) L(xk , u (k|k))
(N 1)d + L (xk+1 ) + (N 1)d +
Por recurrencia se deduce que dado que x0 es tal que J (x0 ) L (x0 )+(N 1)d+,
entonces xk verifica que J (xk ) L (xk ) + (N 1)d + para todo k, y por tanto la
solucion optima del MPC siempre cumple la restriccion terminal. Notese ademas que
para todo k tambien se tiene que J (xk ) J (x0 ) L (x0 ) + (N 1)d + y por
lo tanto xk que es un conjunto acotado, por lo que el sistema es estable en bucle
cerrado.
La monotona del coste optimo garantiza la convergencia asintotica del sistema.
A continuacion se presenta un nuevo resultado en el que se demuestra que el controlador sin restriccion terminal suboptimo estabiliza asintoticamente el sistema. Esta
afirmacion que puede parecer una traslacion de la suboptimalidad del MPC con restriccion terminal, no es tan inmediata. Tengase en cuenta que el lema 3.23 y todos los
resultados derivados de el, estan basados en la optimalidad de la solucion y no en la
factibilidad.
Teorema 3.27 (Suboptimalidad)
Bajo las hipotesis del teorema anterior, el controlador MPC sin restricci
on terminal
suboptimo estabiliza asintoticamente el sistema si
JNs (xk+1 ) < JNs (xk ) kxk k
siendo L(x, u) lkxk y [0, l], para todo
x0 = {x IRn : JNs (x0 ) N d + }

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

85

Demostraci
on:
Sea xk tal que JNs (xk ) N d + . Entonces por optimalidad se tiene que
JN (xk ) JNs (xk ) N d +
lo que implica que xk . Como se demostro anteriormente el controlador optimo

uk = KMPC
(xk ) hace que

JN (xk+1 ) JN (xk ) L(xk , KMPC


(xk )) JNs (xk ) L(xk , KMPC
(xk )) JNs (xk ) kxk k

por lo tanto existe una actuacion factible tal que satisface la condicion de convergencia
JNs (xk+1 ) < JNs (xk ) kxk k . En consecuencia, el problema tiene solucion factible en
todo instante xk si x0 .
De aqu se deduce que el sistema evoluciona de forma que xk , por lo que es un
invariante positivo del sistema. Ademas la monotona del coste suboptimo garantiza
la convergencia asintotica al origen (teniendo en cuenta las consideraciones sobre la
estabilidad hechas en la seccion 3.8).

3.9.1.

Ejemplo de aplicaci
on al reactor

El controlador propuesto se va aplicar al reactor utilizado a lo largo de este captulo.


Para ilustrar el efecto de la eliminacion de la restriccion terminal sobre el calculo en
lnea de la actuacion optima, se ha eliminado las restricciones sobre los estados. De
esta manera el problema sin restriccion terminal no presenta restricciones en los estados
(restricciones no lineales sobre las actuaciones) mientras que el problema con restriccion
terminal s las presenta. Esta diferencia, como se vera mas adelante, supone un ahorro
sustancial de calculo.
Para el ejemplo se va a considerar como matrices de ponderacion

Q=

10

10

R=1

y como funcion de coste terminal y region terminal las utilizadas hasta ahora. El
horizonte de control es Nc = 10 y el horizonte de prediccion se considera igual al de
control. Con estos parametros se calcula la constante d que toma el valor 7
d = min (P 1/2 QP 1/2 ) = 0,3316
7

En la seccion 4.6 se demuestra que d = min (P 1/2 QP 1/2 ) .

86

3.10. Conclusiones

por lo que la region en la que se puede eliminar la region terminal es

= {x IRn : J10
(x) 10d + = 12,6508}

Para el reactor se han probado distintos estados iniciales contenidos en dicha region.
En la tabla siguiente se muestran los valores de las operaciones en punto flotante (flops)
requeridas para la resolucion del problema sin y con restriccion terminal. Estos valores
corresponden a la resolucion del problema utilizando la funcion fmincon de la biblioteca
de optimizacion de MATLAB.
x0

J10
(x0 ) flops sin R.T.

(0,2, 0,3)

12.267

(0,25, 0,2)

flops con R.T.

ratio( %)

957794

1743184

54.94

11.898

796123

1505492

52.88

(0,27, 0,1)

12.210

698281

1324588

52.71

(0,24, 0,1)

11.755

781474

1483264

52.68

(0,1, 0,34)

12.391

790154

1499478

52.69

(0,0, 0,375)

11.881

885181

1670070

53.00

(0,2, 0,275)

11.961

896235

1696148

52.83

(0,25, 0,1)

10.741

827263

1544369

53.56

El ratio calculado (razon entre flops sin restriccion terminal y con ella) pone de
manifiesto que el ahorro computacional es importante y ademas se logra sin perdida
de optimalidad, pues la solucion en cada caso es la misma.
En la figura 3.19 se muestra la evolucion del sistema partiendo de un estado inicial
(0,2, 0,3). En la figura 3.20 se muestra la evolucion del coste optimo, que como se ha
demostrado, es monotonamente decreciente, lo que garantiza la convergencia.

3.10.

Conclusiones

En este captulo se ha analizado la estabilidad del MPC de la formulacion general


del MPC en la que se ha establecido el procedimiento de analisis que es com
un en los
restantes analisis de estabilidad. Basandose en esta se proponen dos nuevas formulaciones del MPC con estabilidad garantizada: la formulacion con un mayor horizonte
de prediccion y la formulacion basada en el coste con horizonte cuasi-infinito. Se ha
analizado tambien el comportamiento de los controladores propuestos en cuanto a su
optimalidad. De este analisis se desprende que el aumento del horizonte de prediccion,

Captulo 3. Nuevas formulaciones del MPC con estabilidad garantizada

87

0.1

x1

0
0.1
0.2
0

10

15

20

25

30

35

40

45

50

10

15

20

25

30

35

40

45

50

10

15

20

25

30

35

40

45

50

x2

0.4
0.2
0

0.5

0
0.5
1

muestras

Figura 3.19: Evolucion del sistema en bucle cerrado con MPC sin restriccion terminal.
1.5

0.5

log10 J*

0.5

1.5

2.5

10

15

20

25

30

35

40

45

50

muestras

Figura 3.20: Evolucion del coste optimo del MPC sin restriccion terminal.

as como la consideracion del coste terminal cuasi-infinito suponen un acercamiento a


la optimalidad y por lo tanto una mejora del comportamiento.
Tambien se ha abordado la estabilidad asintotica en caso de suboptimalidad de la
solucion, demostrandose esta basandose en el analisis anterior y relajandose la condicion
para la estabilidad originalmente impuesta. Por u
ltimo se ha estudiado la estabilidad
del controlador MPC en ausencia de restriccion terminal, lo cual es especialmente
interesante en caso de sistemas sin restricciones en los estados. Se han obtenido nuevos
resultados generalizado otros existentes a la formulacion general del MPC y se ha
caracterizado las regiones en las que el controlador estabiliza al sistema.

88

3.10. Conclusiones

Asociado al concepto de estabilidad asintotica del controlador esta el concepto de

invariancia y en particular el concepto de dominio de atraccion del mismo. Este


conjunto es la region en la que el sistema es asintoticamente estabilizable por el controlador,
y por lo tanto, cuanto mayor sea mayor sera la validez del controlador. El captulo
siguiente esta dedicado al estudio del dominio de atraccion del controlador y en el se
proponen procedimientos y nuevas formulaciones orientadas a su aumento.

Captulo 4
Aumento del dominio de atracci
on
del MPC
4.1.

Introducci
on

Como se ha mostrado en captulos anteriores, bajo ciertas condiciones, el MPC


estabiliza asintoticamente el sistema garantizando la satisfaccion de las restricciones
impuestas a los estados y actuaciones a lo largo de la evolucion del mismo. Estas
restricciones, as como la propia naturaleza del sistema, pueden hacer que no todos
los estados sean estabilizables por el controlador. El sistema sera por tanto localmente
estable en una determinada region, denominada dominio de atraccion, que es ademas
un invariante positivo del sistema controlado.
El conocimiento de este conjunto es importante pues representa el dominio de validez
del controlador, de forma que, si la planta partiese de estados fuera del mismo, el
controlador no sera apropiado, haciendose necesario el dise
no de un nuevo controlador
valido para ese estado. Por tanto, cuanto mayor sea esta region, mayor sera el conjunto
de estados estabilizables por el controlador, lo cual es notablemente beneficioso.
En este captulo se aborda el analisis del dominio de atraccion del MPC orientado
a su aumento. Este es un problema que no se ha tratado monograficamente en la
literatura, en la que s se pueden encontrar resultados aislados sobre el dominio de
atraccion de las formulaciones existentes (Mayne 2001, Magni, De Nicolao, Magnani &
Scattolini 2001, Kerrigan & Maciejowski 2000, Keerthi & Gilbert 1988).
Para ello, se parte del analisis del dominio de atraccion del MPC desde el punto
de vista de la teora de conjuntos invariantes, y se pone de manifiesto que paramet89

90

4.1. Introduccion

ros influyen sobre el. A partir de estos, se proponen procedimientos encaminados al


aumento del dominio de atraccion del controlador sin aumento significativo del coste
computacional. As se pueden establecer tres medidas a tomar: aumento de los horizontes, variacion del coste terminal y variacion de la restriccion terminal.
En esta u
ltima medida se proponen nuevas formulaciones del MPC considerando
restricciones terminales contractivas, basadas en conjuntos invariantes positivos e invariantes de control. Esta u
ltima formulacion ha sido publicada en (Limon Marruedo,

Alamo
& Camacho 2002a). Tanto el analisis del aumento de atraccion, como las nuevas
formulaciones introducidas en este captulo son aportaciones originales de esta tesis.
La organizacion de las medidas llevadas a cabo en este captulo se ilustran en el
siguiente diagrama:

Aumento del
dominio de
atraccin del MPC

Incremento de
los horizontes

Horizonte
de control

Horizonte
de prediccin

Modificacin
del coste terminal

cuasi-infinito

ponderado

Restriccin
terminal
contractiva

invariantes
positivos

invariantes
de control

Figura 4.1: Tecnicas para el aumento del dominio de atraccion.

El captulo termina presentando procedimientos para aumentar el dominio de atraccion del MPC sin restriccion terminal que se caracterizo en el captulo anterior. Esto
tambien forma parte de las contribuciones originales de esta tesis.
Antes de proceder al cuerpo del captulo merece la pena destacar que el analisis
del dominio de atraccion se basa principalmente en la teora de conjuntos invariantes,
cuyos principales resultados se pueden consultar en la seccion A.3.

Captulo 4. Aumento del dominio de atraccion del MPC

4.2.

91

El dominio de atracci
on del MPC

La formulacion general del MPC tiene los siguientes elementos de dise


no: el horizonte de control, la funcion de coste de etapa, la funcion de coste terminal y la region
terminal. Como se ha demostrado, si se considera como region terminal un invariante
positivo del sistema y como coste terminal una funcion de Lyapunov asociada tal
que el decrecimiento de esta sea mayor que el coste de etapa incurrido (hipotesis 3.1),
entonces el controlador MPC estabiliza asintoticamente el sistema. Estas condiciones,
demostradas en el teorema 3.2, se denominan a lo largo del captulo como condiciones
suficientes de estabilidad del MPC.
La imposicion de la invariancia positiva de la region terminal garantiza que, conocida
una secuencia de actuaciones factibles en el instante k, se puede construir otra secuencia
factible para el instante siguiente k + 1. Por tanto si el estado inicial es tal que el
problema de optimizacion tiene solucion (es factible), entonces dicho problema tiene
solucion a lo largo de la trayectoria del sistema. En consecuencia, el conjunto de estados
para los cuales el problema de optimizacion es factible es un invariante positivo del
sistema en bucle cerrado y, por lo tanto, el dominio de atraccion del controlador.
Ademas para todo estado en el cual el problema no tiene solucion, el controlador
no esta definido. De aqu se deduce que el conjunto factible es el mayor dominio de
atraccion posible del sistema.
Seg
un lo anterior, el dominio de atraccion del controlador XN sera el conjunto de
estados para los cuales el problema de optimizacion es factible. Este conjunto depende
exclusivamente del conjunto de restricciones del problema de optimizacion y no del
funcional a optimizar. Entonces, el coste de etapa L(x, u) y la funcion de coste terminal
no influyen en el dominio de atraccion. Tampoco depende, por tanto, de la optimalidad
de la solucion, pues basta con que dicha solucion sea factible.
El conjunto de restricciones del MPC en su formulacion general con un horizonte
de control N son
u(k + j|k) U

j = 0, , N 1

x(k + j|k) X

j = 0, , N 1

x(k + N |k)

Un estado xk pertenece al conjunto factible de estas restricciones (es decir, pertenece


a XN ) si existe una secuencia de N actuaciones admisibles (u(k + j|k) U ) tal que la
evolucion del sistema es admisible (x(k + j|k) X) y alcanza el conjunto terminal
en N pasos (x(k + N |k) ). Al conjunto de estados que satisfacen las condiciones

92

4.2. El dominio de atraccion del MPC

anteriores se denomina conjunto estabilizable en N pasos SN (X, )1 . Por tanto,


XN = SN (X, )
El conjunto SN (X, ) es el maximo conjunto que satisface las condiciones anteriores.
Ademas esta contenido en el maximo conjunto estabilizable 2 SN (X, ) S (X, {0}).
En el caso en el que la region terminal no fuese un invariante positivo, entonces
se puede perder la invariancia positiva del conjunto factible, es decir, la garanta de
que, si el estado inicial es factible, el problema lo sera a lo largo de su evolucion. Este
problema es estudiado en (Kerrigan 2000) donde se establecen condiciones sobre la
region terminal para que el problema sea factible a lo largo de la evolucion del sistema.
Estos resultados estan basados en la teora de conjuntos invariantes.
En este captulo el analisis se va a centrar en el aumento del dominio de atraccion
del controlador. Para poder llevar esto a cabo es fundamental considerar que factores
del controlador influyen en el dominio de atraccion. Dado que el dominio de atraccion
XN tan solo depende del conjunto factible y no de la funcion de coste a optimizar ni
de la optimalidad de la solucion obtenida, este esta caracterizado por:
(i) El conjunto de restricciones en las actuaciones U .
(ii) El conjunto de restricciones en el estado X.
(iii) El modelo del sistema, que esta implcito en las restricciones impuestas sobre el
estado
(iv) La region terminal .
(v) El horizonte de control N .
Los tres primeros elementos forman parte de la descripcion del sistema: el modelo
de prediccion describe el sistema a controlar y las restricciones impuestas sobre las
actuaciones y estados, vienen dadas en general por lmites fsicos sobre las se
nales
del sistema, tales como saturaciones en los actuadores, temperaturas lmites en procesos,etc. Por tanto, los u
nicos parametros manipulables sobre los que se puede influir
para variar el dominio de atraccion son el horizonte N y la region terminal .
En este captulo se proponen medidas para el aumento del dominio de atraccion del
controlador, que se pueden agrupar en tres :
1

Vease la seccion A.3 para consultar la definicion del conjunto estabilizable as como sus
propiedades.
2
El maximo conjunto estabilizable, es decir, el conjunto de estados que pueden ser llevados al origen
siguiendo una evolucion admisible por un controlador admisible, es S (X, {0})

Captulo 4. Aumento del dominio de atraccion del MPC

93

1. Variacion de los horizontes (de control y de prediccion) del MPC.


2. Incorporacion de funciones de coste terminal adecuadas.
3. Modificacion de la restriccion terminal.

Como se vera a continuacion, a excepcion del aumento del horizonte de control,


estas medidas son procedimientos encaminados al aumento de la region terminal, pues,
de la propiedad de los conjuntos estabilizables se tiene que si 2 1 resulta que
SN (X, 2 ) SN (X, 1 )
Por lo tanto, un aumento de la region terminal supone un aumento del dominio de
atraccion del controlador. Ademas, dado que el calculo de la region terminal del controlador se hace fuera de lnea, esta medida no incurre en un aumento significativo
del coste computacional. Por ello, la mayora de las medidas van encaminadas en esta
direccion.

4.3.

Aumento del dominio de atracci


on mediante
los horizontes

4.3.1.

Aumento mediante el horizonte de control

Se va a considerar un controlador MPC con horizonte de control igual al horizonte


de prediccion Nc = Np = N . Entonces, como se ha mostrado en la seccion anterior, el
dominio de atraccion XN es el conjunto estabilizable del sistema en N pasos SN (X, ),
siendo N el horizonte de control. Basandose en las propiedades de este conjunto se
pueden establecer los siguientes resultados:

Teorema 4.1 (Mayne 2001) Sea un controlador MPC general con una regi
on terminal
y un coste terminal V (x), tal que satisface las condiciones suficientes de estabilidad
on del controlador satisface las siguientes
(teorema 3.2). Entonces el dominio de atracci
propiedades:

1. Para cualquier horizonte de control N 1, el dominio de atracci


on del MPC
contiene la regi
on terminal.
XN X

94

4.3. Aumento del dominio de atraccion mediante los horizontes

2. Aumentando el horizonte de control, el dominio de atracci


on aumenta
XN XN +1
3. Puede existir un horizonte N tal que para todo N N , el dominio de atracci
on
no aumenta, es decir, XN = XN

Demostraci
on:
La demostracion se basa en las propiedades del conjunto estabilizable (propiedad A.27).

1. XN = SN (X, ) X para todo N 1. Ademas SN (X, ) .


2. XN = SN (X, ) SN +1 (X, ) = XN +1 .
3. En todo sistema dinamico puede existir un ndice de determinacion N tal que
SN (X, ) = SN (X, ) = S (X, ) para todo N N . Por tanto XN = XN =
X .

La primera consecuencia de estas propiedades es que el controlador MPC tiene un


dominio de atraccion mayor que el obtenido con el controlador local. Esto permite
interpretar el control MPC como un procedimiento para aumentar el dominio de atraccion de controladores locales (ademas de introducir un criterio optimo en la obtencion
de la actuacion sobre el sistema).
La segunda consecuencia es el aumento del dominio de atraccion del controlador al
aumentar el horizonte de control. En efecto, en la mayora de los casos al aumentar
N , se puede comprobar que el dominio de atraccion aumenta. Pero esto no siempre es
as, debido a la propiedad de determinacion finita del conjunto estabilizable. Existen
plantas (como, por ejemplo, una planta lineal inestable con actuaciones limitadas) para
las cuales el conjunto estabilizable S (X, ) esta finitamente determinado, y por lo
tanto a partir de un cierto horizonte finito N , el conjunto de estados estabilizables
para un horizonte N > N no aumenta, es decir,
SN (X, ) = SN +1 (X, ) = S (X, )
En consecuencia, para estas plantas, el aumento del horizonte de control puede no
aumentar el dominio de atraccion, a partir de cierto valor del mismo.

Captulo 4. Aumento del dominio de atraccion del MPC

95

Entonces se puede afirmar que para horizontes de control inferiores al ndice de


determinacion N , el dominio de atraccion aumenta al aumentar el horizonte de control. En plantas en las que S (X, ) no esta finitamente determinado, el dominio de
atraccion aumenta para todo N .
Dado que S (X, {0}), aplicando el teorema A.28, se deduce que
S (X, ) = S (X, {0})
siendo S (X, {0}) el conjunto de estados asintoticamente estabilizables. Entonces, si
el conjunto S (X, ) esta finitamente determinado, del corolario A.29 se deduce que
el conjunto S (X, {0}) tambien esta finitamente determinado, y ademas existe un N
tal que
SN (X, ) = S (X, ) = S (X, {0})
para todo N N .
En consecuencia, un controlador MPC con horizonte finito (N N ) alcanza el
maximo dominio de atraccion posible S (X, {0}), que es el dominio de atraccion del
MPC con horizonte infinito (Keerthi & Gilbert 1988). Este horizonte sera valido para
todo estado inicial asintoticamente estabilizable.
Si S (X, {0}) no esta finitamente determinado entonces tampoco lo esta S (X, )
y por lo tanto no existe un horizonte fijo N tal que estabilice todos los estados asintoticamente estabilizables. Lo que s se verifica es que para todo estado existe un
horizonte finito que depende del estado (por ejemplo, si x Si (X, {0}), basta tomar
N = i) tal que el MPC con ese horizonte lo estabiliza.
Notese que el desarrollo anterior, viene a demostrar desde un punto de vista de
conjuntos invariantes el resultado obtenido en el teorema 3.25, en virtud del cual,
todo estado asintoticamente estabilizable (x S (X, {0})) puede ser asintoticamente
estabilizado por un controlador MPC de un horizonte N suficientemente largo, es decir,
existe un N tal que x SN (X, ).
De lo anteriormente expuesto se deriva el hecho de que aumentando el horizonte de
control, se puede aumentar el dominio de atraccion del controlador (siempre que no se
supere el ndice de determinacion de S (X, )). Este procedimiento es el que habitualmente se sigue y, como se ha comentado, con resultados satisfactorios en la mayora de
los sistemas. Sin embargo, esta tecnica tiene un gran inconveniente: el aumento del horizonte de control produce tambien un aumento del n
umero de variables de decision, y
por lo tanto un aumento de la complejidad del problema de programacion matematica
a resolver. Dado que en un problema de programacion no lineal (NLP) la necesidad
de computo crece generalmente de forma exponencial con el n
umero de variables de
decision, el tiempo de calculo del controlador puede aumentar apreciablemente. Como
es sabido, el tiempo de calculo esta limitado por el periodo de muestreo del sistema,

96

4.3. Aumento del dominio de atraccion mediante los horizontes

que depende de la dinamica que presente el sistema a controlar. Por tanto, el tiempo
de calculo del MPC esta limitado y, en consecuencia, tambien lo esta el horizonte de
control que se puede considerar. As, este procedimiento de aumento del dominio de
atraccion es costoso, y limitado.
Por este motivo, los restantes procedimientos expuestos en este captulo para aumentar el dominio de atraccion se centran en el aumento de la region terminal, que
permite aumentar el dominio de atraccion sin afectar a la dimension del problema de
optimizacion.

4.3.1.1.

Ejemplo de aplicaci
on al reactor

Para ilustrar lo anteriormente expuesto se va a aplicar el controlador MPC al reactor


continuamente agitado. Los parametros del controlador, y en consecuencia la region
terminal, utilizados en este ejemlo son los obtenidos en la seccion 3.3.2. Para este
controlador se ha calculado el dominio de atraccion del controlador para N = 3 y para
N = 4. Estas dos regiones se representan en la figura 4.2.
0.4

x2

0.4

X3

0.8

X4
1.2
0.4

0.2

0.2

Figura 4.2: Dominio de atraccion del MPC para N = 3 (X3 ) y para N = 4 (X4 ).

Como se puede observar en la misma, X3 X4 aumentandose el dominio de atraccion al aumentar N . Ademas cabe resaltar que X3 , es decir, que el controlador
MPC consigue un dominio de atraccion mayor que el conseguido con la ley de control
local.

Captulo 4. Aumento del dominio de atraccion del MPC

4.3.2.

97

Aumento mediante el horizonte de predicci


on

En el anterior captulo se presento la formulacion del MPC con un horizonte de


prediccion mayor que el horizonte de control, estableciendose condiciones suficientes
bajo las cuales el controlador estabiliza asintoticamente el sistema (teorema 3.6). La
idea clave radica en considerar el controlador local para extender la prediccion mas
alla del horizonte de control. Esta formulacion presenta una serie de propiedades que
lo hacen beneficioso, entre las que destaca el mayor grado de optimalidad conseguido.
Sin duda alguna la propiedad mas interesante que se consigue con esta formulacion es
el aumento del dominio de atraccion del controlador.
En efecto, como se comento en la seccion 3.5, el controlador MPC con horizonte de
control Nc y horizonte de prediccion Np = Nc + M formulado con una region terminal
y un coste terminal V (x), puede considerarse como un controlador MPC general
con horizonte Nc tal que la funcion de coste terminal fuese VM (x) y la region terminal
h
SM
(X, ). Esta region es el conjunto de los estados que pueden ser estabilizados a en
M pasos por la ley de control local u = h(x) de forma que la trayectoria es admisible
y las actuaciones tambien.
El conjunto estabilizable en j pasos por la ley de control u = h(x), Sjh (X, ), viene
dada por 3
h
Sjh (X, ) = Qh (Sj1
(X, )) X
siendo S0h (X, ) = . Por lo tanto se puede calcular a partir del conjunto a un paso
del sistema controlado por u = h(x), que viene dado por
Qh () = {x IRn : h(x) U y f (x, h(x)) }
el cual representa el conjunto de estados que pueden llevarse al conjunto invariante
por la ley de control u = h(x) con una actuacion admisible.
El caracter no lineal del modelo hace que en general sea imposible calcular con exactitud dicho conjunto. Por tanto, la ventaja de la formulacion con un mayor horizonte
h
de prediccion Np es la consideracion como region terminal del conjunto SM
(X, ) sin
necesidad de realizar el calculo del mismo, pues esta implcitamente impuesto en las
restricciones.
h
(X, ), se tiene que el dominio de atraccion del MPC es mayor
Dado que SM
(respecto al del controlador con horizonte de prediccion Np = Nc ). El dominio de
atraccion de este controlador se denota XNc ,Np , y depende ademas del horizonte de
prediccion. En el siguiente teorema se establece la influencia que sobre el dominio de
atraccion tiene el aumento de los horizonte de control y de prediccion.
3

Vease la seccion A.3.

98

4.3. Aumento del dominio de atraccion mediante los horizontes

Teorema 4.2 (Aumento del dominio de atracci


on) Sea un sistema y un controlador MPC tal que el coste terminal y la regi
on terminal satisfacen las hipotesis del
teorema 3.6, entonces se tiene que
XNc ,Np XNc ,Np +1 XNc +1,Np +1
y ademas
XNc ,Np XNc +1,Np XNc +1,Np +1

Demostraci
on:

De las propiedades de los conjuntos estabilizables (propiedad A.27), se tiene que si


el conjunto es un invariante positivo del sistema, Sjh (X, ) es un invariante positivo
h
del sistema controlado por el controlador local y verifica que Sjh (X, ) Sj+1
(X, ).
Ademas verifica que Sjh (X, ) Sj (X, ).
De estas propiedades tambien se deduce que el conjunto estabilizable en N pasos
verifica que
SN (X, ) = SN j (X, Sj (X, ))
Considerando las anteriores propiedades se tiene que
h
h
XNc ,Np = SNc (X, SN
(X, )) SNc (X, SN
(X, )) = XNc ,Np +1
p Nc
p Nc +1
h
h
SNc (X, S1 (X, SN
(X, ))) = SNc +1 (X, SN
(X, )) = XNc +1,Np +1
p Nc
p Nc

La segunda afirmacion es inmediata dado que


h
h
XNc ,Np = SNc (X, SN
(X, )) SNc +1 (X, SN
(X, ))
p Nc
p Nc
= XNc +1,Np XNc +1,Np +1

demostrandose el teorema.
Una teorema similar a este se puede encontrar en (Magni, De Nicolao, Magnani &
Scattolini 2001), en el que se demuestra parte del resultado aqu establecido sin utilizar
la teora de conjuntos invariantes.
Una consecuencia inmediata del teorema 4.2 es que
XNc = XNc ,Nc XNc ,Np

Captulo 4. Aumento del dominio de atraccion del MPC

99

para todo Np Nc . Es decir, que tal y como se comprobo anteriormente, la consideracion de un horizonte de prediccion mayor que el de control aumenta el dominio de
atraccion del controlador. Es importante resaltar que, dado que el n
umero de variables
de decision no se vara, el aumento de dominio de atraccion se consigue con un escaso
incremento del coste computacional. Este esfuerzo se incrementa por la incorporacion
de nuevas restricciones sobre el problema, pero es un incremento leve.

4.3.2.1.

Ejemplo de aplicaci
on al reactor

Para este ejemplo se va a considerar como region terminal la utilizada en la seccion


3.3.2 (b ). As, se han calculado los dominios de atraccion del MPC con Nc = 3 y
Np = 3 (X3 ), con Np = 4 (X3,4 ) y con Np = 10 (X3,10 ). Estos conjuntos se muestran en
la figura 4.3, en la cual se puede observar que al aumentar el horizonte de prediccion
el dominio de atraccion aumenta. Este aumento es monotono al aumentar Np , si bien
para cierto valor de Np el incremento es escaso o nulo, de hecho, a partir de Np = 10,
este incremento no es sustancial.

0.5

x2

0.5

X3

X3,4
1

X3,10
1.5

0.4

0.3

0.2

0.1

0.1

0.2

0.3

0.4

x1

Figura 4.3: Aumento del dominio de atraccion al aumentar Np .

En la figura 4.4 se muestra el dominio de atraccion X3 , X3,4 y X4 . Como se puede


observar, tal y como se demostro en el teorema 4.2, X3 X3,4 X4

100

4.4. Aumento del dominio de atraccion mediante el coste terminal


0.4

x2

0.4

X3

0.8

X3,4
X4
1.2
0.4

0.2

0.2

x1

Figura 4.4: Relacion entre X3 (lnea con puntos), X3,4 (lnea gruesa) y X4 (lnea con cruces).

4.4.

Aumento del dominio de atracci


on mediante el
coste terminal

En esta seccion se van a presentar un par de procedimientos de aumento del dominio de atraccion mediante la modificacion del coste terminal. Esto puede resultar
contradictorio con el desarrollo llevado a cabo en la seccion 4.2, en el que se afirmo que
el dominio de atraccion no depende del funcional a optimizar.
Sin embargo, para que el controlador MPC estabilice asintoticamente el sistema,
la funcion de coste terminal y la region terminal deben satisfacer la hipotesis 3.5. Por
lo tanto, una modificacion adecuada de la funcion de coste terminal, puede llevar a
encontrar una mayor region terminal en la que se satisfacen las condiciones suficientes
de estabilidad, y de esta forma aumentar el dominio de atraccion.
Por lo tanto, las modificaciones que se presentan a continuacion estan encaminadas
al aumento de la region terminal y por consiguiente, del dominio de atraccion.

4.4.1.

Incorporaci
on del coste terminal cuasi-infinito

Considerese un controlador local u = h(x) que estabiliza asintoticamente el sistema,


una funcion de Lyapunov asociada V (x) y una region (invariante positivo) tales que

Captulo 4. Aumento del dominio de atraccion del MPC

101

satisfacen la hipotesis 3.5. Como se demostro en la seccion 3.5, a partir de estos se


puede obtener otra funcion VM (x), denominada funcion de coste cuasi-infinito, dada
por
VM (x) =

j=M
X1

Lh (xh (i + j|i)) + V (xh (i + M |i))

(4.1)

j=0

siendo xh (i + j|i) la prediccion del sistema controlado por la ley de control local
u = h(x) considerando x(i|i) = x.
Esta funcion es tambien una funcion de Lyapunov para el sistema controlado por
la ley de control u = h(x) y tal que satisface la condicion terminal en el conjunto
h
(X, ). El conjunto invariante a utilizar como region terminal se puede aumenSM
h
tar aproximandose a SM
(X, ), aumentando, por tanto, el dominio de atraccion del
controlador MPC con VM (x) como coste terminal.
Como se comento anteriormente, para incorporar este conjunto como region terminal, basta con considerar un horizonte de prediccion Np = Nc + M . Sin embargo hay
ocasiones en las que la consideracion de un horizonte de prediccion Np > Nc puede no
ser deseable. Esto se puede deber al hecho de que esto supone aumento de restricciones
en los estados y por lo tanto un incremento del coste computacional en lnea. Este
problema es mas acusado cuando el problema no presenta restricciones en los estados.
En estas ocasiones, puede resultar interesante el aumento del dominio de atraccion
considerando el coste terminal cuasi-infinito.
Para determinar una region terminal asociada, basta con encontrar una constante
M > 0 tal que el conjunto
M = {x IRn : VM (x) M }
h
este contenido en SM
(X, ). Esto se puede realizar mediante el siguiente procedimiento:
se calcula el conjunto factible X h (que se supone convexo) y se resuelve el siguiente
problema de minimizacion

= mn
x

s.a

VM (x)
x
/ Xh

Entonces para todo M , se tiene que M X h .


h
(X, ), basta con tomar M = mn(, M d + ),
Para garantizar que M SM
siendo = {x IRn : V (x) } y d una constante positiva tal que Lh (x) d para
todo x
/ . La condicion M d + es una consecuencia inmediata de la siguiente
propiedad.

102

4.4. Aumento del dominio de atraccion mediante el coste terminal

Propiedad 4.3 Sea la ley de control u = h(x) tal que estabiliza asintoticamente el
sistema, sea V (x) una funcion de Lyapunov asociada y sea X h un invariante
positivo asociado de la forma
= {x IRn : V (x) }
tal que V (x) y satisfacen la hipotesis 3.5. Sea VM (x) la funcion de Lyapunov definida
on
por (4.1). Sea la regi
M = {x IRn : VM (x) M d + }
siendo d una constante positiva tal que Lh (x) d para todo x
/ .
Entonces para todo x M la ley de control u = h(x) lleva al sistema a en M
pasos (o menos).

Demostraci
on:
Supongamos que VM (x) es menor que M d + y la prediccion en el instante M es tal
que xh (i + M |i)
/ . Del principio de invariancia se tiene que x(i + j|i)
/ para todo
j = 0, , M 1, pues si en alg
un instante el sistema entrase en , permanecera en
el. Entonces se tiene que
VM (x) =

j=M
X1

Lh (xh (i + j|i)) + V (xh (i + M |i)) M d +

j=0

y por tanto
V (xh (i + M |i))

j=M
X1

{d Lh (xh (i + j|i))} +

j=0

Dado que xh (i + j|i)


/ se tiene que Lh (xh (i + j|i)) d. En consecuencia
V (xh (i + M |i))
lo que contradice la hipotesis, demostrandose la propiedad.
En consecuencia se puede calcular un conjunto invariante positivo M tal que
M y ademas el coste terminal cuasi-infinito VM (x) y la region M satisfacen
la hipotesis 3.5.

4.4.2.

Aumento de la regi
on terminal ponderando el coste terminal

Como se mostro en la seccion 3.7, el procedimiento habitual para obtener la region


terminal y el coste terminal asociado V (x) suele ser:

Captulo 4. Aumento del dominio de atraccion del MPC

103

1. Calcular una ley de control u = h(x) localmente estabilizante.


2. Obtener una funcion de Lyapunov asociada V (x).
3. Calcular la region = {x IRn : V (x) } X h tal que para todo x
V (f (x, h(x))) V (x) L(x, h(x))

(4.2)

Esta region debe estar contenida en X h para garantizar que tanto las actuaciones
como la evolucion del sistema son admisibles.
El tama
no de la region suele estar limitado por la condicion de convergencia (4.2),
de forma que, cuanto mayor sea la tasa de decrecimiento impuesta a la funcion de
Lyapunov, menor sera la region terminal .
Si el coste terminal V (x) se multiplica por una constante 1, entonces el coste
ponderado
V (x) = V (x)
es tambien una funcion de Lyapunov asociada al controlador local u = h(x), pues V (x)
es definida positiva por serlo V (x) y ser > 0 y ademas, si V (f (x, h(x))) < V (x),
entonces V (f (x, h(x))) < V (x).
La condicion de convergencia para el coste terminal V (x) es
V (f (x, h(x))) V (x) = V (f (x, h(x))) V (x) L(x, h(x))
que se traduce en

1
V (f (x, h(x))) V (x) L(x, h(x))

dado que 1, entonces la tasa de decrecimiento impuesta se reduce, y por lo tanto,


aumentara la region en la que se satisface dicha condicion. En consecuencia la region
terminal asociada a V (x) sera mayor que la asociada a V (x), y por lo tanto el dominio
de atraccion aumenta.
Es importante resaltar, que la ponderacion de este coste desvirt
ua su caracterstica
de aproximacion al coste infinito. Por lo tanto, el controlador obtenido tendra un mayor
dominio de atraccion, pero a costa de empobrecer la optimalidad de la evolucion del
sistema.

4.4.2.1.

Ejemplo de aplicaci
on al reactor

Para el calculo de la region terminal y el coste terminal se utilizan los resultados


obtenidos en la seccion 3.7. En esta seccion se calcula un controlador local lineal a

104

4.4. Aumento del dominio de atraccion mediante el coste terminal

partir del modelo linealizado y se calcula la funcion de Lyapunov asociada. A partir de


esta se toma una region terminal de la forma
= {x IR2 : xT P x }
siendo

P =

132,9406 24,6980
24,6980

62,9982

Como se mostro en el ejemplo de dicha seccion, al aumentar , la constante crece,


siendo por tanto mayor el tama
no de la region terminal tal y como se ha expuesto. As,
considerando a = 1,1, la region terminal a viene dada por a = 0,5. Si se considera
como ponderacion b = 2,0, la region terminal b que viene dada por b = 4,66, que
es la region utilizada en ejemplos anteriores.
En la figura 4.5 se pueden observar ambas regiones terminales, de forma que a
b . Se muestran ademas los dominios de atraccion del MPC con un horizonte de control
N = 3 utilizando como region terminal a (X3a ) y el dominio utilizando b (X3b ). Como
se ha demostrado, el dominio de atraccion del MPC con la mayor region terminal es
mayor que el dominio del otro MPC (X3a X3b ).

0.4

0.2

0.2

x2

0.4

Xa3
0.6

Xb
3

0.8

1
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 4.5: Dominio de atraccion del MPC con N = 3 con a como region terminal (X3a ) y
con b (X3b ).

Captulo 4. Aumento del dominio de atraccion del MPC

4.5.

105

Aumento del dominio de atracci


on mediante la
restricci
on terminal

A continuacion se presentan dos controladores originales basados en la sustitucion


de la restriccion terminal por otra cuyo fin es el aumento del dominio de atraccion del
controlador (conservando por lo tanto la estabilidad asintotica del controlador resultante).

4.5.1.

Aumento del dominio de atracci


on mediante una regi
on
terminal contractiva

En este apartado se presenta una formulacion del MPC que aumenta el dominio
de atraccion del controlador incorporando una region terminal, en la que no tiene por
que cumplirse la condicion terminal y que se contrae en cada instante. Esta estrategia
garantiza la estabilidad y la factibilidad del MPC en cada instante y no a
nade coste
computacional en la resolucion del problema asociado. Este controlador es una de las
aportaciones originales de esta tesis.
Se va a considerar en este caso que existe un controlador local u = h(x) que estabiliza exponencialmente el sistema, con una funcion de Lyapunov asociada V (x) y un
conjunto invariante
= {x IRn : V (x) } X h
tales que satisfacen las condiciones suficientes de estabilidad del MPC dadas por la
hipotesis 3.5. Entonces existe una region
= {x IRn : V (x) } X h
siendo (y por tanto ) tal que para todo x , se satisface que
V (f (x, h(x))) < V (x)
siendo [0, 1). Por lo tanto es un invariante positivo en el que el sistema en bucle
cerrado es exponencialmente estable y en el que no tiene por que cumplirse la condicion
de convergencia de la hipotesis 3.5. Cabe resaltar que el procedimiento de calculo del
invariante propuesto en la seccion 3.7 garantiza todas estas condiciones.
Bajo estas condiciones se puede formular un controlador MPC tal que se considera
como coste terminal V (x) y como restriccion terminal
V (x(k + N |k)) k

106

4.5. Aumento del dominio de atraccion mediante la restriccion terminal

Esta restriccion terminal es una restriccion contractiva, en el sentido en el que en


cada instante la secuencia de actuaciones debe conducir al sistema a una region cada
vez mas peque
na.
Este controlador no sigue la formulacion general del MPC, pues la region terminal
cambia en cada instante y ademas no cumple la hipotesis 3.5 y por lo tanto el controlador MPC no garantiza la estabilidad. En consecuencia, es necesario demostrar que
el controlador propuesto estabiliza asintoticamente al sistema, lo cual se hace en el
siguiente teorema.

Teorema 4.4 (Estabilidad asint


otica)
Sea un sistema dado por
xk+1 = f (xk , uk )
tal que los estados y las actuaciones estan sujetas a las restricciones xk X y uk U .
Sea un controlador u = h(x) que estabiliza exponencialmente el sistema y tiene una
funcion de Lyapunov V (x) asociada tal que
(i) Existe una regi
on X h , en la cual se satisface la hipotesis 3.5 y que tiene la
forma
= {x IRn : V (x) }
(ii) Existe una regi
on X h
= {x IRn : V (x) }
tal que > (por lo tanto ) y tal que para todo x existe una
constante [0, 1) tal que
V (f (x, h(x))) V (x)
Entonces el controlador MPC con coste terminal V (x) y restricci
on terminal
V (x(k + N |k)) k
estabiliza asintoticamente el sistema con un dominio de atracci
on XN = SN (X, ).

Demostraci
on:
Factibilidad:
Se va a proceder por induccion.

Captulo 4. Aumento del dominio de atraccion del MPC

107

Sea un estado inicial x0 SN (X, ), entonces existe una secuencia de N actuaciones


tales que conducen al sistema a , y por lo tanto el problema de optimizacion es
factible, satisfaciendo la restriccion terminal
V (x(k + N |k))

En el instante siguiente k = 1, existe una secuencia factible uF (1) calculada a partir


de la secuencia optima uF (0) dada por

u (j|0)
j = 1, , N 1
u(j|1) =
h(
x(N |1)) j = N

Dado que x1 = x (1|0), se tiene que x(j|1) = x (j|0) para todo j = 1, N . Entonces
el estado predicho satisface V (
x(N |1)) . Al aplicar a partir de este instante el
controlador local, se tiene que el estado terminal verifica V (
x(N + 1|1)) , por lo
que en x1 el problema de optimizacion es factible.
Considerese que el problema es factible en el instante k, entonces de manera analoga
se puede obtener una secuencia factible uF (k + 1), a partir de la solucion optima en k
uF (k) dada por

u (k + j|k)
u(k + j|k + 1) =
h(
x(k + N |k + 1))

j = 1, , N 1
j=N

Dado que xk+1 = x(k + 1|k), se tiene que x(k + j|k + 1) = x (k + j|k) para todo
j = 1, N . Por lo tanto se tiene que
V (
x(k + N |k + 1)) k
Al aplicar la ley de control local en el estado x(k + N |k + 1), se tiene que
V (
x(k + N + 1|k + 1)) V (
x(k + N |k + 1)) k+1
y por lo tanto el problema de optimizacion es factible.
Por induccion se deriva que el problema es factible a lo largo de la trayectoria del
sistema para todo x0 SN (X, ).
Convergencia:
Esta propiedad se deriva del hecho de que existe una region ( ) en la
cual se satisface la condicion terminal 4.2. Dado que en todo instante k, existe una
solucion tal que
V (x (k + N |k)) k

108

4.5. Aumento del dominio de atraccion mediante la restriccion terminal

existe un instante k tal que k . Por tanto a partir de ese instante, el MPC
satisface la condicion terminal, y por el teorema de estabilidad del MPC (teorema 3.2),
el controlador estabiliza asintoticamente el sistema.
Este controlador establece un procedimiento para extender la region terminal al
maximo conjunto invariante contenido en X h . Por tanto el dominio de atraccion
del controlador aumenta, respecto a la formulacion general. Ademas es de resaltar el
hecho de que el controlador estabiliza asintoticamente el sistema sin necesidad de que
se satisfaga la condicion terminal en dicho invariante.

4.5.1.1.

Ejemplo de aplicaci
on al reactor

Partiendo del ejemplo del apartado 4.4.2, se observa que el conjunto a es un


invariante positivo del sistema, para el cual la funcion de Lyapunov asociada V (x) =
xT Pa x viene dada por Pa = 1,1P , siendo P la matriz de Lyapunov obtenida del
problema linealizado controlado por un controlador LQR. El dominio de atraccion
asociado a esta region terminal es X3a .
El dominio de atraccion del controlador se puede aumentar dicha region ponderando
la funcion de Lyapunov, de forma que para b = 2,0, se obtiene la region b notablemente mas grande. El controlador MPC con una funcion de coste terminal dada por
Pb = 2,0P estabiliza asintoticamente el sistema con un dominio de atraccion mayor
X3b . Pero, la ponderacion aplicada sobre el coste terminal hace que la optimalidad de
la solucion empeore dado que la funcion de coste terminal se empobrece como aproximacion al coste optimo.
Aplicando en controlador propuesto, se puede conseguir estabilizar el sistema en el
dominio de atraccion X3b utilizando como coste terminal V (x) = xT Pa x que es mas
aproximada a la solucion optima. Para ello se considera una region terminal contractiva
de la forma
xT Pa x k
siendo = 1,1 4,667 = 5,134 y = 1,1 0,5 = 0,55. La constante indica el factor
de decrecimiento de la funcion de Lyapunov y toma un valor = 0,9223.
En la figura 4.6 se muestra el retrato de fases del sistema controlado por el MPC con
region terminal contractiva. Como se puede observar, el dominio de atraccion es X3b , a
pesar que la condicion terminal tan solo se satisface en a . La restriccion terminal se
contrae sucesivamente partiendo de b hasta a .
En la figura 4.7 se muestra la evolucion del sistema controlado por el MPC propuesto

Captulo 4. Aumento del dominio de atraccion del MPC

109

con region terminal contractiva (lnea con puntos) y del sistema controlado con el
MPC general con una funcion de coste terminal adecuada V (x) = 2xT P x (lnea con
cuadros). La trayectoria con lnea con cruces es la evolucion del sistema con Nc =
10, Np = 10 y un coste terminal cuasi infinito V30 (x). Como se ha demostrado, esta
trayectoria tiene un grado de optimalidad mayor que las otras dos, y por lo tanto
supone un comportamiento mas proximo al optimo.
0.4

0.2

0.2

x2

0.4

Xa3
0.6

X3
0.8

1
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 4.6: Retrato de fases y dominio de atraccion del MPC con N = 3 y con region
terminal contractiva.

4.5.2.

MPC con regi


on terminal contractiva basada en invariantes de control

En esta seccion se presenta una nueva formulacion de control MPC orientada al


aumento del dominio de atraccion mediante la incorporacion como restriccion terminal
la pertenencia a una secuencia contractiva de regiones invariantes de control. Esta
formulacion del controlador MPC forma parte de las contribuciones originales de esta

tesis y ha sido publicada en (Limon Marruedo, Alamo


& Camacho 2002a).
La idea es similar a la que se ha presentado en la seccion 4.5.1, en la que a partir
de un invariante positivo se contrae dicha region hasta alcanzar una region en la que
se satisface la condicion terminal. En este caso, se propone una generalizacion de esta
idea incorporando el concepto de regiones invariantes de control. Basandose en las
propiedades de estos conjuntos, es posible determinar una secuencia de invariantes de
control tales que permiten una formulacion contractiva del MPC.

110

4.5. Aumento del dominio de atraccion mediante la restriccion terminal

b
0

Xb3
0.1

x2

0.2

0.3

0.4

0.5

0.6
0.25

0.2

0.15

0.1

0.05

0.05

x1

Figura 4.7: Evolucion del sistema controlado por el MPC con N = 3, con region terminal
contractiva (puntos), con la region terminal fija b (cuadrados) y con un MPC con Np =
Nc = 10 y V30 (x) (cruces).

4.5.2.1.

Obtenci
on de una secuencia de invariantes de control

Para obtener una secuencia de invariantes de control se hace uso de la teora de


conjuntos invariantes. Un compendio de definiciones y resultados de esta teora se
puede consultar en la seccion A.3 de este documento. A continuacion se presentan
algunas de ellas que son de utilidad en esta seccion.
Un conjunto IRn se dice que es un invariante de control, si para cualquier
estado contenido en , existe una actuacion admisible u(x) U tal que el estado
siguiente permanece en el, f (x, u) .
La obtencion de invariantes de control esta basada en el conjunto a un paso Q().
Este conjunto viene dado por
Q() = {x IRn : u(x) U

tal que f (x, u) }

es decir, el conjunto de estados para los cuales existe una actuacion admisible tal que
el estado siguiente esta contenido en .
Teniendo en cuenta lo anterior, se puede establecer la siguiente propiedad
Propiedad 4.5 Sea X un invariante de control del sistema y sea Q() su con-

Captulo 4. Aumento del dominio de atraccion del MPC

111

junto a un paso, entonces todo conjunto tal que


Q() X

(4.3)

es un invariante de control del sistema.


Esta propiedad es inmediata, considerando el principio de invariancia y la definicion
del conjunto a un paso. La interseccion con el conjunto de restricciones sobre el estado
X es necesario para garantizar que la evolucion del sistema es admisible.
Esta propiedad se verifica tambien si es un invariante positivo, pues esta basado
en la propiedad geometrica de invariancia. En general, el calculo del conjunto Q()
es muy costoso, si no imposible, debido al caracter no lineal del modelo. Pero, gracias
a la propiedad anterior, este conjunto puede sustituirse por un conjunto aproximado Qap (). Este conjunto aproximado debe ser lo suficientemente preciso como para
garantizar que
Qap () Q()
con el fin de que el conjunto = Qap () X satisfaga la condicion (4.3).
De todo lo anterior se deduce que mediante el siguiente algoritmo es posible obtener una secuencia de Nr invariantes de control, partiendo de un conjunto invariante
(positivo o de control) .
1. Hacer 0 = . i 0
2. Calcular i = Qap (i1 ) X i1
3. Si i = Nr ir a 5
4. Si no, hacer i i + 1 e ir a 2
5. Fin
Notese que el procedimiento para calcular Qap () debe ser lo suficientemente preciso
como para que el paso 2 tenga solucion.
De este algoritmo se obtienen Nr conjuntos invariantes de control tales que satisfacen las siguientes propiedades
Propiedad 4.6 Sea {i } la secuencia de Nr invariantes de control obtenidos del algoritmo anterior, entonces

112

4.5. Aumento del dominio de atraccion mediante la restriccion terminal

1. 0 = 1 Nr X.
2. Para todo x i existe una actuacion admisible u U tal que f (x, u) i1 .
3. i Si (X, ).
4. Si el calculo de la regi
on a un paso es exacta (Qap () = Q()), entonces i =
Si (X, ).

Es interesante resaltar que esta secuencia de invariantes de control puede estar finitamente determinada, es decir, que exista un i tal que para todo i i , resulta que
i = i+1 = . En consecuencia, la secuencia de invariantes de control dejara de
crecer. Esto puede ser a consecuencia de la determinacion finita de Si (X, ), es decir, de la propia naturaleza del sistema y de las restricciones, o bien por el caracter
aproximado del calculo de Qap ().
Para el caso de sistemas lineales sujetos a restricciones politopicas, existen procedimientos numericamente eficientes para realizar el calculo del conjunto Q() con
exactitud (Blanchini 1999, Kerrigan 2000). En el caso de sistemas no lineales, no existen procedimientos para el calculo de estos conjuntos, y es un tema abierto en la
comunidad investigadora. En el apendice A de esta tesis, se propone un metodo para
su calculo aproximado basado en la obtencion de una envoltura convexa y en la resolucion de problemas de optimizacion. La complejidad del procedimiento obtenido para
el calculo de estos conjuntos no es crtico en la implementacion del controlador pues el
calculo se realiza fuera de lnea, formando parte de la etapa de dise
no del controlador.

4.5.2.2.

MPC con restricci


on terminal contractiva

Sea una funcion de Lyapunov de control V (x) y un conjunto invariante de control


tales que satisfacen la hipotesis 3.1, y por lo tanto pueden utilizarse para sintonizar
un controlador MPC general con estabilidad garantizada.
Considerese que, a partir del conjunto invariante de control , se calcula una secuencia de Nr invariantes de control {i } utilizando el algoritmo propuesto en el apartado
anterior. A partir de esta secuencia se puede formular el siguiente problema de optimizacion MPC:

Captulo 4. Aumento del dominio de atraccion del MPC

113

mn JN (xk , uF (k))

uF (k)

s.a
u(k + j|k) U

j = 0, , N 1

x(k + j|k) X

j = 0, , N 1

x(k + N |k) Nr k si k < Nr


x(k + N |k)

si k Nr

siendo el funcional a optimizar


JN (xk , uF (k)) =

N
1
X

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

i=0

Como se puede observar, la u


nica variacion que tiene el MPC propuesto, respecto
a la formulacion general del MPC esta en la restriccion terminal. Para k < Nr , la
restriccion contractiva fuerza al estado terminal a estar contenido en el invariante de
control Nr k . El caracter contractivo de esta secuencia hace que la region terminal vaya
evolucionando a una region menor, hasta que en el instante Nr , esta region terminal es
el invariante de control .
La solucion de este problema depende del instante en el que nos encontremos, por
lo que, para k < Nr , la ley de control MPC es variante en el tiempo. A partir de Nr ,
coincide con la formulacion general del MPC. Ademas, cabe destacar que este problema
es computacionalmente similar al MPC general, si bien requiere tener almacenada la
secuencia de invariantes de control.
Antes de demostrar la estabilidad del controlador propuesto, es necesario establecer
el siguiente lema.
Lema 4.7 Sea {i } una secuencia de invariantes de control calculados a partir del
algoritmo propuesto. Entonces se satisface que
SN 1 (X, i ) SN (X, i1 )

Demostraci
on:

De las propiedades de la secuencia de invariantes de control se tiene que


i = Qap (i1 ) X Q(i1 ) X = S1 (X, i1 )

114

4.5. Aumento del dominio de atraccion mediante la restriccion terminal

Dado que el conjunto estabilizable en N pasos verifica la siguiente propiedad (vease la


seccion A.3)
SN (X, ) = SN j (X, Sj (X, ))
se deduce que
SN 1 (X, i ) SN 1 (X, S1 (X, i1 )) = SN (X, i1 )
con lo que se demuestra el lema.
Basandose en este lema, se demuestra que el nuevo controlador propuesto estabiliza
asintoticamente el sistema en todo estado inicial para el cual el problema de optimizacion tiene solucion factible.

Teorema 4.8 (Estabilidad asint


otica)
Sea una funcion de Lyapunov de control V (x) y un conjunto invariante de control
asociado tales que satisfacen la hipotesis 3.5.
Sea una secuencia de Nr invariantes de control {i } obtenida a partir del conjunto
invariante de control utilizando el algoritmo propuesto.
Entonces el controlador MPC con restricci
on terminal contractiva estabiliza asintoticamente el sistema con un dominio de atracci
on SN (X, Nr ).

Demostraci
on:
Factibilidad:
Se procede por induccion.
Sea el estado inicial tal que x0 SN (X, Nr ), entonces por definicion de conjunto estabilizable, existe una secuencia de actuaciones admisibles tal que el sistema es conducido
hasta el conjunto Nr en N pasos siguiendo una evolucion admisible. Por tanto el problema de optimizacion es factible en ese instante. Dado que no existe discrepancias
entre el modelo de prediccion y el comportamiento del sistema,
x1 = f (x0 , u (0|0)) SN 1 (X, Nr )
Del lema 4.7 se deduce que x1 SN (X, Nr 1 ) y por lo tanto, el controlador es factible
en k = 1.
Considerese que el problema es factible en k < Nr , es decir, que xk SN (X, Nr k ).
Entonces la solucion optima garantiza que
xk+1 = f (xk , u (k|k)) SN 1 (X, Nr k )

Captulo 4. Aumento del dominio de atraccion del MPC

115

Del lema 4.7 se deduce que xk+1 SN (X, Nr k1 ) y por lo tanto, el controlador
es factible en k + 1.
Por induccion se infiere que el problema es factible para todo k Nr .
Notese ademas que xNr SN (X, ). Por tanto para k > Nr la factibilidad esta garantizada por la estabilidad del MPC general.
Convergencia:
Como se ha visto anteriormente, la evolucion del sistema es tal que es factible a lo
largo de la evolucion del sistema y ademas, para k > Nr , el controlador coincide con la
formulacion general del MPC y es factible. Por lo tanto el sistema a partir de entonces
evoluciona asintoticamente hacia el punto de equilibrio.

Corolario 4.9 Dado que la estabilidad y la convergencia estan basadas en la factibilidad del problema, la formulacion suboptima de este controlador, tambien garantiza la
convergencia, bajo las hipotesis del teorema anterior, manteniendo el mismo dominio
de atracci
on.
El objetivo final de este controlador es aumentar el dominio de atraccion. Esta
propiedad se establece en el siguiente corolario.
Corolario 4.10 Sea la secuencia de invariantes de control tal que Nr y sea el
horizonte de control menor que el ndice de determinacion del conjunto estabilizable
S (X, ). Entonces el dominio de atracci
on del MPC propuesto es mayor que el del
controlador MPC general. Es decir
SN (X, ) SN (X, Nr )

Demostraci
on:
Dado que Nr y que el horizonte de control es menor que el ndice de determinacion
N < i , es inmediato que
SN (X, ) SN (X, Nr ) SN +Nr (X, )
Por lo tanto, en el caso en que el conjunto S (X, ) no este finitamente determinado, o
bien el horizonte de control N sea inferior al ndice de determinacion i , el controlador
propuesto aumenta el dominio de atraccion.

116

4.5. Aumento del dominio de atraccion mediante la restriccion terminal

Notese que para un horizonte de control tal que N i se tiene que SN (X, ) =
SN +Nr (X, ) = Si (X, ) = S (X, ). Por lo tanto, del resultado anterior se deduce
que SN (X, ) = SN (X, Nr ), por lo que el dominio de atraccion no aumenta al incorporar la secuencia.
Es interesante resaltar que, en el caso en que se pudiese calcular con exactitud el
conjunto Q(), entonces la secuencia de invariantes de control es i = Si (X, ). Por lo
que el dominio de atraccion del controlador es SN +Nr (X, ). Por tanto, tiene el mismo
dominio de atraccion que un MPC general con horizonte de control N + Nr , pero
utilizando tan solo un horizonte de control N . Esto es particularmente interesante para
sistemas lineales sujetos a restricciones politopicas, para los cuales se puede calcular
estos conjuntos con exactitud.
El precio a pagar por el aumento del dominio de atraccion es una perdida de optimalidad del controlador en los primeros Nr periodos de muestreo. Esto se debe a que
el coste terminal no se puede considerar como una aproximacion del coste optimo fuera
del conjunto .

4.5.2.3.

Ejemplo de aplicaci
on al reactor

En la sintonizacion del controlador se han utilizado los siguientes parametros: el


coste de etapa cuadratico con

10 0

Q=
0 1
y R = 1. Como region terminal y coste terminal se ha utilizado la correspondiente
a un controlador local lineal y un factor de ponderacion = 2 (vease el ejemplo del
apartado 4.3.1.1).
Para la aplicacion del controlador propuesto es necesario calcular una secuencia
de invariantes de control del sistema. Para ello se ha seguido el algoritmo propuesto
y como conjuntos invariantes de control se han tomado politopos por la sencillez de
tratamiento matematico y la flexibilidad que permiten. La u
nica restriccion que supone
esta consideracion es que los conjuntos obtenidos son aproximaciones convexas de los
conjuntos reales, que no tienen por que serlo. El procedimiento para calcular la aproximacion al conjunto a un paso a partir de politopos, Qap () se basa en el calculo de un
politopo interior al conjunto Q().
Para iniciar el algoritmo se ha calculado un politopo que es un invariante positivo del
sistema, por ser interior al invariante {V (x) } y contener al conjunto {V (x) }.
El conjunto obtenido se denota 0 . A partir de este conjunto se ha calculado una

Captulo 4. Aumento del dominio de atraccion del MPC

117

secuencia de 3 conjuntos invariantes de control denotados 1 , 2 y 3 , que se muestran


en la figura 4.8.

0.2

0.2

0.4

0.6

3
0.8

1
0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 4.8: Secuencia de invariantes de control {i }.

El dominio de atraccion del MPC con region terminal contractiva y con Np = Nc = 3


es el conjunto de estados que pueden alcanzar la region 3 en Nc = 3 pasos, es
decir, X3c = S3 (X, 3 ). En la figura 4.9 se muestra el dominio de atraccion X3c (lnea
con cruces) junto con la secuencia de invariantes de control. Tambien se ha trazado
el dominio de atraccion del controlador MPC con Nc = 3 y con region terminal el
invariante . Como se puede observar, el nuevo dominio de atraccion es mayor que
el del MPC general. Es importante resaltar que este aumento no implica un mayor
coste computacional del predictivo. Se ha conseguido gracias a la incorporacion de la
secuencia de invariantes de control, cuyo calculo se realiza en la etapa de dise
no del
controlador, fuera de lnea.
(X3c )

En la figura 4.10 se muestra el retrato de estados del sistema controlado con el


MPC con restriccion terminal contractiva propuesta en esta seccion. En la figura 4.11
se han trazado las curvas de evolucion del sistema a lo largo del tiempo, junto con la
actuacion. Es interesante resaltar que la estabilidad no esta basada en el decrecimiento
del coste optimo durante las 3 primeras muestras, pudiendo aumentar el coste optimo.
A partir de entonces, una vez que la region terminal se ha contrado hasta 0 , el coste
optimo s decrece.

118

4.5. Aumento del dominio de atraccion mediante la restriccion terminal


0.5

x2

1
2

0.5

X3

Xc3

1.5
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 4.9: Dominio de atraccion del MPC con restriccion terminal contractiva (X3c ), frente
al del MPC general (X3 ).

0.5

0
1

x2

0.5

Xc3

1.5
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 4.10: Trayectorias del sistema controlado con el MPC con restriccion terminal contractiva.

Captulo 4. Aumento del dominio de atraccion del MPC

119

0.1

0.05

0.05
0.1

10

15

20

25

30

35

40

45

50

10

15

20

25

30

35

40

45

50

10

15

20

25

30

35

40

45

50

x2

0.5
1
1.5

3.5

2.5
1.5
0.5
0.5

muestras

Figura 4.11: Evolucion del sistema controlado con el MPC con restriccion terminal contractiva.

4.6.

Aumento del dominio de atracci


on del MPC
sin restricci
on terminal

En el captulo anterior se caracterizo una region vecindad del origen en la cual el


MPC sin restriccion terminal estabiliza asintoticamente el sistema. Lo mas interesante
de la caracterizacion de la region es poder llevar a cabo el analisis de que factores
influyen sobre esta con el fin de poder aumentar el dominio de atraccion del MPC
sin restriccion terminal. Este analisis es el que se presenta en esta seccion y es una
aportacion original de esta tesis.
Como se demostro en la seccion 3.9, la region en la que el controlador MPC sin
restriccion terminal estabiliza asintoticamente el sistema viene dada por
= {x CN (X) : JN (x) L(x, KMPC (x)) + (N 1)d + }
siendo la region terminal
= {x IRn : V (x) }
y siendo la constante d tal que L(x, KMPC (x)) d para todo estado x
/ , donde
KMPC (x) es la solucion optima del controlador en x.
La condicion de pertenencia al conjunto admisible en N pasos, CN (X), pone de
manifiesto que este conjunto existe en todos aquellos estados factibles, en los que existe
una secuencia de N actuaciones admisibles tal que la evolucion del sistema es admisible

120

4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal

,y ,por lo tanto, para los cuales el JN (x) esta definido. Notese que en el caso en el que no
haya restricciones en el estado, X = IRn se tiene que CN ( IRn ) = IRn , por lo que el coste
optimo estara definido en todo IRn . Por otro lado, dado que la solucion optima alcanza
la region terminal en N pasos para todo x , entonces x SN (X, ) CN (X). En
consecuencia SN (X, ).
Esta region es un invariante positivo del sistema en bucle cerrado, y por lo tanto
es un dominio de atraccion del controlador. No obstante, esta region no es el maximo
dominio de atraccion del controlador, pues la condicion bajo la que se ha determinado
dicha region es conservadora.
El objetivo de esta seccion es analizar como se puede ajustar un controlador predictivo para obtener una region mayor, y por lo tanto, un mayor dominio de atraccion
del controlador. Esta region esta caracterizada por cuatro elementos: el coste optimo (y
en consecuencia todos aquellos parametros que influyan sobre su valor, como el coste
de etapa L(x, u), etc.), el horizonte de control N , la constante d y la constante . En
lo que sigue se proponen ciertas medidas para conseguir una mayor region .
1. Aumentar la constante :
Esta medida se puede obtener, por ejemplo, aumentando la region terminal (calculando el controlador local con este fin o bien con un coste de etapa con menor
valor) o bien ponderando el coste terminal.
En el caso en el que se aumente la region terminal se aumenta tanto como d,
pues, dado que la funcion de coste de etapa es definida positiva, al aumentar el
tama
no de puede aumentar el mnimo coste de etapa de los estados que no
pertenecen a dicha region. Por ejemplo en el caso del coste de etapa cuadratico
y de la region terminal calculada a partir de un controlador lineal siguiendo el
procedimiento propuesto en la seccion 3.7, el parametro d viene dado por
d = min (P 1/2 QP 1/2 )
Para demostrar esta afirmacion, se comprueba que para todo x
/ , es decir, tal
T
que x P x , se verifica que
xT Qx > xT Qx min (P 1/2 QP 1/2 )(xT P x )

= xT Q min (P 1/2 QP 1/2 )P x + min (P 1/2 QP 1/2 )

= xT P 1/2 P 1/2 QP 1/2 min (P 1/2 QP 1/2 )I P 1/2 x


+min (P 1/2 QP 1/2 )
min (P 1/2 QP 1/2 )
siendo I la matriz identidad.

Captulo 4. Aumento del dominio de atraccion del MPC

121

De lo anterior se deduce el tama


no de la region aumentara al aumentar .

JN (x) L(x, u ) + min (P 1/2 QP 1/2 )(N 1) + 1


Esto se puede conseguir mediante la ponderacion del coste terminal como se ha
comentado en secciones anteriores. La ponderacion de la funcion de Lyapunov,
relaja la condicion terminal a imponer en la region, y por lo tanto esta region
aumenta, es decir, la constante aumenta.
2. Aumentar la ponderaci
on del coste terminal:
Como se ha comentado anteriormente, la ponderacion de la funcion de Lyapunov
asociada al invariante (y en consecuencia del coste terminal) aumenta la region
terminal, si bien, a partir de un cierto valor, esta region deja de crecer. A
un
en esta situacion, la ponderacion de la funcion de coste terminal en el funcional
aumenta el dominio de atraccion del controlador MPC sin restricciones.
Considerese, que el nuevo coste terminal es V (x) = V (x), siendo 1. Entonces la region terminal , se puede expresar en terminos del coste terminal
como
= {x IRn : V (x) }
En este caso, el dominio de atraccion del controlador es
= {x CN (X) : JN (x) L(x, u ) + (N 1)d + }
Notese que la ponderacion puede aumentar el dominio de atraccion y en consecuencia afectar tambien al valor de la constante d. Pero, a
un en el caso en que
la region no crezca, y la constante d no se vea afectada por , el termino
aumenta, lo que produce un aumento del dominio de atraccion.
Por otra parte la ponderacion del coste terminal puede aumentar el coste optimo
JN (x), con lo que el aumento de la region terminal puede no ser tan acusado como
se puede esperar. Sin embargo, es razonable pensar que esta medida aumente el
dominio de atraccion, pues la ponderacion del coste terminal se puede considerar
como una funcion de barrera de la restriccion terminal nula. El caracter definido
positivo de la funcion de coste terminal fuerza a la solucion optima a que el estado
terminal este lo mas cerca posible del origen.
En (Parisini & Zoppoli 1995) se calcula una funcion de Lyapunov V (x) = xT P x
similar a la obtenida en el procedimiento de calculo de la region terminal propuesto en 3.7. Basandose en esta, considera como coste terminal esta funcion
ponderada axT P x y demuestra que existe una terna de valores (a, P, N ) tales
que el controlador MPC sin restriccion terminal estabiliza cualquier estado asintoticamente estabilizable. Este resultado se puede interpretar a la luz de los
resultados obtenidos.

122

4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal

En este caso, la ponderacion del coste terminal introducida por los autores tiene
un triple efecto, satisfacer la hipotesis 3.5, aumentar la region terminal y aumentar el dominio de atraccion del controlador sin restriccion terminal hasta
lograr estabilizar cualquier estado contenido en SN (X, ). Por u
ltimo, como se
demostro anteriormente, existe un horizonte N finito tal que el MPC general
estabiliza un estado asintoticamente estabilizable.
A la luz de esto se podra extender el resultado de (Parisini & Zoppoli 1995)
al caso de la formulacion general del MPC, de forma que existe una pareja de
valores (, N ) para los cuales el MPC sin restriccion terminal estabiliza cualquier
estado asintoticamente estabilizable.
3. Aumentar el horizonte de control N :
Esta medida aumenta la region por dos motivos principales:
a) porque aumenta el sumando (N 1)d.
b) porque disminuye el coste optimo JN (x).
Por lo tanto habra un mayor conjunto de estados que satisfacen la condicion. Es
por tanto beneficiosa, pero notese, que a costa de aumentar el coste computacional
del controlador.
4. Aumentar el horizonte de predicci
on Np :
Como se comento anteriormente, un aumento del horizonte de prediccion Np =
N + M con M 1, se puede considerar como un MPC general con un horizonte
de control N y con una funcion de coste terminal VM (x) y una region terminal
h
M = {x IRn : VM (x) } SM
(X, ). En este caso la region vendra dada
por JN (x) L (x) + (N 1)d + .
La region terminal esta contenida en M , por tanto, este aumento de la region
terminal, produce un aumento de la constante d. Ademas es muy posible que la
constante sea mayor que . De hecho, en el caso en el que no haya restricciones,
esta constante puede tomarse = M d + , siendo d la constante d calculada
para .
En este caso la region puede aumentar por tres motivos:
a) porque .
b) porque aumenta d.
c) porque el coste optimo se reduce al aumentar el horizonte de prediccion.

4.6.1.

Ejemplo de aplicaci
on al reactor

Para ilustrar los resultados obtenidos se va a calcular el dominio de atraccion del


controlador sin restricciones del reactor utilizado hasta ahora. Para estos ejemplos se

Captulo 4. Aumento del dominio de atraccion del MPC

123

ha tomado un coste de etapa cuadratico con una ponderacion dada por

Q=

10

10

y R = 1. Como region terminal y coste terminal se ha utilizado la considerada


inicialmente en los ejemplos (vease el ejemplo del apartado 4.3.1.1). La constante d,
que es el mnimo coste de etapa de los estados que no pertenecen a la region terminal,
es
d = 0,3316
Por defecto, el horizonte de control considerado es Nc = 3 y el de prediccion Np = 3.
En este caso el dominio de atraccion es la region
a = {x C3 (X) : J3 (x) L(x, KMPC (x)) + 9,9984}
siendo 2d + = 9,9984. Esta region, comparada con el dominio de atraccion del
controlador con restricciones X3 se muestra en las figuras de este ejemplo.
Con el fin de comprobar la influencia de las distintas medidas propuestas, se van a
mostrar los dominios de atraccion en diversas situaciones:

1. Aumento Nc :
Se calcula el dominio de atraccion con un horizonte de control y de prediccion
Np = Nc = 4. En este caso la region viene dada por
b = {x C4 (X) : J4 (x) L(x, u ) + 10,33}
siendo 3d + = 10,33. En la figura 4.12 se muestra este dominio de atraccion b
comparado con el correspondiente a Nc = 3, que es a . Como se puede observar,
el dominio de atraccion aumenta, sin bien el aumento es peque
no.
2. Ponderando la funci
on de coste terminal:
Se ha calculado el dominio de atraccion considerando como coste terminal 10
veces el coste terminal original. Esta region viene dada por:
b = {x C3 (X) : J3 (x) L(x, u ) + 94,016}
siendo 2d + 10 = 94,016.
Esta medida, como se puede observar en la figura 4.13, produce un aumento
considerable del dominio de atraccion, alcanzando casi la totalidad del dominio
de atraccion maximo X3 .

124

4.6. Aumento del dominio de atraccion del MPC sin restriccion terminal
0.4

0.2

a
0

0.2

x2

0.4

0.6

0.8

1
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 4.12: Aumento del dominio de atraccion del MPC sin restriccion terminal al aumentar
Nc .
0.4

0.2

x2

0.2

0.4

0.6

X3

0.8

1
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 4.13: Aumento del dominio de atraccion del MPC sin restriccion terminal al aumentar
la ponderacion del coste terminal.

3. Aumento del horizonte de predicci


on:
Esta medida produce un aumento de la region principalmente porque el coste
optimo en un determinado estado es menor al aumentar Np . Para ilustrar esto,
se ha considerado un controlador MPC con un horizonte de prediccion Np = 30,

Captulo 4. Aumento del dominio de atraccion del MPC

125

por lo que el dominio de atraccion del nuevo controlador viene dado por:

b = {x C3 (X) : J3,30
(x) L(x, u ) + 9,9984}

En la figura 4.14 se muestra los dominios de atraccion de los controladores. Como


se puede observar, el dominio aumenta como consecuencia de la consideracion de
un mayor horizonte de prediccion. En esta figura se observa que b no esta contenida en X3 , lo cual no es sorprendente pues el dominio de atraccion maximo
con Np = 30 es bastante mayor.
0.4

b
0.2

x2

0.2

0.4

0.6

X3
0.8

1
0.4

0.3

0.2

0.1

0.1

0.2

0.3

x1

Figura 4.14: Aumento del dominio de atraccion del MPC sin restriccion terminal al aumentar
el horizonte de prediccion.

4.7.

Conclusiones

En este captulo se ha abordado el problema del aumento del dominio de atraccion


del controlador MPC. Este problema es relevante, pues permite aumentar el conjunto
de estados estabilizables por el controlador.
Para ello se proponen dos metodos fundamentales: aumentando el horizonte de
control o bien aumentando la region terminal. Entre ellos, se opta por el segundo,
pues el primero incurre en un aumento del coste computacional. En este sentido se
han propuesto una serie de medidas para el aumento del dominio de atraccion como
son: el incremento del horizonte de prediccion, la variacion de la funcion de coste

126

4.7. Conclusiones

terminal mediante la ponderacion del coste terminal o la incorporacion como coste


terminal de la funcion VM (x). Por u
ltimo se han propuesto dos nuevos controladores
MPC que aumentan el dominio de atraccion sustituyendo la restriccion terminal por
una restriccion terminal contractiva. Esta restriccion contractiva puede estar basada
en invariantes positivos o en invariantes de control.
El analisis realizado, y en particular las nuevas formulaciones del MPC son aportaciones originales de esta tesis. El controlador basado en conjuntos invariantes de control

ha sido publicado en (Limon Marruedo, Alamo


& Camacho 2002a).
Por u
ltimo se ha analizado el dominio de atraccion del MPC sin restriccion terminal,
proponiendose una serie de medidas encaminadas a aumentar dicha region. Este analisis
tambien es una de las aportaciones originales de esta tesis.
Con este captulo se cierra la primera parte de la tesis dedicada al analisis de
controladores MPC en ausencia de incertidumbres. Las discrepancias entre el modelo
de prediccion y el modelo real hacen que los resultados obtenidos hasta ahora puedan no
ser validos, lo que conduce a la necesidad de analizar la robustez de estos controladores,
es decir, a analizar bajo que condiciones el controlador mantiene la estabilidad del
sistema incierto en bucle cerrado. Este analisis se lleva a cabo en el siguiente captulo.

Captulo 5
An
alisis de robustez del MPC
nominal
5.1.

Introducci
on

Como se ha visto en los captulos anteriores, el control predictivo esta basado en la


determinacion de la evolucion futura del sistema, para lo cual es necesario disponer de
un modelo que exprese la dinamica del sistema a controlar. Estas predicciones permiten
estimar el coste de una determinada secuencia de actuaciones, y comprobar si el sistema
se mantendra dentro de una serie de restricciones impuestas.
Sin embargo, es muy difcil, si no imposible, la obtencion de un modelo de un sistema tal que caracterice el comportamiento del sistema real con total exactitud. Esto
se puede deber a diversas causas como la presencia de fenomenos inmodelados, la simplificacion de modelos, la consideracion de parametros inexactos o bien el efecto de
perturbaciones externas. Por tanto, todo modelo tiene asociado unos errores en el modelado o incertidumbres, que hacen que exista un discrepancia entre el comportamiento
predicho y el comportamiento futuro del sistema real.
Estas discrepancias en el modelo son trascendentales en el dise
no de controladores
basados en este como en el caso del control MPC. Las incertidumbres pueden provocar
los siguientes efectos sobre el controlador MPC:

(i) La actuacion obtenida, basada en un modelo sin incertidumbres, puede no ser


optima para el sistema real incurriendo en un coste mayor, y por tanto, en un
peor comportamiento del sistema.
127

128

5.1. Introduccion

(ii) El sistema real puede evolucionar a estados en los que el control MPC no es
factible, es decir, en los que es imposible satisfacer todas las restricciones del
sistema y por tanto el problema de optimizacion no tendra solucion posible. Es
decir, que las incertidumbres pueden hacer que el sistema, en su evolucion, abandone el dominio de atraccion del controlador, fuera del cual este no esta definido.
(iii) La evolucion del sistema podra hacerse inestable, a pesar del correcto dise
no del
controlador con el modelo sin incertidumbres.

Por tanto es de relevante importancia la consideracion de dichas incertidumbres en


el dise
no del controlador, con el fin primordial de garantizar la estabilidad del sistema
y la satisfaccion de las restricciones impuestas.
Esto conduce a dos cuestiones fundamentales en el control: la primera es el an
alisis de la estabilidad robusta del sistema en bucle cerrado, es decir, la determinacion
del grado de incertidumbre que puede tener un sistema de forma que el controlador
dise
nado para el sistema nominal conserve la estabilidad en bucle cerrado. La segunda
cuestion es el dise
no robusto, en el cual, dado un sistema con un cierto grado de incertidumbres, se dise
na un controlador tal que garantice la estabilidad del sistema en
bucle cerrado, la satisfaccion de las restricciones y a ser posible, ciertas caractersticas
en su comportamiento.
Este captulo se centra en el primer aspecto: en el analisis de la robustez. En la
seccion 2.6.2 se ha presentado un balance de los resultados existentes en este campo,
los cuales se pueden agrupar en dos grandes grupos: unos basados en la optimalidad
del controlador (Glad 1987, Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni
& Sepulchre 1997) y otros basados u
nicamente en la teora de Lyapunov. El analisis
aqu realizado sigue la segunda lnea.
En (Scokaert et al. 1997) se analiza la estabilidad robusta de los controladores MPC
con horizonte finito para sistemas en tiempo discreto con restricciones bajo incertidumbres aditivas que decaen con el tiempo. Este analisis se orienta a la estabilidad del MPC
cuando se a
nade un observador para estimar los estados del sistema, suponiendo que el
error en la estimacion de los estados decae con el tiempo. Basandose en las propiedades
de los sistemas exponencialmente estables, y bajo la continuidad Lipschitz de la ley de
control, demuestra que el controlador MPC soporta cierto grado de incertidumbre.
En (De Nicolao et al. 1998) se presenta un controlador MPC con restriccion terminal
y coste terminal respondiendo a la formulacion general del MPC. Tambien se hace
un analisis de la robustez siguiendo la lnea de (Scokaert et al. 1997), considerando
incertidumbres aditivas que decaen y cierta condicion de continuidad sobre el coste
optimo.

Captulo 5. Analisis de robustez del MPC nominal

129

En la misma lnea se encuentra (Santos & Biegler 1999), en el cual, desde un punto
de vista de la sensibilidad del problema de optimizacion, se prueba que el controlador
MPC con restriccion terminal nula y sin restricciones en los estados soporta cierto
grado de robustez.
En este captulo se aborda el analisis de la estabilidad robusta del controlador MPC
general. En una primera parte se incorpora la teora de Lyapunov y la teora de conjuntos invariantes1 al analisis de robustez de sistemas con incertidumbres simplemente
acotadas, es decir, que no tienen por que decaer. Esto generaliza los resultados de
(Scokaert et al. 1997) e incorpora nuevos aspectos:
(i) Se consideran incertidumbres aditivas acotadas (que no decaen).
(ii) Se simplifican los resultados y se suavizan las condiciones a imponer sobre el
sistema.
(iii) Se cuantifica el grado de incertidumbres que soporta el sistema.
(iv) Se analiza la satisfaccion robusta de las restricciones.

Estos resultados han sido publicados en (Limon Marruedo, Alamo


& Camacho 2002c)
y constituyen una de las aportaciones originales de esta tesis.
En una segunda parte de este captulo, se generaliza el analisis anterior incorporando
los conceptos de estabilidad entrada a estado. Esto permite considerar incertidumbres
parametricas y extender las condiciones de continuidad Lipschitz del coste optimo
y estabilidad exponencial del sistema a la suavidad de dicha funcion y estabilidad
asintotica del controlador. La incorporacion de la estabilidad entrada a estado en el
analisis de la estabilidad robusta del MPC arroja mucha luz sobre el problema y es
otra de las aportaciones originales de esta tesis.
La organizacion de este captulo se ilustra en el siguiente diagrama

5.2.

Sistemas con incertidumbres aditivas

Sea un sistema descrito por un modelo en tiempo discreto, no lineal con incertidumbres aditivas, de la forma
xk+1 = f (xk , uk ) + wk
(5.1)
1

En el apendice A se presenta un compendio de resultados de cada uno de estos campos.

130

5.2. Sistemas con incertidumbres aditivas

Incertidumbres
aditivas

Estabilidad
robusta

Incertidumbres
paramtricas

Robustez
del MPC

coste ptimo
Lipschitz

coste ptimo
suave

Teora de
Lyapunov

Estabilidad
entrada estado

MPC
subptimo

Factibilidad
robusta

Figura 5.1: Organizacion del captulo 5

siendo el vector de estados del sistema xk IRn y las actuaciones uk IRm en el


instante k. El vector wk IRn representa las incertidumbres sobre el sistema. El u
nico
conocimiento que se tiene de las incertidumbres es que estan acotadas, de forma que
wk W

(5.2)

siendo W un conjunto compacto en IRn .


El sistema esta sometido a una serie de restricciones tanto en las actuaciones como
en los estados del sistema
xk X
uk U

(5.3)
(5.4)

donde X IRn y U IRm son conjuntos compactos, tales que el origen esta contenido
en ellos.
El modelo
xk+1 = f (xk , uk )

(5.5)

describe el comportamiento del sistema en caso de no haber incertidumbres. Este modelo se denomina modelo nominal del sistema y es el que se utiliza como modelo de
prediccion en el controlador MPC.
En la literatura relativa a MPC es frecuente el modelado de las incertidumbres como
incertidumbres aditivas (Mayne 2000, Michalska & Mayne 1993, De Nicolao et al. 1998),
pues son sencillas de identificar, mas faciles de tratar que otras posibles representaciones
de las incertidumbres y ademas permiten modelar un amplio espectro de discrepancias
en el modelo. Para ello basta comprobar que las incertidumbres aditivas representan

Captulo 5. Analisis de robustez del MPC nominal

131

la diferencia entre el comportamiento del modelo nominal y el comportamiento real

del sistema. Estas


pueden representar perturbaciones sobre el estado del sistema o
discrepancias entre modelos que dependan del estado o de las salidas del sistema.
As supongase un sistema real cuyo modelo es xk+1 = f(xk , uk ), que se describe por un
modelo nominal xk+1 = f (xk , uk ), entonces
xk+1 = f(xk , uk ) = f (xk , uk ) + f (xk , uk )
y por lo tanto se puede tomar una incertidumbre wk y un conjunto W tales que
wk = f(xk , uk ) f (xk , uk ) = f (xk , uk ) W, xk X, uk U
Este tipo de incertidumbres proveen una informacion poco precisa del comportamiento de la planta real. Para obtener una mejor descripcion de este, es necesario
obtener un mejor modelo de las incertidumbres. Esto se podra hacer considerando
incertidumbres estructuradas. La estructuracion provee una aproximacion mas precisa
del comportamiento real del sistema y puede permitir obtener resultados menos conservadores. Sin embargo, la determinacion de este tipo de incertidumbres puede ser una
tarea difcil en sistemas no lineales. Las incertidumbres aditivas proveen un modelo sencillo de incertidumbres que ademas facilita el analisis del comportamiento del sistema
incierto. El precio a pagar es en general, la obtencion de resultados conservadores. La
consideracion de incertidumbres estructuradas constituye una lnea de trabajo futuro.

5.3.

Estabilidad de sistemas no lineales con incertidumbres aditivas sujetos a restricciones

En esta seccion se aborda el analisis de estabilidad robusta de un sistema no lineal


autonomo con incertidumbres aditivas
xk+1 = F (xk ) + wk
sujeto a la restriccion xk X IRn . El vector wk representa las incertidumbres
aditivas tales que wk W . El sistema nominal viene dado por
xk+1 = F (xk )
y el origen es un punto de equilibrio, por lo que F (0) = 0.
Se parte de la base de que el sistema es estable y satisface las restricciones impuestas
en ausencia de incertidumbres. En el caso que el sistema fuese incierto, se estudia bajo
que condiciones se conserva la estabilidad del sistema y ademas se siguen satisfaciendo
las restricciones.

132

5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas

Esto es esencial para el analisis de sistemas en bucle cerrado. As, si un sistema no


autonomo dado por (5.5) sujeto a las restricciones (5.4) y (5.3) se controla por una
ley uk = h(xk ), el sistema en bucle cerrado es un sistema autonomo que responde al
modelo
xk+1 = f (xk , h(xk )) = F (xk )
donde el estado esta restringido al conjunto X h , tal que
X h = {x X : h(x) U }

Si bien la ley de control se dise


na para que estabilice el sistema nominal satisfaciendo
las restricciones a las que esta sometido, las incertidumbres pueden hacer perder la
estabilidad o la factibilidad que el comportamiento nominal presenta. En esta seccion
se establecen condiciones bajo las cuales se conservan ambas propiedades del sistema.
Dado que el u
nico conocimiento que se tiene de las incertidumbres que presenta
el sistema, wk , es que estan acotadas, el origen deja de ser un punto de equilibrio del
sistema incierto. De hecho lo que se puede esperar es que el sistema evolucione hasta
una determinada vecindad del origen en la cual permanece confinado. Por tanto las
definiciones clasicas de estabilidad, tales como estabilidad asintotica o exponencial, no
pueden aplicarse a este tipo de sistemas. Tampoco la teora clasica de Lyapunov es
aplicable por este mismo motivo. Esto nos lleva a utilizar una definicion de estabilidad
apropiada a este caso.

Definici
on 5.1 Un sistema es asintoticamente acotado al final si el sistema evoluciona
a un conjunto acotado, es decir, si existen unas constantes positivas b y c tales que
para todo (0, c), existe un k tal que para todo estado inicial kx0 k se tiene que
kxk k b k > k .

Esta definicion es una adaptacion a sistemas discretos de la utilizada en (Khalil 1996).


Para el analisis de estabilidad de sistemas con incertidumbres es importante, como
se apunta en (Scokaert et al. 1997), el concepto de continuidad Lipschitz de una funcion.

Definici
on 5.2 Sea una funcion g(z) : IRp IRq , se dice que es localmente Lipschitz
en un conjunto Z IRp si para todo z1 , z2 Z, existe una constante 0 < L < tal
que se verifica
kg(z1 ) g(z2 )k Lkz1 z2 k
La constante L se denomina constante de Lipschitz.

Captulo 5. Analisis de robustez del MPC nominal

133

Es importante resaltar el hecho de que si una funcion es Lipschitz en una determinada norma, entonces, en virtud de la equivalencia entre normas, es tambien Lipschitz
en cualquier otra norma. Sin embargo, el valor que toma la constante de Lipschitz
s depende de la norma elegida.
La continuidad Lipschitz garantiza que la discrepancia de una funcion entre dos
puntos esta acotada y depende, ademas, de la distancia entre ellos. Esta propiedad es
mas fuerte que la continuidad pero mas debil que la derivabilidad.
Propiedad 5.3 (Khalil 1996) Sea la funcion g(z) : IRp IRq continua en una regi
on
Z IRp y tal que existe g
y
es
continua
en
Z,
entonces
dicha
funci
o
n
es
localmente
z
Lipschitz en Z.
Esta condicion es suficiente, pero no necesaria, pues no toda funcion Lipschitz tiene
que ser derivable.
Basandose en estas propiedades se presenta en esta tesis el siguiente teorema de
estabilidad.

Teorema 5.4 (Estabilidad robusta)


Sea el sistema autonomo xk+1 = F (xk ) tal que el origen es un punto de equilibrio del
sistema y por tanto F (0) = 0.
Sea V (x) una funcion de Lyapunov asociada al sistema tal que
akxk V (x) bkxk
V (F (x)) V (x) ckxk
siendo a, b, c constantes positivas y > 0. Adem
as V (x) es Lipschitz en una vecindad
del origen
r = {x IRn : V (x) r}
Entonces existe una constante > 0 tal que para toda incertidumbre
wk B = {wk IRn : kwk k < }
el sistema incierto xk+1 = F (xk ) + wk es asintoticamente acotado al final, para todo
estado inicial x0 r .

134

5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas

Demostraci
on:
Estabilidad:
La demostracion se hace utilizando conceptos de la teora de conjuntos invariantes 2

tales como el conjunto robusto a un paso Q()


y la propiedad que este conjunto verifica
en el caso de incertidumbres aditivas

Q()
= Q( W )
siendo W el conjunto de incertidumbres y siendo W la diferencia de Pontryagin
de ambos conjuntos. En lo que sigue se denotan los siguientes conjuntos
p = {x IRn : V (x) p}
Bp = {x IRn : kxk p}
De la teora de Lyapunov3 se tiene el sistema xk+1 = F (xk ) es exponencialmente
estable en el origen y ademas existe una constante [0, 1) tal que V (F (x)) V (x).
Sea Lv la constante de Lipschitz de la funcion de Lyapunov V (x) en el conjunto acotado
r . Entonces se tiene que
V (x + w) V (x) + Lv kwk
Considerese una constante

1
r
Lv

entonces se satisface que


r ) = Q(r B ) Q(rLv ) q r
Q(
siendo q =

rLv
.

Para demostrarlo se van a probar las siguientes propiedades:

(i) Q(r B ) Q(rLv ):


Para ello considerese que para todo xk rLv se tiene que
V (xk ) r Lv V (xk + wk ) V (xk ) + Lv r
Por tanto, xk + wk r , wk B , y entonces xk r B . En consecuencia
rLv r B .
De la propiedad de monotona del conjunto a un paso se tiene que Q(r B )
Q(rLv )
2
3

Vease la seccion A.3.


Vease la seccion A.2.3.

Captulo 5. Analisis de robustez del MPC nominal

(ii) q Q(rLv ), siendo q =

135

rLv
:

xk q V (F (xk )) V (xk ) rLv F (xk ) rLv xk Q(rLv )


(iii) r q :
q=

r Lv
r
1
)=r
(1 Lv

Lv

Por lo tanto el conjunto acotado r es un invariante positivo robusto para unas incertidumbres wk B y esta acotado, lo que demuestra la estabilidad.
Convergencia:
Se va a demostrar que para una incertidumbre wk B con
sistema evoluciona al conjunto invariante robusto
r = {x IRn : V (x)

1
r,
Lv

el estado del

Lv
= r }
1

en el cual permanece. Para ello basta demostrar que la evolucion del sistema verifica
que
V (x1 ) V (F (x0 )) + Lv kwo k r + Lv = r1 r
V (x2 ) V (F (x1 )) + Lv kw1 k r1 + Lv = 2 r + Lv (1 + ) = r2 r
..
.
j1
X
1 j
Lv = rj r
V (xj ) j r +
Lv j1i kwi k j r +
1
i=0
Dado que < 1 entonces rj

Lv

= r r cuando j .

Ademas la evolucion del estado satisface la siguiente acotacion

k1
X
1 k
kxk k r +
Lv kj1 kwj k
a
j=0

(5.6)

De este teorema se infiere que el conjunto r es un invariante robusto para un


conjunto de incertidumbres B .

136

5.3. Estabilidad de sistemas no lineales con incertidumbres aditivas

Este teorema es una generalizacion del resultado principal presentado en (Scokaert


et al. 1997), el cual demuestra estabilidad (ante perturbaciones que decaen) bajo las
hipotesis de que F (x) sea exponencialmente estable y Lipschitz. Como se va a comprobar, estas hipotesis son un caso particular de las del teorema 5.4.
Corolario 5.5 Por el teorema inverso de Lyapunov (vease el teorema A1 en (Scokaert
et al. 1997)), si F (x) es Lipschitz y el origen es exponencialmente estable, entonces
existe una funcion de Lyapunov asociada que es Lipschitz, por lo que se satisfacen las
hipotesis del teorema 5.4.
Para un sistema en bucle cerrado, la imposicion de la continuidad Lipschitz del
modelo nominal f (x, h(x)) se puede garantizar bajo la continuidad Lipschitz del modelo
respecto a x y a u y ademas bajo la continuidad Lipschitz de la ley de control u = h(x).
Sin embargo, el teorema 5.4 esta formulado en terminos de la continuidad Lipschitz
de la funcion de Lyapunov, que se puede satisfacer sin necesidad de la continuidad
Lipschitz de la ley de control.
Merece la pena resaltar que la incorporacion de la teora de conjuntos invariantes
en la demostracion del teorema permite obtener resultados compactos y sencillos.
A continuacion se extiende el teorema anterior al caso de sistemas con restricciones
en el estado (que en el caso de sistemas en bucle cerrado pueden derivar de restricciones
en las actuaciones y en los estados). Estas restricciones se transforman en la existencia
de un dominio de atraccion del sistema nominal, que es un invariante positivo, tal que
XF X. En este caso, se establece el siguiente corolario.
Corolario 5.6 Sea el sistema xk+1 = F (xk ) tal que satisface las hipotesis del teorema
5.4 en el dominio de atracci
on XF . Entonces existe una constante > 0 tal que para
toda incertidumbre
wk B = {wk IRn : kwk k < }
el sistema incierto xk+1 = F (xk ) + wk es asintoticamente acotado al final, para todo
estado inicial x0 r = {x IRn : V (x) r} XF .
Esto se debe a la invariancia robusta del conjunto r . Gracias a ella, siempre que el
sistema parta de este conjunto, la evolucion del sistema permanece en dicho conjunto,
y ademas evoluciona convergiendo a un conjunto interior en el cual permanece acotado.
Por tanto, dado que el conjunto r esta contenido en el dominio de atraccion del sistema
XF X, la evolucion del mismo satisface las restricciones.
Como se puede observar, la invariancia robusta es la propiedad que garantiza la
satisfaccion de las restricciones del sistema incierto. En el caso de que el dominio

Captulo 5. Analisis de robustez del MPC nominal

137

de atraccion sea un invariante robusto del sistema, se puede establecer el siguiente


resultado.
Corolario 5.7 Sea el sistema xk+1 = F (xk ) tal que satisface las hipotesis del teorema
5.4 en el dominio de atracci
on XF .
Sea el dominio de atracci
on XF invariante robusto del sistema incierto xk+1 = F (xk ) +
wk para
wk B = {wk IRn : kwk k < }
Entonces existe una constante 0 < tal que para toda incertidumbre
wk B = {wk IRn : kwk k < }
el sistema incierto xk+1 = F (xk ) + wk es asintoticamente acotado al final, para todo
estado inicial x0 XF .
Para demostrar este corolario, basta con tomar una region r (preferiblemente la
region maxima) tal que r XF . Entonces considerando una constante
mn(,

1
r)
Lv

el sistema incierto con wk B , evoluciona a la region r para todo estado inicial de


XF , donde permanece acotado.
En resumen, si un sistema esta sometido a restricciones y tiene un dominio de
atraccion XF , tan solo se puede garantizar la estabilidad robusta cumpliendo las restricciones (factibilidad robusta) en una region r contenida en XF y para cierto grado
de incertidumbre B . Solamente en el caso en que dicho conjunto XF sea un invariante
robusto (para un cierto grado de incertidumbres B ), se puede garantizar que en todo
el dominio de atraccion XF se satisfacen las restricciones. En este caso, para garantizar
que para todo estado de XF evoluciona hasta r , donde queda confinado, el grado de
incertidumbre que admite el sistema es el mnimo de (para garantizar convergencia)
y ( para que XF sea invariante robusto).
En el siguiente corolario se trasladan los resultados anteriores al caso de perturbaciones que decaen.
Corolario 5.8 Bajo las hipotesis del teorema 5.4, si las incertidumbres tienden a 0,
entonces el origen es un punto de equilibrio asintoticamente estable del sistema perturbado para un cierto grado de incertidumbres.
Si, ademas, el sistema presenta restricciones, los corolarios anteriores garantizan
la factibilidad robusta.

138

5.4. Aplicacion al analisis de robustez del MPC

Si la perturbacion decae exponencialmente de forma que kwk k k kw0 k, con


< 1, entonces la evolucion del sistema es exponencial
"

kxk k

#1/

rk Lv (k k )
+
kw0 k
a
a( )

!k

r
k
a

!
1/
!k

Lv

+

kw0 k
a| |

siendo = max(, ). Dado que y se tiene que


!
!k

Por lo tanto, se deduce que


"

kxk k

!#1/

r
Lv

+
kw0 k
a a| |
k

k/

siendo > 0.

5.4.

Aplicaci
on al an
alisis de robustez del MPC

Los resultados obtenidos anteriormente establecen un procedimiento para analizar la


estabilidad robusta de un sistema en bucle cerrado (con o sin restricciones). Basandose
en ellos se va a analizar la estabilidad robusta y la satisfaccion de las restricciones de
un sistema controlado por un controlador MPC en su formulacion general.

Corolario 5.9 (Estabilidad robusta del MPC)


Sea un sistema descrito por un modelo nominal
xk+1 = f (xk , uk )
sujeto a las restricciones uk U , y xk X.
Sea un controlador MPC uk = KMPC (xk ) tal que estabiliza exponencialmente el sistema
en el dominio de atracci
on XN .
Sea el coste optimo del MPC JN (xk ) una funcion Lipschitz en XN .
Entonces, existe una constante > 0 tal que para cualquier incertidumbre
wk B = {wk IRn : kwk k }

Captulo 5. Analisis de robustez del MPC nominal

139

el sistema incierto descrito por


xk+1 = f (xk , KMPC (xk )) + wk
es asintoticamente acotado al final para todo
x0 r = {x IRn : JN (x) r} XN

Este corolario es consecuencia inmediata de los resultados obtenidos en la seccion


anterior. Es importante resaltar que una propiedad que parece clave en la robustez del
controlador predictivo es la continuidad Lipschitz del coste optimo, seg
un la cual
|JN (x + w) JN (x)| LJ kwk

Esta
garantiza que el efecto de las incertidumbres sobre el coste optimo este limitado, es
decir, que una incertidumbre acotada supone una variacion en el coste optimo acotada.
Las condiciones bajo las cuales el MPC garantiza la continuidad Lipschitz del coste
optimo estan asociadas a las condiciones de regularidad del problema de optimizacion
y a la optimalidad de la solucion obtenida. Esta propiedad tan solo esta garantizada
para sistemas lineales sujetos a restricciones lineales (Muske 1995). En el apendice C de
este documento se presenta un analisis de las condiciones bajo las cuales el controlador
MPC para sistemas no lineales satisface la continuidad Lipschitz del coste optimo.
Bajo estas mismas condiciones se establece tambien la continuidad Lipschitz de la
secuencia optima, lo que garantiza en virtud del corolario 3.4 que el controlador MPC
estabiliza exponencialmente el sistema.

5.4.1.

Factibilidad robusta del MPC

En el caso de que el sistema este sujeto a restricciones tanto en las actuaciones como
en el estado, el controlador MPC debe garantizar la satisfaccion de dichas restricciones a
pesar de las incertidumbres. Las restricciones sobre las actuaciones se satisfacen gracias
a la factibilidad de la solucion del problema de optimizacion. Son las restricciones
impuestas sobre los estados las que realmente el controlador puede no ser capaz de
satisfacer. Estas restricciones son de dos tipos: restriccion por lmites sobre los estados y
la restriccion terminal para garantizar la estabilidad. La violacion de las primeras hacen
que el sistema evolucione fuera de los lmites fsicos impuestos y el incumplimiento de la
segunda puede hacer que el sistema pierda la estabilidad y la convergencia. Sin duda,
ambas son igualmente importantes y su satisfaccion a pesar de las incertidumbres
constituyen un gran reto y una gran complejidad en la robustez del MPC. De hecho,

140

5.4. Aplicacion al analisis de robustez del MPC

gran parte de los resultados existentes en robustez del MPC omiten las restricciones del
problema (Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni & Sepulchre 1997).
El analisis llevado a cabo anteriormente garantiza la factibilidad robusta en un
conjunto
r = {x IRn : JN (x) r} XN
contenido en XN . Este conjunto satisface las restricciones gracias a que es un invariante
positivo robusto y por lo tanto garantiza que si el sistema parte de un estado en el
contenido, la evolucion permanece en su interior. Este conjunto puede interpretarse
como que existe un coste optimo umbral r tal que si en el instante inicial JN (x0 ) r
(x0 r ), entonces se satisfacen las restricciones. Si por el contrario el estado inicial
es tal que JN (x0 ) > r (x0 XN \ r ), el sistema podra evolucionar de forma que en
un determinado instante no satisfaga las restricciones.
Conocido el dominio de atraccion del MPC XN , y suponiendo que es un conjunto
conexo y compacto, es posible calcular el coste umbral que garantiza la estabilidad
y satisfaccion robusta de las restricciones ante incertidumbres. En el caso en que XN
sea convexo, el coste optimo umbral r se puede determinar de la solucion del siguiente
problema

r = mn JN (x)
xX
/ N

el cual se resuelve fuera de lnea. Si XN no fuese convexo, se podra considerar en el


problema un conjunto convexo contenido en el, obteniendo un coste umbral conservador.
Para ilustrar esto, considerese un sistema lineal xk+1 = Axk + Buk + wk dado por

A=

1,2775 1,3499
1,0

0,0

B=

1,0

0,0

sujeto a las restricciones kxk 5 y |u| < 1. El sistema real presenta unas incertidumbres kwk k 0,35. Considerando el coste de etapa cuadratico L(x, u) = kxk2 + kuk2 ,
y calculando el controlador local con un LQR, la region terminal obtenida es .
El MPC con un horizonte N = 5 estabiliza robustamente el sistema para las incertidumbres dadas y la region r viene dada por un coste optimo umbral de r = 25,24. En
la figura 5.2 se muestra como la evolucion del sistema para estados iniciales contenidos
en r , permanece contenida en este.
En la figura 5.3 se muestra que existen estados iniciales pertenecientes a X5 \ r
tales que la evolucion del sistema permanece en X5 , satisfaciendo las restricciones, y

Captulo 5. Analisis de robustez del MPC nominal

141

4
3

0
x

Figura 5.2: Evoluci


on del sistema con x0 r

sin embargo existen otros estados desde los cuales la evolucion del sistema pierde la
estabilidad, abandonando el dominio de atraccion.
4

X5

4
3

0
x1

Figura 5.3: Evoluci


on del sistema con x0 X5 \ r

5.4.1.1.

Invariancia robusta del dominio de atracci


on

Un analisis mas exhaustivo sobre la condiciones bajo las cuales el MPC satisface
las restricciones en presencia de incertidumbres se ha llevado a cabo en (Kerrigan
2000, Kerrigan & Maciejowski 2001). Este trabajo se basa en la teora de conjuntos
invariantes y establece condiciones bajo las cuales el controlador MPC garantiza que
su dominio de atraccion es un invariante robusto. La invariancia robusta es condicion
necesaria y suficiente para garantizar que el sistema no abandona dicho conjunto en

142

5.4. Aplicacion al analisis de robustez del MPC

su evolucion. As, si el dominio de atraccion es un invariante robusto, todo estado


estabilizable satisface las restricciones. En estos trabajos no se aborda la convergencia
robusta del MPC, tan solo se determinan condiciones para la satisfaccion robusta de
las restricciones. Por ello, los resultados obtenidos no se limitan a las formulaciones con
estabilidad garantizada. Sin embargo, en esta seccion, se han adaptado estos resultados
tan solo a este caso.
Lo primero que se analiza es bajo que condiciones el dominio de atraccion del MPC
es un invariante robusto y se establece el siguiente teorema .
Teorema 5.10 (Kerrigan 2000)
Sea un controlador MPC formulado para un sistema xk+1 = f (xk , uk ) sujeto a restricciones xk X, uk U que satisface las condiciones suficientes de estabilidad (teorema
3.2). Entonces, el sistema incierto, con incertidumbres aditivas acotadas a W , satisface
las restricciones si se verifica la siguiente condici
on
SN 1 (X, ) W SN (X, )
siendo la operaci
on de suma de Minkowski

Es interesante resaltar que la satisfaccion de esta condicion depende de la forma que


tengan los conjuntos estabilizables en N y en N 1 pasos. Estos conjuntos dependen del
modelo del sistema, de los conjuntos de restricciones X y U y del conjunto invariante
. En lo u
nico en lo que puede influir la sintonizacion del controlador es en el conjunto
invariante y el horizonte de control N . Por tanto, es el sistema y sus restricciones los
que limitan la satisfaccion de esta condicion. Es probable encontrar casos en los que
esa condicion no se satisface para ning
un valor del horizonte de control.
En el caso en el que el dominio de atraccion del MPC no sea inherentemente robusto, Kerrigan propone a
nadir una restriccion adicional al MPC que garantice dicha
propiedad. El trabajo de Kerrigan es una generalizacion de la restriccion del mismo
tipo propuesta en (Chisci & Zappa 1999) para sistemas lineales.
Esta restriccion se denomina restricci
on de robustez y tiene la forma
x(k + 1|k) XR W
siendo x(k + 1|k) la prediccion nominal del estado en el instante siguiente y XR un
conjunto que es parametro de dise
no. Esta nueva restriccion modifica el dominio de
atraccion del MPC, siendo por tanto distinto al del MPC general. El nuevo dominio
de atraccion es
XNr = Q(XR W ) SN (X, )
4

A B es la suma de Minkowski de los conjuntos A y B y viene dada por


{c IRn : a A, b B|c = a + b}.

Captulo 5. Analisis de robustez del MPC nominal

143

Kerrigan establece condiciones sobre el conjunto XR X para que el dominio de


atraccion del MPC modificado, XNr , sea un invariante robusto. Estas condiciones se
resumen en el siguiente teorema.

Teorema 5.11 (Kerrigan 2000)


Sea un controlador MPC con restricci
on de robustez formulado para un sistema xk+1 =
f (xk , uk ) sujeto a restricciones xk X, uk U que satisface las condiciones suficientes
de estabilidad (teorema 3.2). Entonces, el sistema incierto, con incertidumbres aditivas
acotadas a W , satisface las restricciones si
(R(XNr ) (XR W ) SN 1 (X, )) W XNr
siendo R() el conjunto de alcance (vease la secci
on A.3).

Ademas, Kerrigan propone formas de determinacion del conjunto XR que generalmente se toma un conjunto invariante robusto de control del sistema.
Como se ha comentado, estos resultados garantizan la factibilidad robusta del MPC,
no su convergencia. El analisis de estabilidad realizado previamente permite establecer
resultados que aseguren la convergencia del sistema. As, aplicando el corolario 5.7, se
determina que si el dominio de atraccion es robusto para incertidumbres contenidas en
B y el MPC converge para incertidumbres contenidas en B , siendo , entonces,
el controlador MPC satisface las restricciones y converge a un conjunto r XN .
En el caso de perturbaciones que decaen con el tiempo, no es necesario establecer condiciones adicionales de convergencia, pues la naturaleza desvaneciente de las
incertidumbres hacen que el sistema vaya convergiendo al punto de equilibrio.

5.5.

Estabilidad entrada a estado (ISS) del MPC

En la seccion anterior se ha analizado la robustez de los controladores MPC ante


incertidumbres aditivas en el sistema y se ha comprobado que todo sistema controlado por un MPC, bajo ciertas condiciones, admite un cierto grado de incertidumbre.
Tomando un poco de perspectiva en el analisis realizado, se puede observar que las
claves de la estabilidad robustas son dos: la estabilidad exponencial del sistema y la
continuidad Lipschitz del coste optimo. La primera garantiza un decrecimiento distinto
de cero del coste optimo en cada instante y la segunda garantiza que el efecto de las
incertidumbres esta acotado, y ademas este depende del grado de incertidumbre. Por
tanto, para mantener la estabilidad del sistema, basta con que el posible incremento

144

5.5. Estabilidad entrada a estado (ISS) del MPC

de coste optimo que experimenta el sistema por la incertidumbre sea compensado por
el decrecimiento en el coste que fuerza la estabilidad exponencial.
De todo esto se deduce que la prueba de estabilidad anterior es generalizable a
sistemas asintoticamente estabilizables e incluso a sistemas con otro tipo de modelo
de incertidumbres (no aditivas o parametricas, por ejemplo) con tal de que su efecto
sobre el coste optimo este acotado. Esta generalizacion se puede hacer incorporando el
concepto de estabilidad entrada a estado o ISS 5 .

5.5.1.

Estabilidad entrada a estado

La estabilidad entrada a estado fue formulada por primera vez en (Sontag 1989a)
para sistemas en tiempo continuo, pero recientes resultados (Jiang, Sontag & Wang
1999, Jiang & Wang 2001) han trasladado estos conceptos a sistemas en tiempo discreto.
A continuacion se presentan las definiciones y resultados necesarios para el desarrollo
de esta seccion. En la seccion A.4 se presentan estos resultados de una manera mas
extensa y detallada.
Definici
on 5.12 (Estabilidad entrada a estado) (Jiang & Wang 2001) Un sistema xk+1 = F (xk , wk ) es estable entrada a estado si existe una funcion KL , (, ), y
una funcion K , (), tal que la evolucion del sistema satisface que
kxk k (kx0 k, k) + ()
para todo x0 B , siendo kwk k para todo k.
La se
nal de entrada a la que se refiere en esta definicion es wk , que en el contexto
de la robustez viene a ser la incertidumbre. As, esta definicion dice que en ausencia
de incertidumbres el sistema es asintoticamente estable. Sin embargo, cuando aparecen incertidumbres acotadas, el efecto que estas tienen sobre la evolucion del sistema
esta acotada, es decir, que las incertidumbres no hacen divergir al sistema.
Notese que esta definicion incluye a la anteriormente utilizada de estabilidad asintotica acotada al final, pues, de la definicion de estabilidad entrada a estado se deduce
que para todo kx0 k , el estado esta acotado kxk k bk de forma que bk ()
cuando k , dado que (kx0 k, k) 0.
Asociada a este concepto de estabilidad existe la definicion de una funcion de Lyapunov entrada a estado:
5

Acronimo ingles de Input to State Stability

Captulo 5. Analisis de robustez del MPC nominal

145

Definici
on 5.13 (Funci
on de Lyapunov entrada a estado) (Jiang & Wang 2001)
Una funcion continua V : IRn 7 IR+ se denomina funcion de Lyapunov entrada a estado si satisface que
Existen unas funciones K , 1 () y 2 (), tales que
1 (kxk) V (x) 2 (kxk)

x B

Existe una funcion K , 3 (), y una funcion K , (), tales que


V (F (x, w))V (x) 3 (kxk)+() x B w B = {w IRp : kwk }
La segunda propiedad de la definicion es equivalente a decir que existe una funcion
K , (), y una funcion K , 4 (), tales que
V (F (x, w)) V (x) 4 (x) x : kxk ()
es decir, que se satisface la condicion de Lyapunov tan solo fuera de una vecindad del
origen.
El principal resultado es el siguiente lema, donde se establece la condicion suficiente
para garantizar la estabilidad entrada a estado de un sistema.
Lema 5.14 (Jiang & Wang 2001) Si un sistema xk+1 = F (xk , wk ) admite una funcion
de Lyapunov entrada a estado entonces el sistema es estable entrada a estado
La demostracion de este lema se muestra en la seccion A.4. De este resultado se deduce
que existe una funcion K , (), tal que
V (F (x, w)) (V (x)) + ()
Entonces la funcion K , d() = (id)1 (), siendo id(s) = s, satisface las siguientes
propiedades
(i) Si un sistema es estable entrada a estado y la entrada (incertidumbre) tiene una
cota , entonces todo conjunto r , siendo r d(), es un conjunto invariante
robusto del sistema. Ademas el sistema evoluciona hasta quedar confinado en
r = {x IRn : V (x) r} siendo r = d().
(ii) Todo conjunto r es invariante robusto para unas incertidumbres tales que su
cota satisfaga
d1 (r) = 1 (r (r))
(5.7)

146

5.5. Estabilidad entrada a estado (ISS) del MPC

Los resultados obtenidos son mas generales, pero con un desarrollo semejante, a los
presentados en el analisis de estabilidad robusta de la seccion 5.3. En ese caso se tiene
que (r) = r siendo una constante [0, 1), y () es Lv . Por tanto de (5.7) se
tiene que
1

r
Lv
que es la misma cota obtenida en la seccion 5.2.
La aplicacion de estos resultados a sistemas con restricciones se hace siguiendo la
lnea presentada en la seccion 5.3: la invariancia robusta de r garantiza la satisfaccion de las restricciones siempre que r este contenido en el dominio de atraccion del
controlador. Si dicho dominio es un invariante robusto, entonces el resultado obtenido
garantiza que evoluciona a un conjunto en el que permanecera acotado y cuyo tama
no
depende de la cota de la incertidumbre.

5.5.2.

Aplicaci
on al MPC

Sea un sistema incierto descrito por la ecuacion


xk+1 = f (xk , uk , wk )
siendo wk IRp las incertidumbres presentes en el modelo, el cual esta acotada a un
conjunto wk B = {w IRp : kwk }. Por otro lado las entradas y los estados
estan sujetos a uk U , y xk X.
El modelo en ausencia de incertidumbres
xk+1 = f (xk , uk , 0)
es el modelo nominal y es el que se utiliza como modelo de prediccion en un MPC
tal que satisface las condiciones suficientes de estabilidad (teorema 3.2), y por tanto
estabiliza asintoticamente el sistema en un dominio de atraccion XN . La ley de control
obtenida es uk = KMPC (xk ).
Como se puede comprobar en el teorema 3.2, el coste optimo resultado del MPC es
una funcion de Lyapunov del sistema y ademas verifica que
JN (f (xk , KMPC (xk ), 0)) JN (xk ) L(xk , KMPC (xk ))
De todo lo anterior se puede establecer el siguiente teorema, que es el resultado
principal de este analisis, aportacion de esta tesis.

Captulo 5. Analisis de robustez del MPC nominal

147

Teorema 5.15 (Estabilidad robusta)


Sea un sistema incierto descrito por la ecuaci
on
xk+1 = f (xk , uk , wk )
con uk U , xk X y las incertidumbres wk B .
Sea un controlador MPC obtenido a partir del modelo nominal (sin incertidumbres)
tal que satisface las condiciones suficientes de estabilidad (teorema 3.2) y estabiliza
asint
oticamente el sistema nominal en XN .
Sup
ongase que el coste optimo es suave con las incertidumbres de forma que existe una
funcion K , (), tal que
|JN (f (x, KMPC (x), w)) JN (f (x, KMPC (x), 0))| (kwk)
para todo x XN .
Entonces el sistema es estable entrada a estado y ademas para todo r XN , existe
una cota de la incertidumbre = (r) para la cual el sistema incierto es estable y
satisface las restricciones.

Demostraci
on:
Para demostrar el teorema basta comprobar que el coste optimo es una funcion de
Lyapunov entrada a estado. Sea el estado xk+1 = f (xk , KM P C (xk ), wk ), entonces
JN (xk+1 ) JN (xk ) = [JN (f (xk , KM P C (xk ), wk )) JN (f (xk , KM P C (xk ), 0))]
+ [JN (f (xk , KM P C (xk ), 0)) JN (xk )]
(kwk k) L (xk , KMPC (xk ))
lkxk k + ()
Ademas la region r XN es un invariante robusto del sistema, y por lo tanto satisface
las restricciones a lo largo de la evolucion del sistema.
Para un conjunto r dado, el grado de incertidumbre que soporta el controlador
depende de las funciones lkxk y (). Por tanto, el grado de conservadurismo asociado
a esta cota dependera del grado de aproximacion que tenga la funcion a la discrepancia
real ().
Es importante resaltar que la condicion
|JN (f (x, KMPC (x), w)) JN (f (x, KMPC (x), 0))| (kwk)
es una condicion sobre la suavidad de la funcion de coste respecto a los parametros. Por
ejemplo, si la funcion de coste es Lipschitz (o bien C 1 ) con las incertidumbres, entonces
existe una constante LJ tal que
|JN (f (x, KMPC (x), w)) JN (f (x, KMPC (x), 0))| LJ kwk

148

5.6. Suboptimalidad y robustez en el MPC

Por lo tanto, seg


un su grado de derivabilidad, se puede realizar una aproximacion de
mayor orden (por la formula de Taylor, por ejemplo), y por lo tanto obtener una funcion
() menos conservadora.
Una condicion suficiente para garantizar la suavidad del coste optimo respecto a
los parametros es la suavidad de JN (x) respecto al estado y la suavidad del modelo
f (x, u, w) respecto a los parametros. En efecto, supongase que existen dos funciones
K , J () y f (), tales que
|JN (x + x) JN (x)| J (kxk)
kf (x, u, w) f (x, u, 0)k f (kwk)
entonces se tiene que
|JN (f (x, u, w)) JN (f (x, u, 0))| J (kf (x, u, w) f (x, u, 0)k) J f (kwk)
Dado que = J f es una funcion K , se comprueba la suavidad del coste optimo.

5.6.

Suboptimalidad y robustez en el MPC

La estabilidad asintotica del MPC (en ausencia de incertidumbres) esta basada en el


decrecimiento que experimenta el coste optimo a lo largo del tiempo. Esto permite considerar el coste optimo como funcion de Lyapunov. Sin embargo, como se demostro en
la seccion 3.8, la optimalidad de la solucion no es necesaria para garantizar la estabilidad, es tan solo una caracterstica deseable de cara al comportamiento del sistema
controlado. En realidad basta con que la evolucion del coste optimo sea estrictamente
decreciente para garantizar la estabilidad asintotica del controlador. Esto se consigue
imponiendo al problema de optimizacion a resolver en el instante k, la siguiente restriccion de convergencia
JNs (xk ) JNs (xk1 ) L(xk1 , us (k 1|k 1))

(5.8)

siendo una constante positiva tal que 1 y us (k 1|k 1) la actuacion suboptima


obtenida en el instante k 1. La constante indica la tasa de convergencia mnima
que se desea del controlador de forma que cuanto menor sea, mas lenta puede ser la
convergencia del sistema en bucle cerrado al origen.
En (Mayne et al. 2000) se comenta que la solucion optima global del problema de
optimizacion del MPC puede ser inabordable desde un punto de vista computacional,
lo que conduce a la necesidad de soluciones suboptimas para que el MPC sea implementable. Sin embargo, en ausencia de incertidumbres, la restriccion de convergencia no

Captulo 5. Analisis de robustez del MPC nominal

149

es necesaria, pues la factibilidad de la solucion en un instante k, garantiza la existencia


de una solucion factible en k + 1, uF (k + 1), tal que 6
JN (xk+1 , uF (k + 1)) JN (xk ) L(xk , u (k|k))
Por lo tanto, en ausencia de incertidumbres, la factibilidad de la solucion garantiza la
estabilidad del controlador MPC.
La necesidad de la restriccion de convergencia surge de la discrepancia entre la
evolucion predicha del sistema y la evolucion real del mismo, es decir, cuando el sistema
esta sujeto a incertidumbres. En este caso, dado que xk+1 6= x(k + 1|k), no se puede
garantizar que la solucion optima sea tal que el coste optimo decrezca mas que el coste
de etapa, haciendose necesaria la imposicion de la restriccion de convergencia para
garantizar la estabilidad asintotica del sistema.

5.6.1.

Estabilidad robusta del MPC sub


optimo

Dado que el controlador MPC suboptimo toma sentido en presencia de incertidumbres, se va a trasladar el analisis de estabilidad entrada a estado del MPC optimo al
caso suboptimo.
El MPC suboptimo presenta las restricciones propias del MPC, es decir, la restriccion sobre los estados, sobre las actuaciones y sobre el estado terminal, y ademas
impone la restriccion de convergencia dada por la ecuacion (5.8), por la cual garantiza
una convergencia mnima del sistema en bucle cerrado. Las restricciones sobre las entradas y estados en presencia de incertidumbres presentan el problema de factibilidad
robusta tratado anteriormente y que esta relacionado con la invariancia robusta. La
satisfaccion de la restriccion de convergencia depende tambien de las incertidumbres y
no esta garantizada a pesar del cumplimiento de las anteriores.
Del analisis de estabilidad entrada a estado desarrollado anteriormente, se establece
que bajo condiciones de suavidad del coste optimo, el incremento que experimenta este
por el efecto de la incertidumbre esta acotado y depende del grado de incertidumbre
que presenta el sistema
|JN (xk+1 ) JN (x(k + 1|k))| ()
siendo () una funcion K y la cota de las incertidumbres. Entonces, el coste optimo
es una funcion de Lyapunov ISS y verifica que
JN (xk+1 ) JN (xk ) L(xk , u (k|k)) + ()
6

Vease la demostracion de estabilidad de la formulacion general del MPC en la seccion 3.3

150

5.6. Suboptimalidad y robustez en el MPC

Para que el coste optimo satisfaga la condicion de convergencia basta con que se
verifique que
L(xk , uk ) + () L(xk , uk )
de donde se tiene que
() (1 )L(xk , uk )
Por lo tanto, , la tasa de convergencia del controlador, condiciona el grado de incertidumbres que admite el sistema y viceversa. Cuanto mayor sea la tasa de convergencia
, menor sera el grado de incertidumbres para el cual se satisface la restriccion de
convergencia, o lo que es lo mismo, el grado de incertidumbres para el cual el controlador esta definido (es factible). Por el contrario, mas rapida sera la convergencia del
sistema en bucle cerrado.
En resumen, la restriccion de convergencia del MPC suboptimo tiene como fin asegurar una tasa de convergencia del controlador, limitando as el grado de incertidumbres
que admite. Notese ademas que si las incertidumbres no decaen con el tiempo, tan solo
se podra satisfacer la restriccion de convergencia fuera de una vecindad del origen.
Es importante resaltar que estos resultados son validos si la funcion de coste es
suave ante las incertidumbres. En el caso del MPC optimo esto se puede garantizar
bajo ciertas condiciones de regularidad del problema de optimizacion. Sin embargo esta
suavidad esta sujeta a la optimalidad de la solucion, perdiendose en caso de suboptimalidad7 .
Esto se puede solucionar gracias a que, como se demuestra en el teorema siguiente,
la suavidad del coste optimo, garantiza la factibilidad del problema suboptimo, y por
lo tanto la estabilidad del controlador.
A continuacion se va a demostrar la estabilidad del controlador MPC suboptimo
propuesto en el artculo (Scokaert et al. 1999), que viene dado por
Si existe una solucion factible con restriccion de convergencia, entonces se aplica
la solucion.
Si no, aplicar la mejor solucion obtenida.
Este procedimiento garantiza convergencia siempre que el problema de optimizacion
sea factible. Pero los autores no analizan bajo que condiciones es factible el problema y
en consecuencia bajo que condiciones este procedimiento estabiliza el sistema incierto.
En el siguiente teorema, fruto de esta tesis, se establecen condiciones que garantizan
la estabilidad.
7

Vease el ejemplo de la seccion 3.8, en el que se pone de manifiesto la falta de suavidad en el caso
suboptimo.

Captulo 5. Analisis de robustez del MPC nominal

151

Teorema 5.16 (Estabilidad robusta del MPC sub


optimo)
Sea un sistema incierto descrito por la ecuaci
on
xk+1 = f (xk , uk , wk )
con uk U , xk X y las incertidumbres wk B .
Sea un controlador MPC obtenido a partir del modelo nominal (sin incertidumbres)
tal que satisface las condiciones suficientes de estabilidad (teorema 3.2) y estabiliza
asint
oticamente el sistema nominal en XN .
Sup
ongase que el coste optimo es suave con las incertidumbres de forma que existe una
funcion K , (), tal que
|JN (f (x, u, w)) JN (f (x, u, 0))| (kwk)
para todo x XN y para todo u U .
Entonces el controlador MPC suboptimo propuesto, con una restricci
on de convergencia
JNs (xk ) JNs (xk1 ) L(xk1 , us (k 1|k 1))
siendo JNs (xk1 ) el coste suboptimo y us (k 1|k 1) la actuacion suboptima en el
instante k 1, estabiliza el sistema en un conjunto
r = {x IRn : JNs (x) r}
tal que r XN , para una cota de la incertidumbre = (r, ). Adem
as la evolucion
del sistema incierto satisface las restricciones.

Demostraci
on:
La clave de la demostracion radica en comprobar la existencia de una solucion factible
a la restriccion de convergencia (que sera la secuencia optima).
Supongase que el sistema en el instante k 1 se encuentra en el estado xk1 tal
que la actuacion proporcionada por el controlador suboptimo es us (k 1|k 1). Como
consecuencia el sistema evoluciona a xk (estado que difiere del estado predicho xk 6=
xs (k|k 1) = f (xk1 , us (k 1|k 1), 0)).
A partir de la secuencia de actuaciones usF (k 1) se obtiene la secuencia para el
instante k, usF (k) dada por

us (k + j 1|k 1)
us (k + j 1|k) =
h(
x(k + N 1|k))

j = 1, , N 1

siendo u = h(x) la ley de control local a la region terminal. Esta secuencia garantiza la
satisfaccion de las restricciones sobre los estados y sobre las actuaciones en el estado
x(k|k 1) = f (xk1 , usk1 , 0)

152

5.6. Suboptimalidad y robustez en el MPC

y tiene asociado un coste JN (x(k|k 1)), el cual satisface que


JN (x(k|k 1)) JNs (xk1 ) L(xk1 , us (k 1|k 1))
Entonces la solucion optima del MPC en el instante xk verifica que
JN (xk ) JN (f (xk1 , usk1 , 0)) + (kwk1 k)
JN (x(k|k 1)) + (kwk1 k)
JNs (xk1 ) L(xk1 , usk1 ) + (kwk1 k)
n

JNs (xk1 ) L(xk1 , usk1 ) (1 )L(xk1 , usk1 ) (kwk1 k)

Una vez establecido este resultado se va a demostrar la estabilidad comprobando


que el conjunto
r = {x IRn : JNs (x) r}
tal que r XN es un invariante robusto del sistema controlado por el MPC suboptimo
para un cierto grado de incertidumbres. Para ello se va a demostrar que para todo
xk1 r , entonces xk r para cualquier incertidumbre admisible.
Para ello se van a considerar dos casos:
(i) Incertidumbres acotadas:
Considerese una cota de incertidumbres tal que wk B , para la cual existe
una constante q (0, r ()) tal que
(1 )lkxk () x r \ q
Notese que siempre existe una pareja de valores (, q) tal que satisface lo anterior.
Entonces, para todo xk1 r \ q se tiene que
() (1 )lkxk1 k (1 )L(xk1 , us (k 1|k 1))
Por lo tanto se tiene que
JN (xk ) JNs (xk1 ) L(xk1 , us (k 1|k 1))
y en consecuencia existe una solucion factible tal que verifica la restriccion de
convergencia.
De aqu se deduce que para todo x r \ q , el coste suboptimo es estrictamente decreciente y por lo tanto el estado se va aproximando al origen hasta un
determinado instante en el que el estado del sistema entra en la region q .
En este conjunto, las incertidumbres pueden hacer que la restriccion de convergencia no sea factible. En ese caso se elimina y se proporciona la mejor actuacion

Captulo 5. Analisis de robustez del MPC nominal

153

disponible. As, el estado podra volver a salir de q , pero no de r . En efecto,


supongase que xk q , entonces en ese instante, la solucion puede no satisfacer
la condicion de convergencia, pero sin embargo satisface que
JNs (xk+1 ) JNs (xk ) L(xk , us (k|k)) + ()
JNs (xk ) + () q + () r
por lo tanto xk+1 r . En el caso en que el estado saliese de q , el controlador
vuelve a conducirlo hacia este. Por lo tanto, el sistema quedara confinado por lo
tanto en una region contenida en r .
(ii) Incertidumbres que decaen con el estado:
Sean unas incertidumbres tales que
(kwk k) (1 )lkxk k
para todo xk r , entonces se satisface la restriccion de convergencia en todo
instante y por lo tanto el sistema incierto es asintoticamente estable al origen.
Notese que este resultado tambien se satisface para las incertidumbres que decaen
en el tiempo.

De todo lo anterior se deduce que el conjunto r es un invariante robusto para


cierto grado de incertidumbres. Entonces, por estar contenido en XN la evolucion del
sistema satisface las restricciones.
Notese que en el caso de incertidumbres acotadas el sistema evoluciona partiendo
de r hasta un invariante robusto contenido en el donde queda confinado. En este caso,
ante perturbaciones s
ubitas tales que no saquen al sistema de r el sistema conserva
la estabilidad. Esto demuestra el comportamiento estable de los ensayos realizados en
(Scokaert et al. 1999).

5.7.

Robustez del controlador MPC sin restricci


on
terminal

El analisis de robustez realizado en las secciones anteriores es facilmente trasladable


al controlador MPC sin restriccion terminal ni restricciones sobre los estados. Esto se
debe a que la condicion de suavidad del coste optimo se satisface bajo condiciones
blandas.

154

5.7. Robustez del controlador MPC sin restriccion terminal

Lema 5.17 Sea un sistema incierto descrito por la ecuaci


on
xk+1 = f (xk , uk , wk )
tal que uk U y xk IRn . La funcion del modelo f (, , ) es Lipschitz respecto xk y a
wk para todo uk U es decir
kf (x1 , u, w1 ) f (x2 , u, w2 )k Lx kx1 x2 k + Lw kw1 w2 k
siendo Lx y Lw las constantes de Lipschitz del sistema.
Sea la funcion de coste de etapa L(x, u) Lipschitz en x con una constante Lc y sea la
funcion de coste terminal V (x) Lipschitz con una constante de Lipschitz Lv . Entonces
la funcion de coste optima del MPC sin restricci
on terminal es suave y verifica que
|JN (f (x, u, w)) JN (f (x, u, 0))| LJ kwk
siendo

LN 1
LJ Lc x
+ Lv LN
Lw
x
Lx 1

Este resultado es una consecuencia inmediata del analisis de sensibilidad del MPC
desarrollado en el apendice C.
Por lo tanto, seg
un se establecio anteriormente, el coste optimo es una funcion de
Lyapunov ISS, lo que garantiza estabilidad robusta del sistema para cierta cota de la
incertidumbre.
Dado que el controlador sin restriccion terminal estabiliza el sistema en una region
= {x IRn : JN (x) L(x, KMPC (x)) + (N 1)d + }
siendo d el mnimo coste de estapa que puede tener todo estado que no pertenece a
la region terminal = {x IRn : V (x) }. En el siguiente corolario se analiza la
invariancia robusta de esta conjunto.
Corolario 5.18 Bajo las hipotesis del lema anterior, el conjunto es un invariante
robusto para toda incertidumbre tal que
kwk =

d
LJ

Captulo 5. Analisis de robustez del MPC nominal

155

Demostraci
on:
En efecto, supongase que xk y xk+1 no pertenecen a , entonces
JN (xk+1 ) JN (xk ) L(xk , KMPC (xk )) + LJ (N 1)d + + LJ
sustituyendo el valor de se tiene que
JN (xk+1 ) N d + L(xk+1 , KMPC (xk+1 )) + (N 1)d +
por lo que xk+1 .
Ademas dado que para todo x
/ , se tiene que L(x, KMPC (x)) d, entonces
JN (xk+1 ) JN (xk ) (L(xk , KMPC (xk )) d)
por tanto para todo xk
/ , JN (xk+1 ) decrece haciendo converger el sistema en . El
sistema permanece en este conjunto, salvo que la incertidumbre en un momento dado
lo saque de este conjunto, de forma que el controlador vuelve a conducir el sistema
hasta esta region. Notese que si x0 , entonces en ning
un caso se abandonara dicha
region.

5.8.

Ejemplo de aplicaci
on al reactor

A continuacion se va a comprobar que el MPC aplicado al reactor posee una robustez


inherente ante incertidumbres. En este caso se sintoniza el controlador MPC con los
mismos parametros que en la seccion 3.3.2. El horizonte de control en este caso es de
Nc = Np = 3.
Para el sistema as sintonizado se ha calculado un conjunto invariante r contenido
en X3 . Este conjunto viene dado por
r = {x IR2 : J3 (x) 8,5}
Como se ha demostrado anteriormente, existe un conjunto de incertidumbres cuya
cota depende de r, para el cual el conjunto r es un conjunto invariante robusto. Con
el objeto de ilustrar la robustez inherente del controlador, se ha calculado grado de
incertidumbres que admite la region de una forma no conservadora, obteniendose unos
valores de las incertidumbres:
w1 [6103 , 6103 ]
w2 [2102 , 1103 ]

156

5.8. Ejemplo de aplicacion al reactor

0.4

0.2

0.2

x2

0.4

0.6

X3
0.8

1
0.3

0.2

0.1

0.1

0.2

x1

Figura 5.4: Evolucion del sistema incierto controlado por el MPC.

En la figura 5.4 se muestra el dominio de atraccion del controlador X3 y la region r .


Tambien se muestra la evolucion del sistema ante incertidumbres que se han modelado
como aleatorias. Como se puede observar, el sistema evoluciona hasta quedar confinado
en una cierta vecindad del origen.
En la figura 5.5 se ilustra que la evolucion del sistema incierto permanece en r
para las cotas de incertidumbres obtenidas. Para ello se muestra la evolucion del sistema
considerando las incertidumbres mnimas (a) y maximas (b), constantes a lo largo de la
evolucion. Se han considerado por ser estas las realizaciones mas desfavorables. Se puede
comprobar que los estados mas sensibles a las incertidumbres son los extremos derecho
e izquierdo de las regiones y son las zonas que marcan las maximas incertidumbres que
admite el sistema. Esto supone un conservadurismo en el resto del invariante, pero es
la u
nica forma de garantizar la estabilidad robusta en toda la region r .
Es importante resaltar, que las cotas que se obtienen a partir de los procedimientos
presentados en este captulo son mas conservadoras que las utilizadas en este ejemplo.

Estas
han sido calculadas para ilustrar la robustez inherente del controlador y tras un
exhaustivo analisis del sistema. Sin embargo, a pesar del conservadurismo de los procedimientos presentados, son metodos generales para obtener un grado de incertidumbres
para las cuales el sistema es robusto.

Captulo 5. Analisis de robustez del MPC nominal

157

0.4
0.4

0.3

0.3

0.2

0.2

0.1

0.1

x2

x2

0.1

0.1

0.2

0.2

0.3

0.4
0.2

0.3

0.15

0.1

0.05

0.05

x1

(a)

0.1

0.15

0.2

0.4
0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

(b)

Figura 5.5: Evolucion del sistema incierto con incertidumbres mnimas (a) y maximas (b)

5.9.

Conclusiones

En esta seccion se ha abordado el analisis de robustez inherente del controlador


MPC, es decir, se ha analizado el grado de incertidumbre que es capaz de soportar el
controlador dise
nado para el sistema nominal. Resultados existentes en la literatura
establecen robustez del MPC para sistemas cuyas actuaciones son afines en el modelo
y no presentan restricciones ni en los estados ni en las actuaciones. Basandose en la
optimalidad del problema, se establecen margenes de estabilidad robusta ante incertidumbres en las entradas (Geromel & Da Cruz 1987, De Nicolao et al. 1996, Magni &
Sepulchre 1997).
En este captulo, el analisis de estabilidad se basa en la teora de Lyapunov, siguiendo la lnea de (Scokaert et al. 1997, De Nicolao et al. 1998) extendiendo resultados
previos al caso de incertidumbres aditivas en el modelo. Se hace hincapie en la necesidad de garantizar la satisfaccion de las restricciones a pesar de las incertidumbres,
para lo cual se hace uso del concepto de invariancia robusta y se incorporan resultados
existentes (Kerrigan 2000). Este resultado ha sido presentado en (Limon Marruedo,

Alamo
& Camacho 2002c).
Este analisis se puede generalizar a controladores con estabilidad asintotica e incertidumbres parametricas en el sistema gracias a la incorporacion del concepto y
resultados de la estabilidad entrada a estado (ISS) del sistema. As, se puede establecer
el siguiente resultado: la suavidad de la funcion de coste optimo garantiza que el MPC
admite cierto grado de incertidumbre. Este analisis, al igual que el anterior, representa
una de las aportaciones originales de esta tesis.

158

5.9. Conclusiones

Tambien se pone de manifiesto la relacion entre suboptimalidad y robustez, pues


esta tan solo tiene sentido en presencia de incertidumbres. Dado que las condiciones de
suavidad del coste optimo estan basadas en la optimalidad de la solucion, la suavidad
se puede perder en el MPC suboptimo. Sin embargo, sorprendentemente, la suavidad
del coste optimo, garantiza la robustez del MPC suboptimo, pues garantiza la factibilidad de la restriccion de convergencia. Este analisis constituye tambien una aportacion
original de esta tesis.
Por u
ltimo, se ha demostrado la robustez del MPC sin restriccion terminal, dado
que la ausencia de restricciones en los estados permite garantizar la suavidad del coste
optimo. Ademas se determina una cota explcita de las incertidumbres que admite.
Este analisis tambien es original de esta tesis.
En este captulo se ha puesto de manifiesto que la suavidad del coste optimo es una
pieza clave para la robustez del MPC nominal. Sin embargo, esta condicion se puede
satisfacer bajo ciertas condiciones de regularidad del problema, difciles de comprobar.
Por lo tanto, resulta interesante encontrar alguna forma de sintonizar el controlador que
garantice cierto grado de robustez. En el captulo siguiente se presenta una formulacion
del MPC que la estabilidad entrada a estado del controlador y la satisfaccion robusta
de las restricciones.

Captulo 6
MPC ISS con satisfacci
on robusta
de las restricciones
6.1.

Introducci
on

En el anterior captulo se analizo la robustez que inherentemente presenta el controlador predictivo. Esta robustez se comprueba de dos formas: mediante la optimalidad
de la solucion y mediante la capacidad del controlador MPC de estabilizar asintoticamente el sistema. En todos los estudios realizados se parte de la hipotesis que el coste
optimo es una funcion suave (en los basados en optimalidad se exige que sea C 2 (De
Nicolao et al. 1996, Magni & Sepulchre 1997)) y esta condicion tan solo esta garantizada bajo ciertas condiciones de regularidad del problema de optimizacion (vease el
apendice C).
En este captulo se presenta un procedimiento sencillo para incorporar el conocimiento de las incertidumbres en el dise
no del controlador. Esta basado en la acotacion de la
discrepancia entre la evolucion del sistema nominal y el real cuando el sistema presenta
incertidumbres. Esta acotacion se incorpora en las restricciones en los estados y en el
dise
no de la region terminal y a partir de estos, se formula un controlador MPC basado
en predicciones nominales, semejante a las formulaciones no robustas.
El controlador presentado es factible en todo instante (partiendo de estados iniciales factibles) y por lo tanto satisface las restricciones en cada instante a pesar de
la incertidumbres. Ademas, el controlador es estable entrada a estado lo que garantiza
la convergencia del sistema. Este trabajo ha cristalizado en una publicacion (Limon

Marruedo, Alamo
& Camacho 2002b).
159

160

6.2. Descripcion del sistema

6.2.

Descripci
on del sistema

A lo largo del captulo se va a considerar que el sistema real o planta responde a


un modelo incierto descrito por
xk+1 = f (xk , uk , wk )

(6.1)

siendo xk IRn el vector de estados del sistema y uk IRm las actuaciones sobre el
mismo. El vector wk IRp representa las incertidumbres presentes en el modelo, de las
cuales se conoce exclusivamente que estan acotadas de forma que
wk B = {w IRp : kwk }
Por otro lado las entradas y los estados estan sujetos a las restricciones
uk U
xk X
El modelo en ausencia de incertidumbres viene dado por
xk+1 = f (xk , uk , 0)

(6.2)

y se denomina modelo nominal. Este modelo es el que se utiliza como modelo de


prediccion en el controlador MPC propuesto.
Ademas se va a suponer que el sistema satisface la siguiente hipotesis de suavidad.

Hip
otesis 6.1 El modelo es suave respecto a los estados y a las incertidumbres, de
forma que existen dos funciones K , x () y w (), tales que
kf (x + x, u, 0) f (x, u, 0)k x (kxk)
kf (x, u, w) f (x, u, 0)k w (kwk)
para todo x, x + x X, u U y w B .

Resulta interesante destacar que en el caso en el que el modelo sea Lipschitz respecto
a x y a w, entonces estas funciones tienen la forma
x (kxk) = Lx kxk
w (kwk) = Lw kwk

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

6.3.

161

Acotaci
on del efecto de las incertidumbres en
la predicci
on

Las incertidumbres existentes en el sistema real o planta hacen que el comportamiento de este difiera del comportamiento dado por el modelo nominal, por lo que
el sistema no evolucionara como se espera. Con el fin de incorporar este efecto en el
dise
no del controlador, resulta de interes realizar una acotacion de la discrepancia entre
la evolucion del sistema real y la evolucion esperada o predicha por el modelo nominal,
ante una misma secuencia de actuaciones.
Para hacer mas legibles las demostraciones de esta seccion se denotara:
xk+j : el estado del sistema real (incierto) en el instante k + j al aplicar una secuencia
de actuaciones {uk , , uk+j1 } a partir del instante k, estando el sistema en el
estado xk .
x(k + j|k) : el estado predicho mediante el modelo nominal (en ausencia de incertidumbres) ante la misma secuencia de actuaciones y partiendo de xk .
El objeto de esta seccion es pues calcular una acotacion de la forma
kxk+j x(k + j|k)k cj ()
siendo la constante la cota de las incertidumbres, tal que wk B . Esta se establece
en el siguiente lema.

Lema 6.2 Sea un sistema dado por la ecuaci


on (6.1) tal que satisface la hipotesis 6.1,
entonces
kxk+j x(k + j|k)k cj ()
donde cj () viene dada por la recursi
on
cj () = w () + x (cj1 ())
siendo c1 () = w ().

Demostraci
on:
Para ello se va a proceder de la siguiente forma:

162

6.3. Acotacion del efecto de las incertidumbres en la prediccion

j=1 :
kxk+1 x(k + 1|k)k = kf (xk , uk , wk ) f (xk , uk , 0)k w () = c1 ()
j=2 :
kxk+2 x(k + 2|k)k = kf (xk+1 , uk+1 , wk+1 ) f (x(k + 1|k), uk+1 , 0)k
kf (xk+1 , uk+1 , wk+1 ) f (xk+1 , uk+1 , 0)k
+kf (xk+1 , uk+1 , 0) f (x(k + 1|k), uk+1 , 0)k
w () + x (kxk+1 x(k + 1|k)k)
w () + x (c1 ()) = c2 ()
j : siguiendo este procedimiento, para k + j se tendra
kxk+j x(k + j|k)k = kf (xk+j1 , uk+j1 , wk+j1 ) f (x(k + j 1|k), uk+j1 , 0)k
kf (xk+j1 , uk+j1 , wk+j1 ) f (xk+j1 , uk+j1 , 0)k
+kf (xk+j1 , uk+j1 , 0) f (x(k + j 1|k), uk+j1 , 0)k
w () + x (kxk+j1 x(k + j 1|k)k)
w () + x (cj1 ()) = cj ()

Es interesante resaltar que la funcion cj () tiene las siguientes propiedades:


Propiedad 6.3 La funcion cj () verifica que:
(i) Es una funcion K .
(ii) La secuencia cj () es monotonamente creciente, es decir, cj () > cj1 () para
todo > 0.
Demostraci
on:
(i) Se demuestra por induccion: dado que c1 () = w (), esta funcion es K .
Supongase que cj1 () es una funcion K . Entonces, considerando que la composicion de dos funciones K es tambien una funcion K y que la suma de dos funciones
K es tambien una funcion K , se tiene que
cj () = w () + x (cj1 ())
es una funcion K .

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

163

(ii) Se demuestra por induccion: en primer lugar se demuestra que


c2 () = w () + x (c1 ()) > w () = c1 ()
Entonces si cj () > cj1 (), se tiene que
cj+1 () = x () + x (cj ()) > x () + x (cj1 ()) = cj ()
por ser x () una funcion K .

Notese que una secuencia monotonamente creciente no tiene por que divergir. Por
tanto, la acotacion del efecto de las incertidumbres puede no tender a infinito (cuando
j ), permaneciendo acotado, tal y como puede ocurrir en sistemas estables.
En el desarrollo llevado a cabo en las siguientes secciones, se requiere la acotacion
de la discrepancia que experimenta el sistema considerando tan solo el efecto de las
incertidumbres en el instante siguiente. Esta acotacion se establece en el siguiente lema.

Lema 6.4 Sea xk el estado de un sistema incierto descrito por (6.1) tal que satisface
la hipotesis 6.1. Sea x(k + j|k) el estado predicho en el instante k + j a partir de
x(k|k) = xk utilizando el modelo nominal y aplicando una secuencia de actuaciones
uF (k) = {u(k|k), , u(k + j 1|k)}
Sea xk+1 el estado al que evoluciona el sistema incierto al aplicar u(k|k). Sea el estado
x(k + j|k + 1) el estado predicho en el instante k + j a partir de x(k + 1|k + 1) = xk+1
aplicando el resto de la secuencia uF (k), es decir {u(k + 1|k), , u(k + j 1|k)}.
Entonces se tiene que
kx(k + j|k) x(k + j|k + 1)k xj1 w ()

(6.3)

on sucesiva i veces de
para cualquier incertidumbre wk B , siendo xi () la composici
la funcion x ().

Demostraci
on:
Para j = 1 se tiene que
kx(k + 1|k + 1) x(k + 1|k)k = kxk+1 x(k + 1|k)k w ()

164

6.3. Acotacion del efecto de las incertidumbres en la prediccion

La prediccion en el instante siguiente verifica que


kx(k + 2|k + 1) x(k + 2|k)k x (kx(k + 1|k + 1) x(k + 1|k)k) x w ()
y analogamente para la prediccion siguiente se tiene que
kx(k + 3|k + 1) x(k + 3|k)k x (kx(k + 2|k + 1) x(k + 2|k)k) x2 w ()
Procediendo por recursion se demuestra el lema.

6.3.1.

Acotaci
on basada en la continuidad Lipschitz

Particularmente interesante resulta el caso en el que el modelo sea Lipschitz, tanto


en los estados como en las incertidumbres. Como se comento anteriormente, en este
caso las funciones x () y w () toman la forma
x (kxk) = Lx kxk
w (kwk) = Lw kwk
y por lo tanto
xj (x) = Ljx kxk
De la recursion presentada en el lema 6.2 es inmediato comprobar que
kxk+j x(k + j|k)k cj () =

i=j1
X

Lix Lw =

i=0

Ljx 1
Lw
Lx 1

y ademas se tiene que


cj () = cj1 () + Lj1
x Lw
Merece la pena destacar que la continuidad Lipschitz es la forma mas blanda de
suavidad y basta con que la funcion sea continuamente diferenciable para garantizarla.
En este caso, la constante de Lipschitz se puede calcular como la maxima norma inducida del jacobiano del modelo, lo que no es complejo de obtener.

6.3.2.

Reducci
on del conservadurismo

Las cotas obtenidas de la discrepancia entre la evolucion real del sistema y la


predicha por el modelo nominal estan basadas en las funciones K que acotan las variaciones del modelo en el estado x () y en las incertidumbres w (),
kf (x + x, u, w) f (x, u, w)k x (kxk)
kf (x, u, w) f (x, u, 0)k w (kwk)

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

165

que se verifican para todo x, x + x X, u U y w B . Dado el caracter global


de estas acotaciones, las cotas obtenidas son conservadoras, pues representan la peor
de las situaciones posibles. Por lo tanto al incorporar estas acotaciones en el dise
no del
controlador predictivo, se esta considerando siempre que el sistema se encuentra en la
situacion mas desfavorable, lo que conduce a actuaciones conservadoras.
Sin embargo, la principal fuente de conservadurismo radica en el hecho de que las
predicciones se hacen a partir de una secuencia de actuaciones fijas, independiente de
las incertidumbres. Es decir, que las predicciones no consideran el efecto de la realimentacion del controlador, y por lo tanto, la adaptacion que las actuaciones experimentan
ante el efecto de las incertidumbres. Esto es derivado del hecho de que el MPC es
una estrategia en bucle abierto aplicada en bucle cerrado mediante la estrategia de
horizonte deslizante. Este problema ha dado lugar a una reformulacion del MPC de
cara a la robustez, en lo que se ha denominado formulacion del MPC en bucle cerrado
(Mayne et al. 2000, Scokaert & Mayne 1998). Este problema se tratara en un captulo
posterior de esta tesis.
Con vista a reducir el conservadurismo de estas cotas se pueden llevar a cabo las
siguientes medidas:
Elecci
on de una norma adecuada : las acotaciones obtenidas estan definidas en
una norma y sus propiedades son independientes de esta. Sin embargo, los valores alcanzados por estas funciones, y por lo tanto la bondad de la acotacion,
s puede depender de la norma elegida. Una reduccion en alguna de estas funciones puede reducir el grado de conservadurismo de la cota. La reduccion de
x () es particularmente interesante por la composicion sucesiva que experimenta
en la determinacion de la cota.
Para ilustrar este punto, considerese una acotacion basada en la constante de
Lipschitz. Como se comento anteriormente, el valor de dicha constante depende
de la norma. Sea la norma kks en la que se acota la discrepancia, de forma que
kf (x, u, w) f (x, u, 0)ks Lw kwks Lw
Considerese otra norma diferente kkq en la que se calcula la constante de Lipschitz Lx , de forma que
kf (y, u, w) f (x, u, w)kq Lx ky xkq
Sean las constantes mq y Mq tales que mq kxkq kxks Mq kxkq , entonces
kf (x, u, w) f (x, u, 0)kq Mq kf (x, u, w) f (x, u, 0)ks Mq Lw
Por lo tanto la acotacion de la discrepancia en norma kkq viene dada por
kxk+j x(k + j|k)kq

Ljx 1
Mq Lw
Lx 1

166

6.3. Acotacion del efecto de las incertidumbres en la prediccion

y de la equivalencia entre normas se deduce que la acotacion de la discrepancia


en norma kks es
kxk+j x(k + j|k)ks

Ljx 1 Mq

Lw
Lx 1 mq

De esta expresion se deduce que, por el efecto de la composicion de Lx , una reduccion en el valor de Lx puede afectar en mayor medida que un posible aumento
en la relacion entre normas (que viene dado por la razon Mq /mq ).
Tomese por ejemplo un sistema lineal xk+1 = Axk + wk siendo

A=

0,9 2,0
0

0,8

con unas incertidumbres kwk k 0,1 y considerando la norma-s como la norma


. Dado que la norma de la matriz kAk es una constante de Lipschitz del modelo,
se tiene que Lx = kAk = 2,9. Dado que la incertidumbre es aditiva, la constante
de Lipschitz Lw = 1, por lo que la cota obtenida en j = 5 es
kxk+5 x(k + 5|k)k 107,43 0,1 = 10,74
Sin embargo, si se toma como norma-q, para calcular la constante de Lipschitz, la
norma dos ponderada kkP con una matriz de ponderacion
P tal que AT P A
P entonces la constante de Lipschitz es LP = kAkP = . Resolviendo este
problema, que se puede expresar en forma de desigualdad matricial lineal (LMI)
(Boyd, Ghaoui, Feron & Balakrishnan 1994), se obtiene una matriz

P =

1,0189

0,7283

0,7283 29,9620

lo que induce una constante de Lipschitz LP = 1,113 y unas constantes mP =


0,1826 y MP = 1,4138. En este caso, la cota obtenida es
k
x(k + 5|k) xk+5 k 4,84
Como se puede observar, la cota obtenida es mas precisa. La obtencion de una
norma adecuada para un sistema no lineal es una tarea difcil, pero lo que no
debe hacerse es tomar cualquier norma, pues se puede incurrir en el aumento del
conservadurismo.
Controlador en cascada : fue propuesto originalmente en (Bemporad 1998), con
el fin de reducir el conservadurismo de las predicciones en bucle abierto en un
controlador MPC robusto lineal. La idea consiste en a
nadir una realimentacion
adicional al sistema con el fin de considerar en las predicciones la realimentacion
que introduce el controlador MPC.

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

167

Incorporando esta idea en la acotacion que se esta realizando, la actuacion sobre


el sistema se reformula como
uk = Kxk + vk
siendo vk la nueva variable de decision en el problema de optimizacion. As, el
modelo del sistema prealimentado sera
xk+1 = f (xk , Kxk + vk , wk ) = fK (xk , vk , wk )
el cual vara por el efecto del controlador de la prealimentacion. De esta manera,
las funciones de acotacion, principalmente x (), varan y por lo tanto se pueden
reducir las cotas.
Utilizaci
on de aproximaciones locales : la acotacion sobre la discrepancia entre
el estado predicho y el real, se puede reducir si se calcula esta de forma local, es
decir, dependiendo no solo del grado de incertidumbre, sino tambien del estado
y secuencia de actuaciones que se aplican. Esto se puede hacer utilizando las
regiones de evolucion incierta, que se desarrolla en el captulo siguiente.

6.4.

Controlador MPC con estabilidad entrada a


estado

En el captulo anterior se introdujo el concepto de estabilidad entrada a estado y


se comprobo que esta teora ofrece un marco adecuado para el analisis de robustez
del controlador MPC. De este analisis se deduce que si el coste optimo es suave y la
influencia de las incertidumbres sobre el sistema es suave, entonces el sistema admite
cierto grado de incertidumbre. La suavidad del MPC esta sujeta a condiciones de
regularidad en el problema de optimizacion, que resultan difciles de comprobar.
En esta seccion se plantea una formulacion del MPC que garantiza la estabilidad
entrada a estado del sistema sin consideraciones de suavidad en el coste optimo. En este
analisis se considera primero el caso en que no hayan restricciones en los estados. En
una seccion posterior se extienden los resultados al caso con restricciones en los estados.
La motivacion de este analisis por separado es distinguir los dos aspectos de la robustez:
la factibilidad robusta y la convergencia. La convergencia esta garantizada para todo
estado inicial factible, bajo cierta cota de las incertidumbres admitidas, gracias a la
estabilidad entrada a estado. La factibilidad se garantiza modificando las restricciones
en funcion de las incertidumbres presentes en el sistema.
El controlador que se propone se basa en la formulacion robusta del controlador
MPC dual presentada en (Michalska & Mayne 1993). En este trabajo se presenta

168

6.4. Controlador MPC con estabilidad entrada a estado

primero un controlador MPC dual, tal que conduce el sistema hasta una region terminal
, donde un controlador local es el encargado de estabilizarlo hasta el origen. En esta
formulacion, ademas de la conmutacion del controlador, el horizonte de control es una
variable de decision, por lo que se va reduciendo a lo largo de la evolucion del sistema.
Con el fin de proveer robustez al sistema cuando se a
nade un observador de los estados,
se propone un controlador robusto dual que estabiliza sistemas con cierto grado de
incertidumbres aditivas que decaen con el tiempo. Partiendo de un invariante robusto,
se considera en el problema de optimizacion una region terminal mas conservadora
. Para cierto grado de incertidumbres se garantiza que en el instante siguiente el
problema es factible en y por lo tanto el controlador local lo puede llevar hasta en
un tiempo determinado.
En la formulacion que se propone en esta seccion, se utiliza la idea de la region
terminal conservadora pero se extiende a un controlador MPC con horizonte fijo, y por
lo tanto no es necesario conmutar a un controlador local. Ademas se demuestra que el
controlador propuesto garantiza la estabilidad entrada a estado para ciertas cotas de
las incertidumbres.
Cabe resaltar que la formulacion que se presenta esta basada en la prediccion nominal del sistema, con un problema de optimizacion semejante al de un MPC general.
Por lo tanto el procedimiento propuesto para garantizar robustez es tan sencillo como considerar en el problema de optimizacion una region interior a la region terminal
obtenida.
A continuacion se presentan una serie de resultados preliminares sobre la region
terminal necesarios para la formulacion del controlador que se propone.

6.4.1.

Determinaci
on de la regi
on terminal

Se va a considerar que el sistema satisface la siguiente hipotesis:


Hip
otesis 6.5 El sistema es tal que existe un conjunto que es un conjunto invariante
positivo del sistema controlado por una ley de control uk = h(xk ), tal que
1. X h = {x IRn : h(x) U }.
2. Sea un conjunto invariante tal que

Qh ()
1

Qh () = {x IRn : h(x) U y f (x, h(x)) }. Vease la seccion A.3.

(6.4)

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

169

es decir, que para todo x , se satisface que f (x, h(x), 0) .


3. El sistema en bucle cerrado tiene una funcion de Lyapunov asociada V (x) tal que
V (f (x, h(x), 0)) V (x) L(x, h(x)) x
4. Sea un conjunto no vaco B = {z IRn : kzk } tal que
B

(6.5)

siendo B = { IRn : , z B | = + z}.


Notese que las condiciones impuestas sobre el conjunto invariante y la funcion
de coste terminal V (x) son la hipotesis habituales a imponer sobre la region terminal
del MPC nominal. El conjunto y el conjunto B existen gracias a que el controlador
local estabiliza asintoticamente el sistema.
Se va a suponer ademas que la funcion de Lyapunov satisface la siguiente hipotesis
Hip
otesis 6.6 La funcion de coste terminal V (x) es suave, de forma que existe una
funcion K , V (x), tal que
|V (x + x) V (x)| V (kxk)
para todo x .
En el caso en que el conjunto venga dado por
= {x IRn : V (x) }
y el controlador local estabilice exponencialmente el sistema siendo V (x) la funcion
de Lyapunov asociada, se puede obtener el conjunto de la siguiente forma: sea una
constante positiva < 1 tal que, para todo x verifica2
V (f (x, h(x), 0)) V (x)
entonces se puede determinar el conjunto como
= {x IRn : V (x) = v }
El conjunto B vendra dado por un valor de tal que
V () ( v ) = (1 )
dado que para todo x y z B , se verifica que
V (x + z) V (x) + V (kzk) v + V ()
y por tanto x + z , por lo que B .
2

Vease la seccion A.2.3.

(6.6)

170

6.4. Controlador MPC con estabilidad entrada a estado

6.4.2.

Formulaci
on del MPC

Una vez determinados la region terminal , el controlador MPC se obtiene de la


resolucion del siguiente problema de optimizacion:
mn JN (xk , uF (k))

uF (k)

s.a
u(k + j|k) U

j = 0, , N 1

x(k + N |k)
siendo el funcional a optimizar
JN (xk , uF (k)) =

N
1
X

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

i=0

El vector uF (k) denota la secuencia de N actuaciones futuras


uF (k) = {u(k|k), , u(k + N 1|k)}
siendo u(k + j|k) la actuacion en el instante k + j calculada en el instante actual k.
Ante esta secuencia de actuaciones, la evolucion predicha del sistema en el instante
k + j + 1 a partir del modelo nominal del sistema se denota como x(k + j + 1|k) y viene
dada por
x(k + j + 1|k) = f (x(k + j|k), u(k + j|k), 0)
de modo que x(k|k) es el estado muestreado del sistema en el instante actual xk .
Como se puede observar, este problema de optimizacion es semejante al asociado a
la formulacion general del MPC, en el que la region terminal es un invariante con unas
condiciones adicionales.
Se va a considerar que el coste de etapa satisface la siguiente hipotesis de suavidad:

Hip
otesis 6.7 La funcion de coste de etapa L(x, u) es suave respecto al estado de
forma que existe una funcion K , L (x), tal que
|L(x + x, u) L(x, u)| L (kxk)
para todo u U y para todo x IRn .

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

6.4.3.

171

An
alisis de estabilidad

Para comprobar la estabilidad entrada a estado del sistema, se va a demostrar


primero que el controlador esta bien planteado bajo cierto grado de incertidumbres,
es decir, que si un estado es factible, entonces el estado siguiente tambien lo es. Esta
prueba de factibilidad robusta permite afirmar que el conjunto de estados factibles es
un invariante robusto positivo del sistema.
Teorema 6.8 (Factibilidad robusta)
Sea un sistema incierto descrito por un modelo
xk+1 = f (xk , uk , wk )
con las actuaciones sujetas a uk U en todo instante k. Las incertidumbres wk IRp
est
an contenidas en el conjunto wk B = {w IRp : kwk }.
Sup
ongase que las funciones que describen el modelo f (, , ), el coste terminal V () y
el coste de etapa L(, ) son funciones suaves que satisfacen las hipotesis 6.1,6.6 y 6.7.
Sea el controlador MPC obtenido del problema de optimizacion propuesto,de forma tal
que el conjunto terminal satisface la hipotesis 6.5, siendo B el conjunto asociado a
.
Entonces el sistema incierto controlado por el controlador MPC propuesto, si parte
de un estado inicial factible (x0 XNr ), la evolucion del sistema incierto es factible
(xk XNr ), para unas incertidumbres tales que
xN 1 w ()

Demostraci
on:
Para probar el teorema, se va a proceder demostrando que para todo xk1 XNr , se
tiene que xk = f (xk1 , u (k 1|k 1), wk1 ) XNr para toda incertidumbre wk1 B .
Esta condicion garantiza que el conjunto XNr es un invariante robusto del sistema en
bucle cerrado.
Sea uF (k 1) la solucion optima en el instante k 1. A partir de esta se va a
calcular una secuencia uF (k) para el instante k, de forma que

u (k + j 1|k 1) para
u(k + j 1|k) =
h(
x(k + N 1|k)) para

j = 1, ..., N 1
j=N

(6.7)

Se denota x(k + j|k) al estado predicho en k + j a partir del estado x(k|k) = xk


utilizando el modelo nominal (en ausencia de incertidumbres) y aplicando la secuencia
de actuaciones uF (k).

172

6.4. Controlador MPC con estabilidad entrada a estado

A continuacion se va a demostrar que esta secuencia de actuaciones es factible en


el instante k, lo que demuestra el teorema. Para ello se va a comprobar la satisfaccion
de las restricciones del problema de optimizacion en xk para cualquier incertidumbre
admisible.

a) u(k + j|k) U : es consecuencia inmediata de la factibilidad de uF (k 1) y de la


propiedad del controlador local por la cual h(x) U , x .
b) x(k + N |k) : en la figura 6.1,se ilustra la idea de esta demostracion. Primero
se va a demostrar que x(k + N 1|k) . Para ello tengase en cuenta que por
el lema 6.4 se tiene que
k
x(k + N 1|k) x (k + N 1|k 1)k xN 1 w ()
Considerando que xN 1 w () se deduce que el vector
z = x(k + N 1|k) x (k + N 1|k 1) B
Entonces, considerando que x (k + N 1|k 1) y que z B se tiene que
x(k + N 1|k) = x (k + N 1|k 1) + z B
Por la hipotesis 6.4 se tiene que Qh () y por lo tanto el controlador local es
capaz de llevar cualquier estado de a en un solo paso. Por lo tanto
x(k + N |k) = f (
x(k + N 1|k), h(
x(k + N 1|k)), 0)
lo que demuestra la factibilidad de la restriccion terminal.
4

xk1
xk

x2

x(k+N1|k)

x*(k+N1|k1)

x(k+N|k)

0
4

2
x1

Figura 6.1: Ilustracion de la factibilidad robusta de la restriccion terminal

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

173

En el caso de continuidad Lipschitz de las funciones, la cota de incertidumbre admitida es

N 1
Lx Lw
Notese que si el sistema es estable y con una constante de Lipschitz Lx < 1, cuanto
mayor es el horizonte, mayor es el grado de incertidumbres que admite el controlador.
Una vez demostrado que el controlador es factible a lo largo de la evolucion del
sistema incierto, se va a demostrar que el sistema en bucle cerrado es estable entrada a
estado respecto a las incertidumbres. Esto implica que el controlador es robusto en el
sentido de que si las incertidumbres sobre el sistema estan acotadas, el comportamiento
del sistema tambien estara acotado. Si, ademas, estas decaen con el tiempo, el controlador estabiliza asintoticamente el sistema incierto. Este resultado forma parte de las
contribuciones de esta tesis.

Teorema 6.9 (Estabilidad entrada a estado)


Sea un sistema incierto descrito por un modelo
xk+1 = f (xk , uk , wk )
con las actuaciones sujetas a uk U en todo instante k. Las incertidumbres wk IRp
est
an contenidas en el conjunto wk B = {w IRp : kwk }.
Sea el sistema y el controlador MPC tales que satisfacen las hipotesis del teorema 6.8
con un dominio de atracci
on XNr .
Entonces el sistema en bucle cerrado es estable entrada a estado respecto a las incertidumbres para todo x0 XNr .

Demostraci
on:
En esta demostracion se sigue la misma notacion utilizada en la demostracion del
teorema 6.8, siendo uF (k 1) la secuencia optima de actuaciones obtenida en el estado
xk1 . Como consecuencia de la aplicacion de la actuacion optima, el sistema evoluciona
al estado xk , en el cual, como se demostro anteriormente, existe una secuencia factible
de actuaciones uF (k) calculada a partir de la secuencia uF (k 1). Los estados predichos
con esta secuencia son x(k + j|k). As el coste optimo en el instante k 1 es
JN (xk1 )

N
1
X
i=0

L(x (k + i 1|k 1), u (k + i 1|k 1)) + V (x(k + N 1|k 1))

174

6.4. Controlador MPC con estabilidad entrada a estado

y el coste de la secuencia factible en k es


JN (xk ) = JN (xk , uF (k)) =

N
1
X

L(
x(k + i|k), u(k + i|k)) + V (
x(k + N |k))

i=0

Restando ambas expresiones se tiene que


JN (xk ) JN (xk1 ) =

N
2
X

L(
x(k + i|k), u(k + i|k))

i=0

L(x (k + i|k 1), u (k + i|k 1))


L(xk1 , u (k 1|k 1))
+L(
x(k + N 1|k), h(
x(k + N 1|k)))
+V (
x(k + N |k)) V (x (k + N 1|k 1))
Teniendo en cuenta que u(k + i|k) = u (k + i|k 1) para todo i = 0, , N 2, del
lema 6.4 se tiene que
k
x(k + i|k) x (k + i|k 1)k xi w ()
Basandose en la suavidad de L(, ) y V () se pueden obtener las siguientes acotaciones:
L(
x(k + i|k), u(k + i|k)) L(x (k + i|k 1), u (k + i|k 1)) L xi w ()
y analogamente
V (
x(k + N 1|k)) V (x (k + N 1|k 1)) V xN 1 w ()
Considerando que x(k + N 1|k) , de la condicion terminal se tiene que
L(
x(k + N 1|k), h(
x(k + N 1|k))) + V (
x(k + N |k)) V (
x(k + N 1|k))
Incorporando estas condiciones se tiene que
JN (xk ) JN (xk1 )

(N 2
X

{L

xi

w ()} + V

xN 1

w ()

i=0

L(xk1 , u (k 1|k 1))


Dado que las funciones L (), V (), x () y w (), son funciones K , entonces el
primer sumando es una funcion K que se va a denotar (). Por otro lado, la funcion
de coste de etapa verifica L(xk1 , u (k 1|k 1)) lkxk1 k . Considerando esto, por
el principio de optimalidad se tiene que
JN (xk ) JN (xk1 ) lkxk1 k + ()

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

175

y por lo tanto, en virtud de la definicion de funcion de Lyapunov entrada a estado3 ,


la funcion de coste optimo es una funcion de Lyapunov entrada a estado, y en consecuencia, el sistema en bucle cerrado es estable entrada a estado.
Por u
ltimo, merece la pena resaltar que el controlador propuesto puede ser bastante
conservador por dos motivos:

Esta basado en una acotacion conservadora. El conservadurismo en la acotacion


hace que las cotas de incertidumbre que admite el sistema y el dominio de atraccion asociado sean menores que los que se podran obtener con otro tipo de
acotaciones no tan conservadoras. Las medidas propuestas para reducir el conservadurismo tienden a suavizar este efecto.
Esta basado en predicciones en bucle abierto. Esta es sin duda la causa mas
importante. La prediccion del comportamiento del sistema se hace sin atender a
la posible reaccion del controlador ante la incertidumbre presente en el sistema.
Esto hace que el sistema real pueda admitir un mayor grado de incertidumbre
que el grado para el cual se garantiza la estabilidad.

6.5.

Robustez de la formulaci
on con Np > Nc

Del analisis de estabilidad desarrollado en la seccion anterior, se deducen unas propiedades interesantes en el caso en que se considere un horizonte de prediccion mayor
que el de control.
En esta formulacion, la secuencia de actuaciones se calcula para un horizonte de
control Nc , de forma que la prediccion del comportamiento se extiende hasta Np aplicando el controlador local obtenido para la region terminal uk = h(xk ). Seg
un esto, el
MPC se formula como
mn JNc ,Np (xk , uF )
uF

s.a
u(k + j|k) U

j = 0, , Nc 1

h(x(k + j|k)) U j = Nc , , Np 1
x(k + Np |k)
3

Vease la seccion A.4.

(6.8)

176

6.5. Robustez de la formulacion con Np > Nc

siendo el funcional considerado


JNc ,Np (xk , uF ) =

NX
c 1

L(x(k + i|k), u(k + i|k))

i=0
Np 1

L(x(k + i|k), h(x(k + i|k))) + V (x(k + Np |k))

i=Nc

En este caso las predicciones se realizan de forma que


x(k + j + 1|k) = f (x(k + j|k), u(k + j|k), 0) j = 0, Nc 1
x(k + j + 1|k) = f (x(k + j|k), h(x(k + j|k)), 0) j = Nc , Np 1
siendo x(k|k) = xk .
Esta formulacion hace que la acotacion del efecto de la incertidumbre obtenida
cambie para predicciones mas alla del horizonte de control. Para ello basta considerar
la funcion K , hx (), tal que
kf (x + x, h(x + x), 0) f (x, h(x), 0)k hx (kxk)
para todo x, x + x SNp Nc ( IRn , ).
Notese que esta acotacion es menos conservadora que x () pues acota el efecto de
la variacion sobre el estado del sistema en bucle cerrado controlado por una ley de
control asintoticamente estabilizante. Por tanto, el efecto de x sobre el sistema estara compensado por el controlador. Esta compensacion no se considera en la definicion
de x ().
En consecuencia la acotacion kx(k + j|k) xk+j k cj () se obtiene haciendo
cj () = w () + x (cj1 ()) para j Nc
cj () = w () + hx (cj1 ()) para j > Nc
siendo c1 () = w ().
Analogamente al desarrollo realizado en la seccion anterior, se deduce el siguiente
teorema:
Teorema 6.10 Sea un sistema incierto descrito por un modelo
xk+1 = f (xk , uk , wk )
con las actuaciones sujetas a uk U en todo instante k. Las incertidumbres wk IRp
estan contenidas en el conjunto wk B = {w IRp : kwk }.

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

177

Sup
ongase que las funciones que describen el modelo f (, , ), el coste terminal V () y
el coste de etapa L(, ) son funciones suaves que satisfacen las hipotesis 6.1,6.6 y 6.7.
Sea el controlador MPC obtenido del problema de optimizacion dado por la ecuaci
on
(6.8), de forma que el conjunto terminal satisface la hipotesis 6.5, para cierto conjunto de incertidumbres B .
Entonces el sistema incierto controlado por el controlador MPC propuesto es estable
entrada a estado con un dominio de atraccion que es el conjunto factible del problema
XNc ,Np y para unas incertidumbres tales que
N Nc

hxp

xNc 1 w ()

La incorporacion del horizonte de prediccion dota al controlador de una serie de


propiedades:
Aumento del dominio de atracci
on : dado que S1h ( IRn , ), resulta que para
cualquier horizonte de prediccion mayor que el de control, la disminucion de
dominio de atraccion derivado de considerar como region terminal , se
compensa. De hecho para Np > Nc , el controlador puede presentar un dominio
de atraccion mayor.
Posible aumento de la incertidumbres admitidas : el hecho de que el sistema
controlado por la ley de control local sea asintoticamente estable hace posible
que para cierta norma, la funcion hx () satisfaga que
hx (kxk) kxk
Esta propiedad hace que el efecto de las incertidumbres se aten
ue a partir Nc .
Esto se puede satisfacer, por ejemplo, tomando un controlador local lineal que
estabilice exponencialmente el sistema y tomando como norma en la acotacion la
norma ponderada por la matriz de Lyapunov del sistema linealizado en torno al
origen controlado por dicho controlador.

6.6.

MPC robusto con restricciones en el estado

Las restricciones impuestas sobre los estados son especialmente delicadas en el caso
en el que el sistema real tenga incertidumbres. En efecto, si el comportamiento real
del sistema difiere de la prediccion realizada a partir del modelo nominal, la actuacion
obtenida del controlador basado en este puede hacer que el sistema incierto viole las
restricciones impuestas.

178

6.6. MPC robusto con restricciones en el estado

En el captulo anterior se analizo el problema de la factibilidad robusta y se expusieron distintas formas de garantizarla. Todas estas medidas estan relacionadas con
la propiedad de invariancia robusta:
1. La primera forma y mas inmediata es basandose en el coste optimo que es una
funcion de Lyapunov entrada a estado. As toda region
r = {x IRn : JN (x) r}
es un invariante robusto (para un cierto grado de incertidumbres). As en un
conjunto tal que r X el controlador garantiza las restricciones.
2. Determinando si el dominio de atraccion XNr = SN (X, ) es un invariante robusto
del sistema en bucle cerrado. En el caso de incertidumbres aditivas, esto se cumple
bajo la condicion (Kerrigan 2000) dada por
SN 1 (X, ) W SN (X, )
3. Incorporando la restriccion de robustez (Kerrigan 2000). A
nadiendo al problema
de optimizacion la restriccion
x(k + 1|k) XR W
y bajo ciertas condiciones sobre XR se establece que el dominio de atraccion del
controlador con esta restriccion es un invariante robusto, y por lo tanto satisface
las restricciones.
Hay que indicar que en este caso, en las condiciones impuestas en la determinacion
de la region terminal en la hipotesis 6.5, se debe considerar las restricciones en los
estados, de forma que X.
Bajo estas condiciones, el controlador MPC propuesto garantiza la estabilidad robusta, pues los teoremas sobre la estabilidad entrada a estado se siguen satisfaciendo,
y la factibilidad robusta.

6.6.1.

Factibilidad del MPC basada en restricciones conservadoras

La acotacion sobre la discrepancia entre la evolucion predicha y la evolucion del


sistema real permite establecer un procedimiento para garantizar la factibilidad robusta. Basandose en esta acotacion se puede considerar un conjunto de restricciones mas

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

179

conservador tal que garantice que si el sistema nominal satisface la restriccion conservadora, entonces el sistema real satisface la restriccion X a pesar de las incertidumbres.
Para ello se va a definir una nueva secuencia de cotas cj () que posee unas propiedades
interesantes:
n

cj () = max w () + x (
cj1 ()), cj1 + xj1 w ()

(6.9)

siendo c1 () = w () y xi () la composicion sucesiva i veces de la funcion x (), siendo


x1 () = x (). Es inmediato que cj () cj ().
A continuacion se va a establecer el procedimiento de obtencion de las restricciones
conservadoras: sea Xj el conjunto de restriccion conservadora que debe satisfacer el
estado predicho (utilizando el modelo nominal) en el instante k + j a partir del instante
k. Este conjunto viene dado por:
Xj = X Bj

(6.10)

siendo X0 = X y donde Bj es el conjunto


Bj = {z IRn : kzk cj ()}
De esta manera, si x(k + j|k) es tal que esta contenido en Xj , entonces el estado
real del sistema, ante la misma secuencia de entradas, satisface la restriccion xk+j X,
ante cualquier incertidumbre presente en el sistema. De la definicion de diferencia de
Pontryagin de conjuntos se deduce que para todo x(k + j|k) Xj y para todo z Bj ,
se tiene que
x(k + j|k) + z X
Dado que, para una determinada secuencia de actuaciones, la discrepancia entre el
estado predicho y el real es
kxk+j x(k + j|k)k cj () cj ()
entonces
xk+j = x(k + j|k) + {xk+j x(k + j|k)} X
|

{z

j
B

Esta idea esta relacionada con la restriccion de robustez introducida en (Chisci


et al. 2001) para sistemas lineales. En este caso, se resta al conjunto de las restricciones
X los conjuntos de Kolmanovski que son una acotacion de la evolucion del sistema
incierto.
Los conjuntos definidos verifican una propiedad que sera de utilidad en posteriores
demostraciones.

180

6.6. MPC robusto con restricciones en el estado

Lema 6.11 Sea x Xj+1 y sea y IRn tal que kx yk xj w () entonces y Xj .

Demostraci
on:
Sea ej Bj y sea z = x y + ej . Entonces se tiene que
kzk kx yk + kej k xj w () + cj () cj+1 ()
por lo tanto z Bj+1 .
Teniendo en cuenta que x Xj+1 , se tiene que y + ej = x + z X para todo
ej Bj . Por lo tanto y Xj .
En este caso, el controlador MPC toma la forma
mn JN (xk , uF (k))

uF (k)

s.a
u(k + j|k) U

j = 0, , N 1

x(k + j|k) Xj j = 0, , N 1
x(k + N |k)
Ademas, en las condiciones de la hipotesis 6.5, se debe considerar las restricciones
en los estados, de forma que XN 1 .
A continuacion se va a demostrar que el controlador as obtenido garantiza la factibilidad robusta del sistema. Para ello se va a demostrar el teorema 6.8 considerando
estas restricciones. Dado que las restricciones en los estados y la restriccion terminal
son factibles como ya se demostro, tan solo se va a demostrar que las restricciones en
los estados son factibles. De esta forma se complementa el nuevo controlador propuesto en este captulo, en el que se garantiza la satisfaccion robusta de las restricciones,
as como la convergencia gracias a la estabilidad ISS.
Teorema 6.12 (Factibilidad robusta con restricciones en el estado)
Sea un sistema incierto descrito por un modelo
xk+1 = f (xk , uk , wk )
con el estado sujeto a xk X y las actuaciones sujetas a uk U en todo instante k.
Las incertidumbres wk IRp est
an contenidas en el conjunto wk B = {w IRp :

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

181

kwk }.
Sup
ongase que las funciones que describen el modelo f (, , ), el coste terminal V () y
el coste de etapa L(, ) son funciones suaves que satisfacen las hipotesis 6.1,6.6 y 6.7.
Sea el controlador MPC obtenido del problema de optimizacion propuesto, de forma
que los conjuntos de restricciones Xj vienen dados por la ecuaci
on (6.10) y el conjunto
terminal XN 1 satisface la hipotesis 6.5, siendo B el conjunto asociado a .
Entonces el sistema incierto controlado por el controlador MPC propuesto es factible a
lo largo de la evolucion del sistema, para todo estado inicial perteneciente al conjunto
factible del problema XNr y para unas incertidumbres tales que
xN 1 w ()

Demostraci
on:
Se procede de la misma forma que en la demostracion del teorema 6.8, comprobando
que la secuencia uF (k) es factible. En esta demostracion se probo que se satisface la
restriccion terminal y ademas que
x(k + N + 1|k)

Para demostrar x(k + j|k) Xj , considerese que, por el efecto de la incertidumbre,


la discrepancia entre el estado real y el predicho verifica
kxk x (k|k 1)k w ()
Aplicando el lema 6.4 se tiene que
k
x(k + j|k) x (k + j|k 1)k xj w ()
Teniendo en cuenta esto, y dado que x (k + j|k 1) Xj+1 para todo j = 0, , N 2,
por el lema 6.11 se tiene que x(k + j|k) Xj para todo j = 0, , N 2.
Por u
ltimo, dado que x(k + N 1|k) XN 1 , las restricciones se satisfacen.

Por lo tanto la acotacion realizada sobre la discrepancia en las predicciones, permite


establecer un procedimiento sencillo para demostrar factibilidad robusta del sistema.
Ademas, tambien se puede comprobar que el controlador es estable entrada a estado,
lo que garantiza convergencia.

182

6.7.

6.7. Ejemplo de aplicacion al reactor

Ejemplo de aplicaci
on al reactor

Para ilustrar el controlador presentado en este captulo, se va a aplicar al reactor


utilizado a lo largo de la tesis. Las incertidumbres en el sistema se van a modelar
como incertidumbres aditivas acotadas. Ademas, para reducir el conservadurismo se
va a considerar el sistema prealimentado por el controlador local. Tambien se van a
considerar unas restricciones sobre el sistema dadas por:
x1 [0,21, 0,21]
x2 [2,0, 0,25]
La aplicacion de este controlador requiere una serie de calculos previos encaminados
a la determinacion del grado de robustez capaz de soportar el controlador. As, es
necesario determinar las funciones de suavidad y un conjunto invariante.
Para la determinacion del invariante positivo, se ha sintonizado un controlador local
lineal obtenido por la tecnica LQR, con matrices de ponderacion

Q=

10

0,1

R=1

y para las cuales se obtiene un controlador lineal y una funcion de Lyapunov cuadratica
dados por
K=

1,5488 3,4658

P =

263,5900

47,1760

47,1760

117,4640

El sistema controlado por este controlador local tiene un invariante positivo dado por
= {x IR2 : xT P x }
siendo = 9,764 y una constante de decrecimiento de la funcion de Lyapunov =
0,924. El conjunto que se va a considerar como region terminal en el problema de
optimizacion sera
= {x IR2 : xT P x v }
siendo v = = 9,0219.
Como norma para expresar las incertidumbres se va a tomar la norma dos ponderada
por la matriz P . As, la constante viene dada en este caso por

kwkP = (1 )
obteniendose = 0,1208.

Captulo 6. MPC ISS con satisfaccion robusta de las restricciones

183

A continuacion, se calcula la constante de Lipschitz en la norma dos ponderada, del


sistema prealimentado, obteniendose un valor de la constante de Lx = 1,6. Dado que
las incertidumbres son aditivas, se tiene que Lw = 1. Por consiguiente, tomando un
horizonte de control Nc = 4, se tiene que la incertidumbre admitida por el controlador
() viene dada por
L3x Lw
de donde se deduce que 0,0295.
Con el fin de considerar las restricciones en los estados del controlador, se obtiene
una cota conservadora en norma infinito de las incertidumbres obtenidas en norma P .
Esto se debe a que las restricciones se han expresado en norma infinito. En consecuencia
se tiene que
Lj 1
Bj = {z IR2 : kzk x
}
Lx 1
siendo = 5,9103 .
La evolucion del sistema incierto en bucle cerrado se puede observar en la figura
6.2.
0.5

0.5

1.5
0.25

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

0.25

x1

Figura 6.2: Evoluci


on del sistema incierto en bucle cerrado

6.8.

Conclusiones

En este captulo se ha presentado un procedimiento para incorporar el conocimiento de las incertidumbres en el dise
no del controlador. Basandose en la acotacion de

184

6.8. Conclusiones

las discrepancias entre la evolucion del sistema real y el comportamiento predicho por
el modelo nominal, se garantiza que, bajo ciertas cotas de la incertidumbres y considerando como region terminal una region mas conservadora, se satisface de manera
robusta la condicion terminal. Tambien se consideran unas restricciones conservadoras
en los estados predichos que garantizan la satisfaccion robusta de las restricciones por
parte del sistema incierto. En consecuencia, se garantiza la satisfaccion robusta de las
restricciones en el conjunto factible XNr .
Ademas se puede garantizar la estabilidad entrada a estado del sistema para todo
estado inicial factible lo que dota de convergencia al controlador. Esta formulacion
forma parte de las contribuciones originales de esta tesis y ha dado lugar al artculo

(Limon Marruedo, Alamo


& Camacho 2002b).
Cabe resaltar que la factibilidad robusta y la convergencia se han obtenido modificando ligeramente la formulacion general del MPC y se basa en las predicciones
nominales del sistema. Por lo tanto el coste computacional del controlador es el mismo
que el controlador nominal. Ademas estas propiedades se satisfacen bajo hipotesis de
suavidad de las funciones que forman parte del problema de optimizacion y no es
necesario imponer condiciones adicionales como la suavidad del coste optimo, que es
difcil de comprobar.
Un problema del controlador propuesto es que puede conducir a controladores conservadores y/o peque
nos dominios de atraccion. Este conservadurismo tiene su origen
en la acotacion realizada y en la prediccion en bucle abierto del sistema. La primera
de las causas, puede reducirse incorporando una serie de medidas propuestas, como la
incorporacion de un controlador en cascada o bien, la utilizacion de acotaciones locales
que dependan del estado del sistema y de las actuaciones aplicadas sobre el mismo.
En el captulo siguiente de la tesis se presenta un procedimiento para la acotacion local de las discrepancias, que da lugar a las denominadas regiones de evolucion incierta.
Ademas se dise
na un controlador que incorpora estas regiones para garantizar robustez.
La segunda causa, y mas importante, es la prediccion en bucle abierto realizado,
sin incorporar en la prediccion el efecto corrector que incorpora el controlador. Este
problema se puede subsanar con las denominadas formulaciones en bucle cerrado, que
se tratan en un captulo posterior.

Captulo 7
MPC robusto basado en regiones
de evoluci
on incierta
7.1.

Introducci
on

En el captulo anterior se han establecido condiciones bajo las cuales el controlador


estabiliza el sistema para cierto nivel de incertidumbres. As, suponiendo ciertas condiciones de suavidad del sistema y considerando una region terminal conservadora, el
controlador es factible a lo largo de la evolucion del sistema incierto y garantiza que el
coste optimo es una funcion de Lyapunov entrada a estado.
El grado de incertidumbres que puede soportar el controlador garantizando estabilidad se obtiene a partir de acotaciones basadas en la suavidad de las funciones. Estas acotaciones son acotaciones globales, es decir, validas para todo estado, actuacion
e incertidumbre admisible del sistema. Esto hace que los niveles de incertidumbres
obtenidos sean mas conservadores.
Para tratar de mitigar este efecto, se establece en este captulo un procedimiento
para incorporar al dise
no de controladores predictivos robustos, procedimientos locales
para la determinacion de la discrepancia entre el estado predicho y la posible evolucion
del sistema. Este procedimiento se plasma en el concepto de region de evolucion incierta.
Con el fin de dotar de robustez al controlador predictivo, se incorporan las regiones
de evolucion incierta en su formulacion, dando lugar a un controlador dual y otro no
dual que garantizan la estabilidad bajo la factibilidad del estado inicial. Estos controladores MPC robustos son aportaciones originales de esta tesis y han dado lugar al

artculo (Limon Marruedo, Bravo, Alamo


& Camacho 2002).
185

186

7.2. Regiones de evolucion incierta

A continuacion se introduce el concepto de region de evolucion incierta, en el cual


se basa el controlador propuesto.

7.2.

Regiones de evoluci
on incierta

7.2.1.

Descripci
on del sistema

Sea un sistema tal que responde a un modelo con incertidumbres aditivas de la


forma
xk+1 = f (xk , uk ) + wk
(7.1)
siendo xk IRn el estado del sistema en el instante k, uk IRm el vector de actuaciones
y wk IRn las posibles incertidumbres que afectan al sistema. Tanto los estados como
las actuaciones estan restringidos a lo largo del tiempo, de forma que
xk X
uk U

(7.2)
(7.3)

Ademas, las incertidumbres se consideran que estan acotadas en un conjunto compacto


wk W

(7.4)

El sistema en ausencia de incertidumbres se denomina modelo nominal y viene dado


por
xk+1 = f (xk , uk )
de forma que, dicho modelo presenta un punto de equilibrio en el origen, por tanto
f (0, 0) = 0.
El modelado de incertidumbres como aditivas representa a una gran cantidad de
sistemas inciertos, dado que la incertidumbre wk puede depender del estado del sistema.
El u
nico conocimiento de las incertidumbres es el margen de variacion que estas pueden
tener, que se traduce en un determinado conjunto W . Por ejemplo, considerese un
sistema incierto descrito por
xk+1 = f (xk , uk , pk )
siendo pk P el vector de incertidumbres parametricas del que depende el sistema.
Entonces
xk+1 = f (xk , uk , pk ) = f (xk , uk )+(f (xk , uk , pk )f (xk , uk )) = f (xk , uk )+f (xk , uk , pk )

Captulo 7. MPC robusto basado en regiones de evolucion incierta

187

considerando como modelo nominal xk+1 = f (xk , uk , 0) = f (xk , uk ), se puede definir


unas incertidumbres wk y un conjunto W tales que
wk = f (xk , uk , pk ) W, xk X, uk U, pk P
Este tipo de sistemas tambien se suelen denominar sistemas perturbados, por responder estos al mismo modelo. Es importante resaltar que desde un punto de vista
practico, este tipo de descripciones son muy sencillas de obtener en la etapa de identificacion de un sistema, pues wk respresentara el error entre el sistema real y el
identificado.

7.2.2.

Notaci
on y definici
on de operaciones sobre conjuntos

Con el fin de simplificar la exposicion de los desarrollos y resultados obtenidos en


este captulo, se introduce una notacion para describir distintos elementos implicados
en estos. As se denota:
uN
F (k) : a una secuencia de N actuaciones futuras a partir del instante k, es decir
uN
F (k) = {u(k|k), u(k + 1|k), , u(k + N 1|k)}
siendo u(k + j|k) la actuacion j-esima de dicha secuencia. El n
umero de terminos de esta secuencia se suele inferir del contexto, por lo que se suele denotar
simplemente uF (k).
j
erminos de la secuencia uN
{uN
F (k)
F (k)}i : a los t
j
{uN
F (k)}i = {u(k + i|k), , u(k + j|k)}

siendo i j N .
x(k + j|k) : a la prediccion en el instante k + j de la evolucion del sistema en ausencia
de incertidumbres a partir del estado xk aplicando sobre el sistema una secuencia
de actuaciones uF (k).
Tambien resulta de utilidad la definicion de ciertas operaciones sobre conjuntos que
se utilizan en el desarrollo de posteriores resultados.
Definici
on 7.1 Sea el conjunto IRn , y sea la funcion g : IRn IRn , entonces
se define el conjunto g() como
g() = {z IRn : s , z = g(s)}

188

7.2. Regiones de evolucion incierta

Definici
on 7.2 Sea IRn , y IRn , se denomina conjunto diferencia de Pontryagin al conjunto
= {x IRn : x + y , y }
Definici
on 7.3 Sea IRn , y IRn , se denomina conjunto suma de Minkowski
al conjunto
= {z IRn : x , y , z = x + y}

Esta definicion se puede extender a la operaci


on x siendo x un vector contenido
en IRn , sin mas que considerar que = {x}. As x = {x + a, a }.
Propiedad 7.4 Si incluye el origen, entonces
( )

7.2.3.

Regiones de evoluci
on incierta

Como es bien sabido, el efecto de la incertidumbre sobre el sistema hace que, ante
una determinada accion de control, exista una discrepancia entre el estado al que este
evoluciona y el que predice el modelo nominal. As, el estado real del sistema puede
evolucionar a cualquier estado contenido en una vecindad del estado nominal, dado
que 0 W . La region a la que el sistema real puede evolucionar ante una determinada
actuacion depende del estado del que se parte, de la actuacion aplicada y del grado de
incertidumbres que presenta el sistema, siendo tanto mayor cuanto mayor sea el grado
de incertidumbre.
Esta idea puede extenderse a la prediccion realizada a j pasos. As, existe una region
entorno al estado nominal predicho x(k+j|k) tal que contiene todas los posibles estados
a los que el sistema puede evolucionar ante una determinada secuencia de actuaciones.
Esta region se plasma en la denominada region exacta de evolucion incierta.

Definici
on 7.5 Sea un sistema incierto descrito por un modelo
xk+1 = f (xk , uk ) + wk
de forma que las incertidumbres wk W , entonces se denomina regi
on exacta de
evolucion incierta en el instante k + j partiendo del estado en el instante k,xk , y ante
una secuencia de actuaciones uF (k), al conjunto que contiene todos los posibles estados

Captulo 7. MPC robusto basado en regiones de evolucion incierta

189

a los que el sistema incierto puede evolucionar en el instante k + j. Este conjunto viene
dado por:
j2
Xj (xk , {uF (k)}j1
0 ) = f (Xj1 (xk , {uF (k)}0 ), u(k + j 1|k)) W

siendo
X1 = f (xk , u(k|k)) W
La region exacta de evolucion incierta Xj depende en general del estado del sistema
en el instante k, xk , de la secuencia de actuaciones desde el instante k hasta el instante
j 1, {uF (k)N }j1
0 , del conjunto de incertidumbres W y del modelo nominal f (, ).
Para simplificar la notacion, esta region se denota Xj (xk , uF (k)). As esta viene dada
por la composicion
Xj (xk , uF (k)) = f (Xj1 (xk , uF (k)), u(k + j 1|k)) W
Notese que la region Xj se puede entender como la union de todas las regiones
exactas de evolucion incierta a un paso que parten de cualquier estado en Xj1 ante la
actuacion u(k + j 1|k), es decir
Xj (xk , uF (k)) =

f (x, u(k + j 1|k)) W

xXj1

Dado que las regiones exactas de evolucion incierta resultan en general muy difciles
de calcular con exactitud, resulta de interes caracterizar regiones que las aproximen de
una manera conservadora y cuyo calculo sea sencillo. Esto da lugar a las denominadas
regiones de evolucion incierta.
Para ello se parte de un procedimiento (, ) tal que para un conjunto A IRn
dado proporciona otro conjunto (A, u) tal que
f (A, u) (A, u)
para todo A IRn y para todo u U . En consecuencia, el procedimiento (A, u) es una
aproximacion conservadora de f (A, u) que se puede obtener mediante la utilizacion de
tecnicas de aproximacion de conjuntos. De este modo se puede hacer mas facil y menos
costoso el calculo de estos conjuntos, a cambio, claro esta, de un mayor conservadurismo
en la aproximacion. Este procedimiento debe satisfacer la siguiente hipotesis
Hip
otesis 7.6 Sea un conjunto A IRn y sea una actuacion admisible u U . Sea el
procedimiento (, u) : A IRn 7 (A, u) IRn , entonces (, ) debe satisfacer las
siguientes condiciones:

190

7.2. Regiones de evolucion incierta

1. Condicion de inclusion: f (A, u) (A, u).


2. Condicion de monotona: Sea un conjunto B A, entonces
(B, u) (A, u)
siendo f (, ) el modelo nominal del sistema.
Considerando esto, se puede establecer la siguiente definicion.

Definici
on 7.7 (Regi
on de evoluci
on incerta) Sea un sistema incierto descrito por
un modelo
xk+1 = f (xk , uk ) + wk
de forma que las incertidumbres wk W . Sea (, ) un procedimiento tal que satisfaga
la hipotesis 7.6, entonces se denomina regi
on de evolucion incierta en el instante k + j
partiendo del estado xk y ante una secuencia de actuaciones uF (k) al conjunto:
Xj (xk , uF (k)) = (Xj1 (xk , uF (k)), u(k + j 1|k)) W
siendo

X1 = f (xk , u(k|k)) W = X1

Estos conjuntos tienen las siguientes propiedades:


Propiedad 7.8 Sea Xj (xk , uF (k)) el conjunto de evolucion incierta en el instante k+j.
Este conjunto satisface las siguientes propiedades:
1. Contiene todos lo estados posibles del sistema en el instante k + j, es decir
Xj (xk , uF (k)) Xj (xk , uF (k))
2. Para todo xk+1 = f (xk , u(k|k)) + wk con wk W , se tiene que
Xj (xk+1 , uF (k + 1)) Xj+1 (xk , uF (k))
siendo uF (k + 1) = {uF (k)}j1 .

Captulo 7. MPC robusto basado en regiones de evolucion incierta

191

Demostraci
on:
1. Se procede por induccion: considerese que j = 2. Entonces se tiene que
X2 (xk , uF (k)) = f (X1 , u(k + 1|k)) W (X1 , u(k + 1|k)) W = X2 (xk , uF (k))
Supongase que Xj1 (xk , uF (k)) Xj1 (xk , uF (k)), entonces
Xj (xk , uF (k)) = f (Xj1 , u(k + j 1|k)) W
(Xj1 , u(k + j 1|k)) W
(Xj1 , u(k + j 1|k)) W
= Xj (xk , uF (k))
Con lo que se demuestra esta propiedad.
2. Para demostrar la propiedad se procede tambien por induccion:
Partiendo de que xk+1 X1 (xk , uF (k)) y utilizando la propiedad de monotona
se tiene que
X1 (xk+1 , uF (k + 1)) = (xk+1 , u(k + 1|k + 1)) W
(X1 (xk , u(k|k)), u(k + 1|k)) W = X2 (xk , uF (k))
Supongase que Xj1 (xk+1 , uF (k + 1)) Xj (xk , uF (k)). Dado que
u(k + j|k + 1) = u(k + j|k)
de la propiedad de inclusion se tiene que:
Xj (xk+1 , uF (k + 1)) = (Xj1 (xk+1 , uF (k + 1)), u(k + j|k + 1)) W
(Xj (xk , uF (k)), u(k + j|k + 1) W
= (Xj (xk , uF (k)), u(k + j|k) W = Xj+1 (xk , uF (k))

La primera de las propiedades demuestra que bajo las hipotesis impuestas al procedimiento (, ) se garantiza que las regiones de evolucion incierta contienen a las
regiones exactas.
La segunda propiedad resulta muy interesante para posteriores aplicaciones, pues
demuestra que ante una misma secuencia de actuaciones, las regiones de evolucion
incierta obtenidas en un estado real de la planta en k + 1 estan contenidas en las
calculadas en el instante anterior k.

192

7.2. Regiones de evolucion incierta

7.2.4.

Un procedimiento de c
alculo basado en el
algebra intervalar

La region de evolucion incierta es una aproximacion conservadora de la posible


evolucion del sistema incierto calculada a partir de un procedimiento que permita
obtener el mapa de un conjunto a traves del modelo nominal de una forma conservadora
y no muy costosa computacionalmente.
Las acotaciones sobre la evolucion del sistema incierto realizadas en el captulo
anterior llevan a regiones inciertas de la forma
Xj = {x IRn : kx x(k + j|k)k cj ()}
Dado que las constantes cj () se calculan fuera de lnea, la determinacion de las regiones de evolucion incierta en cada instante k se lleva a cabo realizando la prediccion
nominal del sistema. Este procedimiento es muy sencillo, pero por su caracter global
resulta conservadora. Por tanto, interesan procedimientos locales (que dependan de las
actuaciones) para reducir este conservadurismo. El algebra intervalar ofrece un marco
para la definicion de procedimientos apropiados para el calculo de estas regiones.
La aritmetica intervalar es una generalizacion del algebra real en la que los n
umeros
se sustituyen por intervalos y las operaciones sobre los n
umeros se sustituyen por
operaciones intervalares (Moore 1996).
Un intervalo en IR, X = [a, b], es el conjunto de n
umeros reales
X = {x IR : a x b}
La extension de un intervalo a IRn es un vector de intervalos en los que cada componente del vector es un intervalo escalar. Como se puede ver un intervalo en IRn es un
hiperrectangulo en IRn .
La aritmetica intervalar esta caracterizada por las cuatro operaciones basicas sobre
intervalos (Moore 1996):
[a, b] + [c, d] = [a + c, b + d]
[a, b] [c, d] = [a d, b c]
[a, b] [c, d] = [min(ac, ad, bc, bd), max(ac, ad, bc, bd)]
[a, b] / [c, d] = [a, b]

1 1
,
d c

(7.5)

si 0
/ [c, d]

En (Hansen 1992) se puede encontrar la definicion del operador division en el caso en


el que el intervalo cociente contiene el 0. Merece la pena resaltar que el rango de estos
intervalos son exactos, en el sentido en el que coincide con el rango de variacion de los
posibles valores reales.

Captulo 7. MPC robusto basado en regiones de evolucion incierta

193

Considerese una funcion g : IRn 7 IRn , y X un intervalo en IRn . Entonces, es


claro que en general el conjunto g(X) no es un intervalo. El algebra intervalar ofrece
un procedimiento para obtener un intervalo Y tal que g(X) Y . Esto se basa en la
denominada funcion de inclusion.
Definici
on 7.9 Una funcion G : IRn 7 IRn es una funcion de inclusion de g() si
para cualquier intervalo en X IRn se tiene que
g(X) G(X)
Se dice que una funcion de inclusion es monotona si para cualquier pareja de intervalos
X, Y IRn tales que X Y , se tiene que
G(X) G(Y )
En el caso de funciones estandar (exponenciales, logaritmos, etc.) se pueden obtener
funciones de inclusion de forma analtica, utilizando por ejemplo su desarrollo en serie
de Taylor, o en serie de potencias, en los que se tiene una cota del termino de error.
Sin embargo, para funciones complejas se pueden obtener a partir de la denominada
extension intervalar natural (Keartfort 1996).
Definici
on 7.10 Si una funcion g() se puede calcular por una expresi
on (o un algoritmo) formada por las cuatro operaciones elementales y funciones estandar, entonces
una extension intervalar natural de g() se obtiene sustituyendo las operaciones elementales por sus equivalentes intervalares y las funciones estandar por sus funciones
de inclusion.
Por tanto la extension intervalar natural es un procedimiento que transforma un
intervalo en otro intervalo. En el siguiente teorema se establece el resultado mas importante.
Teorema 7.11 (Keartfort 1996) Sea una funcion g : IRn 7 IRm , entonces su extensi
on natural intervalar es una funcion de inclusion monotona de g().
Este resultado establece una forma sencilla de obtener un procedimiento para calcular regiones intervalares que acoten el mapa de otra region intervalar a traves de una
funcion dada. Este consiste en sustituir las operaciones y funciones estandar por sus
equivalentes intervalares. As, la determinacion de la region dada por un intervalo no
es mas que la evaluacion de dicho intervalo en la funcion intervalar obtenida (que es la
extension intervalar natural), lo cual no es muy costoso computacionalmente.

194

7.3. Controlador MPC dual robusto

Este procedimiento se puede utilizar para la determinacion de regiones de evolucion


incierta, obteniendo la funcion de extension intervalar natural del modelo nominal
f (x, u) respecto al estado del sistema x, con lo que se obtiene una funcion intervalar
F (X, u), en la que las actuaciones u son un parametro de la funcion. Se va a comprobar
que este procedimiento satisface la hipotesis 7.6:

Condici
on de inclusi
on : Se satisface por el teorema 7.11 y por la definicion de
funcion de inclusion, seg
un los cuales, para todo X se tiene que
f (X, u) F (X, u)
Condici
on de monotona : El teorema 7.11 tambien establece que la funcion de
extension intervalar natural es monotona, por lo tanto, para todo X Y , se
tiene que
F (X, u) F (Y, u)

7.3.

Controlador MPC dual robusto

Como ya se ha comentado en captulos anteriores, la estabilidad que garantiza la


formulacion general del MPC puede perderse cuando existen discrepancias entre el
modelo de prediccion y el modelo real de la planta. Para dotar de robustez al controlador, hay que considerar su efecto en su dise
no, de forma que el sistema sea estable y
garantice la satisfaccion robusta de las restricciones impuestas sobre los estados.
En esta seccion se presenta un controlador MPC dual que considera el efecto de las
incertidumbres gracias a la incorporacion en su formulacion de las regiones de evolucion
incierta anteriormente introducidas.
El controlador MPC dual se propuso por primera vez en (Michalska & Mayne 1993)
para sistemas no lineales en tiempo continuo. Este controlador parte del conocimiento
de un invariante positivo del sistema denominado region terminal , donde el sistema
se estabiliza por una ley de control local u = h(x). Si el estado del sistema esta fuera de
dicho conjunto, entonces se resuelve un problema de optimizacion MPC de horizonte
finito tomando como restriccion terminal la pertenencia al conjunto . El horizonte,
que inicialmente es N , se reduce un periodo de muestreo en cada instante de forma que
en el instante k, el horizonte del controlador es N k. Una vez obtenida la actuacion
se aplica. De esta forma se garantiza que el controlador conduce el sistema hasta el
conjunto invariante en N pasos, donde se conmuta a la ley de control local que estabiliza
el sistema hasta el origen. De ah el termino de dual.

Captulo 7. MPC robusto basado en regiones de evolucion incierta

195

En este trabajo tambien se presenta una tecnica para dotar de robustez al controlador, que es la que inspiro la formulacion presentada en el captulo anterior. En
este caso la presencia de incertidumbres hace necesario que el controlador local deba
estabilizar el sistema incierto y que el conjunto terminal sea un invariante robusto.
Entonces considerando como restriccion terminal un conjunto contenido en , demuestra que el controlador estabiliza el sistema ante un cierto grado de incertidumbres
aditivas que decaen.
El controlador que se propone en esta seccion es esencialmente distinto pues se incorporan los conjuntos de evolucion incierta en la formulacion del controlador MPC dual.
Para ello, y dado que el sistema presenta incertidumbres, se requiere el conocimiento
de un conjunto invariante robusto para las incertidumbres del sistema.

Hip
otesis 7.12 Sea el conjunto X, una regi
on entorno al origen que es un invariante robusto del sistema (7.1). La ley de control local asociada u = h(x) es tal
que
X h = {x X : h(x) U }.
Para todo x se tiene que
f (x, h(x)) W
Esta condici
on garantiza que el conjunto es un invariante robusto por el principio
de invariancia.

Partiendo de la determinacion del conjunto invariante robusto y de un procedimiento para el calculo de las regiones de evolucion incierta, se puede formular el siguiente
problema de optimizacion:
m
n JN k (xk , uF )
u
F

s.a
u(k + j|k) U
Xj (xk , uF ) X

j = 0, , N k 1
j = 1, , N k 1

XN k (xk , uF )
Siendo el funcional a minimizar :
JN k =

N k1
X
i=0

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

196

7.3. Controlador MPC dual robusto

Este coste esta basado en las predicciones nominales del sistema, sin considerar el efecto
de las incertidumbres. En este caso el funcional afecta exclusivamente al desempe
no
del sistema y no a la estabilidad como en la formulacion general del MPC. As, por
ejemplo, el coste terminal se puede eliminar, o bien se puede tomar una funcion de
coste que considere el efecto de las incertidumbres, como por ejemplo, el coste de la
peor situacion posible, lo cual conduce a un problema min-max.
La principal caracterstica de este controlador es que las restricciones en los estados
se establecen en terminos de regiones de evolucion incierta en vez de en terminos de
estados nominales del sistema. Estas regiones dependen del estado actual xk , de la
secuencia de actuaciones futuras uF , y del grado de incertidumbres. Por tanto son
restricciones en uF .
Notese tambien que el problema de optimizacion reduce el horizonte de control a lo
largo del tiempo, de forma que el controlador tan solo esta definido desde k = 0 hasta
k = N 1. Pero esto no ofrece problemas pues, como se demostrara mas adelante, se
garantiza que en el instante N el estado del sistema alcanza la region terminal, donde
se conmuta al controlador local.
A partir de este problema de optimizacion se establece la siguiente ley de control
dual:

u (k|k) x 6
k
d
KM
(x
)
=
(7.6)
k
PC
h(x )
xk
k
siendo u (k|k) el primer termino de la secuencia de control optima del problema en el
instante k.

7.3.1.

An
alisis de estabilidad

Dado que las incertidumbres que afectan al sistema se modelan como incertidumbres
aditivas acotadas, el origen no es un punto de equilibrio del sistema incierto, por lo
que hay que considerar otro concepto de estabilidad como la estabilidad finalmente
acotada, que se presento en el captulo 6.
Definici
on 7.13 (Khalil 1996) Un sistema es asintoticamente acotado al final si el
sistema evoluciona a un conjunto acotado. Es decir, si existen unas constantes positivas
b y c tales que para todo (0, c), existe un k tal que para todo estado inicial kx0 k
se tiene que kxk k b k > k .
Entonces se puede establecer el siguiente teorema en el que se demuestra que la ley
de control derivada del problema de optimizacion propuesto estabiliza al sistema en

Captulo 7. MPC robusto basado en regiones de evolucion incierta

197

cualquier estado inicial factible.

Teorema 7.14 (Estabilidad finalmente acotada)


Sea un sistema incierto que responde al modelo
xk+1 = f (xk , uk ) + wk
con unas incertidumbres wk W y sujeto a las restricciones
uk U

xk X

Sea el sistema tal que satisface la hipotesis 7.12.


Sea XNd el conjunto de estados tal que el problema de optimizacion del MPC robusto
dual tiene solucion factible con horizonte N .
d
Entonces la ley de control KM
P C (x) estabiliza robustamente al sistema para todo x0
d
on , donde queda confinado.
XN , evolucionando hacia la regi

Demostraci
on:
Para probar el teorema se va a comprobar que en cada instante k se puede calcular
una secuencia de actuaciones a partir de la solucion optima en k 1 que es factible.
La secuencia de actuaciones factibles es
u(k + j|k) = u (k + j|k 1) j = 0, , N k 1
k
es decir uF (k) = {uF (k 1)}N
1

Para comprobar la factibilidad se va a proceder por induccion.


Sea x0 XNd , entonces el problema de optimizacion es factible y tiene una solucion
optima uF (0). Sea x1 el estado al que evoluciona el sistema incierto al aplicar u (0|0).
Sea uF (1) la solucion factible calculada.
Entonces, esta secuencia es admisible por serlo uF (0). Dado que x1 X1 (x0 , u (0|0)),
de la propiedad 7.8 se tiene que
Xj1 (x1 , uF (1)) Xj (x0 , uF (0)) X
para todo j = 2, , N . De aqu se deduce ademas que
XN 1 (x1 , uF (1)) XN (x0 , uF (0))
Por lo tanto, el problema de optimizacion es factible en k = 1.

198

7.3. Controlador MPC dual robusto

Supongase que el problema de optimizacion es factible en el instante k1, situandose


el sistema en xk1 donde se obtiene una solucion optima uF (k 1). Sea xk el estado
al que evoluciona el sistema al aplicar u (k 1|k 1). Sea uF (k 1) la secuencia
de actuaciones calculada a partir de uF (k). Entonces es obvio que esta secuencia es
admisible por serlo uF (k). Ademas, dado que xk X1 (xk1 , u (k 1|k 1)), de la
propiedad 7.8 se tiene que
Xj1 (xk , uF (k)) Xj (xk1 , uF (k 1)) X
para todo j = 2, , N k + 1. Ademas
XN k (xk , uF (k)) XN k+1 (xk1 , uF (k 1))
y por lo tanto, el problema de optimizacion es factible en el instante k.
Por induccion se deduce que el problema es factible en todo k < N .
En el instante k = N 1, se tiene que
X1 (xN 1 , u (N 1|N 1))
por lo que el estado en el instante N satisface que xN .
Una vez que el sistema entra en la region , se conmuta a la ley de control local
u = h(x), que mantiene la evolucion del sistema incierto en , por la propiedad de
invariancia. Por tanto xk para todo k N .

Nota 7.15 La convergencia del controlador esta basada en la obtencion de una solucion factible del problema de optimizacion, que no necesariamente tiene que ser la
solucion optima. Esto implica que soluciones suboptimas del problema de optimizacion
estabilizan igualmente el sistema.
De este teorema se deduce que para todo estado inicial factible, el controlador
conduce al sistema incierto hasta el invariante robusto donde queda confinado. Por
tanto el sistema es asintoticamente estable acotado al final. Si las incertidumbres fuesen
decayendo a lo largo del tiempo y el controlador local estabilizase al sistema asintoticamente, entonces el controlador dual conduce el sistema hasta el origen.
Una bondad del controlador propuesto es que la estabilidad esta sujeta a la factibilidad del estado inicial. Por tanto no se imponen cotas explcitas sobre las incertidumbres,
sino que estas estan implcitamente consideradas en la factibilidad del problema con las
regiones de evolucion incierta. En efecto este controlador admite cualquier grado de incertidumbres y garantiza que estabiliza el sistema siempre que, para las incertidumbres
consideradas, el estado del que se parte sea factible.

Captulo 7. MPC robusto basado en regiones de evolucion incierta

199

Ademas, el caracter local de estas regiones hace que la cota de incertidumbres que
admite el controlador dependa del estado inicial en que se encuentra el sistema. Esto es
una ventaja pues en otro tipo de controladores basados en acotaciones globales de las
incertidumbres (como por ejemplo las basadas en la continuidad Lipschitz del modelo)
se toma el caso mas desfavorable como cota de incertidumbres, incurriendo en cierto
conservadurismo del controlador.
A pesar de la ventaja que supone la aproximacion local, no debe perderse de vista
que este controlador se enmarca dentro de los controladores en bucle abierto, es decir,
aquellos en los que no se considera el efecto de realimentacion del controlador en la
prediccion del comportamiento del sistema incierto. Esto hace que el controlador presente un alto grado de conservadurismo en relacion a formulaciones en bucle cerrado.
De todas formas existen procedimientos que permiten reducir este efecto, como ya se
comento en el captulo anterior.

7.4.

Controlador MPC robusto no dual

Los controladores duales proporcionan un metodo sencillo e intuitivo de controlar


el sistema, muy relacionado ademas con el control optimo con horizonte finito. Sin
embargo, la conmutacion necesaria de una ley de control a otra se presenta como
una desventaja de estos (Allgower, Badgwell, Qin, Rawlings & Wright 1999, Chen &
Allgower 1998a). Quiza la mas inmediata es la perdida de optimalidad del controlador
dentro de la region terminal.
Para evitar la conmutacion al controlador local, se reformula el problema de optimizacion para que el controlador garantice la estabilidad tanto fuera como dentro de
la region terminal. Esto permite eliminar la conmutacion al controlador local y dota
de optimalidad a las actuaciones obtenidas en esta region.
Una forma sencilla de lograr esto es considerando el principio de invariancia robusta
que se satisface en la region . As, a
nadiendo la restriccion
x(k + j|k) W
para todo j = N k + 1, , N , se puede extender el horizonte de control hasta N ,
de forma que las actuaciones obtenidas en este intervalo garantizan que el sistema
incierto permanece en el conjunto . Notese que la factibilidad esta garantizada por la
existencia de la ley de control local u = h(x).
Teniendo en cuenta esto, se puede reformular el problema de optimizacion dual,
para obtener un MPC no dual

200

7.4. Controlador MPC robusto no dual

m
n JN (xk , uF )
u
F

s.a
u(k + j|k) U

si k < N

si no

j = 0, , N 1

X (x , u ) X

j k F

j = 1, , N k 1

x(k + j|k) W

j = 1, , N

XN k (xk , uF (k))

x(k + j|k) W
j = N k + 1, , N

Como se puede observar, en el instante inicial coincide con la formulacion dual. Pero
en este caso, en todo instante k el horizonte de control se extiende hasta N , a
nadiendose
desde N k + 1 hasta N la condicion de invariancia robusta sobre los estados. As,
para k > N es esta restriccion la u
nica que se impone sobre los estados, quedando el
problema de optimizacion
mn JN (xk , uF )
uF

s.a
u(k + j|k) U
j = 0, , N 1
x(k + j|k) W j = 1, , N

Notese que esto hace que el controlador aplique soluciones optimas en el conjunto
invariante robusto que garantizan la robustez. Ademas, si la region terminal y la funcion
de coste terminal se obtienen de forma que satisfacen las condiciones de estabilidad de
la formulacion general del MPC (hipotesis 3.5), entonces el controlador optimo obtenido
proporciona un mejor desempe
no y garantiza la estabilidad asintotica del sistema al
origen en el caso en que las incertidumbres decaigan con el tiempo.
El nuevo controlador robusto viene dado por
nd
KMPC
(xk ) = u (k|k)

A continuacion se demuestra la estabilidad robusta del controlador no dual propuesto.

Captulo 7. MPC robusto basado en regiones de evolucion incierta

201

Teorema 7.16 (Estabilidad finalmente acotada)


Sea un sistema incierto que responde al modelo
xk+1 = f (xk , uk ) + wk
con unas incertidumbres wk W y sujeto a las restricciones dadas por
uk U

xk X

tal que satisface la hipotesis 7.12.


Sea XNd el conjunto de estados tal que el problema de optimizacion del MPC robusto
dual tiene solucion factible con horizonte N .
nd
Entonces la ley de control KM
P C (x) estabiliza robustamente al sistema para todo x0
d
XN , evolucionando hacia la regi
on , donde queda confinado.

Demostraci
on:
Para probar el teorema se va a comprobar que en cada instante k se puede calcular
una secuencia de actuaciones a partir de la solucion optima en k 1 que es factible.
La secuencia de actuaciones factibles es
(

u(k + j|k) =

u (k + j|k 1) j = 0, , N k 1
h(
x(k + j|k))
j = N k, , N 1

k1
k
que verifica {
uF (k)}N
= {uF (k 1)}N
.
0
1

Para comprobar la factibilidad se va a proceder por induccion.


Sea x0 XNd , entonces el problema de optimizacion es factible y tiene una solucion
optima uF (0). Sea x1 el estado al que evoluciona el sistema incierto al aplicar u (0|0).
Sea uF (1) la solucion factible calculada.
2
es factible por serlo uF (0). Dado que
Entonces, esta secuencia {
uF (1)}N
0

x1 X1 (x0 , u (0|0))
de la propiedad 7.8 se tiene que
2
) Xj (x0 , {uF (0)}1N 1 ) X
Xj1 (x1 , {
uF (1)}N
0

para todo j = 2, , N . De aqu se deduce ademas que


1
2
)
) XN (x0 , {uF (0)}N
XN 1 (x1 , {
uF (1)}N
1
0

202

7.4. Controlador MPC robusto no dual

Por lo tanto, x(N |1) . Aplicando la ley de control local se tiene una actuacion
admisible tal que
x(N + 1|1) = f (x(N |1), h(x(N |1))) W
Consecuentemente, el problema de optimizacion es factible en k = 1.
Supongase que el instante k 1 el estado del sistema es xk1 y el problema de
optimizacion es factible. Entonces, se obtiene una solucion optima uF (k 1). Sea xk
el estado al que evoluciona el sistema al aplicar u (k 1|k 1) y sea uF (k 1) la
secuencia de actuaciones calculada a partir de uF (k). Entonces es obvio que la secuencia
k1
{
uF (k)}N
es admisible por serlo uF (k). Ademas, dado que
0
xk X1 (xk1 , u (k 1|k 1))
de la propiedad 7.8 se tiene que
k1
k
Xj1 (xk , {
uF (k)}N
) Xj (xk1 , {uF (k 1)}N
)X
0
1

para todo j = 2, , N k + 1. Ademas


k1
k
XN k (xk , {
uF (k)}N
) XN k+1 (xk1 , {uF (k 1)}N
)
0
1

Ademas se tiene que x(N |k) . Aplicando la ley de control local se mantiene el sistema nominal en W con una secuencia de actuaciones admisibles. En consecuencia
el problema es factible.
Por induccion se deduce que el problema es factible en todo k N 1.
En el instante k = N 1, se tiene que
X1 (xN 1 , u (N 1|N 1))
por lo que el estado en el instante N satisface que xN .
A partir de este instante, la restriccion
x(k + j|k) W
es factible gracias a la invariancia robusta de , lo que garantiza la estabilidad. Notese
que a partir de este instante la secuencia dada por el controlador local es la secuencia
factible, y el controlador proporciona una actuacion que minimiza el coste.

Captulo 7. MPC robusto basado en regiones de evolucion incierta

7.5.

203

Ejemplo de aplicaci
on al reactor

En esta seccion se muestran los resultados de aplicar el controlador dual presentado


al ejemplo del reactor utilizado a lo largo de la tesis. Para el calculo de las regiones
de evolucion incierta se ha utilizado el algebra intervalar, que como se demostro anteriormente, proporciona un procedimiento adecuado por ser sencillo de desarrollar y no
implicar un alto coste computacional. Estos resultados han sido publicados en (Limon

Marruedo, Bravo, Alamo


& Camacho 2002).
El algebra intervalar ofrece una ventaja a
nadida que mejora a
un mas su implementacion: las regiones de evolucion obtenidas son hiperrectangulos. Dado que la region terminal suele calcularse a partir de la linealizacion del modelo en torno al origen,
las regiones invariantes suelen ser elipsoides o politopos. Ademas las restricciones en
los estados tambien suelen ser regiones convexas. La convexidad de estas regiones permiten expresar la restriccion de que una region de evolucion incierta esta contenida
en ellas como una restriccion sobre cada uno de los vertices del hiperrectangulo. Por
tanto cada restriccion en terminos de region de evolucion incierta se transforma en 2n
restricciones sobre los vertices del hiperrectangulo.
El calculo del conjunto invariante robusto, que se va a utilizar como region terminal, se ha hecho buscando el mayor grado de incertidumbre posible. Para ello se ha
tomado como controlador local, el controlador lineal obtenido en el ejemplo del captulo
anterior, cuyo controlador y cuya funcion de Lyapunov cuadratica vienen dadas por
K=

1,5488 3,4658

"

P =

263,5900 47,1760
47,1760 117,4640

El sistema controlado por este controlador local tiene un invariante positivo dado por
= {x IR2 : xT P x }
siendo = 9,764. Tomando de base este conjunto, se ha calculado un invariante positivo
en el cual el controlador local estabiliza robustamente el sistema con una incertidumbre
h

w1 8103 , 6,5103
h

w2 8,5102 , 1,2102

i
i

Como coste de etapa se ha tomado un coste cuadratico con unas matrices de ponderacion
"
#
0,5000
0
Q=
R = 1,3333
0
1,1429
Se ha considerado tambien como coste terminal, V (x) = xT P x.

204

7.5. Ejemplo de aplicacion al reactor

En este ejemplo se han realizado dos ensayos del controlador. En el primero se ha


considerado como incertidumbres del sistema las maximas incertidumbres que admite
el invariante robusto y se ha tomado un horizonte de control N = 4. En la figura 7.1
se muestran las regiones de evolucion inciertas correspondientes a la primera iteracion
del controlador, para un par de estados iniciales. Como se puede observar, la region X4
esta en el interior de la region terminal , satisfaciendo la factibilidad del problema.
0.6

0.4

0.2

x2

0.2

0.4

0.6

0.8
0.25

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

0.25

x1

Figura 7.1: Regiones de evoluci


on incierta en k = 0 para el ensayo 1.

En la figura 7.2 se muestra la evolucion del sistema incierto controlado por el MPC
robusto dual para el primer ensayo. Como se puede observar, el sistema se estabiliza
hasta el invariante robusto donde, debido a las incertidumbres, el sistema evoluciona
hasta quedarse confinado en una vecindad del origen.
En un segundo ensayo, se ha considerado que la planta tiene unas incertidumbres
menores, dadas por
h

w1 6,5103 , 6,5103
w2 1,2102 , 1,2102

Como se ha comentado, el controlador es valido para cualquier grado de incertidumbre,


pues la estabilidad esta garantizada en todo estado inicial factible. En efecto, notese que
el tama
no de las regiones de evolucion incierta (y en particular la terminal) aumenta
con el grado de incertidumbre y con el horizonte de control. Por lo tanto dado que
el sistema tiene menor incertidumbre, el controlador admite un mayor horizonte de
control y en consecuencia un mayor dominio de atraccion del controlador.

Captulo 7. MPC robusto basado en regiones de evolucion incierta

205

0.4

0.2

x2

0.2

0.4

0.6

0.8
0.25

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

0.25

x1

Figura 7.2: Evolucion del sistema incierto en bucle cerrado en el ensayo 1.

Por este motivo se ha considerado para este segundo ensayo un horizonte de control
de N = 7. En la figura 7.3 se ilustra la primera iteracion del algoritmo en un par de
estados iniciales, en la que se puede observar la evolucion de las regiones inciertas,
as como la factibilidad del problema de optimizacion. El comportamiento del sistema
en bucle cerrado se muestra en la figura 7.4. En esta se puede observar que, tal y como se
esperaba, el controlador es capaz de estabilizar el sistema incierto partiendo de estados
mas alejados del punto de equilibrio que los estabilizables en el primer ensayo.

7.6.

Conclusiones

En este captulo se ha presentado un procedimiento para incorporar el efecto de las


incertidumbres en la formulacion del MPC. Este procedimiento se basa en el concepto
de regiones de evolucion incierta. Estas regiones no son mas que aquellas que confinan la evolucion futura del sistema ante una determinada secuencia de actuaciones. El
principal matiz que las diferencia es que estas regiones se orientan a su calculo en lnea
mediante la utilizacion de procedimientos aproximados de acotacion de mapas de conjuntos. As se establecen condiciones sobre los procedimientos aproximados adecuados
para su determinacion y se presentan algunas caractersticas de estas regiones.
Basado en estas regiones, se propone un controlador MPC robusto dual en el que
las restricciones en los estados y terminal se formulan en terminos de regiones de
evolucion incierta. Requiere tambien la determinacion de un controlador robusto local

206

7.6. Conclusiones
0.4

0.2

0.2

x2

0.4

0.6

0.8

1.2

1.4

1.6
0.25

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

0.25

x1

Figura 7.3: Regiones de evoluci


on incierta en k = 0, para el ensayo 2.
0.4

x2

0.4

0.8

1.2

1.6
0.25

0.2

0.15

0.1

0.05

0
x1

0.05

0.1

0.15

0.2

0.25

Figura 7.4: Evolucion del sistema incierto en bucle cerrado en el ensayo2.

con un conjunto invariante positivo admisible asociado. As, para todo estado factible,
el controlador estabiliza de forma robusta el sistema. Ademas, la estabilidad se conserva
en ausencia de optimalidad de la solucion.
Para evitar la conmutacion al controlador local, se propone una modificacion sobre
la formulacion del MPC que consiste en incorporar el principio de invariancia como

Captulo 7. MPC robusto basado en regiones de evolucion incierta

207

restriccion. Esta restriccion es admisible gracias a la existencia del controlador local


robusto y confiere optimalidad (y convergencia) en la region terminal.
Por u
ltimo se ha aplicado el controlador dual al reactor utilizado a lo largo de
la tesis. Las regiones de evolucion incierta se implementan gracias al algebra intervalar. Este algebra proporciona un procedimiento general, sencillo y no muy costoso
computacionalmente de calcular estas regiones y de incorporarlas en el problema de
optimizacion.
Estos controladores MPC robustos son aportaciones originales de esta tesis y han

dado lugar al artculo (Limon Marruedo, Bravo, Alamo


& Camacho 2002).
Hay que resaltar que el controlador propuesto puede tener un alto grado de conservadurismo, pues se enmarca dentro de los controladores MPC en bucle abierto en los
que se predice el comportamiento del sistema incierto en bucle abierto. Este defecto,
presente en los controladores predictivos, viene a solucionarse con formulaciones del
controlador en bucle cerrado. Dentro de ellas se puede considerar el controlador robusto que se presenta en el siguiente captulo, en el que se incorpora el comportamiento
del sistema ante las incertidumbres gracias a la teora de conjuntos invariantes.

208

7.6. Conclusiones

Captulo 8
MPC robusto basado en conjuntos
invariantes robustos
8.1.

Introducci
on

La consideracion de incertidumbres en la formulacion estandar de los controladores


MPC incurre en un alto grado de conservadurismo. El origen de este efecto es la naturaleza de las predicciones que se llevan a cabo en el problema de optimizacion: la
prediccion se hace sin considerar la posible reaccion del controlador ante las incertidumbres presentes. Para resolver este problema se han propuesto en la literatura los
denominados controladores predictivos en bucle cerrado (Scokaert & Mayne 1998, Lee
& Yu 1997).
En este captulo se muestra la necesidad de estas estrategias, su planteamiento y
se analiza su estabilidad desde el punto de vista de la programacion dinamica y de la
formulacion min-max. Estos controladores resuelven el problema del conservadurismo
pero a costa de resolver un problema de optimizacion sumamente complejo.
Sin embargo, de este analisis se deriva la importancia del concepto de invariancia
robusta en esta formulacion, lo cual permite establecer una nueva forma de resolver
el problema: una restriccion estabilizante que, impuesta sobre el problema MPC en
bucle abierto, garantiza la estabilidad robusta del sistema. Esta restriccion esta basada en el calculo de las regiones estabilizables robustas. Dado que para sistemas no
lineales pueden resultar muy complejas de determinar, se propone una nueva restriccion estabilizante basada en una secuencia de conjuntos invariantes de control robustos
mas sencilla de calcular y que permite garantizar la estabilidad de igual forma. Esta
formulacion es una contribucion original de esta tesis.
209

210

8.2. MPC robusto en bucle cerrado

La organizacion del captulo se muestra en el siguiente diagrama:


Incertidumbres
que decaen
Min-max MPC
Incertidumbres
acotadas

MPC
en
bucle cerrado

Restriccin
estabilizante

MPC robusto
basado en
invariantes robustos

Figura 8.1: Organizacion del captulo 8

8.2.

MPC robusto en bucle cerrado

En captulos anteriores se han dado ciertas pinceladas sobre la formulacion en bucle


cerrado del MPC, como solucion al conservadurismo de los controladores predictivos
robustos basados en la incorporacion de las incertidumbres en la prediccion en bucle
abierto. En esta seccion se pretende abordar mas directamente el tema, justificando
el por que de esta necesidad y como se formula este tipo de controladores. Para ello
se sigue la lnea presentada en (Mayne 2001), en el cual se analiza el problema de la
robustez del MPC desde un punto de vista de la programacion dinamica. De este modo
se continua la lnea de anteriores captulos y se hace hincapie sobre la necesidad de la
consideracion de aspectos de invariancia.
A lo largo de esta seccion se va a considerar que el sistema real o planta responde
a un modelo incierto descrito por la ecuacion
xk+1 = f (xk , uk , wk )

(8.1)

siendo xk IRn el vector de estados del sistema y uk IRm las actuaciones sobre el
mismo. El vector wk IRp representa las incertidumbres presentes en el modelo, de las
cuales tan solo se conoce que estan acotadas en un conjunto
wk W

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

211

Por otro lado las entradas y los estados estan sujetos a las restricciones
uk U

xk X

siendo ambos conjuntos compactos.

8.2.1.

Necesidad de controladores MPC en bucle cerrado

Para justificar la necesidad de la formulacion e introducir al concepto de prediccion


en bucle cerrado, se va a seguir un ejemplo ilustrativo utilizado en (Scokaert & Mayne
1998).
Considerese el sistema lineal incierto dado por
xk+1 = xk + uk + wk
siendo xk IR el estado del sistema, uk la actuacion sobre el mismo y wk las incertidumbres del sistema. El estado del sistema esta restringido a
xk [1,2, 2]
mientras que la actuacion no esta acotada. Las incertidumbres del sistema son
wk [1, 1]
El conjunto = {x [1, 1]} es un conjunto invariante robusto del sistema controlado con una ley de control uk = xk ya que para todo xk , se tiene que
xk+1 = wk .
Considerese un controlador MPC con horizonte de prediccion N = 2 y region terminal . El estado del sistema en k + 2 sera
xk+2 = xk + uk + uk+1 + wk + wk+1
Considerese una formulacion robusta estandar (en bucle abierto) del MPC. El objetivo del controlador robusto es determinar una secuencia de actuaciones {uk , uk+1 }
tal que lleve al sistema a para cualquier realizacion de las incertidumbres. De la
prediccion del estado terminal se observa que
xk+2 = xk + uk + uk+1 + wk + wk+1
|

{z

[2,2]

212

8.2. MPC robusto en bucle cerrado

entonces, dado que la incertidumbre posible es mayor que la region se deduce que
no existe ninguna secuencia de actuaciones tal que el problema sea factible.
Sin embargo el problema s es robustamente controlable a ese conjunto en dos pasos.
Para ello basta hacer uk = xk y uk+1 = xk+1 . En efecto
xk+1 = xk + uk + wk = wk [1, 1] [1,2, 2]
luego satisface las restricciones. En el instante siguiente se tiene que
xk+2 = xk+1 + uk+1 + wk+1 = wk+1 [1, 1] =
luego, el sistema puede ser llevado hasta la region terminal en N pasos.
La diferencia entre ambas situaciones es que en la primera la secuencia de actuaciones que se determina en un determinado estado es fija e independiente de la realizacion de las incertidumbres futuras: debe satisfacer las restricciones para cualquier
incertidumbre posible, y esta secuencia no existe. Sin embargo, si se considera que incertidumbres han intervenido en el sistema se pueden determinar actuaciones, dependientes de la evolucion del sistema, que satisfacen las restricciones. Notese que estas
actuaciones son leyes de control, pues proporcionan una actuacion en funcion del estado
del sistema: uk = xk , uk+1 = xk+1 .
En efecto, para un sistema incierto, el conjunto de estados que pueden ser llevados por una secuencia de actuaciones admisible uk = k (xk ) U a un determinado
invariante robusto , en N pasos y satisfaciendo las restricciones a pesar de las incertidumbres es el conjunto estabilizable a N pasos robusto SN (X, ).
SN (X, ) = {x0 X : uk = k (xk ) U k = 0, , N 1 | xk X, xN , wk W }
Sin embargo, en el control predictivo robusto (en bucle abierto) el conjunto de
estados robustamente estabilizables es
Xba = {x0 X : uk (x0 ) U k = 0, , N 1 | xk X, xN , wk W }
es decir, el conjunto de estados que pueden ser llevados por una secuencia de actuaciones admisible y fija hasta el conjunto en N pasos. Este conjunto esta incluido en
SN (X, ), y de hecho suele ocurrir que este conjunto es mucho menor
Xba SN (X, )
En consecuencia, el problema de la prediccion en bucle abierto es un problema de factibilidad: el conjunto de estados estabilizables de forma robusta en bucle abierto es
mucho menor que el que realmente se puede estabilizar. Este es el origen del conservadurismo de las formulaciones robustas del MPC basadas en predicciones en bucle
abierto.

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

8.2.2.

213

Formulaci
on del MPC robusto en bucle cerrado

La formulacion del MPC en bucle cerrado consiste, basicamente, en sustituir la


secuencia de actuaciones
uF (k) = {u(k|k), , u(k + N 1|k)}
por una secuencia de leyes de control
(k) = {u(k|k), 1 (), , N 1 ()}
como variables de decision del problema de optimizacion. Notese que la actuacion
u(k|k) se mantiene como variable de decision, pues el estado actual es conocido.
As, el problema de optimizacion del predictivo se reformula como
mn JN (xk , (k), W )
(k)

s.a
u(k|k) U
j (x(k + j|k)) U j = 1, , N 1 wk+i W, i = 0, j 1
x(k + j|k) X
j = 0, , N 1 wk+i W, i = 0, j 1
x(k + N |k)
wk+i W, i = 0, N 1
siendo x(k + 1|k) = f (xk , u(k|k), wk ) y para j = 1, , N 1
x(k + j + 1|k) = f (x(k + j|k), j (x(k + j|k)), wk+j )
el estado predicho incorporando el efecto de las incertidumbres.
Es importante poner de manifiesto que la prediccion de los estados depende de la
realizacion de las incertidumbres, pudiendo ser esta distinta en el calculo del coste a
optimizar que en la determinacion de las restricciones. Sera conveniente pues, a
nadir a
la notacion de los estados predichos la dependencia de las incertidumbres. Sin embargo,
dado que esta dependencia se deriva del contexto y con el objetivo de la sencillez en
el desarrollo de los resultados que se presentan, se realiza un abuso de notacion y se
omite esta dependencia. Sin embargo, se insta al lector a tener esto en cuenta a lo
largo del captulo, pues en secciones posteriores, los estados predichos corresponden al
comportamiento nominal.
La region terminal X suele ser un conjunto invariante robusto, con una ley de
control local asociada uk = h(xk ) tal que garantiza que f (x, h(x), w) para todo
x y w W.
En consecuencia el coste a minimizar tiene la forma
JN (xk , (k), W ) =

j=N
X1
j=0

L(x(k + j|k), j (x(k + j|k))) + V (x(k + N |k))

214

8.3. Analisis de estabilidad del MPC robusto en bucle cerrado

considerando 0 = u(k|k) (en aras de la sencillez). El coste puede depender del conjunto de incertidumbres presentes sobre el sistema, seg
un como se calculen los estados
predichos para la determinacion de su coste. As, se puede considerar la peor de las
realizaciones posibles de las incertidumbres, lo cual conduce a un problema min-max, o
bien considerar el coste nominal, resultante de hacer wk+j = 0. Por eso, la dependencia
del coste con las incertidumbres se pone de manifiesto en la incorporacion del conjunto
de incertidumbres W en la notacion del coste.
Notese que independientemente de la forma del coste a minimizar, las restricciones
deben satisfacerse para toda posible realizacion de las incertidumbres.
Como es logico, este problema de optimizacion es notablemente mas complejo en
su resolucion que la formulacion en bucle abierto, pues requiere el calculo de leyes de
control, que son variables infinito dimensionales, en general. Por tanto, esta estrategia
se considera una solucion teorica por ahora, si bien importantes esfuerzos se estan
haciendo en la comunidad investigadora para tratar este nuevo reto.
Esta formulacion se utiliza en (Scokaert & Mayne 1998) en el contexto de min-max
y en (Magni, De Nicolao, Magnani & Scattolini 2001) en el contexto del control H .
Dentro de esta familia de controladores se puede englobar el presentado en (Kothare
et al. 1996), en el cual se plantea el problema en bucle cerrado en forma de LMI que
se resuelve en cada instante.

8.3.

An
alisis de estabilidad del MPC robusto en bucle cerrado

8.3.1.

Aproximaci
on desde la programaci
on din
amica

Al igual que los controladores nominales, el control robusto permite una interpretacion desde el punto de vista de la programacion dinamica. Para ello se va a
considerar el controlador en su formulacion min-max, el cual se puede expresar como
la solucion del siguiente problema de programacion dinamica (Mayne 2001):
n

i1 , w W
Ji (x) = mn max{L(x, u) + Ji1
(f (x, u, w))} | f (x, u, w) X
uU

wW

i , que
= V (x) y X0 = . Este problema esta definido en el conjunto X
siendo
es el conjunto de estados que pueden alcanzar el conjunto terminal en i pasos,
estabilizados por una secuencia de actuaciones admisibles y siguiendo una trayectoria
admisible. Por tanto este conjunto es el conjunto controlable en i pasos robusto.
i = K
i (X, )
X
J0 (x)

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

215

Al igual que en el caso nominal, para garantizar la factibilidad del problema de


optimizacion en cada instante, se debe imponer la condicion que sea un invariante
robusto del sistema. Entonces
i = Si (X, )
X
i1 X
i.
que garantiza que X
La ley de control resultante de este problema es
n

i1 , w W
(f (x, u, w))} | f (x, u, w) X
Kir (x) = arg mn max{L(x, u) + Ji1
uU

wW

Aplicando en el instante k la ley de control uk = KNr k (xk ) el sistema incierto


evoluciona de una forma admisible hasta alcanzar el invariante robusto donde la ley
de control local uk = h(xk ) mantiene el sistema evolucionando en dicho conjunto.
Es importante resaltar que la convergencia al conjunto no se debe a la optimalidad
de la solucion obtenida, sino a la satisfaccion de la restriccion
i1 w W
f (x, u, w) X
N k , y por lo tanto el estado
Esta restriccion garantiza que en el instante k, xk X
evoluciona de una region a otra interior, de forma que en el instante N alcanza la region
, xN .
Por tanto, cualquier solucion suboptima factible del problema de programacion
dinamica estabiliza el sistema, si bien con un peor comportamiento en la evolucion
del mismo. En esta idea se basa la formulacion robusta propuesta en este captulo: se
impone sobre el problema en bucle abierto una restriccion tal que garantiza la robustez
del sistema, con las ventajas del bucle cerrado. Este nuevo controlador se expone en
una seccion posterior.
Notese que este analisis justifica la estabilidad siempre y cuando el horizonte de
control se reduzca en cada instante, de forma que en el instante k, el horizonte de control
es N k. Sin embargo, la formulacion habitual del MPC considera un horizonte fijo N ,
por lo que se aplica en cada instante el controlador invariante en el tiempo KNr (x). Este
controlador tan solo garantiza la factibilidad del problema, siempre y cuando la region
terminal sea un invariante robusto. Al igual que en el caso nominal, para garantizar
la convergencia del controlador, es necesario imponer condiciones adicionales, que se
exponen a continuacion.

216

8.3. Analisis de estabilidad del MPC robusto en bucle cerrado

8.3.2.

Estabilidad del MPC robusto en bucle cerrado con horizonte fijo e incertidumbres que decaen con el estado

Siguiendo la lnea de (Mayne 2001), se establecen condiciones suficientes bajo las


cuales el control predictivo robusto en bucle cerrado en su formulacion min-max estabiliza el sistema. Para ello supone que las incertidumbres dependen del estado, de
forma que tienden a 0 cuando el sistema tiende al origen.
w W (x) : x 0 w 0
Este tipo de incertidumbres pueden aparecer, por ejemplo, cuando se obtienen modelos
que son muy precisos en una vecindad del punto de equilibrio, aumentando el error de
estos cuanto mas alejado se encuentra el estado del equilibrio.
En este caso, el origen es un punto de equilibrio del sistema incierto y por lo tanto
puede ser asintoticamente estabilizado al origen. Esta condicion permite la satisfaccion
de la siguiente hipotesis
Hip
otesis 8.1 Existe un conjunto invariante robusto con una ley de control asociada
uk = h(xk ) y una funcion de Lyapunov 1 V (x) tales que
(i) X h .
(ii) f (x, h(x), w) para todo x y w W .
(iii) V (f (x, h(x), w)) V (x) + L(x, h(x)) 0 para todo x y w W .
El controlador min-max MPC considerando como coste terminal V (x) y region
terminal viene dado por el siguiente problema de optimizacion
mn
(k)

max

wF W

j=N
P1
j=0

L(x(k + j|k), j (x(k + j|k))) + V (x(k + N |k))

s.a
u(k|k) U
j (x(k + j|k)) U j = 1, , N 1 wk+i W, i = 0, j 1
x(k + j|k) X
j = 0, , N 1 wk+i W, i = 0, j 1
x(k + N |k)
wk+i W, i = 0, N 1
del cual se deriva la ley de control
r
(xk ) = u (k|k)
uk = KMPC

La estabilidad de este controlador se establece en el siguiente teorema


1

Analogamente se puede establecer esta hipotesis en terminos de funcion de Lyapunov de control.

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

217

Teorema 8.2 (Mayne 2001) Sea un sistema incierto que responde a un modelo
xk+1 = f (xk , uk , wk )
siendo xk IRn , uk IRm y wk IRp . Las entradas y los estados estan sujetos a las
restricciones
uk U

xk X

Las incertidumbres presentes en el modelo satisfacen wk W de forma que w 0


cuando x 0. Por lo tanto f (0, 0, 0) = 0 es un punto de equilibrio del sistema incierto.
Sea el sistema tal que se satisface la hipotesis 8.1.
r
Entonces la ley de control uk = KMPC
(xk ) estabiliza asintoticamente el sistema al origen
N .
para todo estado inicial factible x0 X

Demostraci
on:
N = SN (X, ) y ademas para
Todo estado inicial, por ser factible, satisface que x0 X

todo xk XN se satisface que xk+1 XN 1 = SN 1 (X, ) SN (X, ), por lo que el


controlador es siempre factible a pesar de las incertidumbres.
Para probar la convergencia, se va a demostrar antes el siguiente resultado

i1
Ji (x) Ji1
(x) 0 x X

para lo cual se va a proceder por induccion.


As, para i = 1, para todo x se tiene que
J1 (x) J0 (x) = mn max{L(x, u) + V (f (x, u, w))|f (x, u, w) , w W } V (x)
uU wW

En virtud de la hipotesis 8.1, se tiene que


mn max{L(x, u) + V (f (x, u, w))|f (x, u, w) , w W } V (x) 0
uU wW

luego, J1 (x) J0 (x) 0.

i1 . Entonces para todo x X


i se
(x) para todo x X
Supongase que Ji (x) Ji1
tiene que

i , w W Ji (x)
(x)Ji (x) = mn max{L(x, u)+Ji (f (x, u, w))} | f (x, u, w) X
Ji+1
uU

wW

i , el controlador optimo a i pasos Kir (x) es un controlador suboptimo


dado que x X
i satisface la restriccion, ya
factible del problema en i + 1 pasos pues para todo x X
que
i1 X
i
f (x, Kir (x), w) X

218

8.3. Analisis de estabilidad del MPC robusto en bucle cerrado

En lo que sigue, y en aras de la sencillez de la presentacion de la demostracion, se


omitira la restriccion f (x, u, w) Xi , w W de los calculos.
i , se tiene que
Considerando esto y la optimalidad de Kir (x) para todo x X

Ji+1
(x) Ji (x) max{L(x, Kir (x)) + Ji (f (x, Kir (x), w))} Ji (x)
wW

= max{L(x, Kir (x)) + Ji (f (x, Kir (x), w))}


wW

max{L(x, Kir (x)) + Ji1


(f (x, Kir (x), w))}
wW

Teniendo en cuenta la siguiente propiedad


max A(w) max B(w) max{A(w) B(w)}
w

se deriva que

Ji+1
(x) Ji (x) max{Ji (f (x, Kir (x), w)) Ji1
(f (x, Kir (x), w))}
wW

i1 para todo w W , de la hipotesis de partida se verifica


Dado que f (x, Kir (x), w) X
que

Ji+1
(x) Ji (x) 0
Con lo que queda demostrada la afirmacion anterior.
Considerando este resultado se puede establecer que
r
r
JN (xk+1 ) JN (xk ) = JN (xk+1 ) max{L(xk , KMPC
(xk )) + JN 1 (f (xk , KMPC
(xk ), w))}
wW

r
Dado que xk+1 = f (xk , KMPC
(xk ), wk ), se verifica que
r
r
r
max{L(xk , KMPC
(xk )) + JN 1 (f (xk , KMPC
(xk ), w))} L(xk , KMPC
(xk ))
wW

r
+JN 1 (f (xk , KMPC
(xk ), wk ))
r
= L(xk , KMPC (xk )) + JN 1 (xk+1 )

Por lo tanto, se tiene que


r
JN (xk+1 ) JN (xk ) JN (xk+1 ) L(xk , KMPC
(xk )) JN 1 (xk+1 )

N 1 , se aplica el resultado anterior por el cual


Dado que xk+1 X
JN (xk+1 ) JN 1 (xk+1 ) 0
de donde se deduce que
r
(xk ))
JN (xk+1 ) JN (xk ) L(xk , KMPC

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

219

y por lo tanto JN (x) es una funcion de Lyapunov del sistema.


Este resultado demuestra la estabilidad asintotica del sistema controlado por un
MPC min-max, para incertidumbres que tienden a cero cuando el estado del sistema
tiende al origen. Esta demostracion es una version detallada de la presentada en (Mayne
2001).

8.3.3.

Estabilidad del MPC robusto en bucle cerrado con horizonte fijo e incertidumbres acotadas

Considerese el caso de incertidumbres simplemente acotadas, es decir aquellas que


no tienen por que tender a cero cuando el estado tiende al origen. En este caso, tan
solo se conoce de las incertidumbres su pertenencia a un conjunto acotado W , de forma
que, existe una constante > 0 tal que para todo w W , se tiene que kwk .
Este tipo de incertidumbres hacen que el origen no sea un punto de equilibrio
del sistema y por lo tanto el resultado anterior no puede aplicarse. En este caso, en
(Mayne 2001) se propone la utilizacion de una formulacion dual del controlador, en la
que se a
nade como variable de decision el horizonte de control.
Sin embargo, incorporando resultados de la estabilidad entrada a estado se puede
establecer que el sistema controlado por el controlador robusto min-max anterior, estabiliza el sistema en sentido entrada estado. Esto generaliza el resultado anterior y
demuestra que en caso de incertidumbres acotadas no es necesario recurrir a formulaciones duales para demostrar estabilidad. Este resultado es una contribucion de esta
tesis.
El sistema debe satisfacer la siguiente hipotesis, seg
un la cual debe existir un invariante robusto en el que el sistema es estabilizable entrada a estado.
Hip
otesis 8.3 Existe un conjunto invariante robusto con una ley de control asociada
uk = h(xk ) y una funcion de Lyapunov V (x) tales que
(i) X h .
(ii) f (x, h(x), w) para todo x y w W .
(iii) Existe una funcion K , (), tal que
V (f (x, h(x), w)) V (x) L(x, u) + ()

220

8.3. Analisis de estabilidad del MPC robusto en bucle cerrado

para todo x y w W .
Con esta ligera modificacion se puede comprobar que el sistema controlado por la
ley
r
uk = KMPC
(xk )

es estable entrada a estado, y por lo tanto, que el sistema evoluciona hasta un invariante
robusto en el que queda acotado. Este resultado es original de esta tesis y se establece
en el siguiente teorema
Teorema 8.4 Sea un sistema incierto que responde a un modelo
xk+1 = f (xk , uk , wk )
siendo xk IRn , uk IRm y wk IRp . Las entradas y los estados estan sujetos a las
restricciones
uk U

xk X

Las incertidumbres presentes en el modelo satisfacen


wk W
siendo el conjunto de incertidumbres W tal que existe una constante > 0 que verifica
W B = {kwk }.
Sea el sistema tal que se satisface la hipotesis 8.3.
r
Entonces la ley de control uk = KMPC
(xk ) estabiliza el sistema en el sentido entrada a
N .
estado para todo estado inicial factible x0 X
En la demostracion del teorema se simplifica por ser muy similar a la del teorema
anterior.
Demostraci
on:
La evolucion del sistema garantiza la factibilidad robusta del problema de optimizacion.
Para probar la convergencia, se va a demostrar por induccion que

i1
(x) () x X
Ji (x) Ji1

As, para i = 1, para todo x se tiene que2


J1 (x) J0 (x) = mn max{L(x, u) + V (f (x, u, w))} V (x)
uU wW

Al igual que en la demostracion anterior, en aras de la sencillez de la misma, se omite en la


i , w W .
notacion la restriccion en el estado siguiente f (x, u, w) X

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

221

max{L(x, h(x)) + V (f (x, h(x), w))} V (x)


wW

()
consecuencia de la hipotesis 8.3.

i1 . Entonces para todo


Supongase que Ji (x) Ji1
(x) () para todo x X
i se tiene que
xX

Ji+1
(x) Ji (x) max{Ji (f (x, Kir (x), w)) Ji1
(f (x, Kir (x), w))}
wW

i1 para todo w W , de la hipotesis de partida se verifica


Dado que f (x, Kir (x), w) X
que

Ji+1
(x) Ji (x) ()
Con lo que queda demostrada la afirmacion anterior.
Considerando esto se tiene que
r
r
JN (xk+1 ) JN (xk ) = JN (xk+1 ) max{L(xk , KMPC
(xk )) + JN 1 (f (xk , KMPC
(xk ), wk ))}
wW

r
JN (xk+1 ) L(xk , KMPC
(xk )) JN 1 (xk+1 )

N 1 , se aplica el resultado anterior por el cual


Dado que xk+1 X
JN (xk+1 ) JN 1 (xk+1 ) ()
de donde se deduce que
r
JN (xk+1 ) JN (xk ) L(xk , KMPC
(xk )) + ()

y por lo tanto JN (x) es una funcion de Lyapunov entrada a estado del sistema.

8.4.

Transformaci
on de la formulaci
on en bucle cerrado en restricci
on estabilizante

La formulacion en bucle cerrado del MPC aparece como una formulacion necesaria para solventar los problemas asociados a los controladores robustos tradicionales,
basados en las predicciones en bucle abierto. Sin embargo, la incorporacion de leyes de
control en el problema de optimizacion hacen el problema tan complejo de resolver,
que se considera por ahora una solucion teorica.

222

8.4. Transformacion de la formulacion en bucle cerrado en restriccion estabilizante

Del analisis hecho anteriormente se comprueba que la teora de conjuntos invariantes


ofrece un marco para el analisis de la estabilidad y factibilidad de sistemas inciertos.
Estas propiedades estan muy relacionadas con el concepto de conjunto invariante de
control robusto, y en particular con los conjuntos estabilizables robustos. En efecto, en
el caso de la programacion dinamica se observa que es la satisfaccion en el instante k
de la restriccion
N k1 w W
f (xk , uk , wk ) X
lo que garantiza la convergencia del sistema al invariante robusto a pesar de las
N k es una secuencia contractiva3
incertidumbres, dado que la secuencia de conjuntos X
que converge en .
Esta consideracion permite abandonar la optimalidad de la solucion, pues es la
factibilidad la garanta de convergencia. Por tanto un controlador formulado a partir
del siguiente problema de optimizacion
m
n JN (xk , uF , W )
u
F

s.a

N k1 w W
x(k + 1) X
u(k + j|k) U
j = 0, , N 1
x(k + j|k) X
j = 0, , N 1
x(k + N |k)

siendo x(k + 1) = f (x, u(k|k), w), garantiza igual la factibilidad del sistema y su convergencia al conjunto a pesar de las incertidumbres. Notese que en el problema
de optimizacion, las predicciones hechas a partir del instante k + 1, x(k + j|j) para
j = 2, , N pueden ser predicciones nominales del sistema.
La propiedad mas importante de este problema de optimizacion es que se recupera
la formulacion en bucle abierto, que es mucho mas sencilla de resolver. La adicion en
el problema en bucle abierto de la restriccion
N k1
x(k + 1) X

w W

N k , existe
es lo que garantiza la factibilidad del problema, pues para todo xk X
N k1 para toda incertidumbre w W y
una actuacion factible tal que xk+1 X
N k1 X, la restriccion asegura la satisfaccion robusta de las
ademas, dado que X
restricciones en el estado. Por tanto, la consideracion de un horizonte de control mayor
que 1, as como el resto de restricciones impuestas sobre los estados, tienen sentido
en lo que respecta al desempe
no del controlador pero no por la estabilidad ni por el
dominio de atraccion del controlador.
i =
En efecto, el conocimiento de la secuencia de conjuntos estabilizables a i pasos, X

Si (X, ), ofrece una informacion del sistema muy importante que puede incorporarse
3

Se entiende una secuencia contractiva de conjuntos, aquella secuencia tal que i i+1 para
todo i.

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

223

al dise
no de controladores estabilizantes. Para ello es necesario llevar a cabo el calculo
explcito de estas regiones para incorporarlas como restricciones. Este calculo se hace
fuera de lnea, por lo que el coste computacional derivado, si bien puede ser grande,
forma parte del dise
no del controlador. En lnea, el coste computacional asociado a la
resolucion de este problema de optimizacion es similar a la del MPC nominal.
Existen algoritmos eficientes para la determinacion de estos conjuntos tan solo en
sistemas lineales con restricciones politopicas (Kerrigan 2000). En un contexto diferente
al MPC, en (Mayne & Schroeder 1997) se dise
na un controlador en tiempo mnimo
robusto para sistemas lineales utilizando conjuntos invariantes.
En el caso de sistemas no lineales es necesario recurrir a procedimientos aproximados, que hacen que la anterior restriccion estabilizante no se pueda implementar.
Para subsanar este problema, se propone en la siguiente seccion una formulacion de la
restriccion basada en una secuencia de conjuntos invariantes de control robustos, que
pueden calcularse a partir de procedimientos aproximados.
Esta idea se puede enmarcar dentro los denominados controladores predictivos con
restriccion estabilizante, en los cuales se garantiza la estabilidad del sistema mediante
una restriccion estabilizante impuesta sobre el estado siguiente. En (Primbs et al. 2000),
se presenta un controlador con estabilidad garantizada para sistemas sin incertidumbres
y sin restricciones en los estados. Este controlador se basa la incorporacion de una
restriccion basada en una funcion de Lyapunov de control (CLF). Esta restriccion
obliga a tomar una actuacion que provoque un decrecimiento de la CLF en el instante
siguiente. As, esta funcion es funcion de Lyapunov del sistema en bucle cerrado. La
idea de restriccion estabilizante basada en invariantes de control se podra considerar
una generalizacion de estos resultados.

8.5.

MPC robusto basado en conjuntos invariantes


de control

En la seccion anterior se mostro como se pueden transformar las condiciones impuestas en el control predictivo en bucle cerrado en una restriccion estabilizante sobre el problema formulado en bucle abierto. Esto tiene unas ventajas notables, pero
esta basado en la determinacion de los conjuntos Si (X, ).
Con el fin de evitar el calculo de estos conjuntos y conservar las caractersticas
estabilizantes del controlador, se propone un controlador basado en una secuencia de
invariantes de control robustos, que es mas sencilla de obtener.

224

8.5. MPC robusto basado en conjuntos invariantes de control

En lo que sigue se va a considerar un sistema incierto cuyo modelo responde a


incertidumbres aditivas
xk+1 = f (xk , uk ) + wk
de forma que las incertidumbres estan contenidas en un conjunto acotado wk W . Las
actuaciones y los estados estan a su vez restringidos a
uk U,

8.5.1.

xk X

Determinaci
on de una secuencia de invariantes de control robustos

A lo largo del desarrollo de esta seccion se utilizan conceptos y resultados de la


teora de conjuntos invariantes, que se puede encontrar en el apendice A.
Un conjunto IRn se dice que es un invariante de control robusto, si para
cualquier estado contenido en , existe una actuacion admisible u(x) U tal que el
estado siguiente permanece en el, es decir, f (x, u) + w para todo w W .
La obtencion de invariantes de control esta basada en el conjunto a un paso robusto

Q().
Este conjunto viene dado por

Q()
= {x IRn : u(x) U | f (x, u) + w w W }
es decir, el conjunto de estados para los cuales existe una actuacion admisible tal que
el estado siguiente esta contenido en para toda posible incertidumbre.
En el caso de incertidumbres aditivas, el conjunto a un paso robusto satisface la
propiedad

Q()
= Q( W )
por lo que se puede obtener a partir del conjunto a un paso nominal 4 .
Teniendo en cuenta lo anterior, se puede establecer la siguiente propiedad

Propiedad 8.5 Sea X un invariante de control robusto del sistema y sea Q()
su conjunto a un paso robusto, entonces todo conjunto tal que

Q()
X
es un invariante de control robusto del sistema.
4

El fin u
ltimo de considerar modelos con incertidumbres aditivas es poder obtener el conjunto a
un paso robusto a partir del nominal, que resulta mas sencillo de calcular. Sin embargo, todos los
resultados posteriores son extensibles a otro tipo de incertidumbres considerando el conjunto a un
paso robusto

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

225

Esta propiedad es inmediata, considerando el principio de invariancia y la definicion


del conjunto a un paso robusto. La interseccion con el conjunto de restricciones sobre
el estado X es necesario para garantizar que la evolucion del sistema es admisible. En
el caso en que el conjunto fuese un invariante positivo robusto tambien se satisface
la propiedad pues esta basada en la propiedad geometrica de invariancia.
Como se ha comentado en captulos anteriores, el calculo del conjunto a un paso Q()
es muy costoso, si no imposible, en el caso de sistemas no lineales. Pero la propiedad
anterior provee un procedimiento para determinar invariantes de control robustos a
partir de un calculo aproximado del conjunto a un paso Q(). As, se puede obtener un
procedimiento aproximado de calculo Qap () tal que
= Qap ( W ) Q( W )
De todo lo anterior se deduce que mediante el siguiente algoritmo es posible obtener
una secuencia de Nr invariantes de control robustos.
1. Hacer 0 = . i 0
2. Calcular i = Qap (i1 W ) X i1
3. Si i = Nr ir a 5
4. Si no, hacer i i + 1 e ir a 2
5. Fin
Notese que el procedimiento para calcular Qap () debe ser lo suficientemente preciso
como para que el paso 2 tenga solucion.
De este algoritmo se obtienen Nr conjuntos invariantes de control robusto tales que
satisfacen las siguientes propiedades
Propiedad 8.6 Sea {i } la secuencia de Nr invariantes de control robustos obtenidos
del anterior algoritmo, entonces
1. 0 = 1 Nr X.
2. Para todo x i existe una actuacion admisible u U tal que f (x, u) + w i1
para todo w W .
3. i Si (X, ).

226

8.5. MPC robusto basado en conjuntos invariantes de control

4. Si el calculo de la regi
on a un paso es exacta, es decir Qap () = Q(), entonces
i = Si (X, ).
Es interesante resaltar que esta secuencia de invariantes de control robustos puede
estar finitamente determinada, es decir, que exista un i tal que para todo i i , resulta
que i = i+1 . En consecuencia, la secuencia de invariantes de control dejara de crecer.
Esta determinacion puede venir derivada de la determinacion finita de S (X, ), es
decir, de la propia naturaleza del sistema y de las restricciones, o bien por el caracter
aproximado del calculo de Qap ().

8.5.2.

Formulaci
on del MPC robusto

El analisis llevado a cabo anteriormente muestra que la incorporacion de una restriccion estabilizante basada en las regiones estabilizables asegura estabilidad del controlador robusto en una formulacion en bucle abierto. Sin embargo, la dificultad de la
determinacion de estos conjuntos en sistemas no lineales, conduce a la necesidad de
formulaciones mas implementables.
La estabilidad de la formulacion anterior esta basada en la contractividad de la
N k , que va forzando al sistema, de una forma admisible, a
secuencia de regiones X
alcanzar el invariante robusto. Para conservar la contractividad y admisibilidad de las
soluciones, se propone el calculo de una secuencia de Nr invariantes de control robustos
desarrollado en el apartado anterior. Por tanto, esta secuencia puede utilizarse para
formular un nuevo controlador MPC robusto:
mn JN (xk , uF , W )
uF

s.a (

x(k + 1|k) Nr k W si k < Nr


x(k + 1|k) W
si k Nr
u(k + j|k) U j = 0, , N 1
x(k + j|k) X j = 0, , N 1

En este caso los estados x(k+j|k) son los estados predichos a partir del modelo nominal
del sistema.
Este problema de optimizacion es en bucle abierto, lo que simplifica la resolucion del
problema. El coste a optimizar JN (xk , uF , W ) puede basarse en predicciones nominales,
o bien el correspondiente a una formulacion min-max o cualquier otra. El coste JN , el
horizonte de control N , as como las restricciones adicionales sobre los estados tan solo
afectan al comportamiento del sistema controlado, no a la estabilidad del mismo, que
esta garantizada por la restriccion estabilizante (como se demostrara a continuacion).

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

8.5.3.

227

An
alisis de estabilidad

A continuacion se demuestra que el controlador propuesto estabiliza el sistema


incierto.

Teorema 8.7 (Estabilidad robusta)


Sea un sistema incierto cuyo modelo responde a
xk+1 = f (xk , uk ) + wk
de forma que las incertidumbres estan contenidas en un conjunto acotado wk W . Las
actuaciones y los estados estan a su vez restringidos a
uk U

xk X

Sea X un conjunto invariante robusto del sistema incierto y sea {i } una secuencia contractiva de Nr invariantes de control robustos basada en obtenida utilizando
el algoritmo propuesto.
Entonces el sistema incierto controlado por el controlador MPC robusto propuesto estabiliza el sistema hasta quedar acotado en , para todo estado contenido en XNr =
Q(Nr W ) X.

Demostraci
on:
Se va a comprobar que todo x0 XNr es asintoticamente estabilizado al conjunto , y
para ello se procede por induccion.
Supongase que x0 XNr = Q(Nr W ) X, entonces existe una actuacion
admisible u0 U tal que f (x0 , u0 ) Nr W X. Por lo tanto satisface las
restricciones en x(1|0). Ademas, de la teora de conjuntos invariantes se tiene que
Nr SNr (X, ) SNr (X, ) C (X), siendo C (X) el maximo invariante de
control robusto. Por lo tanto existe una secuencia de actuaciones admisibles tales que la
evolucion del sistema es admisible. En consecuencia se satisfacen todas las restricciones
y el problema es factible en x0 . Ademas el estado siguiente x1 Nr Q(Nr 1
W ) X.
Supongase ahora que xk Q(Nr k W ) X. Entonces existe una actuacion
admisible uk U tal que x(k + 1|k) Nr k W . Ademas, dado que Nr k
C (X), existe una secuencia de actuaciones admisibles que mantienen la evolucion del
sistema admisible. Entonces el problema es factible en xk y ademas xk+1 Nr k
Q(Nr k1 W ) X.

228

8.5. MPC robusto basado en conjuntos invariantes de control

Por lo tanto, para todo k < Nr , se satisface que el problema es factible y ademas el
sistema evoluciona de forma que xNr .
Para k Nr la restriccion x(k + 1|k) W es factible por ser un conjunto
invariante robusto, y ademas la actuacion obtenida garantiza que el sistema permanece
contenido en dicho invariante.

Nota 8.8 La restricci


on x(k + 1|k) W se a
nade para garantizar que el controlador mantiene el sistema en una vez alcanzada la regi
on. Si se omite, entonces es
necesaria una formulacion dual, y por lo tanto la conmutaci
on al controlador local una
vez que el sistema alcanza el conjunto .

Nota 8.9 Si la funcion de coste se toma de forma que el MPC estabiliza asintoticamente el sistema en ausencia de incertidumbres, entonces el controlador estabiliza
asintoticamente el sistema incierto si las incertidumbres decaen con el tiempo.
Esto se debe a que, una vez que el estado del sistema queda confinado en , la
robustez inherente del controlador MPC garantiza la estabilidad asintotica.

Nota 8.10 La adicion de la restricci


on terminal x(k + N |k) en el problema de
optimizacion, solo se puede hacer cuando N Nr . La incorporaci
on de esta restricci
on
mejora el comportamiento del controlador.

Nota 8.11 El sistema se puede comportar de forma que en un determinado instante


k, el sistema evolucione a un conjunto de la secuencia i con i < Nr k (es decir, que
se salte una o mas de una regi
on de la secuencia en un solo paso). En este caso el controlador sigue estabilizando el sistema, pero el desempe
no del sistema podra empeorar.
Para evitar esto, la restriccion estabilizante se puede sustituir por
x(k + 1|k) i W
siendo i tal que xk i+1 \ i .
Propiedad 8.12 El controlador propuesto tiene las siguientes propiedades:
(i) El controlador obtenido eliminando las restricciones sobre los estados x(k+j|k)
X del problema de optimizacion tambien estabiliza el sistema de forma admisible,
es decir, satisfaciendo las restricciones.

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

229

(ii) El controlador estabiliza el sistema para cualquier funcion de coste.


(iii) El dominio de atracci
on tan solo depende de la secuencia {i }.
Nr =
(iv) Si el procedimiento Qap () = Q(), entonces el dominio de atracci
on es X
SNr (X, ).
(v) El controlador estabiliza el sistema con el mismo dominio de atracci
on para
cualquier horizonte de control N 1.
(vi) El controlador estabiliza el sistema con el mismo dominio de atracci
on ante
cualquier solucion suboptima del problema de optimizacion.

Por lo tanto, la secuencia de invariantes de control robustos sirven para garantizar


la estabilidad del controlador, y en consecuencia, determinar el dominio de atraccion
del mismo. El horizonte de control, el coste a optimizar y la optimalidad de la solucion
tan solo afecta al comportamiento del sistema controlado. As, el horizonte de control
y por ende el n
umero de variables de decision, se puede fijar en funcion del coste
computacional en lnea que es admisible para que el tiempo de calculo del controlador
no supere el periodo de muestreo.

8.6.

Ejemplos

8.6.1.

El sistema de Scokaert y Mayne

Se va aplicar la tecnica propuesta al ejemplo utilizado en (Scokaert & Mayne 1998),


con el que se ilustro anteriormente la necesidad de la formulacion en bucle cerrado.
Considerese el sistema lineal incierto dado por
xk+1 = xk + uk + wk
siendo xk IR el estado del sistema, uk la actuacion sobre el mismo y wk las incertidumbres del sistema. El estado del sistema esta restringido a
xk [1,2, 2]
mientras que la actuacion no esta acotada. Las incertidumbres del sistema son
wk [1, 1]

230

8.6. Ejemplos

El conjunto = {x [1, 1]} es un conjunto invariante robusto del sistema controlado


con una ley de control uk = xk . La secuencia de invariantes de control robustos
esta finitamente determinada en un solo paso, de forma que 1 = X.
Basandose en la secuencia de invariantes se aplica el controlador propuesto con
horizonte de control N = 3 y coste de etapa L(x, u) = x2 + u2 sin funcion de coste
terminal. El controlador se aplica en las situaciones ilustradas en (Scokaert & Mayne
1998, Bemporad, Borrelli & Morari 2001), con una perturbacion wk = 1/k y con otra
wk = cos(k/5). En las figuras 8.2 y 8.3 se muestran las evoluciones del sistema en
ambas situaciones, que como era de esperar, estabilizan el sistema en un solo paso.
2.5
2
1.5

1
0.5
0
0.5
1

10

12

14

16

18

20

10

12

14

16

18

20

0.5

0.5

1.5

muestras

Figura 8.2: Evolucion del sistema con wk = 1/k,partiendo de x0 = 2 y x0 = 1,2.

1.5

xk

0.5

0.5

1.5

10

15

20
sample time

25

30

35

40

Figura 8.3: Evolucion del sistema con wk = cos(k/5) y x0 = 2.

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

8.6.2.

231

Ejemplo de aplicaci
on al reactor

En este apartado se aplica la estrategia presentada al ejemplo del reactor (CSTR)


utilizado a lo largo de esta tesis. En captulos anteriores se han dise
nado controladores
robustos basados en la formulacion en bucle abierto del mismo. En este caso se va
a sintonizar un controlador basado en invariantes de control robustos para lo cual es
necesario partir de un conjunto invariante robusto. Como tal se va a tomar el utilizado
en el ejemplo del captulo anterior, el cual para un controlador local
K=

1,5488 3,4658

admite unas incertidumbres


h

w1 8103 , 6,5103
h

w2 8,5102 , 1,2102

i
i

A partir de este conjunto se debe calcular la secuencia de invariantes de control


robustos. Para ilustrar la satisfaccion robusta de las restricciones, se van a considerar
unas restricciones sobre los estados mas exigentes, de forma que
x1 [0,2, 0,2]
Para el calculo de la secuencia se ha seguido el algoritmo propuesto dando lugar a
los conjuntos que se muestran en la figura 8.4.
0.4

0.2

0.2

x2

0.4

1
2

0.8

1.2

0.6

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

x1

Figura 8.4: Secuencia de 6 conjuntos invariantes de control del reactor.

Para ilustrar la forma en que los invariantes de control introducen informacion del
comportamiento del sistema en bucle cerrado, se muestra en la figura 8.5 la evolucion

232

8.6. Ejemplos

de varias realizaciones de incertidumbres aleatorias considerando la restriccion estabilizante. En esta se puede comprobar que la evolucion es siempre admisible a pesar de
las incertidumbres.

0.2

x2

0.2

0.4

0.6

0.8

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

x1

Figura 8.5: Evolucion del sistema para un gran n


umero de realizaciones de las incertidumbres.

En la figura 8.6 se muestra las trayectorias del sistema incierto en bucle cerrado.
Como ponderacion en el controlador se han tomado las mismas matrices de ponderacion
anteriormente citadas y se ha tomado un coste terminal cuadratico dado por la matriz
P . El horizonte de control considerado ha sido Nc = 1 y el de prediccion Np = 1. Para
la simulacion se ha considerado incertidumbres aditivas sobre el sistema aleatorias, de
ah el comportamiento erratico del sistema una vez ha alcanzado el invariante robusto.
0.4

0.2

x2

0.2

x2

0.4

0.6

0.8

1.2

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

x1
x1

Figura 8.6: Trayectorias del sistema en bucle cerrado con incertidumbres aleatorias.

Para mostrar la satisfaccion robusta de las incertidumbres se muestra la evolucion

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

233

del sistema considerando las incertidumbres extremas constantes. En el caso (a) se


considera w1 = 8103 y w2 = 8,5102 . En el caso (b) se considera w1 = 6,5103
y w2 = 1,2102 . En la figura 8.7 se muestran ambos casos y se puede comprobar que
existen situaciones en las que las restricciones se mantienen a pesar de las incertidumbres.
0.4

0.2

0.2

0.2

x2

0.2

0.4

0.4

0.6

0.6

0.8

0.8

0.2

0.15

0.1

0.05

0.05

0.1

0.15

1.2

0.2

0.2

0.15

0.1

0.05

x1

(a)

(b)

0.05

0.1

0.15

0.2

Figura 8.7: Trayectorias del sistema en bucle cerrado con incertidumbres mnimas y maximas.

En la figura 8.8 se muestra la evolucion del sistema en el caso (b) en el estado


proximo a la violacion de las restricciones.

x1

0.2

0.15

0.1

10

15

20

25

30

35

10

15

20

25

30

35

10

15

20

25

30

35

x2

0.2
0.4

2
1
0
1

muestras

Figura 8.8: Satisfaccion de las restricciones en la evoluci


on del sistema en bucle cerrado.

A continuacion se van a ilustrar ciertas propiedades del controlador propuesto.

234

8.6. Ejemplos

Como se comento anteriormente, la restriccion


x(k + 1|k) 0 W
garantiza la estabilidad del sistema, pues fuerza al sistema a permanecer en el invariante
robusto. Sin embargo esta restriccion por s sola puede no ofrecer un comportamiento
satisfactorio, si se compara con el que tendra el controlador conmutando a la ley de
control local. En la figura 8.9 se muestra la evolucion del sistema en bucle cerrado en el
caso de incertidumbres que decaen con el tiempo. La evolucion representada mediante
una lnea con puntos corresponde con la del sistema en bucle cerrado conmutando al
controlador local lineal una vez ha alcanzado la region terminal. En lnea con cruces
se muestra la evolucion del controlador optimo sin conmutar. En ambos casos no se
a
nade al funcional la funcion de coste terminal y se considera Nc = 1.
Como se puede observar, el controlador local conduce el sistema al origen, mientras
el controlador optimo mantiene el sistema en el invariante pero de forma no deseable.
Este efecto se debe a que la actuacion obtenida no es estabilizable asintoticamente,
pues no se considera la ponderacion en el estado terminal. Si se a
nade esta, entonces el
controlador MPC nominal es estabilizante en la region terminal y, dada la robustez inherente del MPC, estabiliza asintoticamente al sistema con incertidumbres que decaen.
Esto se muestra en la misma figura, en lnea con crculos.

0.2

x2

0.2

0.4

0.6

0.8

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

x1

Figura 8.9: Influencia del coste terminal en el sistema en bucle cerrado: lnea con puntos: MPC dual, lnea con cruces: MPC no dual, lnea con crculos: MPC no dual con coste
terminal.

En los ejemplos anteriores, el controlador estabiliza el sistema con un horizonte de


control Nc = 1. Sin embargo, la consideracion de horizontes mayores mejora el desempe
no y la optimalidad del controlador, a costa de un mayor coste computacional.

Captulo 8. MPC robusto basado en conjuntos invariantes robustos

235

En la figura 8.10 se muestra la evolucion del sistema incierto, considerando las incertidumbres maximas, para ciertos valores de los horizontes.
0.4

0.2

x2

0.2

0.4

0.6

0.8

1.2

0.2

0.15

0.1

0.05

0.05

0.1

0.15

0.2

x1

Figura 8.10: Influencia del horizonte de control y de prediccion sobre el sistema en bucle
cerrado

Los resultados obtenidos se resumen en la siguiente tabla:

Tipo de lnea
puntos
cruces
crculos

Nc
1
3
3

Np
1
3
10

JMPC
60.38
52.61
45.91

siendo JMPC el coste de la trayectoria en bucle cerrado.


Como se puede observar, la estabilidad de la evolucion del sistema esta siempre
garantizada, sin embargo, el incremento de los horizontes de prediccion mejoran el desempe
no del sistema, a pesar de que las incertidumbres no se consideran en el funcional
a optimizar. Esto se puede comprobar observando el coste asociado a la evolucion del
sistema en bucle cerrado JMPC para cada uno de los casos.
La incorporacion de la restriccion terminal tambien mejora el desempe
no del sistema en bucle cerrado, pero para ello los horizontes deben ser tales que garanticen la
factibilidad inicial del sistema.

236

8.7.

8.7. Conclusiones

Conclusiones

En este captulo se ha abordado el control predictivo robusto en bucle cerrado. A


partir de un ejemplo ilustrativo se pone de manifiesto que la necesidad de la formulacion
del controlador en bucle cerrado esta basicamente motivada por la perdida de dominio
de atraccion de los controladores en bucle abierto. Este problema se debe a la forma
en la que se realiza la prediccion: sin considerar la realimentacion del sistema. As,
considerando como variables de decision leyes de control, en vez de actuaciones, se
formula el MPC en bucle cerrado.
A continuacion se analiza la estabilidad de los controladores en bucle cerrado desde
la programacion dinamica. A partir de esta, se demuestra la estabilidad del MPC
min-max en bucle cerrado para incertidumbres que decaen con el estado, siguiendo
la demostracion de (Mayne 2001). Este analisis se extiende al caso de sistemas con
incertidumbres acotadas incorporando el concepto de estabilidad entrada a estado, lo
cual es un resultado novedoso.
Este analisis sirve ademas de base para probar que la estabilidad robusta del controlador se puede transformar en una restriccion estabilizante. Por tanto, la factibilidad de
dicha restriccion garantiza la estabilidad robusta. Esto permite volver a la formulacion
en bucle abierto, a costa de un peor desempe
no.
La restriccion estabilizante se basa en la determinacion del conjunto estabilizable
robusto en i pasos, lo cual es practicamente imposible salvo en sistemas lineales con
incertidumbres aditivas o politopicas (Kerrigan 2000). Por ello, se propone un controlador MPC robusto basado en una secuencia de invariantes robustos de control, mas
sencilla de calcular. Este controlador garantiza estabilidad robusta con las ventajas del
bucle abierto y las del bucle cerrado: permite reducir el conservadurismo del controlador sin apenas incremento del coste computacional en lnea. El dominio de atraccion
del controlador propuesto puede llegar a ser igual que el de la formulacion en bucle
cerrado, y el controlador presenta unas caractersticas interesantes, como que estabiliza
para todo horizonte de control Nc 1, entre otras.
Este controlador es uno de los controladores MPC originales propuestos en esta
tesis.

Captulo 9
Conclusiones y futuras lneas de
investigaci
on
9.1.

Conclusiones y aportaciones originales

En esta tesis se ha abordado el analisis y el dise


no de controladores MPC para
sistemas no lineales sujetos a restricciones. Todo ello se ha llevado a cabo siguiendo
un hilo argumental: la garanta de estabilidad del sistema controlado. La teora de
Lyapunov y la teora de conjuntos invariantes han sido el soporte teorico del analisis,
as como de las pruebas de estabilidad realizadas a lo largo de la tesis.
El desarrollo de la tesis se puede distinguir en tres partes diferenciadas: comienza
con el analisis y dise
no de nuevos controladores MPC que garantizan la estabilidad en
ausencia de incertidumbres. A continuacion se analiza la robustez de los controladores
MPC nominales, incorporando un nuevo enfoque: la estabilidad entrada a estado. La
tercera y u
ltima parte constituye el dise
no de nuevos controladores robustos que garantizan la estabilidad en presencia de incertidumbres, tanto en la formulacion en bucle
abierto como en bucle cerrado. A continuacion se detallan las aportaciones realizadas
en esta tesis en cada una de las tres partes citadas:

Dise
no de controladores con estabilidad garantizada :
Partiendo del analisis de estabilidad de la formulacion general del MPC, se han
propuesto dos controladores originales: El controlador MPC con horizonte de
prediccion mayor que el de control, y el controlador MPC con coste terminal
cuasi-infinito. El controlador con mayor horizonte de prediccion es una generalizacion del trabajo previo (Magni, De Nicolao, Magnani & Scattolini 2001)
237

238

9.1. Conclusiones y aportaciones originales

a la formulacion general del MPC. Este controlador soluciona problemas de la


formulacion original, conserva sus propiedades y a
nade otras nuevas que este no
tena. Por otro lado, el controlador con coste cuasi-infinito surge como solucion a
los problemas que presenta el controlador propuesto en (De Nicolao et al. 1998).
Se ha analizado ademas el desempe
no de estos controladores, demostrandose que
lo mejoran sin un incremento apreciable del coste computacional del controlador.
Con el objetivo de mejorar la implementacion de los controladores MPC, se analizan la suboptimalidad de las soluciones y la eliminacion de la restriccion terminal
en el problema de optimizacion. El analisis de la estabilidad del MPC suboptimo
se hace desde la perspectiva de la teora de conjuntos invariantes y se establecen condiciones mas suaves que las consideradas en (Scokaert et al. 1999, Mayne
et al. 2000). Por otro lado, se establecen condiciones bajo las cuales se puede eliminar la restriccion terminal del problema de optimizacion de los controladores
MPC, extendiendo resultados anteriores (Parisini & Zoppoli 1995, Jadbabaie
et al. 2001) al MPC general. Ademas se ha caracterizado un dominio de atraccion de este controlador. Estos resultados, as como los derivados del aumento del
dominio de atraccion caracterizado ha dado lugar al artculo (Limon Marruedo
et al. 2003), que esta pendiente de revision.
A continuacion se analiza un aspecto importante de los controladores predictivos:
el dominio de atraccion y medidas para aumentarlo. Se parte de un analisis del
dominio de atraccion mediante la teora de conjuntos invariantes. Tambien se demuestra utilizando la teora de conjuntos invariantes que todo estado estabilizable
puede ser estabilizado por un controlador MPC con horizonte finito.
A la luz de este analisis se proponen procedimientos de sintonizacion y nuevos
controladores MPC orientados a aumentar el dominio de atraccion del controlador MPC general. Se demuestra que la ponderacion del coste terminal o bien la
incorporacion del coste cuasi-infinito pueden aumentar el dominio de atraccion.
Por otro lado, los nuevos controladores propuestos se basan en la consideracion de
una region terminal contractiva: uno contrayendo un conjunto invariante positivo
y otro basado en una secuencia de invariantes de control. Este u
ltimo controlador

ha sido publicado en (Limon Marruedo, Alamo & Camacho 2002a).


Por u
ltimo, se proponen medidas para aumentar el dominio de atraccion del
controlador sin restriccion terminal: partiendo de la region caracterizada anteriormente, se muestran procedimientos para aumentarlo, entre los que destacan:
la ponderacion del coste terminal y la consideracion de un mayor horizonte de
prediccion.
An
alisis de la robustez de los controladores MPC :
La garanta de estabilidad de los controladores MPC esta basada en la ausencia
de incertidumbres, hipotesis que es una idealizacion, pues todo sistema dinamico
discrepa en mayor o menor medida, del modelo que lo describe. Por lo tanto, es
imprescindible realizar un analisis del grado de incertidumbres del sistema que es
capaz de soportar los controladores predictivos garantizando la estabilidad. Este

Captulo 9. Conclusiones y futuras lneas de investigacion

239

analisis se debe realizar desde dos aspectos: la convergencia y la satisfaccion de


las restricciones.
Partiendo de la teora de Lyapunov, se analiza la estabilidad robusta de controladores MPC aplicados sobre sistemas con incertidumbres aditivas acotadas.
Este estudio es una generalizacion de (Scokaert et al. 1997) y ha sido publicado

en (Limon Marruedo, Alamo


& Camacho 2002c). Este analisis se extiende incorporando el concepto de estabilidad entrada a estado, no utilizado anteriormente
en este contexto. De este analisis se infiere un resultado interesante: la suavidad
del coste optimo garantiza la robustez del controlador.
La satisfaccion de las restricciones esta ntimamente unida con el concepto de
invariancia robusta. Por ello su analisis se hace incorporando conceptos de la
teora de conjuntos invariantes robustos.
Por u
ltimo, basandose en el analisis de continuidad del coste optimo realizado en
el apendice C, se demuestra que el controlador MPC sin restriccion terminal es
robusto, pues esta garantizada la suavidad del coste optimo.
Dise
no de controladores MPC robustos :
Del analisis anterior se pone de manifiesto que la suavidad del coste optimo es
condicion suficiente para garantizar la estabilidad entrada estado del controlador,
y por lo tanto su robustez. Sin embargo, la funcion de coste de un controlador
predictivo no tiene por que ser suave.
Basandose en la acotacion del efecto de las incertidumbres sobre el sistema, se
propone un controlador MPC que garantiza la satisfaccion robusta de las restricciones y ademas la estabilidad entrada a estado bajo condiciones de suavidad del
modelo y de las funciones implicadas en el problema de optimizacion. Estos resul
tados estan en periodo de revision (Limon Marruedo, Alamo
& Camacho 2002b).
Un problema asociado a la acotacion del efecto de las incertidumbres necesaria
para la robustez es su conservadurismo, derivado en parte del caracter global
de esta. Para mitigar este efecto, se propone el concepto de region de evolucion
incierta. Estas regiones son acotaciones del efecto de las incertidumbres que se
calculan en lnea por alg
un procedimiento adecuado, como puede ser el algebra
intervalar. De esta forma se propone un nuevo controlador MPC que incorpora
en su formulacion estas regiones. Este controlador se formula como controlador
dual y no dual. La estabilidad robusta y la satisfaccion de las restricciones estan
garantizadas bajo la factibilidad del problema. Estos resultados han dado lugar

a la publicacion (Limon Marruedo, Bravo, Alamo


& Camacho 2002).
Los controladores robustos propuestos anteriormente se engloban dentro de los
denominados, controladores MPC en bucle abierto, pues no consideran el efecto
de la realimentacion del sistema sobre la prediccion del comportamiento futuro del
sistema. Esto hace que puedan incurrir en un alto grado de conservadurismo, por
lo que se han propuesto en la literatura los denominados controladores MPC en
bucle cerrado. Por ello se hace un analisis de la estabilidad de estos controladores

240

9.2. Futuras lneas de investigacion

en su formulacion min-max basado en (Mayne 2001). Este estudio se ha extendido,


estableciendo condiciones para garantizar la estabilidad entrada a estado de los
controladores min-max cuando el sistema presenta incertidumbres acotadas.
Estos controladores, si bien resultan menos conservadores, su implementacion es
tan costosa que no resultan practicos (por ahora). Como una posible solucion a
este problema se propone un nuevo controlador hbrido entre la formulacion en
bucle abierto y la formulacion en bucle cerrado. Para ello se analiza el origen de
la estabilidad robusta de los controladores en bucle cerrado a la luz de la teora
de conjuntos invariantes y se demuestra que se puede convertir en una restriccion
estabilizante a imponer sobre un controlador MPC estandar. De esta forma se
conserva la facilidad de implementacion del bucle abierto, manteniendo el mismo
dominio de atraccion del controlador en bucle cerrado.
Esta restriccion estabilizante se basa en el conjunto estabilizable robusto, el cual
es difcil de calcular con exactitud salvo para el caso de sistemas lineales con
incertidumbres aditivas o politopicas. Por ello se propone un nuevo controlador
MPC con una restriccion estabilizante basada en el calculo de una secuencia de
invariantes robustos de control, mas sencilla de obtener.
Es importante resaltar que todo el analisis llevado a cabo en esta tesis se basa en la
teora de Lyapunov conjugada con la teora de conjuntos invariantes. El enfoque de la
estabilidad de sistemas no lineales con restricciones a la luz de ambas teoras permiten
una comprension profunda del problema y dan una amplia perspectiva en el analisis y en
el dise
no de controladores predictivos. Por ello se ha tratado de recoger en el apendice A
un conjunto de resultados sobre la estabilidad de sistemas no lineales discretos sujetos
a restricciones. Para ello se han desarrollado algunos resultados (Vidyasagar 1993) y
se han extendido otros, como los relativos a las funciones de control de Lyapunov.
En el apendice C se muestra un estudio de la continuidad del coste optimo basado
en el analisis de sensibilidad del problema de optimizacion, propiedad interesante para
la robustez del controlador.

9.2.

Futuras lneas de investigaci


on

Las caractersticas del control predictivo y el rapido avance que se ha experimentado recientemente en aspectos teoricos como estabilidad y robustez, hacen que esta
estrategia tenga un futuro prometedor. Sin embargo, quedan temas abiertos en los que
trabajar, principalmente orientados a la implementacion.
En esta tesis se ha estudiado con profundidad la estabilidad y robustez de los
controladores predictivos y se han adquirido conocimientos que serviran de base para

Captulo 9. Conclusiones y futuras lneas de investigacion

241

el analisis de aspectos del control predictivo no abordados en la misma o bien que han
quedado abiertos. Entre ellos se pueden destacar:

La implementacion de los controladores propuestos y analizados en esta tesis.


Para ello, se esta dise
nando una planta de laboratorio formada por 4 depositos
interconectados y dotada de instrumentacion industrial. Esta planta esta orientada principalmente a la utilizacion de controladores predictivos no lineales en
espacio de estados y permite ser configurada para explotar distintos aspectos como son: control multivariable, presencia de ceros de transmision, incorporacion
de se
nales logicas, posibilidad de subactuacion y sobreactuacion sobre el sistema.
Implementaciones de controladores MPC rapidos como son controladores sin restriccion terminal, suboptimos y con restricciones blandas en los estados. Para ello
se pueden utilizar algoritmos de optimizacion no lineal como son los algoritmos
geneticos, que se han probado en aplicaciones de control predictivo de robots
moviles con bastante exito.
Estudiar y analizar la formulacion del control predictivo para seguimiento de
referencias. Esto conlleva dos aspectos distintos: la formulacion del controlador
en entrada-salida (con la posible incorporacion de observadores) y la estabilidad
y satisfaccion de restricciones ante cambios en la referencia.
La incorporacion de invariantes de control en el dise
no de controladores predictivos es, a juicio del autor, una idea prometedora, pues permite incorporar
conocimiento del sistema sobre el que se va aplicar el controlador en la propia
formulacion del mismo. El procedimiento de calculo de estos conjuntos es geometrico y se basa en la determinacion del conjunto a un paso Q(). En el caso
de sistemas no lineales, interesa trabajar en procedimientos que mejoren los propuestos en esta tesis para el calculo de estos de una forma aproximada.
Consideracion de incertidumbres estructuradas en el analisis de robustez de los
controladores.
Estudio de la formulacion simultanea del controlador: la ruptura de la composicion sucesiva que conlleva esta formulacion, mejora el condicionamiento del problema y permite explotar propiedades como afinidad del modelo con respecto a
los parametros.

242

9.2. Futuras lneas de investigacion

Ap
endice A
Estabilidad y robustez de sistemas
no lineales en tiempo discreto
A.1.

Introducci
on

Esta tesis se centra en el analisis y el dise


no de controladores predictivos de sistemas
no lineales en tiempo discreto sujetos a restricciones. En esta se contemplan tanto
sistemas sin incertidumbres como sistemas inciertos y todo ello con un nexo de union:
la garanta de estabilidad.
Ya sea por la naturaleza no lineal del modelo del sistema o por la presencia de
restricciones, los sistemas que se estudian son no lineales. La teora de Lyapunov proporciona un marco adecuado para el analisis de la estabilidad de sistemas no lineales
autonomos. De hecho, el analisis de la estabilidad de los controladores predictivos se
suele realizar mediante esta teora (Mayne et al. 2000).
La teora de Lyapunov se extiende a sistemas no autonomos gracias a la denominada
funcion de Lyapunov de control (CLF 1 ). En este apendice se presenta una recopilacion
de esta teora formulada para el caso de sistemas en tiempo discreto.
Intimamente relacionada con esta teora esta el concepto invariancia positiva de
un conjunto en relacion a un sistema autonomo (en bucle cerrado, por ejemplo). Este
concepto se extiende a sistemas no autonomos incorporando el concepto de invariancia
de control, alrededor del cual se desarrolla la teora de conjuntos invariantes. Esta
teora da soporte al analisis de regiones estabilizables, dominios de atraccion, etc. y es
1

Acronimo del termino ingles Control Lyapunov Function.

243

244

A.2. Estabilidad de sistemas no lineales en tiempo discreto

de suma utilidad en el analisis de sistemas con restricciones. Esta teora, ademas de ser
una potente herramienta de analisis, puede ser utilizada en la sntesis de controladores.
Todo ello hace de la teora de conjuntos invariantes un campo que, a juicio del autor, va
a tener un protagonismo cada vez mayor en el area del control. Como referencia tomese
el artculo, (Mayne 2001), que resume la sesion plenaria del ECC del a
no 2000, en la
cual D. Q. Mayne hace un enfoque de la estabilidad y robustez del MPC introduciendo
conceptos de la teora de conjuntos invariantes.
En este apendice se presenta ademas un balance de resultados en el campo de la
teora de conjuntos invariantes de sistemas en tiempo discreto. Entre las publicaciones
dentro de esta teora cabe destacar (Blanchini 1999), en el que se presentan resultados
en este campo, y los trabajos de E. C. Kerrigan (Kerrigan & Maciejowski 2000, Kerrigan
2000) en los que se hace un balance de esta teora con una notacion y nomenclatura
muy consistente, que es la que se ha adoptado en esta tesis.
En el caso de que los sistemas presenten incertidumbres, la teora de Lyapunov
se extiende de una manera natural a la denominada estabilidad entrada a estado.
Esta teora ofrece un marco teorico para el analisis de estos sistemas, dentro del cual
se enmarcan el analisis y dise
no de controladores predictivos para sistemas inciertos
desarrollados en esta tesis. Junto a esta se extiende tambien el concepto de invariancia
robusta, que se desarrolla en la teora de conjuntos invariantes robustos.

A.2.

Estabilidad de sistemas no lineales en tiempo


discreto

Sea un sistema dinamico autonomo en tiempo discreto dado por


xk+1 = F (xk )
siendo xk IRn el estado del sistema en el instante k y la funcion F : IRn 7 IRn una
funcion continua. En lo que sigue se va a considerar siempre que k es un n
umero entero
no negativo, es decir, que el tiempo discurre hacia delante.
Un estado xo se dice que es un punto de equilibrio del sistema (tambien denominado
punto fijo) si
xo = F (xo )
es decir, si el sistema, una vez que alcanza ese estado, permanece en el.
En adelante, y sin perdida de generalidad, se considera que el origen es un punto
de equilibrio del sistema2 .
2

Basta con hacer el cambio de variables z = x xo para trasladar el punto de equilibrio al origen.

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

A.2.1.

245

Definiciones previas

Antes de introducir el concepto de estabilidad, se va a definir un tipo de funciones


muy u
tiles en la teora de estabilidad (Khalil 1996, Vidyasagar 1993).
Definici
on A.1 (Funciones K , K y KL )
Una funcion : IR+ 7 IR+ se dice que es una funcion K si:
Es una funcion continua.
Es estrictamente creciente, es decir: si a > b, entonces (a) > (b).
(0) = 0.
Una funcion : IR+ 7 IR+ se dice que es una funcion K si es una funcion
K y ademas
(a) cuando a .
Una funcion : IR+ IR+ 7 IR+ se dice que es una funcion KL si
La funcion (a, k) es una funcion K en a para todo k 0 fijo.
La funcion (a, k) es decreciente en k para todo a 0 fijo, de forma que
(a, k) 0 cuando k .
Estas funciones tienen una serie de propiedades muy u
tiles. A continuacion se presenta una recopilacion de algunas de ellas.

Propiedad A.2 (Propiedades de las funciones K , K y KL )


(i) Sean 1 () y 2 () funciones K definidas en [0, a).
(ii) Sean 3 () y 4 () funciones K .
(iii) Sea (, ) una funcion KL .
Entonces:
Notese que esto hace que la funcion que describe el sistema pueda depender del punto de equilibrio,
variando esta si dicho punto cambia.

246

A.2. Estabilidad de sistemas no lineales en tiempo discreto

La funcion inversa 11 () es una funcion K definida en [0, 1 (a)).


La funcion inversa 31 () es una funcion K .
La composici
on de dos funciones K , 1 2 , es una funcion K .
La composici
on de dos funciones K , 3 4 , es una funcion K .
La composici
on de una funcion K con una KL , 1 , es una funcion KL .
La funcion 5 (s) = max(1 (s), 2 (s)) es una funcion K .
Dada una funcion K , 3 (), existe una funcion K ,6 (), asociada tal que
6 (s) 3 (s) para todo s 0.
La funcion 7 (s) = s 6 (s) es una funcion K , es decir 6 (s) < s para
todo s > 0.

Tambien resulta de interes introducir el concepto de funcion definida positiva

Definici
on A.3 (Funci
on definida positiva) Una funcion V : IRn 7 IR+ se dice
que es (localmente) definida positiva si existe una funcion K , () tal que
(kxk) V (x)
para todo x Br = {x IRn : kxk r}.
Si esta condici
on se extiende a IRn , entonces se denomina globalmente definida
positiva.
Si la funcion V () es globalmente definida positiva y ademas existe una funcion ()
que es K , entonces se dice que es radialmente no acotada. En este caso se verifica
que V (x) cuando kxk .

Lema A.4 (Khalil 1996) Sea una funcion V : IRn 7 IR+ continua y definida positiva
en Br , entonces existe una funcion K () definida en [0, r] tal que
V (x) (kxk)
para todo x Br .
Si ademas V () es radialmente no acotada, entonces () puede ser K .

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

A.2.2.

247

Estabilidad de un sistema

A continuacion se definen los conceptos de estabilidad de un sistema en el origen


(Vidyasagar 1993).
Definici
on A.5 (Estabilidad) Un sistema xk+1 = F (xk ) se dice que es estable en el
origen (o bien que el origen es un punto de equilibrio estable) si para todo > 0 existe
una constante = () tal que
x0 : kx0 k kxk k k 0
En consecuencia un sistema es estable si para una cota del sistema dada existe
una vecindad del origen tal que si el sistema parte de ella, este evoluciona acotado por
. Esta condicion esta relacionada con cierta robustez del sistema en torno al punto
de equilibrio, pues garantiza que una variacion peque
na de la cota del estado inicial,
supone una variacion peque
na de la cota en la evolucion del sistema.
Definici
on A.6 (Estabilidad asint
otica) Un sistema xk+1 = F (xk ) se dice que es
asint
oticamente estable en el origen si es estable y ademas existe una constante > 0
tal que
x0 : kx0 k xk 0 cuando k
o lo que es equivalente, que existe una funcion KL (, ) tal que
kxk k (kx0 k, k)
para todo k 0 y para todo x0 tal que kx0 k .
La definicion de estabilidad asintotica consta de dos partes: que el sistema sea
estable y ademas que tienda asintoticamente al origen. Puede caber la duda de si la
tendencia del sistema al origen implica que el sistema sea estable. Sin embargo no es
as, pues puede existir un sistema tal que para una vecindad del origen arbitrariamente
peque
na, existen estados tales que si el sistema parte de ellos, este evoluciona saliendose
de esta vecindad, para posteriormente tender al origen asintoticamente. Por lo tanto, el
sistema no es estable pero s tiende al origen asintoticamente. Para mas detalles, vease
la discusion sobre el tema y su ejemplo de la pagina 141 de (Vidyasagar 1993).
Definici
on A.7 (Estabilidad exponencial) Un sistema xk+1 = F (xk ) se dice que
es exponencialmente estable en el origen si es asintoticamente estable y ademas existen
unas constantes > 0, a > 0 y [0, 1) tal que
kxk k akx0 kk
para todo k 0 y para todo x0 tal que kx0 k .

248

A.2. Estabilidad de sistemas no lineales en tiempo discreto

Como se puede observar, la diferencia entre estabilidad asintotica y exponencial,


es la existencia de una funcion KL que acota el sistema tal que tiene una expresion
exponencial
(kx0 k, k) = akx0 kk
Todas las definiciones de estabilidad anteriormente presentadas se formulan para
una vecindad del origen B = {x IRn : kxk }. Se dice en ese caso que el sistema
es estable localmente. En el caso en el que dichas definiciones se puedan extender a
todo IRn entonces se dice que el sistema es globalmente estable.

A.2.3.

Teora de Lyapunov

Esta teora establece condiciones suficientes para garantizar la estabilidad de un


sistema y esta basada en la existencia de una funcion del estado definida positiva
asociada al sistema denominada funcion de Lyapunov. Bajo ciertas hipotesis sobre
esta funcion se puede demostrar estabilidad, estabilidad asintotica o exponencial. As,
existe un teorema de estabilidad de Lyapunov asociado a cada tipo de estabilidad
(Vidyasagar 1993).
Antes de establecer los teoremas de estabilidad resulta u
til la siguiente definicion:
Definici
on A.8 Sea una funcion V : IRn 7 IR+ asociada a un sistema dinamico
xk+1 = F (xk )
siendo xk IRn el estado del sistema en el instante k. Entonces se define
V (x) = V (F (x)) V (x)

Teorema A.9 (Estabilidad)


(i) Sea un sistema dinamico en tiempo discreto dado por
xk+1 = F (xk )
siendo xk IRn el estado del sistema en el instante k y tal que el origen es un
punto de equilibrio.
(ii) Sea una funcion V : IRn 7 IR+ definida positiva tal que

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

249

Existen dos funciones K 1 () y 2 () tales que


1 (kxk) V (x) 2 (kxk)
Satisface la condici
on
V (x) 0
para todo x Br 3 .
Entonces el origen es un punto de equilibrio estable del sistema. Si estas condiciones
se extienden a IRn entonces es globalmente estable4 .

A la funcion V (x) definida positiva que satisface las condiciones de este teorema se
denomina funcion de Lyapunov asociada al sistema xk+1 = F (xk ). As, el teorema anterior se puede reescribir como: un sistema es estable si tiene una funcion de Lyapunov
asociada.
Por el lema A.4, la condicion
V (x) 2 (kxk)
se satisface si la funcion definida positiva V (x) es continua.
La estabilidad de Lyapunov esta ntimamente ligada al concepto de invariancia
positiva.
Definici
on A.10 (Conjunto invariante positivo) Un conjunto IRn se dice
que es un conjunto invariante positivo, si para todo x0 , la evolucion del sistema es
tal que xk para todo k 0.

Por tanto, si un sistema en su evolucion alcanza un invariante positivo, entonces la


evolucion del sistema permanecera en dicho conjunto.
La estabilidad de Lyapunov se deriva del hecho que V (x) es negativa, y por lo
tanto la secuencia de valores V (xk ) es decreciente en toda trayectoria que no salga de
Br , por lo que V (xk ) V (x0 ) para todo k. Se puede comprobar que todo conjunto
= {x IRn : V (x) }
En adelante se denotara Br como la vecindad del origen {x IRn : kxk r}.
En lo que sigue, la estabilidad se considera local, es decir, en una vecindad del origen, salvo que
se indique lo contrario.
3

250

A.2. Estabilidad de sistemas no lineales en tiempo discreto

siendo 1 (r), es un conjunto contenido en Br , pues para todo x ,


1 (kxk) V (x) 1 (r)
y por lo tanto kxk r. En consecuencia, Br es invariante positivo del sistema,
pues para todo x0 tal que V (x0 ) 1 (r), se tiene que V (xk ) V (x0 ) 1 (r),
por lo que xk .
Para demostrar la estabilidad hay que probar que para toda cota de la evolucion
del sistema r, existe un () tal que para todo x0 B , resulta que xk B . Esto
se puede demostrar tomando = 21 (1 ()). As, para todo x0 B se tiene que
V (x0 ) 2 (kx0 k) 2 () = 1 () 1 (r)
por lo que , con = 1 (), es un invariante positivo contenido en Br y que contiene
B . En consecuencia
1 (kxk k) V (xk ) V (x0 ) 1 ()
y por lo tanto xk B , lo que demuestra la estabilidad. Notese que la estabilidad se
basa en la acotacion superior de la funcion de Lyapunov por una funcion K , lo que
garantiza la existencia de la vecindad B contenida en el invariante . Esta es una
condicion blanda, pues, en virtud del lema A.4, se satisface si la funcion de Lyapunov
es continua en una vecindad del origen.
Es importante resaltar que si la condicion
V (x) 0
se satisface en un conjunto que es un invariante positivo del sistema, entonces
V (xk ) V (x0 ) para todo x0 perteneciente al invariante, pues la trayectoria esta contenida en para todo k. Por tanto el sistema es estable en .
Teorema A.11 (Estabilidad asint
otica)
(i) Sea un sistema dinamico en tiempo discreto dado por
xk+1 = F (xk )
siendo xk IRn el estado del sistema en el instante k y tal que el origen es un
punto de equilibrio.
(ii) Sea una funcion V : IRn 7 IR+ definida positiva tal que
Existen dos funciones K , 1 () y 2 (), tales que
1 (kxk) V (x) 2 (kxk)

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

251

Existe una funcion K , 3 (), tal que


V (x) 3 (kxk)
para todo x Br .
Entonces el origen es un punto de equilibrio asintoticamente estable del sistema. Si estas
condiciones se extienden a IRn y la funcion de Lyapunov es radialmente no acotada,
entonces es globalmente asintoticamente estable.

El sistema es estable, pues se satisface el teorema de estabilidad. Por otro lado, la


condicion de que V (x) sea estrictamente decreciente excepto en el origen, hace que
la secuencia V (xk ) sea estrictamente decreciente en todo estado de la trayectoria, salvo
en el origen, para todo x0 perteneciente al conjunto invariante positivo
= {x IRn : V (x) 1 (r)} Br

Dado que la secuencia de valores V (xk ) es definida positiva y estrictamente decreciente para todo x 6= 0, entonces, V (xk ) tiende a 0, cuando k pues de lo contrario,
V (x) lo cual es una contradiccion con el caracter definido positivo de V (). Por
lo tanto xk 0.
Si la condicion
V (x) 3 (kxk)
se satisface en un conjunto invariante positivo , entonces el sistema es asintoticamente
estable para todo x0 .

Teorema A.12 (Estabilidad exponencial)


(i) Sea un sistema dinamico en tiempo discreto dado por
xk+1 = F (xk )
siendo xk IRn el estado del sistema en el instante k y tal que el origen es un
punto de equilibrio.
(ii) Sea una funcion V : IRn 7 IR+ definida positiva tal que

252

A.2. Estabilidad de sistemas no lineales en tiempo discreto

Existen unas constantes a > 0, b > 0 y > 0

tales que

akxk V (x) bkxk


Existe una constante c > 0 tal que
V (x) ckxk
para todo x Br .
Entonces el origen es un punto de equilibrio exponencialmente estable del sistema. Si
estas condiciones se extienden a IRn entonces es globalmente exponencialmente estable.
En este caso la estabilidad asintotica se deriva del teorema anterior, pues una funcion
del tipo akxk es una funcion K . Lo u
nico que hay que demostrar es que el estado se
puede acotar de la forma
kxk k kx0 kk
siendo > 0 y < 1 .
Para ello basta comprobar que existe una constante [0, 1) tal que
V (F (x)) V (x)
En efecto, haciendo

c
c
V (F (x)) V (x) ckxk = V (x) bkxk 1
b
b

V (x) = V (x)

Para demostrar que [0, 1), observese que


bkxk V (x) V (x) V (F (x)) ckxk
por lo que que c b. Considerando ademas que b y c son constantes positivas, se tiene
que 0 = 1 c/b < 1. A partir de esta propiedad se deriva que
V (xk ) k V (x0 ) bkx0 k k
Dado que akxk k V (xk ), se tiene que
kxk k kx0 kk
siendo
!1

=
5

b
a

= [0, 1)

En (Vidyasagar 1993) se impone que > 1, sin embargo en (Scokaert et al. 1997) demuestra que
basta con considerar > 0. El teorema aqu presentado es una sntesis de ambos resultados.

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

253

Por u
ltimo, hay que comentar que, si bien estos teoremas establecen condiciones
sobre la funcion de Lyapunov que son suficientes para garantizar estabilidad, bajo
ciertas condiciones estas condiciones son tambien necesarias. Estos son los denominados
teoremas inversos de Lyapunov (Khalil 1996, Vidyasagar 1993, Scokaert et al. 1997,
Jiang & Wang 2002).

A.2.4.

Estabilidad de sistemas con restricciones

Sea un sistema
xk+1 = F (xk )
cuyo estado esta sujeto a las restricciones dadas por
xk X
para todo k. Dado que el punto de equilibrio debe ser admisible, por lo que 0 X.
Este tipo de sistemas incluyen el caso de un sistema no autonomo
xk+1 = f (xk , uk )
controlado por la ley de control uk = h(xk ), sujeto a restricciones en las actuaciones
uk U y en los estados xk X. El sistema autonomo resultante de cerrar el bucle es
xk+1 = f (xk , h(xk ))
sujeto a la restriccion
xk X h = {x X : h(x) U } X
El concepto de invariancia es esencial en el analisis de sistemas con restricciones. En
efecto, un sistema autonomo sujeto a restricciones evoluciona de una forma admisible
(es decir cumpliendo las restricciones en todo k) si existe un conjunto invariante positivo
contenido en el conjunto de restricciones X. Por tanto, si x0 X, entonces, por
ser un conjunto invariante positivo, se tiene que xk X para todo k y por lo
tanto la evolucion del sistema es admisible.
La teora de Lyapunov demuestra que si existe una funcion de Lyapunov V (x) tal
que
V (x) 0
para todo x X, entonces todo conjunto
= {x IRn : V (x) }

254

A.2. Estabilidad de sistemas no lineales en tiempo discreto

contenido en X es un invariante positivo del sistema, y por lo tanto para todo estado
inicial x0 el sistema satisface las restricciones. Si por el contrario, x0 X \ ,
entonces la evolucion del sistema podra no ser admisible.
El conjunto de estados que satisfacen las restricciones sera por lo tanto el maximo
conjunto invariante asociado al sistema contenido en X, que no tiene por que ser X.

A.2.5.

Generalizaci
on a sistemas no aut
onomos: funciones de
Lyapunov de control

Los resultados de la teora de Lyapunov permiten el analisis de estabilidad de sistemas autonomos (que incluye a los sistemas no autonomos en bucle cerrado). Dada
la generalidad de la teora de Lyapunov resulta muy interesante trasladar todos estos
resultados al analisis de sistemas no autonomos. Esto se consigue gracias al concepto de funcion de Lyapunov de control introducido por primera vez en (Arstein 1983)
para sistemas continuos. En este trabajo se demuestra que la existencia de una CLF
asociada a un sistema es equivalente a la existencia de un controlador asintoticamente
estabilizable. En (Sontag 1989b), se establece una ley de control general obtenida a
partir de la CLF para sistemas afines en la actuacion. En esta seccion se traslada el
concepto de CLF a sistemas en tiempo discreto.
Sea un sistema no autonomo dado por
xk+1 = f (xk , uk )

siendo xk IRn el estado del sistema y uk IRm las actuaciones aplicadas sobre el
sistema. Sea el origen un punto de equilibrio del sistema, por tanto f (0, 0) = 0.
Las entradas del sistema pueden estar restringidas a un conjunto compacto U que
contiene el origen, de forma que uk U en todo instante k.
El concepto de sistema estable definido para sistemas autonomos, se transforma en
estabilizable para un sistema no autonomo. Un sistema es estabilizable si existe una ley
de control tal que estabilice el sistema en bucle cerrado. As se generalizan las distintas
nociones de estabilidad anteriormente definidas.
El concepto de conjunto invariante positivo asociado al caso autonomo se puede
extender al caso de sistemas no autonomos introduciendo el concepto de conjunto
invariante de control.

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

255

Definici
on A.13 (Conjunto invariante de control) Un conjunto IRn se dice
que es un conjunto invariante de control asociado a un sistema
xk+1 = f (xk , uk )
siendo xk IRn y uk IRm , si para todo x0 , existe una ley de control uk = h(xk )
tal que xk para todo k 0 y ademas las actuaciones son admisibles uk = h(xk )
U.
El concepto de funcion de Lyapunov asociado a un sistema autonomo, se puede extender para el caso de un sistema no autonomo en la denominada funcion de Lyapunov
de control.
Definici
on A.14 (Funci
on de Lyapunov de Control) Una funcion V : IRn 7
IR+ se dice que es una funcion de Lyapunov de control asociada al sistema
xk+1 = f (xk , uk )
siendo xk IRn , uk U IRm , si es definida positiva y satisface que
n

V (x) = mn V (f (x, u)) V (x) 0


uU

para todo x Br .
Notese que el problema de minimizacion implicado en una funcion de control de
Lyapunov no es difcil de resolver, especialmente en el caso de sistemas afines en las
actuaciones o sistemas sin restricciones en las actuaciones.
La principal diferencia es que la funcion V (x) se define en terminos de la actuacion,
de forma que si se satisface
n

mn V (f (x, u)) V (x) 0


uU

entonces existe una actuacion admisible asociada a cada estado xk (es decir, una ley
de control uk = h(xk ) U ) tal que la funcion V (xk+1 ) V (xk ).
Por lo tanto si un sistema tiene una funcion de Lyapunov de control asociada,
entonces el conjunto acotado V (x) contenido en Br es un invariante de control del
sistema y por lo tanto el sistema es estabilizable. Esto permite establecer el siguiente
resultado:
Teorema A.15 Si un sistema no autonomo admite una funcion de Lyapunov de control asociada al sistema en Br , entonces el sistema es estabilizable.

256

A.2. Estabilidad de sistemas no lineales en tiempo discreto

Analogamente se establece el siguiente resultado:


Teorema A.16 Si un sistema no autonomo tiene asociada una funcion de Lyapunov
de control tal que
n

V (x) = mn V (f (x, u)) V (x) (kxk)


uU

para todo x Br , siendo () una funcion K , entonces el sistema es asintoticamente


estabilizable.
Si la condicion anterior se satisface en el conjunto , entonces el sistema sera
asintoticamente estabilizable en una region tal que para todo x excepto
el origen, exista una actuacion admisible u U tal que satisfaga las dos condiciones
siguientes:
(i) V (f (x, u)) V (x) < 0.
(ii) f (x, u) .
es decir, en todos aquellos estados tales que la CLF garantiza convergencia, manteniendo la evolucion del sistema en . El conjunto sera por tanto un conjunto invariante
de control.

A.2.5.1.

Sistema sujeto a restricciones en el estado

Si el sistema no autonomo esta sujeto a restricciones en el estado del tipo xk X,


entonces el sistema sera estabilizable si existe una ley de control admisible tal que
la evolucion del sistema es admisible, es decir, si discurre en el conjunto X en todo
instante. Esta condicion esta relacionada con el concepto de invariancia de control, pues
un sistema evoluciona de forma admisible si existe un conjunto invariante de control
incluido en X.
Por tanto, si el sistema tiene asociada una funcion de Lyapunov de control en X,
entonces todo conjunto X tal que para todo x excepto el origen, exista una
actuacion admisible u U tal que satisfaga las dos condiciones siguientes:
(i) V (f (x, u)) V (x) < 0.
(ii) f (x, u) .

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

257

es un conjunto invariante de control contenido en X en el que, ademas, la CLF es


estrictamente decreciente (en todos los estados salvo el origen). Por lo tanto, para todo
x0 , existe una ley de control admisible tal que estabiliza asintoticamente el sistema
permaneciendo su evolucion en X, y por lo tanto satisfaciendo las restricciones.
Notese que todo conjunto
= {x IRn : V (x) }
contenido en X es un invariante de control del sistema.
Como se puede comprobar, el concepto de la invariancia de control es esencial en
el analisis de sistemas no autonomos sujetos a restricciones. Todos estos conceptos se
desarrollan y extienden en la llamada teora de conjuntos invariantes que se aborda en
la proxima seccion.

A.3.

Teora de conjuntos invariantes

Como se ha podido comprobar, los conceptos tales como conjunto invariante positivo
o conjunto invariante de control son trascendentales en el analisis de la estabilidad de un
sistema dinamico, especialmente cuando el sistema esta sujeto a restricciones. Alrededor
de estos conceptos se ha formado toda una teora que los desarrolla, denominada teora
de conjuntos invariantes.
Existen numerosos trabajos en este campo (Bertsekas 1972, Keerthi & Gilbert 1987,
Bitsoris 1988, Gilbert & Tan 1991), si bien, esta teora ha experimentado un nuevo auge
a raz de los trabajos de Blanchini y otros autores (Blanchini 1994, Kolmanovsky &
Gilbert 1998, Kerrigan & Maciejowski 2000). En (Blanchini 1999) se presenta un compendio de resultados en este campo, tanto en el aspecto teorico como de su aplicacion
al control de sistemas.
En esta seccion se sigue la lnea y notacion utilizada en (Kerrigan & Maciejowski
2000), artculo en el que se hace un balance conciso de los principales resultados en
esta teora y los aplica al analisis de la factibilidad del control predictivo.
En lo que sigue, las definiciones se van a centrar en el caso de sistemas no autonomos.
La traslacion a sistemas autonomos, o bien a sistemas en bucle cerrado, es inmediata.
Sea pues un sistema no autonomo dado por
xk+1 = f (xk , uk )

258

A.3. Teora de conjuntos invariantes

siendo xk IRn el estado del sistema y uk IRm las actuaciones aplicadas sobre el
mismo. Sea el origen un punto de equilibrio del sistema, f (0, 0) = 0. Las entradas del
sistema pueden estar restringidas a un conjunto compacto U IRm y el estado del
sistema a un conjunto compacto X IRn , ambos contiendo el origen. Por tanto
uk U

xk X

para todo k.
Si el sistema estuviese controlado por una ley de control u = h(x), entonces las
restricciones se transforman en xk X h = {x X : h(x) U }.
A partir del concepto de conjunto invariante de control (e invariante positivo), se
extienden estos al analisis de la region en la que un sistema puede ser admisible o
estabilizable. Para ello es necesaria la introduccion de un conjunto basico: el conjunto
a un paso.

Definici
on A.17 (Conjunto a un paso) El conjunto a un paso del conjunto , Q(),
es el conjunto de estados x para los cuales existe una actuacion admisible u U
(que depender
a del estado x) tal que el sistema alcanza el conjunto en un solo paso
f (x, u) .
Q() = {x IRn : u(x) U tal que f (x, u) }

Esta definicion se puede extender a un sistema controlado por una ley de control
u = h(x) de la siguiente forma
Qh () = {x IRn : h(x) U y f (x, h(x)) }

En oposicion al conjunto Q(), esta el conjunto de alcance.

Definici
on A.18 (Conjunto de alcance) El conjunto de alcance del conjunto ,
R(), es el conjunto de estados x a los cuales puede evolucionar el sistema partiendo
de ante una actuacion admisible u U en un solo paso.
R() = {z IRn : x , u U tal que z = f (x, u)}

A partir de la definicion de conjunto a un paso se puede establecer una condicion


necesaria y suficiente para garantizar la invariancia de un conjunto.

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

259

Teorema A.19 (Condici


on geom
etrica de invariancia)
Un conjunto es un invariante de control si y solo si
Q()
Notese que esta condicion tiene una interpretacion geometrica, pues el conjunto
Q() es un conjunto que se calcula por procedimientos geometricos (que requiere la
transformacion de un conjunto a traves de un mapa y proyeccion ortogonal del mismo) y
una vez obtenido, basta con comprobar si contiene al conjunto . Esta interpretacion
geometrica de los conjuntos invariantes es muy u
til y es la base del calculo de los
conjuntos relacionados con la teora de invariantes, que como se vera, estan todos
basados en el conjunto a un paso Q().
El conjunto a un paso satisface las siguientes propiedad de monotona:
Propiedad A.20 Sean dos conjuntos 1 2 , entonces
Q(1 ) Q(2 )
A partir del conjunto a un paso, se pueden analizar propiedades del sistema, tales
como la region en la que este es controlable a una determinada region.
Definici
on A.21 (Conjunto controlable en i pasos) El conjunto controlable en i
pasos Ki (X, ) es el conjunto de estados para los cuales existe una secuencia de actuaciones admisibles tal que conduce el sistema hasta el conjunto X en i pasos con
una trayectoria admisible.
Ki (X, ) = {x0 X : para todo k = 0, , i 1, uk U tal que xk X, y xi }
El conjunto controlable a i pasos, Ki (X, ), nos indica los estados que pueden
alcanzar un determinado conjunto en i pasos con una evolucion admisible mediante
una secuencia de actuaciones admisibles. Este conjunto depende del n
umero de pasos
i y representa una secuencia de conjuntos que posee una serie de propiedades:
Propiedad A.22 La secuencia Ki (X, ) satisface las siguientes propiedades:
El calculo de la secuencia se puede obtener haciendo
Ki+1 (X, ) = Q(Ki (X, )) X
con K0 (X, ) = .

260

A.3. Teora de conjuntos invariantes

El conjunto Ki (X, ) no tiene por que estar incluido en Ki+1 (X, ), salvo en el
caso en que el conjunto sea un conjunto invariante de control. As, si x0
Ki (X, ) \ Ki+1 (X, ), entonces el sistema puede llevarse a en i pasos, pero no
en i + 1.
El conjunto K (X, ) esta finitamente determinado si existe un ndice i tal que
K (X, ) = Ki (X, ). Al menor ndice que satisface esta propiedad i se denomina ndice de determinacion.
Si existe un ndice j tal que Ki+1 (X, ) = Ki (X, ) para todo i j entonces
K (X, ) = Kj (X, ) y ademas el menor j que cumple esta propiedad es el
ndice de determinacion.
Este conjunto se puede extender a sistemas en bucle cerrado controlados por una
ley de control u = h(x), dando lugar a
Kih (X, ) = {x0 X h : xk X h , k = 0, , i 1 y xi }
siendo X h = {x X : h(x) U }.
Este conjunto satisface las propiedades anteriores y ademas
h
Ki+1
(X, ) = Qh (Kih (X, )) X

A la luz de la secuencia de conjuntos controlables se pueden definir dos familias de


conjuntos: la secuencia de conjuntos admisibles y la secuencia de conjuntos estabilizables.
La secuencia de conjuntos admisibles esta relacionado con el conjunto de estados
para los cuales el sistema es capaz de evolucionar satisfaciendo las restricciones. Dado que, como se puso de manifiesto anteriormente, la satisfaccion de las restricciones
esta muy relacionada con los invariantes de control, resulta interesante definir antes el
siguiente conjunto:
Definici
on A.23 (M
aximo conjunto invariante de control) El conjunto C (X)
es el maximo conjunto invariante de control contenido en X si y solo si todo conjunto
invariante de control del sistema satisface que
C (X) X
As, C (X) es el maximo conjunto en el cual existe una ley de control admisible tal
que el sistema puede satisfacer las restricciones en su evolucion. Por lo tanto
Ki (X, ) C (X)

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

261

para todo i, y para todo conjunto X.


El maximo conjunto invariante de control se deriva del denominado conjunto admisible.

Definici
on A.24 (Conjunto admisible en i pasos) El conjunto admisible en i pasos Ci (X) es el conjunto de estados para los cuales existe una secuencia de actuaciones
admisibles tal que la evolucion del sistema permanece en el conjunto X durante los i
instantes siguientes.
Ci (X) = {x0 X : para todo k = 0, , i 1, uk U tal que xk+1 X}
El conjunto Ci (X) representa una secuencia de conjuntos que posee una serie de
propiedades:

Propiedad A.25 La secuencia Ci (X) satisface las siguientes propiedades:


El conjunto Ci (X) = Ki (X, X).
Ci+1 (X) Ci (X), es decir, si un estado es tal que existen i + 1 actuaciones admisibles que hacen la evolucion del sistema admisible, entonces, tambien satisface
que es admisible en i pasos.
Si x0 X \ Ci (X), entonces no existe una ley de control admisible para la cual
la evolucion del sistema sea admisible por i pasos o mas.
El conjunto C (X) es el maximo control invariante contenido en X, es decir, el
conjunto de todos los estados para los cuales existe una ley de control admisible
que garantice la satisfacci
on de las restricciones.
C (X) est
a finitamente determinado si y solo si existe un ndice i tal que
Ci+1 (X) = Ci (X) para todo i i . Entonces Ci (X) = C (X).
Es importante resaltar que los conjuntos Ci (X) no son en general conjuntos invariantes de control, sin embargo esta secuencia de conjuntos tiende a un conjunto que
s es un conjunto invariante de control y ademas es el maximo contenido en X.
Tambien hay que hacer notar que el hecho de que en un determinado estado inicial
x0 exista una trayectoria sea admisible, puede implicar estabilidad en el sentido BIBO
(siempre que el conjunto invariante de control maximo sea una conjunto acotado), pero
no quiere decir que el sistema sea asintoticamente estabilizable.

262

A.3. Teora de conjuntos invariantes

El concepto de sistema estabilizable se refiere a la capacidad que tiene un sistema


de evolucionar en cierto un n
umero de pasos hasta un conjunto en el cual, una vez
alcanzado, la evolucion del sistema queda confinada. Esta propiedad viene caracterizada
en el denominado conjunto estabilizable en i pasos.
Definici
on A.26 (Conjunto estabilizable en i pasos) El conjunto estabilizable en
i pasos al conjunto invariante (positivo o de control) X es el conjunto de estados
Si (X, ) para los cuales existe una secuencia de actuaciones admisibles tal que conduce
el sistema hasta el conjunto en i pasos con una trayectoria admisible.
Si (X, ) = {x0 X : para todo k = 0, , i 1, uk U tal que xk X, y xi }
Como se puede observar, la u
nica diferencia entre el conjunto estabilizable Si (X, )
y controlable Ki (X, ) es la condicion de que el conjunto debe ser un conjunto
invariante. Este hecho confiere una serie de propiedades adicionales a los conjuntos
estabilizables, propiedades que se presentan a continuacion y que son extensamente
utilizadas a lo largo de esta tesis.
Propiedad A.27 La secuencia Si (X, ) satisface las siguientes propiedades:
El calculo de la secuencia se puede obtener haciendo
Si+1 (X, ) = Q(Si (X, )) X
con S0 (X, ) = .
Si (X, ) Si+1 (X, ).
Todo conjunto Si (X, ) es un conjunto invariante de control.
Sean dos conjuntos invariantes de control 1 y 2 tales que 1 2 , entonces
Si (X, 1 ) Si (X, 2 ).
Si (X, Sj (X, )) = Si+j (X, ).
El conjunto S (X, ) est
a finitamente determinado si y solo si existe un ndice

i tal que Si+1 (X, ) = Si (X, ) para todo i i . Adem


as S (X, ) = Si (X, )
para i i .
Este conjunto se puede extender a sistemas en bucle cerrado controlados por una
ley de control u = h(x), dando lugar a
Sih (X, ) = {x0 X h : xk X h , k = 0, , i 1 y xi }

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

263

siendo X h = {x X : h(x) U }. Este conjunto satisface las propiedades anteriores y


en particular
h
Si+1
(X, ) = Qh (Sih (X, )) X
Ademas, todo conjunto Sih (X, ) es un invariante positivo del sistema.
La diferencia entre el conjunto controlable y estabilizable radica en el hecho de que
el conjunto al que evolucionan es un invariante del sistema. Esta diferencia, a priori
trivial, es trascendental en la estabilidad. En efecto, si un estado x0 Si (X, ) entonces
existe una secuencia de actuaciones que conducen el sistema al conjunto y una vez
all, existe una ley de control admisible que lo mantiene en dicho conjunto. Por lo tanto
es estable y converge al conjunto . Si por el contrario, el conjunto no fuese un
invariante de control, entonces, el sistema, una vez alcanzado ese conjunto en i pasos,
puede no ser estabilizable en dicho conjunto y abandonarlo, perdiendo la estabilidad.
Hay que resaltar que el conjunto C (X) es diferente al conjunto S (X, ), de hecho
S (X, ) C (X). As, para todo estado x0 C (X) \ S (X, ) existe una ley de
control admisible que hace que el sistema satisfaga las restricciones, pero no existe una
ley de control que ademas conduzca el sistema al conjunto .
Notese que el conjunto trivial {0} es un invariante del sistema (por ser el origen
un punto de equilibrio). Por lo tanto el conjunto de estados que son asintoticamente
estabilizables al origen en i pasos sera Si (X, {0}).
El conjunto S (X, ) es el maximo conjunto estabilizable al invariante y es
en general distinto al conjunto S (X, {0}) que es el maximo conjunto estabilizable al
origen, es decir, el conjunto de estados que pueden ser conducidos al punto de equilibrio
por una ley de control admisible satisfaciendo las restricciones6 .
A raz de esto, resulta interesante establecer una condicion necesaria y suficiente
sobre bajo la cual S (X, ) = S (X, {0}). Esta condicion se establece en el siguiente
teorema, que es original de esta tesis y cuyo resultado tendra una aplicacion inmediata
sobre el control predictivo.
Teorema A.28 Los conjuntos
S (X, ) = S (X, {0})
si y solo si el conjunto invariante es tal que S (X, {0})

Demostraci
on:
6

Este conjunto es una generalizacion del maximo conjunto estabilizable introducido en (Keerthi
& Gilbert 1987).

264

A.3. Teora de conjuntos invariantes

Necesidad:
Supongase que S (X, ) = S (X, {0}), entonces se tiene que
S (X, ) = S (X, {0})
y por lo tanto S (X, {0}).
Suficiencia:
Supongase que S (X, {0}), entonces:
S (X, ) S (X, {0}) :
Dado que S (X, {0}), se tiene que
S (X, ) S (X, S (X, {0})) = S (X, {0})
S (X, {0}) S (X, ) :
Dado que {0} , entonces de las propiedades del conjunto estabilizable
se tiene que S (X, {0}) S (X, ).
Y por lo tanto se demuestra que S (X, {0}) = S (X, )

Este teorema demuestra que el maximo conjunto estabilizable al origen y a coinciden si y solo si es un conjunto invariante cuyos estados son asintoticamente
estabilizables al origen.
En el corolario siguiente se establecen condiciones bajo las cuales ambos conjuntos
S (X, {0}) y S (X, ) estan finitamente determinados. Este resultado tambien es
original de esta tesis y tiene una aplicacion interesante en el analisis del dominio de
atraccion de los controladores predictivos.

Corolario A.29 Sea Sn (X, {0}) para cierto n, entonces S (X, {0}) est
a finitamente determinado si y solo si S (X, ) tambien lo esta.
Adem
as si el ndice de determinacion de S (X, ) es i , y el de S (X, {0}) es j , se
verifica que
i j i + n

Demostraci
on:

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

265

Si S (X, {0}) esta finitamente determinado entonces S (X, ) tambien lo esta:


Dado que Sn (X, ) S (X, ), por el teorema anterior se infiere que
para todo j j
S (X, ) = S (X, {0}) = Sj (X, {0}) Sj (X, )
De las propiedades de los conjuntos estabilizables se tiene que
Sj (X, ) S (X, )
y por lo tanto, para todo j j , se deduce que Sj (X, ) = S (X, ), y consecuentemente esta finitamente determinado con un ndice i j .
Si S (X, ) esta finitamente determinado entonces S (X, {0}) tambien lo esta:
Para todo i i se tiene que
S (X, {0}) = S (X, ) = Si (X, ) Si+n (X, {0})
dado que Si+n (X, {0}) S (X, {0}), se tiene que
Si+n (X, {0}) = S (X, {0})
para todo i i . Por lo tanto S (X, {0}) esta finitamente determinado con un
ndice de determinacion j i + n.

Este resultado es interesante desde un punto de vista practico, ya que, si el invariante es tal que Sn (X, {0}), que es lo habitual, entonces, S (X, ) esta finitamente determinado si y solo si S (X, {0}) tambien lo esta. Por lo tanto si todo
estado estabilizable a lo es en N pasos (siendo N el ndice de determinacion), entonces sera asintoticamente estabilizable al origen N + n pasos. Esta consecuencia se
utilizara en el analisis del dominio de atraccion del MPC, en la seccion 4.3.1.

A.3.1.

Determinaci
on del conjunto a un paso

Los conjuntos anteriormente presentados caracterizan regiones en las que se verifican


propiedades tan importantes como la posibilidad de que sea controlable o que sea
asintoticamente estabilizable satisfaciendo las restricciones. La posibilidad del calculo
de estos conjuntos es muy interesante pues permite analizar fuera de lnea todas estas

266

A.3. Teora de conjuntos invariantes

propiedades. Ademas ofrece la posibilidad de utilizar estas regiones para el dise


no de
controladores. A lo largo de la tesis, se muestran controladores que aprovechan estos
conjuntos en su dise
no.
La determinacion de estas regiones es un calculo puramente geometrico pues basta
con tener un algoritmo para determinar el conjunto a un paso Q() y otro para la
interseccion de dos conjuntos.
El conjunto Q() viene caracterizado por todo estado x para el cual exista una
actuacion u tal que
f (x, u) IRn
u U IRm
La determinacion del conjunto a un paso puede hacerse trasladando el problema al
espacio de estados extendido
"
#
x
z=
u
as, el conjunto Q() se transforma en el espacio extendido en el conjunto
(

= z IR
h

"
n+m

f (z)
IU z

siendo IU = Im , donde Im es la matriz identidad de dimension m. Entonces, el


conjunto Q() sera la proyeccion de sobre las n primeras componentes de z.
La determinacion de este conjunto no es sencilla en general. Sin embargo, en el caso
de sistemas lineales y los conjuntos X, U y politopicos, existen algoritmos eficientes
para su determinacion exacta (Keerthi & Gilbert 1987, Blanchini 1994, Kerrigan 2000).
Sea el sistema lineal xk+1 = Axk + Buk y sea el conjunto de restricciones sobre las
actuaciones U dado por
Au u bu
siendo Au IRnru m y bu IRnru . Sea el conjunto otro politopo dado por
A x b
siendo A IRnr n y bu IRnr . Entonces en el espacio extendido, el conjunto
viene dado por
#
"
#
"
A A A B
b
z
bu

Au
que es otro politopo. Este conjunto se puede proyectar sobre x utilizando por ejemplo
el algoritmo de eliminacion de Fourier-Motzkin utilizado en (Keerthi & Gilbert 1987,
Kerrigan 2000), lo que da lugar a Q(), que es otro politopo.

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

267

Una vez obtenido este conjunto, la interseccion con otro politopo da como resultado
otro politopo y su determinacion es sencilla. En consecuencia, los conjuntos estabilizables, controlables, y admisibles en sistemas lineales sujetos a restricciones politopicas
son politopos y el procedimiento por el que se obtienen estos es exacto.
En el caso de sistemas no lineales el calculo exacto es enormemente complejo. Sin
embargo en ocasiones es suficiente con la determinacion de conjuntos aproximados a
estos conjuntos de forma que
Qap () Q()
Estos conjuntos aproximados pueden servir para la determinacion de conjuntos invariantes de control de sistemas, pues todo conjunto tal que Q() es un
conjunto invariante de control (si es un invariante).
Un posible procedimiento para el calculo aproximado Qap () puede obtenerse trasladando el procedimiento seguido para sistemas lineales a sistemas no lineales. Para ello
se va a considerar que los conjuntos X, U y son politopos. Esto no es muy restrictivo,
pues es habitual expresar las restricciones de forma politopica. Si no fuese este el caso,
se pueden tomar aproximaciones politopicas no muy conservadoras, siempre que estos
conjuntos sean convexos.
As, el conjunto Q() vendra caracterizado en el espacio extendido por el conjunto

"
n+m

= z IR

A f (z)
AU z

"

b
bu

#)

siendo AU = [, Au ]. El conjunto Q() es la proyeccion de sobre x. Dado que este


conjunto no tiene por que ser un politopo (ni siquiera convexo), la determinacion de
esta proyeccion es difcil.
Teniendo en cuenta que la proyeccion es una operacion monotona, es decir, que
para todo , se tiene que la proyeccion de esta contenida en la proyeccion de
, el conjunto Q() se puede aproximar por la proyeccion de un politopo contenido en
. Notese que la proyeccion de un politopo se puede realizar mediante procedimientos
conocidos.
La aproximacion politopica de se puede determinar en dos pasos: primero se
calcula la envoltura convexa del conjunto . De este modo, el politopo adapta su
forma a la geometra particular de la region, que viene caracterizada por la dinamica
del sistema. Una vez hecho esto, se contrae el politopo obtenido hasta estar contenido
en . Esto se puede hacer afectando el termino independiente de la inecuacion por un
factor (0, 1).
Este procedimiento trata de aprovechar la flexibilidad que ofrecen los politopos,

268

A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado

as como la existencia de algoritmos eficientes para realizar operaciones sobre ellos.


Una restriccion fuerte que impone esta eleccion se deriva del hecho de que un politopo
siempre es convexo. Ademas, es claro tambien que este procedimiento puede no ser de
utilidad en caso de sistemas fuertemente no lineales. El desarrollo de este procedimiento
es una de las futuras lneas de trabajo del autor de esta tesis.

A.4.

An
alisis de la robustez de sistemas no lineales:
estabilidad entrada a estado

Sea un sistema autonomo cuyo comportamiento es incierto y responde a un modelo


dado por
xk+1 = f (xk , wk )
siendo xk IRn es estado del sistema y wk IRq el vector de incertidumbres sobre
el sistema. Estas incertidumbres se suponen acotadas de forma que
wk W = {w IRq : kwk }
para todo k. Se supone que, en ausencia de incertidumbres, el origen es un punto de
equilibrio del sistema, as f (0, 0) = 0.
Si las incertidumbres dependen del estado (w W (x)), de forma que w 0 cuando
x 0, entonces el origen es un punto de equilibrio del sistema incierto. En este caso,
la teora de Lyapunov se puede extender considerando en las condiciones de estabilidad
la peor posible de las situaciones posibles, es decir
V (x) = max {V (f (x, w)) V (x)}
wW (x)

Si existe una funcion de Lyapunov tal que V (x) 0, el sistema sera estable a pesar de
las incertidumbres. Si ademas existe una funcion K , (), tal que V (x) (kxk),
entonces el sistema incierto es asintoticamente estable en el origen.
Sin embargo, en el caso en el que las incertidumbres estan simplemente acotadas, el
origen deja de ser un punto de equilibrio del sistema incierto. Por tanto las definiciones
de estabilidad al origen, as como la teora de Lyapunov asociada, no se pueden aplicar.
La teora de la estabilidad entrada a estado, basada en la de Lyapunov, ofrece un marco
para el analisis de estos sistemas.
La estabilidad entrada a estado fue formulada por primera vez en (Sontag 1989a)
para sistemas en tiempo continuo, pero recientes resultados (Jiang et al. 1999, Jiang
& Wang 2001) han trasladado estos conceptos a sistemas en tiempo discreto. A continuacion se presentan algunas definiciones y resultados interesantes.

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

269

Definici
on A.30 (Estabilidad entrada a estado) (Jiang & Wang 2001) Un sistema xk+1 = f (xk , wk ) es estable entrada a estado si existe una funcion KL , (, ), y
una funcion K , (), tal que la evolucion del sistema satisface que
kxk k (kx0 k, k) + ()
siendo kwk k para todo k.
Esta definicion se puede interpretar como que el sistema en ausencia de incertidumbres es asintoticamente estable. Sin embargo, cuando aparecen incertidumbres
acotadas, el efecto que estas tienen sobre la evolucion del sistema esta acotada, es
decir, que las incertidumbres no hacen divergir al sistema.
Asociada a este concepto de estabilidad existe la definicion de una funcion de Lyapunov entrada a estado.

Definici
on A.31 (Funci
on de Lyapunov entrada a estado) (Jiang & Wang 2001)
Una funcion continua V : IRn 7 IR+ se denomina funcion de Lyapunov entrada a estado si satisface que
Existen unas funciones K , 1 () y 2 (), tales que
1 (kxk) V (x) 2 (kxk) x Br
Existe una funcion K , 3 (), y una funcion K , (), tales que
V (f (x, w)) V (x) 3 (kxk) + () x Br , w B = {kwk }
La segunda propiedad de la definicion es equivalente a decir que existe una funcion
K , (), y una funcion K , 4 (), tales que
V (f (x, w)) V (x) 4 (x) x : kxk (kk)
es decir, que se satisface la condicion de Lyapunov tan solo fuera de una vecindad del
origen.
En el siguiente lema se establece la condicion suficiente para garantizar la estabilidad
entrada a estado de un sistema.
Lema A.32 (Jiang & Wang 2001) Si un sistema xk+1 = f (xk , wk ) admite una funcion
de Lyapunov entrada a estado entonces el sistema es estable entrada a estado.

270

A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado

La demostracion de este lema esta muy relacionada con la definicion de conjunto


invariante robusto.
Definici
on A.33 (Conjunto invariante positivo robusto) Sea un sistema incierto dado por
xk+1 = f (xk , wk )
siendo xk IRn el estado del sistema y wk IRq el vector de incertidumbres, que se
suponen acotadas de forma que wk W .
Un conjunto IRn se dice que es un conjunto invariante positivo robusto del sistema si para todo x0 se tiene que xk para todo k 0 y para toda incertidumbre
wk W .
La demostracion de este lema se basa en probar que una region dada por
b = {x IRn : V (x) b}
contenida en Br , es un invariante robusto del sistema para un cierto grado de incertidumbres = (b).
La demostracion a grandes rasgos es la siguiente: de la definicion de V (x) se tiene
que
V (f (x, w)) V (x) 3 (kxk) + ()
Dado que para todo x se tiene que kxk 21 (V (x)), sustituyendo tenemos que
V (f (x, w)) V (x) 3 21 (V (x)) + ()
Considerando que la funcion 3 21 es una funcion K , de las propiedades de estas
funciones se tiene que existe una funcion K , 4 (), tal que
4 (s) 3 21 (s)
con una funcion K , (), asociada tal que
(s) = s 4 (s) 0
Por tanto, dado que V (x) 0, se tiene que
V (f (x, w)) V (x) 3 21 (V (x)) + ()
V (x) 4 V (x) + ()
V (x) + ()
entonces si V (x) b, se tiene que
V (f (x, w)) (b) + ()

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

271

para garantizar que V (f (x, w)) b se debe satisfacer que


b (b) ()
Del desarrollo anterior, se tiene que la funcion 4 (s) = (id )(s) es una funcion
K , siendo id la funcion identidad. Por lo tanto basta tomar
b (id )1 () = d()
siendo d() una funcion K .
De aqu se pueden obtener 2 conclusiones: la primera es que si un sistema es estable
entrada a estado y la entrada (incertidumbre) tiene una cota , entonces todo conjunto
b = {x IRn : V (x) b} Br
con b d(), es un conjunto invariante robusto del sistema. Ademas el sistema evoluciona hasta quedar confinado en b = d().
Otra conclusion es la lectura inversa, todo conjunto b es invariante robusto para
unas incertidumbres tales que su cota satisfaga
1 (b (b))

A.4.1.

(A.1)

Suavidad implica robustez

Sea un sistema incierto xk+1 = f (xk , wk ) tal que su modelo es suave respecto a la
variacion de los parametros, es decir, que existe una funcion K , (), tal que
kf (x, w) f (x, 0)k (kwk)
Notese que esta condicion se satisface bajo condiciones de diferenciabilidad de la funcion.
Sea el sistema sin incertidumbres xk+1 = f (xk , 0) asintoticamente estable con una
funcion de Lyapunov asociada V (x) tal que
V (f (x, 0)) V (x) (kxk)
siendo () una funcion K . Supongase que V (x) una funcion suave, es decir, que existe
una funcion K () tal que
|V (x + x) V (x)| (kxk)

272

A.4. Analisis de la robustez de sistemas no lineales: estabilidad entrada a estado

para todo kxk .


Entonces, bajo estas hipotesis, el sistema es estable entrada a estado, es decir,
admite cierto grado de incertidumbre. Para ello basta ver que
V (f (x, w)) V (x) = V (f (x, w)) V (f (x, 0)) + V (f (x, 0)) V (x)
(kf (x, w) f (x, 0)k) (kxk)
(kwk) (kxk) (kxk) + ()
y por lo tanto la funcion de Lyapunov es tambien una funcion de Lyapunov entrada a
estado.

A.4.2.

Robustez de sistemas no aut


onomos

El analisis anterior se puede trasladar al concepto de funcion de Lyapunov de control


para al analisis de robustez de sistemas no autonomos. Considerese un sistema dado
por
xk+1 = f (xk , uk , wk )
siendo xk IRn el estado del sistema, uk IRm las actuaciones y wk IRq el vector de
incertidumbres sobre el sistema. Estas incertidumbres se suponen acotadas de forma
que
wk W = {w IRq : kwk }
para todo k. Se supone que, en ausencia de incertidumbres, el origen es un punto de
equilibrio del sistema, as f (0, 0, 0) = 0.
En el caso en que las incertidumbres decaigan con el estado, entonces la funcion de
Lyapunov de control se puede definir como una funcion definida positiva tal que
V (x) = mn

uU

max {V (f (x, u, w)) V (x)} (kxk)

wW (x)

para todo x Br , siendo () una funcion K . Por tanto si un sistema tiene una funcion
de Lyapunov de control asociada, entonces es estabilizable a pesar de las incertidumbres
en una region
b = {x IRn : V (x) b}
En el caso en que las incertidumbres sean meramente acotadas, se puede extender
el concepto de funcion de Lyapunov entrada a estado a una CLF. As, si una funcion
definida positiva satisface que
n

V (x) = mn max{V (f (x, u, w)) V (x)} (kxk)


uU

wW

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

273

para todo x Br \ Bd siendo Bd una vecindad del origen que depende del grado de
incertidumbres del sistema.
En este caso, la existencia de una funcion que satisfaga esta condicion garantiza que
el sistema evoluciona hasta una vecindad del origen en la que la evolucion del sistema
queda acotada. En efecto, sea una region b contenida en Br tal que Bd b . Este
conjunto, b es un invariante robusto del sistema. Entonces para todo x b \Bd , existe
una ley de control que conduce el sistema hacia el origen a pesar de las incertidumbres
(gracias a que V (xk ) es estrictamente decreciente). Por lo tanto, en un determinado
instante, el sistema entra en Bd , donde la condicion puede no satisfacerse, y entonces
la evolucion del sistema podra salir de dicho conjunto. Pero, dado que una vez fuera,
el sistema es forzado a converger, el sistema permanecera acotado en una vecindad del
origen.
Asociado al concepto de conjunto robustamente estabilizable esta el concepto de
conjunto invariante de control robusto.
Definici
on A.34 (Conjunto invariante de control robusto) Sea un sistema incierto dado por
xk+1 = f (xk , uk , wk )
siendo xk IRn el estado del sistema, uk U IRm las actuaciones sobre el sistema
y wk IRq el vector de incertidumbres sobre el sistema que se suponen acotadas de
forma que wk W .
Un conjunto IRn se dice que es un conjunto invariante de control robusto
del sistema si para todo x0 se tiene que que existe una ley de control admisible
uk = h(xk ) U tal que xk para todo k 0 y para toda incertidumbre wk W .
Por ejemplo, el conjunto b anteriormente definido es un conjunto invariante robusto. Alrededor de este concepto, se extiende la teora de conjuntos invariantes al caso
de sistemas con incertidumbres, que es particularmente u
til para el analisis de sistemas
inciertos sujetos a restricciones.

A.5.

Conjuntos invariantes robustos

En el caso en el que un sistema presente incertidumbres, los conjuntos invariantes


deben considerar los efectos de las mismas para garantizar convergencia a un conjunto
y la satisfaccion de las restricciones a pesar de la incertidumbres del sistema. Estos
conjuntos son de especial interes para el analisis de la robustez de sistemas sujetos a

274

A.5. Conjuntos invariantes robustos

restricciones y por ello se utilizan en el desarrollo de captulos de esta tesis dedicados


a la robustez de los controladores predictivos.
Numerosos trabajos tratan sobre este asunto tanto para el analisis como para el
dise
no de controladores, generalmente lineales en tiempo mnimo (Bertsekas 1972,
Blanchini 1994, Mayne & Schroeder 1997). En (Kerrigan 2000, Kerrigan & Maciejowski
2001) se utilizan estos conjuntos para el analisis de la factibilidad robusta de controladores predictivos.
Considerese un sistema incierto dado por
xk+1 = f (xk , uk , wk )
siendo xk IRn el estado del sistema, uk IRm las actuaciones sobre el sistema y
wk IRq el vector de incertidumbres sobre el sistema que se suponen acotadas de
forma que wk W . El sistema esta sujeto a las restricciones
uk U
xk X
Estas restricciones deben satisfacerse a pesar de las incertidumbres.
A continuacion se van a extender las definiciones de los distintos conjuntos previa se refiere al
mente definidos al caso robusto, que se denota por el smbolo . As Q()
conjunto a un paso robusto.

Definici
on A.35 (Conjunto a un paso robusto) El conjunto a un paso robusto

del conjunto , Q(),


es el conjunto de estados x para los cuales existe una actuacion
admisible u U (que depender
a del estado x) tal que el sistema alcanza el conjunto
en un solo paso, es decir, f (x, u, w) ante cualquier incertidumbre w W .

Q()
= {x IRn : u(x) U |f (x, u, w) , w W }

Notese que la u
nica diferencia con el caso no robusto es que se debe satisfacer la
condicion para toda posible incertidumbre. En el caso en que las incertidumbres sean
aditivas, de forma que
xk+1 = f (xk , uk ) + wk
el conjunto robusto a un paso robusto verifica que

Q()
= Q( W )
siendo W la diferencia de Pontryagin de ambos conjuntos. Por lo tanto, en este
caso, el conjunto robusto se calcula a partir del conjunto no robusto.

Apendice A. Estabilidad y robustez de sistemas no lineales en tiempo discreto

275

Definici
on A.36 (Conjunto de alcance robusto) El conjunto de alcance robusto

del conjunto , R(),


es el conjunto de estados x a los cuales puede evolucionar el
sistema partiendo de ante una actuacion admisible u U y ante cualquier incertidumbre w W en un solo paso.

R()
= {z IRn : x , U, w W tal que z = f (x, u, w)}
A partir de la definicion de conjunto a un paso robusto, se extienden inmediatamente
todos los resultados y definiciones no robustas al caso robusto.
Teorema A.37 (Condici
on geom
etrica de invariancia robusta)
Un conjunto es un invariante de control robusto si y solo si

Q()
Definici
on A.38 (Conjunto controlable en i pasos robusto) El conjunto contro i (X, ) es el conjunto de estados para los cuales existe una secuencia
lable en i pasos K
de actuaciones admisibles que dependen del estado, tal que conduce el sistema hasta
el conjunto en i pasos con una trayectoria admisible y ante cualquier secuencia de
incertidumbres posibles.
i (X, ) = {x0 X : uk (xk ) U k = 0, , i | xk X, xi , wk W }
K
i (X, ) presenta propiedades semejantes al caso sin incertidumbres.
El conjunto K
Definici
on A.39 (M
aximo conjunto invariante de control robusto) El conjunto C (X) es el maximo conjunto invariante de control robusto contenido en X si y solo
si todo conjunto invariante de control robusto del sistema satisface que
C (X) X
As, C (X) es el maximo conjunto en el cual existe una ley de control admisible tal
que el sistema puede satisfacer las restricciones en su evolucion ante cualquier posible
incertidumbre.
Definici
on A.40 (Conjunto admisible en i pasos robusto) El conjunto admisible en i pasos robusto Ci (X) es el conjunto de estados para los cuales existe una secuencia de actuaciones admisibles tal que la evolucion del sistema permanece en el conjunto
X durante las i muestras siguientes ante cualquier incertidumbre posible.
Ci (X) = {x0 X : uk (xk ) U | xk + 1 X, wk W, k = 0, , i 1 }

276

A.5. Conjuntos invariantes robustos

Definici
on A.41 (Conjunto estabilizable en i pasos robusto) El conjunto estabilizable en i pasos robusto al conjunto invariante robusto (positivo o de control) ,
Si (X, ), es el conjunto de estados para los cuales existe una secuencia de actuaciones
admisibles tal que conduce el sistema hasta el conjunto en i pasos con una trayectoria
admisible para toda posible incertidumbre.
Si (X, ) = {x0 X : uk (xk ) U k = 0, , i 1 | xk X, xi , wk W }

Todas las propiedades presentadas para los conjuntos invariantes no robustos se


extienden al caso robusto, simplemente sustituyendo los conjuntos invariantes por sus
equivalentes robustos. Estas propiedades son de suma utilidad en el analisis y dise
no
de controladores con incertidumbres.

Ap
endice B
Un ejemplo ilustrativo: el reactor
continuamente agitado (CSTR)
Para ilustrar las estrategias de control MPC que se presentan a lo largo de esta
tesis, se van a aplicar sobre el modelo de un sistema altamente no lineal: un reactor
continuamente agitado de mezcla perfecta (CSTR). Este proceso ha sido extensamente
utilizado en la literatura de control pues re
une las principales caractersticas de la
mayora de los reactores (Seborg, Edgar & Mellichamp 1989, Henson & Seborg 1997,
Magni, De Nicolao, Magnani & Scattolini 2001, De Oliveira Kothare & Morari 2000).
Este sistema esta formado por un tanque en el cual tiene lugar una reaccion exotermica irreversible de descomposicion
AB
El caracter exotermico de la reaccion provoca una continua generacion de calor en el
seno del tanque, el cual es evacuado por medio de una camisa de refrigeracion por la
que circula el refrigerante, cuya temperatura Tc es manipulable.
El objetivo del control es mantener la concentracion de reactivo del producto CA
y la temperatura del tanque T en el punto de funcionamiento determinado. Para ello
se act
ua sobre la temperatura de refrigerante Tc modificando as la temperatura del
tanque y, por lo tanto, la temperatura a la que se realiza la reaccion. En consecuencia
se acelera o decelera la reaccion y por tanto se act
ua sobre la concentracion de reactivo
y de producto.
El modelado de este sistema se puede encontrar en (Seborg et al. 1989, Ollero &
Camacho 1997) y se hace bajo las siguientes hipotesis o simplificaciones:
277

278

(i) Se supone mezcla perfecta, por lo que la concentracion de reactivo en el caudal


de salida CA es igual a la concentracion en el seno del tanque.
(ii) La reaccion responde a una cinetica de primer orden, por lo que la velocidad de
reaccion es rA = kCA siendo k la constante cinetica, que responde a la ley de
Arrhenius

k = k0 exp

E
RT

siendo E la energa de activacion de la reaccion, R la constante de los gases y k0


la constante de frecuencia.
(iii) La temperatura en el reactor es uniforme y ademas tan solo se considera la
transferencia de calor con el refrigerante, despreciandose otros efectos termicos
como la transferencia de calor con el medio o la aportacion de energa interna del
agitador.
(iv) Se supone que el sistema se halla en equilibrio en el nivel de lquido en el tanque,
de forma que el caudal de entrada al tanque de reactivo A es igual al caudal de
salida de producto. En consecuencia el volumen de lquido contenido en el tanque
es constante.

Considerando estas simplificaciones se establecen las ecuaciones de balance de masas


y energa en el reactor, que dan lugar a las ecuaciones diferenciales que modelan este
proceso: (Seborg et al. 1989, Ollero & Camacho 1997):

d CA
q
E
=
(CAf CA ) k0 exp
CA
dt
V
RT

q
(Hr )k0
E
U A
dT
=
(Tf T ) +
exp
CA +
(Tc T )
dt
V
Cp
RT
V Cp

donde CA es la concentracion del reactivo A en el tanque, T es la temperatura en el


mismo y Tc es la temperatura del refrigerante, CAf , Tf y q son la concentracion de A,
la temperatura y el caudal del flujo de entrada, V el volumen de lquido contenido en
el tanque.
Los parametros del sistema son:

Apendice B. Un ejemplo ilustrativo: el reactor continuamente agitado (CSTR)

Par
ametro

Descripci
on

Valor

Densidad del lquido

1000 g/l

Cp

Calor especfico medio

0,239 J/g K

(Hr )

Entalpa de reaccion

5 104 J/mol

E/R

Constante de la formula de Arrhenius

8750 K

k0

Constante de frecuencia

7,2 1010 min1

U A

Coeficiente de transferencia de calor

5 104 J/min K

279

Las condiciones nominales de funcionamiento corresponden a q = 100 l/min, Tf = 350


K, V = 100 l, CAf = 1,0 mol/l, lo que conduce al sistema a un punto de equilibrio
dado por
CAo = 0,5 mol/l, T o = 350 K, Tco = 300 K
La temperatura del refrigerante esta restringida a 280 K Tc 370 K, la temperatura
del reactor a 280 K T 370 K y la concentracion a 0 CA 1mol/l.
Dada la diferencia entre las magnitudes de ambos estados, los estados del modelo
se ha normalizado para evitar posibles problemas de condicionamiento numerico. Los
estados y la entrada considerados han sido:
CA 0,5
0,5
T 350
x2 =
20
Tc 300
u =
20
x1 =

Los parametros que definen el sistema, as como las condiciones nominales de funcionamiento, se han tomado iguales a las utilizadas en (Magni, De Nicolao, Magnani
& Scattolini 2001). El punto de funcionamiento elegido es inestable y ademas, el sistema presenta un comportamiento altamente no lineal como se puede observar en las
respuestas en bucle abierto ante un escalon negativo (figura B.1) y ante un escalon
positivo (figura B.2).
El modelo se ha discretizado con un periodo de muestreo Tm = 0,03. El procedimiento de discretizacion utilizado para la implementacion de los controladores predictivos es
mplcito, de forma que no se han obtenido unas expresiones en forma de ecuaciones en
diferencias. El modelo continuo se ha integrado mediante un algoritmo de integracion
numerica, suficientemente preciso (alto orden y de paso variable). As, partiendo de las
condiciones iniciales dadas por el estado en el instante anterior xk , se integra el modelo
considerando a lo largo del periodo de muestreo la entrada constante u(t) = uk para

280

t [kT m, (k + 1)T m], tal y como hace un mantenedor de orden cero. De esta forma,
el estado obtenido en t = (k + 1)T m es el estado xk+1 .
El modelo discreto linealizado en torno al origen se ha obtenido calculando el jacobiano del modelo aproximado utilizando el metodo de diferencias finitas. El modelo
linealizado obtenido es xk+1 = Axk + Buk siendo

A=

0,9385 0,0443
0,1624

B=

1,1365

0,0013

0,0668

que, como se puede comprobar, la matriz A tiene un autovalor fuera del disco unidad,
por lo que el origen es un punto de equilibrio inestable.
1
0.8

x1

0.6
0.4
0.2
0

50

100

150

200

250

300

350

200

250

300

350

muestras

x2

0.5

1.5

50

100

150
muestras

Figura B.1: Respuesta en escalon del sistema con u = 0,25.


0
0.2

x1

0.4
0.6
0.8
1

50

100

150

200

250

300

350

200

250

300

350

muestras

5
4

x2

3
2
1
0

50

100

150
muestras

Figura B.2: Respuesta en escalon del sistema con u = 0,25.

Ap
endice C
An
alisis de la continuidad del coste

optimo
C.1.

El problema de programaci
on matem
atica en
el MPC

Como es bien sabido, la estrategia de horizonte deslizante con la que se aplica el


control predictivo en bucle cerrado, hace que en cada periodo de muestreo se resuelva
un problema de optimizacion que tiene la forma:
mn
uF
s.a

JN (xk , uF )

(C.1)

x(k + j|k) X j = 0, , N 1
x(k + N |k)
u(k + j|k) U j = 0, , N 1
siendo el funcional a optimizar
JN (xk , uF (k)) =

N
1
X

L(x(k + i|k), u(k + i|k)) + V (x(k + N |k))

i=0

que depende del comportamiento futuro del sistema y de las actuaciones a lo largo del
horizonte de prediccion N .
Las restricciones en el estado en el instante j-esimo x(k + j|k) pueden expresarse
mediante un conjunto de ecuaciones
gjx (x) 0
281

282

C.1. El problema de programacion matematica en el MPC

de forma que para j = 0, , N 1 representan el conjunto X y para j = N representan


el conjunto .
A su vez, las restricciones en las actuaciones se pueden expresar como
g u (u) 0
de forma que estas ecuaciones representan el conjunto U .
Dado que los estados predichos dependen del estado actual xk y de la secuencia de
actuaciones uF , el problema de optimizacion a resolver es en general, un problema de
programacion no lineal con la siguiente forma:
mn
uF
s.a

JN (xk , uF )
G(xk , uF ) 0

donde la funcion G(, ) representa las restricciones sobre el estado y sobre las actuaciones.
Otra forma de plantear este problema de programacion matematica es mediante
la denominada formulacion simultanea (Biegler 1998). En esta, la prediccion de los
estados futuros no se incluye implcitamente en las restricciones y en el funcional del
problema de optimizacion. Para ello se a
nade como variable adicional de optimizacion
la secuencia de estados futuros del sistema. Esta nueva variable debe satisfacer en
cada instante el modelo de prediccion, lo que a
nade nx N restricciones de igualdad
a las restricciones de desigualdad derivadas de las restricciones en el estado y en las
actuaciones. El problema de optimizacion se formula pues de la siguiente forma:
mn
s.a

uF ,xF

JN (xk , xF , uF )

(C.2)

x(k + j + 1|k) = F (x(k + j|k), u(k + j|k)) j = 0, , N


x(k|k) = xk
gjx (x(k + j|k)) 0 j = 0, , N
g u (u(k + j|k)) 0 j = 0, , N 1
La solucion optima de este problema de optimizacion es tambien la solucion optima del
problema no simultaneo (C.1). Esta formulacion del problema rompe la composicion
sucesiva del modelo que es necesaria para la prediccion de x(k + j|k) a partir del estado xk . De esta forma el problema de optimizacion esta mejor condicionado, haciendose
menos sensible a errores o perturbaciones en el estado (Biegler 1998). Ademas es mas
sencilla en su implementacion y ofrece un marco de analisis del problema de optimizacion mas intuitivo.

Apendice C. Analisis de la continuidad del coste optimo

283

La formulacion simultanea responde a un problema de programacion no lineal de


la forma:
mn
s.a

uF ,xF

JN (xk , xF , uF )
H(xk , xF , uF ) = 0
G(xk , xF , uF ) 0

En ambas formulaciones, el problema de optimizacion a resolver depende del estado


en el que se encuentra el sistema, de forma que la solucion optima obtenida es una
funcion del estado uF = uF (xk ). Por tanto el problema de optimizacion es un problema
de programacion parametrica, dependiente del estado del sistema.
Resulta de interes analizar como vara la solucion optima del problema, as como
el coste optimo, al variar el estado del sistema, es decir, al variar el parametro. Este
analisis se enmarca dentro del analisis de sensibilidad de un problema de programacion
no lineal.
Esto es particularmente u
til para el analisis de robustez del controlador MPC que
se desarrolla en el captulo 5, en el cual se demuestra que la suavidad del coste optimo
es condicion suficiente para garantizar robustez del controlador. A continuacion se
presentan algunos resultados de sensibilidad del problema de optimizacion del MPC,
orientados a garantizar suavidad del coste optimo. Primero se establecen condiciones
para imponer la continuidad Lipschitz, que es la forma menos exigente de suavidad y
despues se extiende a condiciones de mayor orden.

C.2.

An
alisis de sensibilidad de un problema NLP

En esta seccion se presentan resultados conocidos sobre la sensibilidad de un problema de programacion matematica no lineal (NLP) que seran de utilidad para el analisis
de la suavidad del coste optimo del MPC. Como se ha comentado, el presente analisis se
centra en la continuidad del coste optimo con respecto a la variacion de los parametros
de los que depende. Un estudio mas extenso y profundo sobre el analisis de sensibilidad
de problemas de programacion matematica puede encontrarse en (Fiacco 1983) y en
sus referencias.
El problema de programacion no lineal parametrica, cuyas variables de decision son
x y que depende del vector de parametros y, se formula de la siguiente forma:

284

C.2. Analisis de sensibilidad de un problema NLP

mn
x
s.a

f (x, y)

(C.3)

h(x, y) = 0
g(x, y) 0
en el cual el vector x IRn es el conjunto de variables respecto al cual se minimiza, y el
vector y IRm es el conjunto de parametros del que depende el problema. La funcion
de coste f (, ) es una funcion escalar, la funcion h(, ) representa las p restricciones de
igualdad y g(, ) representa las k restricciones de desigualdad impuestas al sistema.
La solucion optima de este problema dependera en general de los parametros, por
lo que x = x (y). En consecuencia el coste optimo tambien depende de los parametros
f (y). El conjunto de puntos factibles, es decir que satisfacen las restricciones, depende
tambien del valor de los parametros y se define como
S(y) = {x IRn |h(x, y) = 0, g(x, y) 0}
Definici
on C.1 El conjunto S(y) es uniformemente compacto en una vecindad N (
y)
S
en torno a y si el cierre de
S(y) es un conjunto compacto.
yN (
y)

A continuacion se establece el primer resultado de este analisis, en el que se establecen condiciones para garantizar la continuidad Lipschitz del coste optimo.
Teorema C.2 (Continuidad Lipschitz) (Gauvin & Dubeau 1982)
Sea un problema de programaci
on parametrica (C.3) que satisface las siguientes condiciones:
(i) Sean las funciones que definen el problema f ,g y h funciones C 1 .
(ii) Sea el problema de optimizacion factible para un cierto valor de los par
ametros
y.
(iii) Sea x el optimo del problema para un valor de los par
ametros y, tal que satisface
las condiciones de Magasarian-Fromovitz:
a) Existe una direcci
on d IRn tal que
x gi (
x, y)d < 0
x h(
x, y)d = 0

si

gi (
x, y) = 0

Apendice C. Analisis de la continuidad del coste optimo

285

b) El jacobiano x h(
x, y) es de rango maximo.
(iv) Sea el conjunto factible S(y) uniformemente compacto en una vecindad de y.
Entonces el coste optimo f (y) es localmente Lipschitz en una vecindad de los parametros.

Teorema C.3 (Teorema de sensibilidad)(Fiacco 1983)


Sea un problema de programaci
on parametrica (C.3) que satisface las siguientes condiciones:
1. Sea x la solucion optima del problema para un valor de los par
ametros y = 0.
2. Sean las funciones que definen el problema f (, ),g(, ) y h(, ) funciones C 2
respecto a x y C 1 respecto a y en un vecindad de x = x e y = 0.
3. Sea x una solucion optima tal que satisface las condiciones suficientes de segundo
orden.
4. Sea x una solucion optima tal que satisface la condici
on de independencia lineal:
La matriz formada por

x gi (x , 0)

x h(x , 0)

para todo i tal que gi (x , 0) = 0, es de rango maximo por filas.


5. Las restricciones de desigualdad activas gi (x , 0) = 0 son no degeneradas, es
decir, que sus multiplicadores de Lagrange asociados i son positivos.
Entonces en una vecindad de y = 0, se verifica la condici
on suficiente de segundo

orden en x (y) y ademas la solucion optima, los multiplicadores de Lagrange, as como


el coste optimo son funciones C 1 respecto a los par
ametros y.

Bajo las hipotesis de los dos teoremas anteriores se deduce la continuidad Lipschitz
del coste optimo en una vecindad de los parametros. Las condiciones del teorema
C.2 son menos restrictivas que las del teorema C.3. En primer lugar, las funciones
que definen el problema deben ser C 1 , y ademas el punto optimo debe satisfacer la
condicion de Magasarian-Fromovitz, para la cual la condicion de independencia lineal
es suficiente. Es decir, la condicion de independencia lineal implica la de MagasarianFromovitz, pero no al contrario. Tan solo cuando el problema no presenta restricciones
de igualdad, ambas son equivalentes.


C.3. Continuidad Lipschitz del coste optimo JN
(xk )

286

Ademas resulta complejo determinar cuando el mnimo obtenido para un determinado problema satisface las condiciones suficientes de segundo orden. En (Biegler 1998),
L.T. Biegler afirma que no es frecuente que el hessiano de la lagrangiana en el punto
optimo sea definido positivo, por lo que no se satisfacen dichas condiciones. Aunque
en dicho trabajo se establece que cuando el sistema se encuentra en las proximidades
del punto de equilibrio, los multiplicadores de Lagrange tienden a anularse, haciendose
dicho hessiano definido positivo. Esta propiedad es aprovechada para aumentar la tasa
de convergencia del algoritmo de optimizacion.
El teorema C.3 puede extenderse para demostrar que la solucion optima x (y) es
una funcion C p . Para ello basta imponer que las funciones implicadas en el problema
sean de mayor orden: f (, ),g(, ) y h(, ) sean C p+1 respecto a x y C p respecto a y.

C.3.

Continuidad Lipschitz del coste


optimo JN (xk )

Como se expuso en una seccion anterior, el problema de optimizacion del MPC es


un problema parametrico en el estado del sistema. Por tanto, basandose en los teoremas
anteriores, es posible establecer condiciones bajo las cuales el coste optimo JN (x) es
localmente Lipschitz con el estado. Para ello se va a distinguir dos casos: con y sin
restricciones en el estado.

C.3.1.

MPC con restricciones en el estado

Previamente se va a analizar bajo que condiciones se satisfacen las hipotesis de los


teoremas anteriores. Primero se va a comprobar que el problema de optimizacion en
formulacion simultanea (C.2) verifica la condicion de Magasarian-Fromovitz si y solo
si el problema (C.1) satisface la condicion de independencia lineal.
Sea el modelo de prediccion xk+1 = F (xk , uk ). Se denotara en lo que sigue:
Ai = x F (x(k + i|k), u(k + i|k))
Bi = u F (x(k + i|k), u(k + i|k))
Cix = x g x (x(k + i|k))
Ciu = u g u (u(k + i|k))

As, los jacobianos de las restricciones son:

Apendice C. Analisis de la continuidad del coste optimo

h(xF , uF ) =

287

x h u h

A1

.
.
x h(xF , uF ) =
.

I
..
.

..
.

AN 2

..
.

I
AN 1

B0

.
.
u h(xF , uF ) =
.

B1
..
..
.
.

..
.

..
.

BN 2

g(xF , uF ) =

x g x

Cx
1
..
..
.
.


u g u

..
.

BN 1

..
.

..
.

..
.

..
.

CNx

..
.

..
.

C1u
.. . .
.
.

..
.

CNu

Un vector de direccion d verifica la condicion de Magasarian-Fromovitz si


h(xF , uF )d = 0
ga (xF , uF )d 0
siendo ga el conjunto de restricciones de desigualdad que estan activas. Dividiendo
el vector d = [dx , du ],
h(xF , uF )d = x hdx + u hdu = 0


C.3. Continuidad Lipschitz del coste optimo JN
(xk )

288

y teniendo en cuenta que x h es invertible se tiene que


dx = (x h)1 u hdu = hxu du
La matriz (x h)1 es una matriz triangular inferior y la matriz u h es diagonal,
por lo que hxu sera una matriz triangular inferior dada por:

Bj1
hxu
!
ij =
i1

As Bj1

s=j

siendo

i1
Q
s=j

i<j
i=j
i>j

As = Aj Aj1 Ai

Se puede observar que


hxu
ij =

x(k + i|k)
u(k + j 1|k)

Sustituyendo en g

gd =

x g x hxu
u g u

du =

u g x
u g u

du

La submatriz superior u g x es una matriz triangular superior tal que


u gijx =

g x (x(k + i|k))
u(k + j 1|k)

La submatriz inferior u g u es una submatriz diagonal a bloques tal que


u giju =

g u (u(k + i 1|k))
u(k + j 1|k)

Por tanto para que se satisfaga la condicion de Magasarian-Fromovitz deben verificarse dos condiciones: que el jacobiano u h sea de rango maximo y que las filas
de gd correspondientes a las restricciones activas sean menores que cero para alg
un
vector d. La primera de las condiciones se satisface siempre por ser la submatriz x h

Apendice C. Analisis de la continuidad del coste optimo

289

de rango maximo. La segunda condicion se satisface si y solo si dichas filas de la matriz


g son de rango maximo por filas. Es decir, siempre que las restricciones expresadas
de forma no simultanea, verifiquen la condicion de independencia lineal.
Esta condicion no es muy exigente y es suficiente para la aplicacion de metodos
duales de optimizacion.
Por otro lado, el conjunto de actuaciones factibles asociada a un determinado estado
de la planta U(xk ) debe ser uniformemente compacto. Dado que las actuaciones estan
restringidas a un conjunto compacto U , el conjunto U(xk ) es acotado.

Corolario C.4 Sea el problema de optimizacion del MPC (C.1) tal que el modelo de
predicci
on F (x, u), la funcion de coste de etapa L(x, u), la funcion de coste terminal
V (x) y las funciones que definen los conjuntos de restricciones g x (x), g u (u) son funciones C 1 . Sea un estado actual xk tal que el conjunto de actuaciones factibles es un
conjunto compacto. Sea el optimo de dicho problema tal que satisface la condici
on de
independencia lineal de las restricciones activas. Entonces la funcion de coste optimo
JN (xk ) es localmente Lipschitz en un vecindad de estados en torno a xk .
Corolario C.5 Sea el problema de optimizacion del MPC (C.1) tal que el modelo de
predicci
on F (x, u), la funcion de coste de etapa L(x, u), la funcion de coste terminal V (x) y las funciones que definen los conjuntos de restricciones g x (x), g u (u) son
funciones C 2 . Sea el optimo de dicho problema tal que satisface la condici
on de independencia lineal de las restricciones activas y la condici
on suficiente de segundo orden.
Entonces la funcion de coste optimo JN (xk ) es localmente Lipschitz en un vecindad de
estados en torno a xk .

De estos dos resultados se infiere que si las funciones que definen el problema de
optimizacion son C 1 , entonces es necesario comprobar la compacidad del conjunto de
actuaciones factibles. En el caso en que estas funciones sean C 2 entonces no es necesario
determinar dicha compacidad.

Teorema C.6 Sea el problema de optimizaci


on MPC tal que el coste optimo es localmente Lipschitz en una vecindad de x, para todo estado x en el que el problema tiene
soluci
on factible x XN . Entonces el coste optimo es Lipschitz en todo subconjunto
conexo y compacto de XN .


C.3. Continuidad Lipschitz del coste optimo JN
(xk )

290

Demostraci
on:
Supongase que conjunto XN es un conjunto compacto (Mayne 2001)(si no fuese as,
el resultado es valido para un conjunto compacto incluido en XN , como por ejemplo
r = {x IRn : JN (x) r}). Sea un conjunto convexo tal que XN . Entones
para todo x, y existe una recta de la forma z = x+(y x) con [0, 1]. Sea {zk }
una secuencia de nz puntos de dicha recta con z1 = x y znz = y, tal que zk+1 pertenece
a la vecindad de zk en la que la funcion de coste optimo es localmente Lipschitz con
una constante de Lipschitz Lk .
Entonces se tiene que

|JN (x, uF (x)) JN (y, uF (y))| = |

nz1
X

JN (zk , uF (zk ))

k=1
nz1
X

nz
X

JN (zk , uF (zk ))|

k=2

|JN (zk , uF (zk )) JN (zk+1 , uF (zk+1 ))|

k=1
nX
z 1

Lk kzk+1 zk k

k=1

LJ

nX
z 1

kzk+1 zk k = LJ kx yk

k=1

La constante LJ es la mayor de las constantes de Lipschitz Lk .


En caso de que el conjunto XN sea convexo, este resultado demuestra que es Lipschitz. En caso de que no lo sea, el conjunto XN podra ser no conexo. En este caso
S
considerese que XN = i XNi siendo XNi subconjuntos conexos disjuntos de XN .
El resultado obtenido para conjuntos convexos se puede extender a conjuntos no
convexos conexos: para todo par de puntos x, y pertenecientes a XNi existe una secuencia finita de nv puntos {vk } con v1 = x y vnv = y, tales que todos los puntos de la
recta vk + k (vk+1 vk ) pertenecen a XN y ademas kvk vk+1 k kx yk. Entonces,
se tiene que

|JN (x, uF (x)) JN (y, uF (y))| = |

nv1
X

k=1
nX
v 1

nv
X

JN (vk , uF (vk ))|

k=2

LJi kvk+1 vk k = nv LJi kx yk

k=1

Por tanto JN (x) es Lipschitz en XNi .

JN (vk , uF (vk ))

Apendice C. Analisis de la continuidad del coste optimo

C.3.2.

291

MPC sin restricciones en el estado

Lema C.7 Sea la funcion de coste de etapa L(x, u) Lipschitz en x con una constante
Lc . Sea el modelo del sistema F (x, u) Lipschitz en x con una constante Lf . Sea la
funcion de Lyapunov asociada al controlador local en la regi
on terminal V (x) Lipschitz
en x con una constante Lv . Entonces se verifica que
|JN (x + x, uF ) JN (x, uF )| LJ kxk
siendo
LJ = Lc

LN
f 1
+ Lv LN
f
Lf 1

Demostraci
on:

Sea x(k + j|k) el estado predicho con el modelo tal que xk = x, y sea x(k + j|k) al
estado predicho partiendo de xk = x + x. Dado que el modelo es Lipschitz en x, se
tiene que
k
x(k + j|k) x(k + j|k)k Ljf kxk
Seg
un esto se tiene que
|JN (x + x, uF ) JN (x, uF )| = |

N
1 n
X

L(
x(k + i|k), u(k + i|k))

i=0

L(x(k + i|k), u(k + i|k))

+V (
x(k + N |k)) V (x(k + N |k))|

N
1
X
i=0

Lc Lif kxk + Lv LN
f kxk
!

LN 1
kxk
Lc f
+ Lv LN
f
Lf 1

Teorema C.8 Sea un sistema no lineal controlado por un MPC cuyo dominio de atracci
on es XN . Sea la funcion de coste de etapa L(x, u) Lipschitz respecto a x en el conjunto XN con una constante Lc . Sea el modelo del sistema F (x, u) Lipschitz respecto


C.3. Continuidad Lipschitz del coste optimo JN
(xk )

292

a x en el conjunto XN con una constante Lf . Sea la funcion de Lyapunov asociada al


controlador local en la regi
on terminal V (x) Lipschitz respecto a x en el conjunto XN
con una constante Lv . Entonces el coste optimo es Lipschitz en XN de forma que

|JN (y) JN (x)| LJ ky xk

para todo x, y XN , siendo

1
LN
LJ = Lc f
+ Lv LN
f
Lf 1

Demostraci
on:
Por el principio de optimalidad se tiene que
J (y) < J(y, uF )
para toda secuencia de actuaciones factibles. Teniendo en cuenta que la secuencia
optima en x, uF (x), es factible para todo y XN y considerando el lema anterior, se
demuestra el teorema. Para ello se distinguen dos casos:

a) JN (y) > JN (x)


JN (y) JN (x) JN (y, uF (x)) JN (x, uF (x)) LJ ky xk
b) JN (y) < JN (x)
JN (x) JN (y) JN (x, uF (y)) JN (y, uF (y)) LJ ky xk

y por tanto
|JN (y) JN (x)| LJ ky xk
siendo LJ la constante calculada en el lema anterior.

Apendice C. Analisis de la continuidad del coste optimo

C.4.

293

Continuidad Lipschitz local del coste


optimo
JN (xk ) ante incertidumbres param
etricas

Sea un sistema que responde a un modelo


xk+1 = f (xk , uk , wk )

(C.4)

siendo xk IRn el estado del sistema en el instante k, uk IRm el vector de actuaciones


sobre el sistema y wk IRq las incertidumbres que afectan al sistema. Cada una de
estas se
nales estan confinadas en una serie de restricciones a lo largo del tiempo, de
forma que
xk X
uk U
wk W

(C.5)
(C.6)
(C.7)

El sistema presenta, en ausencia de incertidumbres, un punto de equilibrio en el origen,


por tanto f (0, 0, 0) = 0. En consecuencia, para que el sistema en ausencia de incertidumbres pueda evolucionar al punto de equilibrio, los conjuntos X, U y W deben
contener el vector nulo en su interior.
En lo que sigue se denotara f(xk , uk ) = f (xk , uk , 0) al modelo nominal del sistema,
en ausencia de incertidumbres sobre el sistema. Al estado obtenido con el modelo
nominal, se denotara xk .
El problema de optimizacion del MPC es en este caso un problema NLP parametrico que depende en general del estado actual y del valor del parametro del modelo w
considerado en la prediccion del comportamiento del sistema. Si este se considera constante para toda la prediccion, entonces el coste optimo dependera de JN (xk , wk ). Sin
embargo, si se considera que el parametro del modelo vara a lo largo de la prediccion,
el coste optimo dependera de la realizacion de incertidumbres futuras que afectan al
sistema wF , JN (xk , wF ). En lo que sigue se considera el primer caso.
La solucion optima del MPC en el caso nominal (en ausencia de incertidumbres) es
J (xk , 0). La variacion del coste optimo ante una variacion en wk es un problema de
analisis de sensibilidad y se puede aplicar los resultados del apartado C.2. En particular,
bajo hipotesis semejantes a las obtenidas para la continuidad Lipschitz frente al estado,
el coste optimo es Lipschitz ante variaciones en las incertidumbres.

Corolario C.9 Sea el problema de optimizacion del MPC (C.1) tal que el modelo de
predicci
on F (x, u, w), la funcion de coste de etapa L(x, u), la funcion de coste terminal V (x) y las funciones que definen los conjuntos de restricciones g x (x), g u (u) son

294

C.4. Continuidad Lipschitz local del coste optimo JN


(xk ) ante incertidumbres parametricas

funciones C 1 . Sea un estado actual xk tal que el conjunto de actuaciones factibles es


un conjunto compacto para un conjunto de realizaciones de las incertidumbres en una
vecindad de wk = 0. Sea el optimo del problema MPC con el modelo nominal (wk = 0)
tal que satisface que la condici
on de independencia lineal de las restricciones activas.
Entonces la funcion de coste optimo J (xk , wk ) es localmente Lipschitz en un vecindad
de incertidumbres wk en torno a wk = 0.
|J (xk , wk ) J (xk , 0)| Lw kwk k
Por tanto la variacion del coste optimo por una variacion en las incertidumbres esta acotada, y dicha cota depender
a en general del tama
no del conjunto de incertidumbres W .

Este resultado es de particular interes para el analisis de robustez del MPC ante
incertidumbres no aditivas.

Bibliografa
Alamir, M. & Bornard, G. (1995), Stability of truncated infinite constrained receding
horizon scheme: The gerenal discrete nonlinear case, Automatica 31, 13531356.
Allgower, F., Badgwell, T. A., Qin, J. S., Rawlings, J. B. & Wright, S. J. (1999), Nonlinear model predictive control and moving horizon estimation - an introductory
overview, in P. M. Frank, ed., Advances in Control, Springer, pp. 391449.
Arstein, Z. (1983), Stabilization with relaxed controls, Nonlinear Analysis 7, 1163
1173.
Bellman, R. (1957), Dynamic Programming, Princeton Universuty Press.
Bemporad, A. (1998), Reducing conservativeness in predictive control of constrained
systems with disturbances, in Proceedings of the CDC.
Bemporad, A., Borrelli, F. & Morari, M. (2001), Robust model predictive control:
Piecewise linear explicit solution, in Proceedings of the ECC.
Bemporad, A., Chisci, L. & Mosca, E. (1995), On the stabilizing property of SIORHC,
Automatica 31, 20132015.
Bemporad, A., Morari, M., Dua, V. & Pistikopoulos, E. (2000), The explicit solution
of model predictive control via multiparametric quadratic programming, en Proceedings of the ACC.
Bertsekas, D. M. (1972), Infinite-time reachability of state-space regions by using feedback control, IEEE Transactions on Automatic Control 17, 604612.
Biegler, L. T. (1998), Advances in nonlinear programming concepts for process control,
International Journal of Process Control 8(5-6), 301311.
Bitmead, R. R., Gervers, M. & Wertz, V. (1990), Adaptive optimal control - The thinkings man GPC, Prentice-Hall.
Bitsoris, G. (1988), On the positive invariance of polyhedral sets for discrete-time
systems, Systems & Control Letters 11, 243248.
295

296

BIBLIOGRAFIA

Blanchini, F. (1994), Ultimate boundedness control for discrete-time uncertain system


via set-induced lyapunov functions, IEEE Transactions on Automatic Control
39, 428433.
Blanchini, F. (1999), Set invariance in control, Automatica 35, 17471767.
Boyd, S., Ghaoui, L. E., Feron, E. & Balakrishnan, V. (1994), Linear Matrix Inequalities
in systems and control theory, SIAM.
Bryson, A. & Ho, Y. (1969), Applied Optimal Control, Blaisdell Publishing Company.
Camacho, E. F. & Bordons, C. (1999), Model Predictive Control, 2 edn, Springer-Verlag.
Campo, P. J. & Morari, M. (1987), Robust model predictive control, en Proceedings
of the ACC.
Chen, H. & Allgower, F. (1997), A quasi-infinite horizon nonlinear model predictive
control scheme for stable systems: application to a CSTR, en Proceedings of the
ADCHEM.
Chen, H. & Allgower, F. (1998a), Nonlinear model predictive control scheme with
guaranteed stability, en R.Berber & C. Kravaris, eds, Nonlinear Model Based
Process Control, Kluwer Academic Publisher, pp. 465494.
Chen, H. & Allgower, F. (1998b), A quasi-infinite horizon nonlinear model predictive
control scheme with guaranteed stability, Automatica 34(10), 12051218.
Chisci, L., & Mosca, E. (1994), Stabilizing i-o receding horizon control of CARMA
plants, IEEE Transactions on Automatic Control 39, 614618.
Chisci, L., Lombardi, A. & Mosca, E. (1996), Dual receding horizon control of constrained discrete-time linear systems, European Journal of Control 2, 278285.
Chisci, L., Rossiter, J. A. & Zappa, G. (2001), Systems with persistent disturbances:
predictive control with restricted constraints, Automatica 37, 10191028.
Chisci, L. & Zappa, G. (1999), Robustifying a predictive controller against persistent
disturbances, en Proceedings of the ECC.
Clarke, D. W., Mohtadi, C. & Tuffs, P. S. (1987a), Generalized predictive control. Part
I: The basic algorithms, Automatica 23, 137148.
Clarke, D. W., Mohtadi, C. & Tuffs, P. S. (1987b), Generalized predictive control. Part
II: Extensions and interpretations, Automatica 23, 149160.
Cutler, C. R. & Ramaker, B. L. (1980), Dynamic matrix control- a computer control
algorithm, en Proceedings of Automatic Control Conference.

BIBLIOGRAFIA

297

De Nicolao, G., Magni, L. & Scattolini, R. (1996), On the robustness of receding horizon control with terminal constraints, IEEE Transactions on Automatic Control
41, 451453.
De Nicolao, G., Magni, L. & Scattolini, R. (1998), Stabilizing receding-horizon control
of non-linear time-varying systems, IEEE Transactions on Automatic Control
43, 10301036.
De Nicolao, G., Magni, L. & Scattolini, R. (2000), Stability and robustness of nonlinear receding horizon control, en F.Allgower & A.Zheng, eds, Nonlinear Model
Predictive Control, Birkhauser.
De Oliveira Kothare, S. L. & Morari, M. (2000), Contractive model predictive control for constrained nonlinear systems, IEEE Transactions on Automatic Control
45, 10531071.
Fiacco, A. V. (1983), Introduction to Sensivity and Stability Analysis in Nonlinear
Programming, Vol. 165 of Mathematics in Science and Engineering, Academic
Press.
Garca, C. E. & Morshedi, A. M. (1986), Quadratic programming solution of dynamic
matrix control (QDMC), Chemical Engineering Communications 46, 7387.
Garca, C. E., Prett, D. M. & Morari, M. (1989), Model predictive control: theory and
practice - a survey, Automatica 25, 335348.
Gauvin, J. & Dubeau, F. (1982), Differential properties of the marginal function in
mathematical programming, Mathematical Programming Study 19, 101119.
Genceli, H. & Nikolau, M. (1993), Robust stability analysis of constrained l1 -norm
model predictive control, AIChE Journal 39, 19541965.
Geromel, J. C. & Da Cruz, J. J. (1987), On the robustness of optimal regulators
for nonlinear discrete-time systems, IEEE Transactions on Automatic Control
32, 703710.
Gilbert, E. G. & Tan, K. (1991), Linear systems with state and control constraints: The
theory and application of maximal output admissible sets, IEEE Transactions on
Automatic Control 36, 10081020.
Glad, S. T. (1987), Robustness of nonlinear state feedback - a survey, Automatica
23, 425435.
Gomez Ortega, J. (1994), Navegacion en robots moviles basada en tecnicas de control
predictivo neuronal, PhD thesis, Universidad de Sevilla.
Gomez Ortega, J., Ramrez, D. R., Limon Marruedo, D. & Camacho, E. F. (2001), Genetic algorithms based predictive control for mobile robot navigation in changing
environments, en Proceedings of the ECC.

298

BIBLIOGRAFIA

Hansen, E. (1992), Global optimization using interval analysis, Marcel Dekker, Inc.
Henson, M. A. & Seborg, D. E. (1997), Nonlinear process control, Prentice Hall.
Jadbabaie, A., Yu, J. & Hauser, J. (2001), Unconstrained receding-horizon control of
nonlinear systems, IEEE Transactions on Automatic Control 46(5), 776783.
Jiang, Z.-P. & Wang, Y. (2001), Input-to-state stability for discrete-time nonlinear
systems, Automatica 37, 857869.
Jiang, Z.-P. & Wang, Y. (2002), A converse lyapunov theorem for discrete-time systems
with disturbances, Systems & Control Letters 45, 4958.
Jiang, Z., Sontag, E. & Wang, Y. (1999), Input-to-state stability for discrete-time
nonlinear systems, en Proceedings of the IFAC World Congress.
J.Qin, S. & Badgwell, T. A. (1997), An overview of industrial model predictive control
technology, en Proceedings of the conference on Chemical Process Control.
Keartfort, R. B. (1996), Rigorous global search: continuous problems, Kluwer Academic
Publishers.
Keerthi, S. S. & Gilbert, E. G. (1987), Computation of minimum-time feedback control
laws for discrete-time systems with state-control constraints, IEEE Transactions
on Automatic Control 32, 432435.
Keerthi, S. S. & Gilbert, E. G. (1988), Optimal infinite-horizon feedback laws for a
general class of constrained discrete-time systems: Stability and moving-horizon
approximations, Journal of Optimization Theory and Applications 37, 265293.
Kerrigan, E. C. (2000), Robust Constraint Satisfaction: Invariant Sets and Predictive
Control, PhD thesis, University of Cambridge.
Kerrigan, E. C. & Maciejowski, J. M. (2000), Invariant sets for constrained discrete-time
systems with application to feasibility in model predictive control, en Proceedings
of the CDC.
Kerrigan, E. C. & Maciejowski, J. M. (2001), Robust feasibility in model predictive
control: Necessary and sufficient conditions, en Proceedings of the CDC.
Khalil, H. (1996), Nonlinear Systems, 2 edn, Prentice-Hall.
Kolmanovsky, I. & Gilbert, E. G. (1998), Theory and conmputation of disturbance
invariant sets for discrete-time linear systems, Mathematical Problems in Engineering: Theory, Methods and Applications 4, 317367.
Kothare, M. V., Balakrishnan, V. & Morari, M. (1996), Robust constrained model
predictive control using linear matrix inequalities, Automatica 32, 13611379.

BIBLIOGRAFIA

299

Kwon, W. H. & Pearson, A. E. (1977), A modified quadratic cost problem and feedback
stabilization of a linear system, Automatica 22, 838842.
Lee, E. B. & Markus, L. (1967), Foundations of optimal control theory, Wiley.
Lee, J. H. & Yu, Z. (1997), Worst-case formulations of model predictive control for
systems with bounded parameters, Automatica 33, 763781.

Limon Marruedo, D., Alamo,


T. & Camacho, E. F. (2002a), Enlarging the domain of
attraction of MPC controller using invariant sets, en Proceedings of the IFAC
World Congress.

Limon Marruedo, D., Alamo,


T. & Camacho, E. F. (2002b), Input-to-state stable MPC
for constrained discrete-time nonlinear systems with bounded additive uncertainties, en Proceedings of the CDC.

Limon Marruedo, D., Alamo,


T. & Camacho, E. F. (2002c), Stability analysis of systems with bounded additive uncertainties based on invariant sets: Stability and
feasibility of MPC, en Proceedings of the ACC.

Limon Marruedo, D., Alamo,


T. & Camacho, E. F. (2003), Stable constrained MPC
without terminal constraint, en Proceedings of the ACC, (pendiente de revision).

Limon Marruedo, D., Bravo, J. M., Alamo,


T. & Camacho, E. F. (2002), Robust MPC
of constrained discrete-time nonlinear systems based on uncertain evolution sets:
application to a CSTR model, en Proceedings of the CCA.
Luenberger, D. E. (1989), Programaci
on lineal y no lineal, Addison-Wesley Iberoamericana.
Magni, L., De Nicolao, G., Magnani, L. & Scattolini, R. (2001), A stabilizing modelbased predictive control algorithm for nonlinear systems, Automatica 37, 1351
1362.
Magni, L., Nijmeijer, H. & van der Shaft, A. (2001), A receding-horizon approach to
the nonlinear H control problem, Automatica 37, 429435.
Magni, L. & Sepulchre, R. (1997), Stability margins of nonlinear receding-horizon
control via inverse optimality, Systems & Control Letters 32, 241245.
Marquis, P. & Broustail, J. P. (1988), SMOC, a bridge between state space and model
predictive controllers: application to the automation of a hydrotreating unit, en
Proceedings of the IFAC Workshop on model based predictive control.
Mayne, D. Q. (2000), Nonlinear model predictive control: Challeges and opportunities,
en F.Allgower & A.Zheng, eds, Nonlinear Model Predictive Control, Birkhauser,
pp. 2344.

300

BIBLIOGRAFIA

Mayne, D. Q. (2001), Control of constrained dynamic systems, European Journal of


Control 7, 8799.
Mayne, D. Q. & Michalska, H. (1990), Robust horizon control of nonlinear systems,
IEEE Transactions on Automatic Control 35, 814824.
Mayne, D. Q., Rawlings, J. B., Rao, C. V. & Scokaert, P. O. M. (2000), Constrained
model predictive control: Stability and optimality, Automatica 36, 789814.
Mayne, D. Q. & Schroeder, W. R. (1997), Robust time-optimal control of constrained
linear systems, Automatica 33(12), 21032118.
Michalska, H. & Mayne, D. Q. (1993), Robust receding horizon control of constrained
nonlinear systems, IEEE Transactions on Automatic Control 38(11), 16231633.
Moore, E. (1996), Interval analysis, Prentice Hall.
Morari, M. (1994), Model predictive control: Multivariable control technique of choice
in the 1990s?, en D. Clarke, ed., Advances in Model-Based Predictive Control,
Oxford University Press.
Muske, K. R. (1995), Linear model predictive control of chemical processes, PhD thesis,
The University of Texas at Austin.
Nevistic, V. (1997), Constrained control of nonlinear systems, PhD thesis, Swiss Federal
Institute of technology (ETH), Z
urich (Suiza).
Ollero, P. & Camacho, E. F. (1997), Control e instrumentacion de procesos qumicos,
Editorial Sntesis.
Parisini, T. & Zoppoli, R. (1995), A receding-horizon regulator for nonlinear systems
and a neural approximation, Automatica 31(10), 14431451.
Primbs, J. A., Nevistic, V. & Doyle, J. C. (2000), A receding horizon generalization of pointwise min-norm controllers, IEEE Transactions on Automatic Control
45, 898909.
Propoi, A. I. (1963), Use of linear programming methods for synthesizing sampled-data
automatic systems, Automation and Remote Control 24, 837844.
Ramrez, D. R. (2002), Control Predictivo min-max: analisis, caracterizacion y tecnicas
de implementacion, PhD thesis, Universidad de Sevilla.
Ramrez, D. R., Limon Marruedo, D., Gomez Ortega, J. & Camacho, E. F. (1999a),
Model based predictive control using genetic algorithms: Application to a pilot
plant, en Proceedings of the ECC.
Ramrez, D. R., Limon Marruedo, D., Gomez Ortega, J. & Camacho, E. F. (1999b),
Nonlinear MBPC for mobile robot navigation using genetic algortihms, en Proceedings of the ICRA.

BIBLIOGRAFIA

301

Rawlings, J. B. & Muske, K. R. (1993), Stability of constrained receding horizon


control, IEEE Transactions on Automatic Control 38, 15121516.
Richalet, J., Rault, A., Testud, J. L. & Papon, J. (1978), Model predictive heuristic
control: Applications to industrial processes, Automatica 14, 413428.
Santos, L. O. & Biegler, L. T. (1999), A tool to analyze robust stability for model
predictive controllers, Journal of Process Control 9, 234246.
Scokaert, P. O. M. & Mayne, D. Q. (1998), Min-max feedback model predictive control for constrained linear systems, IEEE Transactions on Automatic Control
43(8), 11361142.
Scokaert, P. O. M., Mayne, D. Q. & Rawlings., J. B. (1999), Suboptimal model predictive control (feasibility implies stability), IEEE Transactions on Automatic
Control 44(3), 648654.
Scokaert, P. O. M., Rawlings, J. B. & Meadows, E. S. (1997), Discrete-time stability with perturbations: Application to model predictive control, Automatica
33(3), 463470.
Seborg, D. E., Edgar, T. & Mellichamp, D. (1989), Process Dynamics and Control,
Wiley.
Sontag, E. D. (1989a), Smooth stabilization implies coprime factorization, IEEE
Transactions on Automatic Control 34, 435443.
Sontag, E. D. (1989b), A universal construction of the Arsteins theorem on nonlinear
stabilization, Systems & Control Letters 13, 117123.
Sznaier, M. & Damborg, M. J. (1987), Suboptimal control of linear systems with state
and control inequality constraints, en Proceedings of the CDC.
Vidyasagar, M. (1993), Nonlinear Systems Theory, 2 edn, Prentice-Hall.
Yang, T. H. & Polak, E. (1993), Moving horizon control of nonlinear systems with
input saturation, disturbances and plant uncertainty, International Journal of
Control 58, 875903.
Zafiriou, E. (1990), Robust model predictive control of systems with hard constraints,
Computers and Chemical Engineering 14, 359371.
Zheng, A. (2000), Some practical issues and possible solutions for nonlinear model
predictive control, en F.Allgower & A.Zheng, eds, Nonlinear Model Predictive
Control, Birkhauser.

También podría gustarte