Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Springer
Indice general
1.
Modelado de sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1. Conceptos en modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.1. Contribuci on al modelado de la mec anica y de la ingenier a el ectrica . . . . . . . . . . . . . . . . . . . . . . 1 1.2. Modelos espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.1. Ecuaci on diferencial ordinaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2.2. Ecuaci on en diferencias nitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3. Ejemplo: Control de rapidez (control crucero) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.4. M as sobre modelado de sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.5. M as ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.5.1. Ejemplo: Circuito RLC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.5.2. Ejemplo: Motor DC y acoplamiento exible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.5.3. Ejemplo: Diagrama de bloques del motor DC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.5.4. Ejemplo: Doble ltro pasa-baja RC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.5.5. Ejemplo: Horno el ectrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Linealizaci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1. Linealizando ecuaciones diferenciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Ejemplo: Veh culo a ereo con impulsadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1. Modelo lineal del veh culo a ereo con impulsadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Ejemplo: manipulador rob otico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1. Ecuaciones de movimiento usando Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2. Representaci on espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3. Linealizaci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4. Ideas adicionales acerca del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Ejemplo: manipulador rob otico - incluyendo la din amica del cuerpo r gido . . . . . . . . . . . . . . . . . . . . . . . 2.4.1. Ecuaciones de movimiento usando Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2. Representaci on espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sistemas Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1. Deniciones b asicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1. Linealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.2. Invariancia en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Respuesta a la condici on inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. Ejemplo: Integrador doble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2. Ejemplo: Oscilador sin amortiguamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Respuesta entrada/salida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1. Ecuaci on de convoluci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2. Respuesta en estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4. Polos, ceros y ganancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5. Otros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 18 20 22 22 23 24 25 27 27 28 30 31 31 31 32 33 34 35 35 36 37 39 41
2.
3.
VI
Indice general
4.
Formas can onicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1. Deniciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1. Invariancia de coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.2. Autovalores/autovectores de una matriz y modos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.3. Teorema de Cayley-Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Forma can onica modal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1. Ejemplo: Sistema de m ultiples entradas y m ultiples salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3. Forma can onica controlable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1. Caso, sistema de una entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2. Caso, sistema de m ultiples entradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4. Forma can onica observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1. Caso, sistema de m ultiples salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5. Representaciones espacio de estados en formas can onicas a partir de funciones de transferencia del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1. Forma can onica controlable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.2. Forma can onica observable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.3. Forma can onica modal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Control por realimentaci on de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1. Ejemplo: Motor DC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.2. Sistema no controlable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.3. Estabilizabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Control por realimentaci on de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1. Estructura del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2. Estabilizaci on por realimentaci on de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.3. Desempe no. Control para la soluci on en estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.4. Especicaciones del dise no del control por realimentaci on de estados . . . . . . . . . . . . . . . . . . . . . 5.2.5. Ejemplo, sistema de balance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3. Control integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1. Ejemplo, control de rapidez con control integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Control por realimentaci on de salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.2. Teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2. Observador de orden completo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2. Control usando estados estimados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3. Observador de orden reducido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1. Compensador controlador/estimador orden-reducido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2. Ejemplo: Motor DC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..................................................................... Estabilidad y desempeno 7.1. Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1. Deniciones b asicas de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.2. Estabilidad seg un Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2. Indices de desempe no . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Control Optimo ............................................................................. 8.1. Problema del Control Optimo ............................................................. 8.1.1. C alculo Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.2. Soluci on del problema de optimizaci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . es) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2. Regulador cuadr atico lineal, (LQR por sus siglas en ingl 8.2.1. Ecuaci on de Riccati Diferencial (DRE, por sus siglas en ingl es) . . . . . . . . . . . . . . . . . . . . . . . . . .
5.
6.
7.
8.
Indice general
VII
8.2.2. Valor del ndice de desempe no . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2.3. Ejemplo integrador doble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3. Regulador cuadr atico lineal en estado estacionario - Horizonte innito . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1. Ecuaci on de Riccati Algebraica (ARE, por sus siglas en ingles) . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.2. Resolviendo la ARE usando el m etodo del autovector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.3. Propiedades de robustez del dise no LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.4. Regla de Bryson para selecci on de matrices Q y R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9. Estimaci on Optima .......................................................................... 9.1. Filtro de Kalman-Bucy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1.1. Teor a de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ptimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1.2. Problema del observador o 9.2. Control LQG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.1. Ejemplo: Aeronave de impulsi on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ptimo LQG podr 9.2.2. Compensador o a resultar en un sistema en lazo cerrado inestable . . . . . . . . . .
119 120 120 121 125 133 133 135 135 136 138 140 141 144 147 147 147 148 150 153 154 154 157 157 165 171 174 176 183 187 190 194
10. T opicos especiales de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1. Problema de Generaci on de Trayectoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.2. Formulaci on alternativa: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.3. Programaci on de ganancias (GAIN SCHEDULING) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2. Filtro de Kalman Extendido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.1. Idea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2.2. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11. Problemas propuestos y resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1. Problemas Cap tulo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Problemas Cap tulo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3. Problemas Cap tulo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4. Problemas Cap tulo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.5. Problemas Cap tulo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6. Problemas Cap tulo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.7. Problemas Cap tulo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.8. Problemas Cap tulo 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.9. Problemas Cap tulo 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.
Ecuaciones de Euler Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 A.1. Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 A.2. Soluci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 Optimizaci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1. Optimizaci on sin restricciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1.1. Ejemplo: Supercies cuadr aticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2. Optimizaci on con restricciones de igualdad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2.1. Multiplicadores de Lagrange y el Hamiltoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.2.2. Ejemplo: Supercie cuadr atica con restricci on lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 203 203 205 205 206
B.
C.
Cap tulo 1
Modelado de sistemas
Un modelo es una representaci on puntual de la din amica del sistema y es usada con la nalidad de responder preguntas mediante an alisis y simulaci on. El modelo que se elige depende del tipo de preguntas que se desee responder, y como tal, existe m as de un tipo de modelo para un mismo sistema din amico, con diferentes niveles de delidad dependiendo del fen omeno de inter es.
1.1.
Conceptos en modelado
on matem atica de un sistema f sico, biol ogico o de informaci on. El modelo permite Un modelo es una representaci razonar en relaci on al sistema y hacer predicciones con respecto a como se comportar a un sistema. En esta parte nuestro inter es es emplear modelos de sistemas din amicos que describan el comportamiento entrada/salida de un sistema y para esto adoptaremos la representaci on en la forma espacio de estados. En su forma m as elemental, un sistema din amico es aquel donde los efectos de las acciones (entradas) no se presentan inmediatamente. Por ejemplo, la rapidez de un veh culo no cambia inmediatamente despu es de presionado el pedal del freno, asi como tampoco un dolor de cabeza desaparece justo despu es de haber tomado una aspirina. Un ejemplo mbito nanciero ser en el a a que los benecios de una inversi on no se perciben a corto plazo, estos se presentan solo a largo plazo (si fue una buena inversi on). Como caracter stica fundamental todos estos ejemplos de sistemas din amicos presentan un comportamiento que evoluciona en el tiempo.
1.1.1.
En mec anica, el estudio de la din amica surgi o al intentar describir el movimiento planetario1 . Uno de los triunfos de la mec anica Newtoniana fue la observaci on de que el movimiento de los planetas pod a ser predecida en base a las posiciones y velocidades actuales de todos los planetas. El estado de un sistema din amico es la colecci on de variables que caracteriza completamente el movimiento de un sistema con el prop osito de predecir el movimiento futuro. Al conjunto de todos los estados posibles se le denomina espacio de estados. Un clase com un de modelos matem aticos para sistemas din amicos es representado por ecuaciones diferenciales ordinarias (ODE, por sus siglas en ingl es). En mec anica una de esas ecuaciones diferenciales es: mq + c(q ) + kq = u, (1.1)
donde u representa el efecto de entradas externas. El modelo (1.1) es llamado ecuaci on diferencial controlada o forzada. Cuando u = 0, el modelo se denomina ecuaci on diferencial libre. Este modelo puede f acilmente representar un sistema din amico tal como el sistema masa-resorte con amortiguamiento, ver Fig. 1.1. La variable q R representa la posici on de la masa m con respecto a su posici on de reposo. Se emplea q para referirse a la derivada con respecto al
1 En base a la observaci on detallada de los planetas realizada por Tycho Brahe y los resultados de Kepler, se encontr o empiricamente que rbitas de los planetas pod las o an ser descritas por elipses.
1 Modelado de sistemas
tiempo de q (velocidad de la masa) y q para representar a la segunda derivada (aceleraci on). Decimos que el sistema es de segunda orden dado que la din amica depende de las dos primeras derivadas de q.
q c (q) m k
La evoluci on de la posici on y la velocidad pueden ser descritos usando ya sea una gr aca en el tiempo o un diagrama del plano de fase, ambos mostrados en Fig. 1.2. La gr aca en el tiempo muestra los valores de los estados individualmente como funci on del tiempo. El diagrama del plano de fase muestra la evoluci on de la velocidad en relaci on a la posici on, permitiendo asi visualizar el campo vectorial del sistema (velocidad denotada por las echas).
2
Velocity q [m/s]
1
Position Velocity
1 0 1 2 0
0.5 0 0.5 1 1
10 Time t [s]
15
El adicionar la entrada u al sistema enriquece al sistema y permite que podamos respondar otras preguntas. Por ejemplo, el efecto que los disturbios externos tienen en la trayectoria del sistema. En el caso de que se pueda manipular la variable de entrada u de una forma controlada, es posible analizar si se puede llevar o no el sistema de un punto a otro en el espacio de estados a trav es de una apropiada selecci on de la entrada. La ingenier a el ectrica present o una visi on diferente del modelado, donde el dise no de amplicadores electr onicos llev o a un enfoque tipo entrada/salida. Un sistema era un dispositivo que transformaba entradas en salidas, como mostrado en Fig. 1.3. La estructura entrada/salida se usa en muchas disciplinas de la ingenier a puesto que permite descomponer un sistema en sus componentes individuales y conectarlos a trav es de sus entradas y salidas. As se puede tomar un sistema complicado como una radio o televisi on y se descompone en piezas tales como el receptor, demodulador, amplicador, parlantes, etc. Cada una de estas piezas tiene un conjunto de entradas y salidas y, a trav es de un dise no apropiado, se pueden interconectar para formar el sistema completo. Cuando la teor a de control emergi o como una disciplina en los 1940s, el abordaje adoptado estaba fuertemente inuenciado por la visi on de la ingenier a el ectrica (entrada/salida). La segunda ola de desarrollo en control se vi o inuenciada por la mec anica, donde se us o la perspectiva espacio de estados. El af an por realizar vuelos espaciales es un ejemplo t pico de como comenzaron a fusionarse estos dos puntos de vista hasta llegar a ser lo que hoy en dia se conoce como la representaci on espacio de estados de sistemas de entrada/salida. Espec camente, uno de los problemas que se rbita de un nave espacial. As present o fue el de controlar la o , el desarrollo de modelos espacio de estados involucraba modicar los modelos mec anicos para incluir sensores y actuadores y utilizar ecuaciones con formas m as generales. Luego el modelo dado por la ecuaci on (1.1) fue reemplazado por:
Input System
Output
(1.2)
donde x es el vector de variables de estado, u es el vector de se nales de control y y es un vector de (se nales) medidas. representa la derivada de x con respecto al tiempo, ahora considerado un vector, y f y h son mapeamienEl t ermino dx dt tos (posiblemente no lineales) de sus argumentos a vectores de dimensi on apropiada. Para sistemas mec anicos, caso sistema masa resorte con amortiguamiento, el estado consiste en la posici on y velocidad de la masa. Para complementar la idea de modelado, cabe destacar que un desarrollo nal en la construcci on del problema con una visi on de la teor a de control viene dado por la inclusi on de disturbios e incertezas del modelo2 . Una observaci on a destacar en el modelado para dise no de sistemas de control es que el sistema por realimentaci on puede ser a menudo analizado y dise nado en base a modelos relativamente simples. La justicaci on se encuentra en la robustez inherente que presentan los sistemas de control por realimentaci on. Sin embargo, otro tipo de uso de modelos requiere de m as complejidad y precisi on. Un ejemplo son las estrategias de control por alimentaci on anticipada, donde rea es la de uno usa el modelo para precalcular las entradas que har an que el sistema responda de cierta forma. Otra a validaci on de sistemas.
1.2.
Esta secci on presentar a dos formas principales de modelos a ser usadas en clase. Ambas hacen uso de nociones de estado, entrada, salida y din amica para describir el comportamiento de un sistema.
1.2.1.
El estado de un sistema es la colecci on de variable que resume el pasado de un sistema con el prop osito de predecir el futuro. Para un sistema f sico el estado est a compuesto de las variables necesarias para el almacenamiento de masa, momento y energia. Una cuesti on importante en el del modelado es el decidir cuan exacta debe ser la representaci on de este almacenamiento. Las variables de estado son representadas por un vector x Rn llamado el vector de estados. Las variables de control son representadas por otro vector u R p , y la se nal medida por el vector y Rq . Un sistema se puede representar entonces por la ecuaci on diferencial: dx = f (x, u), dt y = h(x, u),
2
(1.3)
Disturbios e incertezas del modelo son considerados elementos cr ticos en la teor a de control.
1 Modelado de sistemas
donde f : Rn R p Rn y h : Rn R p Rq son mapeamientos suaves. Un modelo de esta forma se llama modelo espacio de estados. La dimensi on del vector de estados es llamada orden del sistema. El sistema (1.4) es llamado invariante en el tiempo porque f y h no dependen explicitamente del tiempo t ; existen sistemas variantes en el tiempo m as generales donde las funciones si dependen del tiempo. El modelo consiste en dos funciones: la funci on f que provee la variaci on del vector de estados con respecto al tiempo en funci on del estado x y el control u, y la funci on h que provee los valores medido como funci on del estado x y del control u. Un sistema se denomina sistema de espacio de estados lineal si las funciones f y h son lineales en x y u. Un sistema espacio de estados lineal puede ser representado por: dx = Ax + Bu, dt y = Cx + Du, (1.4)
donde A, B, C y D son matrices. Si estas matrices son constantes, entonces se dice que tal sistema es lineal e invariante en el tiempo, LTI por sus siglas en ingl es. La matriz A es llamada matriz din amica o matriz de estados, la matriz B es llamada la matriz de control o matriz de entradas, la matriz C es llamada matriz del sensor o matriz de salidas, y la matriz D es llamada la matriz del t ermino directo. Generalizando la ecuaci on din amica de segundo orden estudiada en mec anica, resulta una ecuaci on de la forma: d n1 y dny + a + ... + ao y = u, n 1 dt n dt n1 donde t es la variable independiente, y(t ) es la variable de (salida) dependiente y u(t ) es la entrada. La notaci on (1.5)
Con la denici on apropiada de A, B, C y D, esta ecuaci on se puede denir en la forma espacio de estados lineal. Una forma a un m as general se obtiene dejando que la salida sea una combinaci on lineal de los estados del sistema, por ejemplo: y = b1 x1 + b2 x2 + ... + bn xn + du. (1.8) Este sistema puede ser modelado en espacio de estados como:
dky dt k denota la k- esima derivada con respecto a tiempo t , a veces denotada por y(k) . La ecuaci on diferencial controlada (1.5) se dice que es un sistema de n- esima orden. Este sistema se puede convertir en la forma espacio estado deniendo: y x1 x2 dy/dt . . . (1.6) = x= . , . . n 2 n 2 xn1 d y/dt xn d n1 y/dt n1
y = x1 .
(1.7)
x1 0 x2 . . d x3 . = 0 dt . . . 0 xn a0
1 ...
0 0 . . 0 . . x+. u, 0 . 1 0 an1 1
(1.9)
y = b1 b2 ... bn x + du. Esta forma particular de un sistema lineal en espacio de estados se llama forma can onica controlable. La ecuaci on (1.4) puede ser dibujada como un diagrama de bloques en la Fig. 1.4. Las dobles lineas indican que cantidades vectoriales (m ultiples variables) son pasadas entre los bloques.
(t ) x
x(t )
+ y(t )
Figura 1.4 Diagrama de bloques de un modelo espacio de estados lineal cont nuo general
1.2.2.
Muchas veces resulta m as natural describir la evoluci on de un sistema en instantes de tiempo discretos en vez de continuamente en el tiempo. Si uno se reere a cada uno de estos tiempos usando un n umero entero k = 0, 1, 2..., entonces se puede hacer la pregunta de c omo cambia el estado para cada k. Como se hizo en el caso de ecuaciones diferenciales ordinarias, se dene como estado a los conjuntos de variable que resumen el pasado del sistema para prop ositos de predicci on de su futuro. Los sistemas que se describen de esa manera se denominan sistemas de tiempo discreto o sistemas discretos. La evoluci on de un sistema discreto se puede escribir de la forma: x[k + 1] = f (x[k], u[k]), y[k] = h(x[k], u[k]), (1.10)
donde x[k] Rn es el estado del sistema en el tiempo k, u[k] R p es la entrada y y[k] Rq es la salida. Como antes, f y h son mapeamientos suaves de dimensi on apropiada. La ecuaci on (1.10) se denomina ecuaci on en diferencias porque nos dice como x[k + 1] diere de x[k]. El estado x[k] puede ser una cantidad escalar o un vector; en caso de ser un vector usaremos x j [k] para denotar al j- esimo elemento del vector x (o j- esimo estado) en el instante de tiempo k. Como en el caso de ecuaciones diferenciales, a menudo las ecuaciones son lineales en el estado y la entrada, en cuyo caso el sistema puede ser descrito por: x[k + 1] = Ax[k] + Bu[k], y[k] = Cx[k] + Du[k], (1.11)
Como en el caso anterior, nos referimos a las matrices A, B, C y D como matriz de la din amica, la matriz de control, matriz del sensor y matriz del t ermino directo.
1 Modelado de sistemas
1.3.
El control de rapidez de un veh culo es un problema com un de sistema por realimentaci on que encontramos en nuestro quehacer diario. El sistema intenta mantener una rapidez constante en la presencia de disturbios. El control compensa el efecto de los disturbios midiendo la rapidez del veh culo y ajustando la v alvula de alimentaci on de combustible apropiadamente (para acelerar o desacelerar). Para modelar el sistema tenemos el diagrama de bloques de la Fig. 1.5. Sea v la rapidez del carro y vr la rapidez (deseada) referencia. El controlador recibe las se nales v y vr y genera la se nal de control u que es enviada al actuador que controla la posici on de la v alvula de alimentaci on. La posici on de la v alvula de alimentaci on a su vez controla el torque desarrollado por el motor, que es transmitido a trav es de los engranajes y las ruedas, generando una fuerza F que mueve el carro. Existen duerzas de disturbios Fd debido a las variaciones en la pendiente de la supercie, la resistencia al deslizamiento de las ruedas y fuerzas aerodin amicas. El control de rapidez tambi en tiene una interface humanom aquina que permite que el conductor establezca y modique la rapidez de referencia. Tambi en existen funciones que desconectan el control de rapidez cuando se presiona el freno.
Para comenzar a desarrollar un modelo matem atico comenzamos con un balance de fuerzas para el cuerpo del vehiculo. Sea v la rapidez del vehiculo, m es la masa total (incluyendo pasajeros), F es la fuerza generada por el motor y Fd es la fuerza de disturbio debido a la aceleraci on de la gravedad, fricci on y arrastre aerodin amico. La ecuaci on de movimiento del carro es: dv m = F Fd . (1.12) dt La fuerza F es generada por el motor, cuyo torque T es proporcional a la raz on de inyecci on de combustible, que es a su vez proporcional a la se nal de control 0 u 1 que controla la posici on de la v alvula de alimentaci on. El torque on: depende de la velocidad angular del motor . El torque puede ser representado por la siguiente expresi T ( ) = Tm (1 (
1)2 ), m
(1.13)
donde Tm es el torque m aximo obtenido a la velocidad angular del motor m . Par ametros tipicos son Tm = 190Nm, m = 420rad/s (para 4000 rpm) y = 0,4. Sea n la raz on de los engranajes y r el radio de la rueda.La velocidad del motor es relacionada a la rapidez a traves de: n = v = n v, (1.14) r y la fuerza F se puede escribir como: nu (1.15) F = T ( ) = n uT (n v). r Valores t picos de n para engranajes del 1 al 5 son 1 = 40, 2 = 25, 3 = 16, 4 = 12 y 5 = 10. La fuerza de disturbio tiene tres componentes principales: Fg , fuerzas debido a la acci on de la gravedad; Fr , fuerza debido a la resistencia al deslizamiento; y Fa , fuerza del arrastre aerodin amico. Si asumimos una pendiente de la supercie , la gravedad dota de la fuerza Fg = mgsin , como mostrado en la Fig. 1.6, donde g = 9,8m/s2 . Un modelo simple de fricci on es:
Fr = mgCr sgn(v), Cr = 0,01 es coeciente de fricci on, sgn es la funci on signo de v (1) o cero si v = 0. Un valor tipico de Cr es 0.01. Finalmente, el arrastre aerodin amico es proporcional al cuadrado de la rapidez: 1 Fa = Cd Av2 , 2 donde = 1,3 kg/m3 es la densidad del aire, Cd = 0,32 es el coeciente de arrastre aerodin amico que depende de la rea frontal del carro. forma del vehiculo, A = 2,4m2 es el a Resumiendo, encontramso que el carro puede ser modelado por: m 1 dv = n uT (n v) + mgCr sgn(v) Cd Av2 mgsin . dt 2
El modelo es un sistema din amico de primer orden. El estado es la rapidez del vehiculo, que tambi en es la salida. La entrada es la se nal u que controla la posici on de la v alvula de alimentaci on, y el disturbio e sla fuerza Fd , que pedende de la pendiente de la supercie. El sistema es no lineal puesto que el torque se dene como en (1.13), el t ermino relacionado a la fuerza gravitacional y el car acter no lineal de la fricci on y arrastre aerodin amico.
Fg
mg
1.4.
El principal objetivo del an alisis de sistemas es la predicci on de la forma en la que el sistema responder a a varias stas respuestas cambian para diferentes valores de los par entradas y como e ametros del sistema. En la ausencia del modelado de sistemas, los ingenieros se ven forzados a construir prototipos del sistema para poder probarlos. Los datos obtenidos en las pruebas de los prototipos f sicos son muy valiosos, sin embargo los costos en tiempo y dinero para obtener estos datos muchas veces no permiten su realizaci on. Adicionalmente, los modelos matem aticos son inherentemente m as exibles que los prototipos f sicos y permiten un r apido renamiento de los dise nos del sistema para optimizar varias medidas de desempe no. En consecuencia, uno de los objetivos del an alisis de sistemas es el establecer un modelo matem atico adecuado que pueda ser usado para obtener informaci on equivalente a la que se podr a conseguir de varios prototipos f sicos diferentes. De esta forma, a un si un prototipo nal es construido para vericar el modelo matem atico, el modelador se ha ahorrado un tiempo y dinero signicativos. Un modelo matem atico es un conjunto de ecuaciones que describe completamente las relaciones entre las variables del sistema. Es usado como una herramienta para desarrollar dise nos y algoritmos de control, y la tarea principal para la que ser a usado tiene implicaciones b asicas para la elecci on del modelo del sistema. De ahi que los modelos del sistema deben ser lo m as simples posible, y cada modelo debe ser desarrollado con alguna aplicaci on espec ca en mente. De hecho, de esta forma se tendr a diferentes modelos construidos para diferentes usos del mismo sistema. En el caso de modelos matem aticos, diferentes tipos de ecuaciones ser an usadas para describir al sistema en sus varias aplicaciones. La Tabla 1 clasica a los modelos del sistema de acuerdo a los cuatro criterios m as comunes: aplicaci on del principio de superposici on, dependencia en coordenadas espaciales as como en el tiempo, variaci on de los par ametros en el tiempo, y continuidad de las variables independientes. En base a estos criterios, los modelos de sistemas din amicos son clasicados como lineales y no lineales, concentrados y distribuidos, estacionarios invariantes en el tiempo o variantes
1 Modelado de sistemas
en el tiempo, cont nuos o discretos, respectivamente. Cada clase de modelo es tambi en caracterizada por el tipo de ecuaci on matem atica empleada en la descripci on del sistema.
Tipo de modelo Nolineal Lineal Distribuido Criterio de clasicaci on Principio de superposici on no aplica Principio de superposici on aplica Variables dependientes son funci on de coordenadas espaciales y el tiempo Concentrado Variables dependientes son independientes de las coordenadas espaciales Variantes en el tiempo Par ametros del modelo varian en el tiempo Estacionario Par ametros del modelo son constantes en el tiempo Cont nuo Variables dependientes denidas sobre rango cont nuo de variables independientes Discreto Variables dependientes denidas solo para distintos valores de variables independientes Cuadro 1.1 Clasicaci on de modelos del sistema Tipo de ecuaci on de modelo Ecuaciones diferenciales no lineales Ecuaciones diferenciales lineales Ecuaciones diferenciales parciales Ecuaciones diferenciales ordinarias Ecuaciones diferenciales con coecientes que varian tiempo Ecuaciones diferenciales con coecientes constantes Ecuaciones diferenciales
1.5. 1.5.1.
Se desea formular un modelo donde el voltaje terminal v sea la entrada y el voltaje en el capacitor vC sea la salida. Las leyes de Ohm y Kirchoff permiten obtener la siguiente relaci on para los voltajes: Ri(t ) + L Para el capacitor se sabe que: CvC (t ) = q(t ) C De estas ecuaciones se puede ver inmediatamente que: = R i 1 vC + 1 v, i L L L 1 v C = i. C La dependencia del tiempo se ha omitido por simplicidad. dvC (t ) dq(t ) = = i(t ). dt dt (1.17) di(t ) + vC (t ) = v(t ). dt (1.16)
(1.18)
R v
i
L vC C
1.5 M as ejemplos
Si las variables de estado y las matrices del sistema son denidas como: R 1 i i x= ,x = , A = 1L L , B = vC v C 0 C x = Ax + Bu.
El sistema puede ser descrito por las dos ecuaciones diferenciales de primer orden acopladas mostradas en (1.18). Reescribiendo las ecuaciones en la forma de espacio de estados: R 1 1 i i (1.19) = 1L L + L v. v C vC 0 0 C 1 L , u = v, 0
Un diagrama de bloques del sistema es mostrado en la Fig. 1.8. Notar que los elementos del vector de estados x, i(t ) y
v( t) i(t) _ i(t) 1 vc ( t ) --C vc ( t )
1 -L
+ _
R -L
1 -L
Figura 1.8 Diagrama de bloques del circuito RLC
vC (t ), son salidas de los dos integradores en el diagrama de bloques. Dado que el voltaje del capacitor es la salida. Una segunda ecuaci on debe ser aumentada a la descripci on del problema, la ecuaci on de salida: y = vC = 0 1 x. (1.20) La combinaci on de (1.19) y (1.20) es llamada el modelo espacio de estados del sistema. La transformada de Laplace de (1.18) lleva al modelo a la forma de funci on de transferencia del sistema: G(s) = 1 Vc (s) = . V (s) LCs2 + RCs + 1 (1.21)
1.5.2.
La Fig. 1.9 muestra un motor DC con acoplamiento exible en el eje entre la inercia de la armadura del motor y la inercia de la carga. R y L son la resistencia y la inductancia del bobinado de la armadura respectivamente, k y b son la constante de rigidez y el coeciente de amortiguamiento (lineal) del acoplamiento exible respectivamente y, Jm y Jl son los momentos de inercia de la armadura del motor y carga respectivamente. El voltaje en la armadura u es la entrada del sistema y la posici on angular de la carga l es la salida. Si las dos inercias son separadas una de la otra y los torques apropiados (Tk , Tb , Ta ) aumentados como mostrado en la Fig. 1.10 (diagramas de cuerpo libre), usando la Segunda Ley de Newton (Momentos de Euler) en ambas inercias se tiene: m ) bm l m , m = Ka i + k(l m ) + b( (1.22) Jm m ) bl l = k(l m ) b( l l , Jl (1.23)
10
i R u Jm k,b Jl L m l
1 Modelado de sistemas
donde Ka es la constante de torque, bm y bl son los factores de fricci on de los rodamientos viscosos del motor y la carga respectivamente.
Ta Jm
Tk , Tb
Tk , Tb
l Jl
Las leyes de Ohm y Kirchhoff aplicadas al circuito el ectrico resulta en: u = Ri + L o di m + ke dt (1.24)
m Ri), = 1 (u ke i (1.25) L donde ke es el coeciente de inducci on del bobinado de la armadura del motor. Un diagrama de bloques puede ser dibujado directamente de las ecuaciones (1.22), (1.23) y (1.25) como mostrado en la Fig. 1.12.
ke bm
_
u + _
x1
1 i -L R
_ Ka + + +
1 m ----Jm
x3
x2
m _
_ b _ _ _ 1 l --Jl bl + l
+ l
x5
x4 y
Figura 1.11 Diagrama de bloques del sistema motor DC con acoplamiento exible
1.5 M as ejemplos
11
l m l = i m
(1.26)
y la ecuaciones de estado pueden ser escritas por inspecci on del diagrama de bloques: R ke 1 x 1 = x1 x3 + u, L L L x 2 = x3 , k b + bm k b Ka x1 x2 x3 + x4 x5 , x 3 = Jm Jm Jm Jm Jm x 4 = x5 , k b k b + bl x 5 = x2 + x3 x4 x5 . Jl Jl Jl Jl En forma matricial la ecuaci on se puede escribir como: R ke 0 0 0 L L 0 0 1 0 0, k b + bm k b Ka Jm Jm Jm Jm Jm 0 0 0 0 1 b k k b + bl 0 Jl Jl Jl Jl y = 0 0 0 1 0 x. Se puede observar que el sistema motor DC con acoplamiento exible es un sistema de orden 5: tiene 5 estados. 1 L 0 x+ u. 0 0 0
(1.27)
(1.28)
(1.29)
ke bm
_
u + _
x1
1 i -L R
_ Ka + + +
1 m ----Jm
x3
x2
m _
_ b _ _ _ 1 l --Jl bl + l
+ l
x5
x4 y
Figura 1.12 Diagrama de bloques del sistema motor DC con acoplamiento exible
12
1 Modelado de sistemas
1.5.3.
El sistema electromec anico anterior tiene un acoplamiento exible entre las dos inercias rotacionales. Si se omite la exibilidad, esto signica que el acoplamiento es completamente r gido, luego las ecuaciones del sistema tendran una apariencia diferente al caso anterior. Un acoplamiento r gido signica que la constante de rigidez del resorte es innita: k . No se puede modicar los elementos de las matrices (1.27, 1.28) directamente debido a que algunos de ellos serian muy grande y esto no puede ser posible. Luego, se debe retornar al conjunto de ecuaciones en (1.22) y (1.23) y modicarlas. Es obvio que las dos posiciones angulares ahora seran iguales m = l = y el momento de inercia y los factores de fricci on de los rodamientos seran la suma: J = Jm + Jl y bb = bm + bl . Las dos ecuaciones se reducen a una sola ecuaci on diferencial de segundo orden: = Ka i bn . J (1.30) Las ecuaciones de la parte el ectrica seran las mismas que antes y el nuevo diagrama de bloques es mostrado en la Fig. 1.13.
ke bb _ u + _
x1
1 i -L R
_ Ka + + 1 -J
x3
x2
El n umero de estados del sistema reducido es 3 y el vector de estados es como sigue: x = x1 x2 x3 y las ecuaciones de estado y salida resultan: R ke L 0 L x = 0 0 1, Ka bb 0 J J y = 0 1 0 x. 1 x+ L 0 u 0
T
= i
(1.31)
(1.32)
1.5.4.
A continuaci on se mostrar a como derivar un modelo espacio de estados de un la red el ectrica pasiva mostrada en la Fig. 1.14. Usando la leyes de Ohm y Kirchhoff en los tres lazos de corriente resulta: 1 (i1 i2 )dt , C1 1 1 0= (i2 i1 )dt + i2 dt + R2 i2 . C1 C2 1 i2 dt eo = C2 ei = R1 i1 +
(1.33)
1.5 M as ejemplos
13
Arreglando las ecuaciones, 1 (i1 i2 )dt , C1 1 1 (i1 i2 )dt R2 i2 = C1 C2 1 eo = i2 dt C2 R1 i1 = ei se llega al diagrama de bloques de la Fig. 1.15.
i2 dt + ,
(1.34)
R1 C1 ei i1
R2 C2 i2 eo i3 = 0
Luego, derivando las ecuaciones de estado directamente del diagrama: 1 C1 1 x 2 = C2 x 1 = 1 1 (u x1 ) (x1 x2 ) , R1 R2 , 1 (x1 x2 ) R2
(1.35)
(1.36)
+ ei = u _ x1
1 ----R1
i1
1 ----C1
+ _ eo = y
x2
1 ----R2
1 ----C2 i2
_ +
Figura 1.15 Diagrama de bloques del sistema en Fig. 1.14
14
1 Modelado de sistemas
1.5.5.
La Fig. 1.16 muestra un horno aislado con calentamiento el ectrico que contiene un producto a ser calentado. La temperatura del aire en el horno es Ts , las temperaturas del producto, material de aislamiento y aire del ambiente son Tg , Tr y Ta respectivamente. Se asume que todas las temperaturas son uniformes. La potencia para calentamiento que provee el elemento el ectrico es q, y las potencias que entran al producto y aislamiento son qg y qr . El calor perdido en el aire del ambiente es qa .
Insulation qg
Tr Ta qa
Product Tg qr Ts
u q
La potencia del elemento el ectrico es controlada de forma lineal tal que: q = ku, (1.37)
donde k es una constante de proporcionalidad. Se asume que el intercambio de energ a de calor es debido a convecci on y por lo tanto las potencias y las temperaturas estan relacionadas por: qg = kg (Ts Tg ), qr = kr (Ts Tr ), (1.38) qa = ka (Tr Ta ), rea y la naturaleza f donde los coecientes-k son par ametros de convecci on dependiendo del a sica de las supercies. Si la capacidad de calentamiento total del aire en el horno, del producto y del aislamiento se denota por Cs , Cg y Cr , se pueden formular las expresiones para la raz on de variaci on de la temperatura de las diferentes partes del sistema. Luego se tiene que: dTs = q qg qr , Cs dt dTg (1.39) Cg = qg , dt dTr Cr = qr qa . dt Un diagrama de bloques del modelo se puede ver en la Fig.1.17. De la ecuaci on diferencial (1.39) se puede determinar la siguiente elecci on de variables de estado: Ts x1 (1.40) x = x2 = Tg Tr x3 Con entrada u, el disturbio v = Ta y la salida y = Tg , se puede obtener el conjunto de ecuaciones del modelo espacio de estados. Realizando la sustotuci on apropiada en (1.39). El resultado es:
1.5 M as ejemplos
15
1 (ku kg (x1 x2 ) kr (x1 x3 )) , Cs 1 x 2 = kg (x1 x2 ), Cg 1 x 3 = (kr (x1 x3 ) ka (x3 v)) , Cr x 1 = o en la forma vectorial-matricial: kg + kr kg kr C C C s s s kg kg 0 x = Cg Cg kr kr + ka 0 Cr Cr y= 010 x k 0 Cs 0 x + 0 u + k v, a 0 Cr
(1.41)
(1.42)
u k
+ _ _
1 ----Cs qg
kg
Ts
+ _ Tg y
1 -----Cg qr
kr
+ _ Tr
+ _
1 ----Cr qa
ka
+ _
Ta
om Fuente: Cap tulos 2 y 3 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr y Richard M. Murray. Fuente: Cap tulo 1 del libro Dynamic Modeling and Control of Engineering Systems, de B. Kulakowski, J. Gardner y L. Shearer. Fuente: Cap tulo 2 del libro Linear Systems Control: Deterministic and Stochastic Methods, de E. Hendricks, O. Jannerup y P. Sorensen.
Cap tulo 2
Linealizaci on
El reemplazar un sistema no lineal por su aproximaci on lineal se denomina linealizaci on. Una motivaci on para la linealizaci on es que el comportamiento din amico de muchos sistemas no lineales dentro de un rango de variables puede ser aproximado a modelos de sistemas lineales. Siendo ese el caso, podemos usar t ecnicas bien desarrolladas de an alisis y s ntesis de sistemas lineales para analizar un sistema no lineal. Cabe destacar que se debe tener mucho cuidado cuando se realiza el an alisis de sistemas linealizados ya que la intenci on no es introducir errores al analizar sistemas no lineales. Consideremos el caso de un sistema (elemento no lineal) con una variable de estado x y una variable de salida y que est an relacionadas por la siguiente ecuaci on: y = h(x), (2.1) donde la funci on h : R R es cont nua y diferenciable; esto es h C 1 . Consideremos xo como el punto de operaci on. Si expandemos h en la serie de Taylor alrededor del punto xo se obtiene: y = h(x), = h(xo ) + dh(xo ) (x xo ) + t erminos de alto orden. dx (2.2)
La linealizaci on de h(x) alrededor del punto xo consiste en reemplazar h por una aproximaci on lineal de la forma: dh(xo ) (x xo ) y = h(xo ) + dx dh(xo ) y = yo + (x xo ), dx donde yo = h(xo ). Si y = y yo y x = x xo . Luego, podemos reescribir (2.3) como: y = dh(xo ) x , dx (2.4)
(2.3)
y sobre un rango peque no de x , la linea (2.3) es una buena aproximaci on de la curva y = h(x) en la vecindad del punto de operaci on xo , ver Fig. 2.1 para una ilustraci on de la aproximaci on. Si h : Rn R, esto es, y = h(x1 , x2 , ..., xn ), que signica que la variable dependiente depende de varias variables se puede aplicar el mismo principio. Sea: T xo = x1o x2o ... xno (2.5) el punto de operaci on. La expansi on de la serie de Taylor de h alrededor del punto de operaci on xo resulta en: y h(xo ) = h(xo )T (x xo ) + t erminos de alto orden, donde: h(xo )T = (2.6)
h x1
x = xo
h x2
...
x = xo
h xn
.
x = xo
(2.7)
17
18
y y y0 dh(x0) (x x0) dx y h(x) y0
2 Linealizaci on
x0
Geom etricamente, la linealizaci on de h alrededor de xo se puede pensar como el localizar un plano tangente sobre una supercie no lineal en el punto de operaci on xo , como mostrado en la Fig. 2.2.
x2 x1 x0
Figura 2.2 Plano tangente como aproximaci on lineal de una funci on de dos variables.
2.1.
Consideremos ahora un sistema din amico modelado por un conjunto de ecuaciones diferenciales no lineales: dx1 dt dx2 dt . . . dxn dt = f1 (x1 , x2 , ..., xn , u1 , u2 , ..., um ), = f2 (x1 , x2 , ..., xn , u1 , u2 , ..., um ), . . . . = fn (x1 , x2 , ..., xn , u1 , u2 , ..., um ). (2.8)
Asumiendo que las funciones fi , i = 1, 2, ..., n, son cont nuas y diferenciables. El conjunto de las ecuaciones arriba mostradas se puede representar en la forma vectorial por: dx = f (x, u). dt (2.9)
19
Sea ue = u1e u2e ... une una entrada constante que fuerza al sistema (2.9) a que se asiente en un estado de equilibrio T xe = x1e x2e ... xne ; esto es, ue y xe satisfacen: f (xe , ue ) = 0. (2.10)
Los estados de equilibrio son llamados tambi en puntos estacionarios, puntos constantes o puntos de reposo, ya que si el sistema se ubica inicialmente en x = xe , luego permanecer a en x(t ) = xe para todo tiempo t 0. Por lo general cuando hablamos de la existencia de un ue = 0 nos referimos a condiciones de operaci on puesto que el sistema necesitar a de esa inyecci on ya sea de fuerza (torque, etc.) para mantenerse en el punto de equilibrio. Cuando analizamos la din amica de un sistema no forzado, hacemos ue = 0 y luego buscamos el punto de equilibrio dx = f (x), es decir la soluci on de f (xe ) = 0. En el caso de un sistema din amico no forzado, xe para el sistema din amico dt ste puede presentar cero, uno o m e as puntos de equilibrio. Para estudiar y analizar el comportamiento local del sistema alrededor del punto de equilibrio (xe , ue ), se supone que tanto x xe como u ue son peque nos, tal que perturbaciones no lineales pueden ser ignoradas en comparaci on a los ngulos peque t erminos lineales (de orden bajo). Este argumento es similar a cuando usamos aproximaciones de a nos, reemplazando sin con y cos con 1 para cerca a cero. Si ahora perturbamos el estado de equilibrio haciendo: x = xe + x , La expansi on de la serie de Taylor resulta en: d x = f (xe + x , ue + u ), dt f f (xe , ue )x + (xe , ue )u + t erminos de alto orden, = f (xe , ue ) + x u donde: f1 f1 ... x1 xn . f f . . . (xe , ue ) = (xe , ue ) = y . . x u f fn n ... x1 xn x = xe , u = ue f1 f1 ... u1 um . . . . . . f fn n ... u1 um x = xe , u = ue u = ue + u . (2.11)
(2.12)
(2.13)
son las matrices Jacobianas de f con respecto a x y u, evaluadas en el punto de equilibrio, (xe , ue ). N otese que: d d d d x = xe + x = x , dt dt dt dt (2.14)
porque xe es una constante. Adicionalmente, f (xe , ue ) = 0, luego deniendo A Rnn y B Rnm de la siguiente forma: f f (xe , ue ) y B = (xe , ue ). (2.15) A= x u Finalmente, eliminando los t erminos de orden alto, se llega a la siguiente aproximaci on lineal: d x = Ax + Bu . dt De forma similar, si las salidas del modelo del sistema no lineal son de la forma: y1 = h1 (x1 , x2 , ..., xn , u1 , u2 , ..., um ), y2 = h2 (x1 , x2 , ..., xn , u1 , u2 , ..., um ), . . . . y p = h p (x1 , x2 , ..., xn , u1 , u2 , ..., um ). (2.16)
(2.17)
20
2 Linealizaci on
o en notaci on vectorial: y = h(x, u), (2.18) entonces la expansi on de la serie de Taylor puede ser usada nuevamente para llevar a la aproximaci on lineal de la ecuaci on de salida del sistema. Sea: y = ye + y , (2.19) luego obtenemos: y = Cx + Du , donde: (2.20)
(2.21)
y,
(2.22)
son las matrices Jacobianas de h con respecto a x y u, evaluadas en el punto de operaci on (xe , ue ). El hecho de que modelos lineales puedan ser usados para estudiar el comportamiento de un sistema no lineal cerca a los puntos de operaci on es bien importante. De hecho, lo que haremos en las pr oximas secciones es aprovechar esta aproximaci on local lineal de un sistema no lineal para dise nar leyes de control por realimentaci on que mantengan al sistema cerca al punto de equilibrio (dise no de din amica). Entonces la realimentaci on se usar a para hacer que las soluciones del sistema controlado permanezcan cerca al punto de operaci on, ver Fig. 2.3.
2 1
x2
2 1
z2
0 1 2
1 2 0
/2
x1
3/2
/2
0 z1
/2
Figura 2.3 Comparaci on entre los planos de fase de un sistema no lineal (a) y su aproximaci on lineal alrededor del origen (b). N otese que cerca al punto de equilibrio en el centro de las gr acas , los planos de fase (y como consecuencia la din amica) es practicamente id entica.
2.2.
Considere el movimiento de el veh culo a ereo, tal como el Harrier jump jet mostrado en la Fig. 2.4. El Harrier es capaz de despegar verticalmente al redireccionar los impulsadores principales hacia abajo y a trav es del uso de
21
impulsadores peque nos de maniobra que est an localizados en sus alas. Un modelo simplicado es mostrado en la Fig. 2.4(b) donde el enfoque del movimiento del veh culo es en un plano vertical que corta las alas del veh culo. Las ecuaciones de movimiento ser an calculadas representando las fuerzas generadas por el impulsador principal y los impulsadores de maniobra como F1 y F2 (actuando a una distancia r por debajo del veh culo).
y F2 x
(a) Harrier jump jet (b) Simplied model
F1
Figura 2.4 (a) Veh culo a ereo con impulsadores y su (b) modelo simplicado donde el impulso neto ha sido descompuesto entre la fuerza horizontal F1 y la fuerza vertical F2 actuando a una distancia r del centro de masa.
Sea (x, y, ) la posici on y la orientaci on del centro de masa del veh culo. Sea m la masa del veh culo, J el momento de inercia, g la constante graviatacional y c el coeciente de amortiguamiento. Luego las ecuaciones de movimiento son: mx = F1 cos F2 sin cx , , my = F1 sin + F2 cos + mg cy (2.23) J = rF1 . Se cree conveniente redenir las entradas tal que el origen sea considerado el punto de equilibrio del sistema con entrada cero. Haciendo u1 = F1 y u2 = F2 mg, las ecuaciones resultan: + u1 cos u2 sin , mx = mgsin cx my = mg(cos 1) cy + u1 sin + u2 cos , = ru1 . J (2.24)
donde z = x y x y
Estas ecuaciones denen el movimiento del veh culo como un conjunto de tres ecuaciones diferenciales acopladas. Describiendo la din amica del veh culo en la forma de espacio de estados: z4 z5 z6 c u1 u2 dz (2.25) = gsinz3 z4 + cosz3 sinz3 , m c m u mu dt 1 2 g(cosz3 1) z5 + sinz3 + cosz3 mu m m 1 r J
T
22
2 Linealizaci on
2.2.1.
y escogiendo las Los puntos de equilibrio del sistema est an dados cuando se hacen cero las velocidades x , y y siguientes variables que satisfagan la siguiente ecuaci on: 0 gsinz3 e , z3 e = e = 0. = g(cosz3 e 1) 0 (2.27)
(2.26)
Entonces, el punto de equilibrio corresponde a la posici on vertical del veh culo. N otese que xe y ye no est an especicados. Esto ocurre porque nosotros podriamos trasladar el sistema a una nueva posici on (m as arriba) y todavia obtener un punto de equilibrio. Calculando la matriz de estados A y la matriz de entrada B: 00 0 1 0 0 0 0 0 0 1 0 f 00 0 0 0 1 , (2.28) A= = z ze 0 0 g c/m 0 0 0 0 0 0 c/m 0 00 0 0 0 0 0 0 0 0 0 f 0 . B= = (2.29) u ze 1/m 0 0 1/m r/J 0 Luego el sistema linealizado del veh culo a ereo con impulsores puede ser escrito como: 00 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 d 0 0 1 0 u x = + x dt 0 0 g c/m 0 0 1/m 0 0 0 0 0 1/m 0 c/m 0 00 0 0 0 0 r/J 0
(2.30)
2.3.
(El siguiente problema ha sido adaptado de Snyder, W.E., Industrial Robots: Computer interfacing and control) En on esquem atica del robot es presentada en la Fig. la Fig. 2.5 se muestra el manipulador rob otico r. Un representaci 2.7 donde se asume una conguraci on de masas concentradas. La masa m1 = 10kg representa la masa del cilindro exterior y se ubica en el centro de masa del mismo. La constante r1 = 1m designa la distancia ja entre el centro de masa del cilindro exterior y el centro de rotaci on. La masa de la carga es representada por m2 = 3kg y se asume que est a localizada al nal de un pist on de un brazo telesc opico cuya distancia radial r es medida a partir del centro
23
ngulo de rotaci de rotaci on. El a on del brazo manipulador es . Se asume que las entradas al sistema son el torque T ngulo y la fuerza traslacional (radial) Fr aplicada en la direcci aplicado en el centro de rotaci on en la direcci on del a on r. Despreciar la masa del cilindro interior. Usar g = 10m/sec2 como aceleraci on de la gravedad.
Construiremos las ecuaciones de movimiento del sistema en base a las ecuaciones de Lagrange y luego las representaremos en la forma espacio de estados.
2.3.1.
Energ a cin etica (T ) Primero encontramos la energia cin etica total del sistema. Para esto denimos las posiciones de la masa m1 : x1 = r1 cos , y1 = r1 sin . N otese que r1 es una constante y que las posiciones de la masa m1 hacen referencia al movimiento traslacional que experimenta el centro de masa del cilindro externo (masa concentrada). Diferenciando x1 y y1 con respecto al tiempo se obtiene: sin , x 1 = r1 cos . y 1 = r1 La magnitud del cuadrado del vector velocidad de la masa m1 es:
2 2 2 2 2 2 v2 1 2 + y1 2 = r1 sin2 + r1 cos2 = r1 . 1=x 1 2 2 2 Entonces, la energia cin etica de la masa m1 es: T1 = 1 2 m1 v1 = 2 m1 r1 . Ahora derivaremos una expresi on para la energia cin etica de la segunda masa. La posici on de la masa m2 es:
x2 = rcos , y2 = rsin . N otese que r no es una constante y que la posiciones de la masa m2 hacen referencia al movimiento traslacional que experimenta la masa de carga (masa concentrada). Diferenciando x2 y y2 con respecto al tiempo se obtiene: sin , x 2 = r cos r cos . y 2 = r sin + r La magnitud del cuadrado del vector velocidad de la masa m2 es: sin )2 + (r cos )2 = r 2. v2 2 2 + y2 2 = (r cos r sin + r 2 + r2 2=x
24
2 Linealizaci on
1 1 2 ). Entonces, la energ a cin etica de la masa m2 es: T2 = 2 m2 v2 2 + r2 2 = 2 m2 (r Energ a potencial (V ) Ahora encontraremos la energ a potencial del sistema. La energ a potencial de la masa m1 es:
Ecuaciones de movimiento La funci on Lagrangiana (o Lagrangiano) para el sistema es: 1 1 2 2 2 ) m1 gr1 sin m2 grsin . + m2 (r L = T V = m1 r1 2 + r2 2 2 El manipulador posee dos grados de libertad (r y ). Luego, tenemos dos ecuaciones de movimiento para el sistema: d dt d dt La primera ecuaci on de movimiento resulta en:
2 + 2m2 rr + gcos (m1 r1 + m2 r) = T . m1 r1 + m2 r2
L L r
L = T L = Fr r
2.3.2.
Deniendo las siguientes variables: , z3 = r, z4 = r z1 = , z2 = . z2 z1 2m2 z2 z3 z4 gcosz1 (m1 r1 + m2 z3 ) + u1 d 2 + m z2 z 2 m1 r1 = 2 3 (2.31) , dt z3 z4 u2 z4 z2 2 z3 gsinz1 + m2 dz f (z, u) dt donde u1 = T y u2 = Fr . Asumiendo que la salida est a dada por la posici on de la masa de carga, v1 = x2 = rcos y v2 = y2 = rsin se tiene: v1 z cosz1 , (2.32) = 3 v2 z3 sinz1 v h(z, u) Luego podemos escribir:
25
2.3.3.
Linealizaci on
Para encontrar el modelo linealizado del manipulador rob otico debemos calcular primero los puntos (estados) de equilibrio. Puntos de equilibrio para entradas nulas Considerando entradas nulas (u1 = 0 y u2 = 0), el modelo del sistema resulta en: z2 gcosz1 (m1 r1 + m2 z3 ) dz 2 + m z2 , (2.33) = m1 r1 2 3 dt z4 gsinz1 e igualando las derivadas a cero, la ecuaci on que debemos resolver es la siguiente: gcosz1 (m1 r1 + m2 z3 ) 0 2 + m z2 , = m1 r1 2 3 0 gsinz1
(2.34)
como no existe un z1 tal que cosz1 = 0 y sinz1 = 0 simult aneamente, esto signica que el modelo no forzado que hemos considerado para el manipulador rob otico no presenta puntos de equilibrio ze ; es decir, el sistema din amico analizado no presenta condiciones iniciales z(0) que tal que el sistema permanecer a en ese punto z(0) indenidamente (coincide esto con lo que te dice tu intuici on?). Punto de operaci on (entradas constantes) Considerando entradas constantes (u1 = u1e y u2 = u2e ) e igualando las derivadas a cero resulta: z2e 0 gcosz1e (m1 r1 + m2 z3e ) + u1e 0 2 + m z2 m1 r1 = 2 3 (2.35) , 0 z4e u2e 0 gsinz1e + m2 Luego, el modelo del sistema ser a linealizado alrededor del punto de equilibrio: ze = z1e 0 z3e 0
T
donde z1e y z3e satisfacen las siguientes ecuaciones: u1e cosz1e = g(m1 r1 + m2 z3e ) . u2e sinz1e = gm2
f1 z1 f1 z3 f2 z1 f2 z3 f3 z1 f3 z3 f4 z1 f4 z3
=0
Calculando los elementos de las matrices Jacobianas del sistema no lineal denido en (2.31) tenemos:
f1 z2 f1 =0 z4 gsinz1 (m1 r1 + m2 z3 ) f2 = 2 + m z2 z2 m1 r1 2 3 2 + m z2 ) (2m z z z gcosz (m r + m z ) + u )(2m z ) m2 (2z2 z4 + gcosz1 )(m1 r1 2 3 2 2 3 4 1 1 1 2 3 1 2 3 f2 = 2 + m z2 )2 z4 (m1 r1 2 3 f3 =0 z2 f3 =0 z4
= gcosz1 = z2 2
f4 z2
(2.36)
f4 =0 z4
26
2 Linealizaci on
y,
f1 u1 f2 u1 f3 u1 f4 u1
f1 u2 f2 1 = 2 + m z2 u m1 r1 2 2 3 f3 =0 u2 f4 =0 u2
=0
=0 =0 (2.37) =0 = 1 m2
h1 = z3 sinz1 z1 h2 = z3 cosz1 z1
y,
h1 h1 =0 = cosz1 z2 z3 h2 h2 =0 = sinz1 z2 z3
h1 =0 z4 , h2 =0 z4
(2.38)
h1 h1 =0 =0 u1 u2 , h2 h2 =0 =0 u1 u2
Evaluando las matrices Jacobianas en (ze , ue ) tenemos: 0 1 0 ue2 (m1 r1 + m2 z3e ) m2 u1e 0 f 2 2 2 + m z2 )(m r + m z ) (m1 r1 1 1 2 3e 2 3e (ze , ue ) = m2 (m1 r1 + m2 z3e ) x 0 0 0 u1e 2z3e 0 m1 r1 + m2 z3e 0 1 1 0 2 + m z2 f m1 r1 2 3e (ze , ue ) = , u 0 0 1 0 m2 ue2 u1e z3 0 0 h gm2 g(m1 r1 + m2 z3e ) , (ze , ue ) = ue2 u1e x 0 0 z3e g(m1 r1 + m2 z3e ) gm2 0
(2.39)
0 , 1 0
(2.40)
(2.41)
(2.42)
(2.43)
Modelo lineal en la forma espacio de estados Usando las matrices Jacobianas arriba mencionadas y deniedo:
h h (ze , ue ) = C y (ze , ue ) = D z u Luego las matrices correspondientes para la representaci on espacio de estados lineal alrededor del punto de operaci on (ze , ue ) son:
2.4 Ejemplo: manipulador rob otico - incluyendo la din amica del cuerpo r gido
27
y:
0 , 1 0
0 1 2 + m z2 m1 r1 2 3e B= 0 0
m2
0 , 0 1
(2.44)
u1e ue2 0 0 gm2 g(m1 r1 + m2 z3e ) , D = 0 0 , C= u1e ue2 00 z3e 0 0 g(m1 r1 + m2 z3e ) gm2 z3
(2.45)
0 1 0 1 0 0 1 ue2 (m1 r1 + m2 z3e ) m2 u1e 0 0 0 2 2 dz 2 2 2 + m z2 )(m r + m z ) (m1 r1 2 3e 1 1 2 3e + m1 r1 + m2 z3e = m2 (m1 r1 + m2 z3e ) z 0 0 dt 0 0 0 1 u1e 1 2z3e 0 0 0 m1 r1 + m2 z3e m2 ue2 u1e z3 0 0 00 gm2 g(m1 r1 + m2 z3e ) z v = . + 0 0 u ue2 u1e 0 0 z3e g(m1 r1 + m2 z3e ) gm2
(2.46)
(2.47)
2.3.4.
Si asumimos que r = cte = r1 y que el objetivo es mantener = /2, entonces el problema del manipulador rob otico se puede interpretar como un p endulo invertido con masa m1 + m2 . Qu e pasa cuando = /2 y r = cte > r1 , qu e sistema tenemos?. Otra simplicaci on del modelo se puede dar cuando se considera = 0 y r variable, en ese caso podemos hablar de traslaci on de la masa de carga en la direcci on horizontal.
2.4.
Ejemplo: manipulador rob otico - incluyendo la din amica del cuerpo r gido
(El siguiente problema ha sido adaptado de Snyder, W.E., Industrial Robots: Computer interfacing and control) En on esquem atica del robot es presentada en la Fig. la Fig. 2.7 se muestra el manipulador rob otico r. Un representaci 2.8. La masa mo = 10kg representa la masa del cilindro exterior y se ubica en el centro de masa del cilindro exterior, Io o representa el momento de inercia del cilindro exterior con respecto a su centro de masa. La constante r2 = 1m designa la distancia ja entre el centro de masa del cilindro exterior y el centro de rotaci on. La masa de la carga es representada por ml = 3kg y se asume que est a localizada al nal de un pist on de un brazo telescopico cuya distancia radial r es ngulo de rotaci media a partir del centro de rotaci on. El a on del brazo manipulador es . El cilindro interno del brazo telesc opico tiene masa mi = 2kg y momento de inercia igual a Ii . Asuma que las entradas al sistema son el torque T ngulo y la fuerza traslacional (radial) Fr aplicada en la direcci aplicado en el centro de rotaci on en la direcci on del a on r. Usar g = 9,8m/sec2 como aceleraci on de la gravedad. Construiremos las ecuaciones de movimiento del sistema en base a las ecuaciones de Lagrange y luego las representaremos en la forma espacio de estados.
28
2 Linealizaci on
ml
Ii , mi , ro
Io , mo , ro
2.4.1.
Energ a cin etica Primero encontramos la energia cin etica total del sistema. La energia cin etica traslacional es obtenida deniendo las posiciones de los centros de masa de los cilindros externo e interno con masas mo y mi , y la posici on de la masa de carga ml : 1 ro cos , xo = 2
1 ro sin . yo = 2
xi = (r 1 2 ro )cos ,
1 yi = (r 2 ro )sin .
xl = rcos , yl = rsin .
N otese que ro es una constante, mientras que r no lo es. Diferenciando x e y con respecto al tiempo se obtiene: x o = ro 1 2 sin , 1 y o = ro cos .
2 1 1 r cos 2 r sin + 1 x i = 2 2 ro sin , 1 1 1 y i = r sin + r cos ro cos . 2 2 2
La magnitud del cuadrado del vector velocidad de los centros de masa de los cilindros exterior e interior, y de la masa de la carga es: r2 2 2 r2 2 2 2 1 2 v2 o 2 + yo 2 = o sin + o cos = ro . o=x 4 4 4 1 1 2 sin )2 + 1 (r cos )2 = 1 r 2. v2 i +y 2 cos + (ro r) sin (ro r) 2 + (ro r)2 i =x i = (r 4 4 4 4 sin )2 + (r cos )2 = r 2. sin + r 2 + r2 v2 l 2 + y l 2 = (r cos r l =x Entonces, la energia cin etica traslacional de los cilindros y masa de carga respectivamente es: 11 1 2 2 mo (ro Tto = mo v2 ). o= 2 24 1 11 2 ). Tti = mi v2 mi (r 2 + (ro r)2 i = 2 24
2.4 Ejemplo: manipulador rob otico - incluyendo la din amica del cuerpo r gido
29
1 1 2 ). Ttl = ml v2 2 + r2 l = ml (r 2 2 Considerando que los cilindros son cuerpos r gidos, debemos adicionar su energ a cin etica rotacional a la energia cin etica total del sistema. Este no es el caso para la masa de carga, que es considerada como una masa concentrada (part cula). La energia cin etica rotacional de los cilindros se obtiene usando: 1 Tro = Io 2 2 1 Tri = Ii 2 2 Asumiendo que el cilindro interno es una varilla, su momento de inercia con respecto al centro de gravedad es Ii = 1 1 2 2 2 12 mi r . Para el caso del cilindro externo hueco se puede considerar que Io = 12 mo (3t + ro ), donde t depende de los , se obtiene: radios internos y externos del cilindro hueco. Sabiendo que = Tro = 1 1 2 2 mo (3t 2 + ro ) 2 12 1 1 2 mi r2 2 12 o
T=
Energ a potencial Ahora encontraremos la energ a potencial del sistema. La energ a potencial de los centros de masa de los cilindros (mo y mi ) y la masa de carga ml : 1 Vo = mo gro sin . 2 1 1 Vi = mi g(r ro )sin . 2 2 Vl = ml grsin . Luego la energia potencial total es: V= 1 1 (mo ro + mi (r ro )) + ml gsin . 2 2
El manipulador posee dos grados de libertad (r y ). Luego, tenemos dos ecuaciones de movimiento para el sistema: d dt d dt La primera ecuaci on de movimiento resulta en:
L L r
L = T L = Fr r
30
1 2 3 mo ro 1 2 1 mi rro + 1 mi ro 1 mi ro r + 2 mi rr + ml r2 + 2ml rr mi r2 +3 4 2 2 3
2 Linealizaci on
+gcos
1 1 2 (mo ro + mi (r 2 ro )) + ml r
= T .
2.4.2.
(2.48)
a dada por la posici on de la masa de carga, v1 = xl = rcos y donde u1 = T y u2 = Fr . Asumiendo que la salida est v2 = yl = rsin se tiene: v1 z sinz1 , (2.49) = 3 v2 z3 cosz1 v h(z, u)
Fuente: Cap tulos 1 del libro Systems and Control de Stanislaw H. Zak (2002). om Fuente: Cap tulos 2 y 3 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr y Richard M. Murray. Fuente: Cap tulos 1 del libro Systems and Control de Stanislaw H. Zak (2002). om Fuente: Cap tulos 2 y 3 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr y Richard M. Murray.
Cap tulo 3
Sistemas Lineales
En esta parte del curso nos centraremos en el caso de sistemas lineales invariantes en el tiempo y analizaremos el efecto de las condiciones iniciales y las entradas en las salidas. Los conceptos centrales de matriz exponencial y la ecuaci on convoluci on nos permitir an caracterizar completamente el sistema. Durante las clases anteriores hemos visto varios ejemplos donde los sistemas son modelados usando ecuaciones diferenciales lineales. En general, varios sistemas din amicos pueden ser modelados de forma precisa usando ecuaciones diferenciales lineales. As , sistemas mec anicos y circuitos el ectricos son ejemplos donde los modelos lineales pueden ser usados efectivamente. En muchos casos, nosotros creamos sistemas con una respuesta de entrada/salida lineal. Por ejemplo, casi todos los sistemas modernos de procesamiento de se nales, ya sean anal ogicos o digitales, usan realimentaci on para producir caracter sticas de entrada/salida lineales o casi-lineales. Para estos sistemas, a menudo til representar las caracter es u sticas de entrada/salida como lineales, ignorando los detalles internos requeridos para obtener la respuesta lineal. Para otros sistemas, sin embargo, las no linealidades no pueden ser ignoradas, especialmente si uno se importa en el comportamiento global del sistema. Sin embargo, si s olo nos importa lo que pasa cerca del punto de equilibrio, es suciente aproximar la din amica no lineal por su linealizaci on local.
3.1. 3.1.1.
Considerando el sistema en la forma espacio de estados y su correspondiente ecuaci on de salida: dx = f (x, u), dt y = h(x, u), (3.1)
podemos reescribir las ecuaciones de movimiento usando como punto de equilibrio del sistema al origen x =0yu = 0. Luego tenemos: d x = f (xe + x , ue + u ) = f(x , u ), (3.3) dt (x y = h(xe + x , ue + u ) ye = h , u ). En el nuevo conjunto de variables, el origen es un punto de equilibrio con salida cero. Una vez realizado el an alisis en este nuevo conjunto de variables, las respuestas obtenidas ser an trasladadas de vuelta a las coordinadas iniciales usando x = xe + x , u = ue + u y y = ye + y . Para el sistema (3.1), asumiendo, sin p erdida de generalidad, que el origen es el punto de equilibrio de inter es, escribiremos la salida y(t ) correspondiente a la condici on inicial x(0) = xo y entrada u(t ) como y(t ; xo , u). Usando esta notaci on, un sistema de entrada/salida es lineal si las siguientes condiciones son satisfechas:
31
32
3 Sistemas Lineales
i) y(t ; x1 + x2 , 0) = y(t ; x1 , 0) + y(t ; x2 , 0) ii) y(t ; xo , u) = y(t ; xo , 0) + y(t ; 0, u) iii) y(t ; 0, u1 + u2 ) = y(t ; 0, u1 ) + y(t ; 0, u2 ).
(3.4)
Luego denimos que un sistema es lineal si las salidas son conjuntamente lineales en la respuesta a las condiciones iniciales (u = 0) y la respuesta forzada (x(0) = 0). La propiedad iii) est a relacionada al principio de superposici on: la respuesta de un sistema lineal a la suma de dos entradas u1 y u2 es la suma de las salidas y1 y y2 correspondientes a cada entrada. La forma general del sistema lineal en la forma de espacio de estados, con correspondiente ecuaci on de salida, es: dx = Ax + Bu, dt y = Cx + Du, x(0) = xo (3.5)
donde A Rnn , B Rn p , C Rqn y D Rq p . La ecuaci on (3.5) es un sistema de ecuaciones diferenciales lineales de primer orden con entrada u, estado x y salida y. Es f acil mostrar que dos soluciones dadas x1 (t ) y x2 (t ) para este sistema de ecuaciones, satisfacen las condiciones de linealidad. Deniendo xh (t ) como la soluci on con entrada cero (soluci on homog enea) y la soluci on x p (t ) como la soluci on con condiciones iniciales igual a cero (soluci on particular). La Fig. 3.1 ilustra como dos soluciones individuales se pueden superponer para formar la soluci on completa.
Input u Homogeneous 2 0 2 0 2 0 2 0 Complete 2 0 2 0 20 40 Time t [sec] 60 20 40 60 20 40 60 2 0 2 0 2 0 2 0 2 0 2 0 20 40 Time t [sec] 60 20 40 60 20 40 60
State x1 , x2
Particular
3.1.2.
Invariancia en el tiempo
Invariancia en el tiempo es un concepto importante que se usa para describir un sistema cuyas propiedades no cambian en el tiempo. M as precisamente, para un sistema invariante en el tiempo, si la entrada u(t ) resulta en y(t ), luego moviendo el tiempo en el que se aplica la entrada por una constante a, u(t + a), la salida resulta en y(t + a). Los sistemas que son lineales e invariantes en el tiempo a menudo se denominan sistemas LTI (linear time invariant, por sus siglas en ingl es) y poseen una propiedad interesante: su respuesta a una entrada arbitraria est a completamente caracterizada por sus respuesta a entradas del tipo escal on o sus respuestas a impulsos cortos. Ver m as detalle a continuaci on.
33
(H (t tn ) H (t tn+1 ))u(tn )
(3.6)
como mostrado en la Fig. ??(b). La respuesta a una se nal cont nua se obtiene tomando el l mite cuando tn+1 tn 0, que resulta en: y(t ) =
0
H (t )u( )d ,
(3.7)
donde H es la derivada de la respuesta al escal on, tambi en llamada respuesta impulsiva h. Luego, la respuesta de un sistema LTI a cualquier entrada puede ser calculada a partir de la respuesta al escal on. N otese que la salida s olo depende de la entrada pues consideramos que el sistema est a en reposo al inicio,x(0) = 0). Siendo el sistema causal (sistema donde la salida depende de las entradas pasadas o actuales pero no de entradas futuras), se tiene que la salida para todo sistema LTI causal en reposo al inicio est a descrita por:
t
y(t ) =
0
h(t )u( )d =
t 0
h( )u(t )d ,
(3.8)
on en La segunda igualdad puede ser f acilmente vericada haciendo un cambio de variable (t = ). La integraci (3.8) es llamada una integraci on convoluci on.
1 0.8 0.6 0.4 0.2 0 0
u (t0 ) u (t1 ) u (t0 ) u (t1 )
Output (y)
Input (u)
0.5
0.5
2 4 Time (sec) 6 8
Figura 3.2 (a) Respuesta a entradas cont nuas por partes y (b) salida resultante de la suma de entradas individuales.
3.2.
La ecuaci on (3.7) muestra que la salida de un sistema lineal se puede expresar como un integral sobre todas las entradas u(t ). En esta secci on derivaremos una f ormula m as general, que incluye las condiciones iniciales diferentes de cero. En esta secci on calcularemos la soluci on de un sistema de la forma:
34
3 Sistemas Lineales
x(0) = xo .
(3.9)
(3.10)
(3.11)
Generalizando para cuando A se convierte en una matriz. Denimos el exponencial de matrices como una serie innita:
1 1 1 eX = I + X + X 2 + X 3 + ... = X k , 2 3! k k =0 !
(3.12)
donde X Rnn es una matriz cuadrada y I es la matriz identidad n n. Reemplazando X en (3.9) por At , donde t R, tenemos que:
1 1 1 eAt = I + At + A2t 2 + A3t 3 + ... = Ak t k , 2 3! k =0 k !
(3.13)
(3.14)
Multiplicando por x(0) por la derecha, encontramos que x(t ) = eAt x(0) es la soluci on a la ecuaci on diferencial (9.8) con condiciones iniciales x(0). La matriz (t ) = eAt es denominada matriz de transici on. Tomando la transformada de Laplace en (3.14), sabiendo que L [dh(t )/dt ] = sL [h(t )] h(0), tenemos: sL (eAt ) e0 = AL (eAt ) (sI A)L (eAt ) = I . Entonces, si A no tiene autovalores en el eje imaginario, obtenemos: L (eAt ) = (sI A)1 . (3.15)
3.2.1.
Un sistema lineal muy simple que puede ser usado para enteubnder conceptos b asicos es la ecuaci on diferencial de segunda orden dada por: q = u, y = q. El sistema es llamado de integrador doble porque su entrada u es integrada dos veces para determinar la salida y. En la T y: forma espacio de estados, escribimos x = q q dx 0 01 u. x+ = 1 00 dt La matriz din amica de un integrador doble es: A= y por c alculo directo encontramos que A2 = 0 y entonces: 01 , 00
35
(t ) = eAt =
1t . 01
Entonces, la soluci on homog enea (u = 0) para un integrador doble es dada por: x(t ) = 1t 01 x1 (0) x (0) + tx2 (0) = 1 . x2 (0) x2 (0)
3.2.2.
Un modelo simple de oscilador, tal como el sistema masa-resorte sin amortiguamiento es:
2 q = u. q + o
Poniendo el sistema en la forma de espacio de estados, la matriz din amica del sistema puede ser escrita como: A= 0 o o 0 y eAt = cosot sinot . sinot cosot
Esta expresi on para (t ) = eAt se puede vericar por diferenciaci on: d At o sinot o cosot e = , o cosot o sinot dt 0 o cosot sinot = = AeAt . sinot cosot o 0 Luego la soluci on est a dada por: x(t ) = eAt x(0) = Si el sistema tiene amortiguamiento: cosot sinot sinot cosot x1 (0) . x2 (0)
2 q + 2 o q + o q = u,
eo t
eid t eid t
2
2 1 eid t eid t
2
eid t + eid t 2
eid t
2 1
2 2 1 , i t t i t i d d d e e +e + 2 2 2 1
eid t eid t
donde d = o 2 1. N otese que d y 2 1 pueden ser real o complejo, pero la combinaci on de t erminos siempre proveer a un valor real para los elementos del exponencial de la matriz.
3.3.
Respuesta entrada/salida
En esta secci on derivaremos la ecuaci on convoluci on, que incluye entradas y salidas.
36
3 Sistemas Lineales
3.3.1.
Ecuaci on de convoluci on
Volviendo al sistema general de entrada/salida en la ecuaci on (3.5). Usando la matriz exponencial , la soluci on de la ecuaci on (3.5) se puede escribir como: Teorema 1 La soluci on de la ecuaci on diferencial lineal: dx = Ax + Bu, dt y = Cx + Du. est a dada por: x(t ) = eAt x(0) +
0 t
x(0) = xo
(3.16)
eA(t ) Bu( )d
(3.17)
Demostraci on: Diferenciando ambos lados en (3.17) y usando la propiedad (3.13) de la matriz exponencial. Luego, por sustituci on directa1 , tenemos: dx = AeAt x(0) + dt
t 0
(3.18) (3.19)
que prueba el resultado. De las ecuaciones en (3.16) y (3.17) la relaci on entrada/salida para un sistema lineal est a dado por: y(t ) = CeAt x(0) +
0 t
La ecuaci on (3.19) se denomina ecuaci on de convoluci on y representa la forma general de soluci on de un sistema de ecuaciones diferenciales lineales acopladas. Esta ecuaci on y la ecuaci on (14) han sido directamente calculadas en el dominio del tiempo. Tambi en podemos calcular las soluciones en el dominio de la frecuencia usando la transformada de Laplace. Aplicando la transformada de Laplace a la ecuaci on (3.18) resulta: X (s) = (sI A)1 [x(0) + BU (s)] Y (s) = C(sI A)1 x(0) + [C(sI A)1 B + D]U (s) (3.20)
Respuesta impulsiva
La respuesta impulsiva de un sistema vendr a a ser la salida correspondiente a tener un impulso como entrada en (3.19):
t
y(t ) =
0
CeA(t ) B ( )d + D (t ) = CeAt B + D (t ),
(3.21)
donde la segunda igualdad sigue del hecho que (t ) es cero en cualquier lugar excepto el origen y su integral es id enticamente igual a 1. N otese que existe una limitaci on en el c alculo de la respuesta impulsiva cuando D = 0 ya que actica, se ignora la matriz D y la respuesta impulsiva viene dada por: D (t ) se hace innito en t = 0. En la pr
t
y(t ) = h(t ) =
0
CeA(t ) B ( )d = CeAt B.
(3.22)
Escribiendo la ecuaci on de convoluci on en t erminos de la respuesta a las condiciones iniciales y la integral convoluci on (3.8) de la respuesta impulsiva h(t ) y la se nal de entrada u(t ), se tiene: y(t ) = CeAt x(0) +
0
1 t t to
h(t )u( )d ,
(3.23)
f (t , )d = f (t , )| =t +
t to t
f (t , )d .
37
as la respuesta de un sistema lineal es la superposisici on de la respuesta a un conjunto innito de impulsos cuyas magnitudes est an dadas por la entrada u(t ). El uso de pulsos como aproximaciones de la funci on impulso se puede visualizar en la Fig. 3.3.
1.5 u 1 y 0.5 0 0 2 4 6 8 10 0 0 10 20 t 30 40 0.5
Time t
(a) Pulse and impulse functions
Figura 3.3 Respuesta de un sistema a entradas del tipo impulso representado como la suma de diferentes anchos de pulso. (a) Funciones pulso e impulso. b) Respuestas a los pulsos e impulso.
3.3.2.
la forma general de su soluci on est a dada por (3.19), reescrita aqui por conveniencia: y(t ) = CeAt x(0) +
0 t
que muestra que la respuesta total del sistema consta de la respuesta a las condiciones iniciales y la respuesta a la ltimos t entrada. La respuesta a la entrada est a compuesta por los dos u erminos de (3.19)- esta respuesta a su vez tiene dos componentes - la respuesta transiente y la respuesta en estado estacionario, ver Fig 3.4. La respuesta transiente ocurre en el primer periodo de tiempo despu es de que la entrada ha sido aplicada y reeja la diferencia entre las condiciones iniciales y la soluci on en estado estacionario. La respuesta en estado estacionario es la porci on de la respuesta en la salida que reeja el comportamiento del sistema a largo plazo bajo la acci on de ciertas entradas. Para entradas peri odicas la respuesta en estado estacionario tambi en ser a peri odica, y para entradas constantes la respuesta ser a a menudo constante.
1
0.1 Output y
Input u
1 0
20
40 Time t [sec]
60
80
0.1 0
20
(a) Input
(b) Output
38
3 Sistemas Lineales
y representa un cambio abrupto de un valor a otro valor. La respuesta a un escal on unitario del sistema (3.5) est a denido como la salida y(t ) comenzando de las condiciones iniciales cero (o el punto de equilibrio apropiado) y dada una entrada del tipo escal on. Calculando la respuesta a un escal on unitario de un sistema lineal usando la ecuaci on convoluci on, para x(0) = 0, tenemos:
t
y(t ) =
0
=C
eA Bd + D = C(A1 eA B)
0 =t +D =0
eA(t ) Bd + D (3.24)
(3.25)
El primer t ermino es la respuesta transiente que decae a cero a medida que t . El segundo t ermino es la respuesta al estado estacionario y representa el valor de la salida para despu es de transcurrido un tiempo grande.
Ce(sI A) Bd + Dest
(3.26)
Asumiendo que ninguno de los autovectores de A es igual a s = i , luego la matriz sI A es invertible y podemos escribir: t y(t ) = CeAt x(0) + CeAt (sI A)1 e(sI A) B + Dest 0 (3.27) = CeAt x(0) + CeAt (sI A)1 e(sI A)t I B + Dest = CeAt x(0) + C(sI A)1 est B CeAt (sI A)1 B + Dest , y obtenemos:
39
(3.28)
Nuevamente tenemos una soluci on que consiste de un componente transiente y uno estado estacionario. El componente transiente decae a cero si el sistema es asint oticamente estable y el componente estado estacionario es proporcional a la entrada (compleja) u = est . La respuesta en estado estacionario se puede reescribir como: yss (t ) = Mei est = Mest +i , donde: Mei = C(sI A)1 B + D, (3.29) A)1 B + D.
con M y representando la magnitud y la fase de un n umero complejo C(sI El n umero complejo on de transferencia. Cuandon s = i , decimos que M es la ganancia y es la C(sI A)1 B + D se denomina funci fase del sistema para cierta frecuencia de excitaci on . Usando linealidad y combinando las soluciones de s = +i y s = i , podemos mostrar que si tenemos una entrada u = Au sin( t + ) y una salida y = Ay sin( t + ), entonces: ganancia( ) = Ay = M, Au fase( ) = = .
a dada por: La soluci on en estado estacionario para un senoide u = cos t est yss (t ) = M cos( t + ), a adelantada a la entrada, de otra forma como presentado en la Fig. 3.5. Si la fase es positiva se dice la salida est decimos que la salida est a atrasada a la entrada.
2 Input Input, output 1
Au Ay
10
Output
10 10
0 1 T 2 0 5 10 Time [sec] 15 20
Figura 3.5 Respuesta de un sistema lineal a un senoide. a) Respuesta entrada/salida. b) Respuesta en frecuencia.
Una propiedad de la respuesta en frecuencia es que la ganancia del sistema cuando = 0 se denomina ganancia en la frecuencia cero y corresponde a la relaci on entre una entrada constante y la salida estacionaria: Mo = CA1 B + D. En Ingenier a El ectrica la ganancia de frecuencia cero es denominada DC gain.
3.4.
tiles y sus caracter La funci on de transferencia G(s) = C(sI A)1 B + D tiene interpretaciones muy u sticas son a menudo asociadas a propiedades importantes del sistema. Tres de las caracter sticas m as importantes son la ganancia y la ubicaci on de polos y ceros.
40
3 Sistemas Lineales
La ganancia en la frecuencia cero (o ganancia DC) est a dada por la magnitud de la funci on de transferencia en s = 0. Representa la relaci on del estado estacionario a la salida del sistema con respecto a una entrada del tipo escal on (que puede ser representado por u = est con s = 0). Para una representaci on de espacio de estados, calculamos la ganancia en la frecuencia cero usando la siguiente ecuaci on: G(0) = CA1 B + D. Para un sistema escrito como una ecuaci on diferencial lineal: dny d n1 y dmu d m1 u + a1 n1 + ... + an y = bo m + b1 m1 + ... + bm u, n dt dt dt dt si asumimos que la entrada y la salida del sistema (en estado estacionario) son constantes yo y uo , luego encontramos que an yo = bm uo . Luego la ganancia en la frecuencia cero es: G(0) = bm yo = . uo an (3.31) (3.30)
Considerando el sistema lineal con la siguiente funci on de transferencia racional: G(s) = b(s) . a(s) (3.32)
las raices del polinomio a(s) son llamados polos del sistema, y las raices del polinomio b(s) son llamados los ceros del sistema. Si los polos del sistema pertenecen al semiplano complejo izquierdo abierto (Co on de ) se dice que la funci transferencia es estable. Si los ceros del sistema pertenecen al semiplano complejo izquierdo abierto (Co ) se dice que el sistema es de fase m nima, en caso contrario los ceros son de fase no m nima2 . Para un sistema espacio de estados con funci on de transferencia G(s) = C(sI A)1 B + D, los polos de la funci on de transferencia son los autovalores de la matriz din amica A (sistema con realizaci on m nima). Una forma de ver esto es notando que el valor de G(s) tiende a innito cuando s es un autovalor de la matriz din amica del sistema puesto que s es precisamente el conjunto de puntos donde el polinomio caracter stico (s) = det(sI A) = 0 (y luego (sI A) no es invertible). Se puede destacar que los polos del sistema en la forma de espacio de estados s olo depende de la matriz A, que representa la din amica intr nseca del sistema. Decimos que una funci on de transferencia es estable si todos sus polos tienen parte real negativa. Para encontrar los ceros de un sistema en la forma de espacio de estados, observamos que los ceros son n umeros complejos s tal que la entrada u(t ) = uo est resulta en salida igual a cero. Insertando una respuesta puramente exponencial x(t ) = xo est y y(t ) = 0 en: x = Ax + Bu, y = Cx + Du, resulta: sest xo = Axo est + Buo est , que puede ser escrito como: sI + A B C D xo = 0. uo (3.33) 0 = Cest xo + Dest uo
Esta ecuaci on tiene una soluci on con xo = 0, uo = 0 solo si la matriz a la izquierda no tiene rango completo. Los ceros del sistema (llamados tambi en ceros de transmisi on, en caso de una realizaci on m nima) son entonces aquellos valores de s tal que la matriz. sI + A B , (3.34) C D pierde rango o det sI + A B =0. C D Siendo que los ceros dependen de A, B, C y D, ellos dependen de como las entradas y salidas son acopladas con los estados. N otese que en particular si la matriz B tiene rango completo, luego la matriz en (3.34) tiene n las linealmente
2 s+ a Por ejemplo, el sistema g(s) = s+a con cero en el semiplano derecho en s = a tiene una ganancia constante de 1, pero su fase es 2 arctan( /a) rad y no 0 rad como ser a para el sistema de fase m nima g(s) = 1 con ganancia similar.
3.5 Otros
41
independientes para todos los valores de s. Similarmente hay n columnas linealmente independientes si la matriz C tiene rango completo. Eso signica que los sistemas donde B y C son de rango completo no tienen ceros. En particular l (cada estado puede ser controlado esto signica que un sistema no tiene ceros si es totalmente posible actuar en e independientemente) o si todos los estados son medidos. Para cuando consideramos sistemas sin igual n umero de entradas y salidas, el c alculo de los ceros usando (3.34) se hace inadecuado. Para este caso se trabaja directamente con la matriz de funciones de transferencia, como descrito a continuaci on. POR COMPLETAR
3.5.
Otros
Ancho de banda El concepto de ancho de banda es importante en el entendimiento de los benecios y desventajas al aplicar control por realimentaci on. El ancho de banda est a relacionado a la velocidad de respuesta. En general, un ancho de banda grande corresponde a un tiempo de levantamiento peque no, esto debido a que las se nales de alta frecuencia son pasadas m as f acilmente hacia las salidas. Un ancho de banda grande tambi en indica que el sistema es m as sensible al ruido y a las perturbaciones param etricas. Por otro lado, si el ancho de banda es peque no, el tiempo de respuesta ser a por lo general grande, y el sistema usualmente ser a m as robusto. POR COMPLETAR
om Fuente: Cap tulos 5 y 8 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr y Richard M. Murray (2008). Fuente: Cap tulo 4 del libro Multivariable Feedback Control de S. Skogestad y I. Postlethwaite (2006).
Cap tulo 4
En esta parte discutiremos tres tipos de modelos de sistemas din amicos lineales que presentan formas especiales de sus correspondientes (A, B y C). Estas formas se obtienen mediante un cambio de variable, el cual nalmente revela ciertas propiedades estructurales del modelo. Estas formas ser an de utilidad en las siguientes secciones cuando se construyan algoritmos para la ubicaci on de polos. Los algoritmos de ubicaci on de polos ser an usados para dise nar controladores por realimentaci on de estados, asi como estimadores de estado.
4.1. 4.1.1.
La forma general del sistema lineal en su representaci on espacio de estados, con correspondiente ecuaci on de salida, es: dx = Ax + Bu, dt y = Cx + Du, (4.1)
donde A Rnn , B Rnm , C R pn y D R pm . Los componentes del vector de entrada u y el vector de salida y son dados por las entradas y salidas de un modelo, mientras que las variables de estado dependen del sistema coordenado usado para representar los estados. La elecci on de coordenadas afecta los valores de las matrices A, B y C (D no est a afecta dado que mapea entradas a salidas). A continuaci on investigaremos las consecuencias de cambiar el sistema coordenado. Si elegimos el conjunto de coordenadas z = T x, donde T es una matriz invertible. De (4.1) se tiene: dz dx + Bu , =T = T (Ax + Bu) = TAx + T Bu = TAT 1 z + T Bu = Az dt dt + Du. y = Cx + Du = CT 1 z + Du = Cz El sistema transformado tiene la misma forma que (4.1) pero con matrices A, B y C diferentes: = TAT 1 , B = CT 1 = T B, C A (4.3) (4.2)
Existen sistemas de coordenadas que permiten visualizar una propiedad particular del sistema, luego las transformacions de coordenadas se pueden usar para ganar nuevo entendimiento de la din amica del sistema. Es posible comparar las soluciones del sistema en las coordenadas transformadas y en las coordenadas originales usando la siguiente propiedad del mapeamiento exponencial: eT ST
1
= TeS T 1 .
(4.4)
Esta propiedad se puede vericar usando la denici on de exponencial de matrices. As se puede mostrar que:
43
44
q1 c m k k k m u(t) = sin t q2 c
t 0
( )d . eA(t ) Bu
(4.5)
es factible, siendo que el exponencial de matrice con A puede ser m El transformar A a A as f acil de calcular.
Este es un sistema acoplado de 4 ecuaciones diferenciales y es bastante complicado resolverlo en la forma anal tica. Usando la transformaci on z = T x pondremos al sistema en una forma m as simple. Sea z1 = 1 ( q + q ) , z 1 , 1 2 2 =z 2 1 (q1 q2 ) y z4 = z 3 , tal que: z3 = 2 1 1 0 0 1 0 0 1 1 x. z = Tx = 2 1 1 0 0 0 0 1 1 Y en el nuevo sistema coordenado, la din amica es: 0 1 0 k c dz m m 0 = 0 0 0 dt k 0 0 3 m 0 0 k 0 z + 2m u. 0 1 c 2k m m
N otese que la matriz resultante es diagonal por bloques y, como consecuencia, desacoplada. Luego las soluciones pueden ser calculadas mediante soluci on de dos sistemas de segunda orden representados por los estados (z1 , z2 ) y (z3 , z4 ). De hecho, la forma de cada grupo de ecuaciones es id entica al de un sistema masa-resorte individual. Una vez resueltos los grupos de ecuaciones, se puede recuperar la din amica del sistema en las coordenadas originales mediante inversi on de la transformaci on de estados y escribiendo x = T 1 z.
4.1 Deniciones
45
4.1.2.
Los autovalores y autovectores de un sistema proveen una descripci on del tipo de comportamiento que exhibe un sistema. Para sistemas oscilatorios, el t ermino modo se usa a menudo para denir ciertas conguraciones de vibraci on que pueden ocurrir, ver Figs. 4.2 y 4.3.
(a) Mode 1
Figura 4.2 Sistema de masa conectadas por un resorte. Las masas se mueven hacia la derecha sincronizadas.
(b) Mode 2
Figura 4.3 Sistema de masa conectadas por un resorte. Las masas se mueven en direcciones separadas.
La respuesta a las condiciones iniciales de un sistema lineal se puede escribir en t erminos del exponencial de una matriz, la denominada matriz de estados A. Luego, las propiedades de la matriz A determinan el comportamiento del sistema. Si A Rnn , asumamos que existen n vectores linealmente independientes (autovectores) vi y n escalares i (autovalores) que satisfacen: Avi = i vi . Escribiendo los vectores vi como una matriz: M v1 v2 ... vn , y deniendo la matriz de acuerdo a:
1 0 0 0
0 0 , 0 n
AM = M . I = MM 1 A = M M 1 A2 = M M 1 M M 1 = M 2 M 1 . . . . . .
An = M n M 1
46
eAt = I + At +
Suponiendo primero que v y son autovector y autovalor de valor real. Luego, observamos que la soluci on de la ecuaci on diferencial para x(0) = v, de la denici on de exponencial de matrices arriba: eAt v = Me t M 1 v = e t v. Entonces, el autovalor describe como la soluci on var a en el tiempo, esta soluci on a menudo se denomina modo. El autovector dene la forma de la soluci on y a menudo se denomina forma del modo del sistema (ver Fig. 4.4). El autovalor a menudo se denomina como frecuencia modal.
1.5 u 1 y 0.5 0 0 2 4 6 8 10 0 0 10 20 t 30 40 0.5
A2t 2 Ant n + ... + + ... 2 n! 2 M t 2 M 1 + ... = MM 1 + M tM 1 + 2! = Me t M 1 1 t e 0 ... ... 0 0 e2 t 0 ... 0 1 . . = M M . 0 ... 0 en1 t 0 0 ... ... 0 en t
Time t
(a) Pulse and impulse functions
Figura 4.4 La noci on de modos para un sistema de segundo orden con autovalores reales. La gura en la izquierda muestra el plano de fase y las de la derecha las respuestas en el tiempo. Ambas guras muestran los modos correspondientes a soluciones que comienzan en los autovectores.
as complicado. Siendo A una matriz con elementos reales, los autovalores El caso de los autovalores complejos es m y autovectores son complejos conjugados = i y v = u iw, que implica que: u= Usando el exponencial de matrices tenemos que: eAt v = e t (u + iw) = e t ((u cos t sin t ) + i(u sin t + cos t )) , luego sigue que: 1 eAt u = (eAt v + eAt v ) = ue t cos t e t sin t , 2 1 eAt w = (eAt v eAt v ) = ue t sin t + e t cos t . 2 Nuevamente llamamos a la soluci on correspondiente a de modo del sistema, y v es la forma del modo. Algunas matrices con autovalores iguales no pueden ser transformadas a una forma diagonal. Ellos, entonces, pueden ser transformados a una forma relacionada, denominada forma de Jordan. En este caso, la matriz de estados posee los autovalores en la diagonal. Cuando hay autovalores iguales, pueden haber 1s apareciendo en la superdiagonal, indicando el acoplamiento entre estados. Espec camente decimos que una matriz est a en la forma de Jordan cuando: v v v + v , ,w = . 2 2i
4.1 Deniciones
47
J1 0 .. 0 J2 0 . .. . . . 0 0 0 0 ...
donde Ji es un bloque de Jordan, y i para ese bloque corresponde al autovalor de J . Un bloque de Jordan puede ser representado por un sistema que consiste en un integrador con realimentaci on , ver Fig. 4.5.
x1 x1 x2
, donde Ji = Jk1 0 0 Jk
0 0
0 0 . . .
i 1 .. 0 i 1 . .. . . . 0 0 0 0 ...
0 0 0 0 . . , . i 1 0 1
(4.6)
Figura 4.5 Representacion de sistemas lineales donde las matrices din amicas son bloques de Jordan. Un bloque de Jordan de primer orden se puede representar como un integrador con realimentaci on , como mostrado a la izquierda. Un bloque de Jordan de orden dos es mostrado a la derecha.
Una vez que una matriz est a en la forma de Jordan, el exponencial de la matriz puede ser calculado en t erminos de los bloques de Jordan, usando la forma diagonal por bloques de J : J e 1 0 ... 0 0 0 eJ2 0 0 0 . . .. . eJ = . . (4.7) . . . J 0 0 k 1 0 e 0 0 ... 0 eJk Los exponenciales de los bloques de Jordan pueden a su vez ser escritos como: 1 t
t2 2!
...
eJi t
0 1 t ... . =. . 1 .. . .. . 0 ... 0
t n1 ( n1) ! t n2 ( n2) !
. . .
t 1
i t e .
(4.8)
4.1.3.
Teorema de Cayley-Hamilton
El teorema de Cayley-Hamilton establece que una matriz A satisface su propia ecuaci on caracter stica. La ecuaci on caracter stica de una matriz es la ecuaci on:
( ) det( I A) = n + ... + a1 + ao 0
El teorema de Cayley-Hamilton establece que:
(A) = 0.
(4.9)
Probaremos el teorema de Cayley-Hamilton para el caso de A siendo diagonalizable. Considerando (A), siendo que A se puede escribir como A = M M 1 , encontramos que:
(A) = M ( )M 1 .
48
Pero ( ) act ua separadamente en cada uno de los elementos de la matriz diagonal. Como cada uno de los elementos satisface ( ) = 0, encontramos que ( ) = 0. De aqui concluimos que (A) = 0. Una consecuencia simple del teorema de Cayley-Hamilton es que cualquier potencia de A se puede expresar en t erminos de I , A, ..., An1 . Considerese, por ejemplo, An . De (??) vemos que: An = (an1 An1 + ... + a1 A + ao I )
4.2.
Considerando un sistema de m ultiples entradas y salidas, cont nuo en el tiempo, representado por: x (t ) = Ax(t ) + Bu(t ), y(t ) = Cx(t ), (4.10)
donde A Rnn , B Rnm y C R pn . Observamos que la descomposici on modal (en modos) de A lleva a una til. Dado que A = M M 1 , la transformaci representaci on espacio de estados muy u on de estados se puede hacer por medio de z = T x, T = M 1 , resultando en: z (t ) = z(t ) + M 1 Bu(t ), y(t ) = CMz(t ). (4.11)
Esta representaci on es denominada de forma can onica modal, dado que los estados son simplemente las amplitudes es de los mapeamientos de entrada modales. Los estados son desacoplados en pero pueden estar acoplados a trav M 1 B y salida CM . La forma modal es robusta en cuestiones de c alculo num erico.
4.2.1.
Considere el modelo del sistema din amico como sigue: 542 01 x = 4 5 2 x + 1 1 u, 222 10 142 10 y= x+ u 112 01 Luego, el calculando los autovalores de A tenemos: 5 4 2 det(A I3 ) = det 4 5 2 2 2 2 , = 3 + 12 2 21 + 10 = ( 1)2 ( 10) y vemos que los autovalores asociados de A son = 1 y = 10. Buscando los autovectores correspondientes: 5 4 442 2 4 5 2 v = 4 4 2 v = v = v, 221 2 2 2 =1 1 1 v1 = 0 , v2 = 1 , 2 0
entonces:
49
y:
entonces:
5 4 2 4 5 2 2 2 2
5 4 2 v = 4 5 2 v = v = v, 2 2 8 =10 2 v3 = 2 . 1
Con los tres autovectores v1 , v2 y v3 siendo linealmente independientes podemos denir M tal que la matriz de estados 1 1 2 se pueda diagonalizar: M = 0 1 2 . Entonces: 2 0 1 1 10 0 1 1 2 542 1 1 2 = 0 1 2 4 5 2 0 1 2 = 0 1 0 , 0 0 10 2 0 1 222 2 0 1 1 1 1 2 01 M 1 B = 0 1 2 1 1 2 0 1 10 1 1 2 142 0 1 2 CM = 112 2 0 1
4.3. 4.3.1.
Considerando un sistema de una entrada una salida, un sistema cont nuo en el tiempo es representado por: x (t ) = Ax(t ) + bu(t ), (4.12)
donde A Rnn y b Rn . Si se asume que el sistema es alcanzable, o, equivalentemente, controlable1 , signica que: rango( b Ab ... An1 b ) = n. (4.13)
y a la matriz Wc = b Ab ... An1 b se le denomina matriz de controlabilidad. ltima la de la inversa de la matriz controlabilidad, sea q1 tal la, denimos la matriz de transformaEligiendo la u ci on T como: q1 q1 A (4.14) T = . . . . q1 An1
50
Los elementos x en la matriz son elementos que existen pero no son de nuestro inter es. Considerando la transformaci on z = T x, en el nuevo sistema coordenado, el modelo del sistema es: z (t ) = TAT 1 x(t ) + T bu(t ) (t ). (t ) + bu = Az (4.16)
0 0 T b Ab ... An1 b = . . . 1
0 ... 0 0 ... 1 . . . . . .
x ... x x
1 x . . . .
(4.15)
tienen estructuras particulares que deniremos a continuaci yb Las matrices A on. Analizando primero la estructura de , con q1 siendo la u ltima la de la inversa de la matriz de controlabilidad, tenemos: b q1 b = q1 Ab = ... = q1 An2 b = 0, y, q1 An1 b = 1. Entonces: 0 0 . = Tb = b =. . . q1 An2 b 0 1 q1 An1 b q1 q1 Ab . . . . TA = AT El lado izquierdo de la matriz est a dado por: q1 A q1 A2 . . . (4.18) (4.17)
(4.19)
TA = . n 1 q1 A q1 An
(4.21)
(4.22) (4.23)
ltima N otese que los coecientes del polinomio caracter stico de A son inmediatamente aparentes inspeccionando la u . la de A
y usando el teorema de Cayley-Hamilton obtenemos que A debe Comparando ambos lados de la ecuaci on TA = AT ser como descrito a continuaci on: 0 1 0 ... 0 0 0 0 1 ... 0 0 . . . = . . . (4.24) A . . . . 0 0 0 ... 0 1 ao a1 a2 ... an2 an1
51
4.3.2.
A continuaci on, generalizaremos el m etodo que transforma sistemas a su forma can onica controlable para el caso de sistemas de m as de una entrada. Sea el sistema din amico: x (t ) = Ax(t ) + Bu(t ), (4.25)
donde A Rnn y B Rnm , m n, y rango columna(B)=m por simplicidad2 . La matriz de controlabilidad se puede representar como: Wc = b1 b2 ... bm Ab1 Ab2 ... Abm ... An1 b1 ... An1 bm . (4.26) donde bi , i = 1, 2, ..., m, es la i- esima columna de B. Asumiendo que la matriz presentada en (4.26) es de rango la completo (n las linealmente independientes), luego, podemos seleccionar n columnas linealmente independientes en (4.26). Elegimos estas columnas de la derecha a la izquierda, luego rearreglando las columnas seleccionadas formarmos la siguiente matriz no singular L: L = b1 Ab1 ... Ad1 1 b1 b2 ... Ad2 1 b2 ... bm ... Adm 1 bm .
2
(4.27)
Esta suposici on es hecha por conveniencia, para simplicar el c alculo. Esta suposici on implica que todas las entradas son mutualmente independientes, que viene a ser el caso en aplicaciones pr acticas.
52
i= 1
di = n.
(4.28)
Observese que las m columnas de B est an presentes en L ya que hemos asumido que B es de rango columna completo (m columnas linealmente independientes). Sea:
k = di ,
i= 1
for k = 1, 2, ..., m.
(4.29)
N otese que 1 = d1 , 2 = d1 + d2 , ..., m = n. Seleccionando las m las correspondientes de L1 y denotandolas por esima la de L1 , formamos la siguiente matriz n n: qk , donde qk es la - q1 Ad1 1 q2 . . . . T = q2 Ad2 1 . . . qm . . . d 1 qm A m q1 q1 A . . .
(4.30)
Se puede probar que T es no singular calculando el producto T L y observando que det(T L) = 1. Deniendo la transformaci on de variables de estado z = T x; y usando el mismo argumento que en el caso de un sistema de una = TAT 1 y B = T B, donde: entrada, obtenemos que A 01 0 0 x x 0 0 . . . A= 0 0 x x . . . 0 0 . . . 0 0 0 ... 0 0 0 ... 0 1 ... 0 0 0 ... 0 . . .. . . . . . x ... x x x ... x 0 ... 0 0 1 ... 0 . . .. . . . . . . . . 0 ... 0 0 0 ... x ... x x x ... . . . 0 ... 0 0 0 ... . . .. . . . . . 1 x 0 . . . ... 0 0 ... 0 ... 0 0 ... 0 . . . . . . ... x x ... x ... 0 0 ... 0 . . . . . . ... 0 0 ... 0 . ... x x ... x . .. . . . ... 0 1 ... 0 . . . . . . ... 0 0 ... 1
(4.31)
tiene la estructura de la forma can N otese que los m bloques diagonales en A onica controlable para el caso de una entrada. Las dimensiones de cada bloque son di di , i = 1, 2, ..., m. Los bloques fuera de la diagonal tienen elemento y A se puede calcular conociendo los ltimas las. Luego, toda la informaci que son ceros, excepto por la u on de A ndices de controlabilidad. La matriz B tiene la forma:
53
0 0 . . . 1 0 0 . . B= . 0 . . . 0 0 . . .
00 0 01
0 0 x 0 0 . . . . x . . . 0 0 . . .
(4.32)
Siguiendo el algoritmo para obtener la forma can onica controlable del sistema, obtenemos que: rango( b1 b2 Ab1 Ab2 A2 b1 A2 b2 A3 b1 A3 b2 ) = 4. Luego, d1 = d2 = 2. A continuaci on formamos L: 1 2 = 1 0 0,40 0,35 0,05 0,25 1 3 4 2 10 0 1 , 0 0 13
L = b1 Ab1 b2 Ab2
y:
Entonces: y:
q1 = 0,05 0,15 0,35 0,05 , q2 = 0,25 0,25 0,25 0,25 . La matriz de transformaci on es: 0,05 q1 q1 A 0,05 = T = q2 0,85 q2 A 0,25 0,15 0,15 0,45 0,25 0,35 1,35 0,05 0,25 0,05 0,05 . 0,15 0,25
54
0 1 0 4 5 0 TAT 1 = 0 0 0 3 3 4
0 0 1 1
0 1 TB = 0 0
0 0 . 0 1
4.4.
En esta parte usaremos el concepto de dualidad y, en base a los algoritmos antes presentados para transformar sistemas alcanzables a su forma controlable, derivaremos resultados an alogos para sistemas observables.
4.4.1.
Considerando el modelo de un sistema din amico observable: x (t ) = Ax(t ) y(t ) = Cu(t ), (4.33)
donde A Rnn , C R pn , p n, y rango(C)= p. Se omite la entrada u por conveniencia. Considerando el modelo del sistema dual asociado con el sistema (4.33). w (t ) = AT w(t ) + CT v(t ). (4.34)
Siendo que el sistema (4.33) es observable, el sistema dual (4.34) es alcanzable. Luego podemos transformar el sistem dual (4.34) en su forma can onica controlable usando los algoritmos descritos en la secci on anterior. Finalmente, tomamos el resultado dual para obtener: x x (t ) = A (t ), (4.35) x y(t ) = C (t ), donde: 11 A 12 ... A 1p A A 21 A 22 ... A 2p = A . , . . . . . p1 A p2 ... A pp A 0 0 ... 0 x 1 0 ... 0 x ii = A . . , .. . . . . . 0 0 ... 1 x
(4.36)
(4.37)
que es justamente la transpuesta de la forma can onica controlable para el caso de una entrada. Los enteros di , i = 1, 2, .. p ji , j = i de A tienen la forma: son los ndices de controlabilidad del sistema en (4.35). Las matrices fuera de la diagonal A 0 0 ... 0 x 0 0 ... 0 x ji = A (4.38) . . . .. . . . . . 0 0 ... 0 x
55
1 x .. .
00 00 . . .
Los p ndices de controlabilidad de (4.35) son los llamados ndices de observabilidad del sistema en (4.34). N otese que:
i= 1
0 ... 0 0 ... 0 . . . .
(4.39)
di = n.
(4.40)
Trabajando con el sistema dual para obtener la forma controlable: primero formamos la matriz de controlabilidad; luego procedemos a seleccionar de izquierda a derecha las primeras 4 columnas linealmente independientes. Ellas tienen la forma: T T T T 2 T cT 1 , c2 , A c1 , (A ) c1 . Luego, los indices de observabilidad son d1 = 3 y d2 = 1. Luego, formando L: 1000 0 0 1 0 T 2 T T T T L = cT 1 A c1 (A ) c1 c2 = 0 1 3 0 , 0001 1 0 L 1 = 0 0 0 0 3 1 1 0 0 0 0 0 . 0 1
y:
Entonces los dos vectores necesarios para obtener la transformaci on deseada son: q1 = 0 1 0 0 , y: q2 = 0 0 0 1 . La matriz de transformaci on es: 0 q1 q1 A 0 = T q2 = 1 0 q2 A 10 01 23 00 0 0 . 21 1
56
0 1 =T T AT T = A 0 0
0 1 0 2 1 3 0 105
0 0 0 5
= CT T = 0 0 1 0 . C 0 0 21 1
4.5.
Representaciones espacio de estados en formas can onicas a partir de funciones de transferencia del sistema
En las secciones anteriores se ha descrito la forma de obtener ciertas formas can onicas partiendo de una representaci on espacio de estados dada, en esta parte nos centraremos en obtener representaciones espacio de estados en sus formas can onicas partiendo de la funci on de transferencia del sistema. Considere un sistema denido por: dny d n1 y dy dnu d n1 u du + a + ... + a + b + ... + b1 + bo u + a y = b o n n 1 1 n 1 dt n dt n1 dt dt n dt n1 dt donde u es la entrada y y es la salida. Esta ecuaci on tambi en puede ser escrita como: bn sn + bn1 sn1 + ... + b1 s + bo n(s) Y (s) = g(s) = n = n 1 U (s) s + an1 s + ... + a1 s + ao d (s) (4.42) (4.41)
A continuaci on se presentar an las representaciones espacio de estados correspondientes en su forma can onica controlable, observable y modal.
4.5.1.
La siguiente representaci on es la forma can onica controlable: x 1 0 1 0 ... 0 0 x1 0 x 0 0 1 ... 0 x2 0 0 2 . . . . . . . . . . . . = + . u. . . . . . . . . x n1 0 0 0 ... 0 1 xn1 0 x n ao a1 a2 ... an2 an1 xn 1 + bn u xn1 xn x1 x2 . . .
(4.43)
(4.44)
La forma can onica controlable es importante en el dise no de sistemas de control por ubicaci on de polos. Las ecuaciones (4.43) y (4.44) son derivadas de la siguiente forma. Si bn = 0 entonces:
4.5 Representaciones espacio de estados en formas can onicas a partir de funciones de transferencia del sistema
57
g(s) = = =
bn sn +
bn1 n1 bo 1 + ... + b bn s bn s + bn
d (s)
b 1 n1 bo 1 bn sn + n + ... + b bn s bn s + bn
d (s)
b 1 n1 bo 1 bn sn + n + ... + b bn s bn s + bn
d (s)
estrictamente propia
entonces funci on de transferencia propia = funci on de transferencia estrictamente propia + constante, en otras palabras, g(s) = h(s) + bn y bn es simplemente la matriz D. Ahora suponiendo que: h(s) = cn1 sn1 + ... + cn n s + an1 sn1 + ... + a1 s + ao = cn1 sn1 + ... + cn 1 d (s)
4.5.2.
La siguiente representaci on es la forma can onica observable: x1 bo ao bn x 1 0 0 0 ... 0 ao x 2 0 0 0 ... 0 a1 x2 b1 a1 bn . . . . . . . . . . . + . =. . u. . . . . . . . x 0 0 0 ... 0 an2 xn1 0 n1 0 0 0 ... 1 an1 xn x n bn1 an1 bn y = 0 0 ... 0 1 + bn u xn1 xn x1 x2 . . .
(4.45)
(4.46)
Notar que la matriz de estados n n de la ecuaci on (4.45) es la transpuesta de la matriz de estados de la ecuaci on (4.43).
4.5.3.
Considere la funci on de transferencia denida por (??). Aqui consideramos el caso donde el polinomio del denominador posee raices distintas. Para el caso de raices distintas, (??) puede ser escrita como:
Y ( s) U ( s)
(4.47)
58
x 1 p1 x 2 0 . . . = . . . x n1 0 x n 0
0 0 ... p2 0 ... . . .
0 0 . . .
y = c1 c2 ... cn1 cn
0 x1 1 x2 1 0 . . . . . + . u. . . . 0 xn1 1 pn xn 1 x1 x2 . . .
(4.48)
+ bn u xn1 xn
(4.49)
om Fuente: Cap tulos 5 y 8 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr y Richard M. Murray. Fuente: Cap tulo 2 del libro Systems and Control de Stanislaw H. Zak (2002). Fuente: Cap tulo 4 del libro Multivariable Feedback Control de S. Skogestad y I. Postlethwaite (2006).
Cap tulo 5
El mundo real es no lineal, sin embargo existen un n umero de razones para investigar sistemas lineales. Los sistemas lineales se usan a menudo para aproximar sistemas no lineales. Muchas veces, esta aproximaci on es suciente para el dise no del controlador. El conocimiento de la teor a de sistemas lineales ayuda tambi en a entender la complicada teor a de sistemas no lineales. En esta parte, analizaremos m as conceptos b asicos de sistemas lineales. La forma general del sistema lineal en la forma de espacio de estados, con correspondiente ecuaci on de salida, es: dx = Ax + Bu, dt y = Cx + Du, donde A Rnn , B Rnm , C R pn y D R pm . (5.1)
5.1.
Controlabilidad
Decimos que el sistema din amico descrito por la ecuaci on (5.1) o el par n-dimensional (A, B) es controlable si existe una ley de control u(t ) que transere cualquier estado inicial xo = x(to ) en cualquier tiempo to a un estado nal x f = x(t f ) del espacio de estados en un tiempo t f > to . De otra forma, el sistema o par (A, B) en no controlable. Teorema 1 Las siguientes condiciones son equivalentes: 1. El par n-dimensional (A, B) es controlable. 2. La matriz de controlabilidad n nm
Wc = B AB ... An1 B = n
tiene rango de la completo. 3. Las n las de la matriz eAt B son linealmente independientes para todo t [0, ). 4. La matriz t t T T eA BBT eA d = Vc (t ) = eA(t ) BBT eA (t ) d
0 0
es no singular para todo t > 0. Demostraci on Probando la implicaci on 1 2; esto es, si el par (A, B) es controlable entonces la llamada matriz de controlabilidad B AB ... An1 B Rnmn es de rango de la completo. Probaremos este enunciado por contradicci on ( 2 1). Entonces, asumimos que: rango B AB ... An1 B < n; entonces, existe una vector constante de orden n, q = 0 tal que: qT B = 0T , qT AB = 0T , ...qT An1 B = 0T .
59
60
Por el teorema de Cayley-Hamilton, la matriz A satisface su propia ecuaci on caracter stica. Entonces: An = an1 An1 ... a1 A ao In . Luego: qT An B = 0T = qT (an1 An1 B ... a1 AB ao B) = 0T . Por inducci on obtenemos: qT Ai B = 0T , para i = n + 1, n + 2, ... Ahora sea x(0) = 0 y x(t f ) = q. Ahora mostraremos que no existe ley de control que transera al sistema de x(0) = 0 a x(t f ) = q. De la soluci on de la ecuaci on espacio de estados obtenemos: q = eA(t f to ) x(0) + q=
0 tf tf to
eA(t f ) Bu( )d
eA(t f ) Bu( )d .
Ahora premultiplicamos la ecuaci on resultante por qT para obtener: 0= q porque qT eA(t f ) B = qT B + (t f )AB +
2
=
0
tf
Luego el sistema no puede ser transferido desde x(0) = 0 hasta x(t f ) = q, y luego el sistema x = Ax + Bu es no controlable.
5.1.1.
Ejemplo: Motor DC
M aquinas de corriente cont nua son bastante usadas en sistemas de control en lazo cerrado, en particular para el control de velocidad y torque. Existen de diversos tama nos comenzando a partir de unos cuantos watts, accionados por amplicadores electr onicos, a varios cientos de kilowatss, accionados por generadores Ward-Leonard. Servomotores de bajo consumo de potencia se usan a menudo en instrumentaci on, particularmente en sistemas de control de aviones, donde limitaciones de peso y espacio requieren de motores que provean el m aximo de potencia por unidad de volumen. Un cuerpo conductor que transporta corriente, cuando inmerso en un campo magn etico, experimenta una fuerza ngulo entre el conductor y la proporcional a la magnitud del ujo, la corriente y la longitud del conductor, y el a direcci on del ujo. Cuando el conductor se localiza a una distancia ja de un eje, con respecto al cual puede rotar, se genera un torque proporcional al producto de la fuerza y el radio. En un motor, el torque resultante es la suma de torques nicas dos cantidades que se pueden manipular producidos por conductores individualmente. Para un rotor dado las u son la corriente de armadura y el ujo. Luego, existen dos modos de operaci on de un servomotor DC: a)modo por armadura controlada y b) modo por campo controlado.
Control de armadura
En el motor DC de armadura controlada el campo es excitado de forma separada por una corriente constante i f a partir de una fuente DC ja. El ujo puede ser escrito como = K f i f , K f constante. El torque desarrollado por el motor es proporcional al producto de y la corriente en la armadura y la longitud de los conductores. Dado que el campo es asumido constante, el torque desarrollado por el motor se puede expresar como:
m = Ki ia .
5.1 Controlabilidad
61
Ra ea
La (negligible) Ieq
if constant
El torque del motor es usado para accionar el sistema que posee una inercia total Ieq . Asumiendo el caso ideal donde el torque entregado es igual a la carga (en la pr actica no hay 100 % de eciencia). Entonces: = Ki ia . Ieq (5.2)
donde es la position angular del eje del motor. sta desarrolla un voltaje inducido eb en direcci A medida que la armadura rota en un campo, e on opuesta al suministro y el ujo de armadura. Este voltaje se llama fuerza contra-electromotriz y es proporcional a la velocidad de rotaci on creado por el campo. Dado que el campo es constante, la fuerza contra-electromotriz puede ser expresada como: . eb = Kb (5.3)
donde Kb es la constante de voltaje del motor. El control de la velocidad del motor se obtiene ajustando el voltaje aplicado a la armadura. Su polaridad determina la direcci on de rotaci on del motor. El diagrama esquem atico del sistema motor DC de armadura se presenta en la Fig. 5.1, donde Ra = 1 , La 0H , Kb = 5V/rad/sec, Ki = 5Nm/A, y el momento de inercia efectivo es Ieq = 0,1kgm2 . La fricci on y la inercia del engranaje son despreciables. Aplicando la ley del voltaje de Kirchoff al circuito de la armadura resulta: = ea . Ra ia + Kb Sustituyendo ia de (5.1) en la ecuaci on arriba mostrada y dividiendo ambos lados por Ieq resulta: = Ki ea Kb Ieq Ra Ki Kb Ki = + ea . Ieq Ra Ieq Ra y u = ea . Luego tomando en cuenta los par ametros del sistema, representamos la ecuaci on arriba Sea x1 = , x2 = mostrada en la forma de espacio de estados. 0 1 x 1 = x 2 0 250 Primero formamos la matriz de controlabilidad del sistema: Wc = B AB = 0 50 , 50 12500
T
(5.4)
0 x1 + u. x2 50
y vericamos que el sistema es controlable. Ahora encontraremos un control u que transere el sistema desde un estado inicial x(to ) = 10 1 T x(2) = 0 0 . Recuerde que la soluci on del sistema controlado tiene la forma:
al estado nal
62
x(t ) = eA(t to ) x(to ) + Nuestro objetivo es encontrar u tal que: 0 = x(2) = e2A x(0) +
t to
eA(t ) Bu( )d .
2 0
eA(2 ) Bu( )d .
Se puede vericar que u tiene la forma: u(t ) = BT eA(2t ) donde: eAt = L 1 {(sI A)1 } = Entonces:
2 0 2 0 2 0
eA(2 ) BBT eA
T ( 2 )
e2A x(0),
1 0
eA(2 ) BBT eA 1 0
T ( 2 )
= 0 50
1 250(2 ) ) 250 (1 e
0 50 =
e250(2 )
1 250(2 ) ) 250 (1 e
La estrategia de control arriba mostrada transere el sistema de x(0) = 10 1 a x(2) = 0 0 . Gr acas de x1 y x2 versus tiempo son mostradas en la Fig. 5.2. Una gr aca de u versus tiempo est a dada en la Fig. 5.3.
12 10 8 6 4
u
0
30
x1 x2
20
10
2 0 2
20 10
540
5.1 Controlabilidad
63
Control de campo
La Fig. 5.4 muestra el diagram esquem atico del motor DC de campo controlado donde la corriente de la armadura es mantenida constante y el campo es suministrado a partir de un voltaje ajustable e f .
Ia = Const.
+ ef
Rf if
qm
Lf
El torque desarrollado por el motor es proporcional al ujo creado por la corriente de armadura, la corriente del campo y la longitud de los conductores. Para un motor dado, y dado que la corriente de armadura es constante, el torque puede ser expresado como: = KT i f , (5.5) donde KT es la constante de torque. Este torque es usado para mover yba carda de inercia total J y para vencer la fricci on viscosa. Eso puede ser expresado, despreciando la constante de rigidez K , como: m . m + B = J Aplicando la ley de voltaje de Kirchoff en el circuito del campo se obtiene: f . ef = Rf if +Lf i (5.7) (5.6)
La representaci on espacio de estados se obtiene considerando a la posici on angular y su derivada como los primeros m , la corriente de campo como el tercer estado, x3 = i f , y al voltaje del campo como la entrada estados, x1 = m , x2 = u = e f donde la posici on angular se considera como la salida y = m = x1 . Luego las matrices correspondientes son: 0 0 1 0 A = 0 B/J KT /J , b = 0 , c = 1 0 0 . 1/L f 0 0 R f /L f
5.1.2.
Sistema no controlable
olo si existe una transformaci on de similaridad z = T x tal Teorema 2 El sistema x = Ax + Bu es no controlable si y s que: = TAT 1 = A1 A2 , , B = T B = B1 A 0 0 A4 donde el sistema x r = A1 xr + B1 u es controlable, A1 Rrr , B1 Rrm , y el rango de la matriz de controlabilidad del sistema x = Ax + Bu es igual a r.
64
donde las matrices Q y R satisfacen Wc = QR, donde Q es una matriz ortogonal y R es una matriz triangular superior tal que el rango R=rango Wc . Entonces, premultiplicando la matriz de controlabilidad, Wc , por Q1 reduce esta matriz a una matriz de las triangular superior R porque Q1Wc = R. Sea z = Q1 x la transformaci on de las variables de estado. Entonces en el nuevo sistema coordenado las matrices A y B toman la forma: 1 1 1 0 1 1 1 2 1 1 0 1 1 Q1 AQ = 1 0 1 0 , and Q B = 0 0 . 0 004 0 0 La dimensi on de la parte no controlable es 1.
construir la transformaci on de las variables de estado tal que en el nuevo sistema coordenado la parte controlable sea separada de la parte no controlable. Primero formamos la matriz de controlabilidad del sistema: 1 1 1 0 3 4 1 4 0 0 1 1 0 1 3 5 Wc = B AB A2 B A3 B = 0 0 0 0 0 0 0 0 . 0 1 1 3 2 7 7 19
5.1.3.
Estabilizabilidad
Si los autovalores de la parte no controlada de un sistema x = Ax + Bu est an todo en el semiplano complejo izquierdo abierto- esto es, que la parte no controlada es asint oticamente estable- luego el sistema x = Ax + Bu es estabilizable. En lo que sigue discutiremos m etodos para el dise no de controladores por realimentaci on para el caso de sistemas lineales. El proceso de dise no involucra tres pasos. En el primer paso asumimos que todos los estados est an disponibles y procedemos con el dise no de leyes de control por realimentaci on de estados. Luego procedemos con el segundo paso; que corresponde al dise no del estimador, tambi en denominado como el observador del vector de estados. El ltimo paso consiste en combinar los dos pasos anteriores tal que la ley de control, dise u nada en el primer paso, usa el estimador de estados en vez de el vector de estados real. El resultado de este paso es un compensador combinado controlador-estimador. A continuaci on discutiremos el controlador por realimentaci on de estados.
5.2.
El estado de un sistema din amico es una colecci on de variables que permiten la predicci on del desarrollo de un sistema a futuro. A continuaci on exploraremos la idea de dise nar la din amica de un sistema a trav es de realimentaci on
65
nica idea: la ubicaci de estados. La ley de control por realimentaci on ser a desarrollada paso a paso usando una u on de los autovalores del sistema en lazo cerrado en posiciones deseadas.
5.2.1.
La Fig. 5.5 muestra un diagrama de un sistema de control por realimentaci on de estados t pico. El sistema completo consiste del proceso din amico (planta), que es considerado lineal, los elementos del controlador K y kr , la entrada de referencia (o se nal de comando) r y procesos de disturbio d . El objetivo del controlador por realimentaci on es regular la salida del sistema z tal que rastree la se nal de referencia a un en la presencia de disturbios y tambi en incerteza en el proceso.
Figura 5.5 Sistema de control por realimentaci on de estados. El controlador usa el estado del sistema x y la entrada de referencia r para comandar el proceso (planta) a trav es de su entrada u. El disturbio es modelado a trav es de una entrada aditiva d .
Un elemento importante del dise no de control es la especicaci on de desempe no. La especicaci on m as simple de desempe no es la de estabilidad: en la ausencia de disturbios, nuestro objetivo es hacer que el punto de equilibrio del sistema sea asint oticamente estable. A menudo, especicaciones de desempe no m as sosticadas dotan de propiedades deseadas a una respuesta al escal on o a la respuesta en frecuencia del sistema, tales como tiempo de levantamiento, sobreimpulso y tiempo de establecimiento de la respuesta al escal on. Adicionalmente, una preocupaci on frecuente es que el sistema posea propiedades de atenuaci on de disturbios. Considerando un sistema descrito por la ecuaci on diferencial lineal: x (t ) = Ax(t ) + Bu(t ), x(0) = xo z(t ) = Cx(t ) + Du(t ), , y(t ) = In x(t ) donde hemos ignorado el disturbio d por ahora. Nuestro objetivo es llevar la salida z a una referencia deseada r y mantenerla alli.
5.2.2.
Asumiendo que todos los componentes del vector de estados pueden ser medidos. Dado que el estado en el tiempo t contiene toda la informaci on necesaria para predecir el comportamiento futuro del sistema, la ley de control invariante en el tiempo m as general es una funci on del estado y de la entrada de referencia: u = (x , r ). Si la ley de control por realimentaci on de estados es asumida lineal, entonces la realimentaci on se puede escribir como una combinaci on lineal de todas las variables de estado, incluyendo la referencia: u = Kx + kr r,
66
donde K Rmn es una matriz constante y r es el valor de referencia, asumido por ahora constante. El sistema en lazo cerrado es entonces: x = Ax + B(Kx + kr r), x(0) = xo x = (A BK )x + Bkr r, x(0) = xo Los polos del sistema en lazo cerrado son las raices de la ecuaci on caracter stica: det(sIn A + BK ) = 0. La ley de control por realimentaci on de estados consiste en seleccionar ganancias: ki j , i = 1, 2, ..., m, j = 1, 2, .., n,
tal que las raices de la ecuaci on caracter stica del sistema en lazo cerrado: det(sIn A + BK ) = 0, esten en las ubicaciones deseadas en el plano complejo. Si asumimos que el dise nador ha hecho una selecci on de los polos deseados del sistema en lazo cerrado, y ellos son: p1 , p2 , ..., pn . Los polos (del sistema en lazo cerrado) deseados pueden ser reales o complejos. Si son complejos, ellos deben estar en pares complejos conjugados. Esto es debido al uso de ganancias reales ki j . Una vez que denimos los polos deseados, podemos formar el polinomio caracter stico en lazo cerrado deseado, c (s) = (s p1 )(s p2 )...(s pn )
Nuestro objetivo es seleccionar una matriz de realimentaci on K tal que: det(sIn A + BK ) = sn + n1 sn1 + ... + 1 s + o . El problema arriba presentado es tambi en llamado problema de ubicaci on de polos o problema de asignaci on de autovalores. Primero discutiremos el problema de ubicaci on de polos para una planta con una entrada.
kn = n1 an1
Si el sistema x (t ) = Ax(t ) + bu(t ) no est a en la forma can onica controlable, primero transformamos el sistema en la tal que: forma can onica y luego calculamos el vector de ganancias k k ) = sn + n1 sn1 + ... + 1 s + o . +b det(sIn A
67
Entonces, Luego:
= o ao 1 a1 ... n1 an1 . k , k = kT
donde T es la transformaci on que lleva al sistema x (t ) = Ax(t ) + bu(t ) a la forma can onica controlable. Podemos representar la f ormula de arriba para la matriz de ganancias en una forma alternativa. Para esto, n otese que: q1 q1 A = o ao 1 a1 ... n1 an1 kT . . . . q1 An1 = q1 (o In + 1 A + ... + n1 An1 ) q1 (ao In + a1 A + ... + an1 An1 ). kT An = (ao In + a1 A + ... + an1 An1 ). Entonces: k = q1 c (A). Por el teorema de Cayley-Hamilton, tenemos:
La expresi on para el vector la de ganancias fue propuesto por Ackerman en 1972 y ahora se conoce como F ormula de Ackerman para ubicaci on de polos.
usaremos la f ormula de Ackerman para dise nar el controlador por realimentaci on de estados, u = Kx, tal que los polos en lazo cerrado esten localizados en {1, 2}. Para usar la f ormula de Ackerman, primero formamos la matriz de controlabilidad del sistema x (t ) = Ax(t ) + bu(t ) ltima la de su inversa, denotada por q1 . La matriz de controlabilidad es: y luego encontramos la u b Ab = La inversa de la matriz arriba es: 0 1 . 1 2 Entonces, q1 = 1 2 . El polinomio caracter stico del sistema en lazo cerrado deseado es: 21 . 10
c (s) = (s + 1)(s + 2) = s2 + 3s + 2.
Luego,
68
1 1 10 +2 1 2 01 20 02
x xx x x x .=B .. . . . ... 1 x 0 01
donde la matriz es no singular y cuadrada que consiste de las de B diferentes de cero. Luego, sea: = K. K N otese que: 0 0 . . . k 11 0 0 . . K = B . k21 . . . 0 0 . . . km1 0 ... 0 ... 0 0 0 0 . . . 1n k 0 0 . . . ; 2n k . . . 0 0 . . . mn k
m2 ... k mn1 k
69
K coinciden con las las no ceros de la matriz A en su forma can esto es, las las no ceros en el producto B onica controlable. Si seleccionamos, por ejemplo, las ganancias ki j , i = 1, 2, ..., m y j = 1, 2, ..., n, tal que: 0 1 0 ... 0 0 0 0 1 ... 0 0 . . K = . . ; A BK = A B . . 0 0 0 ... 0 1 o 1 2 ... n2 n1 donde: . K = 1 K
Si el sistema x (t ) = Ax(t ) + Bu(t ) no est a en la forma can onica controlable, primero lo llevaremos a esa forma y luego calcularemos la matriz de ganancias que ubica los polos del sistema en lazo cerrado en las posiciones deseada para el sistema x (t ) = Ax(t ) + Bu(t ) en la forma can onica controlable. la matriz de ganancias que ubica los polos del sistema en lazo cerrado en las posiciones pre-especicadas para el sistema x (t ) = Ax(t ) + Bu(t ) en sus coordinadas originales es entonces dado por: . K = 1 KT donde T es la matriz de transformaci on que lleva al sistema x (t ) = Ax(t ) + Bu(t ) a la forma can onica controlable.
usaremos su forma can onica controlable para encontrar la matriz K R24 tal que los polos en lazo cerrado esten ubicados en: 2, 3 + 3 + i, 3 i, 4. Primero transformamos x (t ) = Ax(t ) + Bu(t ) a la forma can onica controlable. Para eso, formamos la matriz de controlabilidad: 1 0 0 0 0 ... 0 0 1 0 0 ... b1 b2 Ab1 Ab2 A2 b1 ... = 0 0 0 0 1 ... . 0 1 0 5 0 ...
Entonces seleccionamos, procediendo de izquierda a derecha, las primeras cuatro columnas linealmente independientes de la matriz de controlabilidad. Obtenemos: b1 b2 Ab1 A2 b1 .
Entonces, los ndices de controlabilidad son d1 = 3 y d2 = 1. Rearreglamos las columnas y formamos la matriz L de la forma: L = b1 Ab1 A2 b1 b2 = I4 = L1 . ltimas las que necesitamos para la construcci Las u on de la matriz de transformaci on son: q1 = 0 0 1 0 and q2 = 0 0 0 1 . La matriz de transformaci on es:
70
T = q1 q1 A q1 A2 q2
Y el sistema x (t ) = Ax(t ) + Bu(t ) en el nuevo sistema coordenado tiene la forma: 0 100 00 = TAT 1 = 0 0 1 0 and B = TB = 0 0 . A 1 2 3 0 1 0 21 0 0 5 01 El polinomio caracter stico del sistema en lazo cerrado es:
00 0 1 = 1 3 00
1 3 11 0
0 0 . 0 1
El algoritmo aqui presentado para ubicaci on de polos para sistemas de m ultiples entradas presenta m as un valor te orico antes que pr actico. EL algoritmo presenta problemas de implementaci on num erica porque la transformaci on del sistema x (t ) = Ax(t ) + Bu(t ) a la forma can onica controlable sufre de propiedades num ericas pobres. Existen otros algoritmos m as robustos, como los implementados en MATLAB, especicamente en la funci on place. nica. Entonces, los La soluci on del problema de ubicaci on de polos para un sistema de m ultiples entradas no es u grados de libertad restantes pueden ser usados para alcanzar objetivos secundarios. En la semanas siguientes discutiremos un m etodo para construir una ley de control lineal por realimentaci on de estados que ubica los polos del sistema en lazo cerrado en posiciones pre-especicadas y al mismo tiempo minimiza un ndice de desempe no cuadr atico. Como resultado de la discusi on en esta parte, enunciaremos un teorema fundamental de sistemas lineales: Teorema El problema de ubicaci on de polos tiene soluci on para todas las elecciones de los n polos en lazo cerrado, sim etricos con respecto al eje real, si y s olo si el sistema x (t ) = Ax(t ) + Bu(t ) es controlable.
5.2.3.
N otese que kr no afecta la estabilidad del sistema (que es determinado por los autovalores de A BK ) pero si afecta la soluci on en estado estacionario. En particular, el punto de equilibrio y la salida del sistema en lazo cerrado estan dados por: x e = 0 = (A BK )xe + Bkr r, xe = (A BK )1 Bkr r, ze = Cxe + Due
entonces kr debe ser elegido tal que ze = r (el valor deseado de la salida). Asumiendo que D = 0 (el caso m as com un), entonces: ze = r = C(A BK )1 Bkr r,
71
luego para cuando kr sea un escalar (sistema de una entrada y una salida) tenemos: kr = 1/(C(A BK )1 B). N otese que kr es exactamente la inversa de la ganancia en la frecuencia cero del sistema en lazo cerrado.
5.2.4.
La ubicaci on de los autovalores determina el comportamiento de la din amica en lazo cerrado, y como consecuencia, la decisi on m as importante es donde ubicaremos los autovalores. Como en todos los casos de dise no de sistemas de control, existe una concesi on mutua entre la magnitud de la entrada de control, la robustez del sistema a las perturbaciones y el desempe no del sistema en lazo cerrado. En esta secci on revisaremos brevemente estas concesiones mutuas con el caso especial de sistemas de segunda orden.
y = q.
En la forma de espacio de estados, el sistema se escribe como: dx o 0 0 = x+ u, o 2 o ko dt Los autovalores del sistema est an dados por: y = 1 0 x.
= o
2 ( 2 1), o
y observamos que el origen es un punto de equilibrio estable si o > 0 y > 0. N otese que los autovalores son complejos si < 1 y reales en caso contrario. La forma de la soluci on depende del valor de , el cual se denomina factor de amortiguamiento del sistema. Si > 1, decimos que el sistema es sobreamortiguado, y la respuesta natural (u = 0) del sistema est a dado por: y(t ) =
donde = o ( + 2 1) y = o ( 2 1). Vemos que la respuesta consiste en la suma de dos se nales que decaen exponencialmente. Si = 1, entonces el sistema es criticamente amortiguado y la soluci on resulta: y(t ) = e o t (x1o + (x2o + o x1o )t ). ermino en la N otese que la respuesta es a un asint oticamente estable mientras que o > 0, a pesar que el segundo t soluci on este creciendo con el tiempo (pero m as lento que el t ermino exponencial decayente que lo multiplica). Finalmente, si 0 < < 1, entonces la soluci on es oscilatoria y se dice que el sistema es subamortiguado. El par ametro o es conocido como la frecuencia natural del sistema. La respuesta natural del sistema esta dado por: y(t ) = e o t (x1o cos d t + 1 o x1o + x2o sin d t ), d d
72
2 es llamada la frecuencia amortiguada. donde d =6.3. o STATE 1 FEEDBACK DESIGN 185 Debido a la forma simple de un sistema de segunda orden, es posible resolver el sistema en forma anal tica para una entrada del tipo escal on. Para este caso, la soluci on depende de :
y(t ) = k 1 e o t cos d t +
12
e o t sin d t , < 1
y(t ) = k 1 e o t (1 + ot ) , = 1 1 y(t ) = k 1 ( 2
12
+ 1)e o t (
2 1)
1 + ( 2
12
1)e o t ( +
2 1)
, > 1,
donde hemos tomado x(0) = 0. La Fig. 5.6 muestra respuestas de un sistema de 2da orden a una entrada del tipo escal on con k = 1 y para diferentes valores de . La forma de la respuesta es determinado por , y la velocidad de la respuesta es determinada por o : la respuesta es m as r apida si o es grande.
6.3. STATE FEEDBACK DESIGN
Im
= 0 .4 = 0 .7 =1 =0
185
2 1.5
Re
y
1 0.5 0 0
= 1. 2
5 10 Normalized time 0 t
15
(a) Eigenvalues
Figure 6.8: Step response for a second-order system. Normalized step responses h for the
Figura 5.6 Respuestas de un sistema de 2da orden a una entrada del tipo escal on unitario
donde = arccos . El sobreimpulso m aximo ocurrir a por primera vez cuando la derivada de y sea cero, que se puede mostrar que es: Mp = e /
1 2
Adicionalmente tambi en podemos calcular las propiedades de la respuesta al escal on. Por ejemplo, para un sistema subamortiguado: y(t ) = k 1 e o t sin(d t + ) , 12
De la misma forma se pueden calcular otras caracter sticas de la respuesta al escal on, Cuadro 5.7.
Value k Tr = 1/0 e 2 M p = e / 1 Ts 4/ 0
/ tan
= 1/ 2 k 2.2/0 4% 5.9/0
=1 k 2.7/0 0% 5.8/0
Figura 5.7 Propiedades de la respuesta al escal on para un sistema de 2do orden con 0 < < 1.
73
La respuesta en la frecuencia tambi en puede ser calculada expl citamente y est a dada por: Mei =
2 2 ko ko = 2 2 + 2i + 2 (i )2 + 2 o (i ) + o o o
Una ilustraci on gr aca de la respuesta en frecuencia est a dada en la Fig. 5.8. N otese que el pico de la resonancia aumenta a medida que crece .
186
= 0.08 = 0 .2 = 0 .5 =1
2 0 2
Re
0 90 180 1 10
10 Normalized frequency /0
10
(a) Eigenvalues
Figura 5.8 Respuesta en frecuencia de un sistema de 2do orden.
Re .
Decimos que el par de autovalores complejos conjugados , es un par dominante si tiene el menor factor de amortiguamiento comparado con los otros autovalores del sistema. Por consiguiente, se puede decir que el par dominante de autovalores ser a el factor principal en la respuesta del sistema despu es que los transientes debido a otros t erminos (au ltimo no siempre se cumple, a menudo el caso de los autovalores tovalores) hayan desaparecido. A pesar de que esto u dominantes determinana la respuesta (al escal on) del sistema. nico requerimiento formal en la asignaci El u on de autovalores es que el sistema sea controlable. En la pr actia existen otras restricciones porque la selecci on de autovalores tiene un gran efecto en la magnitud y la variaci on del cambio de la se nal de control. Autovalores grandes requerir an por lo general grandes se nales de actuaci on as como tambi en r apidos cambios de estas se nales. La capacidad de los actuadores impondr a restricciones en la posible ubicaci on de los autovalores del sistema en lazo cerrado. A continuaci on, usaremos las ganancias K y kr para dise nar la din amica del sistema en lazo cerrado y satisfacer nuestro objetivo. Los ejemplos a seguir pretender ilustrar y proveer mayor intuici on en como construir tal ley de control por realimentaci on de estados.
74
5.2.5.
Considerando el sistema de la Fig. 5.9, recordemos que este sistema es un modelo para una clase de sistemas en los que el centro de masa es balanceado sobre un punto pivote.
donde = Mt Jt m2 l 2 , Mt = M + m y Jt = J + ml 2 .
ANALISIS DE SISTEMA
Controlabilidad: La matriz de controlabilidad es: 0 Jt / 0 gl 3 m3 / 2 0 lm/ 0 gl 2 m2 (M + m)/ 2 . Wc = B AB A2 B A3 B = 2 3 3 Jt / 0 0 gl m g/ 2 2 2 2 0 lm/ 0 g l m (M + m)/ det(Wc ) = g2 l 4 m4 = 0, 4
y concluimos que el sistema es controlable. Esto signica que podemos mover el sistema desde una condici on inicial hasta un estado na y, en particular, que siempre podemos encontrar una entrada que lleve el sistema desde una condici on inicial hasta el punto de equilibrio.
171
m
75
M p
(a) Segway
Figura 5.9 Sistema de balance.
Polos en lazo abierto: Usando los siguiente par ametos para el sistema (correspondiente, a groso modo, a un humano siendo balanceado por un carro de estabilizaci on): M = 10 kg, m = 80kg, c = 0,1N/m/s, = 0,01N/rad/sec, l = 1m y J = 100kgm2 , 2 g = 9,8m/m . Los autovalores de la din amica del sistema en lazo abierto est an dados por ={0, 2.6842, 2.6851,-0.0011}.
76
SIMULACIONES
La respuesta a una entrada escal on para el controlador aplicado en el sistema linealizado est a dado en la Fig. 5.10 (parte izquierda). Observamos que la fuerza de entrada es excesivamente grande, casi tres veces la fuerza de gravedad en su pico. Para proveer una fuerza m as realista redise namos el controlador para que presenta una din amica controlada un poco m as lenta. Para la din amica del p endulo variamos la frecuencia natural por un factor de tres y mantenemos el factor de amortiguamiento. La din amica del carrito tambi en la desaceleramos, el factor de amortiguamiento permanece en 0.7 pero la frecuencia natural cambia a 1 (correspondiente a un tiempo de subida de 10s). Luego, los polos deseados resultan: = {0,33 0,66i, 0,18 0,18i}. El desempe no del controlador es mostrado en la Fig. 5.10.
190
2
Position p [m]
1 0 0
1 0 0
10
15
Input force F [N]
10
20
30
40
30 20 10 0 10 0 5 10 Time t [s] 15
30 20 10 0 10 0 10 20 Time t [s] 30 40
(a) 1,2 = 1 2i
5.3.
Control integral
Los controladores basados en realimentaci on de estados alcanzan la respuesta correcta en estado estacionario a una entrada de referencia mediante una calibraci on cuidadosa de la ganancia kr . Sin embargo, siendo uno de los principales usos de la realimentaci on el permitir buen desempe no en la presencia de incerteza, requerir tener un modelo exacto de Linear Quadratic Regulators la planta es indeseable. Una alternativa a la calibraci on es el uso de realimentaci on integral, en el cual el controlador usa un integrador para proveer error en estado estacionario cero. Considerando un sistema descrito por la ecuaci on diferencial lineal: x (t ) = Ax(t ) + Bu(t ), x(0) = xo z(t ) = Cx(t ), , y(t ) = In x(t ) el objetivo es llevar la salida z a una referencia deseada r y mantenerla alli. La Fig. 5.11 muestra que el abordaje b asico de la acci on integral en la realimentaci on es el crear un controlador que calcula la integral de la se nal de error, que luego se usa como un t ermino de realimentaci on. Esto se usa mediante el siguiente aumento en la descripci on del sistema con el nuevo estado e: d x Ax + Bu Ax + Bu . = = Cx r zr dt e
77
El estado e es visto como la integral de la diferencia entre la salida real z y la salida deseada r. N otese que si encontramos un controlador que estabilice el sistema, entonces necesariamente tendremos e = 0 en estado estacionario y por consiguiente z = r en estado estacionario.
Figura 5.11 Sistema de control por realimentaci on de estados con aumento de la acci on integral. El controlador usa el estado del sistema x, la entrada de referencia r y la integral del error de salida e para comandar el proceso (planta) a trav es de su entrada u.
Dado el sistema aumentado, dise namos un controlador por realimentaci on de estados de la forma usual, con una ley de control de la forma: u = Kx ki e + kr r, donde K es el t ermino usual de control por realimentaci on de estados, ki es el t ermino integral y kr es usado para jar la entrada nominal para alcanzar el estado estacionario deseado. El punto de equilibrio resultante para el sistema est a dado por: xe = (A BK )1 B(kr r ki ee ). N otese que el valor de ee no es especicado pero autom aticamente se asentar a en el valor que haga e = z r = 0, lo que implica que en equilibrio la salida sera igual a la referencia. Cabe resaltar que esto se mantiene independientemente de los valores especicos de A, B, C y K mientras que el sistema sea estable (que se puede hacer a trav es de la elecci on apropiada de K y ki ). El compensador nal est a dado por: de = z r, dt u = ki e Kx + kr r, donde hemos incluido la din amica del integrador como parte de la especicaci on del controlador. Este tipo de compensador es llamado compensador din amico puesto que tiene su propia din amica interna. El siguiente ejemplo ilustra el abordaje b asico.
5.3.1.
78
Figura 5.12 Sistema de control por realimentaci on de estados con aumento de la acci on integral. Implementaci on. El compensador nal posee el estado e (la integral del error de salida), la entrada de estados del sistema x, la entrada de referencia r, la entrada de la salida controlada del proceso (planta) z y comanda la planta a trav es de su salida u.
dx = ax bg + bw, , dt z = v = x + ve , ngulo de inclinaci on del terreno. La constante a depende donde x = v ve , w = u ue , m es la masa del carro y es el a de las caracter sticas de aceleraci on. Si aumentamos el sistema con un integrador, la din amica de la planta resulta: dx = ax bg + bw, dt , de = z vr = ve + x vr , dt o, en la forma de espacio de estados: d x a0 = 10 dt e
A
x bg b 0 u+ + + . 0 e 0 ve vr
B
N otese que cuando el sistema est a en equilibrio, tenemos e = 0, que implica que la rapidez del veh culo v = ve + x debe ser igual a la rapidez de la referencia deseada vr .
79
y concluimos que el sistema es controlable. Esto signica que podemos mover el sistema desde una condici on inicial hasta un estado nal y, en particular, que siempre podemos encontrar una entrada que lleve el sistema desde una condici on inicial hasta el punto de equilibrio. Polos en lazo abierto: Los autovalores de la din amica del sistema en lazo abierto estan dados por = {0, a}
x + kr vr , , e
y las ganancias kx , ki y kr ser an elegidos para estabilizar el sistema y proveer la entrada correcta para la rapidez deseada. Polos en lazo cerrado: Asumamos que deseamos dise nar el sistema en lazo cerrado para que tenga el siguiente polinomio caracter stico:
c (s) = s2 + a1 s + a2 .
Estabilizaci on por realimentaci on de estados: stico del sistema en lazo cerrado est a dado por: Fijando el disturbio = 0, el polinomio caracter det(sI (A BK )) = det s entonces elegimos: 10 a0 01 10 kx ki = s2 + (bkx a)s + bki ,
. x + kr vr , e
SIMULACIONES
El controlador con integrador resultante estabiliza el sistema y como consecuencia lleva e = z vr a cero, resultando en rastreamiento perfecto. N otese que a un teniendo un peque no error en los valores de los par ametros que denen el sistema, mientras los autovalores del sistema en lazo cerrado sean estables, el error de rastreamiento se aproximar aa cero. Luego, la calibraci on exacta de kr ya no ser a necesaria. De hecho podriamos jar kr = 0 y dejar que el controlador por realimentaci on haga su trabajo. Control integral por realimentaci on tambi en se puede usar para compensar por disturbios constantes. La Fig. 5.12 ngulo = 4o a los t = 8s. La muestra el resultado de una simulaci on en la que el carro encuentra una pendiente con a estabilidad del sistema no se ve afectada por este disturbio externo, y una vez m as vemos que la rapidez del veh culo converge a la rapidez deseada. Esta habilidad de manejar disturbios constante es en general una propiedad de los controladores con realimentaci on integral.
80
Velocity v [m/s]
1 20
Throttle u
19 18 0
10
20 Time t [s]
30
40
Figure 6.15: Velocity and throttle for a car with cruise control based onproporcional proportional (dashed) Figura 5.13 Rapidez y apertura de la v alvula de alimentaci on de combustible basadas en control (linea punteada) y control ngulo proporcional integral (linea s olida). Disturbio: pendiente con a constante. and PI control (solid). The PI controller is able to adjust the throttle to compensate for the
om y Fuente: Cap tulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr Richard M. Murray. Fuente: Cap tulo 3 del libro Systems and Control de Stanislaw H. Zak (2002). Fuente: Cap tulo 6 del libro Linear System Theory and Design, de C.T.Chen.
Cap tulo 6
En esta parte mostramos como usar control por realimentaci on de estados para modicar la din amica del sistema a trav es de observadores. Introducimos el concepto de observabilidad y mostramos que si un sistema es observable es posible recuperar los estados en base a las medidas de las entradas y salidas del sistema. Luego mostramos como dise nar un controlador con realimentaci on partiendo de los estados observados. Un concepto importante es el principio de separaci on, que ser a probado. La estructura del controlador que se deriva es bastante general y se puede obtener en otros m etodos de dise no.
6.1.
Observabilidad
Como hemos observado en las secciones anteriores, la controlabilidad del sistema implica la habilidad para controlar completamente el vector de estado. Supongamos ahora que no podemos acceder a los estados del sistema o que conocer todos los estados del sistema requerir a un n umero excesivo de sensores, lo que es m as realista. En esta parte investigamos como podemos estimar los estados usando un modelo matem atico y algunas medidas. Mostraremos que el c alculo de los estados ser a realizado por un sistema din amico llamado observador. Consideremos el sistema descrito por la ecuaci on diferencial lineal: x (t ) = Ax(t ) + Bu(t ), x(0) = xo , y(t ) = Cx(t ) + Du(t ), donde C R pn , p n, y D R pm . Nuestra intenci on es conocer el comportamiento din amico de todos los estados a partir de sus entradas y salidas (se nal medida), ver Fig. 6.1. La se nal medida puede estar contaminada con ruido n, sin embargo comenzaremos analizando el caso sin ruido. Escribimos x para el estado estimado que resultado del observador.
202
Process u x = Ax + Bu y = C x + Du y
n x Observer
Figura 6.1 Diagrama de bloques del observador. El observador usa las medidas del proceso y (posiblemente contaminada con ruido n) y las entradas u para estimar el estado actual del proceso.
Observabilidad Un sistema lineal es observable si existe un tiempo nito t f > to tal que para cualquier u(t ) y resultante y(t ) en el tiempo [to , t f ] podemos determinar x(t ), to < t < t f , conociendo completamente la entrada u y la salida y.
81
82
N otese que podemos decir que nuestro objetivo es determinar x(to ) ya que una vez x(to ) es obtenido, x(t ) se puede determinar conociendo u(t ) y y(t ) en el intervalo de tiempo [to , t f ]. A continuaci on mostraremos como podemos determinar constructivamente x(to ), dados u(t ) y y(t ). Primero notamos que la soluci on y(t ) est a dada por: y(t ) = CeA(t to ) x(to ) + Deniendo: g(t ) = CeA(t to ) x(to ) = y(t )
t to
donde la parte derecha de la igualdad es conocida. Nuestro objetivo es determinar x(to ). Teniendo x(to ), podemos determinar enteramente x(t ) para todo t [t f , to ] de la f ormula: x(t ) = eA(t to ) x(to ) +
T
t to
eA(t ) Bu( )d .
Premultiplicando ambos lados de g(t ) por eA (t to )CT e integrando la expresi on resultante entre los limites to y t f , obtenemos: t T t T eA (t to )CT g(t )dt . eA (t to )CT CeA(t to ) dtxo =
to to
Sea Vo (to , t f ) =
tf to
eA t CT CeAt dt .
Entonces, despues de algunas manipulaciones y asumiendo que la matriz Vo (to , t f ) es invertible, obtenemos: xo = eAto Vo1 (to , t f )eA
Tt o
tf to
eA
T (t t
o)
CT g(t )dt .
El conocimiento de xo nos permitir a reconstruir totalmente el estado x(t ) sobre todo el intervalo [to , t f ]. Concluimos que si la matriz Vo (to , t f ) es invertible, entonces el sistema es observable.
6.1.1.
Ejemplo
Para un sistema din amico modelado por: x = 1/2 1/2 1 x+ u = Ax + bu, 1/2 1/2 1 y= 11 x = cx,
determinaremos x(t ) sobre el intervalo [0, 10] sabiendo que u(t ) = 1 para t 0 y y(t ) = t 2 + 2t para t 0. Primero calcularemos x(0). Tenemos que to = 0 y t f = 10. Entonces: x(to ) = x(0) = eAto Vo1 (to , t f )eA = Vo1 (0, 10) donde: g(t ) = y(t ) c
0 10 0 10
Tt o
tf to
eA
T (t t
o)
cT g(t )dt
eA t cT g(t )dt ,
eA(t ) bu( )d .
6.1 Observabilidad
83
1 s
1 1 2 s2 1 1 2 s2
1 1 2 s2 1 1 1 + s 2 s2
1 1 1 2t 2t . 1 2t 1 + 1 2t 10
eA t cT ceAt dt , 1 2t + t 2 1 t 2 dt 1 t 2 1 + 2t + t 2
=
0
1t 1+t
1t 1+t
3 3
dt =
0 10
=
0
eA(t ) bu( )d
t 0
1 + t d = t 2 + 2t 1+t +
t t 0
(2t 2 )d
t 2 + 2t 2t ( ) 0 + 2 Entonces:
10 0
= t 2 + 2t t 2 = 2t .
10
eA t cT g(t )dt =
0
10
(1 t )2t t2 2 t3 dt = 2 3 3 (1 + t )2t t +2 3t
=
0
566,667 . 766,667
Luego calculando la condici on inicial xo : x(0) = Vo1 (0, 10) Conociendo x(0), podemos encontrar x(t ) para t 0, x(0) = eAt x(0) +
0 t t 0
eA t ct g(t )dt =
1 . 1
eA(t ) bu( )d .
2
1 + t (1 + t )t t2 + 2 1+t (1 + t )t t2
t2 2
1 + 2t + 1
t2 2
6.1.2.
Teorema
Las siguientes condiciones son equivalentes: 1. 2. 3. 4. El sistema x = Ax + Bu, y = Cx + Du es observable. La matriz Vo (to , t f ) es no singular para todo t f > to . Las n columnas de CeAt son linealmente independientes para todo t [0, ) sobre los n umeros reales. La matriz de observabilidad Wo :
84
C CA Wo = . R pnn . . CAn1
Al igual que en el caso de controlabilidad, usando una transformaci on de similaridad podemos separar la parte observable de la no observable. Si los autovalores de la parte no observable son asint oticamente estables, entonces decimos que el sistema es detectable. Una vez denido el concepto de observabilidad, volveremos a responder la pregunta de como construir un observador para un sistema. Buscamos observadores que sean representados como sistemas lineales y tomen las entradas y salidas del sistema para producir un estimado de los estados del sistema. Esto es, deseamos contruir un sistema din amico de la forma: dx = Fx + Gu + Hy, dt donde u y y son la entrada y salida del sistema original y x Rn es un estimado del estado con la propiedad que x (t ) x(t ) a medida que t .
6.2.
Considerando el sistema lineal con D = 0 para simplicar la exposici on: x (t ) = Ax(t ) + Bu(t ), x(0) = xo , y(t ) = Cx(t ), donde C R pn , p n. Asumiendo que el sistema es observable. Nuestro objetivo es determinar un sistema din amico que estime el vector de estados x basado en las entradas u y salidas y. A continuaci on intentamos determinar los estados simplemente simulando las ecuaciones del sistema con las entradas u, estimador en lazo abierto: dx = Ax + Bu. dt Para encontrar las propiedades del sistema, introducimos el error de estimaci on: x = xx . Entonces, la din amica del error de estimaci on est a descrito por: = Ax , x =x x con el error inicial de estimaci on siendo: x (0) = x(0) x (0). Si los autovalores de la matriz A estan en el semiplano complejo izquierdo abierto, entonces el error converge a cero. Sin embargo, no tenemos ningun control sobre la variaci on de la convergencia o sobre el valor adonde convergen los estados reales y estimados (independientemente, los estados x y x tambi en convergen a cero). Por otro lado, la matriz A no necesariamente tendr a sus autovalores en el semiplano complejo izquierdo abierto. Luego este estimador en lazo abierto no es pr actico ya que queremos que nuestra estimaci on converja r apidamente a un estado diferente de cero para asi poder usarlo en nuestro controlador, y esto independiente de las caracter sticas del sistema. Ahora analicemos el ltimo caso se denomina estimador en lazo cerrado, el observador Luenberger o el caso incluyendo la salida y. Este u estimador de orden completo asint otico. La din amica del estimador en lazo cerrado esta descrita por:
85
dx = Ax + Bu + L(y Cx ), dt la realimentaci on de la se nal medida es proveida por el t ermino L(y Cx ), que es proporcional a la diferencia entre la salida observada y la salida estimada por el observador. La din amica del error de estimaci on viene siendo gobernada por: x =x x . = (A LC)x , x (0) = x(0) x (0). La matriz L puede ser elegida del tal forma que A LC tenga sus autovalores con partes reales negativas, y como consecuencia, el error x tienda a cero. La variaci on de la convergencia es determinada por una selecci on apropiada de autovalores. Es importante destacar que las propiedades de convergencia pueden ser dise nadas para ser m as r apidas con relaci on a la din amica del sistema. Adicionalmente, esta versi on de observador trabaja a un en el caso de sistemas inestables. N otese la similaridad entre los problemas de encontrar un realimentador de estados y encontrar un observador. Realimentaci on de estados por ubicaci on de polos es equivalente a encontrar una matriz K tal que A BK tenga ciertos autovalores. Dise nar un observador con autovalores prescritos es equivalente a encontrar una matriz L tal que A LC tenga ciertos autovalores. Dado que los autovalores de una matriz y su transpuesta son los mismos podemos establecer las siguientes equivalencias: A AT , B CT , K LT , Wc WoT . El problema de dise no del observador es el dual del problema de dise no del realimentador de estados. Luego podemos ltimo punto con valernos de las herramientas aprendidas en la teor a de realimentaci on de estados. Ilustraremos este u un ejemplo.
6.2.1.
Ejemplo
construir la matriz L R42 tal que los autovalores de A LC estan localizados en: {2, 3 + i, 3 i, 4}. En nuestra construcci on de la matriz de ganancias L usamos la forma can onica observable del sistema mostrada en Clase04-01. Nuestro objetivo es entonces contruir la matriz L tal que el polinomio caracter stico de la matriz A LC es: det(sI4 A + LC) = s4 + 12s3 + 54s2 + 108s + 80. tal que: Usando la forma can onica observable del sistema, seleccionamos L 0 0 0 80 L = 1 0 0 180 . C A 0 1 0 54 0 0 1 12
86
nalmente:
80 108 , 54 17
6.2.2.
En esta secci on consideraremos la planta representado por el sistema espacio de estados de la forma: d x(t ) = Ax(t ) + Bu(t ), x(0) = xo . dt y(t ) = Cx(t ), (6.1)
N otese que hemos asumido que no hay t ermino directo en el sistema (D = 0). A menudo esta es una suposici on realista. En esta parte nuestra intenci on es dise nar un controlador por realimentaci on de estados para el caso donde solo la salida es medida. Adem as asumimos que el sistema es controlable y observable. En el cap tulo anterior encontramos una realimentaci on de la forma: u = Kx + kr r, para el caso en que todos los estados eran medidos, y en la secci on anterior desarrollamos un observador que genera estimados del estado x basado en entradas y salidas. En esta parte combinaremos ambas ideas para encontrar una realimentaci on que dote de autovalores deseados al sistema en lazo cerrado para el caso de sistemas donde solo salidas son disponibles para realimentaci on. Si todos los estados no se pueden medir, parece razonable intentar la siguiente realimentaci on: u = K x + kr r, donde x es la salida del observador de estados, en otras palabras: dx = Ax + Bu + L(y Cx ). dt (6.3) (6.2)
Dado que el sistema (6.1) y el observador (6.3) son ambos de dimensi on n, el sistema en lazo cerrado es de dimensi on 2n con los estados (x, x ). La evoluci on de los estados esta descrita por (6.1)-(6.3). Para analizar el sistema en lazo cerrado la variable de estado x es reemplazada por: x = xx . Sustrayendo (6.3) de (6.1) resulta: x =x x . = Ax Ax L(Cx Cx ) = Ax LCx = (A LC)x . Retornando a la din amica del sistema, introduciendo u de (6.2) en (6.1) y usando (6.4) para eliminar x resulta: dx = Ax + Bu = Ax BK x + Bkr r = Ax BK (x x ) + BKr r dt = (A BK )x + BK x + Bkr r. El sistema en lazo cerrado es entonces gobernado por: (6.5) (6.4)
87
d x A BK BK = x 0 A LC dt x . y= C0 x
x Bkr r, + 0 x
(6.6)
N otese que el estado x , que representa el error del observador, no se ve afectado por la se nal de referencia r. Esto es deseable dado que no queremos que la se nal de referencia genere errores en el observador. Con la din amica del sistema siendo diagonal por bloques, encontramos que el polinomio caracter stico del sistema en lazo cerrado es: c (s) = det(sI A + BK ) det(sI A + LC), lo que signica que el dise no de la ley de control es separado de la construcci on del estimador. Esto es lo que conocemos como el principio de separaci on. El resultado es resumido a continuaci on. Teorema: (Ubicaci on de polos por realimentaci on de salidas). Considere el sistema: d x(t ) = Ax(t ) + Bu(t ), x(0) = xo dt y(t ) = Cx(t ). El controlador descrito por: dx = Ax + Bu + L(y Cx ) = (A BK LC)x + Ly, dt u = K x + kr r, da un sistema en lazo cerrado con el polinomio caracter stico:
6.2.2.1.
Algunos autores recomiendan que la parte real de los polos del estimador -esto es, la parte real de los autovalores de la matriz A LC - est en de 2 a 6 veces m as hacia la izquierda en el semiplano complejo izquierdo que la parte real de los polos del controlador, que son los autovalores de la matriz A BK . Tal elecci on asegura un decaimiento r apido del error de estimaci on x = xx comparado con la din amica deseada del controlador. Esto, a su vez, hace que los polos del controlador dominen la respuesta del sistema en lazo cerrado. Dado que los polos del estimador representan una medida de la rapidez con la que el error x = xx decae a cero, uno debe tender a asignar los polos del estimador bien hacia adentro del semiplano complejo izquierdo. Sin embargo, decaimiento r apido requiere de largas ganancias que
88
213
A Process
L x x
e y C
A Observer Controller
Figura 6.2 Diagrama de bloques sistema de control basado en un observador. El observador usa las medidas del proceso y y las entradas u para estimar el estado actual del proceso. El estimado es usado por el controlador por realimentaci on de estados para generar la entrada correctiva. El controlador est a formado por el observador y la realimentaci on de estados.
pueden llevar a la saturaci on de algunas se nales y efectos no lineales impredecibles. Si los polos del estimador fuesen m as lentos que los polos del controlador, la respuesta del sistema en lazo cerrado estar a dominada por el estimador, lo cual es indeseable. Como es usual en la practica de ingenier a, el t ermino compromiso puede ser usado para describir el proceso de construcci on de la estructura nal del compensador.
6.2.2.2.
Ejemplo: Motor DC
MODELO DEL SISTEMA Considere el sistema motor DC de armadura que presenta la esquem atica de la Fig. 6.3, donde Ra = 5 , La = 200mH, Kb = 0,1V/rad/sec, Ki = 0,1Nm/A, la raz on del engranaje N1 /N2 = 1/50. La inercia de la armadura es Iarmadura = 2 103 kgm2 . La carga de 10 kg est a localizada a un radio efectivo de 0.2 m. La inercia del engranaje y fricci on son despreciables. Primero construimos un modelo espacio de estados del motor DC. Empezamos escribiendo la ecuaci on que relaciona el torque a la aceleraci on angular: , m = Ieq (6.7) donde: Ieq = Iarmadura + (N1 /N2 )2 Icarga = 2 103 kgm2 + (1/50)2 10 (0,2)2 kgm2 = 2,16 103 kgm2 . dia + eb = ea , dt
m = Ki ia .
(6.8)
El torque del motor es igual al torque entregado a la carga (caso ideal, en la pr actica no hay 100 % de eciencia). Entonces, combinando (6.7) y (6.8) resulta:
89
= Ki ia Ieq
ia ea
Ra
La
eb if constant
Gear
l Il Output Potentiometer
Figure 3.8
= , u = ea , y y = l . Luego tomando en cuenta la denici on de las variables de estado, Sea x1 = ia , x2 = , x3 = representamos la ecuaciones del modelo en la forma de espacio de estados: Ra b 1 La 0 K x 1 x1 La La x 2 = 0 0 1 x2 + 0 u Ki x 3 x3 0 0 Ieq 0 x1 N1 x2 . 0 y= 0 N 2 x3 Sustituyendo los par ametros del sistema dados, obtenemos de la ecuaci on mostrada arriba: 5 x1 25 0 0,5 x 1 x 2 = 0 0 1 x2 + 0 u = Ax + bu 0 46,296 0 0 x3 x 3 x1 y = 0 0,02 0 x2 = cx. x3 ANALISIS DEL SISTEMA Polos en lazo abierto Los autovalores de la din amica del sistema en lazo abierto est an dados por: {0, 24,0307, 0,9630} Controlabilidad La matriz de controlabilidad es: 5 125 3009,3 Wc = b Ab A2 b = 0 0 231,5 . 0 231,5 5787
90
Observabilidad La matriz de observabilidad, usando el sistema dual w = AT w + cT n es: 0 0 0,9259 0 . WoT = cT AT cT (AT )2CT = 0,02 0 0 0,02 0
El determinante de la matriz es det(WoT ) = 0, y concluimos que el sistema es observable. DE ESTADOS DEL CONTROL POR REALIMENTACION DISENO
6.2.2.3.
Polos deseados Nuestro siguiente paso es dise nar el controlador por realimentaci on de estados u = Kx + Kr r, tal que los autovalores de A bK son: {1 + i, 1 i, 10}. El polinomio caracter stico del sistema en lazo cerrado es:
y,
Luego tenemos:
91
= 2,60 0,0864 0,005 . K = KT Entonces: 12 0,432 0,4752 . 0 1 A bK = 0 46,294 0 0 K = q1 c (A). K = 2,5879 0,0860 0,0049 .. La funci on de transferencia del sistema en lazo cerrado es: 4,6296kr L (y(t )) Y (s) = = c(sI A + bK )1 bKr = 3 . L (r(t )) R(s) s + 12s2 + 22s + 20 La respuesta del sistema en lazo cerrado al escal on de magnitud igual a 1/kr es presentado en la Fig. 6.4.
O, usando la f ormula de Ackerman (s olo funciona para sistemas una entrada - una salida):
0.25
0.2
Figura 6.4 Respuesta del sistema en lazo cerrado del motor para un escal on de magnitud 1/kr .
6.2.2.4.
Polos deseados Nuestro siguiente paso es dise nar el estimador de orden completo ubicando los polos del estimador en: {4, 5 + 2i, 5 2i}. El polinomio caracter stico del estimador es: det(sI3 A + Lc) = (s + 4)(s + 5 2i)(s + 5 + 2i) = s3 + 14s2 + 69s + 116.
92
Ganancia de estimador L Para ubicar los polos en las posiciones deseadas, primero transformamos el sistema a la forma can onica observable. O, equivalentemente al sistema dual w = AT w + cT n a su forma can onica controlable. ltima la de la inversa de WoT , q La u 1 es: q 1 = 1,0800 0 0 . La matriz de transformaci on que lleva al sistema a su forma can onica controlable es: q 1 1,1 0 0 = q 1 AT = 27 0 50 . T 650 50 1250 q 1 (AT )2
yc Las matrices A en las nuevas coordenadas son: 0 0 1 0 T = T 1 = 0 . AT T 1 = 0 0 1 yc T = cT T A 1 0 23,1481 25 T tal que: Ahora encontramos L 0 1 0 T c T = 0 0 1 . A T L 116 69 14 T = 116 45,8519 11 , L
La din amica del estimador de estados de orden completo es descrita por: x = (A Lc)x + bu + Ly, esto es: 25 165,2544 0,5 5 8263 0 11 1 x x = + 0 u + 550 y. 46,2963 320,8519 0 0 16042
Conectamos el estimador de orden completo del motor DC, junto con la realimentaci on de estados, entonces obtenemos el sistema en lazo cerrado con el compensador controlador-estimador-orden-completo combinado. La Fig. 6.5 muestra la gr aca de x1 y su estimado para el sistema en lazo cerrado con estimador en el lazo, donde r = 0, T x(0) = 1 2 0,1 , y x (0) = 0. El dise no del estimador de orden reducido sera presentado junto con la teor a de estimadores de orden reducido. Siguiendo con la respuesta a la pregunta de como construir un observador para un sistema, al igual que en el caso del observador de orden completo, consideraremos observadores que sean representados como sistemas lineales y tomen las entradas y salidas del sistema para producir un estimado de los estados del sistema. La diferencia con respecto al observador anterior radica en que se aprovechar a el hecho de que ciertos estados se pueden denir directamente usando la salida del sistema, y asi, el observador s olo debe concentrarse en estimar los estados no conocidos.
93
Figura 6.5 Gr aca de x1 y su estimado versus el tiempo para el sistema en lazo cerrado con un estimador de orden completo en el lazo.
Figure 3.10
6.3.
Considerando el sistema lineal n dimensional con D = 0 para simplicar la exposici on: x (t ) = Ax(t ) + Bu(t ), x(0) = xo , y(t ) = Cx(t ) (6.9)
donde A, B, C son, respectivamente, matrices reales constantes n n, n p y q n (q n). Asumiendo que el sistema es observable. Nuestro objetivo es determinar un sistema din amico que estime el vector de estados x basado en las entradas u y salidas y. Asumiendo que C tiene rango de columna completa, esto es rango C = q. Denir P= C , R (6.10)
donde R es una matriz real constante (n q) n y es enteramente arbitraria siempre y cuando P sea no singular. Calculando la inversa de P como . (6.11) Q = P1 = Q1 . . Q2 , donde Q1 y Q2 son matrices n q y n (n q). Claramente se tiene que In = PQ = C R Q1 Q2 = I 0 CQ1 CQ2 . = q 0 Inq RQ1 RQ2 (6.12)
Ahora transformaremos (6.9) usando x = Px, x = PAP1 x + PBu y = CP1 x = CQ = Iq 0 x , que puede ser particionado como, 1 x x 2 11 A 12 B x 1 A + 1 u, B2 x 2 A21 A22 , y = Iq 0 x =x 1 = (6.13)
11 , A 12 , A 21 y A 22 son, respectivamente, donde x 1 consiste en los primeros q elementos de x yx 2 es lo que queda de x ; A matrices q q, q (n q), (n q) q y (n q) (n q); B1 y B2 son particionadas apropiadamente. De (6.13) vemos que y = x 1 . Entonces solo necesitaremos estimar los n q elementos de x . Consecuentemente solo necesitamos un
94
estimador de estados de dimensi on n q en lugar de un estimador de estados de dimensi on n que presentamos en la clase anterior. Usando x 1 = y, reescribimos (6.13) como 11 y + A 12 x 1 u, y =A 2 + B 2 u, x 2 = A21 y + A22 x 2 + B y de forma m as sucinta a un usando 21 y + B 2 u, u =A 11 y B 1 u, w=y A que son funciones de se nales conocidas y y u, luego (6.14) se pueden reescribir como, SINTESIS: 22 x x 2 = A 2 + u , 12 x w =A 2 . (6.15) (6.14)
N otese que si la ecuaci on din amica en (6.15) es observable, se puede construir un estimador de x 2 . x x , y =C =A + Bu Teorema El sistema x = Ax + Bu, y = Cx en (6.9) es observable o, equivalentemente, el sistema x en (6.13) es observable si y solo si el sistema x 2 = A22 x 2 + u , w = A12 x 2 en (6.15) es observable. Asimismo, se puede probar la controlabilidad de los sistemas involucrados arriba. 22 x 12 x 2 = A 2 + u , w = A 2 es observable. Consecuentemente, Luego, x = Ax + Bu, y = Cx es observable, entonces x existe un estimador de estados de x 2 de dimensi on n q de la forma 22 L 12 )x +u A 2 = (A 2 + Lw , x (6.16)
22 L 12 ) pueden ser arbitrariamente asignados mediante una elecci A . La tal que los autovalores de (A on apropiada de L sustituci on de u y w en (6.16) resulta en 11 y B 21 y + B 22 L 12 )x (y 1 u) + A 2 u. A 2 + L A x 2 = (A Esta ecuaci on contiene la derivada de y. Esta derivada se puede eliminar deniendo . 2 Ly z=x Luego (6.18) resulta IMPLEMENTACION: 22 L 12 )(z + Ly 21 L 11 )y + (B A ) + (A A 2 L B 1 )u z = (A 22 L 12 )z + [(A 22 L 12 )L 21 L 11 )]y + (B A A + (A A 2 L B 1 )u (A = (6.18) (6.17)
(6.19)
Esta es una ecuaci on din amica de dimensi on n q con y y u como entradas que se puede construir f acilmente usando, es un estimado de x por ejemplo, con circuitos de ampicadores operacionales. De (6.18) vemos que z + Ly 2 . De hecho, ), luego tenemos si denimos e = x 2 (z + Ly 21 x 22 x 22 L 12 )(z + L 2 u (A A x x 1 ) = A 1 + A 2 + B 1 ) 2 (z +L e =x (A21 LA11 )x 1 (B2 LB1 )u LA11 x 1 LA12 x 2 LB1 u 22 L 12 )(x A x = (A 2 z L 1 ) e = (A22 LA12 )e. (6.20)
22 L 12 ) pueden ser arbitrariamente asignados, la raz A Dado que los autovalores de (A on con la que e(t ) se aproxima ) se aproxima a x a cero o, equivalentemente, la raz on con la que (z + Ly 2 se puede determinar por el dise nador. Luego provee un estimado de x z + Ly 2 . para formar 2 = z + Ly 1 con x Combinando x 1 = y = x
95
Esta expresi on provee un estimado del vector de estados ndimensional original x. Una comparaci on entre los estimadores de estado de orden n q y n est a dada en funci on del orden. El observador de orden reducido requiere de la transformaci on presentada en (6.10). Excluyendo este paso, la computaci on requerida en el caso del observador de orden reducido es claramente menor en comparaci on al observador de orden completo. En la implementaci on, el observador de orden reducido tambi en requiere de un menor n umero de integradores. En el caso del observador de orden reducido, la se nal y es realimentada atrav es de la matriz constante Q1 hacia la salida del estimador. Entonces, si y es contaminada con ruido, estos ruidos aparecer an a la salida del estimador. En el caso del observador de orden completo, la se nal y es integrada o ltrada; de ahi que ruidos de alta frecuencia en y ser an suprimidos con un observador de orden completo.
6.3.1.
Se puede probar que el principio de Separaci on tambi en se cumple en el caso del estimador de orden reducido. COMPLETAR...
6.3.2.
Ejemplo: Motor DC
en esta parte nos centraremos en el dise no de un estimador de orden reducido. Escogiendo los polos del estimador de orden reducido en {5 + 2i, 5 2i}. Deniendo la matriz de transformaci on P a continuaci on: 0 0,02 0 P = 1 0 0 , 0 0 1 0 10 P = 50 0 0 , 0 01
Usando el modelo del motor DC, como descrito a continuaci on 5 25 0 0,5 x1 x 1 x 2 = 0 0 1 x2 + 0 u = Ax + bu 0 46,296 0 0 x3 x 3 x1 y = 0 0,02 0 x2 = cx, x3
96
x 1 x 2
0 + 5 u, . 0
La s ntesis del estimador se hace en base al siguiente sistema: x 2 = 25 0,5 x 2 + u , 46,296 0 . w = 0 0,02 x 2
El polinomio caracter stico del estimador de orden reducido es: 22 + L 12 ) = (s + 5 2i)(s + 5 + 2i) = s2 + 10s + 29. A det(sI2 A = l1 , entonces la siguiente ecuaci Sea L on debe ser satisfecha: l2 s l 25 0,5 10 + 1 l2 46,296 0 01 0 0,02 = s + 25 0,02l1 + 0,5 46,296 s + 0,02l2 = s2 + 10s + 29.
s2 + (25 + 0,02l2 )s + 46,296(0,02l1 + 0,5) + 25(0,02l2 ) = s2 + 10s + 29. = Finalmente, se obtiene que: L 411,3228 750 La din amica del estimador de estados de orden reducido es descrita por: 22 L 12 )z + [(A 22 L 12 )L 21 L 11 )]y + (B A A + (A A 2 L B 1 )u, z = (A Iq 0 y x = Q1 Q2 Inq L z esto es: 25 8,7265 5 3738,2 z+ u+ y, 46 , 296 15 0 7792,6 10 411,3228 y 50 x = 0 0 z+ 750 01 z =
Si conectamos el estimador de orden reducido del motor DC, junto con la realimentaci on de estados antes calculada, entonces obtenemos el sistema en lazo cerrado con el compensador controlador-estimador-orden-reducido combinado. La Fig. 6.6 muestra la gr aca de x1 y su estimado para el sistema en lazo cerrado con estimador en el lazo, donde r = 0, T x(0) = 1 0,2 0,1 , y z(0) = 0.
Fuente: Cap tulo 3 del libro Systems and Control de Stanislaw H. Zak (2002). om y Fuente: Cap tulo 7 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr Richard M. Murray.
97
4 Time (sec)
10
Figura 6.6 Gr acas de x1 y su estimado versus tiempo para el sistema no lineal en lazo cerrado con estimador de orden reducido en el lazo.
Cap tulo 7
Estabilidad y desempeno
7.1.
Estabilidad
En general, puede ser dif cil obtener una soluci on expl cita de las ecuaciones diferenciales no lineales que modelan un sistema din amico. Sin embargo, a menudo no necesitamos conocer las soluciones expl citas de las ecuaciones del modelo. En su lugar, estamos interesados en el comportamiento de las soluciones a medida que el tiempo tiende a innito. Adicionalmente, en muchos sistemas f sicos un peque no cambio en las condiciones iniciales resulta en un peque no cambio en la soluci on. Espec camente si un sistema es perturbado de la posici on de reposo, o de la posici on on de equilibrio es estable si de equilibrio, luego comienza a moverse. A grosso modo, podemos decir que una posici para peque nas perturbaciones el sistema no se va muy lejos de esta posici on. Este concepto es ilustrado mediante una bola que descansa en equilibrio en una hoja de metal doblada en varias formas con secciones transversales como mostrado en la Fig. 7.1. Esta gura presenta 4 escenarios posibles. Despreciando las fuerzas de fricci on, una peque na perturbaci on del equilibrio lleva a: 1. Movimiento oscilatorio alrededor del punto de eequilibrio independientemente de la magnitud de las perturbaciones iniciales. Es este caso la posici on de equilibrio es globalmente estable. 2. La nueva posici on es tambi en un equilibrio, y la bola permanecer a en esta posici on. Aqui la posici on de equilibrio es estable. 3. La bola se aleja y no retorna a la posici on de equilibrio. La posici on de equilibrio es inestable. 4. Movimiento oscilatorio en torno al equilibrio, a menos que la perturbaci on sea demasiado grande y la bola se ve forzada a oscilar en una nueva posici on de equilibrio. La posici on de equilibrio es localmente estable.
(1)
(2)
(3)
Figura 7.1 Ilustraci on de posiciones de equilibrio estables e inestables.
(4)
Si se toma en cuenta la fricci on, el movimiento oscilatorio decrecer a permanentemente hasta que la bola retorne al punto de equilibrio como eb los puntos 1 y 4 arriba. Nos referimos a tales posiciones de equilibrio como siendo asint oticamente estables. En la discusi on de conceptos de estabilidad, impl citamente, se asume, como en el punto 4, que existe una regi on peque na para las perturbaciones iniciales permitidas para la cual los movimientos subsecuentes
99
100
7 Estabilidad y desempe no
convergen a la posici on de equilibrio. Sin embargo, si, como en el punto 1, cualquier perturbaci on inicial conlleva a un movimiento que converge a la posici on de equilibrio, entonces tenemos estabilidad asint otica global, que tambien se reere como estabilidad asint otica en la grande.
7.1.1.
Consideramos una clase de sistemas din amicos modelados por la ecuaci on: x (t ) = f (t , x(t )), x(to ) = xo , (7.1)
donde x Rn es el vector de estados y f : R Rn Rn es una funci on vectorial con los componentes: fi (t , x1 , x2 , ..., xn ) : R Rn R, i = 1, 2, ..., n.
Asumiendo que los fi s son cont nuos y que tienen derivadas parciales de primer orden cont nuas. Bajo estas suposi nica. Denotamos la soluci ciones , la soluci on de x (t ) = f (t , x(t )), x(to ) = xo , existe y es u on como x(t ) = x(t ; to , xo ). Si los fi s no dependen expl citamente de t , luego el sistema es representado como x (t ) = f (t , x(t )) = f (x(t )) y es llamado aut onomo; de otra forma es llamado no aut onomo. Un punto de equilibrio o estado es un vector constante, digamos xe , tal que: f (t , xe ) = 0, para todo t . Observese que un estado de equilibrio xe es una soluci on constante de (7.1). Si xe es un punto de equilibrio, siempre se puede transferir este punto de equilibrio al origen de Rn mediante la denici on de la siguiente variable: x = x xe . Asumamos que esto ya ha sido hecho para un punto de equilibrio en consideraci on. Entonces, tenemos: f (t , 0) = 0 para todo t .
A continuaci on introducimos deniciones b asicas de estabilidad seg un Lyapunov (1857-1918). En las siguientes consideraciones usaremos la norma Euclidiana est andar de un vector. Entonces, si x Rn , luego: x = x
2
= (x T x )1/2 .
Denici on 1. Se dice que un estado de equilibrio xe es estable si para cualquier to dado y cualquier escalar positivo , existe un escalar positivo = (to , ) tal que si x(to ) xe < , luego x(t ; to , xo ) xe < para todo t to . Friedland (ver referencias al nal) realiza el siguiente comentario sobre la denici on de estabilidad: Si esta denici on epsilonica los deja frios, piensen en una competencia entre Ud, el dise nador del sistema, y un adversario (naton, de uraleza?). El adversario escoge una regi on en el espacio de estados de radio y lo desaa a encontrar otra regi radio , tal que si el estado inicial comienza dentro de tu regi on, luego permanecer a dentro de la regi on escogida por el adversario. Si Ud puede hacerlo, el sistema es estable. Denici on 2. Un estado de equilibrio xe se dice que convergente, o atrayente, si para cualquier to dado existe un escalar positivo 1 = 1 (to ) tal que si x(to ) xe < 1 , entonces
t
l m x(t ; to , xo ) = xe .
Reescribiremos la Denici on 2 como sigue. Un estado de equilibrio xe es convergente si para cualquier to existe un escalar positivo 1 = 1 (to ) tal que si x(to ) xe < 1 , entonces para cualquier 1 > 0 dado existe T = T (1 , to , xo ) tal que x(t ; to , xo ) xe < 1 para todo t > to + T . Denici on 3. Un estado de equilibrio xe es asint oticamente estable si es estable y convergente. Denici on 4. Un estado de equilibrio xe se dice que es uniformemente estable si el escalar positivo = (to , ) introducido en la Denici on 1 puede ser tomado independientemente del tiempo inicial to .
7.1 Estabilidad
101
Denici on 5. Un estado de equilibrio xe se dice que es uniformemente convergente, o uniformente atrayente, si el on 2 son independientes del tiempo inicial to . escalar positivo 1 = 1 (to ) y T = T (1 , to , xo ) introducido en la Denici ltimas deniciones permiten introducir la noci Las dos u on de estabilidad asint otica uniforme. oticamente estable si es uniformemente Denici on 6. Un estado de equilibrio xe se dice que es uniformemente asint estable y uniformemente convergente. N otese que la soluci on x(t ) = xe debe primero ser estable para luego calicar como asint oticamente estable. Esto para prevenir que la trayectoria del sistema se aleje arbitrariamente del estado de equilibrio antes de que converja al mismo. N otese tambi en que el concepto de estabilidad y estabilidad asint otica segun Lyapunov son conceptos locales. Ellos se aplican al comportamiento del sistema en una peque na vecindad del punto de equilibrio. Un caso especial de estabilidad asint otica uniforme es estabilidad exponencial uniforme que implica estabilidad uniforme e impone un requerimiento adicional que todas las soluciones que se originan cerca al punto de equilibrio dado, xe = 0, se acercan al equilibrio exponencialmente a medida que t . M as rigurosamente, decimos que xe = 0 es exponencialmente uniformemente estable si es estable y existen dos constantes positivas nitas y tal que para cualquier to y xo , cualquier soluci on comenzando en la vecindad de cero satisface: x(t ) e (t to ) xo . N otese que no es menos que la unidad, y uniformidad implica que y son independientes de to (ver Fig. 7.2).
x0 x0
^ (t) x
x(t) t0
^ t 0
Figura 7.2 Ilustraci on de estabilidad exponencial uniforme: un l mite de decaimiento exponencial es independiente del tiempo inicial to .
on. Un estado de equilibrio es inestable si no es estable. Una denici on de inestabilidad es dada a continuaci Denici on 7. Un estado de equilibrio xe se dice que es inestable si existe un > 0 tal que para cualquier > 0 existe x(to ) tal que si x(to ) xe < , entonces x(t1 ) xe 0 para alg un t1 > to . Una interpretaci on geom etrica en dos dimensiones de las deniciones arriba est a mostrada en la Fig. 7.3. Asumiendo que xe = 0 es el estado de equilibrio. Si el estado de equilibrio es estable, como en la Fig. 7.3(a), entonces dado un circulo externo de radio , entonces existe un circulo interno de radio tal que las trayectorias comenzando dentro del circulo- nunca dejen el circulo- . Si el estado de equilibrio es asint oticamente estable, entonces las trayectorias tienden al estado de equilibrio a medida que t tiende al . Esta situaci on es descrita en la Fig. 7.3(b). Finalmente, si el estado de equilibrio es inestable, como en la Fig. 7.3(c), entonces existe un circulo- tal que para cualquier circulo- existe una trayectoria comenzando dentro del mismo que deja el circulo- en alg un tiempo posterior. Una interpretaci on geom etrica del escenario descrito arriba en una dimensi on est a dada en la Fig. 7.4.
7.1.2.
Sea V (x) = V (x1 , x2 , ..., xn ) : Rn R una funci on de valor real y sea S Rn sea una regi on compacta conteniendo el origen x = 0 en su interior. Denici on 8. Decimos que una funci on V = V (x) es semi denida positiva en S , con respecto a x = 0, si: 1. V es continuamente diferenciable, esto es, V C 1 . 2. V (0) = 0. 3. V (x) 0 para todo x S .
102
7 Estabilidad y desempe no
x2
x2
x2
x(t0) x1
x(t0) x1 x(t0) x1
(a)
(b)
(c)
Figura 7.3 Ilustraci on de conceptos de estabilidad en dos dimensiones. (a) Estado de equilibrio estable en el sentido de Lyapunov. (b) Estado de equilibrio asint oticamente estable. (c) Estado de equilibrio inestable.
x(t)
0 t
(c)
0 t
Figura 7.4 Ilustraci on de conceptos de estabilidad en una dimensi on. (a) Estado de equilibrio estable en el sentido de Lyapunov. (b) Estado de equilibrio asint oticamente estable. (c) Estado de equilibrio inestable.
Denici on 9. Decimos que una funci on V = V (x) es denida positiva en S , con respecto a x = 0, si: 1. V es continuamente diferenciable, esto es, V C 1 . 2. V (0) = 0. 3. V (x) > 0 para todo x S \ {0}. El simbolo S \ {0} en el punto 3 arriba denota el conjunto {x : x S , x = 0}. Denici on 10. Decimos que una funci on V = V (x) es (semi)denida positiva globalmente si las deniciones arriba se cumplen para todo x Rn ; de otra forma se dice que V = V (x) es (semi) denida positiva localmente. Las funciones semi denida negativa y denida negativa son denidas de la misma forma pero revertiendo los signos de desigualdad en el punto 3 de las dos deniciones de arriba. Notas: 1. Para observar la diferencia entre funciones denida positiva y semi denida positiva, suponga que x R2 y sea:
2 V1 (x) = x1 2 2 V2 (x) = x1 + x2 .
Ambas funciones V1 y V2 son siempre no negativas. Sin embargo, es posible que V1 sea cero a un en el caso de que x = 0. Especicamente, si jamos x = (0, c), donde c R es cualquier n umero diferente de cero, entonces V1 (x) = 0. Por otro lado, V2 (x) = 0 si y solo si x = (0, 0). Entonces V1 (x) es semi denida positiva y V2 (x) es denida positiva. la derivada en funci Teorema 1. Sea V una funci on no negativa en Rn y sea V on del tiempo de V a lo largo de las trayectorias de la din amica del sistema (7.1):
7.1 Estabilidad
103
= V dx = V f (t , x(t )). V x dt x es semi Sea Sr = Sr (0) una bola de radio r alrededor del origen. Si existe r > 0 tal que V es denida positiva y V es denida negativa para todo x Sr , luego x = 0 es localmente estable seg un Lyapunov. Si V es denida positiva y V denida negativa para todo x Sr , luego x = 0 es localmente asint oticamente estable. Demostraci on. Ver demostraci on del Teorema 3.1 en Nonlinear Systems, de H.K. Khalil, 1992. Notas:
on de Lyapunov. 1. Una funci on V que satisface las condiciones del teorema es llamada funci 2. V (x) se puede denir como una funci on de energia que limita el tama no de x.
A continuaci on damos una interpretaci on geom etrica del teorema de Lyapunov. Primero, n otese que la funci on: = dV (x(t )) , V dt puede ser expresada, usando la regla de la cadena como: = V T x V = V x cos ,
ngulo entre los vectores V y x . Si x = 1, entonces V T x puede ser entendida como el incremento donde es el a < 0 si y solo si 90o < < 270o . En ese caso, el vector de V , evaluado en el punto x, en la direcci on x . Entonces, V velocidad x (t ) apunta en la direcci on de decrecimiento de V . Ilustramos la discusi on presentando Fig. 7.5. =
x V c1
V c2 c1
7.1.2.1.
Ejemplos
104
7 Estabilidad y desempe no
Ejemplo 2. Funciones de Lyapunov motivadas por la sica del problema: p endulo ngulo del p Considere el p endulo, de masa unitaria, longitud unitaria, donde x1 es el a endulo con la vertical, y x2 es la velocidad angular del p endulo. x 1 = x2 x 2 = g sen x1 Para demostrar que xe = 0 (p endulo apuntando hacia abajo) es un punto de equilibrio estable, considere la siguiente funci on como candidata a funci on de Lyapunov: V (x) = g(1 cos x1 ) + denida sobre el conjunto {x Rn : < x1 < } {0}. Luego, (x) = g sen x1 x2 V x2 = 0, g sen x1
2 x2 , 2
Ejemplo 3. Funciones de Lyapunov motivadas por la sica del problema: p endulo con fricci on Considere el p endulo del ejemplo anterior pero esta vez incluya fricci on unitaria: x 1 = x2 x 2 = g sen x1 x2 Sea la funci on de Lyapunov candidata: V (x) = g(1 cos x1 ) + denida sobre el conjunto {x Rn : < x1 < } {0}. Luego, (x) = g sen x1 x2 V x2 2 = x2 , g sen x1 x2
2 x2 , 2
(x) es semidenida negativa. No es denida negativa porque V (x) = 0 para x2 = 0 independientemente del entonces V valor de x1 ; esto es V (x) = 0 a lo largo del eje x1 . De ah que solo podamos concluir que el origen es estable. Sin embargo, si gracaramos el diagrama de plano de fase de la ecuaci on del p endulo se podr a observar que el origen ltimo hecho. A continuaci es asint oticamente estable. La funci on de Lyapunov no demuestra este u on se presenta un teorema (corolario) enunciado por LaSalle que nos permitir a extender las conclusiones de estabilidad del origen usando funciones de Lyapunov. Corolario 1 Sea x = 0 un punto de equilibrio para el sistema (??). Sea V : S R una funci on denida pos (x) 0 en S . Sea itiva cont nuamente diferenciable en el dominio S que contiene al origen x = 0, tal que V (x) = 0} y suponer que ninguna soluci M = {x S | V on puede estar en M , excepto la soluci on trivial. Luego el origen es asint oticamente estable. Demostraci on Ver Khalil, Secci on 3.2 - Principio de Invariancia. Ejemplo 4. Funciones de Lyapunov motivadas por la sica del problema: control de posici on de un robot Una tarea fundamental en rob otica para los manipuladores es transferir objetos de un punto a otro, el problema de control de posici on de un robot. Muchas de las aplicaciones ven an haciendo uso de controladores proporcionales derivativos; sin embargo, no se presentaba una justicaci on te orica para la estabilidad de tales sistemas de control debido a la din amica altamente no lineal del robot.
7.1 Estabilidad
105
Un robot consiste en un n umero de eslabones conectadas por juntas translacionales o rotacionales, siendo que el ltimo eslab u on posee una especie de efector (actuador nal). La din amica de un brazo rob otico de n-eslabones puede ser representado por: H (q)q + b(q, q ) + g(q) = , donde q es el vector n-dimensional que describe la posici on de las juntas, es el vector de torques de entrada, g es el vector de torques gravitacionales, b representa las fuerzas de Coriolis y fuerzas centripetas causadas por el movimiento de los eslabones, y H es la matriz de inercias n n del brazo robotico. Considere un controlador compuesto por un t ermino proporcional derivativo y un t ermino de compensaci on de gravedad. = KD q KP q + g(q), donde KD y KP son matrices constantes denidas negativas. Con la ayuda de un entendimiento f sico del problema, se puede encontrar una funci on de Lyapunov para un sistema rob otico complejo. Primero, n otese que la matriz de inercia H (q) es denida positiva para cualquier q. Segundo, el t ermino de control PD puede ser interpretado como una combinaci on de resortes y amortiguadores. Este an alisis sugiere la siguiente funci on de Lyapunov candidata: 1 T V = [q Hq + qT Kp q], 2 donde el primer t ermino representa la energia cin etica del manipulador, y el segundo t ermino denota la energia potencial articial asociada al resorte virtual en la ley de control. Para calcular la derivada de la funci on V se puede usar el teorema de energia en mec anica que estipula que la variaci on en la energia cin etica es igual a la potencia dotada por las fuerzas externas. Entonces: =q T KP q. V T ( g) + q Substituyendo la ley de control en la ecuaci on arriba se tiene: = q V T KD q 0. (q, q Y del Teorema 1, el origen es estable. Analizando el caso cuando V ) = 0: q = 0 y siendo que el brazo no puede atorarse en una posici on tal que q = 0 (que puede mostrarse f acilmente notando que la aceleraci on es diferente de cero en tales situaciones), el brazo rob otico debe establecerse en q = 0. Luego, usando el Corolario 1, el origen es en oticamente estable. realidad globalmente asint Dos lecciones se pueden sacar de este ejemplo pr atico: 1) usar las propiedades f sicas como sea posible cuando se analice el comportamiento del sistema, y 2) conceptos f sicos como energia nos llevan a elecciones acertadas de funciones de Lyapunov.
106
7 Estabilidad y desempe no
Notas: 1. P: C omo encontramos la funci on de Lyapunov? R (antes del 2000): adivinar R (despu es del 2000): SOSTOOLS (MATLAB Toolbox), para sistemas polinomiales con coecientes conocidos denida negativa. Esto 2. Teorema inverso: si xe = 0 es asint oticamente estable entonces existe V denida positiva y V implica, que si uno busca, uno puede encontrar una funci on de Lyapunov. 3. A menudo el caso de V (x) = xT Px funciona, donde P Rnn es una matriz sim etrica (P = PT ). La condici on que V es denida positiva es equivalente a la condici on que P una matriz denida positiva: xT Px > 0 para todo x = 0,
que se puede escribir como P > 0. Se puede mostrar que si P es sim etrica y denida positiva entonces todos sus autovalores son reales y positivos. Los conjuntos nivel de xT Px son elipsoides.
7.1.2.2.
Considere un sistema din amico lineal invariante en el tiempo modelado por la ecuaci on: x = Ax, Consideramos la funci on de Lyapunov cuadr atica: V (x) = xT Px, donde P es una matriz n n real sim etrica. La derivada en funci on del tiempo de V (x(t )) evaluada en la soluci on de x = Ax es: dV (x(t )) (t ) =V dt =x T (t )Px(t ) + xT (t )Px (t ). Sustituyendo x = Ax y x T = xT AT en la ecuaci on arriba resulta en: = xT AT Px + xT PAx V = xT (AT P + PA)x. El requerimiento que la funci on V sea denida positiva es equivalente a que la matriz P sea denida positiva (P > 0); sea denida negativa es equivalente a la condici y el requerimiento que V on: Q = AT P + PA < 0, (7.2) x(to ) = xo .
on (como matriz). Luego el problema se centra en determinar si la matriz sim etrica Q denida por la denominada ecuaci de Lyapunoven (7.2) es denida negativa. Si este es el caso luego V satisface las condiciones del Teorema 1, y el origen es globalmente asint oticamente estable.
Ejemplo 1 Sea un sistema lineal donde: A= es asint oticamente estable. Eligiendo P como: P= 10 = I2 > 0. 01 1 3 , 0 1
7.1 Estabilidad
107
Luego, Q = AT P + PA = 2 3 , 3 2
que es indenida. Entonces, a menos que Q resultase denida negativa, nada se puede inferir acerca de la estabilidad asint otica, usando el teorema de Lyapunov, para cuando comenzamos con P y luego calculamos Q. til de estudiar la estabilidad de sistemas lineales usando funciones cuadr Una forma m as u aticas es encontrando una matriz P para una funci on Q denida negativa dada; as : elegir una matriz Q denida negativa resolver para P de la ecuaci on de Lyapunov en (7.2) vercar si P es denida positiva Si P es denida positiva, luego xT Px es una funci on de Lyapunov para el sistema lineal y la estabilidad asint otica global est a garantizada.
Elegimos Q = I R22 y la ecuaci on de Lyapunov correspondiente es: a b 0 c p p p11 p12 + 11 12 p21 p22 p21 p22 1 0 a 0 = 0 1 b c
y resolviendo para los elementos de P tenemos: P= o la correspondiente funci on de Lyapunov: V (x ) = 1 2 b b2 + ac + c2 2 x x1 x2 + x2 . 2a2 c + 2ac2 1 2c(a + c) 2
b2 +ac+c2 b 2a2 c+2ac2 2c(a+c) b 1 2 2c( a+ c)
= I < 0. Entonces el origen es globalmente Es f acil vericar que P (vericar los autovalores) y por construcci on V asint oticamente estable. Uno de los elementos esenciales en el problema de control es buscar la forma de probar el desempe no de cualquier ley de control propuesta. Cuando sea que usamos el t ermino mejor u optimo para describir la efectividad de una estrategia de control dada, lo hacemos con respecto a un ndice num erico de desempe no llamado ndice de desempe no. Asumimos que el valor del ndice de desempe no disminuye a medida que la calidad de una ley de control admisible aumenta. El controlador admisible que asegura el cumplimiento de un objetivo del sistema y que al mismo tiempo ptimo del sistema. minimiza el ndice de desempe no es llamado de controlador o
108
7 Estabilidad y desempe no
7.2.
Indices de desempeno
Construir un ndice de desempe no -esto es, escoger una forma de medir el desempe no - puede ser considerado parte del modelado del sistema. Aqu , discutiremos alguna elecciones t picas de ndices de desempe no. Primero, suponemos que el objetivo es controlar un sistema modelado por las ecuaciones a continuaci on: x (t ) = Ax(t ) + Bu(t ), y = Cx(t ) x(to ) = xo , (7.3)
en un intervalo jo [to , t f ] tal que los componentes del vector de estado sean peque nos. Un ndice de desempe no apropiado de la minimizaci on ser a: J1 =
tf
xT (t )x(t )dt .
(7.4)
to
Obviamente, si J1 es peque no, entonces la norma del vector de estados, x(t ) , es peque na en el sentido del ndice de desempe no descrito arriba. Si el objetivo es controlar el sistema tal que los componentes de la salida, y(t ), sean peque nos, entonces podriamos usar el siguiente ndice de desempe no: J2 = = J2 =
tf
yT (t )y(t )dt
to tf
to tf to
donde la matriz de ponderaci on Q = CT C es sim etrica semi denida positiva. En el caso cuando deseamos controlar el sistema de tal forma que los componentes de la entrada, u(t ), sean no muy grandes, un ndice de desempe no (esfuerzo de control m nimo) apropiado a ser minimizado es: J3 = o, J4 =
tf to tf to
uT (t )u(t )dt ,
(7.6)
uT (t )Ru(t )dt ,
(7.7)
donde la matriz de ponderaci on R es sim etrica denida positiva. No hay p erdida de generalidad si asumimos que la matriz de ponderaci on R es sim etrica. Si R no fuese sim etrica, podriamos representar el t ermino cuadr atico uT Ru equivalentemente como R + RT uT Ru = uT u, 2
1 donde la matriz 2 (R + RT ) es sim etrica. Como mencionado por Owens (ver referencias al nal), no se puede minimizar simult aneamente los ndices de desempe no (7.4) y (7.6) porque la minimizaci on de (7.4) requiere de se nales de control grandes, mientras que la minimizaci on de (7.6) requiere de se nales de control peque nas. Para resolver el dilema podemos establecer un compromiso entre estos dos objetivos conictivos mediante la minimizaci on de un ndice de desempe no que sea una combinaci on convexa de J1 y J3 , J = J1 + (1 )J3
tf
to
(7.8)
donde es un par ametro en el rango [0, 1]. Si = 1, luego J = J1 ; y si = 0, luego J = J3 . Mediante tentativa y error, podemos seleccionar del intervalo [0, 1] para establecer un compromiso entre los dos extremos. Una generalizaci on del ndice de desempe no (7.8) es:
109
J=
tf to
En algunas aplicaciones, podemos desear que el estado nal x(t f ) este los m as cerca posible a cero. Entonces una posible medida del desempe no (control terminal) a ser minimizada ser a: J = xT (t f )Fx(t f ), (7.9)
donde F es una matriz sim etrica denida positiva. Combinando las medidas de desempe no (7.5), (7.7) y (7.9) cuando nuestro objetivo de control es mantener los estados peque nos, la entrada de control no muy grande, y el estado nal lo m as cerca de cero como sea posible. El ndice de desempe no resultante es: 1 1 J = xT (t f )Fx(t f ) + 2 2
tf to
(7.10)
donde el factor 1 2 es usado para simplicar las operaciones algebraicas siguientes. Minimizar (7.10) sujeto a (7.3) es atico lineal , o el problema LQR en siglas. llamado de el problema del regulador cuadr En algunos casos, el objetivo del controlador es forzar que los estados del sistema sigan una trayectoria deseada, xd (t ), a lo largo del intervalo [to , t f ] a la vez que mantienen las desviaciones del estado actual x(t ) peque nas con respecto a las trayectorias deseadas con un esfuerzo de control u(t ) no muy grande, en este caso el ndice de desempe no (seguimiento de trayectorias con esfuerzo de control m nimo) ser a: J= 1 2
tf to
(7.11)
Si el objetivo de control consiste en seguimiento de trayectorias con esfuerzo de control m nimo adem as de poseer un estado nal x(t f ) tan cerca como sea posible del estado deseado xd (t f ), el ndice de desempe no apropiado a ser minimizado en este caso podr a ser:
J= 1 1 (x(t f ) xd (t f ))T F (x(t f ) xd (t f )) + 2 2
tf to
(7.12)
Para llevar un sistema de una condici on inicial x(to ) = xo a un conjunto objetivo espec co S en tiempo m nimo, el nimo a ser minimizado es: ndice de desempe no tiempo m J = t f to =
tf to
dt ,
(7.13)
cpn t f siendo el primer instante de tiempo en que x(t ) y S se intersectan. En esta parte presentaremos el problema de optimizaci on cuando no hay dependencia del tiempo. La discusi on preparara las bases para el tema que viene a continuaci on que involucra optimizaci on con sistemas variantes en el tiempo. Fuente: Cap tulos 4 y 5 del libro Systems and Control de Stanislaw H. Zak, Oxford University Press, 2003. om y Fuente: Cap tulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr Richard M. Murray. Fuente: Nonlinear Systems, de H.K. Khalil, Macmillan Publishing Company, 1992. Fuente: Nonlinear Systems Analysis, de M. Vidyasagar, Prentice-Hall, Second Edition, 1993. Fuente: Advanced Control System Design, de B. Friedland, Prentice-Hall, 1996.
Cap tulo 8
Control Optimo
Una vez que se ha elegido el ndice de desempe no, el siguiente paso es determinar la ley de control que minimice ese criterio. Dos m etodos que pueden ser usados para la minimizaci on son el principio de maximalidad de Pontryagin y el m etodo de programaci on din amica desarrollado por R. Bellman. El abordaje variacional de Pontryagin conlleva a ptimo. El m un problema de condiciones de frontera en dos puntos que debe ser resuelto para obtener el control o etodo de programaci on din amica conduce a un ecuaci on funcional que puede ser resuelta usando una computadora digital.
8.1.
ptimos y observadores o ptimos. Los resulEn lo que queda del curso discutiremos el como dise nar controladores o ptimo ser tados de control o an derivados usando c alculo variacional. El resultado ser a aplicado al caso de un ndice de desempe no cuadr atico para un sistema lineal. As , la ecuaci on de Riccati, dependiente y no del tiempo, ser a derivada para resolver el problema del regulador cuadr atico lineal. La ecuaci on de Riccati puede ser resuelta si el sistema es estabilizable. Luego, la soluci on del problema del regulador cuadr atico lineal existe siempre que el sistema sea estabi ptima es dual al problema del regulador cuadr ptimo lizable. El problema de observaci on o atico lineal. Un observador o a menudo se denomina ltro de Kalman o ltro de Kalman-Bucy. Para comenzar, ser an presentadas algunas ideas de c alculo variacional, necesarias para la derivaci on del control ptimo. o
8.1.1.
C alculo Variacional
En esta secci on estaremos preocupados en minimizar un ndice de desempe no aumentado J = J (x(t ), t ) (eliminaremos por ahora la dependencia en u(t )). Para llevar a cabo la minimizaci on, necesitaremos encontrar el cambio inducido en J por los cambios independientes de todos sus argumentos. Sin embargo, el cambio en J depender a del tiempo y ltimas cantidades no son independientes. En esta parte derivaremos una de los diferenciales dt y dx, siendo que las u relaci on de utilidad trabajar esta observaci on. Si x(t ) es una funci on cont nua del tiempo t , luego los diferenciales dx(t ) y dt no son independientes del tiempo. A continuaci on deniremos un peque no cambio en x(t ) que es independiente de dt . Sea la variaci on en x(t ), x(t ), como un cambio incremental en x(t ) cuando el tiempo t es mantenido jo. on original Para encontrar las relaciones entre dx, x, y dt , examinemos la Fig. 11.8. La gura muestra la funci x(t ) y una funci on vecina x(t ) + dx(t ) sobre un intervalo especicado por un tiempo inicial to y un tiempo nal T . En adici on al incremento dx(t ) a cada tiempo t , el tiempo nal ha sido incrementado por dT . Es claro de la gura que el incremento total en x al tiempo T , dx(T ), depende de dT . De acuerdo a nuestra denici on la variaci on x(T ) ocurre para un valor jo de t = T como mostrado y es independiente de dT . Siendo que x(t ) y x(t ) + dx(t ) tienen aproximadamente la misma pendiente x (T ) en el tiemp t = T , y siendo que dT es peque no, se tiene: (T )dT . dx(T ) = x(T ) + x (8.1)
111
112
8 Control Optimo
Otra relaci on que usaremos es la regla de Leibniz para funcionales: si x(t ) Rn es una funci on de t y,
T
J (x ) =
to
h(x(t ), t )dt ,
(8.2)
donde J () y h() son dos funcionales escalares reales (en otras palabras, funciones de la funci on x(t )), luego:
T
to
hT x (x(t ), t ) x dt .
(8.3)
h . x
8.1.2.
ptimo de la forma m La losoa de este capitulo es derivar la soluci on del problema de control o as general.
8.1.2.1.
Suponiendo que la planta es descrita por un sistema no lineales variantes en el tiempo de la forma: x = f (x(t ), u(t ), t ), (8.4)
donde x Rn y u Rm son las variables de estado y entradas de control, respectivamente, y f (, ) es una funci on no lineal que satisface la condici on usual para existencia de la soluci on de la ecuaci on diferencial. Con este sistema se puede asociar el siguiente ndice de desempe no o funcional de costo:
T
(8.5)
113
donde [to , T ] es el intervalo de tiempo de inter es. La funci on de ponderaci on nal F (x(T ), T ) depende del estado nal y el tiempo nal, y la funci on de ponderaci on L(x, u, t ) depende del estado y entrada en los tiempo intermedios en [to , T ]. El ndice de desempe no arriba presentado es bastante general y puede cubrir la clase de problemas pr acticos denidos en la secci on anterior. El problema de control o ptimo consiste en encontrar la entrada u (t ) en el intervalo de tiempo [to , T ] que lleva la planta (8.4) a lo largo de la trayectoria x (t ) tal que la funci on de costo (8.5) sea minimizada, y tal que:
(x(T ), T ) = 0,
(8.6)
ltima condici on corresponde al problema con funci on del estado nal jo. para una funci on R p . Esta u Los roles de la funci on de ponderaci on nal F y la funci on del estado nal jo no deben ser confundidos. F (x(T ), T ) es una funci on del estado nal que queremos hacer peque na. Una ilustraci on debe ser la energ a, que es [xT (T )S(T )x(T )]/2 donde S(T ) es una matriz de ponderaci on dada. Por otro lado, F (x(T ), T ) es una funci on del estado T , donde nal que nosotros queremos jo e igual a cero. Como ilustraci on considere un sat elite con estado x = r r rbita polar con radio R, luego la r y es el radio y posici on angular. Si queremos que el sat elite se ubique en una o funci on del estado nal a ser igualada a cero debe ser: r (T ) R r (T ) , (x (T ), T ) = (T ) 3 R con = GM , la constante gravitacional que atrae a la masa M .
8.1.2.2.
ptimo, usaremos multiplicadores de Lagrange para sumar las restricciones Para resolver el problema de control o (8.4) y (8.6) al ndice de desempe no (8.5). Dado que (8.4) se debe mantener para cada t [to , T ], se requiere un multiplicador asociado (t ) Rn , que es funci on del tiempo. Dado que (8.6) debe mantenerse solo en un tiempo, requerimos de un multiplicador asociado constante R p . El ndice de desempe no asociado es entonces: J = F (x (T ), T ) + T (x (T ), T ) + Si denimos la funci on Hamiltoniana como: H (x, u, t ) = L(x, u, t ) + T f (x, u, t ), podemos escribir (8.7) como: J = F (x (T ), T ) + T (x (T ), T ) +
T to T to
] dt . L(x, u, t ) + T (t ) [ f (x, u, t ) x
(8.7)
(8.8)
H (x, u, t ) T x dt .
(8.9)
+
to
T T Hx x + Hu uTx + (H x )T dt .
(8.10)
to
T to
T xdt .
(8.11)
erminos de dx(t ) y dT usando (??), se tiene: Sustituyendo (8.11) en (8.10) y expresando x(T ) en t
114
8 Control Optimo
T )T dx| + (F + T + H T x dJ = (Fx + x +Tx )dt |T + T |T d + (H T x +Tx )dt |to T t t
+ T dx|to +
to
)T x + H T u + (H x (Hx + )T dt . u
(8.12)
De acuerdo a la teoria de Lagrange, el m nimo con restricciones de J es obtenido en el m nimo sin restricciones de J . Este m nimo se alcanza cuando dJ = 0 para todos los incrementos independientes en sus argumentos. Fijando en nimo cero los coecientes de los incrementos independientes d , x, u, y se obtienen las condiciones para un m como mostrado en la Tabla 1. Para nuestras aplicaciones, to y x(to ) son ambos jos y conocidos, tal que dto y dx(to ) son ambos cero. Los dos terminos evaluados en t = to en (8.12) son autom aticamente igual a cero. La condici on nal en (8.13) necesita m as discusi on. Hemos visto que dx(T ) y dT no son independientes (Fig. 8.1). Entonces, no podemos jar los coecientes de los dos primeros terminos de (8.12) igual a cero en t = T . La complejidad de (8.13) se debe a que las ecuaciones como dadas permiten posibles variaciones en el tiempo nal T . N otese que la ecuaci on de coestado es una ecuaci on din amica que debe ser desarrollada retrocediendo en el tiempo. Esta ecuaci on de coestado es tambi en llamada la adjunta de la ecuaci on de estado. Modelo del sistema: x = f (x, u, t ) Indice de desempe no: Restricci on estado nal: ptimo: Controlador o Hamiltoniano: Ecuaci on de estado: x = Ecuaci on de coestados: t to , to xed
T to
J = F (x (T ), T ) +
L(x, u, t )dt
(x (T ), T ) = 0
H (x, u, t ) = L(x, u, t ) + T f (x, u, t )
H = f , t to H fT L = , + x x x
t T
H L fT = + u u u
x(to ) dado T )T | dx(T ) + (F + T + H )| dT = 0 (8.13) (Fx + x T t T t ptimo no lineal cont Tabla 1. Controlador o nuo con funci on de estado nal jo La Tabla 1 muestra que el problema de control depende de la soluci on de un problema de valor de frontera en dos cil de resolver. puntos, esto porque x(to ) es dado y (T ) es determinado por (8.13). En general este es un problema dif En realidad no nos interesa el valor de (t ), pero este debe ser evidentemente determinado como un paso intermedio ptima u (t ), que depende de (t ) a trav es de la condici on estacionaria. para encontrar la ley de control o Es importante destacar lo siguiente. La derivada en el tiempo del Hamiltoniano es:
T T T f = Ht + H T u T = Ht + Hx H x + Hu u + u + (Hx + ) f .
(8.14) (8.15)
ptimo, luego: Si u(t ) es el control o = Ht . H Ahora, en el caso de sistemas invariantes en el tiempo, f y L no son funciones expl citas del tiempo t , y tampoco lo es H . En esta situaci on: = 0. H (8.16) Luego para sistemas y funcionales de costo invariantes en el tiempo, el Hamiltoniano es una constante en la trayectoria ptima. o
115
8.1.2.3.
Ejemplos
Los primeros ejemplos establecen que la soluci on al problema de optimizaci on dado en la Tabla 1 es bastante ptimo general. Los siguientes ejemplos ilustran el c alculo del controlador o Control de temperatura en un cuarto Se desea calentar un cuarto usando la menor energ a posible. Si (t ) es la temperatura del ambiente, a la temperatura del aire fuera del ambiente (una constante), y u(t ) la tasa de provisi on de calor hacia el ambiente, luego la din amica est a dada por: = a( a ) + bu, para algunas constantes a y b, que dependen del aislamiento del ambiente entre otros. Si denimos el estado como: x(t ) = (t ) a , la ecuaci on espacio de estados se puede escribir como: x = ax = bu. Para poder controlar la temperatura en un intervalo jo de tiempo [0, T ] con la menor provisi on posible de energ a, denimos el ndice de desempe no como: 1 T 2 J= u (t )dt . 2 0 A continuaci on discutiremos dos objetivos de control posibles. El Hamiltoniano es: H= u2 + (ax + bu). 2
ptimo u(t ) es determinado resolviendo: De acuerdo a la Tabla 1, el control o x = H = ax + bu, = Hx = a , 0 = Hu = u + b . La condici on estacionaria dice que la ley de control est a dada por: u(t ) = b (t ), ptimo (t ). entonces para determinar u (t ) solo necesitamos encontrar el coestado o Reemplazando en las ecuaciones de estado y coestado, se tiene: x = ax b2 , = a , ptimo x (t ). que deben ser resueltas para (t ) y el estado o A un no conocemos cual es el coestado nal (T ), pero supongamos que si lo conocemos y resolvamos el conjunto de ecuaciones anterior. Luego se tiene: (t ) = ea(T t ) (T ). y: x = ax b2 (T )ea(T t ) . b2 (T )eaT x(0) , s + a (s + a)(s a) x(0) b2 1/2 1/2 = , (T )eaT + s+a a (s + a) (s a)
116
8 Control Optimo
tal que: b2 (T )eaT sinh at . a Para encontral (T ), consideremos dos objetivos de control, los mismos que dar an dos formas de obtener (T ). a. Estado nal jo Suponga que la temperatura inicial de ambiente es igual a a = 60o . Luego: x(t ) = x(0)eat x(0) = 0o . Sea nuestro objetivo de control aquel que lleve la temperatura nal (T ) a exactamente 70o en un tiempo nal de T segundos. Luego el estado nal requerido es de: x(T ) = 10o . Note que dado que el tiempo nal y el estado nal estan ambos jos, dT y dx(T ) son ambos ceros, tal que (8.13) es satisfecha. ptimo. Para encontrar (T ), se Usando las condiciones para x(0) y x(T ), se puede encontrar (T ) y el control o tiene: b2 x(T ) = x(0)eat (T )(1 e2aT ). 2a Luego el coestado nal ser a: 20a , (T ) = 2 b (1 e2aT ) ptima del coestado es: tal que la trayectoria o
(t ) =
10eat b2 sinh aT
ptima de provisi Finalmente la tasa o on de calor hacia el ambiente est a dada por: u (t ) = 10eat , 0 t T. b sinh aT
ptima, la trayectoria o ptima pra el estado resulta: Usando la ley de control o x (t ) = 10 sinh at . sinh aT
Que resulta en x (T ) = 10, como deseado. b. Estado nal libre Suponga que no estamos preocupados con que el estado nal x(T ) sea exactamente 10o , la demanda es que la ley de control minimice: 1 1 T 2 J = s(x(T ) 10)2 + u (t )dt , 2 2 0 ptima estar para algun peso s R. Si s es grande luegi la soluci on o a cerca a 10o , dado que solo el primer termino contribuir a m as en el costo. De acuerdo a la Tabla 1, las ecuaciones de estado y coestado todav a son las mismas del caso a.:
(t ) = ea(T t ) (T ).
x(t ) = x(0)eat La condici on inicial todav a es: x(0) = 0o , pero la condici on dinal debe ser determinada usando (8.13). El tiempo nal T es jo, tal que dT = 0 y el segundo termino de (8.13) es autom aticamente igual a cero. Dado que x(T ) no es jo, dx(T ) no es cero (como en la parte a.). b2 (T )eaT sinh at . a
8.2 Regulador cuadr atico lineal, (LQR por sus siglas en ingl es)
117
(T ) =
Reemplazar apropiadamente...
F x
= s(x(T ) 10).
8.2.
Regulador cuadr atico lineal, (LQR por sus siglas en ingl es)
La planta a ser investigada es una planta lineal (o linealizada) pero puede ser variante en el tiempo: x (t ) = A(t )x(t ) + B(t )u(t ), x(to ) = xo . (8.17)
El controlador es requerido para minimizar una funci on de costo1 con forma particular, ndice de desempe no cuadr atico: 1 1 T T J (u) = xT (T )F (T )x(T ) + x (t )Q(t )x(t ) + uT (t )R(t )u(t ) dt . (8.18) 2 2 to El tiempo nal es jo pero el estado nal se puede desviar de cero, como requerido por F (T ) 0. Las matrices de ponderaci on de las se nales de estado y control son semidenida positiva y denida positiva, respectivamente, Q(t ) 0 y R(t ) > 0, t . La condici on de frontera est a dada por: (T ) = F (T )x (T ), (8.19)
T puesto que F (x(T ), T ) = 1 2 x (T )F (T )x(T ) y se debe cumplir Fx = 0. El Hamiltoniano del sistema es:
1 1 H = xT (t )Q(t )x(t ) + uT (t )R(t )u(t ) + T (t ) [A(t )x(t ) + B(t )u(t )] . 2 2 La ecuaci on de coestado es: (t ) = H = Q(t )x(t ) AT (t ) (t ), x(t )
(8.20)
(8.21)
(8.22)
La ecuaci on de estado y la de coestado son dos ecuaciones diferenciales en las variables de estado y coestado con la condici on inicial de que el vector de estado comienza en x(to ) = xo y que en el tiempo nal T el coestado obedece a (8.19). En general, resolver estas ecuaciones es bastante dif cil debido al problema de contorno en dos puntos. Sin embargo en el caso lineal cuadr atico es posible emplear un truco para poder resolver el problema. Si (8.22) es insertada en la ecuaci on de estados (8.17) entonces esta ecuaci on y (8.21) pueden ser expresados como: x (t ) A(t ) B(t )R1 (t )BT (t ) = Q(t ) AT (t ) (t ) x(t ) x(t ) = H (t ) . (t ) (t ) (8.23)
1 Las matrices F (T ), Q(t ) y R(t ) son llamadas matrices de ponderaci on y determinan cuanto aumentar a a la funci on de costo total la desviaci on de x(T ), x(t ) y u(t ) a partir de sus ceros. La restricci on de que J tenga un m nimo supone que est a limitado por abajo, luego todos los terminos del ndice deben ser no negativos para todo valor de x y u, entonces se debe cumplir que F (T ) 0, Q(t ) 0, y R(t ) > 0, t .
118
8 Control Optimo
8.2.1.
La soluci on de esta ecuaci on de estado de dimensi on-2n, es: x(t ) (t , t ) (t , t ) x(to ) = (t , to ) = 1 o 2 o (t ) (to ) 3 (t , to ) 4 (t , to ) x(to ) . (to ) (8.24)
Aplicando la propiedad de matriz de transici on, la soluci on tambi en puede ser escrita como:
(t , T ) 2 (t , T ) x(t ) = 1 (t ) 3 (t , T ) 4 (t , T )
x (T ) . (T )
(8.25)
(t ) = (3 (t , T ) + 4 (t , T )F (T )) [1 (t , T ) + 2 (t , T )F (T )]1 x(t ),
que puede ser escrito como:
(8.26)
(t ) = P(t )x(t ).
(8.27)
La matriz P(t ) es una funci on del tiempo nal constante T asi como de t , tal que ser a mas correcto escribir P como P(t , T ). Sin embargo la practica mas com un es omitir la dependencia de T . De (8.19) se tiene que: P(T ) = F (T ). (8.28) La se nal de control est a luego dada por la ecuaci on: u(t ) = R1 (t )BT (t )P(t )x(t ). (8.29)
Esta ecuaci on muestra que el vector de control es derivado a partir del vector de estados. El problema que queda por resolver es determinar la matriz P(t ). Esta matriz debe obedecer una ecuaci on diferencial que resulta de derivar (8.27) con respecto al tiempo: (t ) = P (t )x(t ) + P(t )x (t ). Insertando las ecuaciones de estado y coestado resulta: (t )x(t ) + P(t ) A(t )x(t ) B(t )R1 (t )BT (t )P(t )x(t ) . Q(t )x(t ) AT (t )P(t )x(t ) = P Esta ecuaci on tiene soluci on para todo x(t ) si P(t ) obedece la ecuaci on diferencial: (t ) + Q(t ) P(t )B(t )R1 (t )BT (t )P(t ) + P(t )A(t ) + AT (t )P(t ), 0=P (8.32) (8.31) (8.30)
Esta importante ecuaci on diferencial es conocida como ecuaci on de Riccati diferencial. La condici on de frontera relevante est a dada por (8.28): P(T ) = F (T ) (8.33) A continuaci on consideremos las implicancias del resultado obtenido: primero, la soluci on del problema del regulador cuadr atico lineal se reduce a un conjunto de ecuaciones diferenciales no lineales ordinarias. Segundo, la matriz P(t ) puede ser determinada por integraci on num erica de (8.32) retrocediendo en el tiempo - a partir de t = T hacia t = to - usando la condici on de frontera P(T ) = F (T ). En realidad dado que la matriz P(t ) es sim etrica, necesitamos integrar solo n(n + 1)/2 ecuaciones diferenciales. ptima puede ser escrita como una se Una vez que P(t ) ha sido determinado, la ley de control o nal de la forma: u(t ) = K (t )x(t ). (8.34)
La ganancia de realimentaci on dependiente del tiempo K (t ) es denominada ganancia LQR (ganancia del regulador ptimo y puede ser inferida de (8.29) como: cuadr atico lineal) o ganancia del regulador o
8.2 Regulador cuadr atico lineal, (LQR por sus siglas en ingl es)
119
K (t ) = R1 (t )BT (t )P(t ).
(8.35)
La Fig. 8.2 muestra el diagrama de bloques de la realimentaci on de estados para el regulador cuadr atico lineal. Se observa que en general la ganancia LQR ser a dependiente del tiempo a un cuando el sistema sea LTI y la funci on de costo tenga matrices de ponderaci on Q y R constantes. N otese que la ganancia del controlador LQR es un controlador lineal por realimentaci on de estados y que la ganancia LQR s olo depende de par ametros que se conocen con anticipaci on y luego podr a ser calculado f acilmente ofine.
ptima, el sistema en lazo cerrado est Una vez obtenida la ley de control o a dado por: x (t ) = Ac (t )x(t ) = [A(t ) B(t )K (t )]x(t ) (8.36)
8.2.2.
El valor del ndice de desempe no puede ser evaluado en base a la soluci on de la ecuaci on de Riccati. Primero, notar que: d T + xT Px (x Px) = x T Px + xT Px . dt Usando las ecuaciones (8.17), (8.29) y (8.32), se encuentra que: d T (x Px) = xT Qx uT Ru. dt Luego en el ndice de desempe no (8.18) se obtiene: 1 1 T d T J (u ) = xT (T )F (T )x(T ) x (t )P(t )x(t ) dt , 2 2 to dt 1 1 1 = xT (T )F (T )x(T ) xT (T )P(T )x(T ) + xT (to )P(to )x(to ) 2 2 2 ptimo (m Usando (8.33) los dos primeros t erminos desaparecen y el valor o nimo) del ndice de desempe no es:
1 T Jm n = 2 x (to )P(to )x(to )
(8.37)
120
8 Control Optimo
8.2.3.
Considere un integrador doble descrito por la ecuaci on espacio de estado: x (t ) = Ax(t ) + Bu(t ) = 01 00 p(t ) 0 + u(t ) v(t ) 1
El vector de estados est a formado por la posici on p(t ) y la velocidad v(t ) y la entrada de control es la aceleraci on u(t ). El ndice de desempe no a ser minimizado es: 1 1 J = xT (t f )Fx(t f ) + 2 2 Aqui las matrices han sido seleccionadas como: F= Q= f11 f12 , f12 f22 rp 0 , 0 rv
tf to
xT (t )Qx(t ) + u2 (t ) dt
> 0.
Para que F y Q sean semidenidas positivas, los par ametros r p , rv y y los autovalores de F deben ser no negativos. Introduciendo las matrices de ponderaci on en la ecuaci on de Riccati diferencial resulta: (t ) = Q(t ) P(t )B(t )R1 (t )BT (t )P(t ) + P(t )A(t ) + AT (t )P(t ) P = 00 00 0 1 rp 0 0 1 P(t ) + P(t ) P(t ) + P(t ) 10 10 1 0 rv p11 p12 : p12 p22
Como P(t ) es sim etrico tenemos que resolver tres ecuaciones para los elementos de P(t ) =
1 2 p 11 = r p p12 1 p 12 = p11 p12 p22 1 2 p22 p 22 = rv + 2 p12
Estas ecuaciones tienen que ser resueltas retrocediendo en el tiempo desde el valor inicial en el tiempo t f donde P(t f ) = F . Integraci on num erica con los valores f11 = f12 = f22 = 1, r p = 3, rv = 4 y = 1 resulta en la soluci on mostrada en la Fig. 8.3. Se observa de la gura que los tres valores de los elementos de la matriz P(t ) se aproximan a una constante cuando t f t comienza a crecer. ptimo para diversos valores de la matriz Q. Se observa que para grandes La Fig. 8.4 muestra la respuesta del control o valores de los elementos de la matriz Q, la respuesta es m as r apida pero con un mayor esfuerzo de control (se nal de control m as grande).
8.3.
ptimo que minimiza el El control LQR antes mostrado es el control o ndice de desempe no sobre un intervalo de tiempo nito [to , T ]. Se demuestra que lleva a una ganancia de control variante en el tiempo que puede ser calculada ofine. En la mayoria de los casos es m as conveniente tener una matriz de ganancia constante. Es preferible entonces ptimo con un analizar el problema de control o ndice de desempe no extendido hasta el innito:
121
position
velocity
5 p11 4
2 time [sec]
Figura 8.3 Soluci on de la ecuaci on de Ricatti para el integrador doble. Figura 8.4 Respuesta del sistema integrador doble con LQR.
J (u) = l m
(8.38)
to
tal que todas las matrices son consideradas constantes y Q = QT 0 y R = RT > 0. Siendo que el problema de control LQR est andar consiste en mover los estados del sistema hacia cero de forma ptima, el vector de estados x(t ) se aproximar o a al vector cero a medida que T si el sistema en lazo cerrado es estable. Luego no es relevante incluir el t ermino del estado nal en el ndice de desempe no, que es lo mismo que considerar F = 0 en (8.18).
8.3.1.
ptimo del El valor o ndice est a dado por (8.37). Siendo que el sistema es LTI, el valor de Jm n es independiente del = 0 y la ecuaci tiempo, lo que signica que la matriz P debe ser constante. Esto implica que P on de Riccati se reduce a: 0 = Q PBR1 BT P + PA + AT P. (8.40)
on de Este es un conjunto de ecuaciones algebraicas no lineales acopladas cuadr aticas. En la pr actica se le llama ecuaci Riccati algebraica.
122
8 Control Optimo
La ecuaci on (8.40) pueda tener m ultiples soluciones pero solo una de ellas provee una matriz P semidenida positiva (siempre y cuando el sistema sea estabilizable) y la soluci on particular lleva a:
1 T Jm n = 2 xo P xo .
(8.41)
donde P es la soluci on constante de (8.40). ptima para el control LQR en estado estacionario queda denida por: La matriz de ganancias o K = R1 BT P , y la se nal de control resulta: u(t ) = K x(t ).
t
(8.42)
(8.43)
ptimo que minimiza el En conclusi on, el controlador lineal por realimentaci on de estados o ndice de desempe no: J (u) = l m sujeto a x (t ) = Ax(t ) + Bu(t ), x(0) = xo satisface el teorema m as abajo. El objetivo es construir un controlador lineal por realimentaci on de estados de la forma u = Kx que estabiliza al sistema y minimiza el ndice de desempe no J (u). Denotar dicha ley de control lineal como u . Primero, asumimos que ptimo existe tal que el sistema en lazo cerrado o ptimo el controlador lineal por realimentaci on de estados o x = (A BK )x es asint oticamente estable. Esta suposici on implica que existe una funci on de Lyapunov V = xT Px para el sistema en lazo cerrado; esto es, para alguna matriz denida positiva P la derivada en funci on del tiempo dV dt evaluada en las trayectorias del sistema en lazo cerrado es denida negativa. Teorema 1. Si el controlador por realimentaci on de estados u = Kx es tal que minu dV + xT Qx + uT Ru = 0, dt (8.44)
t
ptimo. para alg un V = xT Px, entonces el controlador es o Demostraci on Teorema 1 Podemos escribir la condici on del teorema como: dV dt Luego, dV dt
u=u
+ xT Qx + uT Ru = 0.
u=u
= xT Qx uT Ru .
0
Integrando ambos lados de la ecuaci on resultante con respecto al tiempo desde 0 hasta , obtenemos V (x()) V (x(0) = (xT Qx + uT Ru )dt .
Debido a la suposici on de que el sistema en lazo cerrado es asint oticamente estable, x() = 0, y luego
T V (x(0) = xo Pxo = 0
(xT Qx + uT Ru )dt .
Entonces, hemos demostrado que si un controlador lineal por realimentaci on de estados satisface la suposici on del teorema, entonces el valor del ndice de desempe no para tal controlador es
123
ptimo, usamos una prueba por contradicci Para demostrar que tal controlador es de hecho o on. Asumimos que (8.44) se ptima. Sup cumple y que u no es o ongase que u resulta en un menor valor de J , esto es, J (u ) < J (u ). De (8.44) tenemos que dV dt esto es, dV dt
u= u u= u
+ xT Qx + u T Ru 0, xT Qx u T Ru .
0
Integrando la expresi on arriba con respecto al tiempo de 0 a resulta V (x(0)) lo que implica que J (u ) J (u ), lo que es una contradicci on, y la demostraci on se ha completado. (xT Qx + u T Ru)dt
Ejemplo 1
Considere el siguiente modelo de un sistema din amico: x = 2u1 + 2u2 , asi como el ndice de desempe no asociado J=
0 2 (x2 + ru2 1 + ru2 )dt ,
x(0) = 3,
donde r > 0 es un par ametro. 1. Primero encontramos las soluci on de ARE correspondiente al controlador lineal por realimentaci on de estados ptimo. Tenemos o A = 0, B= 2 2 , Q = 1, R = rI2 . La ARE para este problema es 8 0 = AT P + PA + Q PBR1 BT P = 1 p2 , r cuya soluci on es p= r . 8
ptimo. El controlador o ptimo 2. Ahora escribimos el sistema en lazo cerrado que se obtiene usando el controlador o tienen la forma 1 1 u = R1 BT Px = x. 2r 1 ptimo es descrito por Entonces, el sistema en lazo cerrado o 4 x = 2 2 u = x. 2r
124
8 Control Optimo
ptimo. Tenemos que 3. Finalmente, encontramos el valor de J para el sistema en lazo cerrado o J = x(0)T Px(0) = 9 2 r . 2
xT (t )Qx(t ) + u2 (t ) dt
> 0,
donde r p y rv son los pesos de posici on y velocidad respectivamente. Con los valores dados la ecuaci on de Riccati algebraica resulta en las siguientes ecuaciones acopladas:
1 2 0 = rp p12 1 0 = p11 p12 p22 1 2 p22 0 = rv + 2 p12
p11 p12 , es la soluci on de la ARE. Resolviendo estas ecuaciones algebraicas se obtiene la soluci on p12 p22 nica: denida positiva u p11 = r p 2 r p + rv p12 = r p p22 = 2 r p + rv Aqui, P = El controlador resulta en el control por realimentaci on de estados con la se nal de control: u(t ) = K x(t ) = (R1 BT P )x(t ) = rp 2 r p rv + x(t )
Se observa que la ganancia de control se incrementa a medida que los pesos de los estados se incrementan, en otras palabras, r p y rv se incrementan en comparaci on al peso de la se nal de control. La ecuaci on caracter stic del sistema en lazo cerrado puede ser encontrada como: s2 + 2 r p rv rp + s+ = 0
La frecuencia natural correspondiente al sistema en lazo cerrado y el factor de amortiguamiento son calculados como: rp = 4
125
1 = 2
rv 1+ 2 rp
Para = 1, si rv = 0 los polos en lazo cerrado tienen un factor de amortiguamiento de 1/ 2 0,71. El root locus como funci on de las ponderaciones se observa en la Fig. (8.5), donde r p varia desde 0 hasta 10. Para este sistema en particular se observa que el factor de amortiguamiento de los polos en lazo cerrado siempre seran mayores que 0.71 para elementos de la matriz de ponderaci on positivos.
8.3.2.
A continuaci on presentamos un m etodo para resolver la ARE referido como el m etodo del autovector. Comenzamos representando la ARE de la forma In A BR1 BT P In = 0. (8.45) P Q AT mbolo H para denotar a la matriz La matriz 2n 2n en la mitad es denominada de matriz Hamiltoniana. usamos el s Hamiltoniana, esto es, A BR1 BT H= . Q AT Entonces, la ARE puede ser representada como P In H In =0 P
Si premultiplicamos la ecuaci on arriba por X 1 y luego postmultiplicamos esta por X , donde X es una matriz no singular n n, X X 1 P X 1 H = 0. (8.46) PX Observar que si pudi esemos encontrar matrices X y PX tal que H luego la ecuaci on (8.46) resulta en X 1 P X 1 X = 0. PX X X , = PX PX
rv = 5
1 0.5 0.1 0
1.5
0.5
0.5
Figura 8.5 Root-locus del sistema integrador doble con LQR en estado estacionario para una variaci on de r p .
126
8 Control Optimo
Luego hemos reducido el problema de resolver la ARE a aquel en el que construimos matrices X y PX apropiadas. Continuando, sea vi el autovector de H y sea si el autovalor correspondiente; entonces Hvi = si vi . Si asumimos que H tiene al menos n autovalores reales distintos entre sus 2n autovalores. (Los resultados obtenidos pueden ser generalizados para cuando los autovalores de H son complejos o iguales.) Entonces, podemos escribir s1 0 ... 0 0 s2 ... 0 H v1 v2 ... vn = v1 v2 ... vn . . . . . . . . . . 0 0 ... sn Sea X = v1 v2 ... vn PX y s1 0 = . . . 0 ... 0 s2 ... 0 . . . . . . . 0 0 ... sn
Para construir P, particionamos la matriz de autovectores v1 v2 ... vn de orden 2n n en dos submatrices de orden n n como sigue W v1 v2 ... vn = . Z Luego, X W = . PX Z Tomando X = W y PX = Z y asumiendo que W es invertible, obtenemos P = ZW 1 . (8.47)
Ahora tenemos que elegir que conjunto de n autovalores elegir, dentro de todos los autovalores de H , para poder contruir P. En el caso en que los 2n autovalores de H son diferentes, el n umero de matrices P generadas con el m etodo descrito arriba son (2n)! . (n!)2 Sea Q = CT C una factorizaci on de rango completo de Q. Del Teorema 3 de Kucera (ver referencias al nal) se concluye que la matriz Hamiltoniana H tiene n autovalores en el semiplano complejo izquierdo y n en el semiplano complejo derecho si y s olo si el sistema como denido en (1) es estabilizable y detectable. La matriz P que nosotros buscamos corresponde a los autovalores asint oticamente estables de H . Con P construido como deseado, tenemos el siguiente resultado. Teorema 2. Los polos del sistema en lazo cerrado x (t ) = (A BR1 BT P)x(t ) son aquellos autovalores de H que tienen parte real negativa.
127
W , podemos escribir Z W Z = W . Z
A BR1 BT Q AT
Realizando las multiplicaciones apropiadas de bloques de matrices n n resulta AW BR1 BT Z = W , o A BR1 BT ZW 1 = A BR1 BT P = W W 1 ,
dado que P = ZW 1 . Entonces, la matriz A BR1 BT P es similar a la matriz cuyos autovalores son los autovalores asint oticamente estables de H . Luego, la demostraci on ha sido completada.
Ejemplo 1
Considere el siguiente modelo de un sistema din amico x = 2x + u, asi como el ndice de desempe no asociado J=
0
ptimo tenga un polo en 3. Encuentre el valor de r tal que el sistema en lazo cerrado o 1. Formamos la matriz Hamiltoniana asociada H= 2. La ecuaci on caracter stica de H es det(sI2 H ) = s2 4 Luego, 1 5 ptimo teniendo su polo localizado en 3. resulta en el sistema en lazo cerrado o r= A BR1 BT Q AT = 2 1 r . 1 2 1 = 0. r
Ejemplo 2
Considere un modelo simple de un robot manipulador como mostrado en la Fig. ??. El movimiento del brazo del robot es controlado por un motor DC a trav es de un engranaje. El motor DC es controlado por armadura y su gura esquem atica es presentada en la Fig. 8.7. Asumimos que el momento de inercia del motor es despreciable en comparaci on con el del brazo del robot. Modelamos el brazo como una masa puntual m ubicada en el extremo nal de la barra (sin masa) de longitud l . Entonces el momento de inercia del brazo Ib = ml 2 . Asumimos que el tren de engranajes no tiene juego, y que todos los ejes conectores son r gidos. Como podemos ver de la Fig. 8.6, la rotaci on del brazo en sentido contrario a las agujas del reloj es denida como positiva, y la rotaci on siguiendo las agujas del reloj es considerada como negativa; mientras que la rotaci on del eje del motor en sentido contrario a las agujas del reloj es denida como negativa, y la rotaci on del eje siguiendo las agujas del reloj es denida como positiva. El torque entregado por el motor es Tm = Km ia ,
128
8 Control Optimo
donde Km es la constante del torque del motor, y ia es la corriente de armadura. Sea N la raz on de los engranajes. Luego tenemos: p umero de dientes del engranaje del motor 1 radio del engranaje del motor n = = . = m radio del engranaje del brazo n umero de dientes del engranaje del brazo N
La
1: N Gear
DC motor
Armature circuit
Control voltage
Figura 8.6 Robot manipulador controlador por un motor DC via un en- Figura 8.7 Figura esquem atica de un motor DC controlado granaje. por armadura.
p radio del engranaje del brazo = m radio del engranaje del motor,
y los radios de los engranajes son proporcionales a sus n umeros de dientes. El trabajo realizado por cada engranaje debe ser igual. Sea Tp que denota el torque aplicado al brazo del robot. Entonces, Tp p = Tm m . Entonces, el torque aplicado al p endulo es Tp = NTm = NKm ia . Usando la segunda Ley de Newton para escribir la ecuaci on que modela la din amica del brazo, Ib d2p = mgl sin p + Tp . dt 2
Sustituyendo las expresiones para Ib y Tp y luego rearreglando tenemos ml 2 d2p = mgl sin p + NKm ia , dt 2
donde g = 9,8m/s2 es la aceleraci on de la gravedad. Aplicado la Ley de Kirchhoff (voltaje) al circuito de armadura resulta en dp dia La + Ra ia + Kb N = u, dt dt donde Kb es la constante emf. Asumiendo que La 0. Entonces, u = Ra ia + Kb N dp , dt
129
A continuaci on calculamos ia de la expresi on anterior y sustituimos el resultado en la ecuaci on de movimiento para obtener: d Kb N dtp d2p u ml 2 2 = mgl sin p + NKm . dt Ra Ra Ahora podemos construir el modelo de espacio de estados para el robot de un brazo. Escogiendo los siguientes estados y variables de salida: dp = p , y y = x1 . x1 = p , x2 = dt Entonces, obtenemos el siguiente modelo de espacio de estados simple del robot manipulador: x 1 = x 2 x2 Kb Km N 2 NKm x + ml 2R u ml 2 Ra 2 a
g l
sin x1
y = x1 . Par ametros razonables para el robot son: l = 1m, m = 1kg, N = 10, Km = 0,1Nm/A, Kb = 0,1Vsec/rad, Ra = 1 . Usando los valores de los par ametros el modelo del robot toma la siguiente forma: x2 x 1 = 9,8 sin x1 x2 + u x 2 y = x1 . Respuestas en el tiempo para las trayectorias de estado del sistema no lineal sin control, u = 0, son mostrados en la Fig. 8.8 para las condiciones iniciales x1 (0) = 1 y x2 (0) = 0. Un plano de fase del sistema no lineal sin control es mostrado en la Fig. 8.9. El modelo linealizado alrededor de x = 0, u = 0 tiene la forma d 0 1 0 x = x+ u, 9 , 8 1 1 dt y = 1 0 x.
5 4 3 2 x 1, x 2 1 0 1 2 3 0 2 4 Time (sec) 6 8 10 x2
x2 10
x1
8 6 4 2 0 2 4 6 8 10 10 5 0 5 10
x1 Figure 5.13 Figura 8.8 Gr acas de y = x1 y x2 versus tiempo para el sistema no lineal Figura 8.9 Un plano de fase del sistema no lineal sin control. sin control.
En la Fig. 8.10 son mostradas las gr acas de y = x1 y x2 versus tiempo para el sistema lineal sin control. Un plano de fase del sistema linealizado es mostrado en la Fig. 8.11. Sea J=
0
(y2 + u2 )dt .
130
8 Control Optimo
Encontraremos una ley de control lineal por realimentaci on de estados u = kx que minimice J sujeto a las ecuaciones dadas por la representaci on espacio de estados lineal. Tenemos Q = cT c = 10 00 y R = [1].
25
10 8
20 x2 15 x1, x2
6 4 2 x2 0 2
x1
10
4 6 8
0.2
0.8
10 10
0 x1
10
Figura 8.10 Gr acas de y = x1 y x2 versus tiempo para el sistema lineal- Figura 8.11 Un plano de fase del sistema linealizado sin conizado sin control. trol.
Identicando los autovectores correspondientes a los autovalores con parte real negativa se puede denir W= 0,2604 0,0496 0,9499 0,1339 y Z= 0,1691 0,9555 , 0,0364 0,2582
y calculando los autovalores y autovectores de H tenemos que 0,3443 0,0485 0,2604 0,0496 0,9298 0,1770 0,9499 0,1339 H 0,1124 0,9196 0,1691 0,9555 0,0661 0,3473 0,0364 0,2582 0,3443 0,0485 0,2604 0,0496 2,7003 0 0 0 0,9298 0,1770 0,9499 0,1339 0 3,6481 0 0 . = 0,1124 0,9196 0,1691 0,9555 0 0 3,6481 0 0,0661 0,3473 0,0364 0,2582 0 0 0 2,7003
Resolviendo la ecuaci on de Riccati, se dene la matriz Hamiltoniana asociada como 0 1 0 0 9,8 1 0 1 A BR1 BT H= = 1 0 0 9,8 , Q AT 0 0 1 1
luego sabiendo que P = ZW 1 se obtiene P= Entonces: k = 19,6509 5,3484 , y 72,3371 19,6509 . 19,6509 5,3484
131
Ac =
cuando las condiciones iniciales son x1 (0) = 1 y x2 (0) = 0, son mostradas en la Fig. 8.12. Un plano de fase del sistema ptimo al modelo no lineal, las linealizado en lazo cerrado es mostrado en la Fig. 8.13. Aplicando el controlador o gr acas de x1 y x2 versus tiempo para el sistema no lineal en lazo cerrado son mostradas en la Fig. 8.14. Un plano de fase del sistema no lineal en lazo cerrado es mostrado en la Fig. 8.15. Los polos del sistema linealizado en lazo cerrado -esto es, los autovalores de Ac - son 1 = 2,7003 y 2 = 3,6481.
10
1
8 6
0.5 x1 0 x1, x2 x2
4 2 x2 0 2 4 6 8 10 10
0.5
1.5
2 Time (sec)
0 x1
10
Figura 8.12 Gr acas de x1 y x2 versus tiempo para el sistema linealizado Figura 8.13 Un plano de fase del sistema linealizado en lazo en lazo cerrado. cerrado.
10
1
8 6
0.5
x1
4 2
0 x1, x2
x2
0 2
0.5 x2 1
4 6 8 10 10
1.5
2 Time (sec)
0 x1
10
Figura 8.14 Gr acas de x1 y x2 versus tiempo para el sistema no lineal Figura 8.15 Un plano de fase del sistema no lineal en lazo en lazo cerrado. cerrado.
132
8 Control Optimo
Los par ametros del sistema son m = 4kg, J = 0,0475kgm2 , r = 0,25m, g = 9,8m/s2 , c = 0,05Ns/m, que corresponden a un modelo escalado del sistema. El punto de equilibrio para el sistema est a dado por F1 = 0, F2 = mg y ze = (xe , ye , 0, 0, 0, 0). Calculamos el sistema linealizado: 0 0 00 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 , C = 1 0 0 0 0 0 , D = 0 0 . , B = A= 0 0 0 g c/m 0 0 00 010000 m 1 0 0 0 0 0 c/m 0 m r 00 0 0 0 0 J 0 Haciendo z = z ze y v = u ue , el sistema linealizado est a dado por: dz = Az + Bv, dt y = Cz. Se puede vericar que el sistema es alcanzable. Para calcular el regulador cuadr atico lineal para el sistema, escribimos la funci on costo como: J=
0
(zT Qz + vT Rv)dt ,
donde z = z ze y v = u ue representan las coordenadas locales en torno al punto de equilibrio (ze , ue ). Comenzamos con matrices diagonales para los costos del estado y la entrada: Q = I66 , R = I22 .
Luego la ley de control de la forma v = Kz ser a usada para derivar la ley de control en t erminos de las variables originales: u = v + ue = K (z ze ) + ue . Como especicado en clases anteriores, los puntos de equilibrio corresponden a ue = (0, mg) y ze = (xe , ye , 0, 0, 0, 0). La respuesta del controlador a un cambio de la funci on escal on para la posici on deseada es mostrada en la Fig. 8.16a. La respuesta puede ser anada cambiando los pesos en la funci on de costo. La Fig. 8.16b muestra la respuesta en la direcci on x para diferentes selecciones del peso , siendo que R = I2 . 6.3. STATE FEEDBACK DESIGN 193
Position x , y [m] Position x [m]
1 0.5 0 0 2
10
4 6 Time t [s]
10
Figura 8.16 Respuesta al escal on of de the unaaircraft aeronave de impulsi on. La Fig. muestra posiciones x e y de cuando se le positions when it is commanded toamove 1 mlas in each direction. In(b) thelax aeronave 2 , 104 . Un peso m comanda moverse 1m en motion cada direcci o n. En Fig. b se muestra el movimiento x variando los pesos de control = 1 , 10 as 2 4 is shown for control weights 1, 10 , 10 . A higher weight of the input term in grande en el t ermino de control de la funci o n costo causa sluggish una respuesa m as lenta. the cost function causes a more response.
Step response for a vectored thrust aircraft. The plot in (a) shows the x and y
level. Since other processes may be running on the server, the web server must adjust its parameters in response to changes in the load. A block diagram for the control system is shown in Figure 6.13. We focus on the special case where we wish to control only the processor load using both the
133
8.3.3.
Un sistema de control que usa el regulador cuadr atico lineal presenta las siguientes caracter sticas de robustez. Esto es, los margenes de estabilidad de la matriz de funciones de transferencia en lazo L(s) = K (sI A)1 B (equivalentemente, las condiciones para que |1 + L(i )| > 1) est an dados por: Margen de ganancia (GM): 1 2 < GM < 1. Margen de fase (PM): PM > 60o . La Fig. 8.17 presenta el diagrama de Nyquist de la funci on de transferencia de lazo, L(s), para un modelo simplicado de un sat elite. 01 0 A= , B= , C = 1 0 , D = 0. 00 1
8.3.4.
Si se conocen los valores m aximos de los estados nales, estados cont nuos y entradas cont nuas, luego se puede aplicar la siguiente regla para la selecci on de matrices de ponderaci on F , Q y R: 1 m ax([xi (T )]2 ) 1 Qii = (T to ) m ax([xi (t )]2 ) 1 Rjj = (T to ) m ax([ui (t )]2 ) Fii =
donde i = 1, 2, ..., n y j = 1, 2, ..., m. Si el tiempo no es importante en la aplicaci on evaluada luego el intervalo de tiempo entre par entesis, (T to ), puede elegirse igual a 1. Los t erminos fuera de la diagonal de las matrices de ponderaci on pueden ser usados si existe interacci on entre los componentes de las entradas o estados. Fuente: Cap tulo 5 del libro Linear Systems Control de Elbert Hendricks et al, Springer, 2008. Fuente: Cap tulo 3 del libro Optimal Control de Lewis y Syrmos, Wiley, 1995. Fuente: Cap tulo 5 del libro Systems and Control de Stanislaw H. Zak, Oxford University Press, 2003.
134
8 Control Optimo
Fuente: Cap tulo 5 del libro Linear Systems Control - Deterministic and Stochastic Methods de Elbert Hendricks, Ole Jannerup y Paul Sorensen, Springer, 2008. om y Fuente: Cap tulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr Richard M. Murray.
Cap tulo 9
Estimaci on Optima
9.1.
Filtro de Kalman-Bucy
El regulador cuadr atico lineal (con horizonte innito) es una ley de control lineal por realimentaci on de estados u = Kx para el sistema: x = Ax + Bu, x(0) = xo que minimiza la funci on de costo cuadr atica: J=
0
La ley de control es llamada optima con respecto a la funci on de costo J . ptimo para un estimador de estados. Esto es, ser Uno se podr a preguntar si existe una t ecnica de dise no o a que existe un abordaje para dise nar observadores que sea equivalente, en alg un sentido, al regulador cuadr atico lineal? As , dado el sistema observable: x = Ax y = Cx, se podr a denir el sistema dual: = AT + CT ,
0
y dise nar un controlador LQR para minimizar la funci on de costo cuadr atica: ( (t )T Q (t ) + (t )T R (t ))dt .
on de costo. Sin embargo, a un no queda claro como se podr a penalizar y en la funci A continuaci on consideraremos un sistema lineal observable: x = Ax + Bu + Gw y = Cx + v, (9.1)
en el que la din amica est a sujeta a disturbios aleatorios w y medidas aleatorias v. En paralelo al desarrollo del regulador ptimo: construir un observador de orden cuadr atico lineal, Kalman examin o el siguiente problema del estimador o completo que minimice el efecto combinado de los disturbios y el ruido, de tal forma que provea un estado m as probable del estado del sistema1 . Resolver este problema requiere de algo de informaci on acerca de los procesos aleatorios. Si los procesos son de media cero, procesos de ruido blanco Gaussiano, luego el problema de dise no del ptimo se convierte en el an estimador o alogo perfecto del problema de dise no del control LQR. Primero revisaremos algo de teor a de probabilidad.
De hecho, Kalman enunci o el problema original para sistemas discretos. La versi on cont nua es atribuida a Kalman y a Bucy.
135
136
9 Estimaci on Optima
9.1.1.
9.1.1.1.
Teor a de probabilidad
Escalares y vectores aleatorios
Considere un variable aleatoria escalar z con fz ( ) representando su funci on de densidad de probabilidad, denida tal que:
fz ( )d = 1.
on diferencial d centrada en . Una de Entonces, fz ( ) provee la probabilidad de que el valor de z este en alguna regi las funciones de densidad de probabilidad es la funci on de densidad de probabilidad Gaussiana, ver Fig. 9.1: f z ( ) = donde > 0 es llamada la desviaci on est andar. ) 1 ( exp 2 2 2 , (9.2)
Dada una funci on de densidad de probabilidad, la media o valor esperado de una funci on g(z) es: E{g(z)} = Por ejemplo, el valor medio de z es: z = E{z} = La varianza de z es E{(z z )2 }. La varianza indica la probabilidad de que el n umero aleatorio est a cerca del valor medio. Una peque na varianza indica que la media es un buen estimado del n umero, mientras que una varianza grande indica que el valor real puede ser bastante diferente de la media. Para la funci on de densidad de probabilidad Gaussiana (9.2), uno puede calcular que y la varianza es 2 . N on de densidad Gaussiana se aproxima al la media es otese que, a medida que 0, la funci . impulso unitario en la media; luego se tiene que z = z = Uno puede extender el concepto de variable escalar aleatoria a un vector de variables aleatorias, digamos z Rn . En este caso, existe una funci on de densidad de probabilidad escalar fz ( ) de n variables aleatorias = [1 , ..., n ]T tal que:
g( ) fz ( )d .
f z ( )d .
...
La funci on fz ( ) provee la probabilidad de que z se encuentra es alg un hipercubo diferencial d 1 ...d n con centro en . La funci on de densidad de probabilidad Gaussiana para un vector de variables aleatorias es: f z ( ) = 1 )T P1 ( ) exp ( 2 n (2 ) |P | 1
fz ( )d 1 ...d n = 1.
137
donde P 0. El valor esperado de cualquier vector o matriz de funciones g(z) es E{g(z)} = Por ejemplo, la media de z es z = E{z} = La covarianza de z es la matriz n n
...
g( ) fz ( )d 1 ...d n .
...
fz ( )d 1 ...d n .
E{(z z )(z z )T }. y la covarianza es P . Para la funci on de densidad Gaussiana, la media es z = 9.1.1.2. Procesos aleatorios
Si la variable aleatoria depende del tiempo, esto es z(t ), entonces es llamada proceso aleatorio. En general, la funci on de densidad de probabilidad podr a tambi en depender del tiempo, fz ( , t ), tal que la media y covarianza cambian a medida que el proceso evoluciona. Si la funci on de densidad de probabilidad es constante; esto es, la media y covarianza permanecen constantes, el proceso es llamado estacionario. N otese que el t ermino estacionario se reere solo a la funci on de densidad de probabilidad, y de ah a los par ametros probabil sticos tales como media y covarianza. El estado z, por otro lado, puede y generalmente si cambia en funci on del tiempo. Dado que la variable aleatoria z(t ) cambia en el tiempo, uno puede cuestionar si su valor en un instante dado del tiempo se correlaciona con su valor en otro instante. Para cuanticar la pregunta, se dene la autocorrelaci on de z(t ) en el tiempo como Rz ( ) = E{z(t + )zT (t )}. La funci on de autocorrelaci on resulta de gran utilidad para encontrar patrones repetitivos dentro de una se nal, como por ejemplo, la periodicidad de una se nal enmascarada bajo el ruido. Si Rz ( ) = P ( ), on delta de Dirac, entonces el valor de z(t ) no est a correlacionado donde P es una matriz constante y () es la funci con el valor de z(t + ) para cualquier tiempo = 0. Tal proceso aleatorio es llamado ruido blanco. La raz on de este nombre es en referencia al contenido de energia del proceso siendo uniformemente distribuido sobre todas las frecuencias. (Recuerde que el color blanco corresponde a la luz reejada en todas las longitudes de onda). Si z(t ) es un proceso de media cero, entonces P (0) es la covarianza del proceso; la matriz P es llamada matriz de densidad espectral o simplemente matriz de covarianza.
9.1.1.3.
Ahora supongamos que existen dos procesos de vectores aleatorios z1 (t ) y z2 (t ). Adicionalmente a sus propias on de densidad de probabilidad conjunta funciones de densidad de probabilidad, estos dos procesos tienen una funci es de su diferencia, t1 t2 , entonces los procesos son denotada por f12 (1 , 2 , t1 , t2 ). Si f12 depende de t1 y t2 solo a trav llamados de estacionarios conjuntos y escribimos f12 (1 , 2 , t1 t2 ). El valor esperado de una funci on (vector o matriz) g(z1 , z2 ) es E{g(z1 (t1 ), z2 (t2 ))} =
...
...
Un ejemplo de matriz de correlaci on cruzada es Rz1 z2 ( ) = E{z1 (t + )zT 2 (t )}. Los dos procesos se dice que son ortogonales o no correlacionados si Rz1 z2 ( ) = 0 para todo .
138
9 Estimaci on Optima
9.1.2.
Deseamos construir un t ermino de inyecci on (y y , t ), tal que el estado estimado generado por el siguiente sistema cticio: x = Ax + Bu + (y y , t ), (9.3) converge al valor m as probable del estado verdadero x en el sentido que la siguiente medida de la covarianza del error del estimaci on sea minimizada: J = tr(E{(x x T )}) = tr(P(t )),
donde P(t ) = E{x x T } es la matriz de covarianza de x . Aqui, x = xx es el estimado del error y el operador tr() representa la traza de una matriz (la suma de los elementos de la diagonal). Asumiremos que la din amica del estimador (9.3) es inicializada mediante la elecci on x (0) = E{x(0)}; se asume que la media es conocida. Resulta que cuando la elecci on de es lineal e invariante en el tiempo:
(y y , t ) = L(y y ).
La din amica del error de observaci on resulta: x =x x = (Ax + Bu + Gw) (Ax + Bu + L(y y )) = (A LC)x + Gw Lv. Note que el error de estimaci on x en cualquier instante es debido s olo al disturbio aleatorio w(t ) y el ruido aleatorio v(t ). Si estas dos se nales aleatorias se desvanecen (y si x (0) = x(0)), luego el error permanecer a en cero por todo el tiempo. Resolviendo la din amica del error, siendo que el sistema es lineal, se encuentra que la soluci on de x es: x (t ) = e(ALC)t x (0) +
t 0
El primer t ermino e(ALC)t x (0) depende del estimado inicial de los estados y no es aleatorio. Tambi en sabemos que si A LC es estable, luego e(ALC)t x (0) 0. Luego, para minimizar el error de estimaci on esperado, necesitamos minimizar el error debido al segundo t ermino. Descomponiendo el estimado del error en dos t erminos, uno que resulta del disturbio y otro del ruido:
t
x (t ) =
0 t
=
0
e(ALC)(t ) Lvd = x w + x v .
La funci on de costo usando x =x v + x w resulta J = tr(E{(x w + x v )(x w + x v )T }). ptimo, dada en la primera parte de esta clase, los procesos Retornando con la denici on del problema del observador o de disturbio y ruido son de media cero y Gaussianos (pero no necesariamente estacionarios): E{v(t )} = 0, E{v(t + )vT (t )} = V ( ), E{w(t )} = 0,
E{w(t + )wT (t )} = W ( ), que corresponden a las siguientes funciones de densidad de probabilidad, f (v) = 1 1 exp vT V 1 v , 2 (2 )n |V |
139
f (w) =
1 (2 )n |W |
1 exp vT W 1 v , 2
donde V y W son las matrices de covarianza de v(t ) y w(t ) respectivamente. Si adicionalmente asumimos que v(t ) y w(t ) no son correlacionados; esto es: E{v(t + )wT (t )} = E{w(t + )vT (t )} = 0. Luego la funci on de costo en funci on de los componentes resultantes x v y x w de x est a dada por: T T T T J = tr E{x w x w +x v x v } = tr E{x w x w )} + E{x v x v } =
t t 0
tr E{
d d } + E{
t 0 0
d d }
J = tr
0 t
( )d d
= tr
0
J=
0
(xT Qx + uT Ru)d ,
el sistema en lazo cerrado es descrito como: x = Ax + Bu = (A BK )x. La respuesta en el tiempo es: x(t ) = e(ABK )t x(0). Entonces el costo puede ser calculado como:
t
J=
0 t t
=
0
=
0
= x(0)T
e(ABK ) (Q + K T RK )e(ABK ) d .
T
( T GW GT + T V )dt , = AT + CT .
Aqui, la matriz W representa la matriz de covarianza de w(t ) y la matriz V representa la matriz de covarianza de v(t ). Por denici on, W y V son denidas positiva. Como ya sabemos de la teor a LQR, la entrada de minimizaci on hacia el sistema dual es
= L T ,
140
9 Estimaci on Optima
donde LT = V 1CPT , nica semidenida positiva de la ecuaci y PT es la soluci on u on de Riccati algebraica: AP + PAT PCT V 1CP + GW GT = 0. La ganancia del observador, denido arriba, minimiza la covarianza del error de estimaci on. En un sentido cuanticable, la ganancia balancea entre el error de estimaci on debido a la incertezas en la planta (representadas por el disturbio w(t )) y la incerteza de medida (representada por el ruido desconocido v(t )). Si la covarianza del disturbio es grande en relaci on a la covarianza del ruido, entonces la ganancia resultante del observador L ser a grande. Esto signica que el estado estimado depender a m as fuertemente del error de medida y y . Por otro lado, si la covarianza del disturbio es peque na en relaci on a la covarianza del ruido, entonces la ganancia del observador G ser a peque na. N otese, sin embargo, que L garantiza que A LC sea Hurwitz. El ltro de Kalman aplicado a procesos estoc asticos cont nuos en el tiempo se puede resumir en el siguiente teorema: ptimo tiene la forma de un observador lineal: Teorema 3. (Kalman-Bucy, 1961). El estimador o dx = Ax + Bu + L(y Cx ), dt
donde
Nota: El ltro de Kalman fue originalmente elaborado para sistemas discretos, ver Optimal Estimation of Dynamic Systems de John Crassidis y John Junkins, Cap tulo 5.
9.2.
Control LQG
Regreso a los origenes del problema de control H2 : x = Ax + Bu + w y = Cx + v, donde w y v son procesos aleatorios Gaussianos con media cero y covarianzas W y V . El problema de control estoc astico LQG consiste en:
Asumir por simplicidad que la referencia es cero, r = 0 (de otra forma, se traslada el estado apropiadamente). ptimo tiene la forma Teorema El compensador o x = Ax + Bu + L(y Cx ) u = K (x xd ),
141
ptimo ignorando el controlador por realimentaci donde L es la ganancia del observador o on de estados y K es la ganancia del controlador por realimentaci on de estados ignorando el disturbio w y ruido v. Esto es llamado el principio de separaci on (para control H2 ). ptimo simplicado viene a ser: Nota: El compensador o
x = (A LC)x + Bu + Ly u = K (x xd ),
9.2.1.
Los par ametros del sistema son m = 4kg, J = 0,0475kgm2 , r = 0,25m, g = 9,8m/s2 , c = 0,05Ns/m, que corresponde a un modelo escalado del sistema. El punto de equilibrio para el sistema est a dado por F1 = 0, F2 = mg y ze = (xe , ye , 0, 0, 0, 0). Para derivar el sistema linealizado cerca del punto de equilibrio, calculamos el sistema linealizado: 0 0 00 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 B= 1 A= , . m 0 0 0 g c/m 0 0 1 0 0 0 0 0 c/m 0 m r 00 0 0 0 0 J 0 Haciendo z = z ze y s = u ue , el sistema linealizado est a dado por: dz = Az + Bs. dt 9.2.1.1. ptimo (Filtro de Kalman-Bucy) Observador o
Considere la din amica original de la aeronave de impulsi on presentada en clases anteriores, escrita en la forma espacio de estados como: 0 z4 0 z5 dz 0 z6 . + = 1 c 1 dt g sin m z4 m cos F1 m sin F2 g cos c z5 1 sin F1 + 1 cos F2 m m m r 0 J F1
Considerando s olo la din amica lateral del sistema, esto es, solo los subsistemas cuyos estados estan dados por ). Para dise z = (x , , x , nar el ltro de Kalman debemos incluir la descripci on de los procesos aleatorios de disturbio y ruido de medida. Entonces, aumentando el sistema para que tenga la forma z = Az + Bs + w, y = Cz + v, donde w representa la fuente de disturbio (modelada como un proceso Gaussiano de media igual a cero) y v representa el ruido de media (modelado como un proceso Gaussiano de media igual a cero). La matriz de salida C corresponde a una sola se nal medida x. Para este ejemplo, escogemos que los disturbios de proceso wi , i = 1, ..., n, son disturbios independientes con covarianza dada por Wii = 0,1, Wi j = 0, i = j. El ruido de medida para x xe es una variable aleatoria que modelamos con una covarianza V = 104 . Sea ( T W + T V )dt . JF =
0
142
9 Estimaci on Optima
Encontraremos una (pseudo) ley de control lineal por realimentaci on de estados = LT que minimice JF sujeto al sistema dual = AT + CT . Usando los par ametros mencionados como indicado arriba, se puede calcular la ganancia de Kalman resultante. Resolviendo la ecuaci on de Riccati, se dene la matriz Hamiltoniana asociada como 0 0 0 0 104 0 0 0 0 0 9,8 0 0 0 0 0 1 0 0 , 0125 0 0 0 0 0 0 1 0 0 0 0 0 0 AT CT V 1C . = H= 0 0 0 0 1 0 W A 0,1 0 0 0,1 0 0 0 0 0 1 0 0 0,1 0 0 9,8 0,0125 0 0 0 0 0,1 0 0 0 0
Calculando los autovalores y autovectores de H , posteriormente identicando los autovectores correspondientes a los 1 se obtiene autovalores con parte real negativa, deniendo WF y ZF , y sabiendo que PF = ZF WF 0,0037 0,0047 P= 0,0185 0,0032 0,0047 0,0768 0,1703 0,0598 0,0185 0,1703 0,6390 0,1170 0,0032 0,0598 . 0,1170 0,1482
(9.4)
Entonces
El desempe no del estimador es mostrado en la Fig. 9.2(a). Observamos que a pesar de que el estimador converge a los estados del sistema, se presenta bastante sobreimpulso en los estados estimados, lo que puede llevar a un bajo desempe no en un sistema en lazo cerrado. Para mejorar el desempe no del estimador, exploramos el impacto de aumentar una nueva se nal medida. Suponiendo que en lugar de s olo medir la posici on de salida x, tambi en medimos la orientaci on de la aeronave . La matriz de salida resulta 1000 v y= z+ 1 , v2 0100 y si asumimos que v1 y v2 son independientes fuentes de ruido, cada uno con covarianza Vi = 104 , luego la matriz de ptimo resulta ganancias del estimador o 32,6 0,150 0,150 32,6 (9.6) L= 32,7 9,79 . 0,0033 31,6 Estas ganancias proveen buena inmunidad al ruido y alto desempe no, como mostrado en la Fig. 9.2(b).
(9.5)
9.2.1.2.
Se puede vericar que el sistema es alcanzable. Luego, para calcular el regulador cuadr atico lineal para el sistema, escribimos la funci on costo como: (z T Qz + sT Rs)dt . J=
0
Comenzamos con matrices diagonales para los costos del estado y la entrada:
218
0.1 0.1
143
0.1
0.1
0.2
0.2
0.3
xd
0.3
xd
d
0.4
0.5
1 Time t [s]
1.5
0.4
0.5
1 Time t [s]
1.5
Figura 9.2 Dise no del ltro de Kalman para la aeronave de impulsi on. En el primer dise no (a) s olo se mide la posici on lateral de la the lateral position of the aircraft is measured. Adding a direct measurement of the roll aeronave. Aumentando una medida directa del a ngulo de rotaci on produce un mejor observador (b). Las condiciones iniciales para ambas angle produces a much better observer (b). The initial condition for both simulations is simulaciones son (0,1, 0,0175, 0,01, 0)
Kalman lter design for a vectored thrust aircraft. In the rst design (a) only
0 1 0 0175 0 01 0 .
1 0 0 the 0 same parameters as before, the resulting Using having covariance R 10 4 . 0 1 0 0 , Kalman gain is given by Q = R = 100. 0 0 1 0 37 0 0001 46 9 L 185 Usando estas matrices, se puede calcular la ganancia del regulador por realimentaci on de estados resultante. Resolvien31 6 como do la ecuaci on de Riccati, se dene la matriz Hamiltoniana asociada The performance of the estimator the 0 0is shown 1 in Figure 0 0 7.9a. 0 We0see that while 0 estimator converges to the system state, it contains signicant overshoot in the state 0 0 0 1 0 0 0 0 poor estimate, which can lead to performance in0a closed loop setting. 0 9 , 8 0 , 0125 0 0 0 , 00006 0 , 0013 a To improve the performance we explore the impact of adding 1 B T 0 of0the estimator, 0 0 0 0 0,0013 0,0277 A BR . = Suppose H = output measurement. new that instead of measuring just the output position T 1 0 0 0 0 0 0 0 Q A x , we also measure the orientation of the aircraft . The output becomes 0 1 0 0 0 0 9,8 0 Calculando los autovalores y autovectores de H , posteriormente identicando los autovectores correspondientes a los and if we assume that 1 and with covariance 2 are independent noise sources each 1 se obtiene autovalores con parte real negativa, deniendo W y Z , y sabiendo que P = Z W K K K K K R 10 4 , then the optimal estimator gain matrix becomes
i
0 y 0
0 1 00 0 01 0 1 1 0 0 z 1 0 1 0 1 0 0 2
0,0125 0
0 0
(9.7)
Luego la ley de control de la forma s = K z ser a usada para derivar la ley de control en t erminos de las variables L 32 7 9 79 originales: 0 0033 31 6 u = s + ue = K (z ze ) + ue .
0 150
32 6
These gains provide good immunity to noise and high performance, aszeillustrated Como especicado en clases anteriores, los puntos de equilibrio corresponden a ue = 0 y = (xe , 0, 0, 0). in Figure 7.9b.
Control LQG
9.2.1.3.
ptimo LQG resulta: El compensador o 32,6 0 32,6 0,15 1 0 0,150 0 0,15 32,6 0 1 + z = 0,25 u + 32,7 32,7 0,01 0,0125 0 z 0,0033 5,263 0,0033 31,6 0 0 u = 0,316 9,198 0,824 5,955 z + Kze , 09.
144
9 Estimaci on Optima
9.2.2.
(9.8)
El vector x = x1 x2 es el vector de estados, u es la entrada de control, y es la salida medida y w y v son los ruidos blancos Gaussianos independientes con intensidades 0 y 1 respectivamente. El ndice de desempe no asociado est a dado por: 1 T ( (x1 + x2 )2 + u2 )dt J = E l m T T 0 ametro real no negativo. donde E() es el operador valor esperado y es un par Extrayendo las siguientes matrices del problema con el n de simplicar c alculos posteriores: A= 11 , 01 B1 = 0 , 1 B2 = 1 , 1 B3 = 0 D13 = 1
C1 = 1 0 ,
D11 = 0,
D12 = 0,
9.2.2.1.
LQR
El problema de control LQR queda denido por la minimizaci on del siguiente funcional de desempe no: JLQR = siendo que: x 1 x 2 =A x1 + B1 u x2
0
( (x1 + x2 )2 + u2 )dt
La ecuaci on de Riccati que resuelve el problema de control LQR est a dada por: PA + AT P PBR1 BT P + Q = 0 PA + AT P PB1 p11 p12 p12 p22 11 10 + 01 11 10 T 11 B P+ =0 01 1 11 0 1 01 11 p11 p12 =0 + 11 p12 p22
00 2 p11 p2 p11 + 2 p12 p12 p22 + 12 + = 00 p11 + 2 p12 p12 p22 + 2 p12 + 2 p22 p2 + 22 Resolviendo para cada elemento de la matriz P se obtiene: P= donde = 2 + 4 + . Luego la ganancia del LQR es: K = R1 BT 1P= 1 1 21 11
145
9.2.2.2.
Filtro de Kalman
ptimo queda denido por la minimizaci El problema del observador o on del siguiente funcional de desempe no: JFK = siendo que:
0 T ( T B2 BT 2 + 1 )dt
1 2
= AT
1 T + C1 2
ptimo est La ecuaci on de Riccati que resuelve el problema del observador o a dada por: PF AT + APF PF CT V 1CPF + B2W BT 2 =0
T PF AT + APF PF C1 1 C1 PF + B2 BT 2 =0 T
10 11 + 11 01
1 0
10
1 1
=0
2 p11 + 2 p12 p2 11 + p22 + 2 p12 p12 p11 + p22 + 2 p12 p12 p11 + 2 p22 p2 12 + Resolviendo para cada elemento de la matriz P se obtiene: PF = 11 12
1 1
9.2.2.3.
LQG
ptimo est Luego, el compensador o a dado por: x = Ax + B1 u + L(y C1 x ) u = K x Reescribiendo lo anterior se tiene: k (s) = donde A B1 K LC1 = Evaluando K (sI (A B1 K LC1 ))1 L, se obtiene: k (s) = s2 + ( + A B1 K LC1 L , K 0 1 1 ( + ) 1
(1 2s) 2)s + 1 +
9.2.2.4.
Considerando el sistema en lazo cerrado mostrado en la Fig. 9.3, en donde la ganancia posee valor nominal igual a +1.
146
9 Estimaci on Optima
Realizando los c alculos se muestra que solo los terminos lineal y constantes del polinomio caracter stico del sistema en lazo cerrado son funciones de y que esos terminos estan dados por:
+ 4 + 2( 1)
y1 + (1 )
respectivamente. Una condici on necesaria para estabilidad es que ambos terminos sean positivos (criterio de estabilidad de Routh-Hurwitz?) Esta condici on es satisfecha para el caso del lazo nominal = 1. Sin embargo, para , = 4 (en otras palabras, = 0 y = 0), la condici on necesaria de estabilidad es a 1 1 < < 1+ . 8 16
on necesaria de estabilidad se torna en: Esta situaci on empeora si y son grandes. Para el caso de = , la condici 1+ 1 2 1 < < 1+ 2. 2
Luego, el margen de ganancia puede ser arbitrariamente peque no si se selecciona y (equivalentemente, y ) lo sucientemente grandes. Asi, concluimos que la optimalidad del LQG no garantiza robustez en estabilidad! La robustez en estabilidad de un sistema en lazo cerrado LQG debe ser chequeada a posteriori. Este inconveniente es una propiedad fundamental de los m etodos asociados a minimizaci on de normas cuadr aticas y fue una de las razones principales por las que se inicia la investigaci on en abordajes que minimizan la norma innita. La robustez es un objetivo clave de la realimentaci on que siempre debe ser analizado.
w plant
v y
u s
Fuente: Applied Optimal Control, de A.E. Bryson, Jr. y Y.-C.Ho, Hemisphere Publishing, 1975. Fuente: Aircraft Control and Simulation, de B.L. Stevens y F.L. Lewis, John Wiley & Sons, NJ, Second Edition, 2003. Fuente: Advanced Control System Design, de B. Friedland, Prentice-Hall, 1996. om y Fuente: Cap tulo 7 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr Richard M. Murray. Fuente: Linear Robust Control, de M. Green y D. Limebeer, Pearson Education, Inc.
Cap tulo 10
10.1. 10.1.1.
Introducci on
Dado un sistema de control no lineal: x = f (x, u) x Rn , u R p y = h(x) y Rq y una trayectoria de referencia r(t ) Rq , encontrar una ley de control u = (x, r) tal que: limt (y(t ) r(t )) = 0. 10.1.1.1. Abordaje:
10.1.1.2.
Generaci on de trayectoria:
amica) Encontrar una trayectoria posible (satisface din x d = f (xd , ud ) xd (r), ud (r) r = h(xd )
147
148
10.1.1.3.
Seguimiento de trayectoria:
Encontrar u = (x , xd , ud ) tal que el sistema en lazo cerrado sea estable, con desempe no deseado.
10.1.1.4.
Estimaci on:
Determinar x a partir de y, u.
10.1.1.5.
Revisi on:
1. Escoger K para la din amica en lazo cerrado deseada (ubicaci on de autovalores, LQR, etc). 2. Escoger kr que provee el valor deseado a la salida. x = Ax + Bu = (A BK )x + Bkr r Punto de equilibrio xe = (A BK )1 Bkr r ye = C(A BK )1 Bkr r = kr = 1 C(A BK )1 B r
deseado
Este abordaje trabaja mediante estabilizaci on del origen y luego usando kr r para empujar el sistema hacia xe . Funciona porque el sistema es lineal.
10.1.2.
Formulaci on alternativa:
Resolver directamente para el punto de equilibrio. El objetivo es encontrar una ley de control tal que la salida limt y(t ) = yd = para alguna salida deseada r. Para resolver este problema, primero denimos el estado deseado correspondiente limt x(t ) = xd y entrada limt u(t ) = ud para alcanzar r. Obviamente, xd , ud y yd deben satisfacer las ecuaciones de estado y salida; esto es x d = Axd + Bud yd = Cxd + Dud Siendo que xd es una constante, x d = 0, tenemos: 0 = Axd + Bud yd = Cxd + Dud Dado yd , resolvemos las ecuaciones arriba para xd y ud . Si no hay soluci on para xd y ud , entonces el objetivo de limt y(t ) = yd no se puede alcanzar. Entonces, asumamos que la soluci on existe; esto es, la ecuaci on lineal: 0 AB = yd C0 xd ud
tiene soluci on. Para un sistema de una entrada una salida, xd y ud puede ser resuelto como
149
1
xd AB = ud C0
0 u = K (x xd ) + yd
estabiliza pto equilibrio
ud
entrada nominal
x = A x + B u y = C x + D u
Suposici on fundamental: (xd , ud ) es un punto de equilibrio para r constante.
10.1.2.1.
Ejemplo
ngulo, la velocidad angular y la corriente, respectivamente; la entrada v on del a donde los estados , , i son la posici ngulo. Nuestro objetivo es llevar el motor a d = 10 y a la vez es el voltaje aplicado y la salida y es la posici on del a minimizar (9( d )2 + v2 )d . J (x ) =
0
150
= 3,00 0,8796 0,1529 i d = 3,00 0,8796 0,1529 d i id = 3,00 0,8796 0,1529 3,00 0,8796 0,1529 i = 3,00 0,8796 0,1529 3,00 0,8796 0,1529 i = 30 + 3,00 0,8796 0,1529 i
d d id 10 0 0
10.1.3.
Sea el sistema no lineal con trayectoria posible: x = f (x, u) y = h(x) x d = f (xd , ud ) r(t ) = h(xd )
Para estabilizar la trayectoria de referencia, observar el error e = x xd , luego: x = f (x, u) x d = f (xd , ud ) e = f (x, u) f (xd , ud ) = f (e + xd , v + ud ) f (xd , ud ) = F (e, v, xd , ud )
termino no lineal que varia en el tiempo
A continuaci on trataremos a xd , ud como si fuesen par ametros en el controlador y linealizaremos en torno a (e, v) = (0, 0). F f e = Ad e + Bd v Ad = = e ( 0, 0) x ( xd , u d ) F f = Bd = v ( 0, 0) u ( xd , u d ) Ahora estabilizar e = 0 mediante elecci on de Kd tal que (Ad Bd Kd ) sea Hurwitz. u = Kd (xd , ud )(x xd ) + ud
151
10.1.3.1.
Observaciones
1. No asumir que (xd , ud ) son valores de equilibrio, s olo que son valores que satisfacen la din amica. Punto de equilibrio resulta en el caso especial de r =constante. 2. De forma m as general se puede programar las ganancias obtenidas para cualquier par ametro, o a un el estado: u = Kd (xd , ud )(x xd ) + ud Usar con cuidado (NL!)
3. Problema: Linealizar en torno al punto de equilibrio deseado, luego linealizaci on no trabajar a muy bien lejos de este punto. 4. En la practica, implementar la programaci on de ganancias (gain scheduling) a trav es de interpolaci on:
5. En teor a, no se puede decir mucho en relaci on a como este m etodo trabaja. Trabaja bien si (xd , ud ) varian lo sucientemente despacio. Trabaja bien en practica, a un si la variaci on de (xd , ud ) es r apida.
10.1.3.2.
Considerar el vehiculo con dos ruedas mostrado en la Fig. 10.3. Para prop ositos de direccionamiento estamos in ngulo de direcci teresados en un modelo que describe como la velocidad del vehiculo depende del a on . Para ser espec cos, considerar la velocidad v del centro de masa, una distancia a a partir de la rueda trasera, y sea b la distancia ngulo de orientaci ngulo entre la entre ruedas. Sean x e y las coordenadas del centro de masa, es el a on y es el a velocidad v y la linea de centros del vehiculo. Dado que b = tan y = 0 (punto de referencia est a en la rueda trasera), asumiendo que las ruedas ruedan sin resbalarse, encontramos que el movimiento del centro de masa est a dado por: dx = v cos dt (10.1) dy = v sen dt ngulo es inuenciado por el a ngulo de direcci Para ver como el a on, observamos, de la Fig. 10.3, que el vehiculo rota con la velocidad angular v/ra en torno al punto O. Entonces: v v d = = tan dt ra b (10.2)
Las ecuaciones (10.1) y (10.2) pueden ser usadas para modelar la bicicleta bajo la suposici on que no hay resbalamiento entre ruedas y el piso. La suposici on de no resbalamiento puede ser relajada adicionando una variable de estado extra, dando asi un modelo m as realista. Tal modelo tambi en describe la din amica de direccionamiento de barcos asi como la din amica de alabeo de aeronaves y misiles. Las ecuaciones de movimiento no lineales del sistema pueden ser descritas como: v cos x d v sen y = v = f (x, y, , v, ) dt tan u x b
152
donde x, y y son la posici on y la orientaci on del centro de masa del vehiculo, v es la velocidad de la llanta trasera, b ngulo de la rueda delantera. es la distancia entre la rueda delantera y trasera y es el a
x
ngulo direccional es y la velocidad del centro de masa tiene un a ngulo relativo Figura 10.3 Din amica de la direcci on de la bicicleta. El a al eje longitudinal del vehiculo igual a cero. La posici on de la bicicleta est a dada por (x, y) y la orientaci on por . La distancia entre ruedas es b, el centro de masa est a ubicado a una distancia a hacia adelante de la rueda trasera.
Estamos interesados en el movimiento del vehiculo en linea recta horizontal con velocidad ja v = vr = 0, entonces: xd = vr t yd = yr x d d = 0 vd = vr ud d = 0 Notar que (xd , yd , d , vd , d ) no son un punto de equilibrio, pero si satisfacen las ecuaciones de movimiento. Deniendo el error, se tiene lo siguiente para la din amica del error: ex = x vr t e x = v cos vr e x = (ev + vr ) cos e vr = F1 (ex , ey , e , ev , e ) e y = (ev + vr ) sen e = F2 (ex , ey , e , ev , e ) ey = y yr e y = v sen v ev + vr e = tan e = F3 (ex , ey , e , ev , e ) e = tan e = b b ev = v vr e = Linealizando con respecto a (ex , ey , e , ev , e ) = (0, 0, 0, 0, 0), se tiene: F1 F1 F1 ex ey e 0 0 (ev + vr ) sen e F2 F2 F2 = 0 0 (ev + vr ) cos e Ad = ex ey e ex = 0, ey = 0, e = 0 00 0 F3 F3 F3 ev = 0, e = 0 ex = 0, ey = 0, e = 0 ex ey e
ev = 0, e = 0
F1 ev F 2 Bd = ev F 3 ev
Luego, se obtiene que:
F1 e F2 e F3 e
ex = 0, ey = 0, e = 0 ev = 0, e = 0
153
1 0 00 0 e x ex 0 ev e y = 0 0 vr ey + 0 v e r 0 e e 00 0 b Resolviendo el problema de control para este sistema (ubicaci on de polo, LQR), se tiene que: ex ev = Kd ey e e x vr t v v = Kd y yr + r 0
o, m as espec camente:
00 0 Ad = 0 0 vr , 00 0
1 0 0 0 Bd = v r 0 b
e x = ev e y = vr e vr e = e b
ev = 1 ex b e = (a1 ey + a2 e ) , vr
que posiciona los polos del sistema en lazo cerrado en 1 y las raices de s2 + a1 s + a2 = 0. Luego el controlador en ngulo coordenadas originales queda como:la posici on del a x vr t 1 0 0 v v a1 b a2 b y yr + r = 0 0 vr vr
Kd e ud
10.2.
Una amplia clase de problemas de estimaci on involucra modelos no lineales. Por muchas razones, estimaci on de estados para sistemas no lineales es considerablemente m as dif cil y admite una gran variedad de soluciones en comparaci on al problema lineal. Considerando el siguiente modelo no lineal real con medidas de tiempo cont nuas: x (t ) = f (x(t ), u(t )) + G(t )w(t ), y(t ) = h(x(t )) + v(t ) (10.3)
donde f (x(t ), u(t ), t ) y h(x(t ), t ) son asumidas cont nuas y diferenciables, y w(t ) y v(t ) son procesos de ruido Gausiano de media cero con covarianzas dadas por: E{w(t )wT ( )} = W (t ) E{v(t )vT ( )} = V (t ) E{v(t )wT ( )} = 0 (10.4) (10.5) (10.6)
La ecuaci on (10.6) implica que v(t ) y w(t ) no estan corelacionados. Adem as, la entrada de control u(t ) es una cantidad determin stica. El problema con un modelo no lineal es que una entrada Gausiana no necesariamente produce una salida Gausiana (como en el caso lineal).
154
Existen muchas formas de producir una version linealizada del ltro de Kalman. A continuaci on consideraremos el abordaje m as com un, llamado ltro de Kalman Extendido. El ltro de Kalman extendido, a pesar de no ser precisamente optimo, ha sido satisfactoriamente aplicado a varios sistemas no lineales en el transcurso de los a nos. El concepto fundamental de este ltro involucra la noci on de que el estado real est a lo sucientemente cerca del estado estimado. Luego, la din amica del error puede ser representado de forma bastante exacta mediante una expansi on en series de Taylor linealizada de primer orden. A continuaci on omitiremos la dependencia con respecto al tiempo de las se nales para simplicar la notaci on. Considerando el observador no lineal como descrito a seguir: x = f (x , u) + L(y h(x )) La din amica del error de estimaci on, e = x x , est a denida por: e = f (x, u) f (x , u) + Gw L(h(x) h(x )) Lv = F (e, x , u) + Gw LH (e, x ) Lv E (e, x , u, w, v) donde: F (e, x , u) = f (e + x , u) f (x , u) H (e, x ) = h(e + x ) h(x ) (10.8) (10.7)
E e
e+
( 0, x ,u,0,0)
E w
w+
( 0, x ,u,0,0)
E v
v
( 0, x ,u,0,0)
F H L e + Gw Lv e ( 0, x e ( 0, x ,u) ) (x (x e = (A ) LC ))e + Gw Lv
donde:
(10.9)
F (x A ) = e H (x C ) = e
10.2.1.
Idea
Dise nar el observador para el sistema linealizado en torno al estimado actual Observador: x = f (x , u) + L(y h(x )) donde: T (x L = PC )V 1 (x T (x T (x =A P )P + PA ) + GW GT + PC )V 1C(x )P, Este viene a ser el Filtro de Kalman Extendido (EKF) (Schmidt). P(to ) = E{e(to )eT (to )}.
10.2.2.
Ejemplo
En este ejemplo demostraremos la utilidad del ltro de Kalman extendido para estimar los estados de la ecuaci on de Van der Pol, dada por:
155
mx + 2c(x2 1)x + Kx = 0, donde m, c y k poseen valores positivos. Esta ecuaci on induce un ciclo limite que es sostenido periodicamente mediante liberaci on de energ a hacia y absorci on de energ a del ambiente, a trav es del t ermino de amortiguamiento. El sistema puede ser representado en su representaci on espacio de estados como descrito a continuaci on: x 1 = x2 2 1)x (k/m)x . x 2 = 2(c/m)(x1 2 1 Las se nales medidas son posici on tal que C = [1 0]. Para efectos del ejemplo hemos generado los estados usando m = c = k = 1 y con condici on inicial igual a xo = [1 0]T . Las medidas son muestreadas con intervalos de t = 0,01s y la matriz G usados en el ltro con un error de medida con desviaci on estandar de = 0,01. El modelo linealizado A de Kalman extendido son: = A 0 1 2 1) , 4(c/m)x 1 x 2 (k/m) 2(c/m)(x 1 G= 0 . 1
Notese que no se ha incluido ruido de proceso (en otras palabras, no hay error) en el primer estado. Esto es debido al hecho que el primer estado es una relaci on cinem atica que es correcta tanto en teor a como en la practica (velocidad siempre es derivada de la posicion). En el ltro de Kalman extendido los par ametro del modelo son asumidos como m = 1, c = 1,5 y k = 1,2, lo cual introduce errores en los par ametros asumidos, comparados al sistema real. La covarianza inicial es escogida como Po = 1000I . El escalar W en el ltro de Kalman extendido es luego variado hasta que se obtengan estados estimados razonables (este anamiento de la matriz de covarianza es bastante com un en el dise no del ltro de Kalman tambi en). La respuesta a la pregunta cu ales son los estimados razonables? es a menudo dejado al ingeniero de dise no. Dado que para simulaci on los valores verdaderos son conocidos, podemos comparar nuestros estimados con los verdaderos valores para anar W . Encontramos que q = 0,2 provee un buen estimado.
Differenced Measurement
5 2.5 0 2.5 5 0 5 2.5
Estimate
2 4 6 8 10
0 2.5 5 0
10
Time (Sec)
0.03 0.5
Time (Sec)
Velocity Errors
2 4 6 8 10
Position Errors
10
Time (Sec)
Figura 10.4 Resultados del ltro de Kalman extendido para la ecuaci on de Van der Pol
Time (Sec)
Fuente: Lecture 1-1, CDS 110b, de Richard Murray. om y Fuente: Cap tulo 3 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J. Astr Richard M. Murray. Fuente: Optimal Estimation of Dynamical Systems, de J.L. Crassidis y J.L. Junkins, 2004.
Cap tulo 11
11.1.
Un velero de masa m y velocidad v(t ) (el viento con una velocidad constante vw empuja al velero desde la parte trasera), desarrolla una fuerza impulsora igual a: Fa (t ) = k1 (vw v(t ))2 A(t ), rea de la vela. La fuerza de resistencia que el velero debe superar donde A(t ) es el a cuando viaja en el agua se puede aproximar por: Fw (t ) = k2 v2 (t ).
vw
A(t)
v(t)
(1.1) Velero
1. Derivar las ecuaciones de movimiento para el velero. Escribir la representaci on espacio de estados para la entrada A(t ) y la salida v(t ). Usando la 2da Ley de Newton se obtiene la ecuaci on de movimiento del velero: F = m dv dt dv dt dv dt
Fa (t ) Fw (t ) = m
dv k1 (vw v(t ))2 A(t ) + k2 v2 (t ) = 0. Escribiendo la ecuaci on de movimiento en la dt forma de espacio de estados, siendo que v(t ) es la variable de estado, A(t ) es la variable de entrada y v(t ) es tambi en la variable de salida. d k2 k1 v = v2 (t ) (vw v(t ))2 A(t ) . dt m m y= v
La din amica del sistema presenta una representaci on espacio estados de la forma x = f (x, u) ya que estamos lidiando con un sistema no lineal. rea de la vela A(t ) para mantener la nave a una velocidad constante vo < vw ? 2. Qu e tan grande debe ser el a dv = 0. Luego de la representaci on espacio de estados se Si la velocidad del velero es constante, se debe cumplir dt tiene que:
157
158
rea de la vela para llegar a un velocidad constante vo = vw ? 3. Cu al deber a ser el a Si la velocidad v es constante e igual a vw , entonces de la expresi on anterior se tiene que: A(t )vo vw = l m Problema 1.2: Oscilador Van der Pol k2 v2 o . vo vw k1 (vw vo )2
Considere el circuito simple R, L, C de la Fig. (1.2) con L y C siendo elementos lineales y R siendo un resistor no lineal (no cumple la ley de Ohm VC = iR R, en su lugar iR = f (vC )). La gura a la derecha muestra la caracter stica del resistor.
1. Elegir como estados a la corriente en el inductor iL y el voltaje del capacitor vC y calcular la representaci on espacio de estados del sistema. Para modelar el circuito el ectrico usamos la ley de Kirchhoff para corrientes: iC = iR + iL . dvC 3 + iL . = vC + vC dt Despejando en funci on de la variable de estado vC : C dvC 1 1 3 1 = vC + vC + iL . dt C C C Tambi en sabemos que en un circuito que tiene elementos conectados en paralelo se cumple que: vC = L Despejando en funci on de la variable de estado iL : 1 diL = vC . dt L Siendo los estados iL y vC , la representaci on espacio de estado del sistema es: 1 vC d il L = 1 1 1 . v 3 dt C vC + vC + iL C C C diL . dt
La din amica del sistema presenta una representaci on espacio estados de la forma x = f (x, 0) ya que estamos lidiando con un sistema no lineal.
159
Problema 1.3: Preguntas varias Responder seg un se pida. 1. Control feedforward La Fig. (1.3) muestra una aplicaci on t pica de control feedforward.
El tanque de mezcla cont nua posee una temperatura controlada por realimentaci on. Control feedforward es empleado para suprimir r apidamente los disturbios en el ujo de alimentaci on. a) Destacar en la gura qu e lazos corresponden a realimentaci on y feedforward, respectivamente. Justicar. b) Presentar el diagrama de bloques del sistema.
2. Elementos b asicos del sistema de control La Fig. (1.4) muestra un veh culo de exploraci on espacial (rover), ejemplo de un sistema de control embebido. Los sistemas de control embebido emplean computadoras digitales de usoespec co abordo como componente fundamental en el lazo de control por realimentaci on.
a) Identicar cada uno de los elementos b asicos del sistema de control. Presentar el diagrama de bloques del sistema incluyendo cada componente destacado en la gura. nica ley de control ser b) Cree Ud que una u a responsable del movimiento del rover? Justique. 3. Puntos de equilibrio La Fig. (1.5) presenta al p endulo incluyendo dos magnetos de igual fuerza han sido adicionados cerca a la la parte inferior del arco de oscilaci on del p endulo. Ayuda: La ecuaci on del p endulo simple es: + b + mgl sin = 0, ml 2
160
a) Bosqueje el diagrama de plano de fase del sistema del sistema p endulo sin considerar los magnetos. Considere [2 , 2 ]. Explique el graco realizado. b) Si bien la ecuaci on de movimiento del sistema incluyendo los magnetos es compleja en su c alculo, bosqueje como lucir a el diagrama de plano de fase del sistema. Considere [ /2, /2]. Cu ales son los puntos de equilibrio de este sistema?
ngulo hecho por el p endulo con la vertical, g es la aceleraci on de la gravedad y b > 0 el amordonde es el a . tiguamiento del sistema. Las variables de estado son y Problema 1.4: Modelado de sistemas
Encontrar formas de realizar operaciones de manipulaci on/reparaci on en el espacio es un problema que recibe bastante atenci on - por ejemplo, para el ensamblaje de la estaci on espacial internacional y para la recuperaci on de sat elites. En la actualidad el trabajo lo vienen realizando sistemas de manipulaci on remota; sin embargo, un nuevo m etodo considerando partes inables del manipulador viene siendo estudiado debido a la gran reducci on en peso. La Fig. (1.6a) muestra la construcci on de una estructura espacial desde un transbordador y la Fig. (1.6b) muestra un modelo del manipulador exible donde J es la inercia del motor conductor, I es la inercia de la carga medida en su centro de masa, u es el torque generado el motor, m es la masa de la carga, l es la distancia al centro de gravedad de ngulos de rotaci la carga, y son los a on del motor y la carga respectivamente, y k es la rigidez torsional del eje exible. Considerar w como un torque externo que afecta a la carga.
1. Presentar un modelo mec anico traslacional, an alogo al modelo mec anico torsional presentado en la Fig. (3b). sta 2. Calcular las ecuaciones de movimiento del sistema. Considerar el efecto de la fuerza gravitatoria (a un siendo e peque na). 3. Derivar la representaci on espacio de estados del sistema introduciendo las variables de estado (normalizadas) x1 = k(J + I + ml 2 ) . Considerar aceleraci on de la gravedad g = 0, s olo para esta , x2 = , donde o = o J (I + ml 2 ) pregunta.
161
Problema 1.5: Suspensi on de un veh culo Los veh culos usan suspensi on activa y/o pasiva para permitir un paseo confortable en caso se presenten desniveles en las carreteras. La Fig. (1.7) -derecha- muestra un diagrama esquem atico del veh culo con un sistema de suspensi on. El modelo representa un cuarto del modelo del veh culo; el veh culo es aproximado por dos masas, una representa un
cuarto del cuerpo del veh culo y la otra una rueda (incluyendo frenos y parte del sistema de suspensi on). El actuador ejerce una fuerza F entre la rueda y el cuerpo que es calculada en base a la realimentaci on de la distancia entre el cuerpo y la rueda. Sean xb , xw y xr las alturas del cuerpo, rueda y supercie de la carretera medidas todas desde el equilibrio. Representar la masa del cuerpo, masa de la rueda y rigidez de la rueda por mb , mw y kt , respectivamente. Calcular lo que se pide: 1. Determinar las ecuaciones de movimiento. Incluir diagramas de cuerpo libre. Nota: Las ecuaciones de movimiento deben de quedar en funci on de la fuerza F . 2. Un sistema de suspensi on convencional consiste en un resorte y un amortiguador, de rigidez k y coeciente de amortiguamiento c respectivamente, luego se tiene F = k(xw xb ) + c(x w x b ). Escribir las ecuaciones de movimiento para el sistema de suspensi on convencional en la forma espacio de estados. Detallar cual es el vector de estados, la matriz din amica, la matriz de entrada y la entrada. 3. Cu al seria la(s) salida(s) de interes del sistema? Por qu e? Escribir la ecuaci on de salida en su representaci on espacio de estados. 4. Presente el diagrama de bloques (diagrama de simulaci on)correspondiente al sistema de suspensi on convencional. Problema 1.6: Paseo dominguero en bicicleta Una pareja sale a pasear en bicicleta un dia domingo. El muchacho (que pesa 200 libras) maneja una bicicleta vieja y pesada, y la esposa (que pesa 100 libras) maneja una bicicleta de carrera, ligera, con ruedas de alta presi on, rayos de aluminio, etc. Ambos van paseando juntos cuando de pronto alcanzan una pendiente y deciden no pedalear ni frenar en esta pendiente. Al nal, el muchacho llega bien adelante de la esposa. Ambos quedan confundidos; para qu e gastar $1000 en una bicicleta tan lujosa si esto es lo que va a pasar! Usted debe explicar este hecho analizando la din amica del sistema como se pide a continuaci on. 1. Obtenga un modelo para la bicicleta + conductor pendiente abajo. En otras palabras, graque la bicicleta + conductor bajando la pendiente. Su graca debe incluir los par ametros del sistema: masas, momentos de inercia, dimensiones, ngulos, etc. a 2. Dibujar el diagrama de cuerpo libre para la bicicleta + conductor que muestre todas las fuerzas que act uan en el sistema. 3. Escribir una ecuaci on de movimiento del sistema de primer orden. Considere la inercia de las ruedas, estructura y conductor como una sola inercia de masa. 4. Escribir la representaci on espacio de estados del sistema descrito en el paso anterior. Se nalar el/los estados y la/las entradas. Adicionar la ecuaci on de salida, especicando la/las salidas (Ud dene las salidas). 5. Calcular el velocidad de equilibrio ve del sistema para el caso cuando la bicicleta es manejada en una pendiente con inclinaci on (e = ).
162
6. (2 ptos) Escriba la aproximaci on lineal del sistema en torno al punto de equilibrio (ve , e ). 7. En base a la descripci on de las bicicletas y de los conductores, usar el modelo linealizado para mostrar por qu e el muchacho, de mayor peso y conduciendo la bicicleta vieja, termina llegando primero al nal de la pendiente. Sugerencia : Resolver la ecuaci on diferencial para el caso v (0) = 0. Despu es de todo este an alisis, cu al ser a la ventaja de poseer una bicicleta m as ligera? Respuesta: la ventaja se maniesta cuando se maneja cuesta arriba! Problema 1.7: Microscopio de fuerza at omica (AFM, por sus siglas en Ingl es) El AFM es una de las principales herramientas en generaci on de im agenes, medidas y manipulaci on de materia en la nanoescala. La informaci on es colectada palpando la supercie de la muestra (sample) con una sonda mec anica (viga voladiza - cantilever). Elementos piezoel ectricos ejecutan peque nos y precisos movimientos generados por un comando electr onico. Una diagrama esquem atico del AFM se muestra en la gura de la izquierda. Una viga voladiza (cuya longitud onica es colocada cerca de la muestra. La muestra puede ser movida usualmente varia entre 50-200 m) con una punta c vertical y horizontalmente usando un elemento piezoel ectrico. Cuando la muestra se acerca a la punta de la viga, fuerzas de interacci on entre la muestra y la punta conllevan a una deexi on de la viga voladiza. La deexi on es medida usando un rayo laser reejado desde la parte superior de la viga voladiza hacia un arreglo de fotodiodos. La deexi on de la viga es controlada por realimentaci on usando un actuador piezol ectrico que controla la posici on vertical de la muestra. En base a experimentos se captura la din amica del sistema piezoel ectrico-viga voladiza y se obtiene un modelo mec anico simple del sistema (gura de la derecha). El sistema puede ser modelado como dos masas separadas por un piezoel ectrico ideal. La masa m1 es la mitad del sistema piezoel ectrico, y la masa m2 es la otra mitad del sistema piezoel ectrico m as la masa del apoyo. Se asume que el piezoel ectrico genera una fuerza F entre las masas y que hay amortiguamientos c1 y c2 en los resortes. Sean las posiciones de los centros de masa z1 y z2 . 82
F
Photo diode Sample Sweep generator x,y Amplifier Deflection reference
(a) Schematic diagram (1.8a) Diagrama esquem atico del AFM
Laser Cantilever
m1
F m2 k1 c1 c2
k2
Amplifier
1. Determinar las ecuaciones de movimiento del sistema piezoel ectrico - viga voladiza. Asumir que el sistema parte del equilibrio est atico (no incluir fuerza gravitacional). Presentar diagramas de cuerpo libre 2. Sea la elongaci on del elemento piezoel ectrico l = z1 z2 la variable de control y sea la deexi on de la viga voladiza z1 la variable de salida, eliminar la variable F en las ecuaciones anteriores y reescribir las ecuaciones en funci on de las variables l y z1 3. Usando las ecuaciones lineales l = k3 u y y = k4 z1 , escribir el modelo del sistema relacionando la salida y con su se nal de control u. La salida y corresponde a la deexi on amplicada y la se nal de control u corresponde al voltaje aplicado al piezoel ectrico 4. Calcular la representaci on espacio de estados del sistema anterior. Cu ales son los estados, la/las entrada/as y salida del sistema? Y ( s) 5. Obtener la funci on de transferencia del sistema piezoel ectrico-viga voladiza, G(s) = U ( s) . 6. Calcular la din amica normalizada del sistema y su correspondiente representaci on espacio de estados. Sugerencia: Denir las variables adimensionales x = forma m as conveniente
y L
y = t , donde =
k m,
Problema 1.8: Preguntas variadas Responda seg un sea el caso. Argumente en las respuestas.
163
1. La Fig. (1.9) muestra la respuesta en el tiempo de un sistema con control crucero a un cambio en la rapidez de 25 m/s a 30 m/s. Las 3 curvas corresponden a masas del veh culo diferentes, entre 1000 y 3000 kg, qu e propiedad del sistema controlado se demuestra en esta graca? a) b) c) d) Realimentaci on. Robustez. Estabilidad. Desempe no.
Speed [m/s]
Actuate Throttle
Sense Speed
30
m
25
Compute
10
Time [s]
(1.9) Sistema de control por realimentaci on para controlar la rapidez del veh culo.
2. Demostrar que el sistema masa-resorte mq + kq = u posee la representaci on espacio de estados descrita abajo cuando se consideran las variables adimensionales x = q/l y = ot , d x 0 1 = 1 0 d dx/d 0 x + v, 1 dx/d
2 = k/m. Cu donde l es la amplitud de oscilaci on de q y o al es el valor de v? 3. Usando las respuestas en el tiempo de la Fig. (1.10b), explicar qu e es lo f sicamente est a sucediendo con el veh culo. Fundamente con ecuaciones, diagramas de cuerpo libre, etc.
Velocity v [m/s]
20 19 0 1
Fg
10 Time t [s]
20
30
mg
Throttle u
0 0
10 Time t [s]
20
30
(1.10a) En t = 5s el veh culo con control crucero encuentra una pendiente. (1.10b) Respuesta en lazo cerrado.
4. La representaci on en lazo cerrado del sistema de control de vuelo de una mosca se puede dividir en varios bloques: la din amica del cuerpo y aerodin amica del cuerpo como la planta, a la aerodin amica del ala como el actuador, al giroscopio neuromec anico como el saturador, al sistema de visi on como el sensor y el sistema sensoriomotor como el controlador. Ubicar estos componentes del sistema de control en el diagrama de bloques de la Fig. (1.11). Problema 1.9: Modelado 1. Calcular la ecuaci on de movimiento de la bola de poliestireno a lo largo del eje x de la regi on de entrampamiento. Usar la 2da Ley de Newton. ametro, la masa resultante ser a m 5.5 1010 mg, la misma 2. Si se trabaja con una bola de poliestireno de 1 m de di que se puede considerar despreciable. Para el caso de masa despreciable, representar la ecuaci on de movimiento de la bola en la forma espacio de estados. Asumir que se puede medir el desplazamiento x de la bola m as un ruido n. 3. Determinar el (los) punto(s) de equilibrio para cuando la posici on central del l aser es u . Ser a que todos los puntos de equilibrio calculados son puntos v alidos?
164
(1.11) Visi on como mecanismo compensatorio para atenuaci on de disturbios tipo viento vw .
pticas es un instrumento cient Un microscopio de pinzas o co capaz de manipular part culas diel ectricas (dimensiones en nm o m) mediante la aplicaci on de fuerzas (en el orden de pN) via un rayo l aser focalizado. Este microscopio es muy usado en el estudio de sistemas biol ogicos, ver Fig.1 donde se realiza un estiramiento de la mol ecula de ADN para determinar sus propiedades f sicas; los extremos de la mol ecula de ADN est an pegados a unas bolas de poliestireno. La Fig.(1.12) muestra el punto m as estrecho del haz de l aser, el cual posee un gradiente de campo el ectrico muy fuerte que atrae a las part culas diel ectricas, form andose una especie de trampa. Cuando la bola es movida del centro de la trampa debido a una fuerza externa, el haz de l aser es deectado; esta deexi on se mide con un fotodiodo detector de posici on. El objetivo de control consiste en reducir las variaciones en la posici on de la bola debido a la acci on de fuerzas externas. Fig.(1.12) Diagrama esquem atico de un experimento La bola de poliestireno posee masa m y su desplazamiento en la direcci on +x es de estiramiento de una mol ecula de ADN. debido a las siguientes fuerzas: ptico (fuerza restauradora), donde u es la posiFo : fuerza de entrampamiento o ci on central del l aser focalizado y viene a ser la entrada de control, y 1 , 3 > 0. 1 3 (x u)3 1 (x u), para |x u| < R = Fo = 3 , 0, otro caso Fd : fuerza de arrastre viscoso. Fd = x , > 0. Ft : fuerza t ermica. Fe : otras fuerzas externas que dependen de las condiciones del experimento.
4. Escribir la representaci on lineal del sistema en torno a un punto de equilibrio apropiadamente elegido. 5. Es el sistema estable, controlable, observable?
165
11.2.
Considere el circuito simple R, L, C de la Fig.(2.1) con L y C siendo elementos lineales y R siendo un resistor no lineal (no cumple la ley de Ohm VC = iR R, en su lugar iR = f (vC )). La gura a la derecha muestra la caracter stica del resistor.
2. Encontrar el(los) punto(s) de equilibrio del sistema Los puntos de equilibrio se encuentran al igual a cero las derivadas con respecto al tiempo en la representaci on espacio de estados. Entonces: 1 v Ce d iLe 0 L = = 1 1 3 1 . 0 dt vCe vCe + vCe + iLe C C C Las ecuaciones que se deben resolver para calcular los puntos de equilibrio son: vCe = 0 y 1 3 1 1 vCe + vCe + iLe = 0 C C C
1. Elegir como estados a la corriente en el inductor iL y el voltaje del capacitor vC y calcular la representaci on espacio de estados del sistema. Siendo los estados iL y vC , la representaci on espacio de estado del sistema es: 1 vC d iL L = 1 1 . 1 3 dt vC vC + vC + iL C C C
Luego el punto de equilibrio es: (iLe , vCe ) = (0, 0). 3. Seleccionar un punto de equilibrio y calcular la representaci on lineal del sistema en torno al punto de equilibrio seleccionado. La din amica linealizada del sistema en torno al punto de equilibrio antes calculado: 1 v C d iL f1 (iL , vC ) L = 1 1 3 1 = f2 (iL , vC ) . dt vC vC + vC + iL C C C f1 f1 L d iL i iL vC = f2 f2 v C C dt v iL vC iL = iLe vC = vCe 1 L L i i 0 L =1 1 . 1 2 v C v C + 3 vC iL = iLe C C C vC = vCe
166
1 0 L i i = 1 L1 L . v C v C C C 4. Qu e puede decir sobre la estabilidad del sistema en torno al punto de equilibrio seleccionado? La estabilidad del sistema lineal se calcula resolviendo para los autovalores del sistema: 1 1 1 C 0 (A) = 1 L1 = 1+4 2C 2C L C C
Como 1 + 4 C L > 1, entonces existe un autovalor de A con parte real negativa, esto signica que el punto de equilibrio (0,0) es inestable. Problema 2.2: Aeronave PVTOL
Considere una aeronave de despegue y aterrizaje vertical (PVTOL), como mostrado en la ngulo de alabeo , y Fig.(2.2). Los estados son las posiciones y, z del centro de masa, el a . Las entradas de control, ut y um , son el empuje las velocidades correspondientes, y , z , aplicado en el centro de masa y el momento de alabeo en torno al centro de masa de la aeronave, respectivamente. Adicionalmente, > 0 es un coeciente peque no relacionado al acoplamiento entre el momento de alabeo y la aceleraci on lateral de la aeronave. Finalmente, g denota la fuerza gravitacional. En el modelo de la aeronave PVTOL, desprecie el efecto de exi on en las alas o fuselaje y considere a la aeronave como un cuerpo r gido.
1. Calcular las ecuaciones de movimiento del PVTOL. Masa de la aeronave, m, y momento de inercia con respecto al centro de masa de la aeronave y a lo largo del fuselaje es J . Las ecuaciones de movimiento para un prototipo PVTOL son: my = sin ut cos um mz = cos ut sin um + mg = um J z um y , Ut = 2. Escribir las ecuaciones de movimiento usando las siguientes variable normalizadas: Y = , Z = , Um = g g J ut J , = . mg mg Usando las variables normalizadas se obtiene: = sin Ut cos Um Y = cos Ut sin Um + 1 Z = Um Luego, el sistema en su representaci on espacio de estados es: Y Y Z Z d = dt Y sin Ut cos Um cos Ut sin Um + 1 Z Um
167
Y Z Ut donde Y es el vector de estados y Um es el vector de entradas de control. Z 3. Determinar el/los punto/s de operaci on del PTVOL. Cu al es la implicancia del punto de operaci on? Para calcular los puntos de equilibrio igualamos a cero las derivadas, asi: e Y Y Z e Z d e =0= . Y U sin U cos dt me e te e cos eUte sin e Ume + 1 Z Ume Lo que resulta en: e = 0 Y Ze = 0 e = 0 Ume = 0 Ume = 0 sin eUte cos e Ume = 0 sin eUte = 0 cos eUte sin e Ume + 1 = 0 cos eUte = 1
nica opci Si elegimos Ute = 0 de cos eUte = 1 0 = 1? (inconsistente!). Luego la u on es que cos e = 1, lo cual se cumple para e = k , k Z. 4. Elija un punto de operaci on para la linealizaci on del sistema. Represente el sistema linealizado en su forma espacio de estados. e , Ute , Ume ) = (Ye , Ze , 0, 0, 0, 0, 0, 1). e , Z e , Elegimos el punto de operaci on (Ye , Ze , e , Y Identicamos apropiadamente a las funciones que usaremos para las derivadas: ) ,Z , f1 (Y , Z , , Y Y Y Z f2 (Y , Z , , Y ) ,Z , Z f3 (Y , Z , , Y ) ,Z , d = = dt Y sin Ut cos Um f4 (Y , Z , , Y , Z , ) cos Ut sin Um + 1 f5 (Y , Z , , Y Z ) ,Z , ) ,Z , Um f6 (Y , Z , , Y Derivando apropiadamente para formar las matrices A y B: f1 f1 f1 f1 f1 f1 Y Z Y Z f f f f f f 2 2 2 2 2 2 Y Y Z Y Z Z f3 f3 f3 f3 f3 f3 Z d Y Z Y = f f f f f f 4 4 4 4 4 dt Y 4 Y Z Z Y Z Y = Ye f5 f5 f5 f5 f5 f5 Y Z Y Z = Ze Z f 6 f 6 f 6 f 6 f 6 f 6 = e =Y e Y Z Y Z Y e Z=Z e = Ut = Ute Um = Ume
f1 Ut f2 Y Z Ut f3 U Y + ft 4 U Z t f5 Ut f
f1 Um f2 Um f3 Um f4 Um f5 Um 6 f6 Ut Um
168
Luego:
Y Z d Y = dt Z
0 0 0 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 0 Y = Ye Z = Ze 0 = e 0 =Y e Y =Z e Z e = Ut = Ute Um = Ume
Y Z Y + Z
t U m U
y:
Y 0 Z 0 0 d = dt Y 0 0 Z 0
0 0 0 0 0 0 0 0 0 0 0
1 0 0 0 0 0
Y 00 0 0 Z 1 0 0 0 0 1 0 0 Ut + Y 0 0 0 Um 0 0 Z 1 0 00 0 1
LINEARIZATION EXAMPLE
Para el sistema masa-resorte no lineal-amortiguador no lineal mostrado en la Fig.(2.3) se pide: 1. Calcular el punto de equilibrio del sistema para fe = 16. 2. Escribir la representaci on lineal del sistema con respecto al punto de equilibrio antes calculado.
La ecuaci on de movimiento del sistema es: Mx + B(x 3 + x ) + K |x|x = 16 + cos t La correspondiente representaci on espacio de estados es: d x = dt x x K 16 1 B 3 +x ) |x|x + + cos t (x M M M M
Representaci on lineal del sistema en relaci on a una excitaci on promedio f(t ) = 16: 4 16 En el punto de equilibrio se cumple: ue = 16, |xe |xe = xe = K K d x = dt x Luego: 0 1 B 2K 2 + 1) |x| (3x M M x + x
pto equilibrio
0 1 M
cos t
0 1 0 d x x 8 K + = 1 B x dt x M M M
cos t
169
Para el sistema mostrado en la Fig.(2.4) se pide: 1. Calcular el punto de equilibrio del sistema para Ve = 2. 2. Escribir la representaci on lineal del sistema con respecto al punto de equilibrio antes calculado.
Fg
donde F representa la fuerza generada por el motor y Fd representa la fricci on al rodamiento, el arrastre aerodin amico y la fuerza gravitacional, ver Fig.(5). El torque T (n v) = T ( ) = Tm (1 ( 1)2 ), donde Tm es el torque m aximo obtenido m ametros tipicos son Tm = 190Nm, m = a la velocidad angular del motor m . Par 420rad/s (para 4000 rpm) y = 0,4. Otros valores t picos: 4 = 12, = 1,3 kg/m3 , Cr = 0,01, Cd = 0,32, A = 2,4m2 , m = 1000kg.
mg
(2.5) Veh culo sobre una pendiente, modelo para control crucero
1. Existe un punto de equilibrio (ve , ue , e ) donde la fuerza aplicada por el motor balancea las fuerzas de disturbio. Calcular la entrada ue para un viaje en cuarta con ve = 25m/s, e = 0. Rpta: ue = 0,1687. dv . = 0,0101v + 1,32u 9,8 a resulta: 2. Para el punto (ve , ue , e ), vericar que el modelo lineal est dt 3. Denir la salida v para el sistema lineal antes calculado. 4. Si se cierra el lazo de control con u = 0,5v 0,1z, donde z =v . Mostrar el diagrama de bloques del sistema (como representar a esta ley de control en Matlab/Simulink). 5. Escribir la representaci on espacio de estados del sistema controlado, con estados v y z. Incluir la ecuaci on de salida. Problema 2.6: Linealizaci on e =cte. Responder seg e ), un corresponda: Se cumple 0 = Cm (0, 0, 1. Presentar el diagrama de bloques del sistema autopiloto destacando los elementos b asicos del sistema de control. Incluir todas las variables dadas. A continuaci on el diagrama de bloques del sistema. 2. Escribir la ecuaci on de movimiento rotacional (cabeceo) de la aeronave en su forma espacio de estados. Incluir la ecuaci on de salida. Escribiendo la din amica rotacional del sistema: =M J 1 J = 2 Cm V 2 Sc 1 , e ) V 2 S c J = 2 Cm ( , Representaci on espacio de estados: d dt 1 , e ) V 2 S c Cm ( , 2J y = f ( ) =
170
La Fig. (2.6) muestra el lazo de control del cabeceo (pitch) de un sistema autopiloto. El sistema de control recibe una se nal y del giroscopio. La se nal on de la aeronave a partir de la y es una funci on f ( ), donde es la desviaci condici on predenida del cabeceo. La presencia de una se nal y produce una rotaci on e en el elevador (actuador) de la aeronave. La rotaci on del elevador produce una tasa de variaci on en el cabeceo de la aeronave igual a e, la misma que es retornada como mostrado en la gura. Sea J el momento de inercia de la aeronave respecto al eje de rotaci on que 2 el momento neto del cabeceo, con C = pasa por O y sea M = 1 m 2 Cm V Sc , e ) el coeciente de momento del cabeceo, V la velocidad de la Cm ( , aeronave, S la supercie del ala, c la longitud de la cuerda aerodin amica y ngulo de ataque. el a
3. Calcular la representaci on lineal del movimiento rotacional de la aeronave. Qu e punto de equilibrio emple o para la linealizaci on?. C alculo de los ptos de equilibrio: 0 = 1 , e ) V 2 S c 0 Cm ( , 2J e . e ) = 0. Luego un punto de equilibrio es xe = 0 , ue = Se sabe que Cm (0, 0, 0 La representaci on lineal del sistema para el punto de equilibrio elegido es: 0 0 1 d = o Cm (0, 0, e ) o Cm (0, 0, e ) + o Cm (0, 0, e ) e dt e f (0) y = 0 donde o = 1 V 2 Sc . 2J
171
11.3.
Problema 3.1: An alisis sistemas lineales Responder seg un corresponda: dx 1 01 u x+ = 0 , con ley de control: u = Kx + kr r. 00 1. Sea el sistema: dt y= 10 x Demostrar que los polos del sistema en lazo cerrado no pueden ser asignados arbitrariamente. 2. Considerar el sistema mostrado en la Fig. (3.1).
La din amica de cada uno de los subsistemas se puede escribir como: dx = Ax + Bu1 , dt y1 = Cx dz = Az + Bu2 . dt y2 = Cz
Demostrar que el sistema formado por los dos subsistemas id enticos, con entrada 128 T u = u1 u2 y salida igual a y = y1 + y2 , no es observable.
Position feedback
M aquinas tipo torno son controladas autom aticamente (ver Fig.(3.2)). Considerando un eje, la posici on deseada de la cuchilla se compara con la posici on actual y sta informaci e on es usada para activar una bobina, la cual controla la presi on dentro del actuador hidr aulico. El sistema actuador-cuchilla est a descrito por: 1 X (s) = . Gxy (s) = Y (s) s(0,5s + 1) El voltaje de salida del amplicador es: Eo (s) = AE (s) = A[Rd (s) X (s)]
rd
i R
Cutting tool
Work piece y
Fluid supply
fuerza en el eje actuador es proporcional a la corriente i(t ) tal que F = K2 i(t ) donde K2 = 2,0. La fuerza es balanceada contra el resorte, F = Ky(t ), donde K = 1,2 es la constante del resorte, y R = 10 y L = 0,5 H. Sea A = 6,95. (b) 1. 2. 3. 4.
Eo(s) I(s) F(s) Y(s) X(s) 1 Rd(s) + K2 G(s) A K Rposici + sL on deseada y la posici donde rd (t ) es la posici on deseada de la cuchilla y e( t ) es el error entre la on medida. La Tool position
Gracar el diagrama de bloques del sistema de control de posici on de cuchilla. Fig. P4.7 (a) Tool position control, (b) Block diagram Expresar la funci on de transferencia actuador-cuchilla en su forma can onica modal. Calcular la matriz de transici on eAt = L 1 {(sI A)1 } para la representaci on espacio de estados antes calculada. Para el sistema en lazo cerrado (entrada rd (t ), salida x(t )), determinar la correspondiente forma can onica controlable.
172
Un velero de masa m se encuentra inicialmente en reposo, v(0) = 0. En el tiempo t = 0, se presenta un fuerte viento de magnitud Vo = 10 m/s. Asumir que la fuerza del viento sobre las velas es en la direcci on del viaje y est a dado por Fw (t ) = bw [Vo v(t )]. Asumir que el arrastre viscoso del agua sobre el velero est a dado por Fd (t ) = bd v(t ).
1. Escribir la ecuaci on de movimiento del velero en la forma de espacio de estados. Usar como variable de estado a la velocidad v(t ). Asumir que se puede medir v(t ). 2. Para las condiciones dadas en el enunciado del problema, calcular la velocidad del velero en estado estacionario. Es la velocidad del velero menor que 10 m/s? x = Ax + Bu, x(0) = xo 0 t = 0, Ayuda. Sea el sistema: , si u(t ) = , la salida del sistema est a dada por: y = Cx + Du u = cte t > 0, y(t ) = CeAt x(0) + CA1 eAt Bu + D CA1 Bu . 3. Si el objetivo es mover el velero a una velocidad vr (t ), qu e modicaci on debemos realizar a la ecuaci on de movimiento? Mostrar que con control integral es posible seguir una velocidad de referencia vr (t ) =cte. Problema 3.4: Preguntas variadas 1. Cu al es la principal ventaja de un dise no de control por realimentaci on de estados en relaci on a un dise no de control proporcional o proporcional derivativo (PD) usado en control cl asico? 2. Dena cada t ermino en las expresiones dadas abajo. x = Ax + Bu, x(0) = xo Sea el sistema: , la soluci on y la salida estan dadas por: y = Cx + Du x(t ) = eAt x(0) +
0 ? t 0 t
eA(t ) Bu( )d
?
CeA(t ) B u( )d
?
x = Ax + Bu, x(0) = xo . y = Cx + Du
Explique que representa la funci on de transferencia. x = Ax + Bu, x(0) = xo 4. Pruebe que, para el sistema , los autovalores de la matriz A son los polos del sistema. y = Cx + Du 5. Pruebe que, para una realizaci on espacio de estados de orden n en la forma can onica modal, la matriz de controlabilidad es de la forma: . . . .. . . . . . . . 0 0 1 ... Wc = 0 1 an1 ... 1 an1 a2 n1 an2 . . .
173
donde a1 , a2 , . . . son los coecientes del polinomio caracter stico sn + an1 sn1 + an2 sn2 + . . . . Asuma que el sistema solo tiene una entrada. 6. Existe alguna limitaci on pr actica en los valores seleccionados para las ganancias K del control por realimentaci on de estados u = Kx? En otras palabras, analice que pasa con la se nal de control u si se eligen polos en lazo cerrado muy alejados del eje imaginario.
174
11.4.
Problema 4.1: Controlabilidad y observabilidad, formas can onicas Responda lo que se pide: 1. Para el sistema dado en el diagrama de simulaci on de la Fig. (4.1), encontrar las condiciones necesarias y sucientes para los valores de , , k1 y k2 tal que el sistema sea tanto controlable como observable.
2. Para el sistema descrito por la funci on de transferencia abajo: s2 2 Y (s) = U (s) s(s2 1) escribir la representaci on espacio de estados tanto en la forma can onica controlable como en la forma can onica modal. Sugerencia: Comience calculando la forma can onica controlable. Problema 4.2: Soluci on ecuaci on espacio de estados Un sistema en lazo cerrado para controlar la concentraci on qu mica se muestra en la Fig. (4.2). La alimentaci on es granular y de composici on variable. Se desea mantener una composici on constante de la mezcla a la salida mediante ajuste de la v alvula de ujo. La funci on de transferencia del tanque y la v alvula de salida est a dada por: G(s) = y el controlador es representado por: k2 s El transporte de la alimentaci on a lo largo de la faja transportadora introducir a un retraso de 2 segundos, que para efectos de este problema sera ignorado. Considerar k1 = 0,1 y k2 = 0,02. Calcular lo que se pide: Gs (s) = k1 + 4 4s + 1
175
1. En qu e punto del diagrama de bloques (Fig. 4.2a) se debe incluir el retraso? 2. Cerrar el lazo de control y expresar la funci on de transferencia en lazo cerrado en su forma can onica modal. Es el sistema estable? 3. Obtener la expresi on para la salida y(t ) asumiendo que la entrada (set point) es un escal on de magnitud unitaria y que el vector de estados inicial es qo = [0,5, 0, 0]T . 4. Expresar la funci on de transferencia en lazo cerrado en su forma can onica observable.
176
11.5.
Problema 5.1: Control por realimentaci on de estados La representaci on espacio de estados normalizada que describe la desviaci on lateral de un veh culo (manejado en el eje x) est a dada por:
01 = 00 z= 10
y + 1 y
x on lateral y orientaci on del centro donde y y son la posici ngulo de la (5.1) Control de la direcci de masa del veh culo, respectivamente, y es el a on de un veh culo. Derecha: modelo simplicado llanta delantera. Sea = a/b = 0,5. de una bicicleta.
1. Es el sistema inestable, asint oticamente estable o marginalmente estable? 2. Si se desea dise nar un controlador por realimentaci on de estados para estabilizar la din amica y seguir una referencia dada r de la posici on lateral del veh culo, calcular las ganancias de la ley de control u = Kx + kr r para un tiempo de asentamiento de la respuesta igual a 4 s. Considere una raz on de amortiguamiento = 0,707 para los polos en lazo cerrado. Ayuda: Tiempo de asentamiento ts 4/ o . 3. (2 ptos) Para la ley de control antes usada, calcular la salida controlada z(t ) a una entrada r(t ) del tipo escal on en para la entrada de control (t ). Bosquejar la posici on lateral y unitario con y(0) = 0 y (0) = 0. Resolver tambi ngulo de la llanta delantera . y el a 4. Cu al es el valor inicial de la se nal de actuaci on? Habr a alg un problema con la actuaci on? Qu e recomienda para solucionar el problema? 5. Dise ne el observador de estados con una selecci on de polos apropiada. Se nale que polos eligi o. 6. Calcule la funci on de transferencia del sistema en lazo cerrado. Por qu e no aparece la informaci on del observador? Problema 5.2: Preguntas variadas 1. Calcule la matriz de funciones de transferencia del diagrama de bloques de la Fig. (5.2), en otras palabras G(s) en la siguiente expresi on: u y1 = G(s) 1 u2 y2
De la gura se tiene:
177
1 1,5 u1 + u2 (s 1)(s + 1) (s 1)(s + 2) 1,5 1 u1 + u2 y2 = (s + 3)(s + 1) (s + 3)(s + 2) y1 = Agrupando t erminos: y1 y2 1 1,5 )(s + 1) (s 1)(s + 2) u1 = (s 1 1,5 1 u2 (s + 3)(s + 1) (s + 3)(s + 2)
C omo seria llevar G(s) a su forma espacio de estados? Idea: Ver el problema a continuaci on. 2. Un sistema compuesto por dos subsistemas conectados en cascada es mostrado en la Fig. (5.3). Sean las variables de estado del sistema x1 = y1 u1 y x2 = y2 . Asumir que la entrada al sistema es u = u1 y que la salida es y = y2 . Obtener el modelo de espacio de estados del sistema interconectado. Cu ando es el sistema no controlable? Encontrar la funci on de transferencia del sistema no controlable. Sugerencia: Usar transformada de Laplace inversa en cada uno de los bloques.
u1 u
sa sb
y1
u2
1 sc
y2 y
Del diagrama de bloques se tienen las siguientes funciones de transferencia: y1 = y2 = Usando transformada de Laplace inversa: y 1 + by1 = u 1 + au1 y 2 + cy2 = y1 Reescribiendo las ecuaciones para x1 = y1 u1 y x2 = y2 : y 1 u = by1 + au1 y 2 = y1 cy2 x 1 = b(x1 + u1 ) + au1 x 2 = x1 + u1 cx2 En la forma espacio de estados el sistema interconectado queda como: x 1 x 2 b 0 ab x1 + u 1 c x2 1 x1 y= 01 x2 = s+a u1 s+b
1 1 u2 = y1 s+c s+c
178
Usar la formula de Ackerman para para dise nar un control por realimentaci on de estados u = Kx + kr r tal que los polos en lazo cerrado se ubiquen en s = {2, 2}. (Encontrar K y kr ) Usando la f ormula de Ackerman: K = q1 c (A) ltima la de la inversa de la matriz de controlabilidad y c (s) es la ecuaci donde q1 es la u on caracter stica del sistema en lazo cerrado. La matriz de controlabilidad es: 1 2 Wc = 0 1 Wc1 = luego: q1 = 0 1 La ecuaci on caracter stica: Entonces: K= 01 2 1 1 0 12 01
c (s) = (s + 2)(s + 2) = s2 + 4s + 4
2
+4
2 1 10 +4 1 0 01
La ganancia de alimentaci on directa o preltro Kr : kr = 1/(C(A BK )1 B) revisar! 4. Considere la planta del problema anterior, calcular los ceros de transmision del sistema: x = 1 2 1 u x+ 0 1 0 y = 0 1 x+u
Los ceros de transmisi on del sistema se calculan resolviendo para s en la siguiente ecuaci on: det sI + A B C D =0
Algunas deniciones: Sistema de fase m nima: ceros de la funci on de transferencia a la izquierda del semiplano complejo abierto. Problema 5.3: Controlabilidad 1. Es el sistema completamente controlable? Fundamente su respuesta sin calcular la matriz de controlabilidad. 2. Para qu e valores de a se garantiza la estabilidad asint otica del sistema? Para qu e valores de a y b es el sistema estabilizable? 3. Para que valor de a el sistema no es completamente observable? Problema 5.4: Control por realimentaci on de estados, entradas constantes Responda lo que se pide:
s 2 1 1 det 1 s 0 = 0 0 1 1
179
1. Describir dos formas en que la entrada de referencia puede ser introducida en un sistema de control por realimentaci on de estados de tal forma que la respuesta tenga error cero en estado estacionario para cambios del tipo escal on en la se nal de referencia. Fundamente su respuesta. Nota: No incluir control integral en esta parte. Una ley de control ser a la presentada en clase u = Kx + kr r, la otra queda a su criterio! 2. Describir como control integral puede ser introducido en un sistema de control por realimentaci on de estados de tal forma que se tenga la respuesta en estado estacionario con error cero tanto para se nales de referencia como disturbios en la planta del tipo escal on. Problema 5.5: Control por realimentaci on de estados - unidad de cinta) Las ecuaciones de movimiento de un mecanismo de unidad de cinta mostrado en la Fig. (6.4) est an dadas por: 0 2 0 0 0 0 0,1 0,35 0,1 0,1 0,75 0 0 0 2 0 x = 0 x+ 0 u 0,4 0,4 0,4 1,4 0 0 0 0,03 0 0 1 1 y = 0,5 0 0,5 0 0 x donde los elementos del vector de estados x son x1 (posici on de la cinta en el cabrestante), 1 (velocidad de la rueda de conducci on), x2 (posici on de la cinta en el codicador), 2 (velocidad de salida), y i (corriente en el motor del cabrestante). La entrada de control u es el voltaje aplicado e, y la salida y es la posici on del cabezal de lectura/escritura x3 . Se ha decidido implementar un controlador por realimentaci on de estados, con una ley de control de la forma u = Kx + kr r, donde K es la ganancia de control y kr es una ganancia de alimentaci on directa. La respuesta deseada a una referencia del tipo escal on debe tener un sobreimpulso peque no y un tiempo se establecimiento de 1 segundo. Esto puede ser alcanzado usando una ecuaci on caracter stica de la forma:
2 2 2 c ( ) = ( 2 + 2 o1 + o 1 )( + 2 o2 + o2 )( + o1 )
con = 0,8, o1 = 6 y o2 = 8. Se pide: 1. 2. 3. 4. 5. 6. Calcular la funci on de transferencia de u hasta y. Determinar la estabilidad del sistema. Antes de calcular el controlador, vericar la controlabilidad del sistema. Determinar la ganancia de control K del sistema. Muestre los detalles de c alculo. Determinar el valor de la ganancia kr Incluir control integral en el dise no del controlador, cu ales ser an las ganancias de control (K , ki ) y de alimentaci on directa (kr )?
Problema 5.6: Microscopio de fuerza at omica (AFM, por sus siglas en ingl es) El AFM es una de las principales herramientas en generaci on de im agenes, medidas y manipulaci on de materia en la anica (viga nanoescala. La informaci on es colectada palpando la supercie de la muestra (sample) con una sonda mec voladiza con punta c onica). La muestra se puede mover vertical y horizontalmente usando un elemento piezoel ectrico.
180
Cuando la muestra se acerca a la punta de la viga, fuerzas de interacci on entre la muestra y la punta conllevan a una deexi on de la viga voladiza. La deexi on es medida usando un rayo laser reejado desde la parte superior de la viga voladiza que va hacia un arreglo de fotodiodos. La deexi on de la viga es controlada por realimentaci on usando un actuador piezol ectrico que controla la posici on vertical de la muestra. Un diagrama esquem atico del AFM se muestra en la gura (a) abajo. Una representaci on esquem atica del movimiento vertical del piezoel ectrico se presenta en la gura (b) abajo. El modelo muestra dos masas separadas por un piezoel ectrico ideal. La masa m1 es la mitad del sistema piezoel ectrico, y la masa m2 es la otra mitad del sistema piezoel ectrico m as la masa del apoyo. Este modelo asume que el piezoel ectrico genera una fuerza F entre las masas y que existe cierto amortiguamiento viscoso c2 junto al resorte de rigidez k2 . Sean las posiciones de los centros de masa z1 y z2 . Considere el modelo de la din amica vertical del AFM. La din amica b asica est a dada por la ecuaci on: (m1 + m2 ) dz1 dl d2l d 2 z1 + c2 + k2 z1 = m2 2 + c2 + k2 l , 2 dt dt dt dt
donde l = z1 z2 es la elongaci on del elemento piezoel ectrico. El piezoel ectrico puede ser modelado como un sistema de segunda orden con una frecuencia natural 3 y raz on de amortiguamiento 3 . La din amica acoplada es luego descrita por el sistema lineal: 0 0 1 0 0 0 dx k / ( m + m ) c / ( m + m ) 1 / m 0 2 1 2 2 1 2 2 x+ u = 0 3 0 0 0 dt 2 0 0 3 23 3 3 m2 m1 k2 m1 c2 y= 10 x m2 + m1 m1 + m2 m1 +m2 donde la se nal de entrada u es la se nal que llega del amplicador y la salida y es la elongaci on del piezoel ectrico. Los par ametros del sistema: m1 = 0,15 103 kg, m2 = 1 103 kg, k2 = 6,832 107 N/m, 3 = 7,5398 105 rad/s, 3 = 0,1.
181
Photo diode Sample Sweep generator x,y Amplifier Deflection reference Piezo drive Controller z
Laser Cantilever
m1
Piezo crystal m2
Amplifier
z1
z2
(5.6b) Modelo mec anicomodel del AFM con (b) Mechanical piezoel ectrico pre-cargado (F )
1. 2. 3. 4.
Es el sistema estable? Calcular la matriz de controlabilidad del sistema y determinar su rango. Es el sistema controlable? Explique qu e se pretende conseguir usando control. Encontrar el controlador por realimentaci on de estados que provee un sistema en lazo cerrado con polos complejos que tengan raz on de amortiguamiento igual a 0.707. C omo seleccionar a la frecuencia natural del sistema en lazo cerrado? Recuerde que el polinomio caracter stico para un sistema en lazo cerrado de cuarta orden est a dado por:
2 2 2 c ( ) = ( 2 + 2o1 o1 + o 1 )( + 2o2 o2 + o2 )
Detalle sus c alculos. 5. Ser a necesario aumentar un control proalimentaci on kr ?, por qu e? En caso de ser necesario, obtenga kr . 6. Matlab-Simulink Usar el archivo-m afm_data.m para generar las matrices del sistema. a) Crear un archivo en Simulink usando la din amica lineal del AFM. Aumentar al modelo el Simulink el controlador dise nado en los puntos anteriores. b) En Simulink, calcule la respuesta del sistema a condiciones iniciales xo = 1 109 , 0, 0, 0 . c) En Matlab, calcule la respuesta a las condicione iniciales antes detalladas. d) En una gr aca, superponga los resultados obtenidos en Simulink y en Matlab. Compare. Problema 5.7: Modelo de robot m ovil monociclo La mayoria de robots m oviles de interior no se mueven como un carro, los robots poseen dos ruedas direccionales controladas activamente y una rueda giratoria, ver Fig. 1a. En relaci on a la Fig. 1b, que presenta un modelo del robot monociclo, las entradas de control son las velocidades longitudinal y angular del robot. Para caracterizar compleon tamente el estado del robot se necesitan tres variables de estado: x, y y . El punto (x, y) denota un punto de localizaci de la plataforma (en este caso, punto medio del eje trasero), mientras que denota la orientaci on del robot. 1. Representar el movimiento (cinem atica) de la plataforma m ovil como un conjunto de ecuaciones diferenciales (forma espacio de estados). Suponer que las ruedas del robot ruedan sin deslizar. 2. Si nuestro objetivo es analizar el movimiento del m ovil a lo largo de una linea recta ( = o ) con velocidad lineal ja o = 0, es posible encontrar alg un punto de equilibrio para estas condiciones? 3. Suponiendo que nuestro objetivo sea minimizar la desviaci on lateral del m ovil que se mueve a lo largo o paralelo al T eje x (o = 0) con velocidad lineal ja o = 0, considerar las ecuaciones de movimiento para z = y y calcular la din amica lineal aproximada. 4. Considerando la din amica linealizada del caso anterior, es el sistema controlable? Problema 5.8: Control por realimentaci on de estados - control integral El transporte en alta mar usa gr uas para descargar contenedores entre barcos cargueros. La Fig. (5.8)-derecha muestra la din amica de la gr ua en el plano vertical, este plano presenta el alabeo (movimiento dominante en un barco anclado en alta mar). El modelo p endulo en carrito, Fig.3-izquierda, permite caracterizar el efecto del alabeo en la carga. La Fig. 3b muestra el detalle del modelo p endulo en carrito. El p endulo representa la carga, la posici on x(t ) es la posici on-x del carrito y representa el movimiento de alabeo del barco, el control de posici on u(t ) reacciona al cambio de la posici on-x ngulo de balanceo. La aproximaci on lineal del sistema en del carrito y es aplicado en la punta de la pluma, (t ) es el a su forma espacio de estados es:
182
d dt
0 1 0,280 0
0 0 x + + 0,0286 u 0,0286
1. Es el sistema estable? Es el sistema controlable? 2. Dise nar el controlador por realimentaci on de estados tal que las oscilaciones del p endulo sean neutralizadas. Para esto usar una ley de control de la forma: u(t ) = x(t ) + u(t ). Esta ley se puede seleccionar debido a que se cuenta con la informaci on de los aceler ometros x . Luego es posible centrarse s olo en el c alculo de u , que puede tomarse como:
u (t ) = K
y que permitir a incrementar el amortiguamiento del sistema a = 0,707 (n = | (A)|). Presentar el diagrama de bloques del sistema en lazo cerrado correspondiente a usar las leyes de control antes descritas. 3. Suponiendo que no se pudiese cancelar el efecto de la aceleraci on inducida por el mar (que es la que causa el alabeo), qu e ley de control elegir a para resolver el problema cuando x = ao =cte? Fundamente por qu e la ley de control elegida cumplir a el objetivo de neutralizar las oscilaciones. Use diagrama de bloques para indicar que modicaciones se le haria a la planta y/o controlador del caso anterior. Problema 5.9: Control por ubicaci on de polos 1. Escribir la ecuaci on espacio de estados del sistema carro cohete. Usar las variables de estado x1 = y (posici on) y x2 = y (velocidad). Es el sistema controlable y observable? Por qu e? 2. Cuando los polos del sistema controlado son seleccionados como 2 2 j, encontrar el control por realimentaci on de estados u(t ) = kx(t ) que asigna dichos polos al sistema controlado. 3. Cuando el polo deseado del observador de orden reducido es elegido como 2, calcular el observador de orden reducido que asigna este polo deseado al error de estimaci on x 2 = x2 x 2 . Considerar que x 2 es el estimado de x2 . 4. Combinando el controlador y observador de orden reducido antes calculados, encontrar el correspondiente compensador C(s).
183
El sistema carro cohete puede ser representado por la siguiente funci on de transferencia: 1 G(s) = 2 , s con Y (s) = G(s)U (s). (5.9) Carro cohete.
11.6.
de observadores Problema 6.1: Diseno Para el siguiente modelo de un sistema din amico, responder lo que se pide: x = 01 1 x+ u, 20 0 y = 1 0 x + 2u.
1. Dise nar un estimador de estados de orden completo tal que los polos del estimador est en localizados en -3 y -4. Escribir la representaci on espacio de estados de la din amica del estimador. Denotar el vector de estados estimado por x . 2. En el diagrama de bloques presentado en la Fig.(6.1), encontrar las funciones de transferencia Gxu y Gxy .
184
Considere un mototaxi de tres ruedas, ver Fig. (6.2) (dos ruedas delanteras y una rueda posterior). La trayectoria deseada durante el manejo se debe mantener con un autopiloto (compensador). La informaci on del modelo del veh culo con control del eje frontal est a dada en la Tabla 1.
vas + v2 y(s) = u(s) Ls2 Angulo de la rueda delantera u Entrada Salida medida Trayectoria de la desviaci on lateral y Salida controlada Trayectoria de la desviaci on lateral y Par ametros constantes conocidos Velocidad del veh culo v > 0 Cantidades geom etricas a > 0, b > 0 y L > 0 Modelo Pyu (s) = Cuadro 11.1 Detalles de la descripci on del sistema
Sea va/L = 0,5 y v2 /L = 1. 1. Presente la planta en su forma can onica controlable. El modelo de la planta en su forma can onica controlable es: x (t ) = 0 01 u(t ) x(t ) + 1 00 y = 1 0,5 x(t )
2. Calcular la ganancia K de la ley de control de estabilizaci on u(t ) = Kx(t ), para un tiempo de asentamiento de la respuesta igual a 4 s. Considere una raz on de amortiguamiento = 0,707 para los polos en lazo cerrado. Ayuda: Tiempo de asentamiento ts 4/ o . Para el c alculo de u elegimos los polos del sistema en lazo cerrado con = 0,707 y = 2:
c (s) = s2 + 2 s + 2 = s2 + 2s + 2
Usando la f ormula de Ackerman: K = q1 c (A) = 0 1 W c1 c (A) = 1 0 K= 22 3. Usando los polos en lazo cerrado del caso anterior, ser a posible calcular la ganancia KP de la ley de control u(t ) = KP y(t )? Si, no, por qu e? 4. Calcular el observador de orden completo que estime los estados del sistema. Escribir dicho observador en la forma espacio de estados. Considerar que los polos de la din amica del error de estimaci on est an ubicados en {2, 2}. La din amica del estimador est a dada por: x = (A LC)x + Bu + Ly. Sea la ganancia del estimador de estados L = cumplir: l1 . Siendo que los polos del estimador son 2 y 2, se debe l2 01 00
2
+2
01 10 +2 00 01
185
2 0 2 0 y. u+ x + x = 4 1 4 2
5. Presentar el compensador (controlador del item b. + observador del item d.) en su forma funci on de transferencia Kuy (s) y completar en el diagrama de bloques presentado abajo para Pyu (s) y Pzu(s) .
La din amica del compensador est a dada por: x = (A LC BK )x + Ly u = K x . Reemplazando los valores obtenidos se tiene: 2 0 2 x = x + y 6 4 4 . u= 22 x Luego: Kuy (s) = 12s + 8 s2 + 6s + 8 y Pyu (s) = Pzu (s).
Problema 6.3: Control por ubicaci on de polos 1. El modelo para movimiento rotacional yaw de un buque de carga est a dado por: = r, r = r3 + r c + u, ngulo yaw, r es la tasa de cambio de , u es la entrada de control; , son constantes conocidas donde es el a positivas y diferentes de cero y c 0. El buque se est a moviendo en linea recta ( , r) = (o , 0) cuando el controlador deja de funcionar, u = 0, seguir a el buque desplazando en l nea recta? 2. Si la din amica linealizada del movimiento yaw est a dada por: =r r r = u + rb , r b = 0
186
donde rb es un bias de sensado constante. Si y r son medidos, calcular el observador de orden reducido que permita estimar el bias rb desconocido. Usar = = 1 y ubicar el polo del estimador en s = 5. Escribir el representaci on espacio de estados del estimador de orden reducido para implementaci on. 3. Para la din amica linealizada del caso anterior, calcular el controlador para control de cabeceo para cuando se asume sensado perfecto (no hay bias rb ). Ubicar los polos del sistema controlado con n = 4 rad/s y = 0,65. Presentar el diagrama de bloques indicando el controlador y el observador de orden reducido (incluir el detalle de entradas, salidas y din amicas). de observadores Problema 6.4: Diseno Si consideramos que un brazo rob otico de una uni on puede ser modelado como un p endulo invertido, el modelo no lineal para un brazo rob otico espec co posee la siguiente representaci on espacio de estados: x 1 (t ) x2 = 0,5x2 10 sen x1 + 0,1u x 2 (t ) y(t ) = x1 (t ) donde y(t ) es la posici on angular del brazo rob otico, u(t ) es el torque de control, x1 = y y x2 = y . Como parte de un trabajo de tesis Juan debe dise nar un controlador para el brazo rob otico. Juan calcula que el punto l obtiene el siguiente modelo lineal: de equilibrio del sistema es xe = (0, 0) para ue = 0. Acto seguido, e x (t ) = 0 1 0 x (t ) + u (t ) 10 0,5 0,1 y (t ) = 1 0 x (t )
donde y (t ) = y ye , x = x xe y u (t ) = u ue . 1. Cometi o Juan alg un error en el c alculo del sistema linealizado? 2. Juan desea dise nar un controlador por realimentaci on de estados tal que el sistema en lazo cerrado tenga los polos en -2. Para poder implementar el controlador calculado, Juan debe antes dise nar un observador para el sistema lineal ngulo y puede ser medido. Dise puesto que s olo el a nar dicho observador tal que el error de observaci on tienda a cero lo sucientemente r apido. de compensadores Problema 6.5: Diseno La din amica describiendo la desviaci on lateral de un veh culo (manejando en el eje x) es a dada por:
01 = 00 y = 10
y + 1 y
x donde y y son la posici on vertical normalizada y orientaci on del centro de masa del veh culo. Adem as = a/b = 0,5. (6.4) Control de la direcci on de un veh culo. Modelo simplicado de una Responder lo que se pide: bicicleta
1. Si se desea dise nar un controlador para estabilizar la din amica y seguir una referencia dada r de la posici on lateral del veh culo. Calcular las ganancias de la ley de control u = Kx + kr r para un tiempo de asentamiento igual a 6 s (normalizados) y raz on de amortiguamiento = 0,707 para los polos en lazo cerrado. Ayuda Tiempo de asentamiento ts 4/ o . 2. Para la ley de control antes usada, cu al es el valor inicial de la se nal de actuaci on? Habr a alg un problema con la actuaci on? 3. Dise ne el observador de estados con una selecci on de polos apropiada. Se nale que polos eligi o. 4. Calcule la funci on de transferencia del sistema en lazo cerrado. Por qu e no aparece la informaci on del observador?
187
11.7.
Problema 7.1: Preguntas varias Para obtener todo el puntaje, muestre todos sus c alculos. 1. Considerar el sistema a continuaci on: x 1 = x2 , x 2 = p(t )x2 et x1 x R2 , to = 0.
Se pide encontrar las condiciones que la funci on p() debe cumplir para asegurar la estabilidad del equilibrio (0,0). 2 + et x2 como funci Usar V (x, t ) = x1 o n de Lyapunov tentativa. 2 2. Sea el sistema din amico modelado por: x = 2x + u, 1 2 (qx + u2 )dt . 2 0 Encontrar el valor de q tal que el sistema en lazo cerrado tiene un polo en -3. on de la ecuaci on de Riccati P, P = PT > 0 (eig(P) > 0). Ayuda: Recuerde que la soluci J= Lyapunov Problema 7.2: Estabilidad segun y el ndice de desempe no:
La siguiente ecuaci on describe el movimiento de la posici on surge u(t ) de un buque de carga: (m Xu Xu|u| u|u| = . )u 1. Si el objetivo de control es que u(t ) ud (t ), donde ud (t ) representa la trayectoria deseada, calcular la din amica del error de seguimiento de trayectoria e(t ), siendo que e(t ) = u(t ) ud (t ). 1 2. Usando la funci on de Lyapunov V (e) = e2 , probar que la ley de control: 2
1. Determinar los puntos de equilibrio del sistema. 2. Linealizar el sistema con respecto al punto (0,0). Investigar la estabilidad de (0,0) usando el sistema linealizado, considerar los casos > 0 y < 0. 3. Analizar la estabilidad del punto (0,0) en el sentido de Lyapunov. Considerar > 0. Contestar lo que se pide: Problema 7.4: An alisis de estabilidad e ndices de desempeno 1. (1 pto) El sistema: x 1 = x1 (2 x2 ) 2 x x 2 = 2x1 2
188
tiene tres puntos de equilibrio en (0,0), (1,2), (-1,2). Analizar la estabilidad de cada uno de estos puntos usando la gura abajo.
2. Considere el siguiente sistema: x 1 = x2 3x1 3 2x x 2 = x2 1 Probar que el punto de equilibrio (0,0) es asint oticamente estable. Es el sistema globalmente o localmente asint oticamente estable? 2 + x2 . Ayuda: Use la siguiente funci on de Lyapunov candidata, V (x) = 2x1 2 3. Problema del m nimo esfuerzo de control. Sea el sistema x = Ax + Bu, determinar el ndice de desempe no que corresponde al problema de transferir un sistema de un estado inicial arbitrario x(to ) = xo hacia un estado nal x(t f ) = x f S con el m nimo esfuerzo de control. 4. Problema del tiempo m nimo. Sea el sistema x = Ax + Bu, determinar el ndice de desempe no que corresponde al problema de transferir un sistema de un estado inicial arbitrario x(to ) = xo hacia un estado nal x(t f ) = x f S en un tiempo m nimo. Problema 7.5: Responda verdadero/falso Demuestre la veracidad o falsedad de los siguientes enunciados. Para obtener todo el puntaje, muestre todos sus c alculos. 1. Las Figs. (7.3a) y (7.3b) representan estados de equilibrio asint oticamente estables. ( )
x(t)
0 t
2 + 2x2 (1 + et ), t = 0, x R2 , es denida positiva. 2. La funci on V (x, t ) = x1 o 2 3. Para el sistema a continuaci on, el estado de equilibrio xe es estable,
( (
) )
x 1 = x2 , x 2 = x1
x R2 , xe = 0, to = 0. ( )
Nota: Use V (x) = x 2 como funci on de Lyapunov tentativa para probar la estabilidad. ptimo: 4. El siguiente problema de control o
189
m n u
uT udt
tal que x = Ax + Bu x(to ) = xo , x(t f ) = x f , consiste en determinar una ley de control admisible u que, en el menor tiempo posible, lleve la trajectoria del sistema desde el estado inicial x(to ) = xo a un estado nal x f especicado. Problema 7.5: Preguntas varias Para obtener todo el puntaje, muestre todos sus c alculos. 1. Las guras abajo representan los diagramas de plano de fase de dos sistemas, se nalar cu antos y cu ales son los puntos de equilibrio. Qu e puede decir de la estabilidad de dichos puntos de equilibrio?
to
1.5 1
2 1
0.5 x
2
x2 0
0.5 1 1.5 1 0 x 1
1 2 2
0 x1
2. El sistema a continuaci on representa un p endulo invertido con longitud variable: x 1 = x2 , x 2 = x2 (2 + sen t )x1 x R2 , to = 0.
2 x2 como funci on de Lyapunov 2 + sen t
1. Representar el movimiento rotacional (din amica/cinem atica) del sat elite en la forma espacio de estados. Considerar que el lazo de control ha sido cerrado con:
= + do bo ,
R, > 0.
2. Calcular el (los) puntos de equilibrio del sistema en lazo cerrado. 3. Demostrar que la ley de control antes descrita alinea bo con do . Usar la funci on de Lyapunov candidata: 1 1 V ( , do ) = T I + (do + bo )T (do + bo ). 2 2 tiles: F ormulas u a b = aT b, a (b c) = b (c a) = c (a b)
190
Un sat elite B (cuerpo r gido) con un sistema de referencia solidario al cuerpo - origen en el centro de masa y alineado con respecto a los principales ejes de inercia - es mostrado en la Fig. 1. Sea bo R3 un vector unitario representando la direcci on de una antena en el sat elite y do R3 un vector unitario jo (sistema de referencia inercial) representando la direcci on de la antena en la estaci on terrena. La ecuaci on del movimiento de Euler resulta en: + I = , I elite con respecto a los ejes solidarios al donde R3 es el vector velocidad angular del sat cuerpo, I = diag(I1 , I2 , I3 ) y es el torque de control. En el sistema de referencia solidario al cuerpo, do no est a jo, est a rotando con velocidad angular , entonces: o = do . d (7.6) Sat elite y estaci on terrena
11.8.
ptimo con valor nal y tiempo nal jos Problema 8.1: Control o
El voltaje de entrada u(t ) que carga al capacitor en la Fig. 2, partiendo de x(0) = 2V en t = 0 hasta x(10) = 12V en t = 10, debe ser calculado para una energ a disipada por el resistor m nima. No hay restricciones en la ley de control u(t ). Notar que, de la ley de voltajes de Kirchhoff:
i(t)
R 100 k
u(t)
C 10 F
x(t)
Ri2 (t )dt .
1. Denir la funci on Hamiltoniano y correspondientes ecuaciones de estado y coestado, condici on estacionaria y condiciones de frontera. ptimo. 2. Resolver las ecuaciones anteriores y calcular el voltaje de entrada u(t ) o 3. Calcular el valor m mimo de J . Problema 8.2: LQR con horizonte innito Dada la matriz Hamiltoniana correspondiente a un sistema din amico y su ndice de desempe no asociado. La matriz Hamiltoniana es: 2 5 H= 1 2 La funci on del Matlab [V,D]=eig(H) result o en lo siguiente: V= Se pide: 1. Escribir la ecuaci on del sistema en lazo cerrado gobernado por la ley de control u = kx. ptimo. 2. Encontrar la soluci on de la ecuaci on de Riccati correspondiente al controlador o Problema 8.3: Balanceando una bola sobre una viga La Fig. (8.2) muestra una bola que rueda a lo largo de una v a acondicionada en la viga. La bola debe ser llevada al 0,9806 0,7071 , 0,1961 0,7071 D= 3 0 0 3
191
ngulo de la viga a trav punto medio de la viga (el origen) mediante manipulaci on del a es de un motor el ectrico. La distancia entre la posici on de la bola y el origen se denota como y y satisface la siguiente ecuaci on diferencial: y = b sin( ) b , donde b es una constante que depende de varios par ametros del sistema. Se asume que el valor normalizado de b ptimo, se necesita tener una aproximaci es 1. Para poder usar control o on de la din amica. As , se dene la siguiente realizaci on espacio de estados del sistema: z = Az + Bu y = 1 0 z. El prop osito del problema de optimizaci on es llevar la bola al origen sin requerir demasiada energia. Un criterio natural de desempe no es el siguiente problema cuadr atico:
m n u
tal que z = Az + Bu, z(0) = [ 0,5 1 ]T donde q y r son par ametros positivos.
y
(8.2) La bola rodando en la v a de la viga y podr a caer en cualquiera de los puntos extremos
siendo p12 = p21 y P > 0 (denida positiva). Escribir la ecuaci on de Riccati como un sistema de cuatro ecuaciones expl citas en t erminos de los elementos de P y de las constantes q y r. Resolver para los elementos de P. ptimo asumiendo que todos los estados son conocidos por la reali2. Encontrar las ganancias del controlador o mentaci on. Asumir que r = 1 y q = 5. 3. Encontrar la frecuencia natural y la raz on de amortiguamiento del sistema en lazo cerrado. on 4. Siendo que la viga tiene longitud nita, se hace necesario introducir restricciones en el problema de optimizaci para asegurar que la bola no se caiga de la viga. Adicionalmente, a menudo debemos dise nar el controlador asumiendo que existen limitaciones en la magnitud de la se nal de control. En base a lo expuesto, c omo se formular a el ptimo resultante? problema de control o Problema 8.4: LQR con horizonte nito Calcular la ley de control por realimentaci on de estados u tal que minimice J=
1 2 int0 (x + u2 )dt
sujeto a
x = x + u, x(0) = 2
Asumir J = p(t )x2 (t ). on deben ser completados anal ticamente. Ayuda: Los puntos a continuaci En general, la ecuaci on Hamilton-Jacobi-Bellman est a dada por:
192
0=
ptimo se puede determinar aplicando Dado que no hay restricciones en la se nal de control u, la forma del control o las condiciones (necesaria de primer orden y suciente de segundo orden) de optimizaci on a la funci on H . Aqu se debe obtener u en funci on de p(t ) y otras variables. El resultado del punto anterior debe ser reemplazado en la ecuaci on HJB del primer punto. La ecuaci on resultante vendr a a ser la ecuaci on de Riccati diferencial. Cu al es la condici on inicial de esta ecuaci on? Redena la ecuaci on diferencial de Riccati en funci on de su matriz Hamiltoniana (misma matriz que en el caso de ptimo con horizonte innito). No se olvide de detallar las condiciones iniciales. control o Problema 8.5: LQR con horizonte innito Dada la matriz Hamiltoniana correspondiente a un sistema din amico y su ndice de desempe no asociado. Sea la matriz Hamiltoniana: 2 5 H= 1 2 La funci on del Matlab [V,D]=eig(H) result o en lo siguiente: V= Se pide: 1. Escribir la ecuaci on del sistema en lazo cerrado gobernado por la ley de control u = kx. ptimo. 2. Encontrar la soluci on de la ecuaci on de Riccati correspondiente al controlador o Problema 8.6: Control de posici on motor DC Un sistema de control de posici on de un motor DC para el control de una v alvula electr onica es descrito por la ecuaci on diferencial: 0 1 0 = + V ., a 0 0,9806 0,7071 , 0,1961 0,7071 D= 3 0 0 3
J J + minu(t )R L(x, u) + t x
H
f (x, u)
donde es la posici on angular, es la velocidad angular, es el coeciente de amortiguamiento viscoso, es el constante de velocidad del motor DC y Va es el voltaje de actuaci on. Considerar el problema de regular el motor en torno a su estado cero donde la variable controlada es la posici on, es decir: y= 1 0 , ptimo que minimice el 1. Encontrar el control por realimentaci on de estados o ndice de desempe no:
t
J = l m
t 0
Usar los valores num ericos = 7,14 rad/s, = 238,3 rad/(Vs2 ) y =1. 2. Cu al es el tiempo de subida de la respuesta del sistema en lazo cerrado? C omo se podr a disminuir el tiempo de subida? 2,230 2 0,078 + 1,12 Nota: ts = o Problema 8.7: Control LQR Considere la representaci on espacio de estados de una planta de primer orden inestable: x (t ) = ax(t ) au(t ), y el nuevo ndice de desempe no: a R, a > 0,
193
J=
0
, b R, > 0, b 0.
nica modicaci 1. Demostrar que, con un cambio de variables ebt x(t ) x (t ) y ebt u(t ) u (t ), la u on requerida para calcular el control LQR con el nuevo ndice de desempe no es usar A + bI en la ecuaci on de Riccati algebraica en vez de A. 2. Para el sistema con variable de estado x (t ) y se nal de control u (t ), determinar la ganancia K del control LQR en funci on de , a, b. 3. Para el sistema con variable de estado x y se nal de control u, mostrar la posici on de los polos en lazo cerrado en el plano complejo con 0 < < . 4. Usar el resultado anterior para explicar cu al es el efecto de b en el dise no del control.
194
11.9.
Problema 9.1: Filtro de Kalman Considere un cohete en el espacio, el cual se puede modelar como un integrador doble que se mueve en una direcci on. La aceleraci on es debido al ruido de proceso. Con las variables de estado x1 = z y x2 = z , la representaci on espacio de estados del sistema es: 01 0 x = x+ w 00 1 , x R2 . y = 1 0 x+v Por el momento, asumir que la posici on z es medida con alg un error v. Considerar que w y v son procesos de ruido blanco con media cero y densidades espectrales (covarianzas) como sigue: V = 1. W = 4, 1. Determinar el ltro de Kalman. Escribir el observador en su forma espacio de estados. 2. Suponer que un segundo sensor es usado, tal que la velocidad z tambi en es medida. La ecuaci on de salida es luego cambiada a: y = x + v, donde ahora v es un vector de dimensi on dos (ruido blanco de media cero) con matriz de covarianza: V= 1 0 . 0 2
Demuestre que la matriz de covarianza del error de estimaci on (soluci on de la ecuaci on de Riccati) es: 1 3 2 P = E{x T (t )x (t )} = . 3 3 2 2 Cu al es la ganancia del ltro de Kalman? Problema 9.2: Control LQG Considere el sistema inestable de segundo orden: x 1 = x2 , x 2 = x2 + u + w con medidas cont nuas: y = x1 + x2 + v, donde w y v son procesos de ruido blanco con densidades espectrales (covarianzas) W y V , respectivamente. 1. (2 ptos) Sea el ndice de desempe no: J=
0 2 2 (x1 + x2 + Ru2 )dt .
Encontrar los polos del sistema controlado. Gracar en el plano complejo como var an los polos en funci on de R. 2. Mostrar que para R = 1 y W = V = 1, las ganancias del control LQR y del ltro de Kalman resultan en: K= 1 3 , L= 1 , 2
siendo que los polos del sistema controlado est an ambos en s = 1. 3. Encontrar la funci on de transferencia del compensador LQG resultante G(s). 4. Para la din amica del compensador G(s), bosquejar en el plano complejo como var an los polos del sistema controlado al ir variando la ganancia de la planta (tal que Py (s) Py (s), para = 1). 5. Para el controlador LQR, u = Kx, bosquejar en el plano complejo como var an los polos del sistema controlado al ir variando la ganancia de la planta (tal que Px (s) Px (s), para = 1). Asumir en este caso que se conocen todos los estados.
195
x = x + u + w , y = x+v
0
donde w y v son procesos de ruido blanco con varianzas w y v , respectivamente, y el ndice de desempe no es: J = E{ 1 2 (qx2 + u2 )dt },
1. Calcular el control LQR correspondiente. Notar que la ganancia de control K ser a funci on de q. Presentar la din amica del sistema controlado. 2. Si w /v = 1, calcular la ganancia del ltro de Kalman. Presentar el ltro de Kalman en su forma de espacio de estados. 3. Encontrar el rango de q que permita que el estimador posea una din amica r apida en comparaci on a la din amica del sistema controlado. Problema 9.4: Preguntas variadas Responda seg un corresponda. 1. Una forma com un del ndice de desempe no cuadr atico es: 1 1 J = eT f Qf ef + 2 2
tf to
donde y(t ) = Cx(t ) + Du(t ). Mostrar que J puede ser reescrito como: 1 1 Qf ef + J = eT 2 f 2
tf to
donde: Q = CT QyC, N = CT Qy D, R = Ry + DT Qy D. ptimo: 2. Considere el siguiente sistema para el c alculo del observador o x = 1 2 4 u + w, x+ 3 1 3 y = 1 3 x+v
donde W =
a) Escribir la ecuaci on de Riccati correspondiente. b) Resolver la ecuaci on de Ricati algebraica. c) Escribir la representaci on espacio de estados del Filtro de Kalman (FK). Problema 9.5: Control LQG Considere el problema LQG con la siguiente din amica: x = 1 0 11 w, u+ x+ 1 1 01 y = 1 0 x+v
donde x = x1 x2 es el vector de estados, u es la entrada de control, y es la salida medida y w y v son los ruidos blancos Gausianos independientes con intensidades 0 y 1 respectivamente. El ndice de desempe no asociado est a dado por: J=E 1 T T l m
T 0
( (x1 + x2 )2 + u2 )dt
196
Obtener lo que se pide: ptimo (LQR) asumiendo que todos los estados son conocidos por la reali1. Encontrar la ganancia del controlador o mentaci on. ptimo (FK). 2. Encontrar la ganancia del observador o ptimo (LQR+FK) usando una representaci 3. Describir el compensador o on espacio de estados. 4. Describir el sistema con control LQG usando una representaci on espacio de estados. 5. Completar en el diagrama de bloques de la gura abajo usando las correspondientes funciones de transferencia.
w plant
v y
u s
Problema 9.6: Filtro de Kalman Un ingeniero intenta usar la teor a del ltro de Kalman como una metodolog a para ltrar se nales de medida ruidosas. til, v(t ) el ruido de medida y z(t ) las Considere el diagrama de bloques mostrado en la gura donde y(t ) es la se nal u medidas ruidosas. El ltro a ser dise nado es denotado por L(s), cuya salida y (t ) debe ser un buen estimado de la entrada til y(t ). u
Se desea que L(s) sea un ltro pasa-baja con las siguientes caracter sticas: L(0) = 1 L(s) decayendo como 1/s para grandes valores de s El ingeniero comienza modelando la se nal y(t ) como una se nal ltrada por el sistema de primer orden G(s): G(s) = b , s+a
la se nal ltrada es el ruido blanco w(t ) con covarianza W . El ruido de medida v(t ) tambi en se asume como ruido blanco, y con covarianza V . La forma espacio de estados resulta: x = ax + w z = (b/ )x + v para valores del par ametro = 0 . 1. Considerando el observador de la forma: ] , x + l [z (b/ )x = ax derivar la funci on de transferencia correspondiente al ltro.
197
2. Derivar el ltro de Kalman Cu al es la inuencia del par ametro en el ltro L(s)? 3. Qu e restricciones se necesitan en los par ametros del modelo G(s) para hacer que se satisfagan las propiedades del ltro L(s) antes especicadas? 4. Asumiendo que el modelo de la se nal y(t ) es tomado como un sistema de segundo orden: G(s) = Se puede satisfacer la restricci on L(0) = 1? Problema 9.7: Control LQG Considere el problema del LQG con la siguiente din amica: x = u+w y = x+v donde x es la variable de estado, u es la entrada de control, y es la salida medida y w y v son ruidos blancos Gaussianos independientes con covarianzas 2 r y r respectivamente. El control LQG usa el siguiente ndice de desempe no: J = E{ l m 1 T T
T 0
b , s(s + a)
(a > 0, b > 0)
( 2 x2 + u2 )dt },
ametros reales no negativos. donde E{} es el valor esperado y , son par ptimo (LQR + ltro de Kalman) est 1. Demuestre que el compensador o a dado por: u = k(s)y, donde: k (s) =
s+ +
2. Determine la representaci on espacio de estados del sistema en lazo cerrado, con w y v como entradas, y las variables de estados x y x . Demuestre paso a paso sus c alculos Cu ales son los autovalores del sistema en lazo cerrado? 3. En el diagrama de bloques mostrado, qu e valores podr a alcanzar el escalar sin desestabilizar el sistema en lazo cerrado?
Ap endice A
Las ecuaciones de Lagrange son una de las t ecnicas m as comunes para derivar las ecuaciones de movimiento se sistemas con m ultiples grados de libertad (GDL). d L L = Qi , dt q i qi i = 1, 2, ..n.
Siendo L = T V , con T siendo la energ a cin etica y V la energ a potencial, qi son las coordenadas generalizadas y Qi son las fuerzas generalizada. Ciertas restricciones se aplican a la elecci on de estas cantidades generalizadas: Las coordenadas generalizadas deben ser linealmente independientes. Las fuerzas generalizadas Qi deben realizar el mismo trabajo que las fuerzas no conservativas considerando un desplazamiento virtual qi , as :
W = Qi qi .
i= 1
199
200
1 1 V = k1 z2 + k2 (z2 z1 )2 . 2 1 2 Y el Lagrangiano ser a: 1 1 1 2 1 2 L = m1 z 2 2 1 + m2 z 2 k1 z1 k2 (z2 z1 ) 2 2 2 2 Luego, realizando las correspondientes sustituciones en las ecuaciones de Lagrange: d L ( ) dt z 1 L z1 L d L ( ) dt z 1 z1 m1 z 1 + (k1 + k2 )z1 k2 z2 = d (m1 z1 ) = m1 z 1 dt
d L ( ) dt z 2 L z2 L d L ( ) dt z 2 z2 m1 z 2 k2 z1 + k2 z2 En forma matricial: m1 0 0 m2 z 1 z 2 +
m2 z 2
= k2 (z2 z1 ) = k2 z1 + k2 z2 = F2 = F2 z1 z2 = F1 F2
k1 + k2 k2 k2 k2
A.1.
Problema
El deslizador (1) de masa m1 se puede mover horizontalmente y est a en contacto con dos resortes (3) de rigidez k. La esfera (2) de masa m2 y radio r forma un cuerpo r gido con la masa despreciable (4). Todo el movimiento est a en el 2. plano vertical. El momento de la esfera con respecto a un eje que pasa por su centro de gravedad es I = 2 m r 2 5
En el instante t = 0, el sistema es posicionado tal que: Hallar las ecuaciones diferenciales de movimiento.
A.2.
Soluci on
a cin etica T ser a: El sistema tiene dos grados de libertad, por tanto dos coordenadas generalizadas x y . La energ
A.2 Soluci on
201
1 1 1 2 T = T1 + T2 = m1 x 2 + m2 v2 G + I 2 2 2 La velocidad y la posici on absoluta del centro de masa de la esfera ser an: {rG } = (x + R sen )i + (R cos )j sen )j cos )i + (R {vG } = {r G } = (x + R El cuadrado de la velocidad ser a: cos )2 + (R sen )2 = x cos + R2 2 v2 + R 2 + 2xR G = (x La energ a cin etica total ser a: 1 1 1 2 cos + R2 2) + I T = m1 x 2 + m2 (x 2 + 2xR 2 2 2 1 1 2 2 cos + 2 (m2 R + I ) 2 = 2 (m1 + m2 )x + m2 xR La energ a potencial total ser a debido a la energ a almacenada en los resortes y a la energ a gravitacional: 1 V = 2 kx2 m2 gR cos 2 Luego el Lagrangiano resulta: 1 1 cos + (m2 R2 + I ) 2 kx2 + m2 gR cos L = (m1 + m2 )x 2 + m2 xR 2 2 Aplicando las ecuaciones de Lagrange: d L L ( ) =0 dt x x L d L ) =0 ( dt
donde:
L = 2kx x
202
Figura A.4 Sistema tiene deslizador-p endulo con GDL El sistema 2 grados de dos libertad,
L sen m2 gR sen = m2 Rx
Usando las ecuaciones de Lagrange: cos m2 R 2 sen + 2kx = 0 (m1 + m2 )x + m2 R 2 + m2 Rx (m2 R + I ) cos + m2 gR sen = 0
Ap endice B
Optimizaci on
B.1.
Un ndice de desempe no escalar L(u) esta dado en funci on de un vector de control u Rm . Queremos obtener el valor de u que resulte en el m nimo valor de L(u). ptimizaci Para resolver el problema de o on, escribimos la expansi on en serie de Taylor de un incremento en L, as : 1 T dL = Lu du + duT Luu du + O(3), 2 donde O(3) representa los terminos de orden tres. El gradiente de L con respecto a u es el vector columna: Lu = y la matriz Hessiana es: Luu = (B.1)
L , u 2L , u2
(B.2)
(B.3)
y Luu es denominada la matriz curvatura. Un punto estacionario o cr tico ocurre cuando un incremento dL es cero en su primera orden para todos los incrementos du. Luego: Lu = 0, (B.4) para un punto cr tico. Suponiendo que estamos en el punto cr tico, tal que Lu = 0 en (B.1), para que el punto cr tico sea un m nimo local, se requiere que: 1 dL = duT Luu du + O(3), (B.5) 2 sea positivo para todos los incrementos du. Esto se garantiza si la matriz de curvatura Luu es denida positiva: Luu > 0. Si Luu es denida negativa, el punto cr tico es un m aximo local. (B.6)
B.1.1.
203
204
B Optimizaci on
Lu = Qu + S. Luego: ptimo. donde u denota el control o El tipo de punto cr tico se obtiene examinando la matriz Hessiana: Luu = Q. El punto u es m nimo si Luu > 0, o q11 > 0, q11 q22 q2 aximo si Luu < 0, o q11 < 0, q11 q22 q2 12 > 0. Es un m 12 < 0. Sustitiuendo u se puede encontrar el valor extremo del ndice de desempe no: 1 1 L = L(u ) = ST Q1 QQ1 S ST Q1 S = ST QS. 2 2 Sea: 1 11 + 0 1 u. L(u) = uT 12 2 u = 2 1 1 1 1 0 , = 1 1 u1 u2
T
u = Q1 S,
Luego:
es un m nimo, dado que Luu > 0. El m nimo valor de L es L = 1 2. Los contornos de L(u) son dibujados en la Fig. A.1, donde u =
Lu = Qu + S =
u1 + u2 u1 + 2u2 + 1
N otese que el gradiente es siempre perpendicular a los contornos y apuntando en la direcci on de incremento de L(u).
205
B.2.
Sea el ndice de desempe no escalar dado por L(x, u), una funci on del vector de control u Rm y del vector de estados n x R . El problema consiste en seleccionar u tal que minimice a L(x, u) y simultaneamente satisfaga la ecuaci on de restricci on: f (x, u) = 0. (B.7) EL vector x es determinado para un u dado de la relaci on (B.7), tal que f es un conjunto de ecuaciones escalares, f Rn . Para encontrar las condiciones necesarias y suciente para un m nimo local que tambien satisfaga f (x, u) = 0, procederemos de forma similar a la secci on anterior.
B.2.1.
En un punto estacionario, dL es igual a cero al primer orden para todos los incrementos du cuando d f es cero. Esto requiere que: T T dL = Lu du + Lx dx = 0, (B.8) y, d f = fu du + fx dx = 0. (B.9) Dado que (B.7) determina x para un u dado, el incremento dx puede ser determinado de (B.9) para un incremento dado du. Luego la matriz Jacobiana fx es no singular y:
1 dx = fx fu du.
(B.10)
(B.11)
L u
d f =0
T T 1 T T = (Lu Lx fx fu )T = Lu fu fx Lx ,
(B.12)
L u
= Lu .
dx=0
(B.13)
Para conseguir dL igual a cero al primer orden para incrementos arbitrarios du cuando d f = 0, se debe tener:
T T Lu fu fx Lx = 0.
(B.14)
Esta es una condici on necesaria para un m nimo. Antes de derivar una condici on suciente, escribir (B.8) y (B.9) como: dL LT LT = x u df fx fu dx du
T
(B.15)
nica Este conjunto de ecuaciones lineales dene un punto estacionario, y debe tener una soluci on dxT duT . LA u forma de que esto pueda ocurrir es si la matriz de coecientes de dimensi on (n + 1) (n + m) tiene rango menor que n + 1. Esto es sus las deben ser linealmente dependientes tal que exista un vector Rn tal que: 1 T Entonces:
T LT Lx u fx fu
=0
(B.16)
206
T Lx + T fx = 0 T Lu
B Optimizaci on
(B.17) (B.18)
+ fu = 0
T
(B.19)
Y sustituyendo (B.19) en (B.18) de nuevo resulta en la condici on (B.14) para puntos estacionarios. Deniendo el Hamiltoniano como: H = L+T f,
(B.20)
donde es denominado multiplicador de Lagrange. En un punto estacionario, dH = dL es igual a cero al primer orden para los incrementos de primer orden de du y d cuando d f es cero. T T dH = Hu du + Hx dx + H d = 0, (B.21)
Incrementos dx no contribuyen a dH :
(B.22)
(B.23)
(B.24)
dado que H = L en esta situaci on. ENtonces, para alcanzar un punto estacionario debemos imponer la siguiente condici on estacionaria: Hu = 0. (B.25) Luego las condiciones necesarias para un punto m nimo de L(x, u) que satisface la restricci on f (x, u) = 0 son:
H = f = 0, H T = 0, = Lx + fx x H T = 0, = Lu + fu u
con H (x, u, ) denida por (B.20). Mediante la introducci on de multiplicadores de Lagrange, ha sido posible reemplazar el problema de minimizar L(x, u) sujeto a la restricci on f (x, u) = 0 con el problema de minimizar el Hamiltoniano H (x, u, ) sin restricciones.
B.2.2.
Suponer que el ndice de desempe no esta dado como en el ejemplo anterior: L(x, u) = Sea la restricci on: f (x, u) = x 3 = 0. El Hamiltoniano es: 1 xu 2 11 12 x + 01 u x . u
207
1 H = L + T f = x2 + xu + u2 + u + (x 3), 2 donde es un escalar. Las condiciones para un punto estacionario son: H = x 3 = 0, Hx = x + u + = 0, Hu = x + 2u + 1 = 0. Resolviendo el sistema de ecuaciones se obtiene: x = 3, u = 2 y = 1. Luego el punto estacionario es: (x, u) = (3, 2). La Fig. B.2 muestra los contornos de L(x, u y la restricci on f (x, u) para este problema.
Ap endice C
C alculo Variacional
til en la soluci C alculo variacional es una rama de la matem atica que es bastante u on de problemas de optimizaci on. Un problema hist orico resuelto usando c alculo variacional es el problema del la curva braquist ocrona. El problema fue propuesto en 1696 por Johann Bernoulli. Bajo la inuencia de la gravedad una bola se desplaza a lo largo de una cuerda (sin fricci on) con extremos jos A y B. El problema consiste en encontrar la forma de la cuerda que haga que la bola se mueva de A hacia B en el menor tiempo posible. La soluci on es un cicloide y se le atribuye a Johann y Jacob ptimo es aparente, encontrar la funci Bernoulli, Newton y LHospital. La conexi on con el problema de control o on de control que minimice la medida de desempe no. ptimo el objetivo es determinar una funci En control o on que minimice un funcional espec co - el ndice de desempe no. Un problema an alogo en c alculo es determinar un punto que lleve a un valor m nimo de una funci on. En esta secci on introduciremos conceptos concernientes a funcionales apelando a resultados conocidos de la teoria de funciones.
C.1.
Conceptos
Notar que f depende de tanto q como q, en general, para ser m as expl citos, f (q, q). = 2 q q , q , q R . El incremento de f es: on: f (q) = q2 Ejemplo Considere la funci 1 2 1 2 1
Funci on: Una funci on es una regla de correspondencia que asigna a cada elemento de un cierto conjunto D un nico elemento en el conjunto R . D es denominado dominio y R es denominado rango. u Funcional Un funcional J es una regla de correspondencia que asigna a cada funci on x en una cierta clase un nico valor real. es denominado dominio del funcional, y el conjunto de n u umeros reales asociados con las funciones en es denominado rango del funcional. Notar que el dominio de un funcional es una clase de funciones; intuitivamente, podriamos decir que un funcional es una funci on de una funci on. on f es denida, luego el incremento Incremento de un funci on Si q y q + q son elementos para los cuales la funci de f , denotado por f , es: f = f (q + q) f (q). (C.1)
De nuevo, se puede enfatizar que J (x, x) depende tanto de x como de x. x es la variaci on de la funci on x. Ejemplo Considere el funcional: J (x ) = x2 (t )dt ,
210
C C alculo Variacional
J = J (x + x ) J (x ) =
tf to
[x + x]2 dt
tf to
x2 (t )dt =
tf to
La variaci on de un funcional La variaci on juega el mismo rol que el diferencial en determinar los valores entremos, en el caso de la variaci on se aplica al caso de un funcional y en el caso del diferencial se aplica al caso de una funci on. POR COMPLETAR...
Fuente: Cap tulo 4 del libro Optimal Control de Donald Kirk, Springer, 1970. Fuente: Cap tulo 3 del libro Optimal Control de Lewis y Syrmos, Wiley, 1995.