Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Índice
1. Introducción 2
2. Modelos matemáticos 3
2.1. Función de transferencia y respuesta al impulso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2. Sistemas de control automáticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2.1. Controladores Industriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3. Modelado en el espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3.1. Funciones de transferencia en el espacio de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3.2. Representación en el espacio de estados: la función de excitación no contiene términos derivados . 7
2.3.3. Representación en el espacio de estados: la función de excitación contiene términos derivados . . . 7
2.4. Linealización de sistemas no lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1
1 INTRODUCCIÓN
7. State feedback 44
7.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
7.1.1. Forma canónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
7.1.2. Asignación de polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
7.1.3. Controlabilidad de la salida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.1.4. Control con acción integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
7.2. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7.2.1. Forma canónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.2.2. Observador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
7.2.3. Principio de dualidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
7.2.4. Asignación de polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.2.5. Control usando estados estimados: Principio de Separación . . . . . . . . . . . . . . . . . . . . . . 51
1. Introducción
Las teorías de control que se utilizan habitualmente son la teoría de control clásica (también denominada teoría de
control convencional), la teoría de control moderno y la teoría de control robusto.
1. Teoría de control clásica: Esta teoría se aplica a sistemas con una única entrada y una única salida. Utiliza ecuacio-
nes diferenciales ordinarias para la descripción de sistemas, las cuales pueden ser resueltas mediante la Transformada
de Laplace para el caso de sistemas lineales.
2. Teoría de control moderna: La teoría de control moderna, basada en el análisis en el dominio del tiempo y la
síntesis a partir de variables de estados, se ha desarrollado para manejar la creciente complejidad de las plantas
modernas y los requisitos cada vez más exigentes sobre precisión, peso y coste en aplicaciones militares, espaciales
e industriales. Permite trabajar con sistemas con múltiples entradas y salidas.
3. Teoría de control robusto: Esta teoría define un rango de posibles errores, de forma que si el error está dentro de
dicho rango, el sistema de control permanezca estable. Esta teoría incorpora tanto la aproximación de respuesta en
frecuencia como la del dominio temporal.
Algunas definiciones son:
Plantas: Una planta puede ser una parte de un equipo, tal vez un conjunto de los elementos de una máquina que
funcionan juntos, y cuyo objetivo es efectuar una operación particular. Generalmente se refiere a cualquier objeto
físico que se va a controlar (como un dispositivo mecánico, un horno de calefacción, un reactor químico o una nave
espacial).
Procesos: Cualquier operación que se va a controlar.
Sistemas: Un sistema es una combinación de componentes que actúan juntos y realizan un objetivo determinado.
Un sistema no está necesariamente limitado a los sistemas físicos.
Perturbaciones: Una perturbación es una señal que tiende a afectar negativamente el valor de la salida de un
sistema. Si la perturbación se genera dentro del sistema se denomina interna, mientras que una perturbación externa
se genera fuera del sistema y es una entrada.
Control realimentado: El control realimentado se refiere a una operación que, en presencia de perturbaciones,
tiende a reducir la diferencia entre la salida de un sistema y alguna entrada de referencia, y lo realiza tomando en
cuenta esta diferencia.
Sistemas lineales: Un sistema se denomina lineal si se aplica el principio de superposición. Este principio establece
que la respuesta producida por la aplicación simultánea de dos funciones de entradas diferentes es la suma de
las dos respuestas individuales. Por tanto, para el sistema lineal, la respuesta a varias entradas se calcula tratando
una entrada cada vez y sumando los resultados. Este principio permite desarrollar soluciones complicadas para la
ecuación diferencial lineal a partir de soluciones simples.
2
2 MODELOS MATEMÁTICOS
Sistemas lineales e invariantes en el tiempo: Una ecuación diferencial es lineal si sus coeficientes son constantes
o son funciones sólo de la variable independiente. Los sistemas dinámicos formados por componentes de parámetros
concentrados lineales invariantes con el tiempo se describen mediante ecuaciones diferenciales lineales invariantes
en el tiempo (de coeficientes constantes). Tales sistemas se denominan sistemas lineales invariantes en el tiempo
(o lineales de coeficientes constantes). Los sistemas que se representan mediante ecuaciones diferenciales cuyos
coeficientes son funciones del tiempo, se denominan sistemas lineales variantes en el tiempo. Un ejemplo de un
sistema de control variante en el tiempo es un sistema de control de naves espaciales (la masa de una nave espacial
cambia debido al consumo de combustible).
2. Modelos matemáticos
La dinámica de muchos sistemas, ya sean mecánicos, eléctricos, térmicos, económicos, biológicos, etc., se describe en
términos de ecuaciones diferenciales. Dichas ecuaciones diferenciales se obtienen a partir de leyes físicas que gobiernan un
sistema determinado (como las leyes de Newton para sistemas mecánicos y las leyes de Kirchoff para sistemas eléctricos).
Se puede ver que tanto x(t) como g(t) son nulas para t < 0.
La respuesta al impulso consiste en la respuesta del sistema cuando en la entrada se aplica un impulso unitario (es
decir, una delta de Dirac), siendo las condiciones iniciales nulas. Por lo tanto, la respuesta al impulso resulta:
3
2 MODELOS MATEMÁTICOS
Las ventajas de la representación mediante diagramas de bloques de un sistema estriban en que es fácil formar el
diagrama de bloques general de todo el sistema con sólo conectar los bloques de los componentes de acuerdo con el flujo
de señales y en que es posible evaluar la contribución de cada componente al desempeño general del sistema.
4
2 MODELOS MATEMÁTICOS
Vector de estado: Si se necesitan n variables de estado para describir completamente el comportamiento de un sistema
dado, entonces esas n variables de estado se pueden considerar como las n componentes de un vector x. Este vector
se denomina vector de estado. Un vector de estado es, por lo tanto, un vector que determina unívocamente el estado
del sistema x(t) en cualquier instante del tiempo t ≥ 0, una vez que se conoce el estado en t = t0 y se especifica la
entrada u(t) para t ≥ t0 .
Espacio de estado: El espacio n-dimensional cuyos ejes de coordenadas están formados por el eje x1 , eje x2 , ..., eje
xn , donde x1 , x2 , . . . , xn son las variables de estado, se denomina espacio de estados. Cualquier estado se puede
representar como un punto en el espacio de estados.
Ecuaciones en el espacio de estados: En el análisis en el espacio de estados se centra la atención en los tres tipos de
variables que aparecen en el modelado de los sistemas dinámicos: las variables de entrada, las variables de salida y
las variables de estado.
Sea un sistema de múltiples entradas-múltiples salidas con n integradores. Supóngase también que hay r entradas
u1 (t), u2 (t), . . . , ur (t) y m salidas y1 (t), y2 (t), . . . , ym (t). Se definen las n salidas de los integradores como variables
de estado: x1 (t), x2 (t), . . . , xn (t). Entonces el sistema se puede describir mediante:
ẋ(t) = f (x, u, t)
y(t) = g (x, u, t)
Si estas ecuaciones se linealizan alrededor del estado de operación, se obtienen las siguientes ecuaciones de estado
linealizadas:
Donde A(t) es la matriz de estado, B(t) es la matriz de entrada, C(t) es la matriz de salida y D(t) es la matriz de
transición directa. En la figura 2.1 se tiene una representación de este sistema.
5
2 MODELOS MATEMÁTICOS
Figura 2.1: Diagrama en bloques de un sistema de control lineal en tiempo continuo representado en
el espacio de estados.
Para los casos en que f y g no involucran el tiempo explícitamente, se está en presencia de un sistema invariante en
el tiempo. Para el caso de un sistema LTI entonces se tiene:
Y (s)
G(s) =
U (s)
Y (s) −1 Q(s)
G(s) = = C (sI − A) B + D =
U (s) |sI − A|
Donde |sI − A| es el polinomio característico de G(s), por lo que se concluye que los autovalores de A son idénticos a
los polos de G(s).
En caso de tener múltiples entradas y salidas, el procedimiento es el mismo, obteniendo:
Y(s) −1
G(s) = = C (sI − A) B + D
U(s)
6
2 MODELOS MATEMÁTICOS
x1 = y
x2 = ẏ
..
.
xn = y (n−1)
ẋ1 = x2
ẋ2 = x3
..
.
ẋn−1 = xn
ẋn = an x1 − . . . − a1 xn + u
Lo cual es equivalente a:
0 1 0 ··· 0
0
x1 0 0 1 ··· 0
0
x = ... , B = .. .. .. ..
ẋ = Ax + Bu , .. , A = . . . .
.
xn 0 0 0 ··· 1
1
−an −an−1 −an−2 ··· −a1
La salida queda:
x1
y = Cx =
1 0 ···
0 ..
.
xn
La función de transferencia resulta:
1
G(s) =
sn + a1 sn−1 + · · · + an−1 s + an
Una forma de obtener una ecuación de estado y una ecuación de salida es definir las siguientes n variables como un
conjunto de n variables de estado:
x1 = y − β0 u
x2 = ẏ − β0 u̇ − β1 u = ẋ1 − β1 u
x3 = ÿ − β0 ü − β1 u̇ − β2 u = ẋ2 − β2 u
..
.
xn = y (n−1) − β0 u(n−1) − β1 u(n−2) − · · · − βn−2 u̇ − βn−1 u = ẋn−1 − βn−1 u
7
2 MODELOS MATEMÁTICOS
Donde
β0 = b 0
β1 = b 1 − a 1 β0
β2 = b 2 − a 1 β1 − a 2 β0
..
.
βn−1 = bn−1 − a1 βn−2 − · · · − an−2 β1 − an−1 β0
βn = bn − a1 βn−1 − · · · − an−2 β1 − an−1 β0
ẋ1 = x2 + β1 u
ẋ2 = x3 + β2 u
..
.
ẋn−1 = xn + βn−1 u
ẋn = −an x1 − an−1 x2 − · · · − a1 xn + βn u
ẋ = Ax + Bu
y = Cx + Du
y =f (x)
df 1 d2 f 2
y =f (x) + (x − x) + (x − x) + . . .
dx x=x 2! dx2 x=x
Si la variación x − x es pequeña, se pueden despreciar los términos de orden superior, y se puede escribir:
(
y = f (x)k
y = y + K (x − x) → df
K= dx
x
8
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
y = f (x1 , x2 )
La técnica de linealización presentada aquí es válida alrededor de la condición de operación. Sin embargo, si las con-
diciones de operación varían ampliamente, tales ecuaciones linealizadas no son adecuadas y deben manejarse ecuaciones
no lineales.
Señales de prueba típicas: Las señales de prueba que se usan regularmente son funciones escalón, rampa, parábola,
impulso, etc. Con estas señales de prueba, es posible realizar con facilidad análisis matemáticos y experimentales de
sistemas de control, ya que las señales son funciones del tiempo muy simples.
La forma de la entrada a la que el sistema estará sujeto con mayor frecuencia en una operación normal determina
cuál de las señales de entrada típicas se debe usar para analizar las características del sistema. El uso de tales señales
de prueba permite comparar el comportamiento de todos los sistemas sobre la misma base.
Respuesta transitoria y respuesta en estado estacionario: La respuesta en el tiempo de un sistema de control consta
de dos partes: la respuesta transitoria y la respuesta en estado estacionario. La respuesta transitoria se refiere a la que
va del estado inicial al estado final. Por respuesta en estado estacionario se entiende la manera como se comporta la
salida del sistema conforme t tiende a infinito. Por tanto, la respuesta del sistema c(t) se puede escribir como:
donde ctr (t) es la respuesta transitoria y css (t) es la respuesta en estado estacionario.
Estabilidad absoluta, estabilidad relativa y error en estado estacionario: Un sistema de control está en equilibrio si,
en ausencia de cualquier perturbación o entrada, la salida permanece en el mismo estado. Un sistema de control
lineal e invariante con el tiempo es estable si la salida termina por regresar a su estado de equilibrio cuando el siste-
ma está sujeto a una condición inicial. Un sistema de control lineal e invariante con el tiempo es críticamente estable
si las oscilaciones de la salida continúan de forma indefinida. Es inestable si la salida diverge sin límite a partir de
su estado de equilibrio cuando el sistema está sujeto a una condición inicial. En realidad, la salida de un sistema
físico puede aumentar hasta un cierto grado, pero puede estar limitada por «detenciones» mecánicas, o el sistema
puede colapsarse o volverse no lineal una vez que la salida excede cierta magnitud, por lo cual ya no se aplican las
ecuaciones diferenciales lineales.
Entre los comportamientos importantes del sistema (aparte de la estabilidad absoluta) que deben recibir una cuida-
dosa consideración están la estabilidad relativa y el error en estado estacionario. Como un sistema de control físico
implica un almacenamiento de energía, la salida del sistema, cuando este está sujeto a una entrada, no sucede a
la entrada de inmediato, sino que muestra una respuesta transitoria antes de alcanzar un estado estacionario. La
respuesta transitoria de un sistema de control práctico, con frecuencia, muestra oscilaciones amortiguadas antes de
alcanzar un estado estacionario. Si la salida de un sistema en estado estacionario no coincide exactamente con la
entrada, se dice que el sistema tiene un error en estado estacionario. Este error indica la precisión del sistema.
9
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Respuesta al escalón
La señal de entrada con condiciones iniciales nulas es:
L 1
r(t) = u(t) ←→ R(s) =
s
La respuesta al escalón es:
1 1 1 1
C(s) = = −
1 + sT s s s + T1
Antitransformando esta respuesta, se tiene:
t
c(t) = 1 − e− T u(t)
Se puede ver como la salida comienza en cero, pero con el paso del tiempo se aproxima al valor unitario. En la figura
3.1 se tiene una representación de esta respuesta.
Obsérvese que, conforme más pequeña es la constante de tiempo T , más rápida es la respuesta del sistema. Otra
característica importante de la curva de respuesta exponencial es que la pendiente de la línea de tangente en t = 0 es 1/T ,
ya que:
dc 1 t 1
= e− T =
dt t=0 T t=0 T
La salida alcanzará el valor final en t = T si mantuviera su velocidad de respuesta inicial. A partir de esta ecuación se
observa que la pendiente de la curva de respuesta c(t) disminuye de forma monótona de 1/T en t = 0 a cero en t → ∞.
L 1
r(t) = t ←→ R(s) =
s2
Por lo tanto, la respuesta queda:
1 1 1 T T2
C(s) = 2
= 2− +
1 + sT s s s 1 + sT
10
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Comparando esta señal con la de entrada, se puede definir la señal de error como:
t
e(t) = r(t) − c(t) = T 1 − e− T u(t)
Se puede ver que a medida que t → ∞, la señal de error se aproxima a la constante T . Por esta razón, cuanto más
pequeña sea esta constante T , menor será el error cometido.
11
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
C(s) K K/A
= 2 = 2 B K
R(s) s A + sB + K s + As + A
Dado que este sistema presenta dos polos, se dice que es un sistema de segundo orden. Esto puede ser reducido también
como:
C(s) K/A
= q q
R(s) B B 2
K B B 2
K
s + 2A + 2A − A s + 2A − 2A − A
Se puede ver que si B 2 − 4AK < 0 los polos del sistema son complejos, mientras que si B 2 − 4AK ≥ 0 son reales. Se
puede aplicar el siguiente cambio de variables:
(
wn2 = K
A
B
A = 2ζw n = 2σ
C(s) wn2
= 2
R(s) s + 2ζwn s + wn2
12
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Se puede ver que la frecuencia de oscilación transitoria es la frecuencia natural amortiguada wd . La señal de error
en este sistema es: !
−ζwn t ζ
e(t) = r(t) − c(t) = e cos (wd t) + p sin (wd t) u(t)
1 − ζ2
Se puede ver que para t → ∞ la señal de error se hace nula. Para ζ = 0 la respuesta se vuelve no amortiguada y las
oscilaciones continúan indefinidamente a la frecuencia wn .
2. Caso críticamente amortiguado (ζ = 1): En este caso, los dos polos del sistema son iguales, por lo que la salida es:
wn2 1
C(s) = 2
(s + wn ) s
Se obtiene entonces:
3. Caso sobreamortiguado (ζ > 1): En este caso los polos de la transferencia son reales negativos y diferentes. La
transformada de la salida en este caso resulta:
w2 1
C(s) = p n p
s + ζwn + wn ζ − 1 s + ζwn − wn ζ − 1 s
2 2
En la figura 3.4 se tiene un gráfico para distintos valores de ζ, mostrando los resultados obtenidos.
13
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Figura 3.4: Curvas de respuesta al escalón para un sistema de segundo orden, utilizando distintos
valores de ζ.
En la Figura 3.4 se observa que un sistema subamortiguado con ζ entre 0,5 y 0,8 se acerca al valor final con mayor
rapidez que un sistema críticamente amortiguado o sobreamortiguado. Entre los sistemas que responden sin oscilación,
un sistema críticamente amortiguado presenta la respuesta más rápida. Un sistema sobreamortiguado siempre es lento
para responder a las entradas.
wn2
C(s) =
s2 + sζwn + wn2
Obsérvese que, sin tomar la transformada inversa de Laplace de C(s), también se obtiene el tiempo de respuesta c(t)
diferenciando la respuesta escalón unitario correspondiente, ya que la función impulso unitario es la derivada con respecto
al tiempo de la función de escalón unitario.
En la figura 3.5 se tienen distintas curvas para la respuesta al impulso con distintos valores de ζ.
14
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Figura 3.5: Curvas de respuesta al impulso de un sistema de segundo orden para distintos valores de ζ.
Para los casos críticamente amortiguado y sobreamortiguado, la respuesta impulso unitario siempre es positiva o cero;
es decir, c(t) ≥ 0. Para el caso subamortiguado, la respuesta impulso unitario c(t) oscila alrededor de cero y toma valores
tanto positivos como negativos.
5. Tiempo de asentamiento ts : Es el tiempo que se requiere para que la curva de respuesta alcance un rango alrededor
del valor final del tamaño especificado por el porcentaje absoluto del valor final (por lo general del 2 % y 5 %). Este
parámetro se relaciona con la mayor constante de tiempo del sistema.
En la figura 3.6se tiene una representación de todos estos parámetros.
15
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Donde β se define en la figura 3.7. Se puede ver en esta expresión que para un pequeño valor de tr , el valor de wd
debe ser grande.
Para el tiempo pico tp , es necesario derivar la respuesta al escalón (del sistema subamortiguado) y se debe suponer que
16
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
1 − ζ2 {z }
| {z } 6=0
6=0
La sobreelongación máxima Mp se da en t = tp = π/wd , por lo tanto, si se asume que c (∞) = 1 se puede calcular:
Mp =c(tp ) − 1
!
−ζwn wπ π ζ π✟✟
Mp = − e d cos wd +p wd✟
sin ✟
wd 1 − ζ 2 ✟✟ wd
−ζwn wπ
Mp =e d
En caso de que c(∞) no sea la unidad, es necesario calcular con la expresión completa.
Como se mencionó anteriormente, la respuesta al escalón de un sistema subamortiguado es de la forma:
p !!
e−ζwn t −1 1 − ζ2
c(t) = 1 − p sin wd t + tan t≥0
1 − ζ2 ζ
Se puede ver que la atenuación de la parte oscilatoria viene dada por el factor 1/ζwn . Se puede ver que para el mismo
wn y para un rango de 0 < ζ ≤ 1 el tiempo que tarda en estabilizarse el sistema es muy grande, es decir que se trata de un
sistema ligeramente amortiguado. El tiempo de asentamiento ts corresponde al tiempo que tarda la respuesta en asentarse
con una tolerancia del 2 % o del 5 %. Siendo T = ζw1 n , se suele tomar como criterio:
(
4 4
ts = 4T = ζwn = σ Criterio del 2 %
3 3
ts = 3T = ζwn = σ Criterio del 5 %
17
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Se verá en esta sección que la respuesta de sistemas de orden superior es la suma de las respuestas de sistemas de
primer orden y segundo orden.
donde p(s), q(s), n(s) y d(s) son polinomios en s que denotan los polos y los ceros de las funciones de transferencia.
Se puede escribir entonces:
C(s) p(s)d(s) b0 sm + b1 sm−1 + · · · + bm−1 s + bm
= = (m ≤ n)
R(s) q(s)d(s) + p(s)n(s) a0 sn + a1 sn−1 + · · · + an−1 s + an
Este cociente de polinomios se puede descomponer como:
C(s) (s + z1 ) (s + z2 ) · · · (s + zm )
=K
R(s) (s + p1 ) (s + p2 ) · · · (s + pn )
Analizando la respuesta al impulso, y considerando el caso en el que todos los polos en lazo cerrado son reales y
distintos, la transformada de la salida resulta:
n
a X ai
C(s) = +
s i=1 s + pi
donde ai es el residuo del polo en s = −pi . Si todos los polos en lazo cerrado se encuentran en el semiplano izquierdo
del plano s, las magnitudes relativas de los residuos determinan la importancia relativa de las componentes en la forma
desarrollada de C(s). Si hay un cero en lazo cerrado cerca de un polo en lazo cerrado, el residuo en este polo es pequeño
y el coeficiente del término de respuesta transitoria que corresponde a este polo se vuelve pequeño. Un par polo-cero
cercanos entre sí se cancelarán efectivamente uno al otro. Si un polo se localiza muy lejos del origen, su residuo puede ser
pequeño. Los valores transitorios que corresponden a tal polo remoto son pequeños y duran un tiempo corto. Los términos
en la forma desarrollada de C(s) que tienen residuos muy pequeños contribuyen poco a la respuesta transitoria, por lo
que pueden pasarse por alto. Si se hace esto, el sistema de orden superior se aproxima mediante uno de orden inferior.
A continuación, considérese el caso en el que los polos de C(s) están formados por polos reales y pares de polos
complejos conjugados. Un par de polos complejos conjugados produce un término de segundo orden en s. Como la
forma factorizada de la ecuación característica de orden superior está formada por términos de primer y segundo orden,
la ecuación se puede escribir como:
q r p
a X aj X bk (s + ζk wk ) + ck wk 1 − ζk2
C(s) = + + (q + 2r = n)
s j=1 s + pj s2 + 2ζk wk s + wk2
k=1
donde se supone que los polos en lazo cerrado son distintos. [Si los polos en lazo cerrado contienen polos múltiples,
C(s) debe contener términos de polos múltiples]. A partir de esta última ecuación, se observa que la respuesta de un
sistema de orden superior está compuesta de varios términos que contienen las funciones simples encontradas en las
respuestas de los sistemas de primer y segundo orden. Por tanto, la respuesta escalón unitario c(t), la transformada
inversa de Laplace de C(s), es:
Xq r
X q X r q
c(t) = a + aj e−pj t + bk e−ζk wk t cos wk 1 − ζk2 t + ck e−ζk wk t sin wk 1 − ζk2 t t≥0
j=1 k=1 k=1
En este caso, la curva de respuesta de un sistema estable de orden superior es la suma de un número de curvas
exponenciales y curvas sinusoidales amortiguadas.
Si todos los polos en lazo cerrado se encuentran en el semiplano izquierdo del plano s, los términos exponenciales y
los términos sinusoidales amortiguados de la última ecuación se aproximarán a cero, conforme el tiempo t aumente. Por
tanto, la salida en estado estacionario es c(∞) = a.
Supóngase que el sistema que se considera es estable. Por tanto, los polos en lazo cerrado que se localizan lejos
del eje jw tienen partes reales grandes y negativas. Los términos exponenciales que corresponden a estos polos llegan a
cero con mucha rapidez. (Obsérvese que la distancia horizontal del polo en lazo cerrado al eje jw determina el tiempo
de asentamiento de los transitorios producidos por tal polo. Cuanto más pequeña es la distancia, más prolongado es el
tiempo de asentamiento.).
18
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
donde a y b son constantes y m ≤ n. Un criterio simple, conocido como el criterio de estabilidad de Routh, permite
determinar la cantidad de polos en lazo cerrado que se encuentran en el semiplano derecho del plano s sin tener que
factorizar el polinomio.
Criterio de estabilidad de Routh: Este criterio dice si existen o no raíces inestables en una ecuación polinomial, sin
tener que obtenerlas en realidad. Este criterio de estabilidad sólo se aplica a los polinomios con una cantidad finita
de términos. Cuando se aplica el criterio a un sistema de control, la información sobre la estabilidad absoluta se
obtiene directamente de los coeficientes de la ecuación característica.
El procedimiento en el criterio de estabilidad de Routh es el siguiente:
1. Se escribe el polinomio en s de la forma siguiente:
a0 sn + a1 sn−1 + · · · + an−1 s + an = 0
19
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
los factores cuadráticos producen las raíces complejas del polinomio. El factor s2 + bs + c produce las raíces
con partes reales negativas sólo si b y c son ambas positivas. Para todas las raíces que tienen partes reales
negativas, las constantes a, b, c,. . . deben ser positivas en todos los factores. El producto de cualquier cantidad
de factores lineales y cuadráticos que contengan sólo coeficientes positivos siempre produce un polinomio con
coeficientes positivos. Es importante señalar que la condición de que todos los coeficientes sean positivos no
es suficiente para asegurar la estabilidad. La condición necesaria, pero no suficiente, para la estabilidad es que
todos los coeficientes estén presentes y tengan un signo positivo. (Si todas las a son negativas, se hacen positivas
multiplicando ambos miembros de la ecuación por −1).
3. Si todos los coeficientes son positivos, se ordenan los coeficientes del polinomio en filas y columnas de acuerdo
con el patrón siguiente:
sn a0 a2 a4 a6 . . .
n−1
s a1 a3 a5 a7 . . .
sn−2 b1 b2 b3 b4 . . .
sn−3 c1 c2 c3 c4 . . .
sn−4 d1 d2 d3 d4 . . .
.. .. .. .. ..
. . . . .
s2 e1 e2
s1 f1
s0 g1
El proceso de formar filas continúa hasta que no quedan más elementos. (El número total de filas es n + 1.) Los
coeficientes b1 , b2 , b3 , etc., se evalúan del modo siguiente:
b1 = a1 a2a−a1
0 a3
b 2 = 1 4 0 a3
a a −a
a1
a1 a6 −a0 a7
b 3 = a1
..
.
La evaluación de las b continúa hasta que todas las restantes son cero. Se sigue el mismo patrón de multiplica-
ción cruzada de los coeficientes de las dos filas anteriores al evaluar las c, las d, las e, etc. Es decir,
c1 = b1 a3b−a1
1 b2
d1 = c1 b2c−b1
1 c2
b a −a b
c b −b1 c3
c2 = 1 5 1 3 d2 = 1 3
b1 c1
c3 = b1 a7b−a1
1 b4
d3 = c1 b4c−b1
1 c4
.. ..
. .
Este proceso continúa hasta que se completa la n-ésima fila. El array completo de los coeficientes es triangular.
Obsérvese que, al desarrollar el array, una fila completa se divide entre, o se multiplica por, un número positivo
para simplificar el cálculo numérico subsecuente sin alterar la conclusión de la estabilidad.
El criterio de estabilidad de Routh plantea que el número de raíces con partes reales positivas es igual al número de
cambios de signo de los coeficientes de la primera columna del array. Debe señalarse que no es necesario conocer los
valores exactos de los términos de la primera columna; sólo se necesitan los signos. La condición necesaria y suficiente
para que todas las raíces se encuentren en el semiplano izquierdo del plano s es que los coeficientes sean positivos y que
todos los términos de la primera columna del array tengan signo positivo.
3.5. Estabilidad
Se tienen dos tipos de estabilidades:
Estabilidad externa, o de entrada-salida: Se refiere a la estabilidad del sistema con condiciones iniciales nulas. Des-
cribe el efecto de perturbaciones en la entrada sobre el comportamiento de la salida.
Estabilidad interna: Se refiere a la estabilidad del sistema autónomo (sin entradas). Describe el efecto de perturba-
ciones en las condiciones iniciales sobre el comportamiento dinámico de los estados.
De acuerdo con estos dos tipos de estabilidades, se pueden hacer las siguientes definiciones.
20
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Representación interna
En caso de que se trate de sistemas lineales y causales, es posible utilizar una representación en el espacio de estados:
(
ẋ = Ax + Bu
y = Cx + Du
En términos de la representación interna, la estabilidad BIBO dependerá de los autovalores de A, ya que todo polo de
G(s) es un autovalor de A:
1
G(s) = C (sI − A)−1 B + D = Cadj (sI − A) B + D
det (sI − A)
Por lo tanto, si los autovalores de A tienen parte real negativa, todos los polos de G(s) tendrán parte real negativa,
y el sistema será BIBO estable. Sin embargo, no todo autovalor de A es un polo de G(s), ya que pueden producirse
cancelaciones entre ceros y polos al computar G(s). Por lo tanto, un sistema puede ser BIBO estable aunque algunos
autovalores de A no tengan parte real negativa.
ẋ = f (x(t))
es un vector constante tal que si x (0) = xe , entonces x(t) = xe para todo t ≥ 0. Esta definición vale para sistemas
no lineales. Para sistemas lineales, siempre y cuando A no tenga autovalores nulos, sólo existirá un único punto de
equilibrio: el origen.
Definición: El sistema ẋ(t) = Ax(t) es estable en el sentido de Lyapunov, o simplemente estable, si toda condición
inicial finita origina una trayectoria acotada.
Definición El sistema ẋ(t) = Ax(t) es asintóticamente estable si toda condición inicial finita origina una trayectoria
acotada que además tiende al origen cuando t → ∞.
Definición El sistema ẋ(t) = Ax(t) es inestable si no es estable.
Una vez realizadas estas definiciones, es posible enunciar el siguiente teorema:
Teorema: El sistema ẋ(t) = Ax(t) es:
21
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
1. estable en el sentido de Lyapunov si y sólo si todos los autovalores de A tienen parte real no positiva, y
aquellos con parte real cero están asociados a un bloque de Jordan1 de orden 1 de A.
2. asintóticamente estable si y sólo si todos los autovalores de A tienen parte real negativa.
Por definición, la estabilidad asintótica implica estabilidad de Lyapunov. Por otro lado, como todo polo de la transfe-
rencia
−1
G(s) = C (sI − A) B + D
debe ser un autovalor de A, estabilidad interna asintótica implica estabilidad BIBO. Sin embargo, no todo autovalor
de A será un polo de G(s), ya que pueden existir cancelaciones. Por lo tanto, la estabilidad BIBO no implica estabilidad
interna (el sistema puede ser BIBO estable pero no Lyapunov estable o asintóticamente estable).
Funciones de Lyapunov
Las funciones de Lyapunov V : Rn → R son funciones que pueden ser utilizadas para determinar la estabilidad de un
sistema.
1 Un bloque de Jordan de orden k es una matriz que presenta todos los autovalores sobre su diagonal, y luego todos unos en las columnas siguientes:
λ 1 0 ··· 0
0 λ 1 ··· 0
k×k
Ak = . .. .. .. ∈ C
.. ..
. . . .
0 0 0 0 λ
El orden del bloque esta dado por la multiplicidad de cada uno de los autovalores.
Una matriz de Jordan es aquella que es cero en todas las posiciones, salvo en su diagonal donde está compuesta por bloques de Jordan de orden ki .
22
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Teorema de estabilidad de Lyapunov: Sea V una función no negativa en Rn y sea V̇ la derivada temporal de V en
distintas trayectorias del sistema:
∂V dx ∂V
V̇ = = F (x)
∂x dt ∂x
Sea Br = Br (0) una esfera de radio r centrada en el origen. Si existe un r > 0 tal que V es definida positiva2 y V̇ es
semidefinida negativa3 para todo x ∈ Br , entonces x = 0 es localmente estable en el sentido de Lyapunov. Si V es
definida positiva y V̇ es definida negativa4 en Br , entonces x = 0 es localmente asintóticamente estable.
Si V cumple con las condiciones del teorema, se dice que V es una función de Lyapunov para el sistema.
Estabilidad para sistemas lineales: Sea el sistema descrito por ẋ = Ax, donde A es una matriz no singular, por lo cual
el único estado de equilibrio es x = 0. Una condición necesaria y suficiente para que el estado de equilibrio sea
asintóticamente estable global es que dada cualquier matriz Q hermítica definida positiva, existe una matriz P
hermítica definida positiva tal que:
A∗ P + P A = −Q
La función x∗ P x es una función de Lyapunov para este sistema. La forma mas fácil de resolver esto es definiendo
Q = I, donde I es la matriz identidad, y verificando si P es definida positiva.
Una propiedad importante es también que siendo λi el i-ésimo autovalor de A, si A es estable entonces se cumple
que:
λi + λj 6= 0
3.6. Efectos de las acciones de control integral y derivativa en el comportamiento del sistema
Acción de control integral: En el control proporcional de una planta, cuya función de transferencia no posee un integra-
dor 1/s, hay un error en estado estacionario, o desplazamiento (offset), en la respuesta para una entrada escalón. Tal
offset se elimina si se incluye la acción de control integral en el controlador.
En el control integral de una planta, la señal de control, que es la señal de salida a partir del controlador, es en
todo momento el área bajo la curva de la señal de error hasta tal momento. La señal de control u(t) tiene un valor
diferente de cero cuando la señal de error e(t) es cero. Esto es imposible en el caso del controlador proporcional, ya
que una señal de control diferente de cero requiere una señal de error diferente de cero.
La acción de control integral, aunque elimina el offset o el error en estado estacionario, puede conducir a una res-
puesta oscilatoria de amplitud decreciente lenta o, incluso, de amplitud creciente, y ambos casos, por lo general, se
consideran indeseables.
Control proporcional de sistemas: Considérese un sistema de primer orden con función de transferencia de la forma:
K
G(s) =
1 + sT
Por lo tanto, este sistema presenta un error en estado estacionario distinto de cero cuando a la entrada se pone un
escalón. Este error se conoce como offset.
2V (x) es definida positiva si V (x) > 0 ∀x 6= 0 y V (0) = 0.
3V (x) es semidefinida positiva si V (x) ≥ 0 ∀x, pero V (x) puede ser cero en otros puntos además de x = 0. V (x) es semidefinida negativa si
V (x) ≤ 0 ∀x, pero V (x) puede ser cero en otros puntos además de x = 0.
4 V (x) es definida negativa si V (x) < 0 ∀x 6= 0 y V (0) = 0.
23
3 RESPUESTA TRANSITORIA Y ESTACIONARIA
Nuevamente utilizando el teorema del valor final (dado que se trata de un sistema estable), se tiene:
s (1 + sT )
ess = lı́m sE(s) = lı́m =0
s→0 s→0 K + s (1 + sT )
Por lo tanto, el error en estado estacionario para un sistema con control integral con una señal de entrada de escalón
unitario, es nulo.
Control derivativo de sistemas: Cuando una acción de control derivativa se agrega a un controlador proporcional, apor-
ta un modo de obtener un controlador con alta sensibilidad. Una ventaja de usar una acción de control derivativa
es que responde a la velocidad del cambio del error y produce una corrección significativa antes de que la magnitud
del error se vuelva demasiado grande. Por tanto, el control derivativo prevé el error, inicia una acción correctiva
oportuna y tiende a aumentar la estabilidad del sistema.
Aunque el control derivativo no afecta en forma directa al error en estado estacionario, añade amortiguamiento al
sistema y, por tanto, permite el uso de un valor más grande que la ganancia K, lo cual provoca una mejora en la
precisión en estado estacionario.
Debido a que el control derivativo opera sobre la velocidad de cambio del error, y no sobre el error mismo, este modo
nunca se utiliza solo. Siempre se emplea junto con una acción de control proporcional o proporcional-integral.
Control proporcional-derivativo de un sistema de segundo orden: Si se usa una acción de control proporcional-derivativo,
se obtiene un equilibrio entre un comportamiento aceptable para una respuesta transitoria y un comportamiento
aceptable en un estado estacionario. La función de transferencia en lazo cerrado con una realimentación unitaria
como el de la figura 3.10 es:
C(s) Kp + Kd s
=
R(s) Js2 + (B + Kd ) s + Kp
El error de estado estacionario resulta:
B
ess =
Kp
La ecuación característica es:
Js2 + (B + Kd ) s + Kp = 0
El factor de amortiguamiento efectivo de este sistema es B + Kd , mientras que el factor de amortiguamiento relativo
es:
B + Kd
ζ= p
2 JKp
24
4 ROOT LOCUS O LUGAR DE LAS RAÍCES
1 + G(s)H(s) = 0 → G(s)H(s) = −1
Dado que G(s)H(s) es un cociente de polinomios complejos, es necesario dividir esta ecuación en módulo y ángulo:
(
∠G(s)H(s) = ±π (2k + 1) k = 0, 1, ... Condición de ángulo
|G(s)H(s)| = 1 Condición de magnitud
Los valore de s que cumplen con ambas condiciones son las raíces de la ecuación característica, o los polos en lazo
cerrado. El lugar de las raíces es una gráfica de los puntos del plano complejo que sólo satisfacen la condición de ángulo.
Las raíces de la ecuación característica (los polos en lazo cerrado) que corresponden a un valor específico de la ganancia
se determinan a partir de la condición de magnitud.
En muchos casos, G(s)H(s) contiene un parámetro de ganancia K, y la ecuación característica resulta:
K (s + z1 ) (s + z2 ) · · · (s + zm )
1+ =0
(s + p1 ) (s + p2 ) · · · (s + pn )
Entonces, los lugares de las raíces para el sistema son los lugares de los polos en lazo cerrado cuando la ganancia K
varía de cero a infinito.
Obsérvese que, para empezar a dibujar los lugares de las raíces de un sistema mediante el método analizado aquí, se
debe conocer la localización de los polos y los ceros de G(s)H(s). Recuérdese que los ángulos de las cantidades complejas
que se originan a partir de los polos y los ceros en lazo abierto para el punto de prueba s se miden en sentido contrario al
de las agujas del reloj.
4.2. Resumen de las reglas generales para construir los lugares de raíces
El primer paso es obtener la ecuación característica, escribiéndola de manera de que el parámetro de interés aparezca
como el factor multiplicativo:
K (s + z1 ) (s + z2 ) · · · (s + zm )
1 + G(s)H(s) = 0 → 1 + =0
(s + p1 ) (s + p2 ) · · · (s + pn )
25
4 ROOT LOCUS O LUGAR DE LAS RAÍCES
Para el caso en que K > 0 se está en el caso de realimentación negativa, que es lo que se supondrá en este desarrollo.
Si K < 0 se tiene realimentación positiva, y para que este análisis sea válido es necesario modificar la condición de ángulo.
Los pasos a seguir entonces son:
1. Situar los polos y ceros de G(s)H(s) en el plano s. Las ramas del lugar de las raíces empiezan en los polos en lazo abierto
y terminan en los ceros (ceros finitos o ceros en infinito).
A partir de la forma factorizada de la función de transferencia en lazo abierto, sitúense los polos y los ceros en lazo
abierto en el plano s. [Obsérvese que los ceros en lazo abierto son los de G(s)H(s), mientras que los ceros en lazo
cerrado son los de G(s) y los polos de H(s).]
Una gráfica del lugar de las raíces tendrá tantas ramas como raíces tenga la ecuación característica. Debido a que,
por lo general, el número de polos en lazo abierto es mayor que el de ceros, el número de ramas es igual al de
los polos. Si el número de polos en lazo cerrado es igual al número de polos en lazo abierto, el número de ramas
individuales del lugar de las raíces que terminan en los ceros finitos en lazo abierto será igual al número m de ceros
en lazo abierto. Las n − m ramas restantes terminan en infinito (n − m ceros implícitos en infinito) a lo largo de las
asíntotas.
Si se incluyen los polos y los ceros en infinito, el número de polos en lazo abierto es igual al de ceros en lazo abierto.
Por tanto, siempre se puede plantear que los lugares de las raíces empiezan en los polos de G(s)H(s) y terminan en
los ceros de G(s)H(s) conforme K aumenta de cero a infinito, donde los polos y los ceros incluyen los finitos y los
infinitos en el plano s.
2. Determinar los lugares de las raíces sobre el eje real. Los lugares de las raíces sobre el eje real se determinan a partir
de los polos y los ceros en lazo abierto que se encuentran sobre él. Los polos y los ceros complejos conjugados de
la función de transferencia en lazo abierto no afectan a la localización de los lugares de las raíces sobre el eje real,
porque la contribución del ángulo de un par de polos o ceros complejos conjugados es 360° sobre el eje real. Cada
parte del lugar de las raíces sobre el eje real se extiende sobre un rango de un polo o cero a otro polo o cero. Al
construir los lugares sobre el eje real, selecciónese un punto en éste. Si el número total de polos y ceros reales a la
derecha de este punto de prueba es impar, este punto se encuentra en el lugar de las raíces. Si los polos y ceros en
lazo abierto son simples, el lugar de las raíces y su forma complementaria alternan segmentos a lo largo del eje real.
3. Determinar las asíntotas de los lugares de las raíces. Si el punto de prueba s se sitúa lejos del origen, se considera
que no cambia el ángulo de cada cantidad compleja. Entonces, un cero en lazo abierto y un polo en lazo abierto
cancelan los efectos del otro. Por tanto, los lugares de las raíces para valores de s muy grandes deben ser asintóticos
para líneas rectas cuyos ángulos (pendientes) se obtengan mediante:
±180° (2k + 1)
Ángulos de las asíntotas = k = 0, 1, 2, ...
n−m
Donde n es el número de polos finitos de G(s)H(s) y m es el número de ceros finitos de G(s)H(s). Todas las
asíntotas cortan el eje real. El punto de intersección se obtiene del modo siguiente: si se desarrollan el numerador y
el denominador de la función de transferencia en lazo abierto, el resultado es:
K sm + (z1 + z2 + · · · + zm ) sm−1 + . . . + z1 z2 · · · zm
G(s)H(s) =
sn + (p1 + p2 + · · · + pn ) sn−1 + . . . + p1 p2 · · · pn
Si un punto de prueba se localiza muy lejos del origen, entonces, dividiendo el denominador entre el numerador, se
puede escribir G(s)H(s) como
K
G(s)H(s) = n−m
(p1 +p2 +···+pn )−(z1 +z2 +···+zm )
s+ n−m
La abscisa de la intersección de las asíntotas y el eje real se obtiene igualando a cero el denominador del lado derecho
de esta ecuación y despejando s:
(p1 + p2 + · · · + pn ) − (z1 + z2 + · · · + zm )
s=−
n−m
Es importante señalar que las asíntotas muestran el comportamiento de los lugares de las raíces para |s| ≫ 1. Una
ramificación del lugar de las raíces puede encontrarse en un lado de la asíntota correspondiente o puede atravesar
esta de un lado al otro.
26
4 ROOT LOCUS O LUGAR DE LAS RAÍCES
4. Encontrar los puntos de ruptura y de ingreso. Debido a la simetría conjugada de los lugares de las raíces, los puntos
de ruptura y de ingreso se encuentran sobre el eje real o bien aparecen en pares complejos conjugados.
Si un lugar de las raíces se encuentra entre dos polos en lazo abierto adyacentes sobre el eje real, existe al menos
un punto de ruptura entre dichos dos polos. Asimismo, si el lugar de las raíces está entre dos ceros adyacentes (un
cero puede localizarse en −∞) sobre el eje real, siempre existe al menos un punto de ingreso entre los dos ceros. Si
el lugar de las raíces se encuentra entre un polo en lazo abierto y un cero (finito o infinito) sobre el eje real, pueden
no existir puntos de ruptura o de ingreso, o bien pueden existir ambos.
Supóngase que la ecuación característica se obtiene mediante:
B(s) + KA(s) = 0
Los puntos de ruptura y los puntos de ingreso corresponden a las raíces múltiples de la ecuación característica. Por
tanto, los puntos de ruptura y de ingreso se determinan a partir de las raíces de:
donde la prima indica una diferenciación con respecto a s. Es importante señalar que los puntos de ruptura y los
puntos de ingreso deben ser las raíces de esta expresión, aunque no todas las raíces son puntos de ruptura o de
ingreso. Si una raíz real se encuentra en la parte del eje real del lugar de las raíces, es un punto de ruptura o de
ingreso real. Si una raíz real no está en la parte del eje real del lugar de las raíces, esta raíz no corresponde a un
punto de ruptura ni a un punto de ingreso. Si dos raíces s = s1 y s = −s1 son un par complejo conjugado, y si no es
seguro que están en los lugares de las raíces, es necesario verificar el valor de K correspondiente. Si el valor de K
que corresponde a la raíz s = s1 de dK/ds = 0 es positivo, el punto s = s1 es un punto de ruptura o de ingreso real.
(Como se supone que K es no negativo, si el valor obtenido de K es negativo, el punto s = s1 no es de ruptura ni
de ingreso.)
5. Determinar el ángulo de salida (ángulo de llegada) de un lugar de las raíces a partir de un polo complejo (un cero
complejo). Para dibujar los lugares de las raíces con una precisión razonable, se deben encontrar las direcciones de
los lugares de las raíces cercanas a los polos y ceros complejos. Si se selecciona un punto de prueba y se mueve en la
cercanía precisa del polo complejo (o del cero complejo), se considera que no cambia la suma de las contribuciones
angulares de todos los otros polos y ceros. Por tanto, el ángulo de llegada (o ángulo de salida) del lugar de las
raíces de un polo complejo (o de un cero complejo) se encuentra restando a 180° la suma de todos los ángulos de
vectores, desde todos los otros polos y ceros hasta el polo complejo (o cero complejo) en cuestión, incluyendo los
signos apropiados.
6. Encontrar los puntos donde los lugares de las raíces cruzan el eje imaginario. Los puntos donde los lugares de las raíces
cruzan el eje jw se encuentran con facilidad por medio de: (a) el criterio de estabilidad de Routh, o (b) suponiendo
que s = jw en la ecuación característica, igualando a cero la parte real y la parte imaginaria y despejando w y K.
En este caso, los valores encontrados de w representan las frecuencias en las cuales los lugares de las raíces cruzan
el eje imaginario. El valor de K que corresponde a cada frecuencia de cruce proporciona la ganancia en el punto de
cruce.
7. Tomando una serie de puntos de prueba en la cercanía del origen del plano s, dibujar los lugares de las raíces. Deter-
mínense los lugares de las raíces en la cercanía del eje jw y el origen. La parte más importante de los lugares de
las raíces no está sobre el eje real ni en las asíntotas, sino en la parte cercana al eje jw y al origen. La forma de los
lugares de las raíces en esta región importante del plano s debe obtenerse con suficiente precisión.
8. Determinar los polos en lazo cerrado. Un punto específico de cada ramificación del lugar de las raíces será un polo
en lazo cerrado si el valor de K en dicho punto satisface la condición de magnitud. Por otra parte, la condición de
27
4 ROOT LOCUS O LUGAR DE LAS RAÍCES
magnitud permite determinar el valor de la ganancia K en cualquier localización de las raíces sobre el lugar. (Si es
necesario, se establece una parametrización de los lugares de las raíces en términos de K. Los lugares de las raíces
son continuos con K.)
El valor de K que corresponde a cualquier punto s sobre el lugar de las raíces se obtiene a partir de la condición de
magnitud, o bien
producto de las longitudes entre el punto s y los polos
K=
producto de las longitudes entre el punto s y los ceros
4.3. Compensación
4.3.1. Compensación de adelanto
Un compensador de adelanto lo que hace es provocar un adelanto en la fase de la salida del sistema. Los procedimientos
para diseñar un compensador de adelanto mediante el método del lugar de las raíces se plantean del modo siguiente:
1. A partir de las especificaciones de comportamiento, determine la localización deseada para los polos dominantes en
lazo cerrado.
2. Por medio de una gráfica del lugar de las raíces del sistema sin compensar (sistema original), compruebe si el ajuste
de la ganancia puede o no por sí solo proporcionar los polos en lazo cerrado adecuados. Si no, calcule la deficiencia
de ángulo φ. Este ángulo debe ser una contribución del compensador de adelanto si el nuevo lugar de las raíces va
a pasar por las localizaciones deseadas para los polos dominantes en lazo cerrado.
3. Suponga que el compensador de adelanto GC (s) es
Ts + 1 s + T1
GC (s) = KC α = KC 1 0<α<1
αT s + 1 s + αT
donde α y T se determinan a partir de la deficiencia de ángulo. KC se determina a partir del requisito de la ganancia
en lazo abierto.
4. Si no se especifican las constantes de error estático, determine la localización del polo y del cero del compensador de
adelanto, para que el compensador de adelanto contribuya al ángulo φ necesario. Si no se imponen otros requisitos
sobre el sistema, intente aumentar el valor de α lo más que pueda. Un valor más grande de α, generalmente,
proporciona un valor más grande de KV (error de velocidad estática), lo que es deseable. Obsérvese que
28
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
1. Dibuje la gráfica del lugar de las raíces para el sistema no compensado, cuya función de transferencia en lazo abierto
sea G(s). En función de las especificaciones de la respuesta transitoria, sitúe los polos dominantes en lazo cerrado
en el lugar de las raíces.
2. Suponga que la función de transferencia del compensador de retardo es
Ts + 1 s + T1
GC (s) = K̂C β = K̂C 1 β>1
βT s + 1 s + βT
Así, la función de transferencia en lazo abierto del sistema compensado se convierte en GC (s)G(s).
3. Calcule la constante de error estático especificada en el problema.
4. Determine el incremento necesario en la constante de error estático para satisfacer las especificaciones.
5. Determine el polo y el cero del compensador de retardo que producen el incremento necesario en la constante de
error estático sin modificar apreciablemente los lugares de las raíces originales.
6. Dibuje una nueva gráfica del lugar de las raíces para el sistema no compensado. Localice los polos dominantes en
lazo cerrado deseados sobre el lugar de las raíces.
7. Ajuste la ganancia K̂C del compensador a partir de la condición de magnitud, para que los polos dominantes en lazo
cerrado se encuentren en la localización deseada (K̂C será aproximadamente 1).
29
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
dB dB
Por lo tanto, se trata de una recta con pendiente −20 dec o −6 oct . Por otra parte, el ángulo de fase de 1/jw es constante
e igual a −90°.
De la misma manera, la magnitud logarítmica de jw en dB es:
dB dB
Se trata en este caso de una recta con pendiente 20 dec o 6 oct . El ángulo de fase de jw es constante e igual a 90°. En
la figura 5.1 se tiene una representación de estos dos casos.
∓1
Factores de primer orden (1 + jwT) : La magnitud logarítmica para el caso del polo es:
p
1
20 log = −20 log 1 + w2 T 2 dB
1 + jwT
La curva de la fase permanece en 0° hasta una década antes de w = T1 (es decir en w = 10T 1
). A partir de esta
frecuencia, decrece con una pendiente de −45° dec hasta una década después de w = T (es decir hasta que w = 10
1 1
T ),
donde alcanza los 90°. En la figura 5.2 se tiene una representación de esto.
30
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
1
G (jw) = 2
1 + 2ζj wwn + j wwn
Si ζ > 1 se tienen dos raíces reales, y el sistema se puede analizar como en el caso anterior. Para 0 < ζ < 1 se tienen
dos polos complejos conjugados. La curva asintótica resulta:
s
2 2
2
1 w w
20 log 2 = −20 log 1− 2 + 2ζ [dB]
w w wn wn
1 + 2ζj wn + j wn
Para frecuencias bajas la asíntota es una recta horizontal en 0dB, mientras que para altas frecuencias resulta en:
2
w w
−20 log = −40 log [dB]
wn2 wn
Por lo tanto, es un resultado similar al que se obtendría con un polo doble. Cerca de la frecuencia w = wn hay in
pico de resonancia, cuya magnitud será determinada por el factor de amortiguamiento relativo ζ.
El ángulo de fase es:
−1 2ζ wwn
φ = tan 2
1 − wwn
Para frecuencias pequeñas el ángulo resulta de 0°, para w = wn es de −90° y para w → ∞ el ángulo alcanza los 180°.
31
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
Nuevamente, el resultado obtenido es similar para el caso de un polo doble. En la figura 5.3 se tiene un ejemplo de
esta situación.
dB
Si se tuvieran ceros complejos conjugados, la pendiente de la asíntota de la magnitud sería de 40 dec y la fase pasaría
de 0° a 180°.
Frecuencia de resonancia wr y el valor pico de resonancia Mr : Sea una función cuadrática G (jw):
1 1
G (jw) = 2 → |G (jw)| = r 2 2
1 + 2ζj wwn + j wwn 1− w2
2 + 2ζ wwn
wn
El módulo |G (jw)| será máximo cuando el denominador g (w) sea mínimo, es decir:
2 2 !2
w2 w w2 − wn2 1 − 2ζ 2
g (w) = 1− 2 + 2ζ = + 4ζ 2 1 − ζ 2
wn wn wn2
p
Se puede ver que la frecuencia de resonancia wr es menor que la frecuencia natural amortiguada wd = wn 1 − ζ2.
La magnitud del pico de resonancia Mr es:
√1 0≤ζ ≤ √1
2ζ 1−ζ 2 2
Mr = |G (jw)|⌋máx =
1 ζ> √1
2
32
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
El diagrama polar de esta función de transferencia es un semicírculo cuando la frecuencia w varía de cero a infinito,
como se aprecia en la figura 5.4. El centro se localiza en 0,5 sobre el eje real y el radio es igual a 0,5.
Por lo tanto, queda demostrado G (jw) es un círculo en el plano X − Y (ver figura 5.4), donde el semicirculo inferior
corresponde a 0 ≤ w ≤ ∞ y el superior a −∞ ≤ w ≤ 0.
El diagrama polar de 1 + jwT es simplemente es una recta vertical que pasa por el (1, 0), lo cual se diferencia mucho
1
del diagrama de 1+jwT visto anteriormente.
33
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
2 ∓1
Factores cuadráticos 1 + 2ζj wwn + j wwn : Una transferencia típica es:
1
G (jw) = 2 ζ >0
w
1 + 2ζ j wn + j wwn
El diagrama polar de esta función de transferencia senoidal empieza en 1 0° y termina en 0 −180° conforme w
aumenta de 0 a ∞. Por tanto, la parte de alta frecuencia de G (jw) es tangente al eje real negativo. En la figura 5.5
se tienen ejemplos de esto.
1
Para el caso subamortiguado w = wn , se tiene que G (jwn ) = 2jζ , y el ángulo de fase es de −90°. Por lo tanto, se
observa que la frecuencia en la que el lugar geométrico G (jw) corto el eje imaginario es la frecuencia natural no
amortiguada wn . En el diagrama polar, el punto de frecuencia cuya distancia al origen es la máxima, corresponde a
la frecuencia de resonancia wr . El valor pico de G(jw) se obtiene como el cociente entre la magnitud del vector en
la frecuencia de resonancia wr y la magnitud del vector en w = 0. La frecuencia de resonancia wr se muestra en el
diagrama polar de la figura 5.6.
Figura 5.6: Diagrama polar que muestra el pico de resonancia y la frecuencia de resonancia wr .
34
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
Se obtiene que: (
G (0) = 1 0°
G (w → ∞) = ∞ 180◦
donde n > m, o el grado del polinomio del denominador es mayor que el del numerador, tendrá las formas generales
siguientes:
1. Para λ = 0 o sistemas de tipo 0: El punto inicial del diagrama polar (que corresponde a w = 0) es finito y está sobre
el eje real positivo. La tangente en el diagrama polar en w = 0 es perpendicular al eje real. El punto terminal, que
corresponde a w = ∞, está en el origen, y la curva es tangente a uno de los ejes.
2. Para λ = 1 o sistemas de tipo 1: El término jw del denominador contribuye −90° al ángulo de fase total de G (jw)
para 0 ≤ w ≤ ∞. En w = 0, la magnitud de G(jw) es infinita y el ángulo de fase se convierte en −90°. En bajas
frecuencias, el diagrama polar es asintótico hacia una línea paralela al eje imaginario negativo. En w = ∞, la
magnitud se vuelve cero y la curva converge hacia el origen y es tangente a uno de los ejes.
2
3. Para λ = 2 o sistemas de tipo 2: El término (jw) del denominador contribuye −180° al ángulo de fase total de
G(jw) para 0 ≤ w ≤ ∞. En w = 0, la magnitud de G(jw) es infinita y el ángulo de fase es igual a −180°. En bajas
frecuencias, el diagrama polar es asintótico hacia una línea paralela al eje real negativo. En w = ∞, la magnitud se
vuelve cero y la curva es tangente a uno de los ejes.
En la figura 5.8 se tiene una representación de estas 3 situaciones.
35
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
La función F (s) es analítica en todas las partes del plano s, excepto en sus puntos singulares. A cada punto de análisis
en el plano s le corresponde un punto en el plano F (s). Se puede demostrar que para una determinada trayectoria cerrada
continua en el plano s, que no pase por ningún punto singular, hay una curva cerrada en el plano F (s).
A partir de esto se puede definir:
Teorema de transformación: Supóngase que F (s) es un cociente de dos polinomios en s. Supóngase también que P es
el número de polos y Z el número de ceros de F (s) que se encuentran en cierto contorno cerrado en el plano s,
considerada una multiplicidad de polos y ceros. Supóngase, por último, que este contorno es tal que no pasa a través
de ningún polo ni cero de F (s). Este contorno cerrado en el plano s se transforma después dentro del plano F (s)
como una curva cerrada. El número total N de rodeos del origen del plano F (s) en el sentido de las agujas del reloj,
conforme un punto representativo traza el contorno completo en el sentido de las agujas del reloj, es igual a:
N =Z −P
Obsérvese que, mediante este teorema de la transformación, no se encuentra el número de ceros y de polos sino su
diferencia.
Obsérvese también que un número positivo N indica que hay más ceros que polos en la función F (s) y un número N
negativo indica que hay más polos que ceros. En las aplicaciones de un sistema de control, el número P se determina
con facilidad para F (s) = 1 + G (s) H (s) a partir de la función G(s)H(s). Por tanto, si N se determina a partir de
la gráfica de F (s), es fácil determinar el número de ceros en el contorno cerrado en el plano s. Obsérvese que las
formas exactas del contorno en el plano s y el lugar geométrico de F (s) no son importantes en lo que respecta a los
rodeos del origen, debido a que estos sólo dependen de que se encierren los polos y/o los ceros de F (s) mediante el
contorno en el plano s.
36
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
Teniendo este teorema en cuenta, suponiendo que un punto representativo s sigue un contorno en el plano s en el sentido
de las agujas del reloj, si el contorno en el plano s encierra el polo un F (s), el lugar geométrico de F (s) rodea una vez el
origen del plano F (s) en sentido contrario al de las agujas del reloj. Si el contorno en el plano s encierra un cero de F (s),
el lugar geométrico de F (s) rodea una vez el origen del plano F (s) en el sentido de las agujas del reloj. Si el contorno en
el plano s encierra un cero y un polo o si no encierra ninguna singularidad, el lugar geométrico de F (s) no rodea el origen
del plano F (s).
Si el teorema de la transformación se aplica al caso especial en el que F (s) es igual a 1 + G(s)H(s), se puede plantear
el siguiente enunciado: Si el contorno cerrado en el plano s encierra el semiplano derecho del plano s, el número de
ceros en el semiplano derecho del plano de la función F (s) = 1 + G(s)H(s) es igual al número de polos de la función
F (s) = 1 + G(s)H(s) en el semiplano derecho del plano s, más el número de rodeos del origen del plano 1 + G(s)H(s) en
el sentido de las agujas del reloj por la curva cerrada correspondiente en este último plano.
Dado que lı́ms→∞ (1 + G(s)H(s)) = constante, es posible considerar sólo una parte del contorno cerrado en el plano s,
es decir el eje jw. Por lo tanto, no es necesario recorrer la semicircunferencia que cierra el contorno, ya que generalmente
se mapea en un único punto en el plano F (s).
Se puede demostrar que rodear el origen mediante la gráfica de 1 + G(jw)H(jw) equivale a rodear el punto −1 + j0
mediante el lugar geométrico G(jw)H(jw). Por tanto, la estabilidad del sistema en lazo cerrado se averigua examinando
los rodeos del punto −1 + j0 mediante el lugar geométrico de G(jw)H(jw). El número de rodeos en el sentido de las
agujas del reloj del punto −1 + j0 se encuentra dibujando un vector del punto −1 + j0 al lugar geométrico G(jw)H(jw),
a partir de w = −∞, pasando por w = 0 y hasta llegar a w = ∞ o bien contando el número de rotaciones en el sentido
de las agujas del reloj del vector. Es sencillo dibujar G(jw)H(jw) para la trayectoria de Nyquist. La transformación del eje
jw negativo es la imagen reflejada de la transformación del eje jw positivo con respecto al eje real. Es decir, la gráfica de
G(jw)H(jw) y la gráfica de G(−jw)H(−jw) son simétricas con respecto al eje real.
A partir de esta definición, es posible realizar las siguientes observaciones:
1. El criterio se expresa como:
N = Número de rodeos en el sentido horario del punto (−1, 0)
Z = N + P → Z = Número de ceros de F (s) en el semiplano derecho del plano s
P = Número de polos de G(s)H(s) en el semiplano derecho del plano s
37
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
3. Debido a que el diagrama de Nyquist no debe pasar por polos o ceros de G(s)H(s), si la función G(s)H(s) tiene
polos o ceros en el origen (o sobre el eje jw para puntos diferentes del origen), debe modificarse el contorno en el
plano s. La forma usual de modificar el contorno cerca del origen es mediante un semicírculo de radio infinitesimal
ε, como se aprecia en la figura 5.10.
Figura 5.10: Contorno cerrado en el plano s evitando los polos y ceros en el origen.
γ = 180° + φ
Con el fin de que un sistema de fase mínima sea estable, el margen de fase debe ser positivo.
Margen de ganancia: El margen de ganancia es el recíproco de la magnitud |G (jw)| en la frecuencia a la cual el ángulo
de fase es −180°. Si se define la frecuencia de cruce de fase w1 como la frecuencia a la cual el ángulo de fase de la
función de transferencia en lazo abierto es igual a −180°, se produce el margen de ganancia Kg 7 :
1
Kg = Kg [dB] = 20 log (Kg ) = −20 log (|G (jw1 )|)
|G (jw1 )|
Un margen de ganancia positivo (en decibeles) significa que el sistema es estable, y un margen de ganancia negativo
(en decibeles) quiere decir que el sistema es inestable. Para un sistema estable de fase mínima, el margen de ganancia
indica cuánto puede incrementarse la ganancia antes de que el sistema se vuelva inestable. Para un sistema inestable,
el margen de ganancia indica cuánto se debe disminuir la ganancia para que el sistema se vuelva estable.
6 En otras palabras: El margen de fase es el ángulo que le falta a la fase para llegar a −180° cuando la ganancia es unitaria (0dB).
7 En otras palabras: El margen de ganancia es el valor que le falta a la ganancia para llegar a 0dB cuando la fase es de −180°.
38
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
Figura 5.11: Margen de fase y de ganancia. La figura (a) muestra el análisis en un diagrama de Bode,
mientras que la imagen (b) muestra el análisis sobre un diagrama de Nyquist.
Por lo tanto, para garantizar estabilidad, se debe cumplir que ambos márgenes sean positivos. Generalmente, para
obtener un rendimiento satisfactorio, el margen de fase debe estar entre 30° y 60°, y el margen de ganancia debe ser
mayor que 6dB. Con estos valores, un sistema de fase mínima tiene una estabilidad garantizada, aun cuando la ganancia
en lazo abierto y las constantes de tiempo de los componentes varíen un cierto grado.
5.5. Compensación
5.5.1. Compensación de adelanto
Sea un compensador de adelanto que tiene la función de transferencia:
Ts + 1 s + T1
GC (s) = KC α = KC 1 0<α<1
αT s + 1 s + αT
donde α se denomina factor de atenuación del compensador de adelanto. Tiene un cero en s = −1/T y un polo en
s = −1/αT . Como 0 < α < 1 se ve que el cero siempre se localiza a la derecha del polo en el plano complejo. El valor
mínimo de a está limitado por la construcción física del compensador de adelanto, y generalmente se lo toma alrededor
de 0,05. En la figura 5.12a se tiene el diagrama polar de este compensador.
39
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
(a) Diagrama polar del compen- (b) Diagrama de Bode del com-
sador GC (s) con KC = 1. pensador GC (s) con KC = 1.
Para un valor determinado de α, el ángulo entre el eje real positivo y la línea tangente dibujada desde el origen hasta
el semicírculo proporciona el ángulo de adelanto de fase máximo φm . Se llamará wm a la frecuencia en el punto tangente.
Por lo tanto, se tiene:
1−α
2 1−α
sin (φm ) = 1+α =
2
1+α
Por otra parte, en la figura 5.12b se tiene el Bode del compensador, donde se ve que las frecuencias esquinas para
el compensador de adelanto son w = 1/T y w = 1/αT . Se puede ver también que wm es la media geométrica de las dos
frecuencias esquinas:
1 1 1 1
log (wm ) = log + log → wm = √
2 T αT αT
La función principal del compensador de adelanto es modificar la curva de respuesta en frecuencia para proporcionar
un ángulo de adelanto de fase suficiente para compensar el excesivo retardo de fase asociado con las componentes del
sistema fijo. El método para el diseño de un compensador de adelanto es:
1. Suponga el siguiente compensador de adelanto:
Ts + 1 s + T1
GC (s) = KC α = KC 1 0<α<1
αT s + 1 s + αT
donde G1 (s) = KG(s). Determine la ganancia K que satisfaga el requisito sobre la constante estática de error dada.
2. Usando la ganancia K así determinada, dibuje el diagrama de Bode de G1 (jw), el sistema con la ganancia ajustada
pero sin compensar. Calcule el margen de fase.
3. Determine el ángulo de adelanto de fase que es necesario que se añada al sistema. Incremente un adelanto de
fase adicional de 5° a 12° al ángulo de adelanto de fase requerido, ya que la adición del compensador de adelanto
desplaza la frecuencia de cruce de ganancia hacia la derecha y disminuye así el margen de fase.
4. Determine el factor de atenuación α a partir de
1−α
sin (φm ) =
1+α
√
Determine la frecuencia donde la magnitud del sistema no compensado G1 (jw) es igual a −20 log (1/ α). Seleccione
√
esta frecuencia como la nueva frecuencia de cruce de ganancia. Esta frecuencia corresponde wm = 1/ αT y el cambio
de fase máximo φm ocurre en esta frecuencia.
40
5 ANÁLISIS DE SISTEMAS POR EL MÉTODO DE RESPUESTA EN FRECUENCIA
5. Determine las frecuencias esquinas del compensador de adelanto del modo siguiente:
(
w = T1 Compensador de adelanto de cero
1
w = αT Compensador de adelanto de polo
Ts + 1 s + T1
GC (s) = KC β = KC 1 β>1
βT s + 1 s + βT
En el plano complejo, un compensador de retardo tiene un cero en s = −1/T y un polo en s = −1/βT . El polo está
localizado a la derecha del cero. En las figuras 5.13a y 5.13b se tienen los diagramas de Nyquist y Bode respectivamente
para este compensador.
(a) Diagrama polar del compen- (b) Diagrama de Bode del com-
sador GC (s). pensador GC (s) con KC = 1 y
β = 10.
La función principal de un compensador de retardo es proporcionar una atenuación en el rango de las altas frecuencias
a fin de aportar un margen de fase suficiente al sistema. La característica de retardo de fase no tiene importancia en la
compensación por retardo. El procedimiento para diseñar compensadores de retardo es:
1. Suponga el siguiente compensador de retardo:
Ts + 1 s + T1
GC (s) = KC β = KC 1 β>1
βT s + 1 s + βT
Defina KC β = K, entonces:
Ts + 1 Ts + 1 Ts + 1
GC (s) = K → GC (s)G(s) = K G(s) = G1 (s)
βT s + 1 βT s + 1 βT s + 1
donde G1 (s) = KG(s). Determine la ganancia K que satisfaga los requisitos sobre la constante de error estático de
velocidad.
2. Si el sistema no compensado pero ajustado en ganancia G1 (jw) = KG(jw) no satisface las especificaciones en
los márgenes de fase y de ganancia, entonces encuentre la frecuencia en la cual el ángulo de fase de la función
de transferencia en lazo abierto sea igual a −180° más el margen de fase requerido. Este es el margen de fase
especificado más 5° a 12°. (La adición de entre 5° y 12° compensa el desfase que introduce el compensador de
retardo.) Seleccione esta frecuencia como la nueva frecuencia de cruce de ganancia.
41
6 CONTROLADORES PID: REGLAS DE ZIEGLER-NICHOLS
3. Para evitar los efectos adversos del desfase producido por el compensador de retardo, el polo y el cero del compensa-
dor de retardo deben localizarse sustancialmente por debajo de la nueva frecuencia de cruce de ganancia. Por tanto,
seleccione la frecuencia esquina w = 1/T (que corresponde al cero del compensador de retardo) entre una octava y
una década por debajo de la nueva frecuencia de cruce de ganancia. Observe que se selecciona el polo y el cero del
compensador suficientemente pequeños. Así el retardo de fase ocurre en la región de bajas frecuencias de manera
que no afecta al margen de fase.
4. Determine la atenuación necesaria para llevar la curva de magnitud a 0dB en la nueva frecuencia de cruce de
ganancia. Si se considera que esta atenuación es de −20 log (β), determine el valor de β. A continuación se obtiene
la otra frecuencia esquina (que corresponde al polo del compensador de retardo) a partir de w = 1/βT .
5. Usando el valor de K determinado en el paso 1 y el de β obtenido en el paso 5, calcule la constante KC a partir de
K
KC =
β
42
6 CONTROLADORES PID: REGLAS DE ZIEGLER-NICHOLS
El método de Ziegler-Nichols es un método experimental para el diseño de controladores PID, el cual se basa en la
respuesta al escalón experimental de aquellos sistemas que se desean controlar, y que resulta muy útil en aquellos casos
en que no se conoce el modelo matemático exacto de las plantas. Existen casos en donde los sistemas resultantes pueden
presentar una gran sobreelongación en su respuesta al escalón, por lo que será necesario realizar una serie de ajustes finos
para cumplir con las especificaciones.
Existen dos métodos de Ziegler-Nichols para la obtención de controladores PID, los cuales se presentan a continuación.
Figura 6.2: Respuesta al escalón de una planta que no contiene integradores ni polos dominantes
complejos conjugados .
La curva de la figura 6.2 se caracteriza por dos parámetros: El tiempo de retardo L y la constante de tiempo T .
Estos parámetros se obtienen dibujando una recta tangente en el punto de inflexión de la curva, y determinando las
intersecciones de esta tangente con el eje de tiempo y con la recta c(t) = K.
Aquellos sistemas que cumplen con estos requisitos, pueden ser aproximados mediante sistemas de primer orden con
un retardo:
C(s) K
T (s) = = e−Ls
U (s) Ts + 1
Utilizando esta aproximación, la obtención de los valores de KP , Ti y Td se hace según la tabla 6.1.
Tipo de controlador KP Ti Td
T
P L ∞ 0
T L
PI 0,9 · L 0,3 0
T 1
PID 1,2 · L 2L 2 ·L
43
7 STATE FEEDBACK
Conociendo Kcr y Pcr es posible establecer los valores del controlador según las relaciones de la tabla 6.2.
Tipo de controlador KP Ti Td
1
P 2 Kcr ∞ 0
Pcr
PI 0,45 · Kcr 1,2 0
1
PID 0,6 · Kcr 2 Pcr 0,125 · Pcr
Cuadro 6.2: Regla de sintonía de Ziegler-Nichols basada en la ganancia crítica Kcr y periodo crítico
Pcr .
Se puede ver que para aquellos sistemas donde la planta es conocida, la ganancia crítica Kcr puede ser obtenida a
partir del diagrama Root Locus, buscando el valor de Kcr y wcr donde los polos se ubican sobre el eje jw (notar que
Pcr = w2πcr ). En aquellos casos donde el diagrama Root Locus no cruza el eje jw, no será posible diseñar un controlador
PID mediante este método para dichas plantas.
7. State feedback
7.1. Controlabilidad
Sea el sistema de tiempo continuo:
(
x : Vector de espacio de estados
ẋ = An×n x + B n×1 u →
u : Señal de control
Se dice que este sistema es controlable en t = t0 , si es posible construir una señal de control sin restricciones que
transfiera un estado inicial a cualquier estado final en un intervalo de tiempo finito t0 ≤ t ≤ t1 . Si todos los estados son
controlables, se dice que el sistema es de estado completamente controlable.
Tomando un estado inicial nulo, la respuesta de un sistema a una entrada u (t) = δ (t) es:
ˆ t ˆ t
A(t−τ )
x (t) = e Bu (t) dτ → xδ (t) = eA(t−τ ) Bδ (t) dτ = eAt B
0 0
44
7 STATE FEEDBACK
Teorema: Un sistema es controlable si y solo si la matriz de controlabilidad Wrn×n es de rango8 n, es decir que presenta n
filas o columnas linealmente independientes. Por lo tanto, un sistema es controlable si su matriz de controlabilidad
es inversible.
Observación: Para el caso de que el sistema presente r señales de entrada
(
n×n n×r x : Vector de espacio de estados
ẋ = A x+B u→
u : Vector de control
la matriz de controlabilidad es de tamaño n × rn. La condición de controlabilidad sigue siendo la misma (Wr debe
ser de rango n), a excepción de la condición de inversibilidad, ya que no se trata de una matriz cuadrada.
Se puede ver que esta matriz es de rango n, lo cual cumple con la condición de controlabilidad.
Una vez definido esto, es necesario encontrar la transformación T que permite llevar el sistema original x a su forma
canónica z. Al aplicar la transformación T al sistema se tiene:
ż = T ẋ
ż = T (Ax + Bu)
ż = T AT −1 z + Bu
ż = T AT −1z + T Bu
8 El rango de una matriz es el número de filas (o columnas) linealmente independientes.
45
7 STATE FEEDBACK
y = Cx + Du
y = CT −1 z + Du
Finalmente se obtiene:
W̃r = T B AB A2 B ··· An−1 B = T Wr
Por lo tanto, la transformación que permite llevar un sistema a su forma canónica resulta:
T = W̃r Wr−1
Teorema: Sea un sistema descrito por ẋ = Ax + Bu. Existe entonces una transformación z = T x tal que las matrices à y
B̃ están en su forma canónica.
ẋ = Ax + Bu y = Cx + Du
u = −Kx + kr r
donde r es una señal de referencia, que permite alcanzar un sistema realimentado cuyo polinomio característico es:
ẋ = Ax + B (−Kx + kr r)
ẋ = (A − BK) x + Bkr r
Por lo tanto, el problema que se debe resolver es encontrar el valor de la ganancia K que hace que la matriz A − BK
tenga los autovalores deseados.
La ganancia del control proporcional es:
K = K̃T = p 1 − a1 p 2 − a2 ··· p n − an W̃r Wr−1
donde Wr es la matriz de controlabilidad de x y W̃r es la matriz de controlabilidad del sistema canónico z. Por otra
parte, si lo que se busca es que la salida en estado estacionario sea igual a la referencia entonces:
−1
kr = −1
C (A − BK) B
46
7 STATE FEEDBACK
En caso de no utilizar esta fórmula, lo que se debe hacer es calcular el polinomio característico de la matriz A′ =
A − BK:
λ (s) = det (sI − A + BK)
e igualarlo con el polinomio característico que se desea obtener:
De esta forma, es posible encontrar los valores ki que componen el control proporcional K.
K = k1 k2 · · · kn
Fórmula de Ackerman
Esta fórmula permite encontrar el valor de la matriz K para sistemas de una única entrada y una única salida
K = k1 k2 · · · kn → u = Kx
p (s) = sn + a1 sn−1 + . . . + an
la matriz K resulta:
K= 0 0 ··· 0 1 Wr−1 p (A) p (A) = An + a1 An−1 + . . . + an I
m×(n+1)r
WS = CB CAB CA2 B ··· CAn−1 B D
Al igual que como ocurría con los sistemas de control integrales, los sistemas de control con acción integral permiten
alcanzar un error de estado estacionario nulo, ya que trabajan sobre la integral del error. Por lo tanto, es necesario añadir
una nueva variable de estado que represente la integral del error:
ż = y − r
donde r es una señal de referencia. De esta forma, el sistema se puede reescribir como:
ẋ Ax + Bu A 0 x B 0 x
= = + u+ r y= C 0
ż y−r C 0 z 0 −1 | {z } z
| {z } | {z }
Ĉ
 B̂
47
7 STATE FEEDBACK
Esta nueva planta que introduce el nuevo estado, se la conoce como planta aumentada. Se puede ver que si el
controlador logra estabilizar el sistema, necesariamente se debe cumplir que ż = 0 y entonces y = r, por lo que el error
de estado estacionario es nulo.
Para que sea posible aplicar un controlador, la planta aumentada debe ser controlable, es decir que su matriz de
controlabilidad debe ser de rango n:
Wr = B̂ ÂB̂ · · · Ân−1 B̂
Una vez verificada la controlabilidad de la planta aumentada, es posible aplicar el siguiente controlador:
u = −Kx + ki z + kr r
ẋ = Ax + Bu = Ax + B (−Kx + ki z + kr r)
ẋ = (A − BK) x + Bki z + Bkr r
7.2. Observabilidad
En la práctica, no todas las variables de estado son accesibles para ser realimentadas, por lo que se hace necesario
estimar dichas variables de estado no disponibles. La estimación de variables de estado no medibles se denomina ob-
servación. Un dispositivo que estima u observa las variables de estado de llama observador de estado o simplemente
observador. Si el observador de estado capta todas las variables de estado del sistema, sin importar si algunas están
disponibles por medición directa, se denomina observador de estado de orden completo.
Un observador que estima menos de n variables de estado, donde n es la dimensión del vector de estado, se denomina
observador de estado de orden reducido o de orden reducido. Si el observador de estado de orden reducido es el orden
mínimo posible, se denomina observador de estado de orden mínimo u observador de orden mínimo.
9 Se debe tener en cuenta se debe trabajar siempre con la planta aumentada, y no con la planta original.
48
7 STATE FEEDBACK
Se dice que el sistema es completamente observable si el estado x(t0 ) se determina a partir de la observación de
y(t) durante un intervalo de tiempo finito, t0 ≤ t ≤ t1 . Por tanto, el sistema es completamente observable si todas las
transiciones del estado afectan eventualmente a todos los elementos del vector de salida.
Dado el sistema propuesto, y asumiendo que t0 = 0, se puede plantear:
( ´t
x (t) = eAt x (0) + 0 eA(t−τ ) Bu (τ ) dτ
´t
y (t) = CeAt x (0) + C 0 eA(t−τ ) Bu (τ ) dτ + Du
Dado que A, B, C, D y u son cantidades conocidas, para analizar la observabilidad completa del sistema anterior se
puede hacer directamente analizando el siguiente sistema simplificado:
(
ẋ = An×n x
y = C m×n x
x = C −1 y
Para el caso en que C no es inversible, se debe encontrar otra forma de estimar el vector de estados a partir de la
salida. Tomando la derivada de la salida:
y C
ẏ CA
ẏ = C ẋ = CAx → .. = .. x
. .
(n−1) CA n−1
y
Teorema: Un sistema es observable si y solo si la matriz de observabilidad WOnm×n es de rango n, es decir que presenta n
filas o columnas linealmente independientes.
49
7 STATE FEEDBACK
Al igual que como ocurría para la controlabilidad, siempre existe una transformación T que permite convertir un
sistema a su forma canónica observable.
7.2.2. Observador
Considérese el siguiente sistema: (
ẋ = An×n x + B n×r u
y = C m×n x
Un estimador de estados puede ser:
dx̂
= Ax̂ + Bu
dt
El error de estimación es x̃ = x − x̂. Por lo tanto:
dx̃ d (x − x̂) dx dx̂
= = − = (Ax + Bu) − (Ax̂ + Bu) = A (x − x̂) = Ax̃
dt dt dt dt
Si la matriz A presenta todos sus autovalores en el semiplano izquierdo, el sistema será estable y el error de estima-
ción convergerá a cero (la estimación convergerá al valor real). El estimador dx̂
dt utilizado es un observador que utiliza
únicamente la información de la entrada u. Un observador más útil es:
dx̂
= Ax̂ + Bu + L (y − C x̂)
dt
Este observador sirve también para sistemas inestables. El término L (y − C x̂) introduce el efecto de la salida en la
estimación. El error de estimación en este caso resulta:
dx̃
= (A − LC) x̃
dt
donde la matriz L puede ser elegida de forma tal que la matriz A − LC tenga autovalores con parte real negativa, y
así el error de estimación converja a cero.
A ↔ AH B ↔ CH K ↔ LH Wr ↔ WOH
Por lo tanto, este principio se puede plantear como: Sea el sistema S1 descrito por:
(
ẋ = Ax + Bu
y = Cx
50
7 STATE FEEDBACK
dx̂
= Ax̂ + Bu + L (y − C x̂)
dt
donde
−1
1 0 0 ··· 0
p 1 − a1 C a1 1 0 ··· 0
p 2 − a2 CA
L = WO−1 W̃O
..
→ WO = ..
→ W̃O = a2 a1 1 ··· 0
. . .. .. .. ..
. . . .
p n − an CAn−1
an−1 an−2 an−3 ··· 1
El error del observador x̃ = x − x̂ es gobernado por una ecuación diferencial cuyo polinomio característico es:
u = −Kx + kr r
Supóngase también que no se disponen de todos los estados, y por ende es necesaria la utilización de un observador
para estimar aquellos estados no disponibles. Por lo tanto, la realimentación será de la forma:
u = −Kx̂ + kr r
donde x̂ es el estado estimado mediante el observador. Como se mencionó anteriormente, un observador muy útil, ya
que también usa información de la salida, es
dx̂
= Ax̂ + Bu + L (y − C x̂)
dt
Para analizar el sistema a lazo cerrado, es conveniente analizar el error del observador, dado por:
e = x − x̂
ẋ =Ax + B (−Kx̂ + kr r)
ẋ =Ax − BKx̂ + Bkr r
ẋ =Ax − BK (x − e) + Bkr r
ẋ = (A − BK) x + BKe + Bkr r
51
8 DISEÑO EN EL DOMINIO DE LA FRECUENCIA
Se puede ver que este polinomio característico es el producto de dos polinomios: el polinomio característico del sistema
de control, y el polinomio característico debido al error del observador.
Mediante este desarrollo, es posible encontrar la ganancia K del controlador como si todas las variables de estado
fueran conocidas (es decir sin el observador), ya que K únicamente depende de A y de B, mientras que L depende
únicamente de A y de C. Por lo tanto, las ganancias tanto del controlador como del observador pueden ser halladas
utilizando las herramientas vistas en las demás secciones:
p 1 − a1
p 2 − a2
K = p1 − a1 · · · pn − an T L = WO−1 W̃O
..
.
p n − an
El hecho de que se pueda separar un sistema de control con estados estimados, en la resolución de un sistema de
control y un observador por separado, se lo conoce como el principio de separación.
En la figura 7.1 se tiene el diagrama en bloques del sistema descrito.
52
8 DISEÑO EN EL DOMINIO DE LA FRECUENCIA
Figura 8.1: Planta realimentada mediante un sistema de control. Las señales de entrada son la señal de
referencia r, la señal de perturbación de la carga d y el ruido de medición n. La salida del proceso es η
y la señal de control es u.
A partir del sistema de la figura 8.1, se puede definir un conjunto de funciones de transferencia, conocido como el
grupo de las seis, el cual consiste en:
P CF PC P
TF = T = PS =
1 + PC 1 + PC 1 + PC
→ Gang of six
CF C 1
CF S = CS = S=
1 + PC 1 + PC 1 + PC
Las funciones de transferencia de la primer columna dan la respuesta de la salida del proceso y la señal de control a
la entrada de referencia. La segunda columna da la respuesta de la variable de control a las perturbaciones en la carga
y el ruido. La tercer columna da la respuesta de la salida del proceso a las perturbaciones en la carga y el ruido. Por lo
tanto, se requieren cuatro funciones de transferencia para conocer como responde el sistema al ruido y las perturbaciones,
mientras que se requieren dos funciones de transferencia para conocer la respuesta a las señales de referencia.
Para el caso especial en que F = 1, se está en presencia de un sistema con realimentación de error puro, dado que la
realimentación es debida únicamente al error. En estos casos, el sistema puede ser caracterizado únicamente con cuatro
funciones de transferencia, conocidas como the Gang of four:
1 P
S= Sensibilidad PS = Sensibilidad a la carga
1 + PC 1 + PC → Gang of four
PC C
T = Sensibilidad complementaria CS = Sensibilidad al ruido
1 + PC 1 + PC
En algunos casos, la función de sensibilidad de la carga es también conocida como la función de sensibilidad de la
entrada, y la función de sensibilidad al ruido es conocida como función de sensibilidad de salida.
53
8 DISEÑO EN EL DOMINIO DE LA FRECUENCIA
Según Bode, para sistemas de fase mínima, es posible obtener la fase de un sistema únicamente a partir de su diagrama
de magnitud:
π ∞ d log |Pmp (jw)| π d log |Pmp (jw)|
ˆ
arg (Pmp (jw0 )) = f (w) d log (w) ≈
2 0 d log (w) 2 d log (w)
donde f (w) = π22 log w−w
w+w0
0
es el factor de ponderación. Por lo tanto, se puede ver que la curva de fase se obtiene
a partir de un promedio ponderado de la derivada de curva de magnitud. De esta forma, si la curva de magnitud tiene
pendiente n, entonces la fase es constante y de valor nπ 2 .
De acuerdo con esto, se tiene entonces:
π
arg (C (jwgc )) + arg (Pmp (jwgc )) ≈ ngc
2
Por lo tanto, se tiene que:
arg (C (jwgc )) + arg (Pmp (jwgc )) + arg (Pap (jwgc )) ≥ −π + φm
arg (C (jwgc )) + arg (Pmp (jwgc )) ≥ −π + φm − arg (Pap (jwgc ))
donde finalmente:
π
− arg (Pap (jwgc )) ≤ π − φm + ngc = φℓ
2
Esta condición es conocida como la desigualdad de la frecuencia de cruce de la ganancia, y muestra que la frecuencia de
cruce de la ganancia debe ser elegida de forma tal que el atraso de fase (phase lag) del sistema de fase no mínima no sea
demasiado grande.
54
8 DISEÑO EN EL DOMINIO DE LA FRECUENCIA
Este teorema muestra que el diseño de sistemas de control puede ser visto como una redistribución de atenuación de
perturbaciones sobre distintas frecuencias. En particular, se puede ver que si la sensibilidad es pequeña para un cierto
rango de frecuencias, necesariamente debe incrementarse para otro rango de frecuencias, de forma tal que su integral
permanezca constante.
En este teorema, se puede ver también que si el sistema no presenta polos en el semiplano derecho, entonces se cumple
que: ˆ ∞ ˆ ∞
1
log |S (jw)| dw = log dw = 0
0 0 |1 + L (jw)|
55