Está en la página 1de 726

CONTROL AUTOMÁTICO

El Centro de Innovación y Desarrollo Tecnológico en Cómputo del Instituto Politécnico Nacional,


presenta un libro cuyo objetivo es el de contribuir hacia la reducción de la brecha existente entre la
teoría y la práctica en la enseñanza del Control Automático. Por esta razón, aunque el contenido del
CONTROL AUTOMÁTICO
libro es de nivel Licenciatura puede ser de gran utilidad incluso para aquellas personas involucradas Teoría de diseño, construcción de prototipos,
en el proceso enseñanza-aprendizaje del Control Automático en el nivel de Posgrado.
modelado, identificación y pruebas experimentales
La característica principal de esta obra es que se describe de manera detallada cómo diseñar, construir
y probar experimentalmente varios sistemas de control. Para ello, primero se describe la tarea que
debe realizar el sistema de control bajo estudio y se obtiene su modelo matemático. Luego, se explica
de manera detallada cómo construir el prototipo experimental y cómo estimar los valores numéricos
de los parámetros del modelo obtenido previamente (identificación experimental del modelo).
Entonces se diseña el controlador correspondiente utilizando la teoría presentada en los primeros
capítulos de la obra. Finalmente, se muestra cómo construir el controlador diseñado previamente
utilizando electrónica analógica o digital y se presentan los resultados obtenidos experimentalmente.

El libro es especialmente útil para estudiantes y profesores en las carreras de Ingeniería Eléctrica,
Electrónica, Mecánica, Mecatrónica e incluso Robótica.
Victor Manuel Hernández Guzmán
Ramón Silva Ortigoza
Roberto Valentín Carrillo Serrano

Victor Manuel Hernández Guzmán

Roberto Valentín Carrillo Serrano


Ramón Silva Ortigoza

Instituto Politécnico Nacional

COLECCIÓN CIDETEC
Roberto Valentín Carrillo Serrano. Nació
Victor Manuel Hernández Guzmán. Nació
en Querétaro, Qro., México en 1976. Recibió
en Querétaro, Qro., México. Recibió el título
el título de Ingeniero en Instrumentación y
de Ingeniero Industrial en Eléctrica por parte
Control de Procesos por la Universidad
del Instituto Tecnológico de Querétaro en
Autónoma de Querétaro, donde también
1988, el grado de Maestro en Ciencias en
obtuvo los grados de Maestro en Ciencias en
Ingeniería Eléctrica (Control) por parte del
Instrumentación y Control Automático, y de
Instituto Tecnológico de la Laguna, en
Doctor en Ingeniería en 2000, 2008 y 2011
Torreón, Coah., en 1991 y el grado de Doctor
respectivamente. Trabajó en Kellogg de
en Ciencias en Ingeniería Eléctrica
México de 1999 a 2006. Las áreas de interés del
(Mecatrónica) por parte del CINVESTAV-
Dr. Carrillo Serrano son los robots
IPN, en México, D.F., en 2003. Actualmente
manipuladores, control de máquinas eléctricas
es Profesor en los programas de Licenciatura y
y control de sistemas mecatrónicos.
Maestría en Instrumentación y Control de la
Actualmente es Profesor en el programa de
Universidad Autónoma de Querétaro. Su
Licenciatura en Ingeniería en Automatización
trabajo de investigación trata sobre el control
y de la Maestría en Instrumentación y Control
de robots manipuladores y sistemas electro-
Automático de la Universidad Autónoma de
mecánicos. Tiene particular interés en la
Querétaro, además de ser miembro del
construcción de prototipos didácticos para la
Sistema Nacional de Investigadores, México.
enseñanza de técnicas de control clásicas y
En cuanto a publicaciones se refiere, estas se
modernas (no lineales).
encuentran en estándares internacionales que
pertenecen a la base de datos Journal Citation
Reports (JCR) e ISI-Thomson.

Ramón Silva Ortigoza. Recibió el título de


Licenciado en Electrónica por la Benemérita
Universidad Autónoma de Puebla en 1999, y
los grados de Maestro y Doctor en Ciencias en
Ingeniería Eléctrica (Opción Mecatrónica)
por el CINVESTAV-IPN, en 2002 y 2006,
respectivamente. Actualmente, es
Investigador del Departamento de Posgrado
del Área de Mecatrónica en el CIDETEC del
Instituto Politécnico Nacional, y miembro del
Sistema Nacional de Investigadores. Es
coautor del libro Control Design Techniques
in Power Electronics Devices (Springer-
Verlag, London, 2006), y coeditor del libro
Mecatrónica (Colección CIDETEC,
México, 2010). Se ha desempeñado como
jurado en el Premio de Ingeniería de la
Ciudad de México y Premio a la
Investigación en el IPN , así como Evaluador
de Programas de Posgrado presentados en el
marco del PNPC de CONACYT . Sus áreas
de interés incluyen el control de sistemas
mecatrónicos, la robótica móvil y el control
aplicado a electrónica de potencia.
Victor Manuel Hernández Guzmán
Ramón Silva Ortigoza
Roberto Valentı́n Carrillo Serrano

CONTROL AUTOMÁTICO

Teorı́a de diseño, construcción de prototipos,


modelado, identificación y pruebas
experimentales

México, D.F. Enero 2013.


Control Automático
Teorı́a de diseño, construcción de prototipos,
modelado, identificación y pruebas experimentales

Autores:
Victor Manuel Hernández Guzmán
Ramón Silva Ortigoza
Roberto Valentı́n Carrillo Serrano

Primera Edición 2013


D.R. c 2013
Instituto Politécnico Nacional
Luis Enrique Erro s/n.
Unidad Profesional “Adolfo López Mateos”
Zacatenco, 07738, México, D.F.

CIDETEC
Av. Juan de Dios Bátiz S.N. esq. Miguel Othón de Mendizábal
Col. Nueva Industrial Vallejo
Del. Gustavo A. Madero C.P. 07700

ISBN: 978-607-414-362-1
Hecho en México / Made in Mexico
V

A mi esposa, padres y hermanos.


Victor.

Para mis maravillosos hijos, Rhomina y Joserhamón, y a mi madre.


Ramón.

A Dios, a mis padres, a mi esposa, a mis profesores y alumnos.


Roberto.
Prefacio

El Control Automático es una de las disciplinas que soporta de manera


importante el tecnológicamente avanzado modo de vida que conocemos hoy
en dı́a. Sus aplicaciones se encuentran en casi todas las actividades que el
ser humano realiza en el siglo XXI: desde el funcionamiento del telescopio
espacial Hubble y de numerosas naves espaciales hasta el refrigerador que se
encuentra en los hogares asegurando la conservación de los alimentos. Desde
los depósitos de agua residenciales hasta las grandes industrias que producen
todos los satisfactores de los seres humanos: automóviles, aviones, alimentos,
bebidas y medicinas, por mencionar algunos.
Aunque se sabe que las primeras aplicaciones del Control Automático apa-
recieron hace más de 2000 años, fue la Revolución Industrial la que detonó su
desarrollo como un conjunto de conocimientos cientı́ficos destinados a resol-
ver problemas tecnológicos. Desde entonces, el uso del Control Automático
ha sido fundamental para que las actividades productivas del ser humano se
hagan cada vez más eficaces incrementando la calidad y la repetitibilidad de
los productos.
Por esta razón, los cursos sobre Control Automático se han hecho comunes
en las carreras de Ingenierı́a Eléctrica, Electrónica, Mecánica, Quı́mica y, más
recientemente, Mecatrónica y Robótica. Sin embargo, el hecho de que las técni-
cas de Control Automático convencionales estén soportadas por herramientas
matemáticas ha planteado tradicionalmente una dificultad en la enseñanza de
esta disciplina: para aprender a diseñar sistemas de control primero se debe
tener un buen conocimiento de cómo se resuelven las ecuaciones diferencia-
les lineales de coeficientes constantes mediante el uso de la transformada de
Laplace. Este hecho plantea un importante obstáculo dado que la solución
de ecuaciones diferenciales es algo que normalmente es complicado para la
mayorı́a de los estudiantes de Licenciatura. El problema se complica más aún
porque en Control Automático lo más importante de resolver una ecuación di-
ferencial es saber interpretar el resultado cuando la mayorı́a de los estudiantes
de Licenciatura se quedan perdidos en cómo resolver la ecuación diferencial.
VIII Prefacio

Otra dificultad en la enseñanza del Control Automático es cómo mostrar


la manera de relacionar los resultados matemáticos con los aspectos prácticos
de un sistema de control: ¿Cómo construir prácticamente un controlador que
está expresado en términos de la variable de Laplace (función de transferen-
cia)? ¿Cómo se construye un controlador usando electrónica digital o usando
electrónica analógica? ¿Cómo tomar en cuenta las ganancias de los sensores y
de los amplificadores de potencia? ¿Cómo determinar esta ganancia en un am-
plificador de potencia basado en modulación por ancho de pulso? ¿Qué efectos
tienen estas ganancias en un sistema de control?
La manera en que tradicionalmente se ha resuelto el problema de la prácti-
ca descrito en el párrafo anterior ha sido la compra de prototipos didácticos
comerciales. Sin embargo, esto tiene dos desventajas: 1) estos equipos nor-
malmente son excesivamente caros pues son construidos en el extranjero y 2)
muchos de los aspectos involucrados en el funcionamiento de un sistema de
control permanecen “invisibles” para el estudiante; esto es debido a que estos
equipos están diseñados pensando que el estudiante de Control Automático no
tiene porqué saber cómo se resuelven los detalles prácticos relacionados con la
electrónica y la programación, por ejemplo, de los diferentes componentes de
un sistema de control. Este es el caso de ¿Cómo construir un amplificador de
potencia? ¿Cómo diseñar y construir un controlador basado en amplificado-
res operacionales o un controlador basado en un microcontrolador? ¿Existen
alternativas a la práctica común de comprar sensores en el extranjero?
La presente obra pone a la disposición de los estudiantes y de los profeso-
res de nivel Licenciatura un material con el cual se pretende ayudar a resolver
algunas de las dificultades arriba mencionadas. Con el fin de facilitar el apren-
dizaje de los aspectos teóricos se incluye un capı́tulo dedicado exclusivamente
a la solución de ecuaciones diferenciales lineales y de coeficientes constantes
usando la transformada de Laplace. Si bien ese capı́tulo puede ser visto como
un curso de ecuaciones diferenciales, la principal diferencia respecto del curso
de matemáticas que sobre este tema se lleva en el tronco común de Licencia-
tura (Ingenierı́a) es que en nuestro libro se hace énfasis en la interpretación
de la solución de una ecuación diferencial. Además se resalta el efecto que
tienen los parámetros de una ecuación diferencial en la forma gráfica de la
solución. Debemos subrayar que la experiencia de los autores es que los libros
existentes sobre Control Automático (incluso los más importantes) se limitan
a presentar un breve prontuario de soluciones de ecuaciones diferenciales y
no consiguen que el estudiante razone acerca de lo que está haciendo. Para
salvar este problema, en el presente libro se recurre a ejemplificar cada tipo
de ecuación diferencial con una situación práctica que cualquier estudiante de
Licenciatura ha observado en algún momento de su vida. Es decir, se recurre
a la experiencia cotidiana del estudiante para que comprenda lo que significan
los resultados matemáticos.
La problemática relacionada con los aspectos prácticos de los sistemas de
control es resuelta mediante la aplicación a varios sistemas de control experi-
mentales. En cada uno de estos ejemplos se procede de igual manera. Primero
Prefacio IX

se describe la tarea que ejecuta el sistema de control bajo estudio y luego


se explica al lector cómo construir cada uno de los componentes de dicho
sistema de control. Posteriormente se muestra cómo obtener el modelo ma-
temático correspondiente para después explicar a detalle cómo obtener, de
manera experimental, el valor numérico de cada uno de los parámetros del
modelo. Entonces se usan las técnicas de control presentadas previamente en
los primeros capı́tulos del libro para diseñar (matemáticamente) el controlador
correspondiente. Se presenta también la manera de construir el controlador
usando electrónica analógica o digital y finalmente se presentan los resultados
experimentales obtenidos al controlar el prototipo que se ha construido.
A continuación se explica cómo está organizada la presente obra. En el
capı́tulo 1 se presenta una panorámica general del Control Automático con el
fin de que el lector entienda a grandes rasgos cuál es el objetivo de diseñar
sistemas de control. Esto se realiza utilizando un ejemplo que cuyo funciona-
miento es bien conocido por la mayorı́a de las personas: el control de un cañón
antiaéreo. También se presenta una breve historia del Control Automático y se
relaciona con el contenido de la obra para que el lector identifique cuales son
las razones por las que cada herramienta de control ha sido desarrollada. En el
capı́tulo 2 se aborda el problema de obtener el modelo matemático de sistemas
fı́sicos comunes en Ingenierı́a Eléctrica, Electrónica, Mecánica y Mecatrónica.
Una razón importante de incluir este tema es que el lector se dé cuenta de que
los sistemas de control están descritos por ecuaciones diferenciales lineales y
de coeficientes constantes. Esto motiva el estudio de la solución de las ecuacio-
nes diferenciales en el capı́tulo 3, pues esto es importante para entender cómo
responde un sistema de control y qué hay que modificar en él para conseguir
la respuesta deseada.
En los capı́tulos 4 al 7 se presentan las herramientas utilizadas en el diseño
de sistemas de control clásico y moderno: criterios de estabilidad y error en
estado estacionario (capı́tulo 4), la técnica del lugar de las raı́ces (capı́tulo 5),
la técnica de la respuesta en frecuencia (capı́tulo 6) y la técnica de las variables
de estado (capı́tulo 7). La exposición de estos temas está dirigida hacia su
aplicación en los ejemplos prácticos presentados en los últimos capı́tulos de
la obra. De este modo, muchos de los ejemplos presentados en los primeros
capı́tulos tratan sobre el diseño de controladores que después serán construidos
y probados experimentalmente en los últimos capı́tulos.
La estructura de los capı́tulos 8 al 14 es la misma, pues tienen el mismo
objetivo: se presenta la aplicación de las técnicas de control desarrolladas
en los capı́tulos 4 al 7 al análisis y diseño de sistemas de control prácticos.
Los controladores correspondientes son construidos al igual que el sistema
de control completo, utilizando materiales de bajo costo y que son fáciles
de conseguir por un estudiante de licenciatura. Finalmente, se presentan los
resultados obtenidos experimentalmente al probar los sistemas de control en
la práctica.
En el capı́tulo 8 se estudian y diseñan varios circuitos electrónicos realimen-
tados, entre ellos algunos circuitos osciladores con forma de onda sinusoidal
X Prefacio

basados en amplificadores operacionales (audiofrecuencia) y en transistores


(radiofrecuencia). En los capı́tulos 9 y 10 se controla la velocidad y la posi-
ción, respectivamente, de un motor de corriente directa con escobillas e imanes
permanentes. Un sistema de levitación magnética es controlado en el capı́tulo
11 mientras que en el capı́tulo 12 se controla un mecanismo muy popular en
Control Automático y que es conocido como Ball and Beam. Finalmente, en
los capı́tulos 13 y 14 se presentan dos mecanismos que incluyen péndulos: el
péndulo de Furuta y el péndulo con rueda inercial. Por último, se debe decir
que la importancia de todos estos prototipos experimentales es reconocida en
los cursos de control en todo el mundo y por eso han sido seleccionados como
bancos de prueba en la presente obra.
El primer autor reconoce y agradece el apoyo de sus dos coautores. Su
colaboración ha sido de gran valor no sólo en la elaboración de la presente obra
sino, además, en diversas actividades de investigación que han realizado desde
que eran estudiantes de Doctorado (con el segundo autor) y desde que el tercer
autor realizó sus estudios de Maestrı́a y Doctorado, los cuales el primer autor
tuvo la fortuna de dirigir. Un reconocimiento y un agradecimiento especial
para los Drs. Hebertt Sira Ramı́rez (Director de tesis) y Gerardo Silva Navarro,
ambos investigadores del CINVESTAV-IPN quienes fueron fundamentales en
los estudios de Doctorado del primer autor. También se reconoce y agradece
al Dr. Vı́ctor Santibáñez del Instituto Tecnológico de la Laguna con quien
el primer autor ha mantenido una importante colaboración cientı́fica desde
2004 en el área de control de robots manipuladores. Un reconocimiento a
la importante colaboración cientı́fica con los Drs. Ricardo Campa (Instituto
Tecnológico de la Laguna) y Arturo Zavala Rı́o (IPICYT).
Las ideas que han motivado este trabajo tomaron forma durante los cursos
que sobre Control Automático ha impartido el primer autor a nivel Licencia-
tura y Maestrı́a en la Facultad de Ingenierı́a de la Universidad Autónoma de
Querétaro, Institución a la que está adscrito desde 1995. Se agradece a es-
ta Institución el apoyo recibido durante todos estos años. Un agradecimiento
al Sistema Nacional de Investigadores por el apoyo económico recibido des-
de 2005 y al CIDETEC del Instituto Politécnico Nacional por facilitar los
medios editoriales requeridos para la impresión de este libro. Una mención es-
pecial para mi esposa Judith de quien siempre he recibido el apoyo necesario
para realizar no sólo esta obra sino todo el trabajo de investigación que he
desarrollado desde que decidı́ hacer mis estudios de Doctorado.
El segundo autor reconoce y agradece la invitación del primer autor para
participar en la elaboración de este y otros proyectos ambiciosos, académicos
y de investigación. Su apoyo ha sido fundamental en el desarrollo profesio-
nal del segundo autor y en la formación conjunta de estudiantes de nivel
maestrı́a. El segundo autor agradece de forma muy especial a los Doctores
Gilberto Silva Ortigoza y Hebertt Sira Ramı́rez, investigadores de la BUAP
y del CINVESTAV-IPN, por ser sus mentores; el primero a lo largo de toda
su trayectoria y el segundo en sus estudios de formación de posgrado. Tam-
bién, se reconoce y agradece la importante colaboración académica con las
Prefacio XI

Doctoras Magdalena Marciano Melchor (CIDETEC-IPN), Griselda Saldaña


González (Universidad Tecnológica de Puebla) y Mariana Marcelino Aran-
da (UPIICSA-IPN). El segundo autor agradece el apoyo recibido por parte
del CIDETEC del Instituto Politécnico Nacional, Centro de Investigación al
que está adscrito desde 2006, el soporte económico recibido de la SIP y de
los programas EDI y COFAA del Instituto Politécnico Nacional, ası́ como del
Sistema Nacional de Investigadores. Mención especial merecen mis hijos, Rho-
mina y Joserhamón, por su apoyo moral y ser la inspiración que me permite
esforzarme cada dı́a para dar siempre lo mejor.
El tercer autor agradece primeramente al Dr. V. M. Hernández Guzmán la
atenta invitación a participar en la realización de la presente obra. Al Consejo
Nacional de Ciencia y Tecnologı́a que me becó para mis estudios de Maestrı́a y
Doctorado (perı́odo de realización de la presente obra). A mi segunda casa, la
Universidad Autónoma de Querétaro, espacio para la docencia, investigación
y difusión de la cultura que me ha enseñado a ser un mejor ser humano,
manteniéndome dı́a con dı́a en constante superación en todos los sentidos. A
Dios, a mis padres Valentı́n y Alicia, y a mi esposa Lizbeth, por el apoyo
recibido en todo momento.

V. M. Hernández Guzmán Querétaro, Qro., FI-UAQ.


R. Silva Ortigoza México, D.F., Instituto Politécnico Nacional.
R. V. Carrillo Serrano Querétaro, Qro., FI-UAQ.

Enero de 2013.
Índice general

1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Sistema de control de un cañón antiaéreo . . . . . . . . . . . . . . . . . . . 2
1.2. Historia del Control Automático . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3. Prototipos didácticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2. Modelado matemático de sistemas fı́sicos . . . . . . . . . . . . . . . . . . 15


2.1. Energı́a y variables generalizadas del sistema . . . . . . . . . . . . . . . . 16
2.2. Almacenadores de energı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1. Sistemas mecánicos traslacionales . . . . . . . . . . . . . . . . . . . . 20
2.2.2. Sistemas mecánicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.3. Sistemas eléctricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3. Disipadores de energı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.1. Sistemas mecánicos traslacionales . . . . . . . . . . . . . . . . . . . . 27
2.3.2. Sistemas mecánicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.3. Sistemas eléctricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4. Fuentes de energı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.1. Sistemas mecánicos traslacionales . . . . . . . . . . . . . . . . . . . . 31
2.4.2. Sistemas mecánicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4.3. Sistemas eléctricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5. Convertidores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.1. Transformadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.2. Adaptadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.7. Caso de estudio. Un convertidor electrónico de potencia de
CD a CD tipo resonante serie de alta frecuencia . . . . . . . . . . . . . 83
2.8. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.9. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
XIV Índice general

2.10. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3. Base matemática: ecuaciones diferenciales . . . . . . . . . . . . . . . . . 97


3.1. Ecuación diferencial de primer orden . . . . . . . . . . . . . . . . . . . . . . . 99
3.2. Un integrador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.3. Ecuación diferencial de segundo orden . . . . . . . . . . . . . . . . . . . . . . 112
3.4. Raı́ces reales diferentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
3.5. Raı́ces reales repetidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
3.6. Raı́ces complejas conjugadas diferentes . . . . . . . . . . . . . . . . . . . . . 134
3.7. Raı́ces complejas conjugadas repetidas . . . . . . . . . . . . . . . . . . . . . 140
3.8. Una ecuación diferencial general . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
3.9. Polos y ceros en sistemas de orden superior . . . . . . . . . . . . . . . . . 150
3.9.1. Cancelación polo-cero y modelos reducidos . . . . . . . . . . . 150
3.9.2. Polos dominantes y modelos reducidos . . . . . . . . . . . . . . . 152
3.10. El principio de superposición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
3.11. Caso de estudio. Un convertidor electrónico de potencia de
CD a CD tipo resonante serie de alta frecuencia . . . . . . . . . . . . . 160
3.12. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
3.13. Preguntas de Repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
3.14. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

4. Criterios de estabilidad y error en estado estacionario . . . . . 177


4.1. Diagramas de bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.2. Regla de los signos para determinar la ubicación de las raı́ces
de un polinomio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
4.2.1. Polinomios de segundo grado . . . . . . . . . . . . . . . . . . . . . . . 187
4.2.2. Polinomios de primer grado . . . . . . . . . . . . . . . . . . . . . . . . . 190
4.2.3. Polinomios de grado 3 o mayor . . . . . . . . . . . . . . . . . . . . . . 190
4.3. Criterio de estabilidad de Routh . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
4.4. Error en estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
4.4.1. Referencia tipo escalón . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
4.4.2. Referencia tipo rampa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
4.4.3. Referencia tipo parábola . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
4.5. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
4.6. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
4.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
Índice general XV

5. Diseño usando la respuesta en el tiempo . . . . . . . . . . . . . . . . . . . 221


5.1. Diseño con el lugar de las raı́ces . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
5.1.1. Reglas para construir el lugar de las raı́ces. . . . . . . . . . . . 225
5.2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
5.2.1. Control proporcional de posición . . . . . . . . . . . . . . . . . . . . 232
5.2.2. Control proporcional-derivativo (PD) de posición . . . . . . 235
5.2.3. Control de posición usando un compensador de adelanto238
5.2.4. Control proporcional-integral (PI) de velocidad . . . . . . . . 241
5.2.5. Control proporcional-integral-derivativo (PID) de
posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
5.2.6. Asignación de los polos de lazo cerrado deseados . . . . . . 257
5.2.7. Control proporcional-integral-derivativo (PID) de un
sistema de levitación magnética . . . . . . . . . . . . . . . . . . . . . 264
5.2.8. Control de un sistema ball and beam . . . . . . . . . . . . . . . . 268
5.3. Caso de estudio. Notas adicionales sobre el control PID de
posición de un motor de CD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
5.4. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
5.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
5.6. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289

6. Diseño usando la respuesta en frecuencia . . . . . . . . . . . . . . . . . . 291


6.1. Un circuito RC de corriente alterna . . . . . . . . . . . . . . . . . . . . . . . . 292
6.1.1. Representaciones gráficas comunes . . . . . . . . . . . . . . . . . . . 294
6.1.2. Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
6.1.3. Componentes de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . 301
6.1.4. Relación entre la respuesta en la frecuencia y en la
respuesta en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
6.2. Sistemas arbitrarios de orden n . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
6.3. Gráficas polares y de Bode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
6.4. Gráficas de respuesta en frecuencia. Ejemplos . . . . . . . . . . . . . . . 319
6.4.1. Ejemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
6.4.2. Ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
6.4.3. Ejemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
6.5. Criterio de estabilidad de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . 325
6.5.1. Recorridos cerrados alrededor de polos y ceros . . . . . . . . 326
6.5.2. Trayectoria de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
6.5.3. Polos y ceros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
6.5.4. Criterio de Nyquist. Caso especial . . . . . . . . . . . . . . . . . . . 331
6.5.5. Criterio de Nyquist. Caso general . . . . . . . . . . . . . . . . . . . . 332
6.6. Márgenes de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
6.7. Relación entre las caracterı́sticas de respuesta en la frecuencia
y en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
6.7.1. Respuesta en lazo abierto . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
XVI Índice general

6.7.2. Respuesta en lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . 337


6.8. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
6.8.1. Ejemplo de análisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
6.8.2. Un sistema ball and beam . . . . . . . . . . . . . . . . . . . . . . . . . . 344
6.8.3. Control PD de posición de un motor de CD . . . . . . . . . . . 355
6.8.4. Rediseño del control PD de posición de un motor de CD363
6.8.5. Control PID de posición de un motor de CD . . . . . . . . . . 368
6.9. Caso de estudio. Control PID de un sistema de levitación
magnética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
6.10. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
6.11. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
6.12. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391

7. La técnica de las variables de estado . . . . . . . . . . . . . . . . . . . . . . . 393


7.1. Representación en variables de estado . . . . . . . . . . . . . . . . . . . . . . 394
7.2. Linealización aproximada de ecuaciones de estado no lineales . . 399
7.2.1. Procedimiento para ecuaciones de primer orden sin
entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
7.2.2. Procedimiento general para ecuaciones de orden
arbitrario y número de entradas arbitrario . . . . . . . . . . . . 402
7.3. Algunos resultados del álgebra lineal . . . . . . . . . . . . . . . . . . . . . . . 407
7.4. Solución de una ecuación dinámica, lineal e invariante en el
tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
7.5. Estabilidad de una ecuación dinámica . . . . . . . . . . . . . . . . . . . . . . 412
7.6. Controlabilidad y observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 413
7.6.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
7.6.2. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
7.7. Función de transferencia de una ecuación dinámica . . . . . . . . . . 418
7.8. Una de las ecuaciones dinámicas que corresponden a una
función de transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
7.9. Ecuaciones dinámicas equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . 425
7.10. Control por realimentación del estado . . . . . . . . . . . . . . . . . . . . . . 428
7.11. Observadores de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
7.12. El principio de separación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
7.13. Caso de estudio. El péndulo con rueda inercial . . . . . . . . . . . . . . 438
7.13.1. Obtención de la forma en (7.75) . . . . . . . . . . . . . . . . . . . . . 438
7.13.2. Control por realimentación del estado . . . . . . . . . . . . . . . . 439
7.14. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440
7.15. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
7.16. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
Índice general XVII

8. Circuitos electrónicos realimentados . . . . . . . . . . . . . . . . . . . . . . . 447


8.1. Circuitos electrónicos para reducir no linealidades . . . . . . . . . . . 448
8.1.1. Reducción de la distorsión en amplificadores . . . . . . . . . . 449
8.1.2. Reducción de la zona muerta en amplificadores. . . . . . . . 451
8.2. Construcción analógica de controladores . . . . . . . . . . . . . . . . . . . . 456
8.3. Diseño de osciladores con forma de onda sinusoidal . . . . . . . . . . 458
8.3.1. Diseño basado en un amplificador operacional. Puente
de Wien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
8.3.2. Diseño basado en un amplificador operacional. Red
RC de defasaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 468
8.3.3. Diseño basado en un transistor . . . . . . . . . . . . . . . . . . . . . . 472
8.4. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494
8.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497

9. Control de velocidad de un motor de CD . . . . . . . . . . . . . . . . . . 499


9.1. Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500
9.2. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
9.3. Control de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
9.4. Identificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507
9.5. Control de velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509
9.5.1. Un controlador PI modificado . . . . . . . . . . . . . . . . . . . . . . . 509
9.5.2. Un controlador con dos grados de libertad . . . . . . . . . . . . 512
9.6. Prototipo experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515
9.6.1. Control de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 518
9.6.2. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 518
9.7. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519
9.8. Cálculo numérico de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522
9.9. Programación del microcontrolador PIC16F877A . . . . . . . . . . . . 523
9.10. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
9.11. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529

10. Control de posición de un motor de CD . . . . . . . . . . . . . . . . . . . 531


10.1. Identificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532
10.2. Control sin perturbaciones externas (Tp = 0) . . . . . . . . . . . . . . . . 535
10.2.1. Control proporcional con realimentación de velocidad . . 535
10.2.2. Control con un compensador de adelanto . . . . . . . . . . . . . 537
10.3. Control bajo el efecto de perturbaciones externas . . . . . . . . . . . . 540
10.3.1. Un controlador PID modificado . . . . . . . . . . . . . . . . . . . . . 541
10.3.2. Un controlador con dos grados de libertad . . . . . . . . . . . . 544
10.3.3. Un controlador PID clásico . . . . . . . . . . . . . . . . . . . . . . . . . 549
10.4. Seguimiento de trayectorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
XVIII Índice general

10.5. Cálculo numérico de los algoritmos de control . . . . . . . . . . . . . . . 555


10.6. Construcción del sistema de control . . . . . . . . . . . . . . . . . . . . . . . . 556
10.7. Programación del microcontrolador PIC16F877A . . . . . . . . . . . . 559
10.8. Control basado en una computadora personal . . . . . . . . . . . . . . . 562
10.9. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
10.10.Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573

11. Control de un sistema de levitación magnética . . . . . . . . . . . . . 575


11.1. Modelo matemático no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 578
11.2. Modelo lineal aproximado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581
11.2.1. Obtención de un modelo en variables de estado . . . . . . . . 581
11.2.2. Aproximación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583
11.3. Construcción del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.1. Esfera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.2. Electroimán . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.3. Sensor de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.4. Controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586
11.3.5. Lazo de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587
11.3.6. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 587
11.4. Identificación experimental de los parámetros del modelo . . . . . 587
11.4.1. Resistencia del electroimán, R . . . . . . . . . . . . . . . . . . . . . . 587
11.4.2. Inductancia del eletroimán, L(y) . . . . . . . . . . . . . . . . . . . . 587
11.4.3. Ganancia del sensor de posición, As . . . . . . . . . . . . . . . . . 588
11.4.4. Masa de la esfera, m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 589
11.5. Diseño del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590
11.5.1. Un controlador proporcional . . . . . . . . . . . . . . . . . . . . . . . . 593
11.5.2. Un controlador proporcional-integral-derivativo (PID) . . 594
11.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595
11.7. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599
11.8. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 601

12. Control de un sistema Ball and Beam . . . . . . . . . . . . . . . . . . . . . 603


12.1. Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605
12.2. Construcción del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 608
12.2.1. Medición de la posición x del balı́n . . . . . . . . . . . . . . . . . . 609
12.2.2. Medición de la inclinación θ de la varilla . . . . . . . . . . . . . 612
12.2.3. Interfaces y amplificador de potencia . . . . . . . . . . . . . . . . . 612
12.3. Identificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614
12.3.1. Sistema de medición de la inclinación θ de la varilla . . . 614
12.3.2. Sistema de medición de la posición x del balı́n . . . . . . . . 614
12.3.3. Subsistema motor-varilla . . . . . . . . . . . . . . . . . . . . . . . . . . . 614
Índice general XIX

12.3.4. Dinámica del balı́n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615


12.4. Diseño del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 617
12.5. Construcción del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 620
12.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 621
12.7. Control basado en el microcontrolador
PIC16F877A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 630
12.7.1. Construcción del sistema de control . . . . . . . . . . . . . . . . . . 630
12.7.2. Diseño del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633
12.7.3. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . 633
12.7.4. Programa utilizado en el microcontrolador PIC16F877A 635
12.8. Un sistema de medición mejorado para la posición del balı́n . . . 639
12.9. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641
12.10.Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643

13. Control de un péndulo de Furuta . . . . . . . . . . . . . . . . . . . . . . . . . . 645


13.1. Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647
13.2. Modelo lineal aproximado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650
13.3. Construcción del péndulo de Furuta e indentificación de sus
parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653
13.4. Diseño del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656
13.5. Construcción del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 657
13.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661
13.7. Resumen del capı́tulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665
13.8. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667

14. Control de un péndulo con rueda inercial . . . . . . . . . . . . . . . . . . 669


14.1. Péndulo con rueda inercial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 670
14.2. Modelo matemático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672
14.3. Controlador no lineal para levantar el péndulo . . . . . . . . . . . . . . 674
14.4. Controlador para atrapar el péndulo . . . . . . . . . . . . . . . . . . . . . . . 678
14.5. Construcción del péndulo con rueda inercial e identificación
de sus parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 680
14.6. Construcción del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687
14.7. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 691
14.8. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699
14.9. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701

Índice alfabético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703


1
Introducción

Las aplicaciones del control automático en la actualidad son muy extensas,


variadas e importantes. Quizá una de las más populares es la del control de
robots manipuladores en la industria de manufactura. Desde la lı́neas de en-
samble de automóviles hasta las celdas robotizadas de soldadura. Las razones
principales para este éxito es la alta calidad del trabajo, el ahorro de tiempo
y la reducción del costo de producción.
2 1 Introducción

Objetivos del capı́tulo

Comprender de manera intuitiva los conceptos básicos de realimentación


y control en lazo cerrado, ası́ como los objetivos de un sistema de control.
Conocer la historia del Control Automático para comprender por qué se
desarrollaron este conjunto de herramientas de diseño.
Relacionar los capı́tulos de la presente obra con los hechos históricos que
motivaron los conocimientos descritos en cada capı́tulo.
Con el fin de explicar de qué se trata el Control Automático (o simplemente
control) y cuál es su propósito, a continuación se describe cómo funciona el
sistema de control del direccionamiento de un cañón antiaéreo. Las razones
de haber elegido este ejemplo son las siguientes. i) Se trata de un sistema
cuyo objetivo y funcionamiento básico pueden ser entendidos fácilmente por la
mayorı́a de las personas debido a la gran cantidad de pelı́culas, video-juegos,
programas de televisión, etc., que de alguna manera u otra muestran para
qué sirve este sistema de control. ii) Es un problema históricamente muy
importante pues motivó el desarrollo de gran parte de las ideas y técnicas
básicas del Control Automático durante la Segunda Guerra Mundial. Este
ejemplo también será utilizado para que el lector pueda relacionar el contenido
del presente libro con algunos de los aspectos de los sistemas de control.

1.1. Sistema de control de un cañón antiaéreo

En la figura 1.1 se muestra un esquema de este sistema de control. El cañón


antiaéreo debe apuntar hacia un avión y derribarlo. Para conseguir esto, el
cañón debe tener varios movimientos independientes que permitan ajustar su
orientación (θ) en el plano horizontal y su inclinación respecto de la horizontal.
Con el fin de simplificar la descripción del problema, en lo que sigue sólo se
considerará el control de la orientación en el plano horizontal θ.
Para ajustar la orientación θ del cañón se utiliza un motor eléctrico. Esto
se consigue acoplando mecánicamente el motor al cañón mediante un juego de
engranes. El conjunto motor-cañón funciona, a grandes rasgos, del siguiente
modo. Si se aplica un voltaje positivo al motor entonces el cañón recibe un
par en sentido antihorario, por lo que el cañón tiende a moverse en sentido
antihorario. Si se aplica un voltaje negativo al motor entonces el cañón recibe
un par en sentido horario, por lo que el cañón tiende a moverse en sentido
horario. Si el voltaje que se aplica al motor es igual a cero, entonces el par
aplicado sobre el cañón es igual a cero, por lo que el cañón tiende a detenerse.
La posición del avión se determina mediante el uso de un radar y se usa este
dato como el valor θd que se desea alcance la orientación del cañón θ. Es decir,
se desea conseguir que θ = θd lo más rápido posible para, una vez conseguido
1.1 Sistema de control de un cañón antiaéreo 3

can
à óon
radar antiaeóreo

òd ò
motor
v engranes
òd ò

controlador amplificador
de
potencia

Figura 1.1. Sistema de control de un cañón antiaéreo.

òd ò
òd

(a) θd > θ, v > 0, el cañón se (b) θd < θ, v < 0, el cañón se mueve en


mueve en sentido antihorario. sentido horario.

Figura 1.2. El cañón antiaéreo siempre debe moverse hacia la orientación deseada.

esto, disparar1 . De acuerdo al funcionamiento descrito en el párrafo anterior,


una manera sencilla de conseguir esto es aplicando al motor un voltaje v que
sea calculado de acuerdo a la siguiente regla:

v = kp (θd − θ) (1.1)

donde kp es una constante positiva. La operación presentada en (1.1) es rea-


lizada utilizando equipo electrónico de baja potencia (una computadora o un
microcontrolador, por ejemplo) y se debe utilizar un amplificador de potencia
para satisfacer los requerimientos del motor eléctrico. En este caso se está su-
poniendo que el amplificador de potencia ofrece una amplificación unitaria
1
Sin embargo, en una situación real, es necesario que la orientación del cañón vaya
adelante de la posición del avión con el fin de compensar el tiempo que la bomba
tarda en viajar desde que es disparada hasta que llega a donde está el avión.
Aquı́ se está despreciando este efecto con el fin de simplificar la exposición.
4 1 Introducción

en voltaje, pero realiza una gran amplificación en corriente eléctrica (véase el


capı́tulo 9, sección 9.2). De acuerdo a la figura 1.2 se puede presentar alguna
de las siguientes situaciones:
Si θ < θd , entonces v > 0 y el cañón gira en sentido antihorario de modo
que θ se aproxima a θd .
Si θ > θd , entonces v < 0 y el cañón gira en sentido horario de modo que
θ se aproxima a θd .
Si θ = θd , entonces v = 0 y el cañón no gira por lo que la condición θ = θd
se puede mantener para siempre.
A partir de este razonamiento se concluye que la regla presentada en (1.1) para
determinar el voltaje que se ha de aplicar al motor tiene buenas posibilidades
de funcionar en la práctica.
A la regla en (1.1) se le conoce como ley de control o, simplemente, contro-
lador. En la figura 1.3 se muestra un diagrama de bloques de los componentes
del sistema de control de un cañón antiaéreo. Nótese que la construcción del
controlador en (1.1) requiere que la posición del cañón θ (también conocida
como la salida) sea usada para generar el voltaje v (también conocido como
la entrada) que se aplica al motor. Este hecho define los conceptos de reali-
mentación y de sistema en lazo cerrado. Esto indica que el sistema de control
compara la posición del motor (θ, salida) con la posición deseada o referencia
(θd ) y aplica al motor un voltaje v que depende de la diferencia existente entre
estas variables (véase (1.1)).

amplificador
òd ò
+ controlador de v motor
potencia can
à oón
kp
à â1

Figura 1.3. Diagrama de bloques del sistema de control de un cañón antiaéreo.

Si se define el error de posición como la diferencia θd − θ, se dice que


el error en estado estacionario2 del sistema de control de posición es cero
porque, de acuerdo a lo arriba explicado, θd − θ = 0 puede mantenerse para
siempre. Sin embargo, el término “en estado estacionario” indica que esto
se conseguirá cuando el tiempo sea suficientemente grande como para que el
cañón deje de moverse. Ası́ que aún queda el problema de determinar cómo
evolucionará el movimiento del cañón conforme θ se aproxima a θd . A esto se
le conoce como la respuesta transitoria del sistema de control 3 . En la figura
2
Véase el capı́tulo 4
3
Véanse los capı́tulos 3, 5 y 6
1.1 Sistema de control de un cañón antiaéreo 5

1.4 se muestran varios ejemplos de cómo puede ser la respuesta transitoria.


Nótese que si kp es grande en (1.1) entonces el voltaje v que se aplica al
motor es mayor por lo que el par sobre el cañón también es mayor y, por tanto,
girará más rápido. Entonces, el tiempo que debe transcurrir para que θ alcance
a θd será menor. Sin embargo, un movimiento rápido del cañón y la inercia
propia del mismo pueden provocar que cuando θ alcance a θd la velocidad del
cañón sea diferente de cero θ̇ 6= 0 por lo que el cañón continuará moviéndose
y cambiará el signo de θd − θ. Entonces la posición θ puede efectuar varias
oscilaciones alrededor de θd antes de que el cañón se detenga. Esto significa
que el valor de kp tiene un efecto importante sobre la forma de la respuesta
transitoria por lo que debe ser calculada de modo que se obtenga la respuesta
transitoria deseada (rápida y sin oscilaciones). Incluso, para conseguir esto, en
ocasiones no será suficiente con ajustar el valor de kp y deberá modificarse la
regla en (1.1), es decir se deberá utilizar otro controlador (véanse los capı́tulos
5, 6, 7 y 10). Es más, el error en estado estacionario puede ser diferente de cero
(θ 6= θd cuando el motor alcanza el reposo) debido a perturbaciones externas
(el viento, por ejemplo, puede desviar al cañón de su posición u orientación
deseada) o por efectos tales como la fricción existente entre las partes móviles
de todo el mecanismo. Esto significa que incluso la búsqueda de un error en
estado estacionario que sea cero o, al menos, suficientemente pequeño puede
ser una razón para buscar un nuevo controlador.

òd

0
0
tiempo

Figura 1.4. Tres formas posibles de la respuesta transitoria en el control de un


cañón antiaéreo.
6 1 Introducción

Un aspecto muy importante en el diseño del sistema de control es la es-


tabilidad del mismo. El concepto de estabilidad puede interpretarse a groso
modo recordando lo que ocurre en un péndulo simple (véase la figura 1.5).
Si la posición deseada del péndulo es θ = 0 entonces basta con dejar que el
péndulo se mueva libremente (con un par externo igual a cero, T (t) = 0) y
el péndulo oscilará hasta que, por efecto de la fricción, alcanzará el reposo en
θ = 0. Entonces se dice que, bajo esta situación, el péndulo es estable porque
alcanza la posición deseada θ = 0 en estado estacionario a partir de cual-
quier posición inicial suficientemente cercana. Por otro lado, si se desea que
el péndulo alcance la posición θ = π es claro que, por efecto de la gravedad,
el péndulo siempre se aleja de esa configuración por cercana que se elija la
posición inicial respecto de ese valor deseado θ = π. Entonces se dice que bajo
esa situación el péndulo es inestable4 . Nótese que, de acuerdo a esta descrip-
ción intuitiva, el sistema de control de un cañón antiaéreo es inestable si la
ley de control en (1.1) utiliza una constante kp negativa: en este caso el cañón
se moverá de modo que θ se aleja de θd . Por tanto, el valor de la constante
kp también determina la estabilidad del sistema de control y debe elegirse de
manera que la asegure 5 . Nótese que si el sistema de control es inestable (kp
negativa) entonces el error en estado estacionario nunca será cero a pesar de
que la regla en (1.1) indica que el motor se detiene cuando θ = θd . Esto se
debe a que, incluso si θ = θd desde el principio, la medición de la posición θ
siempre está contaminada de ruido el cual producirá que θ 6= θd en (1.1) y
esto será suficiente para que, de acuerdo a lo explicado previamente, θ se aleje
de θd .

T(t)

l
ò
g
m

Figura 1.5. Péndulo simple.

Otro factor importante en el sistema de control de un cañón antiaéreo es


el movimiento que describe el avión por derribar. Es claro que si la dirección
4
Este es precisamente el término que coloquialmente se usa pare describir que el
péndulo no puede permanecer en θ = π para siempre
5
Véanse los capı́tulos 3, 4, 5, 6, 7
1.1 Sistema de control de un cañón antiaéreo 7

θd , que indica en donde se encuentra el avión, es constante entonces el avión


será derribado más fácilmente que si el avión se aleja a gran velocidad (cuan-
do θd cambia rápidamente) o cuando el avión acelera para escapar (cuando la
segunda derivada de θd es grande). Por tanto, la ley de control en (1.1) debe
ser diseñada de manera que el sistema de control responda correctamente ba-
jo cualquiera de las tres situaciones anteriormente descritas. En caso que θd
tenga una forma diferente a las consideradas, se supone que el sistema de con-
trol responderá correctamente si responde bien ante las tres situaciones antes
consideradas. Esta es la idea detrás del diseño del error en estado estacionario
del sistema, descrito en el capı́tulo 4.
De acuerdo a lo anterior, se puede decir que las tres caracterı́sticas fun-
damentales de un sistema de control son la respuesta transitoria, la respuesta
en estado estacionario (o error en estado estacionario) y la estabilidad. El
controlador debe ser diseñado de manera que estas tres partes fundamenta-
les de la respuesta de un sistema de control cumplan con las especificaciones
requeridas: rapidez y pocas oscilaciones (respuesta transitoria), que la posi-
ción del cañón alcance (o sea muy cercana a) la posición deseada cuando el
tiempo sea suficientemente grande (respuesta en estado estacionario) y que
el sistema de control sea estable. Para conseguir esto, las técnicas de control
estudiadas en la presente obra se basan en el estudio del modelo matemático
del sistema de control completo. De acuerdo a lo expuesto en el capı́tulo 2,
este modelo matemático está dado en términos de una ecuación diferencial
ordinaria, lineal y de coeficientes constantes. Por esta razón, en el capı́tulo 3
se estudia la solución de este tipo de ecuaciones diferenciales para definir las
propiedades que determinan su estabilidad ası́ como la forma transitoria de la
solución y el valor final de la misma. El conocimiento de cómo es la solución
de estas ecuaciones diferenciales es fundamental para los métodos de diseño
de controladores que se estudian en este libro.
Los métodos de diseño que se usan en esta obra pueden dividirse en clásicas
y modernas. Las técnicas de control clásicas son estudiadas en los capı́tulos
3, 4, 5, 6 y existen dos metodologı́as diferentes: las técnicas de respuesta en
el tiempo (capı́tulo 5) y las técnicas de la respuesta en la frecuencia (capı́tulo
6). Las técnicas de control clásico están basadas en el uso de la transformada
de Laplace para resolver y analizar ecuaciones diferenciales. Las técnicas de
la respuesta en el tiempo se basan en determinar la forma de la respuesta
temporal de un sistema de control a partir de la ubicación de los polos de la
función de transferencia correspondiente (capı́tulo 3) y el método principal de
diseño es el Lugar de las Raı́ces (capı́tulo 5). Las técnicas de la respuesta en la
frecuencia explotan la idea fundamental detrás de la Transformada de Fourier:
los sistemas de control (lineales) funcionan como filtros de tal manera que,
ante una orden, la respuesta del sistema de control está básicamente dada
como esa orden filtrada por el sistema de control. Es por esta razón que
las herramientas fundamentales de diseño para esta técnica son las gráficas
polares y de Bode (capı́tulo 6) ampliamente utilizadas en el diseño y análisis
de filtros (pasa altas, pasa bajas, pasa banda, etc.). En los capı́tulos 8, 9, 10,
8 1 Introducción

11 y 12 se presentan algunas aplicaciones experimentales de las técnicas de


control clásico.
Por otro lado, las técnicas modernas que se abordan en este libro están
representadas por las basadas en las variables de estado (capı́tulo 7) las cua-
les, a diferencia de las técnicas clásicas permiten estudiar el comportamiento
del “interior” del sistema de control. Esto significa que las variables de estado
suministran más información que puede ser aprovechada para conseguir me-
jores resultados. Ejemplos de aplicaciones de estas técnicas son mostrados en
los capı́tulos 13 y 14.

1.2. Historia del Control Automático

Una vez que se ha descrito a groso modo qué es lo que se persigue al diseñar
un sistema de control ası́ como algunos conceptos útiles para conseguirlo, a
continuación se presenta una breve historia del Control Automático. El obje-
tivo es que el lector se dé cuenta de cómo han sido formulados estos conceptos
y, además, pueda apreciar cuáles han sido las necesidades ingenieriles que han
motivado estas ideas. También se indican las partes del presente libro en don-
de se abordan los principales conceptos y técnicas de los sistemas de control.
El contenido de esta sección está basado en la información reportada en [1].
El Control Automático se ha usado desde hace más de 2000 años. Se tiene
conocimiento de la existencia de relojes de agua, construidos por Ktesibios,
hacia el año 270 antes de Cristo, ası́ como una variedad de mecanismos in-
geniosos construidos en Alejandrı́a y descritos por Herón. Sin embargo, des-
de el punto de vista de la ingenierı́a, el avance más importante en Control
Automático se debió a James Watt en 1789 al introducir un regulador de ve-
locidad para su máquina de vapor. Sin embargo, a pesar de su importancia, el
regulador de velocidad de Watt tenı́a varios problemas. Se observaba que en
ocasiones la velocidad variaba de manera oscilatoria en lugar de permanecer
constante o crecı́a sin lı́mite. Tratando de determinar bajo qué condiciones se
podı́a asegurar un funcionamiento estable, entre 1826 y 1851 J.V. Poncelet
y G.B. Airy mostraron que era posible utilizar ecuaciones diferenciales para
representar el funcionamiento completo de la máquina de vapor junto con el
regulador de velocidad (véase el capı́tulo 2 para el problema del modelado de
sistemas fı́sicos).
En esas fechas los matemáticos sabı́an que la estabilidad de una ecuación
diferencial estaba determinada por la ubicación de las raı́ces de la ecuación
caracterı́stica correspondiente y se sabı́a que habı́a inestabilidad si la parte
real de una raı́z era positiva (véase el capt́ulo 3, sección 3.8). Sin embargo, no
era sencillo calcular el valor numérico de dichas raı́ces y en ocasiones ni siquie-
ra era posible. Ası́, en 1868 J.C. Maxwell mostró la manera de determinar la
estabilidad de las máquinas de vapor con el regulador de Watt simplemente
examinando los coeficientes de la ecuación diferencial que la representa. Sin
embargo, este resultado sólo era útil para ecuaciones diferenciales de segundo,
1.2 Historia del Control Automático 9

tercero y cuarto orden. Más tarde, entre 1877 y 1895 y de manera indepen-
diente, E.J. Routh y A. Hurwitz dedujeron un método para determinar la
estabilidad de sistemas de cualquier orden, resolviendo el problema que Max-
well habı́a dejado abierto. Este método ahora es conocido como el Criterio de
Routh o de Routh-Hurwitz (véase el capı́tulo 4, sección 4.3).
Durante gran parte del siglo XIX se desarrollaron muchas aplicaciones
relacionadas con el Control Automático entre las cuales estaban el control
de temperatura, de presión, de nivel de lı́quidos y la velocidad de máquinas
rotativas. Por otro lado, se empezó a usar el vapor para mover grandes cañones
y para actuar sobre el sistema de dirección de barcos cada vez más grandes.
Incluso, por esa época, en Francia se introdujeron los términos de servomotor
y servomecanismo para describir un movimiento generado por un servidor o
esclavo. Sin embargo, la mayorı́a de los controladores de ese entonces eran
del tipo encendido-apagado y fueron personas como E. Sperry y M.E. Leeds
quienes se dieron cuenta de que los mejores operadores humanos empleaban
el sentido de anticipación disminuyendo la potencia conforme la variable a
controlar se acercaba a su valor deseado. Fue N. Minorsky quien en 1922
presentó un análisis claro de los sistemas de control de posición y formuló lo
que hoy en dı́a se conoce como controlador PID (véase el capı́tulo 5, sección
5.2.5). Este controlador fue deducido observando la manera en que el piloto
humano de un barco controla su dirección.
Por otro lado, desde 1920 la amplificación habı́a producido muchos proble-
mas a las compañı́as telefónicas ya que se distorsionaba fuertemente la señal
de audio. Fue en esa época que H.S. Black encontró que si una pequeña can-
tidad de la señal obtenida a la salida de un amplificador se utilizaba para ser
realimentada a la entrada del mismo se podı́a reducir la distorsión producida
por el amplificador. Durante el desarrollo de este trabajo, Black fue ayudado
por H. Nyquist quien, a partir de esas experiencias, publicó en 1932 un trabajo
titulado “Regeneration Theory” en donde estableció las bases de lo que ahora
es conocido como el Análisis de Nyquist (véase el capı́tulo 6, sección 6.5).
Durante el perı́odo 1935-1940, las compañı́as telefónicas deseaban ampliar
el ancho de banda de sus sistemas de comunicación para aumentar el número
de sus usuarios. Para esto necesitaban que sus lı́neas telefónicas presentaran
una buena caracterı́stica de respuesta en frecuencia (véase el capı́tulo 6): una
ganancia constante sobre un amplio rango de frecuencias con un pequeño
ángulo de atraso y una aguda pendiente de atenuación a partir de una deter-
minada frecuencia de corte. Motivado por este problema, H. Bode estudió la
relación existente entre una caracterı́stica de atenuación dada y el mı́nimo
corrimiento de fase que se le puede asociar. Como resultado introdujo los con-
ceptos de margen de ganancia y margen de fase (véase el capı́tulo 6, sección
6.6) y empezó a manejar el punto (−1, 0) del plano complejo como un punto
crı́tico en lugar del punto (+1, 0) manejado por Nyquist. Detalles completos
del trabajo de Bode aparecieron en 1945 en su libro “Network Analysis and
Feedback Amplifier Design”.
10 1 Introducción

Pero fue la Segunda Guerra Mundial la que hizo que el trabajo en sistemas
de control se concentrara en unos pocos problemas especı́ficos. El más impor-
tante de estos fue el relacionado con el direccionamiento de cañones antiaéreos.
El trabajo en este problema motivó el desarrollo de nuevas ideas en el control
de servomecanismos. G. S. Brown del Instituto Tecnológico de Massachusetts
mostró que muchos sistemas eléctricos y mecánicos pueden ser representados
y manipulados usando diagramas de bloques (véase el capı́tulo 4, sección 4.1)
y A. C. Hall mostró en 1943 que manejando los bloques como funciones de
transferencia (véase el capı́tulo 3) podı́a obtenerse la función de transferencia
del sistema completo para finalmente usar el criterio de estabilidad de Nyquist
y determinar los márgenes de ganancia y de fase.
Los investigadores en el Instituto Tecnológico de Massachusetts usaron
circuitos de adelanto (véase el capı́tulo 10, sección 10.2.2) en el trayecto directo
para modificar el desempeño del sistema de control, mientras que en el Reino
Unido se usaron varios lazos internos para modificar la respuesta del sistema
de control.
Hacia el final de la Segunda Guerra Mundial las técnicas de respuesta en
frecuencia basadas en el método de Nyquist y las gráficas de Bode ya estaban
bien establecidas, describiendo el desempeño del sistema de control en térmi-
nos de ancho de banda, frecuencia de resonancia, margen de fase y margen
de ganancia (véase el capı́tulo 6). El enfoque alternativo a estas técnicas se
basaba en la solución de las ecuaciones diferenciales usando la Transforma-
da de Laplace y describı́an el desempeño del sistema de control en términos
del tiempo de subida, sobre paso, error en estado estacionario y el amorti-
guamiento (véase el capı́tulo 3, sección 3.3). Muchos ingenieros preferı́an este
método porque los resultados estaban expresados en términos “reales”. Pero
este enfoque tenı́a la desventaja de que no existı́a una manera sencilla que
permitiera al diseñador relacionar los cambios en los parámetros con cambios
en la manera en que respondı́a el sistema. Fue precisamente el método del
Lugar de las Raı́ces (véase el capı́tulo 5, secciones 5.1 y 5.2) introducido en
1948 y 1950 por W. Evans el que permitió librar estos obstáculos. Ası́, hacia
esas fechas las ahora llamadas técnicas de control clásico estaban bien estable-
cidas y estaban orientadas a sistemas que podı́an ser descritos por ecuaciones
diferenciales lineales con coeficientes constantes y con una sola entrada.
Entonces vino la era de los vuelos supersónicos y espaciales. Era necesario
utilizar modelos fı́sicos detallados representables en ecuaciones diferenciales
que podı́an ser lineales o no lineales. Los ingenieros que trabajaban en las
industrias aeroespaciales encontraron que siguiendo las ideas de Poincaré era
posible formular ecuaciones diferenciales generales en términos de un conjunto
de ecuaciones diferenciales de primer orden y ası́ empezó a nacer lo que hoy
se conoce como la técnica de las variables de estado (véase el capı́tulo 7).
Un gran impulsor de esta técnica fue R. Kalman quien, alrededor de 1960,
presentó los conceptos de controlabilidad y observabilidad (véase la sección
7.6).
1.3 Prototipos didácticos 11

Finalmente, se debe decir que a partir de esas fechas se han detectado nue-
vos problemas en los sistemas de control que han motivado la introducción
de diversas técnicas de control que aún hoy en dı́a se siguen desarrollando.
Por ejemplo, las no linealidades encontradas en los servomecanismos ha mo-
tivado el desarrollo de las técnicas de control no lineal. El control de aviones
supersónicos, que deben operar bajo amplios rangos de temperatura, presión,
velocidad, etc., motivó el desarrollo de control adaptable. La introducción
de sistemas de control basados en radar motivó el desarrollo de técnicas de
control para sistemas en tiempo discreto, etc.

1.3. Prototipos didácticos

En las secciones previas se ha mencionado que el Control Automático ha


sido desarrollado con el fin de resolver problemas de ingenierı́a importantes.
Sin embargo, la enseñanza de las técnicas del Control Automático necesita que
el estudiante pueda practicar aplicando sus conocimientos de manera experi-
mental. Como es difı́cil hacer uso de instalaciones industriales complejas o de
laboratorios de alta tecnologı́a con este propósito, en la enseñanza del Control
Automático se recurre a los llamados “prototipos didácticos”. Un prototipo
didáctico es un dispositivo que tiene dos caracterı́sticas principales: i) es
suficientemente sencillo como para que pueda ser construido y ser puesto en
marcha usando diferentes controladores, e ii) que sea un modelo suficiente-
mente complejo como para que se puedan apreciar los diferentes aspectos de
un sistema de control. A continuación se listan los prototipos didácticos usados
en este libro y se indica cuales son las herramientas del Control Automático
que son utilizadas en dichos prototipos:
Circuitos electrónicos osciladores basados en amplificadores operacionales
y transistores (capı́tulo 8). Respuesta en frecuencia, criterio de estabilidad
de Nyquist y criterio de estabilidad de Routh.
Motores de CD con escobillas e imán permanente (capı́tulos 9 y 10). Diseño
de varios controladores básicos en servomecanismos utilizando la respuesta
en el tiempo: proporcional, proporcional-derivativo, proporcional-integral,
proporcional-integral-derivativo, compensadores de adelanto, controlado-
res con dos grados de libertad.
Sistema de levitación magnética (capı́tulo 11). Diseño de un controlador
PID usando el concepto de aproximación lineal de un sistema no lineal y
el método del lugar de las raı́ces.
Sistema “ball and beam” (capı́tulo 12). Diseño de un sistema multilazo
usando la respuesta en frecuencia (criterio de Nyquist y gráficas de Bode)
y el lugar de las raı́ces.
Péndulo de Furuta (capı́tulo 13). Diseño de un controlador por realimen-
tación del estado usando la técnica de la variable de estado. Se utiliza una
aproximación lineal de un sistema no lineal.
12 1 Introducción

Péndulo con rueda inercial (capı́tulo 14). Diseño de dos controladores por
realimentación del estado usando la técnica de la variable de estado. Uno
de los controladores es diseñado utilizando el modelo no lineal completo
del mecanismo y es utilizado para dar al lector una pequeña introducción
al control de sistemas no lineales.

1.4. Resumen del capı́tulo


En el presente capı́tulo se ha explicado de manera intuitiva cuál es la idea
fundamental de controlar un sistema en lazo cerrado. Para esto se ha descrito
cómo funciona el sistema de control de un cañón antiaéreo. También se ha ex-
plicado, mediante el mismo ejemplo, qué es lo que se busca cuando se diseña
un sistema de control. Se ha presentado una breve descripción de la historia
del Control Automático para que el lector entienda que todos los conceptos
detrás de las herramientas de los sistemas de control han sido motivados por
problemas tecnológicos importantes. Esta descripción histórica ha sido utili-
zada para indicar en que partes de la presente obra se abordan las diferentes
herramientas del Control Automático.

1.5. Preguntas de repaso

1. ¿Para qué podrı́a el lector usar el Control Automático?


2. ¿Podrı́a hacer una lista del equipo doméstico que utilice la realimentación?
3. Investigue como funciona un reloj de pared (que utiliza un péndulo)
¿Cómo cree que intervenga la realimentación en el funcionamiento de estos
relojes?
4. ¿Por qué es históricamente importante el regulador de velocidad de Watt
para una máquina de vapor?
5. ¿Qué significa que un sistema de control sea inestable?
6. ¿Qué entiende por rapidez de respuesta?
7. ¿Por qué se dice que un péndulo invertido es inestable?
8. ¿Por qué se desarrollaron primero las técnicas de respuesta en frecuencia
antes de las técnicas de respuesta en el tiempo?
Referencias

1. S. Bennett, A brief history of automatic control, IEEE Control Systems Maga-


zine, pp. 17-25, June 1996.
2. G.W. Evans, The story of Walter R. Evans and his textbook Control-Systems
Dynamics, IEEE Control Systems Magazine, pp. 74-81, December 2004.
3. D.A. Mindell, Anti-aircraft fire control and the develoment of integrated systems
at Sperry, 1925-1940, IEEE Control Systems Magazine, pp. 108-113, April 1995.
4. S.W. Herwald, Recollection of the early development of servomechanism and
control systems, IEEE Control Systems Magazine, pp. 29-32, november 1984.
5. D.S. Bernstein, Feedback control: an invisible thread in the history of technology,
IEEE Control Systems Magazine, pp. 53-68, April 2002.
6. W. Oppelt, On the early growth of conceptual thinking in the control system
theory- The German role up to 1945, IEEE Control Systems Magazine, pp.
16-22, November 1984.
7. S. Bennett, Nicolas Minorsky and the automatic steering of ships, IEEE Control
Systems Magazine, pp. 10-15, November 1984.
2
Modelado matemático de sistemas fı́sicos

El modelado matemático de sistemas fı́sicos consiste en obtener un conjun-


to de ecuaciones que, al ser resueltas, muestran cómo evolucionan las variables
importantes del sistema. Esto se consigue describiendo matemáticamente, y
por separado, a cada una de las partes que componen al sistema por mo-
delar. Finalmente, estos modelos matemáticos aislados deben ser conectados
de acuerdo a la configuración que mantienen dentro del sistema completo,
respetando las leyes de la naturaleza que los rigen.
16 2 Modelado matemático de sistemas fı́sicos

Objetivos del capı́tulo

Darse cuenta de que el modelo matemático de los sistemas fı́sicos está cons-
tituido por ecuaciones diferenciales.
Aprender a obtener el modelo matemático de sistemas mecánicos, eléctri-
cos y electromecánicos.
Identificar a los sistemas fı́sicos como la interconexión de procesadores de
energı́a.
Identificar las analogı́as entre sistemas de diferente naturaleza, a partir de
la manera en que procesan la energı́a.
Tradicionalmente, cuando se aborda el modelado de sistemas fı́sicos se re-
curre a los métodos especı́ficos desarrollados para cada tipo de sistema. Es
decir, los sistemas eléctricos son modelados usando los métodos desarrollados
en la teorı́a de circuitos eléctricos y cuando se trata de sistemas mecánicos
se usan los métodos desarrollados en ingenierı́a mecánica. Sin embargo, pro-
ceder de esta manera tiene varias desventajas: i) la persona no especializada
en el tema en cuestión debe simplemente aceptar (sin muchas explicaciones)
los métodos de modelado desarrollados en esa rama del conocimiento, ii) el
estudiante no se da cuenta de que las leyes fı́sicas utilizadas para el modelado
de sistemas de diferente naturaleza están relacionadas por analogı́as; aunque
en todo curso de control automático siempre se tratan de resaltar las ana-
logı́as, éstas tienen que ser explicadas a partir de las ecuaciones resultantes
del modelado y no se puede ver que es la esencia del fenómeno la que tiene su
contraparte en sistemas de diferente naturaleza.
Una manera de estudiar el modelado de sistemas fı́sicos de diferente natu-
raleza bajo una perspectiva unificada es utilizando un concepto que es común
a varios ámbitos de la ingenierı́a: la energı́a del sistema. Por esta misma razón
en esta obra el modelado de sistemas se limita a sistemas eléctricos y mecáni-
cos los cuales pueden estudiarse usando conceptos generales de energı́a que
son comunes a todos estos sistemas. La idea fundamental del uso de la energı́a
para el modelado es que los componentes de cada sistema bajo estudio suminis-
tran, almacenan o disipan energı́a y cuando se unen para formar un sistema
complejo es cuestión de determinar cómo esa energı́a es transmitida de un
componente a otro.
Este enfoque de usar la energı́a para el modelado (y, por tanto, el presente
capı́tulo) está basado en las ideas introducidas en [1].

2.1. Energı́a y variables generalizadas del sistema


En dos sistemas que se encuentran conectados el intercambio de energı́a
se realiza a través de un puerto, el cual puede ser conceptualmente descrito
como formado por dos terminales comunes a ambos sistemas (véase la figura
2.1). La energı́a es intercambiada entre estos sistemas através de dos variables
2.1 Energı́a y variables generalizadas del sistema 17

generalizadas que se identifican bajo los conceptos generales de esfuerzo e


y flujo f . Estas variables, al ser generalizadas, están definidas en cualquier
sistema independientemente de su naturaleza. Por tanto, no se confundan
estas variables con las variables esfuerzo y flujo definidas en resistencia de
materiales (esfuerzo) y mecánica de fluidos (flujo). Las variables generalizadas
de esfuerzo y flujo pueden ser distinguidas a partir de la manera en que son
medidas. El esfuerzo es medido utilizando un instrumento que se conecta
entre ambas terminales del puerto (en la literatura en inglés se usa el término
across para describir estas variables). Ejemplos de estas variables son el voltaje
(sistemas eléctricos), la presión (sistemas de fluidos) y la velocidad (sistemas
mecánicos): estas variables se miden entre dos puntos porque necesitan ser
medidas respecto a un valor de referencia. El flujo es medido utilizando un
instrumento que se conecta a lo largo de una de las terminales del puerto (en
la literatura en inglés se usa el término through para describir estas variables).
En este caso no se necesita especificar un valor de referencia sino que se mide
la variable que fluye a través del sistema. Ejemplos de estas variables son el
flujo de fluidos (sistemas de fluidos), la corriente eléctrica (sistemas eléctricos)
y la fuerza (sistemas mecánicos).

f
Sistema Sistema
1 e 2

puerto

Figura 2.1. Dos sistemas conectados a través de un puerto.

En este enfoque en el cual lo sistemas son considerados como procesadores


de energı́a, el producto de las variables de esfuerzo y flujo es igual a la potencia
instantánea (w) intercambiada a través del puerto:

w = ef

Para cada uno de los componentes del sistema se debe definir una convención
de signos para las variables generalizadas de esfuerzo y de flujo (véase la figura
2.2). De este modo, si la potencia w tiene signo positivo para el componente i
entonces este componente recibe energı́a en ese instante. Si la potencia w tiene
signo negativo para el elemento i entonces el componente entrega energı́a a
los otros componentes del sistema en ese instante.
La energı́a intercambiada (E) en el intervalo de tiempo [0, t] está dada
como la integral de la potencia instántanea:
18 2 Modelado matemático de sistemas fı́sicos

Componente
e
i

Figura 2.2. Sentidos definidos como positivos para las variables de esfuerzo y flujo.

Z t
E= ef dt (2.1)
0

Si la energı́a E es positiva para el componente i, entonces E representa la


energı́a que este componente ha recibido en el intervalo de tiempo [0, t], pero si
E es negativa entonces E representa la cantidad de energı́a que el componente
ha entregado a los otros componentes del sistema en el intervalo de tiempo
[0, t].
Ejemplo 2.1 En un circuito eléctrico, la potencia (w) está dada como el
producto de la corriente eléctrica i (A, Amperes) a través del circuito y el
voltaje v (V, volts) medido entre las terminales del circuito, mientras que la
energı́a (E) intercambiada (puede ser recibida o entregada dependiendo del
signo de E) en el intervalo de tiempo [0, t] se calcula como la integral de la
potencia:
Z t
w = iv, E = iv dt
0

En un sistema mecánico traslacional, la potencia (w) está dada como el


producto de la fuerza aplicada F (N, Newton) y la velocidad v (m/s, me-
tros/segundo), mientras que la energı́a (E) intercambiada en el intervalo de
tiempo [0, t] se calcula como la integral de la potencia:
Z t
w = F v, E = F v dt
0

En un sistema mecánico rotativo, la potencia (w) está dada como el producto


del par aplicado T (Nm, Newton×metro) y la velocidad angular ω (rad/s,
radian/segundo), mientras que la energı́a (E) intercambiada en el intervalo
de tiempo [0, t] se calcula como la integral de la potencia:
Z t
w = T ω, E = T ω dt
0

En un sistema de fluidos, la potencia (w) está dada como el producto de la pre-


sión P (N/m2 , Newton/metro2 ) y el flujo del fluido Q (m3 /s, metro3 /segundo),
mientras que la energı́a (E) intercambiada en el intervalo de tiempo [0, t] se
calcula como la integral de la potencia:
2.2 Almacenadores de energı́a 19
Z t
w = P Q, E= P Q dt
0

Se recomienda hacer el análisis dimensional correspondiente en cada caso pa-


ra verificar que la energı́a siempre está dada en Joules=Newton×metro y la
potencia en Joules/segundo.
Los componentes de un sistema pueden clasificarse de la siguiente manera,
de acuerdo a la acción que realizan sobre la energı́a E que intercambian:
Almacenadores de energı́a.
Disipadores de energı́a.
Fuentes de energı́a.
Convertidores.
A continuación se estudia cada una de estas funciones.

2.2. Almacenadores de energı́a


Existen dos maneras de almacenar la energı́a: i) mediante el almacena-
miento de esfuerzo e ii) mediante el almacenamiento de flujo. Estas dos ma-
neras de almacenar la energı́a definen dos nuevas variables: la acumulación de
esfuerzo (ea ) y la acumulación de flujo (fa ):
Z t
dea
ea = e dt, e =
0 dt
Z t
dfa
fa = f dt, f =
0 dt
Nótese que a partir de estas expresiones también se puede escribir:

e dt = dea , f dt = dfa

lo cual, al ser sustituido en (2.1) da origen a las siguientes expresiones para


la energı́a almacenada en términos de la acumulación de esfuerzo:
Z ea (t)
E= f dea (2.2)
ea (0)

y para la energı́a almacenada en términos de la acumulación de flujo:


Z fa (t)
E= e dfa (2.3)
fa (0)

Para poder calcular la integral en (2.2) es necesario que el flujo f se pueda


escribir como función de la acumulación de esfuerzo ea , es decir que se pueda
escribir:
20 2 Modelado matemático de sistemas fı́sicos

f = φ(ea )

Por otro lado, para poder calcular la integral en (2.3) es necesario que el
esfuerzo e se pueda escribir como función de la acumulación de flujo fa , es
decir que se pueda escribir:

e = ϕ(fa )

En cada caso, las funciones φ y ϕ se conocen como las funciones constituti-


vas del componente del sistema que realiza la acción de almacenamiento de
esfuerzo o de flujo. A continuación se estudian los componentes que realizan
el almacenamiento de esfuerzo o de flujo en sistemas de diferente naturaleza.

2.2.1. Sistemas mecánicos traslacionales

Almacenamiento de flujo

En la figura 2.3 se muestra un cuerpo rı́gido (sin flexibilidad) de masa m


(positiva) que se mueve con velocidad v12 (v12 = e, esfuerzo) bajo el efecto de
una fuerza F (F = f , flujo). Se supone que no existe fricción entre el cuerpo
y el medio que lo rodea. Los sentidos mostrados para la fuerza y la velocidad
son los sentidos que se definen como positivos para este tipo de componente
de sistema. Bajo estas condiciones, la Segunda Ley de Newton [2], pág. 89,
establece que:

F = ma (2.4)

donde a = dvdt12 es la aceleración del cuerpo. La siguiente manera de definir el


momentum p:

p = mv12 (2.5)

es muy conveniente porque se puede integrar (2.5) y (2.4) para concluir que el
momentum es la acumulación de flujo (p = fa ), es decir que se puede escribir:
Z t
p= F dt + p(0)
0

A partir de (2.5) se concluye que la función constitutiva es:


1
v12 = ϕ(p) = p, (e = ϕ(fa ))
m
Entonces, sustituyendo v12 = e, p = fa y v12 = p/m en (2.3) y suponiendo
que p(0) = 0, se encuentra que la energı́a almacenada está dada como:
Z p
1 1 2 1 2
E= p dp = p = mv12
0 m 2m 2
lo cual constituye la expresión bien conocida para la energı́a cinética.
2.2 Almacenadores de energı́a 21
v 12

m F
2

Figura 2.3. Un cuerpo rı́gido de masa m como almacenador de flujo en sistemas


mecánicos traslacionales.

Almacenamiento de esfuerzo

En la figura 2.4 se muestra un resorte que se deforma (se comprime o se


estira) a una velocidad v12 (v12 = e, esfuerzo) bajo el efecto de una fuerza F
(F = f , flujo). Nótese que aunque la fuerza F se aplica en el extremo 1 del
resorte, debe considerarse que una fuerza del mismo valor y de sentido con-
trario aparece en el extremo 2 del resorte para que sea posible la deformación.
Además, v12 = v1 − v2 donde v1 y v2 son las velocidades de los extremos 1 y
2 del resorte, respectivamente. Los sentidos mostrados para la fuerza y las ve-
locidades son los que se definen como positivos para este tipo de componente
de sistema. Nótese que la velocidad v12 indica que el extremo 1 del resorte
se aproxima al extremo 2 del resorte. Se supone que el resorte no tiene masa
y que la deformación no es permanente ni produce calor. El almacenamiento
de energı́a en un resorte se realiza mediante el desplazamiento neto del re-
sorte respecto de su estado nominal. El estado nominal del resorte puede ser
definido como aquel en el cual el resorte no está ni estirado ni comprimido,
pero en algunos casos también puede ser definido como aquel en el cual el
sistema mecánico completo está en reposo aunque el resorte este comprimido
o estirado en esa situación de reposo. Por tanto, la acumulación de esfuerzo
se define como el desplazamiento neto (ea = x12 ):

v 12
1 2
F F
v1 v2

Figura 2.4. Un resorte como almacenador de esfuerzo en sistemas mecánicos tras-


lacionales.

Z t
x12 = v12 dt + x12 (0) (2.6)
0
22 2 Modelado matemático de sistemas fı́sicos

donde x12 = x1 − x2 con x1 y x2 las posiciones de los extremos 1 y 2 del


resorte, respectivamente. De acuerdo al sentido de la velocidad v12 que se ha
definido en la figura 2.4 se concluye que el desplazamiento neto x12 es positivo
cuando el resorte está comprimido.
En el caso de un resorte lineal la función constitutiva responde a la Ley
de Hooke [2], pág. 640:

F = k x12 , (f = φ(ea )) (2.7)

donde k es una constante positiva que se conoce como la constante de rigidez


del resorte. Entonces, sustituyendo x12 = ea , F = f y F = k x12 en (2.2)
y suponiendo que x12 (0) = 0, se encuentra que la energı́a almacenada en el
resorte está dada como:
Z x12
1
E= k x12 dx12 = k x212
0 2

2.2.2. Sistemas mecánicos rotativos

Almacenamiento de flujo

En la figura 2.5 se muestra un cuerpo rı́gido (sin flexibilidad) que gira


con velocidad angular ω12 (ω12 = e, esfuerzo) bajo el efecto de un par T
(T = f , flujo). Se supone que no existe fricción entre el cuerpo y el medio
que lo rodea. Los sentidos mostrados para el par y la velocidad angular son
los sentidos que se definen como positivos para este tipo de componente de
sistema. De acuerdo a la Segunda Ley de Newton [2], pág. 122:

T ! 12
2
Eje de rotación

Figura 2.5. Un cuerpo rı́gido rotativo de inercia I como almacenador de flujo en


sistemas mecánicos rotativos.

T = Iα (2.8)

donde α = dωdt12 es la aceleración angular del cuerpo e I es el momento de


inercia (constante positiva). El momentum angular h se define de la siguiente
manera conveniente:
2.2 Almacenadores de energı́a 23

h = Iω12 (2.9)

porque integrando (2.8) y (2.9) se encuentra que el momentum angular es la


acumulación de flujo (h = fa ) porque se puede escribir:
Z t
h= T dt + h(0)
0

A partir de (2.9) se concluye que la función constitutiva es:


1
ω12 = ϕ(h) = h, (e = ϕ(fa ))
I
Entonces, sustituyendo ω12 = e, h = fa y ω12 = h/I en (2.3) y suponiendo
que h(0) = 0, se encuentra que la energı́a almacenada está dada como:
Z h
1 1 2 1 2
E= h dh = h = Iω12
0 I 2I 2

lo cual constituye la expresión bien conocida para la energı́a cinética.

Almacenamiento de esfuerzo

En la figura 2.6 se muestra un resorte que se deforma (mediante una flexion


angular) a una velocidad ω12 (ω12 = e, esfuerzo) bajo el efecto de un par T
(T = f , flujo). Nótese que aunque el par T se aplica en el extremo 1 del resorte,
debe considerarse que un par del mismo valor y de sentido contrario aparece
en el extremo 2 del resorte para que sea posible la deformación. Además,
ω12 = ω1 − ω2 con ω1 y ω2 las velocidades de los extremos 1 y 2 del resorte,
respectivamente. Los sentidos mostrados para la fuerza y las velocidades son
los que se definen como positivos para este tipo de componente de sistema.
Se supone que el resorte no tiene momento de inercia (o masa) y que la
deformación no es permanente ni produce calor. El almacenamiento de energı́a
en un resorte se realiza mediante el desplazamiento angular neto del resorte
respecto de su estado nominal. El estado nominal del resorte puede ser definido
como aquel en el cual el resorte no está flexionado en ni en sentido horario
ni antihorario, pero en algunos casos también puede ser definido como aquel
en el cual el sistema mecánico completo está en reposo aunque el resorte este
flexionado en esa situación de reposo. Por tanto, la acumulación de esfuerzo
se define como el desplazamiento angular neto (ea = θ12 ):

Z t
θ12 = ω12 dt + θ12 (0) (2.10)
0

donde θ12 = θ1 − θ2 con θ1 y θ2 las posiciones angulares de los extremos 1 y


2 del resorte, respectivamente. De acuerdo al sentido de la velocidad ω12 que
24 2 Modelado matemático de sistemas fı́sicos

se ha definido en la figura 2.6 se concluye que el desplazamiento angular neto


θ12 es positivo cuando el resorte se flexiona de modo que θ1 > θ2 .
En el caso de un resorte lineal, la función constitutiva responde a la Ley
de Hooke:

T = k θ12 , (f = φ(ea )) (2.11)

donde k es una constante positiva que se conoce como la constante de rigidez


torsional del resorte. Entonces, sustituyendo θ12 = ea , T = f y T = k θ12 en
(2.2) y suponiendo que θ12 (0) = 0, se encuentra que la energı́a almacenada en
el resorte está dada como:
Z θ12
1 2
E= k θ12 dθ12 = k θ12
0 2

2.2.3. Sistemas eléctricos

Almacenamiento de esfuerzo

En la figura 2.7 se muestra un inductor a través del cual circula una corrien-
te eléctrica i (i = f , flujo) bajo el efecto de un voltaje v12 (v12 = e, esfuerzo)
aplicado entre sus extremos. Se supone que no existen efectos parásitos, es
decir, el inductor no tiene resistencia eléctrica interna ni existe capacitancia
entre sus espiras. Los sentidos mostrados para la corriente eléctrica y el voltaje
son los sentidos que se definen como positivos para este tipo de componente
de sistema.
Faraday fue el primero en darse cuenta de que un inductor (y en general
cualquier circuito eléctrico suficientemente largo, dado que un inductor es un
conductor eléctrico arrollado sobre un núcleo) tiene propiedades análogas a
las que tiene el momentum en sistemas mecánicos. Lo que Faraday llamó el

! 12
T !1 !2 T
1 2

Figura 2.6. Un resorte como almacenador de esfuerzo en sistemas mecánicos rota-


tivos.

i
1 2
+ à
v 12

Figura 2.7. Un inductor como almacenador de esfuerzo en sistemas eléctricos.


2.2 Almacenadores de energı́a 25

“momentum electrodinámico” es más conocido actualmente como el flujo con-


catenado λ y es igual al flujo magnético que es encerrado por el inductor.
Faraday encontró que el flujo concatenado es proporcional a la corriente i que
fluye a través del inductor y a una constante positiva L que depende de la
forma geométrica en que el conductor está arrollado para formar el inductor.
La constante L recibe el nombre de inductancia. Por tanto, se puede escribir:

λ = Li (2.12)

El flujo concatenado determina el voltaje que se produce en los extremos de


un inductor mediante lo que hoy se conoce como la Ley de Faraday [2], pág.
606, [3], pág. 325:
dλ di
v12 = =L (2.13)
dt dt
Esto significa que el flujo concatenado representa la acumulación de voltaje o
esfuerzo (λ = ea ).
Z t
λ= v12 dt + λ(0)
0

Por tanto, a partir de la expresión en (2.12) se concluye que:


1
i = φ(λ) = λ, (f = φ(ea ))
L
Entonces, sustituyendo i = f , λ = ea e i = λ/L en (2.2) y suponiendo que
λ(0) = 0, se encuentra que la energı́a almacenada está dada como:
Z λ
1 1 2 1
E= λ dλ = λ = Li2 (2.14)
0 L 2L 2
lo cual constituye la expresión bien conocida para la energı́a magnética alma-
cenada en un inductor.

Almacenamiento de flujo

Un capacitor se forma donde quiera que se encuentren dos conductores


eléctricos con potenciales eléctricos diferentes, separados por un material no
conductor a una distancia suficientemente pequeña como para que se genere
un campo eléctrico entre ellos. Cada uno de los conductores eléctricos recibe
el nombre placa. En la figura 2.8 se muestra un capacitor a través del cual
circula una corriente eléctrica i (i = f , flujo) bajo el efecto de un voltaje v12
(v12 = e, esfuerzo) aplicado entre sus terminales. Se supone que no existen
efectos parásitos, es decir que no existe corriente de fuga entre las placas del
capacitor y que no existen efectos inductivos debidos a las placas del capa-
citor. Debido a la diferencia de potencial que existe entre los conductores se
26 2 Modelado matemático de sistemas fı́sicos

producirá una acumulación de carga eléctrica. Se usa la letra q para repre-


sentar dicha carga eléctrica, la cual es igual pero de signo contrario en cada
uno de los conductores. Con el fin de cuantificar la cantidad de carga eléctrica
que puede ser almacenada, se define la capacitancia C (constante positiva)
del siguiente modo [3], pág. 121:
q
C= (2.15)
v12
La capacitancia C depende de la forma geométrica y la cercanı́a de los con-
ductores (placas), ası́ como de las propiedades dieléctricas del material no
conductor colocado entre ellos. La corriente eléctrica se define a partir de la
carga eléctrica del siguiente modo:
dq
i= (2.16)
dt
Por tanto, la carga eléctrica representa la acumulación de flujo (de corriente
eléctrica) (q = fa ):
Z t
q= i dt + q(0)
0

A partir de la expresión en (2.15) se concluye que


1
v12 = ϕ(q) = q, (e = ϕ(fa ))
C
Entonces, sustituyendo v12 = e, q = fa y v12 = q/C en (2.3) y suponiendo
que q(0) = 0, se encuentra que la energı́a almacenada está dada como:
Z q
1 1 2
E= q dq = q
0 C 2C
lo cual constituye la expresión bien conocida para la energı́a eléctrica alma-
cenada en un capacitor.

i
1 2

+ à
v 12

Figura 2.8. Un capacitor como almacenador de flujo en sistemas eléctricos.


2.3 Disipadores de energı́a 27

2.3. Disipadores de energı́a


Un disipador es un componente que básicamente convierte la energı́a en
otra forma de energı́a (generalmente térmica) la cual no es recuperable por el
sistema. A diferencia de los almacenadores de energı́a, la disipación de energı́a
sólo se realiza mediante un único proceso. Ası́, un disipador es un componente
cuya función constitutiva relaciona de manera estática (sin integrales de por
medio) a las variables generalizadas de esfuerzo y de flujo:

e = ϕ(f )

En este caso no hay energı́a almacenada y sólo se puede hablar de que la


potencia instantanea que se disipa está dada por el producto de las variables
generalizadas de esfuerzo y flujo:

w = ef (2.17)

A continuación se estudian los componentes disipadores de energı́a en sistemas


de diferente naturaleza.

2.3.1. Sistemas mecánicos traslacionales

Cualquier objeto mecánico que requiere de la aplicación permanente de


una fuerza para poder mantener un valor de velocidad presenta efectos di-
sipativos. Normalmente la disipación de potencia ocurre porque la energı́a
cinética está siendo convertida en energı́a térmica por efecto de la fricción, la
cual aparece siempre que dos cuerpos hacen contacto mientras existe movi-
miento relativo entre ellos. La función constitutiva de un disipador mecánico
general está dada como:

v12 = ϕ(F )

donde v12 (e, esfuerzo) es la velocidad relativa entre los cuerpos y F (f , flujo)
es la fuerza aplicada. Un caso particular muy importante de fricción es la
fricción viscosa, la cual está representada por una función constitutiva lineal
de la forma:
1
v12 = F, fricción viscosa (2.18)
b
donde b es una constante positiva conocida como el coeficiente de fricción
viscosa. Este tipo de fricción ocurre, por ejemplo, cuando una placa plana
y llena de orificios se desplaza dentro de una cámara cerrada llena de aire,
como se muestra en la figura 2.9. Debido a que el aire debe fluir a través de
los orificios conforme la placa se mueve a velocidad v12 , es necesario aplicar
una fuerza F para mantener la velocidad del movimiento. Además, v12 =
v1 − v2 donde v1 y v2 son las velocidades de los extremos 1 y 2 del dispositivo,
28 2 Modelado matemático de sistemas fı́sicos

respectivamente. Los sentidos de la fuerza y las velocidades mostrados en la


figura 2.9 son los definidos como positivos. Aunque el dispositivo mostrado en
la figura 2.9 puede no estar colocado fı́sicamente entre dos cuerpos que hacen
contacto, la fricción viscosa generalmente está presente y es común tomarla
en cosideración. De acuerdo a (2.17), la potencia disipada por efecto de la
fricción viscosa está dada como:
1 2 2
w= F = bv12
b

v 12

v1 F
F

1
2
v2

Figura 2.9. La fricción viscosa se produce como resultado de la resistencia al flujo


del aire a través de los orificios.

También existen otros tipos de fricción que con frecuencia aparecen en la


práctica. Dos de ellas son la fricción estática y la fricción de Coulomb. Las
funciones constitutivas en cada caso son:

F = ±Fs |v12 =0 , fricción estática (2.19)


½
+1, si v12 > 0
F = Fc signo(v12 ), signo(v12 ) = , fricción de Coulomb
−1, si v12 < 0
(2.20)

La fricción estática representa una fuerza que tiende a prevenir el movimiento


sólo en el momento en que éste está a punto de iniciar. Esta es la razón por
la que en la ecuación (2.19) la contante Fs se evalúa en v12 = 0. La fricción
de Coulomb, en cambio, sólo aparece cuando el movimiento se está realizando
(v12 6= 0) y es constante para velocidades del mismo signo. En la figura 2.10 se
muestran gráficamente las funciones constitutivas en (2.18), (2.19) y (2.20).
Dado que las fuerzas de fricción estática y de Coulomb no tienden a ce-
ro cuando la velocidad tiende a cero, estas fricciones son las responsables
de algunos problemas en sistemas de control de posición: la diferencia entre
la posición que se desea alcanzar y la posición realmente alcanzada por el
mecanismo es diferente de cero, lo que se conoce como “un error en estado
2.3 Disipadores de energı́a 29

F F F
Fs Fc
b

v 12 v 12 v 12

à Fs à Fc

Figura 2.10. Funciones constitutivas definidas en (2.18), (2.19) y (2.20).

estacionario diferente de cero”. Por otro lado, dado que las fricciones estática
y de Coulomb tienen funciones constitutivas no lineales y discontinuas, no
pueden ser manejadas usando técnicas de control por sistemas lineales ni por
las técnicas de control para sistemas no lineales “suaves”. Esta es la razón
por las que con frecuencia no son consideradas en el modelado de sistemas.
Sin embargo, hay que tener presente que en cualquier situación experimental
se observarán los efectos de estas dos fricciones. Se sugiere consultar [4] si se
desea conocer algunos métodos para medir los parámetros de distintos tipos
de fricción.

2.3.2. Sistemas mecánicos rotativos

Los disipadores en sistemas mecánicos rotativos (véase la figura 2.11) son


idénticos a los disipadores en sistemas mecánicos traslacionales. La única di-
ferencia es que las variables generalizadas de esfuerzo y flujo están expresadas
en términos de velocidad angular ω12 (ω12 = e, esfuerzo) y par T (T = f ,
flujo):
1
ω12 = T, fricción viscosa (2.21)
b
T = ±Ts |ω12 =0 , fricción estática
½
+1, si ω12 > 0
T = Tc signo(ω12 ), signo(ω12 ) = , fricción de Coulomb
−1, si ω12 < 0

2.3.3. Sistemas eléctricos

El componente disipador en sistemas eléctricos es aquel en el cual es ne-


cesario aplicar un voltaje v12 (v12 = e, esfuerzo) entre sus terminales para
mantener el flujo de una corriente i (i = f , flujo) a través de él. La función
constitutiva correspondiente relaciona de manera estática estas dos variables
30 2 Modelado matemático de sistemas fı́sicos

T !1 !2 T

! 12

Figura 2.11. Un disipador en sistemas mecánicos rotativos.

y está definida por la Ley de Ohm [2], pág. 530, en el caso de que el disipador
sea lineal:

v12 = iR (2.22)

donde R es una constante positiva conocida como la resistencia eléctrica del


disipador. En la figura 2.12 se muestra una resistencia eléctrica por la que
fluye una corriente i y se aplica un voltaje v12 . Los sentidos mostrados son los
definidos como positivos. De acuerdo a w = ef , la potencia disipada en una
resistencia eléctrica está dada como:
1 2
w = i2 R = v
R 12

v 12

i
1 2
+ à

Figura 2.12. Una resistencia como disipador en sistemas eléctricos.

2.4. Fuentes de energı́a


Las fuentes de energı́a pueden ser de dos tipos: fuentes de esfuerzo (e) y
fuentes de flujo f . En las figuras 2.13(a) y 2.13(b) se muestran ambos tipos
de fuentes y los sentidos definidos como positivos para el esfuerzo y el flujo.
También se muestran dos dibujos en los que especifica que una fuente de
esfuerzo (o de flujo) entrega un esfuerzo (o un flujo) que es independiente
(constante) del flujo (o esfuerzo) a través de la fuente. Más aún, cuando la
potencia w = ef es positiva, entonces w es la potencia que la fuente entrega
a los otros componentes del sistema; cuando la potencia w = ef es negativa,
entonces w es la potencia que la fuente recibe desde los otros componentes del
sistema.
2.4 Fuentes de energı́a 31

f
e
e1
+
e1 Recibe Entrega
potencia potencia
à
f
(a)
f
f1
+
f1 Recibe Entrega
e potencia potencia
à
e
(b)

Figura 2.13. Fuentes de esfuerzo y de flujo.

2.4.1. Sistemas mecánicos traslacionales

Una fuente de fuerza es una fuente de flujo, por lo que la fuente entrega
una fuerza cuyo valor es independiente de la velocidad (esfuerzo) del compo-
nente del sistema sobre el cual se está aplicando dicha fuerza. Una fuente de
velocidad es una fuente de esfuerzo, por lo que la velocidad que produce es
independiente de la fuerza (flujo) ejercida sobre el componente del sistema
correspondiente. Claramente es mucho más fácil visualizar lo que es una fuen-
te de fuerza que una fuente de velocidad. Sin embargo, algunos fenómenos
pueden ser modelados de manera conveniente como fuentes de velocidad.

2.4.2. Sistemas mecánicos rotativos

Las fuentes se definen como en el caso de sistemas mecánicos traslacionales,


pero en términos de par (flujo) y velocidad angular (esfuerzo).

2.4.3. Sistemas eléctricos

Una fuente de corriente eléctrica es una fuente de flujo, por lo que la fuente
entrega una corriente eléctrica cuyo valor es independiente del voltaje (esfuer-
zo) entre sus terminales. Una fuente de voltaje es una fuente de esfuerzo, por
lo que el voltaje entre sus terminales es independiente de la corriente eléctrica
a través de ella. Tal como sucede en los sistemas mecánicos, es más fácil visua-
lizar una clase de fuentes: el concepto de fuente de voltaje es más claro que el
de una fuente de corriente eléctrica. Sin embargo, el uso de fuentes de corrien-
te es un artificio muy útil para modelar algunos efectos que se presentan, por
ejemplo, en circuitos electrónicos.
32 2 Modelado matemático de sistemas fı́sicos

2.5. Convertidores
Los convertidores son componentes que simplemente permiten que la
energı́a fluya a través de ellos sin almacenarla ni disiparla. Estos componentes
están conectados a través de dos puertos (vése la figura 2.14). Cada puerto
esta definido por una variable generalizada de esfuerzo y una de flujo. El pa-
pel de los convertidores es modificar las variables de esfuerzo y de flujo en
el segundo puerto respecto de las variables de esfuerzo y de flujo que existen
en el primer puerto. Este proceso es realizado de manera que la energı́a en el
segundo puerto es igual a la energı́a en el primer puerto. Esos componentes
se pueden clasificar en dos tipos: i) los transformadores, en los cuales las va-
riables de esfuerzo y de flujo en ambos puertos son de la misma naturaleza e
ii) los adaptadores, en lo cuales las variables de esfuerzo y flujo en un puerto
son de naturaleza diferente a las del otro puerto.

f1 f2

Puerto 1 Convertidor Puerto 2


e1 e2

Figura 2.14. Un convertidor tiene dos puertos.

2.5.1. Transformadores

Sistemas eléctricos

Un transformador eléctrico esta formado por dos inductores (conduc-


tores eléctricos) enrollados firmemente sobre un mismo núcleo de material
ferromagnético (véase la figura 2.15). Esto significa que los inductores están
magnéticamente acoplados pero eléctricamente aislados.
Cada inductor define un puerto. En el puerto 1, v1 representa la variable
de esfuerzo e i1 representa la variable de flujo. En el puerto 2, v2 representa
la variable de esfuerzo e i2 representa la variable de flujo. Las direcciones
indicadas representan los sentidos definidos como positivos de estas variables.
El punto colocado en la parte superior de cada inductor se usa como una
convención para indicar que los inductores se enrollan en la misma dirección.
Si no fuera este el caso entonces los puntos se colocarán en extremos opuestos
de los inductores. El inductor conectado al puerto 1 consta de n1 vueltas y el
inductor conectado al puerto 2 consta de n2 vueltas.
2.5 Convertidores 33

Como los inductores están acoplados magnéticamente, el flujo concatenado


por el inductor 1, λ1 , y por el inductor 2, λ2 , dependen ahora de las corrientes
en ambos inductores:

λ1 = L1 i1 + M12 i2 , (2.23)
λ2 = M21 i1 + L2 i2 (2.24)

donde L1 , L2 son las inductancias de los inductores 1 y 2, mientras que M12


y M21 son las inductancias mutuas existentes entre ambos circuitos. Siempre
se cumple que M12 = M21 = M . Los signos positivos en las expresiones
anteriores son debidos a que las orientaciones de las corrientes son tales que
la corriente positiva entra a los arrollamientos por los extremos marcados con
un punto. Despejando i2 de (2.23) y sustituyendo en (2.24) se obtiene:
µ ¶
L2 L1 L2
λ2 = λ1 + M − i1 (2.25)
M M

Se define el coeficiente de acoplamiento como:


M
k=√
L1 L2
Si los circuitos están completamente desacoplados entonces k = 0, pero si
los dos circuitos están perfectamente acoplados de modo que todo el flujo
que es encerrado por el inductor 1 también es encerrado por el inductor 2,
entonces k = 1. Este caso es obtenido con muy buen grado de aproximación
en la práctica si el núcleo sobre el cual se enrollan los dos inductores es de
material ferromagnético con un valor grande de permeabilidad
√ magnética µ.
Suponiendo que este es el caso, es decir que M = L1 L2 , entonces (2.25) se
convierte en:
r
L2
λ2 = λ1 (2.26)
L1

i2
+
v2
à
n2
i1

+ n1
v1
à

Figura 2.15. Transformador eléctrico.


34 2 Modelado matemático de sistemas fı́sicos

Por otro lado, dividiendo (2.24) entre (2.23), con M12 = M21 = M , y usando
(2.26):
r
λ2 M i1 + L2 i2 L2
= =
λ1 L1 i1 + M i2 L1
A partir de esto se puede escribir:

i2 L1 L2 − M
= q
i1 L2 − L L1 M
2

√ √ r
√L1 ( L1 L2 − M )
L2 L1
= √ = (2.27)
L1 L2 − M L2

La inductancia de cada circuito está dada como:


n21 A
L1 = µ
l
n22 A
L2 = µ
l
donde A, l y µ son, respectivamente, el area, la longitud media y la permea-
bilidad magnética del núcleo. Por tanto
r
L1 n1
= (2.28)
L2 n2

Usando esto y (2.13) se obtiene, de (2.26):


n2
v2 = v1
n1

y de (2.27):
n1
i2 = i1
n2
Lo cual significa que la potencia en ambos puertos es igual porque:
n2 n1
w2 = v2 i2 = v1 i1 = v1 i1 = w1
n1 n2

Sistemas mecánicos traslacionales

En la figura 2.16 se muestra un transformador mecánico traslacional ası́ co-


mo las variables definidas y los sentidos definidos positivos de las mismas. Se
trata de una palanca con brazos de longitud a y b. Las posiciones x1 y x2 se
obtienen por simple geometrı́a:
2.5 Convertidores 35

x1 = a sin(α), x2 = b sin(α)

Derivando respecto al tiempo y dividiendo ambos resultados se obtiene la


relación entre esfuerzos:
b
v2 = v1
a
La relación entre las fuerzas (flujos) en cada puerto se obtiene usando el
principio del trabajo virtual:

F1 δx1 = F2 δx2
δx1 = aδ sin(α), δx2 = bδ sin(α)
a
F2 = F1
b
Nótese que la potencia en ambos puertos es igual:
b ³a ´
w2 = v2 F2 = v1 F1 = F1 v1 = w1
a b

F2

b
v2

a ë

v1

F1

Figura 2.16. Transformador mecánico traslacional.

Sistemas mecánicos rotativos

En la figura 2.17 se muestran dos ruedas dentadas de radios r1 y r2 unidas,


cada una, a un eje rotativo. La rueda de radio r1 tiene n1 dientes mientras que
la rueda de radio r2 tiene n2 dientes. En la figura 2.17 también se muestran
los sentidos definidos como positivos de los pares y las velocidades angulares
36 2 Modelado matemático de sistemas fı́sicos

en cada rueda. El hecho de que las ruedas sean dentadas evita que las ruedas
puedan patinar. Esto asegura que la longitud de arco de cı́rculo s generado
por un ángulo θ1 descrito en el eje 1 sea igual a la longitud de arco generado
por un ángulo θ2 en el eje 2. Existe una relación geométrica que relaciona al
radio de un cı́rculo, el ángulo descrito por el mismo y la longitud del arco de
cı́rculo generado. Aplicando esta relación en ambos ejes se tiene:

s = θ1 r1 , s = θ2 r2 (2.29)

donde θ1 y θ2 deben estar dados en radianes. De lo anterior se obtiene:

θ1 r1 = θ2 r2 (2.30)

T1 T2
ò1 s ò2
!1 r1 r2 !2
n1
n2
F

Figura 2.17. Caja de engranes.

Por otro lado, se sabe que el paso de los engranes α (ancho de cada diente)
es igual en ambos ejes, pues esto es necesario para que dichos dientes se
adapten correctamente al girar. Esto significa que:

p1 = αn1 , p2 = αn2
p1 = 2πr1 , p2 = 2πr2

donde p1 y p2 representan los perı́metros de cada una de las ruedas dentadas.


Combinando estas expresiones se tiene:
r1 n1
= (2.31)
r2 n2

Combinando (2.30) y (2.31):


n2
θ1 = θ2
n1
Derivando respecto al tiempo se obtiene:
2.5 Convertidores 37
n2
ω1 = ω2 (2.32)
n1
donde ω1 y ω2 son las velocidades angulares de cada rueda. Por otro lado, la
fuerza F aplicada en el punto donde hacen contacto las ruedas es igual para
ambas. Esta fuerza satisface:

T1 = F r1 , T2 = F r2

donde T1 y T2 son los pares aplicados a cada eje. Despejando F e igualando:


r1 n1
T1 = T2 = T2 (2.33)
r2 n2
Usando (2.33) y (2.32) se encuentra que la potencia en ambos puertos es igual:
n1 n2
w1 = T1 ω1 = T2 ω2 = T2 ω2 = w2
n2 n1

2.5.2. Adaptadores

Sistemas mecánicos

Considere el sistema piñón-cremallera mostrado en la figura 2.18. El puerto


1 está definido en términos de variables rotativas: la velocidad angular ω1 es
el esfuerzo y el par T1 es el flujo, mientras que el puerto 2 está definido en
términos de variables de traslación: la velocidad v2 es el esfuerzo y la fuerza
F2 es el flujo. Por definición, el par T1 y la fuerza F2 se relacionan a través
de:

T1 = rF2 (2.34)

donde r es el radio del piñón, mientras que la velocidad angular ω1 y la


velocidad v2 se relacionan a través de (véase (2.29)):

v2 = rω1 (2.35)

Por tanto, la potencia en ambos puertos es igual:


1
w1 = T1 ω1 = rF2 v2 = F2 v2 = w2
r
Los sentidos mostrados en la figura 2.18 son los definidos como positivos.

Sistemas electromecánicos

En la figura 2.19 se muestra una espira cuadrada de area A = l2 colocada


dentro de un campo magnético B. Por la espira circula una corriente eléctrica
i, en el sentido indicado, por efecto de una fuente de voltaje externa de valor E.
38 2 Modelado matemático de sistemas fı́sicos
!1

r
T1

F2 v2

Figura 2.18. Piñón-cremallera.

N S

àv+

R
L
i
à +
E
(a) Vista superior.
F
B
ò
N S

F
(b) Vista frontal.

Figura 2.19. Motor eléctrico de CD.

La resistencia R y la inductancia L mostradas en la figura 2.19(a) representan


la resistencia del cobre y la inductancia de la espira. La fuerza que ejerce el
campo magnético sobre una corriente eléctrica de longitud l está dada como
[2], pág. 541:
2.5 Convertidores 39

F̄ = ilū × B̄ (2.36)

donde ū es un vector unitario en el mismo sentido de la corriente eléctrica y


se usa la barra arriba de las variables para indicar que se trata de vectores.
El sı́mbolo “×” representa el producto vectorial. Por tanto, bajo la situación
mostrada en la figura 2.19(b), es decir cuando θ = 90◦ , el campo magnético
ejerce sobre los lados izquierdo y derecho de la espira la fuerza:

F = ilB

en el sentido indicado. Esto significa que sobre el eje de la espira se ejerce un


par de valor:
l
T = 2 F = iBl2 = iBA
2
donde se ha considerado que el par debido a la fuerza en cada lado es lF/2
(fuerza por radio) y que hay dos fuerzas aplicadas de la misma magnitud: una
aplicada sobre el lado izquierdo y otra sobre el lado derecho de la espira. El
lector puede verificar que, de acuerdo a (2.36), las fuerzas sobre los lados de
la espira que están atrás y adelante no producen ningún par de giro. Todo
lo anterior significa que la espira gira con una velocidad angular ω = −θ̇, es
decir, en sentido contrario al definido para θ en la figura 2.19(b) donde θ es el
ángulo formado por las direcciones del campo magnético y la perpendicular
a la espira. De acuerdo a la Ley de Faraday [3], pág. 325, este movimiento
induce un voltaje v en las terminales de la espira el cual está dado de acuerdo
a (2.13), es decir:

v=
dt
donde λ es el flujo magnético concatenado por la espira el cual está dado por:

λ = BA cos(θ)

Por tanto, usando estas dos expresiones se encuentra:

v = −BAθ̇ sin(θ) = BAω sin(θ)

Nótese que, de acuerdo a la Ley de Lenz [3], pág. 327, el voltaje inducido v
tiene una polaridad tal (véase la figura 2.19(a)) que se opone a la causa que
lo produce la cual en este caso es, a fin de cuentas, la corriente que circula i.
Ahora suponga que se colocan varias espiras con diferentes inclinaciones, de
manera que un conmutador mecánico automáticamente conecte y desconecte
las espiras de tal modo que siempre esté conectada sólamente la espira para
la cual θ = 90◦ . Entonces, el voltaje en las terminales del conjunto está dado
como:

v = BAω
40 2 Modelado matemático de sistemas fı́sicos

Lo que se acaba de describir es el funcionamiento de un motor eléctrico de CD


(corriente directa). Sean el voltaje v y la corriente i las variables de esfuerzo
y flujo, respectivamente, del puerto 1 y sean la velocidad angular ω y el par T
las variables de esfuerzo y flujo, respectivamente, del puerto 2. Las relaciones
entre las variables de ambos puertos están dadas por:

v = BAω (2.37)
1
i= T
BA
Si se considera que en el puerto 1 se aplica un par T a una velocidad ω,
produciendo en el puerto 2 un voltaje v y una corriente eléctrica i, entonces
se tiene un generador eléctrico de CD y ambas expresiones en (2.37) aún son
válidas. Nótese que en cualquiera de estos casos, la potencia en ambos puertos
es igual:
1
w1 = vi = T BAω = T ω = w2
BA
En situaciones más generales se acostumbra escribir las expresiones en (2.37)
del siguiente modo:

v = ke ω (2.38)
T = km i (2.39)

donde ke > 0 y km > 0 se conocen, respectivamente, como la constante de


fuerza contra electromotriz y la constante de par. Estas constantes se intro-
ducen para tomar en consideración la presencia de varias espiras en serie y
otras variantes en la construcción de motores y generadores de CD. Se puede
usar el hecho de que la potencia en ambos puertos es igual:
1
w1 = vi = ke ω T = T ω = w2
km
para mostrar que ke = km en cualquier motor (generador) de CD. Sin embar-
go, hay que tener cuidado con las unidades: ke = km se cumple siempre que
estas constantes se expresen en el sistema internacional de unidades (metro-
kilogramo-segundo).

Sistemas electromecánicos: fuerza debida a un campo magnético

En la figura 2.20 se muestra una barra de material ferromagnético colocada


a una distancia x de un electroimán. El electroimán consiste de un inductor
arrollado sobre un núcleo del mismo material ferromagnético que la barra. Por
el inductor circula una corriente eléctrica i por efecto de un voltaje v aplicado
en sus terminales.
La inductancia L(x) es dependiente de la posición x de la barra debido a lo
siguiente. De acuerdo a (2.12), el flujo magnético está dado como el producto
2.5 Convertidores 41
x

i
+
F
v
à
õ

Figura 2.20. Fuerza debida un campo magnético.

de la inductancia y la corriente eléctrica λ = L(x)i. Por otro lado, si la barra


se aproxima al núcleo entonces el espacio entre ambos disminuye. Como el aire
presenta mayor resistencia al paso del flujo magnético que la resistencia que
presenta un material ferromagnético, entonces el flujo magnético aumenta al
disminuir x. Si la corriente eléctrica se mantiene constante mientras se reduce
x entonces, de acuerdo a λ = L(x)i un aumento del flujo λ solo puede ser
debido a un aumento en la inductancia L(x), es decir, que la inductancia
cambia al cambiar x.
Por efecto del campo magnético generado por la corriente i, la barra recibe
una fuerza de atracción F hacia el núcleo del electroimán. A continuación
se obtiene una expresión para esta fuerza. Suponga que la barra sufre un
desplazamiento dx. El trabajo mecánico debido a este desplazamiento es:

dEM = F dx (2.40)

De acuerdo a (2.14), la energı́a almacenada en el campo magnético está dada


como:
1
Em = L(x)i2 (2.41)
2
Como la corriente se mantiene constante y sólo hay un cambio en la posición
de la barra, entonces el cambio en la energı́a magnética está dado por:
1 2
dEm = i dL(x) (2.42)
2
Los cambios en las energı́as mecánica y magnética deben ser suministrados
por la fuente de voltaje conectada a la inductancia, es decir:

dEv = dEm + dEM (2.43)

donde dEv es el trabajo suministrado por la fuente de voltaje. Este trabajo


debe ser realizado compensando el voltaje inducido en la inductancia el cual,
de acuerdo a (2.13) y λ = L(x)i, está dado como:
42 2 Modelado matemático de sistemas fı́sicos

dλ dL(x)
v= =i
dt dt
Por tanto:

dEv = vidt = i2 dL(x) (2.44)

Sustituyendo (2.42) y (2.44) en (2.43):


1 1
dEM = i2 dL(x) − i2 dL(x) = i2 dL(x)
2 2
es decir, la mitad del trabajo realizado por la fuente de voltaje se dedica a
cambiar la energı́a magnética y la otra mitad se dedica a realizar el trabajo
mecánico, es decir;

dEm = dEM (2.45)

Por otro lado, como el cambio en la energı́a magnética sólo se debe al cambio
en la posición x, entonces se puede escribir:
∂Em
dEm = dx
∂x
Entonces, de acuerdo a esto, (2.40), (2.45) y (2.41) se concluye que:

∂Em 1 ∂L(x)
F = = i2 (2.46)
∂x 2 ∂x
El desarrollo aquı́ presentado se basa en las ideas reportadas en [5], cap. 5.

2.6. Ejemplos
Una vez que se han establecido las funciones constitutivas de cada ele-
mento de sistema se debe abordar el problema de conectar varios de estos
elementos para obtener el modelo matemático de sistemas más o menos com-
plejos. La clave para interconectar los elementos de un sistema mecánico es
considerar que todos ellos se conectan mediante uniones rı́gidas. Esto significa
que la velocidad a ambos lados de una unión es igual. Para ser más claros, a
continuación se presentan varios ejemplos.
Ejemplo 2.2 Considere el sistema masa-resorte-amortiguador mostrado en
la figura 2.21(a) donde se aplica una fuerza externa F (t) sobre el cuerpo de
masa m. Este sistema quizá sea el más sencillo desde el punto de vista del
modelado, pero es muy importante desde el punto de vista de control porque
representa el comportamiento básico de los sistemas de control de posición.
En la figura 2.21(b) se muestra el diagrama de cuerpo libre correspondien-
te. Nótese que en cada unión entre componentes existen dos fuerzas iguales
2.6 Ejemplos 43

aplicadas en sentidos contrarios. Esto es con el fin de satisfacer la Tercera


Ley de Newton [2], pág. 88, que establece que a cada acción (del cuerpo A
sobre el cuerpo B) corresponde una reacción (del cuerpo B sobre el cuerpo
A). Las ruedas debajo del cuerpo se usan para indicar que no existe fricción
con el suelo sobre el cual se apoya. Esto también significa que el efecto de la
gravedad no interviene. Sin embargo, equivalentemente se podrı́a eliminar el
amortiguador colocado en el extremo derecho para ser sustituido por fricción
entre el cuerpo y el suelo. El modelado de la fricción entre el cuerpo y el sue-
lo se realiza de manera idéntica a como se considera el amortiguador en el
procedimiento que sigue.

K F (t) b
m

(a)
vK vm vb
F (t)
FK Fb
m
FK Fb
(b) Diagrama de cuerpo libre.

Figura 2.21. Sistema masa-resorte-amortiguador.

La nomenclatura utilizada es la siguiente:


vm = dxdtm , donde xm es la posición del cuerpo.
vb = dx
dt , donde xb es la posición del extremo móvil del amortiguador.
b

dxK
vK = dt , donde xK es la posición del extremo móvil del resorte.
Usando la figura 2.21(b), ası́ como (2.4), (2.7), (2.18) se obtienen las siguien-
tes expresiones:
dvm
masa: m = F (t) + FK − Fb (2.47)
dt
resorte: KxK = FK (2.48)
amortiguador: bvb = Fb (2.49)

Nótese que, de acuerdo a la convención de signos mostrada en la figura 2.3, las


fuerzas que actúan sobre la masa m y que tienen el mismo sentido que vm en
la figura 2.21(b) aparecen con signo positivo en (2.47) y por esa misma razón
Fb aparece afectada por un signo negativo. Los signos a ambos lados de las
expresiones en (2.48) y (2.49) respetan las convenciones de signos definidas
en las figuras 2.4 y 2.9, respectivamente. Nótese que uno de los extremos del
resorte y del amortiguador está en reposo y que son los extremos móviles los
44 2 Modelado matemático de sistemas fı́sicos

que en las figuras 2.4 y 2.9 tienen una velocidad y una fuerza aplicadas en el
mismo sentido. Nótese también que se ha definido:
dxK
vK = (2.50)
dt
Considerando que los diferentes elementos de sistema se conectan mediante
uniones rı́gidas, de acuerdo a la figura 2.21(b) se puede escribir:
vK = −vm = −vb (2.51)
De acuerdo a esto se concluye que se puede escribir:
xK = −xm + c1 = −xb + c2
donde c1 y c2 son dos constantes. Si se usa la convención de definir xK = 0,
xm = 0 y xb = 0 como aquellos puntos ocupados por el extremo móvil del
resorte, el centro del cuerpo de masa m y el extremo móvil del amortiguador,
respectivamente, cuando el sistema está en reposo con F (t) = 0, entonces se
puede decir que c1 = c2 = 0 y, por tanto:
xK = −xm = −xb
Usando estas relaciones, también se puede escribir (2.47), (2.48), (2.49) co-
mo:
d2 xm dxm
m +b + Kxm = F (t) (2.52)
dt2 dt
Esta última expresión es una ecuación diferencial ordinaria, de segundo or-
den, lineal y de coeficientes constantes, que representa el modelo matemático
del sistema masa-resorte-amortiguador. Esto significa que si se conocen los
parámetros m, b y K, ası́ como las condiciones iniciales xm (0), dxdtm (0) y la
fuerza externa aplicada F (t) como una función del tiempo, entonces se puede
resolver dicha ecuación diferencial para obtener la posición xm (t) y la velo-
cidad dxdtm (t) del cuerpo como funciones del tiempo. Dicho de otro modo, se
puede conocer la posición y la velocidad del cuerpo en cualquier instante de
tiempo presente o en el futuro, es decir, para todo t ≥ 0. Finalmente, cuando
se estudia la solución de las ecuaciones diferenciales es conveniente expresar
una ecuación diferencial de manera que el coeficiente de la potencia mayor
sea igual a la unidad, es decir, es más conveniente escribir (2.52) como:
b K 1
ẍm + ẋm + xm = F (t) (2.53)
m m m
d2 xm dxm
donde ẍm = dt2 y ẋm = dt .

Ejemplo 2.3 En la figura 2.22(a) se muestra un sistema masa-resorte-


amortiguador con un resorte y un amortiguador colocados en un mismo ex-
tremo del cuerpo de masa m. El objetivo de este ejemplo es mostrar que el
modelo matemático en este caso es idéntico al obtenido en el ejemplo previo.
La nomenclatura utilizada es la siguiente:
2.6 Ejemplos 45

v = dx
dt , donde x es la posición del cuerpo.
v1 = dxdtK = dx
dt , donde xK = xb representan la posición del extremo móvil
b

del resorte y del amortiguador, respectivamente.


De acuerdo a la figura 2.22(b) y a (2.4), (2.7), (2.18), se obtienen las siguien-
tes expresiones:
dv
masa: m = F (t) + FK + Fb (2.54)
dt
resorte: KxK = FK
amortiguador: bv1 = Fb

m F(t)

(a)
v1 v
FK
FK
Fb m F(t)
Fb

v1
(b) Diagrama de cuerpo libre.

Figura 2.22. Sistema masa-resorte-amortiguador.

Nótese que, de acuerdo a la convención de signos mostrada en la figura


2.3, todas las fuerzas en (2.54) aparecen afectadas por un signo positivo porque
tienen el mismo sentido que v en la figura 2.22(b). Por otro lado, al existir
una unión rı́gida y de acuerdo a los sentidos definidos en la figura 2.22(b) se
tiene que:

v = −v1 (2.55)

Del mismo modo a como se hizo en el ejemplo previo, si x = 0, xK = 0 y


xb = 0 se definen, respectivamente, como el centro del cuerpo m y el extremo
móvil del resorte y del amortiguador cuando el sistema completo está en reposo
con F (t) = 0, entonces se puede escribir:

xK = xb = −x (2.56)
46 2 Modelado matemático de sistemas fı́sicos

No es difı́cil darse cuenta que combinando las expresiones en (2.54) y usando


(2.56), (2.55) se obtiene:

b K 1
ẍ + ẋ + x = F (t)
m m m
2
donde ẍ = ddt2x y ẋ = dx
dt . Este modelo matemático es idéntico al mostrado en
(2.53) si se considera que x = xm .
Ejemplo 2.4 En la figura 2.23(a) se muestran dos cuerpos unidos por un
resorte cuando se aplica una fuerza externa F (t) sobre el cuerpo de la izquier-
da. Esta situación representa el caso práctico en el que el cuerpo 1 transmite
movimiento al cuerpo 2 pero ambos cuerpos están conectados mediante una
pieza mecánica que presenta flexibilidad. Esta flexibilidad no es introducida
de manera intencional sino que es un problema no deseado que aparece debido
a la rigidez finita del material con el que está hecha la pieza mecánica que
une a los cuerpos 1 y 2. Con frecuencia es muy importante estudiar cual es
el efecto de esta flexibilidad en el desempeño del sistema de control y por eso
debe ser tomada en consideración durante el modelado. Los amortiguadores
se introducen para considerar el efecto de la fricción de cada cuerpo con sus
soportes (o el suelo).

F (t)
K
m1 m2

b1 b2
(a)
v m1 vK v m2 v b2
F (t) F K1 K F b2
F b1
m1 m2
v b1 F b1 F K1 F K2 F K2 F b2

v1 v2
(b) Diagrama de cuerpo libre.

Figura 2.23. Dos cuerpos unidos por un resorte.

El diagrama de cuerpo libre correspondiente se muestra en la figura 2.23(b).


La nomenclatura utilizada es la siguiente:
vm1 = dxdtm1 , donde xm1 es la posición del cuerpo 1.
vm2 = dxdtm2 , donde xm2 es la posición del cuerpo 2.
vb1 = dxdtb1 , donde xb1 es la posición del extremo móvil del amortiguador
1.
2.6 Ejemplos 47

vb2 = dxdtb2 , donde xb2 es la posición del extremo móvil del amortiguador
2.
v1 = dx
dt , donde x1 es la posición del extremo del resorte unido al cuerpo
1

1.
v2 = dx
dt , donde x2 es la posición del extremo del resorte unido al cuerpo
2

2.
Usando la figura 2.23(b), ası́ como (2.4), (2.7), (2.18), se obtienen las si-
guientes expresiones:
dvm1
masa 1: m1 = F (t) + Fb1 − FK1 (2.57)
dt
dvm2
masa 2: m2 = FK2 − Fb2 (2.58)
dt
resorte: KxK = FK1 = FK2
amortiguador 1: b1 vb1 = Fb1
amortiguador 2: b2 vb2 = Fb2

Las fuerzas que tienen el mismo sentido que vm1 y vm2 , y que actúan sobre
cada uno de los cuerpos, aparecen afectadas con un signo positivo y con un
signo negativo en caso contrario. Nótese también que se ha definido:
dxK
vK = = v1 − v2
dt
Considerando que todos los elementos del sistema se conectan mediante unio-
nes rı́gidas entonces, de acuerdo a la figura 2.23(b) se tiene que:

vm1 = −vb1 = v1 (2.59)


vm2 = vb2 = v2

De acuerdo a esto, si se definen xm1 = 0, xm2 = 0, xb1 = 0, xb2 = 0,


x1 = 0, x2 = 0 como aquellos puntos ocupados por el centro del cuerpo 1, el
centro del cuerpo 2, el extremo móvil del amortiguador 1, el extremo móvil
del amortiguador 2, el extremo del resorte que está unido al cuerpo 1 y el
extremo del resorte que está unido al cuerpo 2, respectivamente, cuando todo
el sistema está en reposo con F (t) = 0, entonces se concluye que:

xm1 = −xb1 = x1 , (2.60)


xm2 = xb2 = x2

Por tanto, las expresiones en (2.57) y (2.58) se pueden escribir como:

dvm1
masa 1: m1 = F (t) + b1 vb1 − KxK
dt
dvm2
masa 2: m2 = KxK − b2 vb2
dt
48 2 Modelado matemático de sistemas fı́sicos

Usando (2.59) y (2.60) se obtiene:

d2 xm1 dxm1
masa 1: m1 2
= F (t) − b1 − KxK
dt dt
d2 xm2 dxm2
masa 2: m2 = KxK − b2
dt2 dt
Por otro lado, de acuerdo al párrafo que sigue a (2.6) se tiene que xK =
x1 − x2 , por lo que se puede escribir:

d2 xm1 dxm1
masa 1: m1 = F (t) − b1 − K(x1 − x2 )
dt2 dt
d2 xm2 dxm2
masa 2: m2 = K(x1 − x2 ) − b2
dt2 dt
Finalmente, usando de nuevo (2.60) se obtiene que el modelo matemático
correspondiente está dado por las dos siguientes ecuaciones diferenciales, las
cuales deben ser resueltas simultáneamente:
d2 xm1 b1 dxm1 K 1
masa 1: 2
+ + (xm1 − xm2 ) = F (t)
dt m1 dt m1 m1
d2 xm2 b2 dxm2 K
masa 2: 2
+ − (xm1 − xm2 ) = 0
dt m2 dt m2
Estas dos ecuaciones diferenciales no pueden ser combinadas para obtener
una sola ecuación diferencial, ya que las variables xm1 y xm2 son linealmente
independientes, es decir, no se cuenta con ninguna expresión algebraica que
relacione a estas variables.
Ejemplo 2.5 En la figura 2.24(a) se muestran dos cuerpos conectados a tres
resortes y un amortiguador. En este caso, el amortiguador representa la fric-
ción existente entre los dos cuerpos y, por esto, no puede ser sustituido por la
posible fricción existente entre cada cuerpo y el suelo (si no estuvieran colo-
cadas las ruedas debajo de cada cuerpo). El diagrama de cuerpo libre corres-
pondiente se muestra en la figura 2.24(b). La nomenclatura utilizada es la
siguiente:
ẋ1 = dxdt , donde x1 es la posición del cuerpo 1.
1

dx2
ẋ2 = dt , donde x2 es la posición del cuerpo 2.
vb1 = dxdtb1 , donde xb1 es la posición del extremo del amortiguador que
está conectado al cuerpo 1.
vb2 = dxdtb2 , donde xb2 es la posición del extremo del amortiguador que
está conectado al cuerpo 2.
v1 = dxdt , donde x es la posición del extremo del resorte unido al cuerpo 1.
dy
v2 = dt , donde y es la posición del extremo del resorte unido al cuerpo 2.
vK1 = dxdtK1 , donde xK1 es la posición del extremo móvil del resorte co-
nectado sólo al cuerpo 1.
2.6 Ejemplos 49

F(t) x1 K2 x2
K1 K3
m1 m2

b
(a)
F K2 F K2
v K1 x1 x2
F K2 F K3
F K1 F K2 F K3
m1 v1 v2 m2
Fb
F K1 F(t) Fb v K3
Fb Fb
v b1 v b2
(b) Diagrama de cuerpo libre.

Figura 2.24. Sistema con dos cuerpos y tres resortes.

vK3 = dxdtK3 , donde xK3 es la posición del extremo móvil del resorte co-
nectado sólo al cuerpo 2.
Usando la figura 2.24(b), ası́ como (2.4), (2.7), (2.18), se obtienen las si-
guientes expresiones:

masa 1: m1 ẍ1 = F (t) + FK1 − FK2 − Fb (2.61)


masa 2: m2 ẍ2 = FK2 − FK3 + Fb (2.62)
resorte entre cuerpos: K2 xK2 = FK2
resorte izquierdo: K1 xK1 = FK1
resorte derecho: K3 xK3 = FK3
amortiguador: b(vb1 − vb2 ) = Fb

Considerando que todos los elementos del sistema se conectan mediante unio-
nes rı́gidas entonces, de acuerdo a la figura 2.24(b) se tiene que:

ẋ1 = −vK1 = v1 = vb1 (2.63)


ẋ2 = vb2 = v2 = vK3

De acuerdo a esto, si se definen x1 = 0, x2 = 0, xb1 = 0, xb2 = 0, x = 0, y = 0,


xK1 = 0, xK3 = 0 como aquellos puntos ocupados por el centro del cuerpo 1,
el centro del cuerpo 2, el extremo del amortiguador conectado al cuerpo 1, el
extremo del amortiguador conectado al cuerpo 2, el extremo del resorte central
que está unido al cuerpo 1, el extremo del resorte central que está unido al
cuerpo 2, el extremo móvil del resorte de la izquierda y el extremo móvil del
50 2 Modelado matemático de sistemas fı́sicos

resorte de la derecha, respectivamente, cuando todo el sistema está en reposo


con F (t) = 0, entonces se concluye que:

x1 = −xK1 = x = xb1 (2.64)


x2 = xb2 = y = xK3

Por tanto, las expresiones en (2.61) y (2.62) se pueden escribir como:

masa 1: m1 ẍ1 = F (t) + K1 xK1 − K2 xK2 − b(vb1 − vb2 )


masa 2: m2 ẍ2 = K2 xK2 − K3 xK3 + b(vb1 − vb2 )

Usando (2.63) y (2.64) se obtiene:

masa 1: m1 ẍ1 = F (t) − K1 x1 − K2 xK2 − b(ẋ1 − ẋ2 )


masa 2: m2 ẍ2 = K2 xK2 − K3 x2 + b(ẋ1 − ẋ2 )

Por otro lado, de acuerdo al párrafo que sigue a (2.6) se tiene que xK2 =
x1 − x2 , por lo que se puede escribir:

masa 1: m1 ẍ1 = F (t) − K1 x1 − K2 (x1 − x2 ) − b(ẋ1 − ẋ2 )


masa 2: m2 ẍ2 = K2 (x1 − x2 ) − K3 x2 + b(ẋ1 − ẋ2 )

Finalmente, se obtiene que modelo matemático correspondiente está dado por


las dos siguientes ecuaciones diferenciales, las cuales deben ser resueltas si-
multáneamente:
b K1 K2 1
masa 1: ẍ1 + (ẋ1 − ẋ2 ) + x1 + (x1 − x2 ) = F (t)
m1 m1 m1 m1
b K3 K2
masa 2: ẍ2 − (ẋ1 − ẋ2 ) + x2 − (x1 − x2 ) = 0
m2 m2 m2
Tal como ocurre en el ejemplo anterior, estas dos ecuaciones diferenciales no
pueden ser combinadas para obtener una sola ecuación diferencial, ya que las
variables x1 y x2 son linealmente independientes, es decir, no se cuenta con
ninguna expresión algebraica que relacione a estas variables. Nótese también
que los términos correspondientes al resorte central y al amortiguador aparecen
con signo contrario en cada una de estas ecuaciones diferenciales. Esto es
debido a que la fuerza que produce el resorte central o el amortiguador sobre
el cuerpo 1 es en sentido contrario a la fuerza que ejerce sobre el cuerpo 2.
Ejemplo 2.6 En la figura 2.25(a) se muestra un cuerpo rotativo unido a dos
muros a través de un resorte y un amortiguador. Sobre este cuerpo se aplica
un par externo T (t). En este caso, el amortiguador representa la fricción
existente entre el cuerpo y los rodamientos sobre los que se apoya. El resorte
representa la flexibilidad del eje o flecha del cuerpo giratorio. El diagrama de
cuerpo libre correspondiente se muestra en la figura 2.25(b). La nomenclatura
utilizada es la siguiente:
2.6 Ejemplos 51

θ̇ = dθ
dt , donde θ es la posición angular del cuerpo.
ωb = dθ dt , donde θb es la posición angular del extremo móvil del amorti-
b

guador.
θK = dθdtK , donde θK es la posición angular del extremo móvil del resorte.
Usando la figura 2.25(b), ası́ como (2.8), (2.11), (2.21), se obtienen las si-
guientes expresiones:

cuerpo giratorio: I θ̈ = T (t) + Tb − TK (2.65)


resorte: KθK = TK
amortiguador: bωb = Tb

b K
I

T(t)
(a)

Tb Tb ò ò TK TK òK

I
b
!b T(t)
(b) Diagrama de cuerpo libre.

Figura 2.25. Sistema masa-resorte-amortiguador rotativo.

Nótese que los pares que se aplican sobre el cuerpo I y tienen el mismo
sentido que la velocidad angular θ̇, aparecen afectados por un signo positivo en
(2.65). En caso contrario aparecen afectados por un signo negativo, como es
el caso de TK . Considerando que todos los elementos del sistema se conectan
mediante uniones rı́gidas entonces, de acuerdo a la figura 2.25(b) se tiene que:

θ̇ = −ωb = θ̇K (2.66)

De acuerdo a esto, si se definen θ = 0, θb = 0, θK = 0 como las posiciones


angulares del cuerpo, el extremo móvil del amortiguador y el extremo móvil del
resorte, respectivamente, cuando todo el sistema está en reposo con T (t) = 0,
entonces se concluye que:

θ = −θb = θK (2.67)

Por tanto, las expresiones en (2.65) se pueden escribir como:


52 2 Modelado matemático de sistemas fı́sicos

I θ̈ = T (t) + bωb − KθK


= T (t) − bθ̇ − Kθ

Finalmente, se obtiene que el modelo matemático correspondiente está dado


por la siguiente ecuación diferencial:
b K 1
θ̈ + θ̇ + θ = T (t) (2.68)
I I I
Nótese que este modelo matemático es idéntico al presentado en (2.53) para
un sistema masa-resorte-amortiguador traslacional si se sustituye la inercia
por la masa, la posición angular θ por la posición xm y el par externo T (t)
por la fuerza externa F (t).
Ejemplo 2.7 En la figura 2.26(a) se muestran dos cuerpos rotativos unidos
por una cremallera. Sobre el cuerpo rotativo de la izquierda se aplica un par
externo T (t). Ası́ que se puede pensar que el cuerpo de la izquierda es un
motor el cual debe transmitir movimiento al cuerpo rotativo de la derecha
a través de una cremallera. Siguiendo las convenciones de signo mostradas
en las figuras 2.3, 2.5, 2.9 y 2.18 se obtienen los diagramas de cuerpo libre
mostrados en las figuras 2.26(b) y 2.26(c). En la figura 2.26(b) se muestra
la parte correspondiente a la conexión de los dos cuerpos rotativos mediante
dos adaptadores tipo piñón-cremallera, mientras que en la figura 2.26(c) se
muestra el diagrama de cuerpo libre de cada uno de los cuerpos rotativos1 . La
nomenclatura utilizada es la siguiente:
vm = dxdtm , donde xm es la posición de la cremallera de masa m.
ω1 = dθdt , donde θ1 es la posición angular del cuerpo rotativo 1.
1

dθ2
ω2 = dt , donde θ2 es la posición angular del cuerpo rotativo 2.
v1 es la velocidad traslacional que se produce en la cremallera como resul-
tado de que el cuerpo 1 gira con velocidad ω1 .
v2 es la velocidad traslacional que se produce en la cremallera como resul-
tado de que el cuerpo 2 gira con velocidad ω2 .
ωb1 = dθdtb1 , donde θb1 es la posición angular del extremo móvil del amorti-
guador unido al cuerpo rotativo 1 (fricción del cuerpo 1 con los rodamien-
tos).
ωb2 = dθdtb2 , donde θb2 es la posición angular del extremo móvil del amor-
tiguador unido al 2 (fricción del cuerpo 2 con los rodamientos).
vb = dxdt , donde xb es la posición del extremo del amortiguador unido a
b

la cremallera m. Este amortiguador representa la fricción de la cremallera


con el suelo.
1
En un sistema piñón-cremallera debe utilizarse el principio de que a toda fuerza
(o par) de acción corresponde una fuerza (o par) de reacción sólo en uno de los
puertos, pues el par (o fuerza) en uno de los puertos es simplemente el reflejo de
la fuerza (o par) en el otro puerto. Véase también el ejemplo 2.9
2.6 Ejemplos 53

Motor

T(t) I1 I2

Cremallera m
(a)
T2
!1

r r
T1
F1 F2 F2
F1 w2
m
v1 vm v2
Fb

vb

Fb
(b) Diagrama de cuerpo libre.
b1 T b1 T1 !1

I1
! b1 T b1 T(t)

T2 !2 T b2
b2
I2
T b2 ! b2
(c) Diagrama de cuerpo libre (cont.).

Figura 2.26. Dos cuerpos rotativos unidos por una cremallera.

Usando las figuras 2.26(b) y 2.26(c), ası́ como (2.4), (2.8), (2.18), (2.21),
(2.34), (2.35) se obtienen las siguientes expresiones:

dω1
inercia 1: I1 = T (t) + T1 − Tb1 (2.69)
dt
dω2
inercia 2: I2 = T2 − Tb2 (2.70)
dt
54 2 Modelado matemático de sistemas fı́sicos

dvm
masa: m = F1 − F2 + Fb (2.71)
dt
amortiguador izquierdo: b1 ωb1 = Tb1
amortiguador derecho: b2 ωb2 = Tb2
amortiguador central: bvb = Fb
piñón-cremallera izquierda: T1 = rF1 , v1 = rω1 (2.72)
piñón-cremallera derecha: T2 = rF2 , v2 = rω2 (2.73)

Nótese que las fuerzas que tienen el mismo sentido que ω1 , ω2 y vm aparecen
afectadas con un signo positivo en (2.69), (2.70), (2.71) y con un signo nega-
tivo en caso contrario. Considerando que todos los elementos del sistema se
conectan mediante uniones rı́gidas entonces, de acuerdo a las figuras 2.26(b)
y 2.26(c) se tiene que:

vm = −v1 = v2 = −vb (2.74)


ω1 = ωb1 , ω2 = ωb2 (2.75)

De acuerdo a esto, si se definen xm = 0, θ1 = 0, θ2 = 0, xb = 0, θb1 = 0, θb2 =


0 como las posiciones de la cremallera, el cuerpo rotativo 1, el cuerpo rotativo
2 y los extremos móviles de los amortiguadores conectados a la cremallera y
a los cuerpos rotativos 1 y 2, respectivamente, cuando todo el sistema está en
reposo con T (t) = 0, entonces se concluye que:

xm = −xb (2.76)
θ1 = θb1 , θ2 = θb2

Por tanto, las expresiones en (2.69), (2.70) y (2.71) se pueden escribir como:

dω1
inercia 1: I1 = T (t) + rF1 − b1 ωb1 (2.77)
dt
dω2
inercia 2: I2 = rF2 − b2 ωb2 (2.78)
dt
dvm
masa: m = F1 − F2 + bvb (2.79)
dt
Recordando que v1 = −v2 , se pueden usar (2.72) y (2.73) para encontrar
que ω1 = −ω2 . Entonces se puede usar este resultado ası́ como (2.75) para,
restando (2.78) a (2.77), encontrar:

dω1
(I1 + I2 ) = T (t) + r(F1 − F2 ) − (b1 + b2 )ω1 (2.80)
dt
Por otro lado, usando −vm = v1 = rω1 = vb se puede escribir (2.79) como

dω1
−mr = F1 − F2 − bvm
dt
2.6 Ejemplos 55

Despejando F1 − F2 de esta expresión y sustituyendo en (2.80) se obtiene


finalmente:
dω1
(I1 + I2 + mr2 ) = T (t) − (b1 + b2 + r2 b)ω1
dt
Esta ecuación diferencial representa el modelo matemático del sistema en la
figura 2.26(a). En este caso se pudieron combinar tres ecuaciones diferencia-
les distintas en una sola ecuación diferencial. Esto es debido a que las tres
variables ω1 , ω2 y vm son linealmente dependientes pues están relacionadas
mediante las expresiones algebraicas −vm = rω1 = −rω2 . Nótese también
cómo el radio de los piñones interviene para adaptar i) la masa de la crema-
llera a la inercia equivalente que se produce sobre el eje de la inercia 1 e ii)
la fricción equivalente que sobre el eje de la inercia 1 produce la fricción de la
cremallera con el suelo.

Ejemplo 2.8 En la figura 2.27(a) se muestran dos cuerpos rotativos unidos


por un resorte. Sobre el cuerpo de la izquierda se aplica un par externo T (t).
Entonces, el sistema mostrado en la figura 2.27(a) representa el caso de un
motor (cuerpo de la izquierda) que mueve a una carga (cuerpo de la derecha)
y que el eje que une a ambos cuerpos es flexible. Esta flexibilidad normal-
mente no es introducida intencionalmente, sino que es una caracterı́stica no
deseada que surge como resultado de la rigidez finita de los materiales con que
se construye el eje que une al motor y la carga. En situaciones como esta es
muy importante tomar en cuenta dicha flexibilidad para estudiar como afec-
ta al desempeño del sistema de control. Siguiendo las convenciones de signo
mostradas en las figuras 2.5, 2.6 y 2.11 se obtiene el diagrama de cuerpo libre
mostrado en la figura 2.27(b). La nomenclatura utilizada es la siguiente:
ω2 = dθdt , donde θ2 es la posición angular del cuerpo 1.
2

dθ5
ω5 = dt , donde θ5 es la posición angular del cuerpo 2.
ω1 = dθdt , donde θ1 es la posición angular del extremo móvil del amorti-
1

guador conectado al cuerpo 1.


ω6 = dθdt , donde θ6 es la posición angular del extremo móvil del amorti-
6

guador conectado al cuerpo 2.


ω3 = dθ dθ4
dt y ω4 = dt , donde θ3 y θ4 son las posiciones angulares de los
3

extremos del resorte.


Usando la figura 2.27(b), ası́ como (2.8), (2.11), (2.21), se obtienen las
siguientes expresiones:

cuerpo 1: I1 ω̇2 = T (t) + T1 − T3 (2.81)


cuerpo 2: I2 ω̇5 = T4 − T6 (2.82)
amortiguador izquierdo: b1 ω 1 = T 1
amortiguador derecho: b2 ω 6 = T 6
resorte: KxK = T3 = T4 , xK = θ3 − θ4
56 2 Modelado matemático de sistemas fı́sicos

b1 K b2

I1 I2
T(t)
(a)
!1 T1 !2 T3 T3 !4 T4 T6 T6
I1 I2
T1 T(t) !3 T4 !5 !6
(b) Diagrama de cuerpo libre.

Figura 2.27. Dos cuerpos rotativos unidos por un resorte.

donde la última expresión se obtiene de acuerdo al párrafo que sigue a (2.10).


Nótese que, en las expresiones (2.81) y (2.82), los pares que tienen el mismo
sentido que ω2 y ω5 aparecen afectadas con un signo positivo y con un signo
negativo en caso contrario. Considerando que todos los elementos del sistema
se conectan mediante uniones rı́gidas entonces, de acuerdo a la figura 2.27(b)
se tiene que:

ω2 = −ω1 = ω3 , ω5 = ω 6 = ω 4 (2.83)

De acuerdo a esto, si se definen ω2 = 0, ω5 = 0, ω1 = 0, ω6 = 0, ω3 = 0 y


ω4 = 0 como las posiciones angulares del cuerpo 1, del cuerpo 2, del extremo
móvil del amortiguador izquierdo, del extremo móvil del amortiguador derecho
y de los extremos izquierdo y derecho del resorte, respectivamente, cuando todo
el sistema está en reposo con T (t) = 0, entonces se concluye que:

θ2 = −θ1 = θ3 , θ5 = θ 6 = θ 4 (2.84)

Por tanto, las expresiones en (2.81) y (2.82) se pueden escribir como:

cuerpo 1: I1 ω̇2 = T (t) + b1 ω1 − K(θ3 − θ4 )


cuerpo 2: I2 ω̇5 = K(θ3 − θ4 ) − b2 ω6

Usando (2.83) y (2.84) se encuentra finalmente que el modelo matemático


está dado por las siguientes dos ecuaciones diferenciales que deben ser resuel-
tas simultáneamente:

cuerpo 1: I1 θ̈2 + b1 θ̇2 + K(θ2 − θ5 ) = T (t)


cuerpo 2: I2 θ̈5 + b2 θ̇5 − K(θ2 − θ5 ) = 0

Estas dos ecuaciones diferenciales no pueden ser agrupadas en una sola porque
las variables θ2 y θ5 son linealmente independientes, es decir, no se cuenta
con una expresión algebraica que relacione a estas dos variables.
2.6 Ejemplos 57

Ejemplo 2.9 En la figura 2.28(a) se muestran dos cuerpos rotativos unidos


a través de una caja de engranes. Sobre el cuerpo de la izquierda se aplica
un par externo T (t), por lo que este sistema puede ser interpretado como
un motor eléctrico (cuerpo de la izquierda) que transmite movimiento a una
carga (cuerpo de la derecha) a través de una caja de engranes. Siguiendo las
convenciones de signo mostradas en las figuras 2.5, 2.11, 2.17 se obtiene el
diagrama de cuerpo libre mostrado en la figura 2.28(b)2 . La nomenclatura
utilizada es la siguiente:
ω = dθ
dt , donde θ es la posición angular del cuerpo 1.
ω4 = dθdt , donde θ4 es la posición angular del cuerpo 2.
4

dθb1
ωb1 = dt , donde θb1 es la posición angular del extremo móvil del amor-
tiguador conectado al cuerpo 1.
ωb2 = dθdtb2 , donde θb2 es la posición angular del extremo móvil del amor-
tiguador conectado al cuerpo 2.
ωn1 y ωn2 son las velocidades angulares en las ruedas dentadas que resultan
del movimiento de los cuerpos 1 y 2.
Tn1 y Tn2 son los pares que aparecen en las ruedas dentadas como resultado
del movimiento de los cuerpos 1 y 2.

b 1 T(t) n1
I1 b2
I2
n2
(a)
T b1 T b1 ! T n1 ! n1
I1 T n2 T3 !4 T b2 T b2
! b1 T(t) I2
! n2 ! b2
(b) Diagrama de cuerpo libre.

Figura 2.28. Dos cuerpos unidos a través de una caja de engranes.

Usando la figura 2.28(b), ası́ como (2.8), (2.21), (2.32), (2.33) se obtienen
las siguientes expresiones:

cuerpo 1: I1 ω̇ = T (t) − Tb1 − Tn1 (2.85)


2
En una caja de engranes debe utilizarse el principio de que a todo par de acción
corresponde un par de reacción sólo en uno de los puertos, pues el par en uno de
los puertos es simplemente el reflejo del par en el otro puerto. Véase también el
ejemplo 2.7
58 2 Modelado matemático de sistemas fı́sicos

cuerpo 2: I2 ω̇4 = T3 + Tb2 (2.86)


amortiguador izquierdo: b1 ωb1 = Tb1
amortiguador derecho: b2 ωb2 = Tb2
n1 n2
engranes: Tn1 = Tn2 , ωn1 = ωn2 , Tn2 = T3 (2.87)
n2 n1
donde la última expresión se debe a que, de acuerdo a la tercera ley de Newton,
una acción del cuerpo A sobre el cuerpo B produce una reacción (en sentido
contrario) del cuerpo B sobre el cuerpo A. Nótese que, en las expresiones
(2.85) y (2.86) los pares que tienen el mismo sentido que ω y ω4 aparecen
afectadas con un signo positivo y con un signo negativo en caso contrario.
Considerando que todos los elementos del sistema se conectan mediante unio-
nes rı́gidas entonces, de acuerdo a la figura 2.28(b) se tiene que:

ω = ωb1 = −ωn1 , ω4 = −ωb2 = −ωn2 (2.88)

De acuerdo a esto, si se definen θ = 0, θ4 = 0, θb1 = 0, θb2 = 0, θn1 = 0,


θn2 = 0 como las posiciones angulares del cuerpo 1, del cuerpo 2, del extremo
móvil del amortiguador izquierdo, del extremo móvil del amortiguador derecho,
de la rueda dentada 1 y de la rueda dentada 2 cuando todo el sistema está en
reposo con T (t) = 0, entonces se concluye que:

θ = θb1 = −θn1 , θ4 = −θb2 = −θn2 (2.89)

Por tanto, usando (2.88) y (2.89) las expresiones en (2.85) y (2.86) se pueden
escribir como:
n1
cuerpo 1: I1 ω̇ = T (t) − b1 ω − T3 (2.90)
n2
cuerpo 2: I2 ω̇4 = T3 − b2 θ̇4 (2.91)

Por otro lado, de (2.87) y (2.88) se tiene ω = nn21 ω4 . Usando esto, despejan-
do T3 de (2.91), sustituyendo en (2.90) y después de acomodar términos se
encuentra:
à µ ¶2 ! à µ ¶2 !
n2 n2 n2
I2 + I1 θ̈4 + b2 + b1 θ̇4 = T (t) (2.92)
n1 n1 n1

Nótese que las dos ecuaciones diferenciales en (2.90) y (2.91) se han podi-
do combinar en una sola ecuación gracias a que las variables ω y ω4 son
linealmente dependientes pues están relacionadas a través de ω = nn12 ω4 . Esta
ecuación diferencial representa el modelo matemático buscado: si se conoce el
par externo aplicado T (t) entonces se puede conocer la posición θ4 del cuerpo
2 al resolver la ecuación diferencial anterior.
Ejemplo 2.10 En la figura 2.29(a) se muestra el mismo mecanismo de la
figura 2.26(a) (estudiado en el ejemplo 2.7) pero ahora la cremallera es fle-
xible. Esta flexibilidad no se introduce de manera intencional, sino que es un
2.6 Ejemplos 59

problema no deseado que aparece debido a la rigidez finita del material con
el que está hecha la cremallera. Para encontrar el modelo matemático en este
caso se puede aprovechar el desarrollo realizado en el ejemplo 2.7. Es decir, se
puede partir de las ecuaciones (2.77), (2.78) y (2.79), las cuales se reescriben
a continuación para facilitar la referencia:
dω1
inercia 1: I1 = T (t) + rF1 − b1 ωb1
dt
dω2
inercia 2: I2 = rF2 − b2 ωb2
dt
dvm
masa: m = F1 − F2 + bvb
dt
considerando ahora que, de acuerdo a la figura 2.29(b) y las convenciones en
la figura 2.4 y (2.7):
F1 = K1 (xA − xB ), F2 = K2 (xC − xD )
con:
vA = dx dxB
dt y vB = dt , donde xA y xB son las posiciones de los extremos
A

del resorte de la izquierda.


vC = dx dxD
dt y vD = dt , donde xC y xD son las posiciones de los extremos
C

del resorte de la derecha.

xm
I1 K1 K2 I2
m
A B C D

(a)
v AB
F1 F1
vA K1 vB

v CD
F2 F2
vC K2 vD
(b) Flexibilidad en la cremallera.

Figura 2.29. Sistema de transmisión tipo cremallera con flexibilidad.

Entonces, usando esto y (2.74) y (2.75) se encuentra:


60 2 Modelado matemático de sistemas fı́sicos

dω1
inercia 1: I1 = T (t) + rK1 (xA − xB ) − b1 ω1 (2.93)
dt
dω2
inercia 2: I2 = rK2 (xC − xD ) − b2 ω2 (2.94)
dt
masa: mẍm = K1 (xA − xB ) − K2 (xC − xD ) − bẋm (2.95)
Por otro lado, de acuerdo a (2.72), (2.73), (2.74), (2.76) y considerando que
todos los elementos del sistema se conectan mediante uniones rı́gidas se en-
cuentra que:
xB = xC = xm , xA = −rθ1 , xD = rθ2 (2.96)
donde θ1 y θ2 son las posiciones angulares de las ruedas dentadas 1 y 2 defi-
nidas de acuerdo a la figura 2.26(b). Sustituyendo (2.96) en (2.93), (2.94) y
(2.95):
inercia 1: I1 θ̈1 + b1 θ̇1 − rK1 (−rθ1 − xm ) = T (t)
inercia 2: I2 θ̈2 + b2 θ̇2 − rK2 (xm − rθ2 ) = 0
masa: mẍm + bẋm − K1 (−rθ1 − xm ) + K2 (xm − rθ2 ) = 0
El modelo matemático está dado por estas tres ecuaciones diferenciales que
deben ser resueltas simultáneamente. En este caso no se pueden combinar
estas tres ecuaciones para obtener una sola ecuación diferencial equivalente
debido a que las variables θ1 , θ2 y xm son linealmente independientes pues no
se cuenta con una expresión algebraica que relacione a estas tres variables.
Nótese que desde el punto de vista del modelado este es el efecto que introdu-
cen los dos resortes considerados en este ejemplo. Compárese con el modelo
matemático obtenido en el ejemplo 2.7.

b1 n1
I1 K b2
I2
T(t)
n2
(a)
T n2 !B
K

!A T n2
(b) Flexibilidad en
los engranes.

Figura 2.30. Sistema de transmisión con flexibilidad en la caja de engranes.

Ejemplo 2.11 En la figura 2.30(a) se muestran dos cuerpos giratorios co-


nectados a través de una caja de engranes y un resorte. El cuerpo del lado
2.6 Ejemplos 61

izquierdo recibe un par externo T (t). Por tanto, este ejemplo representa el
caso de un motor (cuerpo izquierdo) que transmite movimiento a una carga
(cuerpo derecho) a través de una caja de engranes cuyos dientes son flexibles.
Esta flexibilidad es un problema no deseado que, sin embargo, aparece en la
práctica debido a la rigidez finita del material con el que se hacen los engranes
(acero). Para resolver este problema se puede aprovechar el desarrollo presen-
tado en el ejemplo 2.9 para modelar el sistema mostrado en la figura 2.28(a).
Por tanto, se puede regresar a las expresiones en (2.90) y (2.91), las cuales
se reescriben a continuación para facilitar la referencia:
n1
cuerpo 1: I1 ω̇ = T (t) − b1 ω − Tn2 (2.97)
n2
cuerpo 2: I2 ω̇4 = Tn2 − b2 θ̇4 (2.98)

pero ahora, de acuerdo a las figuras 2.30(b) y 2.6 y a (2.11):

Tn2 = K(θA − θB )

donde ωA = θ̇A y ωB = θ̇B con θA y θB las posiciones angulares de los


extremos del resorte. Por otro lado, de acuerdo a (2.87) se tiene que θ = nn21 θA ,
porque ωA = −ωn2 y ωn1 = −θ, donde θ y θA son las posiciones angulares
del cuerpo 1 y del extremo del resorte conectado a la rueda dentada 2, según
se define en la figura 2.30(b). Nótese además que θB = θ4 . Sustituyendo todo
esto en (2.97) y (2.98) se encuentra:
µ ¶
n1 n1
cuerpo 1: I1 θ̈ + b1 θ̇ + K θ − θ4 = T (t)
n2 n2
µ ¶
n1
cuerpo 2: I2 θ̈4 + b2 θ̇4 − K θ − θ4 = 0
n2

Estas dos ecuaciones diferenciales deben ser resueltas simultáneamente y re-


presentan el modelo matemático buscado. Nótese que estas dos ecuaciones
diferenciales no pueden ser combinadas en una sola debido a que las variables
θ y θ4 son linealmente independientes, es decir no se cuenta con una expresión
algebraica que relacione a estas variables. Esta es la principal diferencia con
el problema resuelto en el ejemplo 2.9 y es debida a la introducción del resorte
en el presente ejemplo.

Ejemplo 2.12 (tomado de [6], pp. 122). En la figura 2.31 se muestra un


servomecanismo, es decir, se trata de un motor de CD con escobillas que se
usa para mover un cuerpo de masa M através de una caja de engranes y
de un adaptador del tipo piñón-cremallera. El cuerpo M se mueve sobre un
plano horizontal, por lo que no es necesario tomar en consideración el efecto
de la gravedad. Siguiendo las convenciones de signo mostradas en las figuras
2.5, 2.3, 2.11, 2.9, 2.17, 2.18, 2.19 se obtienen los diagramas de cuerpo libre
mostrados en la figura 2.32. En la figura 2.32(a) se desglosan los componentes
62 2 Modelado matemático de sistemas fı́sicos

eléctricos del motor de CD, en la figura 2.32(b) se desglosan los componentes


mecánicos del motor y la caja de engranes mientras que en la figura 2.32(c) se
muestran los elementos que componen al sistema piñón-cremallera3 . Nótese
que se considera fricción entre el motor y sus rodamientos ası́ como la fricción
entre el piñón y sus rodamientos y fricción entre el cuerpo M y su soporte (o
el suelo). La nomenclatura utilizada es la siguiente:
θ̇m = dθdtm , donde θm es la posición angular del motor.
ωP = dθdtP , donde θP es la posición angular del piñón.
ẋ = dx
dt , donde x es la posición del cuerpo M .
ωb1 = dθdtb1 , donde θb1 es la posición angular del extremo móvil del amor-
tiguador conectado al motor.
ωb2 = dθdtb2 , donde θb2 es la posición angular del extremo móvil del amor-
tiguador conectado al piñón.
vb3 = dxdtb3 , donde xb3 es la posición del extremo móvil del amortiguador
conectado al cuerpo M .
ω1 y ω2 son las velocidades angulares en las ruedas dentadas resultantes
del movimiento del motor y del piñón.
u es el voltaje aplicado a la armadura del motor e i es la corriente que
circula a través de la armadura del motor.
3
Véanse los pies de página correspondientes a los ejemplos 2.9 y 2.7

n1
+ Piñon
u Motor
à b1
r

n2

Cremallera

b2

Figura 2.31. Servomecanismo.


2.6 Ejemplos 63

R L
+ T n1
+ b1
u i eb
à Im r
à
IP

n2 b2

M
b3

(a)
b1 T b1 T T1 !1 n 1

Im T2 !2
T b1 ! b1 òm

n2
(b)
!P !P
T b2 T b2
r
IP
! b2 TP
T2 v
F

M x

F b3

v b3
F b3

(c)

Figura 2.32. Diagrama de cuerpo libre correspondiente a la figura 2.31.


64 2 Modelado matemático de sistemas fı́sicos

F , TP y v son la fuerza, el par y la velocidad traslacional que se producen


en el sistema piñón-cremallera como resultado del movimiento del piñón
y la masa M .
Usando la figura 2.32, ası́ como (2.4), (2.8), (2.18), (2.21), (2.32), (2.33),
(2.34), (2.35) se obtienen las siguientes expresiones:

inercia motor: Im θ̈m = T − T1 − Tb1 (2.99)


inercia piñón: IP θ̈P = T2 + Tb2 + TP (2.100)
masa M : M ẍ = −F − Fb3 (2.101)
amortiguador motor: b1 ωb1 = Tb1
amortiguador piñón: b2 ωb2 = Tb2
amortiguador masa M : b3 vb3 = Fb3
n1 n2
engranes: T1 = T2 , ω1 = ω2 (2.102)
n2 n1
piñón-cremallera: v = rωP , TP = rF (2.103)

Nótese que, en las expresiones (2.99), (2.100) y (2.101), las fuerzas que tienen
el mismo sentido que θ̇m , ωP y ẋ aparecen afectadas con un signo positivo y
con un signo negativo en caso contrario. Considerando que todos los elementos
del sistema se conectan mediante uniones rı́gidas entonces, de acuerdo a la
figura 2.32 se tiene que:

v = ẋ = vb3 (2.104)
θ̇m = ωb1 = −ω1 , ω2 = ωb2 = −ωP (2.105)

De acuerdo a esto, si se definen x = 0, xb3 = 0, θm = 0, θb1 = 0, θb2 = 0 como


las posiciones del cuerpo M , el extremo móvil del amortiguador conectado al
cuerpo M , el rotor del motor, el extremo móvil del amortiguador conectado
al rotor del motor y el extremo móvil del amortiguador conectado al piñón,
respectivamente, cuando todo el sistema está en reposo con T = 0, entonces
se concluye que:

x = xb3 (2.106)
θm = θb1 (2.107)

Por tanto, las expresiones en (2.99), (2.100) y (2.101) se pueden escribir


como:
n1
inercia motor: Im θ̈m = T − T2 − b1 ωb1
n2
inercia piñón: IP θ̈P = T2 + b2 ωb2 + rF
masa M : M ẍ = −F − b3 vb3

Usando (2.104) y (2.105):


2.6 Ejemplos 65
n1
inercia motor: Im θ̈m = T − T2 − b1 θ̇m (2.108)
n2
inercia piñón: IP θ̈P = T2 − b2 ωP + rF (2.109)
masa M : M ẍ = −F − b3 ẋ (2.110)

Por otro lado, de acuerdo a (2.102), (2.103), (2.104) y (2.105) se encuentra


que θ̇m = nn12r ẋ. Usando esto, despejando T2 de (2.109) y sustituyendo en
(2.108):
n2 n2 n1
Im ẍ + b1 ẋ = T − [IP ω̇P + b2 ωP − rF ] (2.111)
n1 r n1 r n2
De (2.103) y (2.104) se tiene que ẋ = rωP . Usando esto en (2.111) y susti-
tuyendo F de (2.110) se encuentra:
µ ¶ µ ¶
n2 n2 n1 n1 n1 n1
Im ẍ + b1 ẋ = T − IP + rM ẍ − b2 + rb3 ẋ
n1 r n1 r n2 r n2 n2 r n2
Agrupando términos se obtiene finalmente:
à µ ¶2 ! à µ ¶2 !
n2 1 n2 1 n2
Im + IP 2 + M ẍ + b1 + b2 2 + b3 ẋ = T
n1 r r n1 r r n1 r
(2.112)

Por otro lado, usando la Ley de voltajes de Kirchhoff (véase el ejemplo 2.14)
al circuito de la figura 2.32(a) se obtiene:
di
L + Ri + eb = u (2.113)
dt
Usando (2.38), (2.39) y θ̇m = nn12r ẋ se encuentra que el voltaje inducido y el
par generado están dados como:
n2
eb = ke θ̇m = ke ẋ, T = km i
n1 r
Entonces, usando este resultado, (2.113) y (2.112) se encuentra, finalmente,
que el modelo matemático buscado está representado por las dos ecuaciones
diferenciales siguientes, las cuales deben ser resueltas simultáneamente:
di n2
+ Ri + ke L ẋ = u (2.114)
dt n1 r
à µ ¶2 ! à µ ¶2 !
n2 1 n2 1 n2
Im + IP 2 + M ẍ + b1 + b2 2 + b3 ẋ = km i
n1 r r n1 r r n1 r
(2.115)

Otra manera de expresar este modelo matemático es mediante una sola ecua-
ción diferencial obtenida al combinar (2.114) y (2.115). Para esto, derı́vese
66 2 Modelado matemático de sistemas fı́sicos

di
una vez respecto al tiempo a (2.115). Esto produce la aparición de dt en el
miembro derecho de la ecuación resultante. A continuación se sustituye el va-
di
lor de dt obtenido al despejar de (2.114). Con esto se obtiene una ecuación
3
diferencial en términos de de ddt3x , ẍ, ẋ e i. Para eliminar i, se despeja esta
variable de (2.115) y se sustituye. Ası́, se obtiene una ecuación diferencial de
tercer orden en la variable x con el voltaje u como excitación. De este modo
el modelo matemático queda representado por una sola ecuación diferencial a
partir de la cual se puede conocer la posición x de la masa M si se conoce el
voltaje u aplicado al motor. Se deja como ejercicio para el lector el realizar el
procedimiento descrito.

Ejemplo 2.13 En la figura 2.33(a) se muestra un péndulo simple donde θ


representa la posición angular del péndulo respecto de la vertical y θ̇ = dθ
dt .
Se supone que toda la masa m del péndulo está concentrada en el extremo y
que la varilla, de longitud l, no tiene masa (o ésta es despreciable comparada
con la masa m). El diagrama de cuerpo libre correspondiente se muestra en la
figura 2.33(b). El péndulo puede ser considerado un cuerpo rotativo de inercia:

I = ml2

la cual corresponde a la inercia de una partı́cula de masa m que describe un


movimiento circular con un radio constante l [7], cap. 9. Se considera que
sobre el péndulo actúan tres pares: 1) el par externo T (t), 2) el par debido
a la fricción, Tb , existente en el punto de donde se sostiene el péndulo y 3)
el par debido a la fuerza de gravedad, Tg . De acuerdo a las figuras 2.33(a) y
2.33(b), el par Tg está aplicado en sentido contrario a como se define θ y su
magnitud es igual a:

Tg = peso del péndulo × brazo de palanca


= mg × d, d = l sin(θ)
= mgl sin(θ) (2.116)

Usando la figura 2.33(b), ası́ como (2.8), (2.21), se obtienen las siguientes
expresiones:

cuerpo giratorio: I θ̈ = T (t) + Tb − Tg (2.117)


amortiguador: bωb = Tb

Nótese que los pares que se aplican sobre el cuerpo I y tienen el mismo sentido
que la velocidad angular θ̇, aparecen afectados por un signo positivo en (2.117).
En caso contrario aparecen afectados por un signo negativo, como es el caso
de Tg . Considerando que todos los elementos del sistema se conectan mediante
uniones rı́gidas entonces, de acuerdo a la figura 2.33(b) se tiene que:

θ̇ = −ωb (2.118)
2.6 Ejemplos 67

T(t)

l
ò ò ò Tg
g Tb Tb
m
I
b
d !b T(t)
(a) (b) Diagrama de cuerpo libre.

Figura 2.33. Péndulo simple.

Por tanto, si se definen θ = 0, θb = 0 (con ωb = θ̇b ) como las posiciones


angulares del péndulo y el extremo móvil del amortiguador, respectivamente,
cuando todo el sistema está en reposo con T (t) = 0, entonces se concluye que:

θ = −θb (2.119)

Entonces, las expresiones en (2.117) y (2.116) se pueden escribir como:

I θ̈ = T (t) + bωb − mgl sin(θ)


= T (t) − bθ̇ − mgl sin(θ)

Finalmente, se obtiene que el modelo matemático correspondiente está dado


por la siguiente ecuación diferencial:

ml2 θ̈ + bθ̇ + mgl sin(θ) = T (t)

Nótese que esta es una ecuación diferencial de segundo orden pero no lineal,
caracterı́stica que es debida al hecho de que aparece la función sin(θ). En
la sección 7.2 del capı́tulo 7 se explica la manera de manipular este tipo de
ecuaciones diferenciales. Más aún, en los capı́tulos 11, 13 y 14 se muestra
como diseñar controladores para este tipo de ecuaciones diferenciales.

Ejemplo 2.14 En la figura 2.34(a) se muestra un circuito RLC conectado


en serie y alimentado con una fuente de voltaje. La manera de relacionar a
los elementos del circuito en este tipo de conexión eléctrica es usando la Ley
de Kirchhoff de voltajes [8], pág. 67:

Propiedad 2.1 Ley de Kirchhoff de voltajes. La suma de los voltajes


alrededor de un trayecto cerrado es igual a cero.

Usando las convenciones de signo de las figuras 2.7, 2.8, 2.12 se obtiene
el diagrama mostrado en la figura 2.34(b). Entonces, a partir de esta figura y
68 2 Modelado matemático de sistemas fı́sicos

C L

+
vi R
à
(a)

+ vC à + vL à
C L
+ +
vi i R vR
à à
(b)

Figura 2.34. Circuito RLC conectado en serie.

usando (2.12), (2.13), (2.15), (2.16), (2.22) ası́ como la Ley de Kirchhoff de
voltajes se obtiene:
vi = v L + v R + v C
Z t
q
vC = , q = i(r)dr, si q(0) = 0 (2.120)
C 0

vL = , λ = Li (2.121)
dt
dq
vR = iR, i = (2.122)
dt
Nótese que la corriente eléctrica que circula por todos los componentes del
circuito es la misma. Por tanto:
d2 q dq 1
vi = L 2
+R + q (2.123)
dt dt C
o bién:
Z t
di 1
vi = L + Ri + i(r)dr (2.124)
dt C 0

El modelo matemático correspondiente está representado por cualquiera de las


expresiones en (2.123) o (2.124).
A partir de (2.122) se observa que existe una relación algebraica (y lineal,
además) entre el voltaje en una resistencia y la corriente a través de la mis-
ma: vR = iR. Nótese que la resistencia R es el factor constante que relaciona
2.6 Ejemplos 69

corriente y voltaje en una resistencia viR = R. Este hecho motiva el cuestio-


narse si acaso existe una relación similar entre la corriente y el voltaje en
un inductor y en un capacitor. Sin embargo, a partir de (2.120) y (2.121) se
observa que, a menos que se introduzca algún artificio matemático, esto no
es posible por que están de por medio una derivada y una integral. Entonces,
el artificio matemático que se usa es la transformada de Laplace ya que ésta
tiene las siguientes propiedades:
½ ¾ ½Z t ¾
dx 1
L = sX(s), L x(r)dr = X(s), si x(0)=0 (2.125)
dt 0 s

donde X(s) es la transformada de Laplace de x(t), es decir L{x(t)} = X(s).


Por tanto, a partir de (2.120) y (2.121) se obtiene, mediante el uso de la
transformada de Laplace y considerando todas las condiciones iniciales iguales
a cero:
1
VC (s) = I(s)
sC
VL (s) = sLI(s)

donde L{vC (t)} = VC (s), L{vL (t)} = VL (s) y L{i(t)} = I(s). Por tanto, aho-
ra se tiene una relación algebraica entre las transformadas de Laplace de los
voltajes y las corrientes en un inductor y un capacitor. Al factor que relaciona
a estas variables se le denomina “impedancia” y se representa como:

V (s)
Z(s) = (2.126)
I(s)

Es decir, la impedancia de un inductor es:

VL (s)
ZL (s) = = sL (2.127)
I(s)

mientras que la impedancia en un capacitor es:

VC (s) 1
ZC (s) = = (2.128)
I(s) sC

Entonces, usando la transformada de Laplace y el concepto de impedancia se


puede escribir el modelo matemático en (2.124) como:
1
Vi (s) = sLI(s) + RI(s) + I(s)
sC
Vi (s) = ZL (s)I(s) + RI(s) + ZC (s)I(s)
Vi (s) = (ZL (s) + R + ZC (s))I(s)

lo cual motiva el definir la impedancia total del circuito serie como:


70 2 Modelado matemático de sistemas fı́sicos

Zt (s) = ZL (s) + R + ZC (s)


1 Vi (s)
Zt (s) = sL + R + , Zt (s) = (2.129)
sC I(s)

Con lo anterior se prueba una propiedad importante en circuitos eléctricos


conectados en serie:

Propiedad 2.2 La impedancia total de un circuito serie es igual a la suma


de las impedancias de todos los elementos conectados en serie.

El concepto de impedancia es muy importante en circuitos eléctricos y es


una de las herramientas que normalmente se utilizan para modelar y analizar
circuitos en ingenierı́a. Es decir, las expresiones en (2.129) también represen-
tan el modelo matemático del circuito en la figura 2.34(a).

Ejemplo 2.15 En la figura 2.35(a) se muestra un circuito RLC conectado en


paralelo y alimentado con una fuente de corriente. La manera de relacionar
los componentes del circuito en este tipo de conexión eléctrica es usando la
Ley de Kirchhoff de corrientes [8], pág. 68:

Propiedad 2.3 Ley de Kirchhoff de corrientes.. La suma de las corrien-


tes que entran a un nodo es igual a la suma de las corrientes que salen del
mismo nodo.

ii L C R

(a)

+
ii L C R v
iL iC iR

à
(b)

Figura 2.35. Circuito RLC conectado en paralelo.

Usando las convenciones de signo de las figuras 2.7, 2.8, 2.12 se obtiene
el diagrama mostrado en la figura 2.35(b). Entonces, a partir de esta figura y
2.6 Ejemplos 71

usando (2.12), (2.13), (2.15), (2.16), (2.22) ası́ como la Ley de Kirchhoff de
corrientes se obtiene:
ii = iL + iR + iC
Z t
dv
q = vC, q = iC (r)dr, si q(0) = 0 ⇒ iC = C (2.130)
0 dt
Z
1 t diL
iL = v(r)dr, v = L (2.131)
L 0 dt
v
iR = (2.132)
R
Nótese que el voltaje es el mismo en todos los componentes del circuito. Por
tanto, el modelo matemático está representado por:
Z
1 t v dv
ii = v(r)dr + + C (2.133)
L 0 R dt
A partir de (2.130) y (2.131) se obtiene, mediante el uso de la transformada de
Laplace (véase (2.125)) y considerando todas las condiciones iniciales iguales
a cero:
IC (s) = sCV (s)
1
IL (s) = V (s)
sL
donde L{iC (t)} = IC (s), L{iL (t)} = IL (s) y L{v(t)} = V (s). Al factor que
relaciona a las transformadas de Laplace de la corriente y el voltaje en un
elemento de circuito se le denomina “admitancia” y se representa como:
I(s)
Y (s) = (2.134)
V (s)
Es decir, la admitancia de un inductor es:
IL (s) 1
YL (s) = = (2.135)
V (s) sL
mientras que la admitancia en un capacitor es:
IC (s)
YC (s) = = sC (2.136)
V (s)
Entonces, usando la transformada de Laplace y el concepto de admitancia se
puede escribir el modelo matemático en (2.133) como:
1 1
Ii (s) = V (s) + V (s) + sCV (s)
sL R
1
Ii (s) = YL (s)V (s) + V (s) + YC (s)V (s)
R
1
Ii (s) = (YL (s) + + YC (s))V (s)
R
72 2 Modelado matemático de sistemas fı́sicos

lo cual motiva el definir la admitancia total del circuito en paralelo como:


1
YT (s) = YL (s) + + YC (s)
R
1 1 Ii (s)
YT (s) = + + sC, YT (s) = (2.137)
sL R V (s)

Con lo anterior se prueba una propiedad importante en circuitos eléctricos


conectados en paralelo:

Propiedad 2.4 La admitancia total de un circuito en paralelo es igual a la


suma de las admitancias de todos los elementos conectados en paralelo.

El concepto de admitancia es muy importante en circuitos eléctricos y es la


otra herramienta que normalmente se utiliza para modelar y analizar circuitos
en ingenierı́a. Es decir, las expresiones en (2.137) también representan el
modelo matemático del circuito en la figura 2.35(a).
A partir de las definiciones de impedancia y admitancia en (2.126) y
(2.134) es claro que la admitancia es la inversa de la impedancia, es decir:
1
Y (s) = (2.138)
Z(s)

Esto también se comprueba al comparar las definiciones de impedancia y ad-


mitancia en un inductor y un capacitor mostradas en (2.127), (2.128), (2.135)
y (2.136). Entonces, a partir de (2.137) se puede escribir:
1 1 1 1 1
= + + , YT (s) =
ZT (s) ZL (s) R ZC (s) ZT (s)

donde ZT (s) representa la impedancia total del circuito conectado en paralelo


mostrado en la figura 2.35(a). No debe relacionarse ZT (s) con Zt (s) definida
en (2.129) como la impedancia total del circuito conectado en serie mostra-
do en la figura 2.34(a). Generalizando la expresión anterior al caso en que
se tienen n elementos de circuito conectados en paralelo, se encuentra la si-
guiente expresión general para el cálculo de la impedancia total de n elementos
conectados en paralelo:
1 1 1 1
= + + ... + (2.139)
ZT (s) Z1 (s) Z2 (s) Zn (s)

En el caso en que sólo dos elementos de circuito están conectado en paralelo


es fácil comprobar que la expresión anterior se reduce a:

Z1 (s)Z2 (s)
ZT (s) = (2.140)
Z1 (s) + Z2 (s)
2.6 Ejemplos 73

I(s) R C
+ +

V i (s) C R V o (s)

à à

Figura 2.36. Circuito RC serie-paralelo.

Ejemplo 2.16 Considere el circuito mostrado en la figura 2.36. Si Vo (s) es el


voltaje en las terminales de los elementos de circuito conectados en paralelo y
si Zp (s) es la impedancia total de estos dos elementos conectados en paralelo,
se puede escribir:
Vo (s)
Zp (s) = (2.141)
I(s)
1
R sC R
Zp (s) = 1 = RCs + 1
R + sC
donde se ha usado (2.140) para calcular la impedancia de dos elementos co-
nectados en paralelo. Nótese que I(s) es la corriente total a través de los dos
elementos conectados en paralelo. Por otro lado, si Zsp (s) es la impedancia to-
tal del circuito serie-paralelo, es decir, la impedancia medida en las terminales
donde se aplica el voltaje Vi (s), entonces se puede escribir:
Vi (s)
Zsp (s) = (2.142)
I(s)
1 R
Zsp (s) = R + +
sC RCs + 1
donde se ha usado el hecho de que la impedancia total de elementos conectados
en serie es igual a la suma de las impedancias de cada elemento y que la
impedancia de los dos elementos en paralelo está dada en (2.141). Combinando
las expresiones en (2.141) y (2.142) obtiene:
R
Vo (s) Zp (s) RCs+1
= GT (s) = = 1 R
Vi (s) Zsp (s) R+ sC + RCs+1

por lo que se puede escribir:


Vo (s) Ts
= GT (s) = 2 2 , T = RC (2.143)
Vi (s) T s + 3T s + 1
Nótese que GT (s) no es una impedancia ya que está dada como el cociente de
dos impedancias y el cociente de dos voltajes.
74 2 Modelado matemático de sistemas fı́sicos

Ejemplo 2.17 Considere el circuito mostrado en la figura 2.37. A continua-


ción se muestra como obtener la relación F (s) = VV21 (s)
(s) . Primero se definen los
tres trayectos cerrados (o mallas) mostrados en la figura 2.37, por los cuales
circulan las corrientes de malla I1 (s), I2 (s) e I3 (s). A continuación se utiliza
la siguiente regla para aplicar la Ley de Kirchhoff de voltajes:
“Considere la malla i. La suma algebraica de los voltajes en todos los ele-
mentos de circuito en la malla i se iguala a cero. El voltaje en un elemento de
circuito es el producto de su impedancia por la suma algebraica de las corrien-
tes de malla en ese elemento de circuito. La corriente de malla i siempre se
ve afectada con un signo “+” y las corrientes que van en sentido opuesto se
afectan con un signo “−”. El voltaje en una fuente de voltaje se afecta con un
signo “+” si la corriente de la malla i pasa através de la fuente de un signo
“+” a un signo “−” y se afecta con un signo “−” en caso contrario. ”
Esta regla constituye la base del método de análisis de mallas utilizado para
el análisis de circuitos en ingenierı́a. Se recomienda consultar las referencias
[9] y [8] para una exposición más amplia del método. Usando esta regla en
cada una de las mallas mostradas en la figura 2.37 se obtiene:

C C C

+ +
V 1(s) I1 R I2 R I3 R V 2(s)

à à

Figura 2.37. Red RC de defasaje.

1
I1 (s) + (I1 (s) − I2 (s))R = V1 (s) (2.144)
sC
1
(I2 (s) − I1 (s))R + I2 (s) + (I2 (s) − I3 (s))R = 0
sC
1
(I3 (s) − I2 (s))R + I3 (s) + V2 (s) = 0, V2 (s) = RI3 (s)
sC
De la tercera ecuación en (2.144) se obtiene:
µ ¶
1 1
I2 (s)R = R+ V2 (s) + V2 (s) (2.145)
R sC

Sustituyendo esto e I3 (s) = V2R(s) en la segunda ecuación mostrada en (2.144)


se obtiene una expresión que permite calcular I1 (s) en función de V2 (s) sola-
mente. Sustituyendo este valor de I1 (s) e I2 (s) dado en (2.145) en la primera
2.6 Ejemplos 75

ecuación mostrada en (2.144) se obtiene V1 (s) como función de V2 (s) so-


lamente. Finalmente, acomodando términos convenientemente se obtiene la
expresión buscada:

V2 (s) R3 C 3 s3
= 3 3 3 = F (s) (2.146)
V1 (s) R C s + 6R2 C 2 s2 + 5RCs + 1

Ejemplo 2.18 Un convertidor electrónico de potencia de CD/CD es un cir-


cuito que en su entrada recibe un voltaje de CD y en su salida entrega otro
voltaje de CD pero de valor diferente al recibido en su entrada. En la figura
2.38(a) se muestra el circuito de un convertidor electrónico de potencia de
CD/CD tipo Boost o elevador de voltaje. Esto significa que el voltaje de CD
en la salida del convertidor es mayor que el voltaje de CD en su entrada. Se
puede observar que la construcción del sistema se realiza mediante dispositivos
semiconductores (transistor-diodo). El transistor Q tiene dos posibles estados:
el estado apagado (corte) u = 0, y el estado encendido (saturación) u = 1. En
el estado apagado el diodo D se polariza directamente, y permite el paso de
la energı́a entre la fuente de voltaje E y la carga del sistema R. En el estado
encendido el diodo D se polariza inversamente, y en consecuencia no existe
conexión entre la fuente de voltaje E y la carga del sistema R.
El modelo matemático asociado al convertidor de potencia de CD/CD
Boost está definido por:
di
L = E − (1 − u)υ (2.147)
dt
dυ υ
C = (1 − u)i − (2.148)
dt R
donde i es la corriente eléctrica a través del inductor L, v es el voltaje en las
terminales del capacitor C y la constante E representa el voltaje de CD que
se aplica en la entrada del sistema. Este sistema tiene por salida v, el cual
tiene la caracterı́stica de satisfacer la siguiente desigualdad υ ≥ E. La entrada
de control u representa la función de posición del interruptor, la cual es una
señal que sólo toma el valor de 0 o de 1.
Para la obtención del modelo matemático del convertidor de potencia de
CD/CD Boost (2.147)-(2.148) y el análisis del mismo, se introduce el con-
cepto de interruptor ideal, mostrado en la figura 2.38(b). En este circuito el
interruptor ideal tiene dos posibles posiciones: el caso en el cual u = 0 que
corresponde al circuito equivalente mostrado en la figura 2.39(a), asociado al
hecho de que el transistor Q este apagado. Mientras que para el caso u = 1, el
circuito equivalente que se obtiene es el mostrado en la figura 2.39(b), estando
el transistor Q encendido.
Partiendo de los circuitos equivalentes mostrados en las figuras 2.39(a) y
2.39(b), el empleo de la Ley de Kirchhoff de Voltajes (LVK) y la Ley de Kir-
chhoff de Corrientes (LCK), se procede a la obtención del modelo matemático
asociado al convertidor de potencia de CD/CD Boost:
76 2 Modelado matemático de sistemas fı́sicos

L D
i

E Q v R

(a) Construcción del convertidor mediante


transistor-diodo.
L
i u

E v C R
u
(b) Convertidor con interruptor ideal.

Figura 2.38. Convertidor de potencia conmutado de CD/CD Boost.

L
i a

E I v C R

(a) Interruptor colocado en u = 0.


L
i a

E I v C R

(b) Interruptor colocado en u = 1.

Figura 2.39. Circuitos equivalentes del convertidor de CD/CD Boost.

Para el caso en el cual u = 0, el circuito equivalente es el mostrado en


la figura 2.39(a). Aplicando la LVK a la malla I y la LCK al nodo a de
mencionada figura, se obtienen respectivamente las relaciones dinámicas
que gobiernan a la corriente i y al voltaje v:
di
L = E−υ (2.149)
dt
dυ υ
C = i− (2.150)
dt R
Para el caso en el cual u = 1, se obtiene el circuito equivalente mostrado
en la figura 2.39(b). De igual manera, aplicando la LVK a la malla I y
2.6 Ejemplos 77

la LCK al nodo a de la figura en cuestión, las ecuaciones que se obtienen


para la corriente i y el voltaje v, respectivamente son:
di
L =E (2.151)
dt
dυ υ
C =− (2.152)
dt R
Mediante simple inspección se pueden relacionar las ecuaciones obtenidas en
los circuitos equivalentes, mostrados en las figuras 2.39(a) y 2.39(b), a través
de la variable u, de la siguiente manera:
di
L = E − (1 − u)υ (2.153)
dt
dυ υ
C = (1 − u)i − (2.154)
dt R
ya que cuando u = 0 o u = 1, se generan los sistemas (2.149)-(2.150) y
(2.151)-(2.152), respectivamente. De esta forma, el modelo matemático del
convertidor de potencia de CD/CD Boost está determinado por el sistema
de ecuaciones diferenciales no lineales (2.153)-(2.154). A este conjunto de
ecuaciones se le denomina modelo conmutado, que hace referencia al hecho
de que la posición del interruptor u sólo puede tomar el valor de 0 o de 1.
Con la intención de conocer el valor en estado estacionario de las variables
asociadas al sistema (2.153)-(2.154), se parte del modelo promedio del con-
vertidor. En este modelo se supone que la conmutación (encendido-apagado)
del transistor ocurre a muy alta frecuencia de modo que se puede expresar el
modelo en términos de variables promedio, es decir:

di
L = E − (1 − uav )υ (2.155)
dt
dυ υ
C = (1 − uav )i − (2.156)
dt R
donde i y υ representan, respectivamente, la corriente y el voltaje promedio en
el inductor y el capacitor. Mientras que la entrada uav ahora denota la entrada
de control promedio, la cual puede tomar valores en el intervalo continuo [0,1),
siendo esta la función de posición promedio del interruptor.
Como consecuencia de imponer que la entrada del convertidor sea uav =
di
U = constante, se encuentra que en estado estacionario (cuando dt = 0 y

dt = 0) el sistema (2.155)-(2.156) genera que:
· ¸· ¸ · ¸
0 (1 − U ) i E
= (2.157)
(1 − U ) − R1 υ 0

Ası́, resolviendo (2.157) se encuentra que en estado estacionario i y υ satis-


facen las siguientes relaciones:
78 2 Modelado matemático de sistemas fı́sicos

1 E
i= (2.158)
R (1 − U )2
E
υ= (2.159)
(1 − U )
De esta manera, a partir de las relaciones en estado estacionario, determi-
nadas por (2.158)-(2.159), es claro que se tiene la siguiente relación estática
(en estado estacionario) promedio:
υ 1
H(U ) = = (2.160)
E (1 − U )
υ
De (2.160) se puede observar que el cociente E es mayor o igual a uno,
pues U ∈ [0, 1), de ahı́ que a este convertidor se le conozca como elevador de
voltaje. Finalmente, en la figura 2.40 se puede observar la curva caracterı́stica
estática del convertidor Boost, donde claramente se ve cumplida la desigualdad
υ ≥ E.

10

6
H(U)

0
0 0.2 0.4 0.6 0.8 1
U

Figura 2.40. Ganancia de voltaje estático del convertidor de potencia Boost.

Ejemplo 2.19 El circuito de un convertidor de potencia de CD/CD tipo


Boost-Boost ideal, es decir sintetizado con interruptores, se muestra en la
figura 2.41. Mientras que el circuito práctico es el que se muestra en la figura
2.42.
En el sistema mostrado en la figura 2.41 las entradas u1 y u2 sólo pueden
tomar el valor de 0 o de 1, que corresponden fı́sicamente a la posición de los
interruptores (véase la figura 2.41). Estas posiciones en la práctica se efectúan
por medio de transistores en modo de operación de corte/saturación, como se
ilustra en figura 2.42. Cabe mencionar que el estado de corte de los transistores
equivale al caso en el que u1 = 0, u2 = 0, y el estado de saturación de los
transistores equivale a tener u1 = 1, u2 = 1 en la figura 2.41.
2.6 Ejemplos 79

Figura 2.41. Circuito del convertidor de potencia de CD/CD Boost-Boost ideal.

Figura 2.42. Circuito del convertidor de potencia de CD/CD Boost-Boost real.

El resto de las variables involucradas en el sistema de la figura 2.41 son: i1 ,


υ1 , i2 y υ2 , las cuales corresponden a las corrientes y voltajes, respectivamente,
asociados a L1 , C1 , L2 y C2 . Asimismo, la constante E representa el voltaje
de CD aplicado a la entrada del convertidor y υ2 la salida, misma que entrega
un voltaje amplificado que satisface la siguiente relación: υ2 ≥ E, lo cual
quedará demostrado cuando se realice un análisis en estado permanente del
sistema Boost-Boost, a partir de la obtención de su modelo matemático.
Partiendo de la figura 2.41 o 2.42 se procede a obtener el modelo matemáti-
co que describe la evolución del sistema a lo largo del tiempo con la ayuda de
la Ley de Kirchhoff de Voltajes (LVK) y la Ley de Kirchhoff de Corrien-
tes (LCK). Para esto, se consideran los cuatro casos diferentes que pueden
suscitarse de los dos posibles estados que toma cada transistor (encendido o
apagado), generando cuatro circuitos equivalentes, cada uno representado por
subsistemas de ecuaciones diferenciales lineales de cuarto orden. Finalmente,
estos subsistemas se hacen comulgar en un solo sistema diferencial de cuar-
to orden no lineal que constituye el modelo matemático final del convertidor
Boost-Boost. A continuación se muestra tal proceso.
a) Para el caso en el cual los transistores Q1 y Q2 están encendidos, i. e.,
u1 = 1 y u2 = 1 (véase la figura 2.41), el circuito equivalente es el que
muestra en la figura 2.43(a). Aplicando la LVK a las mallas I y II de la
figura 2.43(a) se obtienen las ecuaciones que gobiernan a las corrientes i1 e
i2 , respectivamente determinadas por:
di1
L1 = E, (2.161)
dt
di2
L2 = υ1 . (2.162)
dt
Por otro lado, aplicando la LCK a los nodos A y B de la figura 2.43(a), se
obtienen las ecuaciones diferenciales asociadas a los voltajes υ1 y υ2 , dadas
80 2 Modelado matemático de sistemas fı́sicos

por:
dυ1 υ1
C1 =− − i2 , (2.163)
dt R1
dυ2 υ2
C2 =− . (2.164)
dt RL
b) Para el caso en el que Q1 está encendido y Q2 apagado, i. e., u1 = 1 y
u2 = 0, a partir de la figura 2.41, el circuito equivalente es el que muestra en
la figura 2.43(b). Aplicando la LVK a las mallas I y II de la figura 2.43(b)
se obtienen las ecuaciones para i1 e i2 respectivamente:
di1
L1 = E, (2.165)
dt
di2
L2 = υ1 − υ2 . (2.166)
dt
De igual forma, aplicando la LCK en los nodos A y B de la figura 2.43(b), se
obtienen las ecuaciones que gobiernan a los voltajes υ1 y υ2 :
dυ1 υ1
C1 =− − i2 , (2.167)
dt R1
dυ2 υ2
C2 = i2 (t) − . (2.168)
dt RL
c) Cuando Q1 está apagado y Q2 encendido, i. e., u1 = 0 y u2 = 1, el circuito
resultante es el que muestra en la figura 2.43(c) y aplicando la LVK en las
mallas I y II, se logra el planteamiento de las ecuaciones que describen el
comportamiento de las corrientes i1 e i2 respectivamente:
di1
L1 = −υ1 + E, (2.169)
dt
di2
L2 = υ1 . (2.170)
dt
Asimismo, valiéndose de la LCK para los nodos A y B de la figura 2.43(c),
se tiene lo siguiente:
dυ1 υ1
C1 = i1 − − i2 , (2.171)
dt R1
dυ2 υ2
C2 =− . (2.172)
dt RL
d) Finalmente, cuando u1 = 0 y u2 = 0, el cual corresponde al caso en el que
los transistores se encuentran apagados, el circuito equivalente es el que se
muestra en la figura 2.43(d). Para obtener las ecuaciones que gobiernan a los
voltajes y corrientes ilustrados en la figura 2.43(d), de igual forma, se aplica
la LVK para las mallas I y II obteniendo lo siguiente:
2.6 Ejemplos 81

di1
L1 = −υ1 + E, (2.173)
dt
di2
L2 = υ1 − υ 2 . (2.174)
dt
Mientras que, aplicando la LCK para los nodos A y B, se tiene:
dυ1 υ1
C1 = i1 − − i2 , (2.175)
dt R1
dυ2 υ2
C2 = i2 − . (2.176)
dt RL
Ası́, mediante inspección, al comparar las ecuaciones (2.161)-(2.162),
(2.165)-(2.166), (2.169)-(2.170) y (2.173)-(2.174), se producen como resul-
tado las ecuaciones que gobiernan el comportamiento de i1 e i2 , determinadas
respectivamente por (2.177) y (2.179). Realizando un proceso similar para las
variables υ1 y υ2 , determinadas por las ecuaciones (2.163)-(2.164), (2.167)-
(2.168), (2.171)-(2.172) y (2.175)-(2.176), se obtienen las ecuaciones (2.178)
y (2.180) respectivamente. De esta manera, el modelo matemático del converti-
dor Boost-Boost queda determinado por el sistema de ecuaciones diferenciales
de cuarto orden no lineal, siguiente:
di1
L1 = −(1 − u1 )υ1 + E, (2.177)
dt
dυ1 υ1
C1 = (1 − u1 )i1 − − i2 , (2.178)
dt R1
di2
L2 = υ1 − (1 − u2 )υ2 , (2.179)
dt
dυ2 υ2
C2 = (1 − u2 )i2 − . (2.180)
dt RL
Ası́, las ecuaciones (2.177)-(2.180) constituyen el modelo matemático del con-
vertidor de potencia Boost-Boost. Si se desea corroborar que estas ecuaciones
reproducen los cuatro modos de operación del convertidor (o circuitos equiva-
lentes de la figura 2.43), basta con asignarle los valores correspondientes a las
entradas u1 y u2 .
Con la finalidad de conocer las propiedades del convertidor de potencia
Boost-Boost en estado estacionario se parte de su modelo promedio asociado,
el cual se obtiene suponiendo que ambos transistores conmutan a alta frecuen-
cia y está determinado como:

dī1
L1 = −(1 − u1av )ῡ1 + E, (2.181)
dt
dῡ1 ῡ1
C1 = (1 − u1av )ī1 − − ī2 , (2.182)
dt R1
dī2
L2 = ῡ1 − (1 − u2av )ῡ2 , (2.183)
dt
82 2 Modelado matemático de sistemas fı́sicos

(a) Circuito equivalente del convertidor de potencia Boost-Boost


cuando u1 = 1 y u2 = 1.

(b) Circuito equivalente del convertidor de potencia Boost-Boost


cuando u1 = 1 y u2 = 0.

(c) Circuito equivalente del convertidor de potencia Boost-Boost


para u1 = 0 y u2 = 1.

(d) Circuito equivalente del convertidor de potencia Boost-Boost


cuando u1 = 0 y u2 = 0.

Figura 2.43. Modos de operación del convertidor de potencia de CD/CD Boost-


Boost.

dῡ2 ῡ2
C2 = (1 − u2av )ī2 − , (2.184)
dt RL
donde ī1 , ῡ1 , ī2 y ῡ2 representan las corrientes y los voltajes promedio asocia-
dos a L1 , C1 , L2 y C2 respectivamente. Las entradas u1av y u2av representan
las entradas de control promedio, las cuales pueden tomar valores en el in-
tervalo continuo [0, 1), siendo estas las funciones de posición promedio de los
interruptores.
De esta manera, partiendo del modelo promedio (2.181)-(2.184), se procede
a obtener los valores en estado estacionario del sistema que aparecen cuando
las entradas del convertidor ū1av y ū2av son constantes en algún valor dentro
del intervalo [0, 1). Esto se consigue suponiendo que ddtī1 = 0, dῡ dī2
dt = 0, dt = 0
1
2.7 Caso de estudio 83
dῡ2
y dt = 0, para encontrar:
    
0 −(1 − ū1av ) 0 0 ı̄1 −E
 (1 − ū1av ) 1   ῡ1   0 
 − R1 −1 0   =  ,
 0 1 0 −(1 − ū2av )   ı̄2   0 
0 0 (1 − ū2av ) − R1L ῡ2 0

Resolviendo para ī1 , ῡ1 , ī2 y ῡ2 , se obtiene lo siguiente:


   E R1 +RL (1−ū2av )2 
ı̄1 R1 RL (1−ū1av )2 (1−ū2av )2
 ῡ1    E 

 = 1−ū1av . (2.185)
 ı̄2   E 1

RL (1−ū1av )(1−ū2av )2
ῡ2 E
(1−ū1av )(1−ū2av )

De esta manera, (2.185) permite conocer de manera directa los valores que
toman las variables promedio ī1 , ῡ1 , ī2 y ῡ2 , en estado estacionario. Asi-
mismo, a partir de la última relación en (2.185) se puede observar que la
salida satisface la desigualdad ῡ2 ≥ E, pues recordemos que u1av ∈ [0, 1) y
u1av ∈ [0, 1).

2.7. Caso de estudio. Un convertidor electrónico de


potencia de CD a CD tipo resonante serie de alta
frecuencia
Muchos equipos en la actualidad utilizan para su funcionamiento una
gran diversidad de circuitos electrónicos los cuales, precisamente debido a su
gran diversidad, necesitan ser alimentados con diferentes niveles de voltaje de
corriente directa (CD). Para alimentar estos equipos se puede utilizar un gran
transformador que cuente con varias derivaciones en el secundario de modo
que a partir de cada una de ellas se pueda utilizar un arreglo rectificador-
filtro para obtener un voltaje de CD diferente. Sin embargo, este método ya
no es utilizado porque requiere de componentes (inductores y capacitores) de
valores grandes, resultando en equipos voluminosos, además de producir la
pérdida de grandes cantidades de energı́a. La estrategia utilizada actualmente
para resolver este problema consiste en contar con varios circuitos electrónicos
de potencia que mediante dispositivos de conmutación obtienen, a su salida,
valores de voltaje de CD diferentes a partir de un único voltaje de CD de
suministro. Estos circuitos reciben el nombre de convertidores electrónicos de
potencia de CD a CD y resuelven el problema arriba mencionado reduciendo
las pérdidas de energı́a y el volumen de los equipos. De hecho, la miniatu-
rización de los equipos electrónicos modernos se debe en gran parte al uso
de convertidores electrónicos de potencia. En los ejemplos 2.18 y 2.19 se han
modelado algunos de los convertidores electrónicos de potencia utilizados en
la actualidad.
84 2 Modelado matemático de sistemas fı́sicos

i C

v -

+
L

+
E C0 R v0

(a) Serie
i i0
L0

+
L

+
v C0 R
E v0

- -

(b) Paralelo

Figura 2.44. Convertidores electrónicos de potencia de CD a CD tipo resonante.

Otro tipo especial de convertidores electrónicos de potencia son aquellos


que se denominan resonantes, los cuales se clasifican a su vez en serie y paralelo
según la manera en que se conectan sus componentes (véase la figura 2.44).
En particular, el convertidor resonante serie de CD a CD mostrado en la
figura 2.44(a) funciona del siguiente modo. La red de conmutación constituye
un inversor que entrega un voltaje de potencia alterno y cuadrado (que toma
valores de ±E) a la entrada del circuito resonante serie. En la forma más básica
de funcionamiento de un convertidor resonante serie, la frecuencia de la señal
de voltaje entregada por el inversor es igual a la frecuencia de resonancia
del circuito serie LC. De este modo, los transistores con los que se construye
la red de conmutación se encienden y apagan por parejas, Q1 , Q3 y Q2 , Q4 ,
cuando la corriente a través de ellos es igual a cero (véanse los interruptores
en la parte izquierda de la figura 2.45; los diodos colocados en paralelo a los
transistores son utilizados cuando el circuito no funciona en resonancia tal
como se explica la sección 3.11 del capı́tulo 3). Esto es muy conveniente pues
evita la fatiga de los transistores alargando la vida útil de los mismos. Por
otro lado, como el circuito LC serie funciona en resonancia, la corriente i a
través del circuito adquiere una forma de onda sinusoidal la cual es rectificada
y filtrada por la parte derecha del circuito de la figura 2.44(a). De este modo,
la carga alimentada por el circuito (representada por la resistencia R) recibe
en sus terminales el voltaje de CD representado por v0 .
En la figura 2.46 se muestra el diagrama eléctrico de un convertidor reso-
nante serie de CD a CD presentando el inversor de manera simplificada como
2.7 Caso de estudio 85

L C
Q1 Q4 i +và
+ D1 D4 +
ï
E ï
ï R v0
à Q3
ï C0
Q2 à
D2 D3

Figura 2.45. Convertidor resonante serie de CD a CD mostrando la disposición de


dispositivos en el inversor.

L C

v-

+
i
+

E(t)
- Co

v0

Figura 2.46. Circuito simplificado de un convertidor resonante serie de CD a CD.

una fuente de voltaje alterno y cuadrado E(t) que toma valores ±E. Nótese
que, debido a la presencia de los diodos rectificadores, el funcionamiento del
circuito puede ser separado en dos casos: 1) cuando i > 0, figura 2.47(a), y
2) cuando i < 0, figura 2.47(b). A partir de la figura 2.47(a) se obtienen las
ecuaciones para i > 0. Aplicando la Ley de Kirchhoff de voltajes al trayecto
cerrado de la izquierda se obtiene:
di
E(t) = L
+ v + v0 , i > 0
dt
Es importante resaltar que se ha tomado en consideración el sentido indicado
para la corriente i, ası́ como la polaridad indicada para v0 . Por otro lado, de
acuerdo a (2.120) la relación entre el voltaje y la corriente en el capacitor
resonante está dada como:
dv
C = i, i > 0
dt
Finalmente, aplicando la Ley de Kirchhoff de corrientes al nodo común a
ambos capacitores se obtiene:
86 2 Modelado matemático de sistemas fı́sicos

dv0 v0
i = C0 + , i>0
dt R

L C

+ -

+
i v
v0

+
E(t) - C0 R
-

(a) i > 0
L C

i +
v- -
+

E(t) - C0 R v0

+
(b) i < 0

Figura 2.47. Circuitos equivalentes para i > 0 e i < 0.

Por otro lado, a partir de la figura 2.47(b) se obtienen las ecuaciones para
i < 0. Aplicando la Ley de Kirchhoff de voltajes al trayecto cerrado de la
izquierda se obtiene:
di
E(t) = L + v − v0 , i < 0
dt
Nótese que v0 está afectado por un signo “−” porque la polaridad indica-
da para este voltaje está en sentido opuesto al definido por el sentido de la
corriente eléctrica i. Sin embargo, la relación entre el voltaje y la corriente en
el capacitor resonante no sufre cambios:
dv
= i, i < 0
C
dt
Finalmente, aplicando la Ley de Kirchhoff de corrientes al nodo común a
ambos capacitores se obtiene:
v0 dv0
i=−− C0 , i<0
R dt
Nótese que el sentido correcto de la corriente en el capacitor C0 y en la resis-
tencia es de la terminal marcada con “+” a la terminal marcada con “−”, es
decir, es contrario al sentido indicado para i.
2.8 Resumen del capı́tulo 87

Comparando estos dos conjuntos de ecuaciones, se puede obtener un único


conjunto de ecuaciones que representa a ambos casos i > 0 e i < 0:
di
E(t) = L + v + v0 sign(i) (2.186)
dt
dv
C =i (2.187)
dt
dv0 v0
abs(i) = C0 + (2.188)
dt R
donde:
½
+1, i > 0
sign(i) = (2.189)
−1, i < 0

mientras que abs(i) representa el valor absoluto de i, es decir abs(i) = i si


i > 0 y abs(i) = −i si i < 0. Las ecuaciones en (2.186)-(2.188) constituyen
el modelo matemático del convertidor electrónico de potencia de CD a CD
tipo resonante serie. En la sección 3.11 del capı́tulo 3 se retomará el estudio
de este tipo de convertidor electrónico de potencia. A partir del estudio del
modelo (2.186)-(2.188) se verá cómo funciona este circuito y se explicará por
qué recibe el calificativo de “alta frecuencia”. Para más información sobre el
modelado de este tipo de convertidores electrónicos de potencia se recomienda
consultar [10].

2.8. Resumen del capı́tulo

El modelo matemático de un sistema fı́sico es una ecuación o un conjunto


de ecuaciones diferenciales que describen la evolución de las variables impor-
tantes del sistema fı́sico cuando son sometidas a condiciones especı́ficas. Tal
descripción será obtenida mediante la solución de dichas ecuaciones diferen-
ciales en el capı́tulo 3.
Se ha mostrado que el modelo matemático de los sistemas mecánicos,
eléctricos y electromecánicos puede ser obtenido utilizando el concepto de
energı́a, cantidad fı́sica que los ingenieros están acostumbrados a manejar. De
acuerdo a este enfoque, se puede considerar que las partes que componen a los
sistemas fı́sicos son procesadores de energı́a y el modelo matemático describe
cómo intercambian la energı́a dichos componentes.
Comparando la manera en que los sistemas procesan la energı́a se pueden
establecer analogı́as entre sistemas de diferente naturaleza. Por ejemplo, la
masa y la inercia (sistemas mecánicos) son análogas a la inductancia (sistemas
eléctricos), un resorte (sistemas mecánicos) es análogo a un capacitor (sistemas
eléctricos), y la fricción viscosa (sistemas mecánicos) es análoga a la resistencia
(sistemas eléctricos). Además, una caja de engranes y una barra apoyada en
un punto (sistemas mecánicos) son análogas a un transformador (sistemas
88 2 Modelado matemático de sistemas fı́sicos

eléctricos), mientras que un sistema piñón-cremallera (sistemas mecánicos) es


análogo a un motor eléctrico (sistemas electromecánicos).
En lo que resta de la presente obra, el modelo matemático del sistema a
controlar será utilizado para diseñar un controlador (otra ecuación diferencial
en general). El objetivo es que al conectar el controlador en realimentación
con el sistema a controlar se genere otra ecuación diferencial (en lazo cerrado)
cuyas propiedades (estudiadas en el capı́tulo 3) aseguren que la variable que
interesa controlar evolucione en el tiempo de la manera deseada.

2.9. Preguntas de repaso


1. ¿Cuáles son las leyes fundamentales de la fı́sica que se usan para describir
la interconexión de componentes en sistemas mecánicos y en sistemas
eléctricos?
2. ¿Por qué el modelo obtenido en el ejemplo 2.7 es una ecuación diferen-
cial de primer orden mientras que el modelo obtenido en el ejemplo 2.8
está constituido por dos ecuaciones diferenciales de segundo orden cada
una? Nótese que en el ejemplo 2.7 hay tres cuerpos mientras que en el
ejemplo 2.8 hay dos cuerpos involucrados.
3. ¿Por qué el modelo en (2.92) no tiene el término correspondiente a θ4 , es
decir, a la posición?
4. ¿Por qué los modelos matemáticos de un circuito RL y de un circuito
RC son ecuaciones diferenciales de primer orden mientras que el modelo
matemático de un circuito RLC es una ecuación diferencial de segundo
orden?
5. En la sección 2.2.3 se menciona que “Faraday fue el primero en darse cuen-
ta de que un inductor (y en general cualquier circuito eléctrico suficien-
temente largo) tiene propiedades análogas a las que tiene el momentum
en sistemas mecánicos”. ¿Puede explicar a qué se refiere esta afirmación?
¿Ha observado que cuando se trata de desconectar un circuito altamente
inductivo salta una chispa? ¿Recuerda lo que establece la Primera Ley de
Newton?
6. Se ha visto que en un motor eléctrico de CD se cumple que ke = km . Por
otro lado, es claro que el subsistema eléctrico debe transmitir energı́a al
subsistema mecánico para realizar el movimiento. ¿Puede dar el ejemplo
de una situación en la que el subsistema mecánico transmite energı́a al
subsistema eléctrico? ¿Qué papel juega en este caso el hecho de que ke =
km ?
7. Se ha visto que una caja de engranes es análoga al transformador eléctrico
¿Podrı́a listar las caracterı́sticas existentes entre las corrientes y voltajes
en ambos devanados de un transformador eléctrico? ¿Algo similar puede
establecerse para las velocidades y pares en ambos lados de la caja de
engranes? ¿Podrı́a listar las ventajas, desventajas y aplicaciones de estas
caracterı́sticas en una caja de engranes y en un transformador eléctrico?
2.10 Ejercicios propuestos 89

8. De acuerdo a la pregunta anterior ¿Por qué un automóvil debe viajar más


lentamente para subir una pendiente muy pronunciada pero puede viajar
más rápido en terrenos planos?
9. Si un transformador eléctrico puede elevar el voltaje eligiendo una ta-
za n1 /n2 apropiada ¿Por qué se usan circuitos electrónicos basados en
transistores para amplificar señales en sistemas de comunicaciones (que
procesan corriente alterna) en lugar de transformadores eléctricos?
10. Si un transformador eléctrico y una caja de engranes conservan la potencia
en ambos puertos ¿De qué manera intervienen las pérdidas en ambos
dispositivos? ¿A qué se pueden deber dichas pérdidas?

2.10. Ejercicios propuestos


1. Considere el sistema masa-resorte-amortiguador mostrado en la figura
2.22(a) y estudiado en el ejemplo 2.3. Ahora suponga que este mecanismo
está girado 90◦ en sentido horario, es decir, que ahora existe el efecto de
la gravedad sobre la dirección del desplazamiento del resorte y del amorti-
guador (la masa cuelga del techo a través del resorte y del amortiguador).
Demuestre que el modelo matemático correspondiente es:
b K 1
ÿ + ẏ + y = F (t)
m m m
donde y = x − x0 con x0 = mg/K y g la aceleración de la gravedad.
¿Qué significa esto?
2. Considere el sistema mecánico del ejemplo 2.9. Suponga que sobre el cuer-
po de la derecha se aplica un par externo de perturbación Tp (t). También
suponga que el par externo aplicado T (t) es producido por un motor
eléctrico de CD como en el ejemplo 2.12. Obtenga el modelo matemático
correspondiente y compárelo con el obtenido en (9.9) y (9.10) del capı́tulo
9.
3. Realice las manipulaciones algebraicas que sobre el modelo (2.114) y
(2.115) se sugieren en el último párrafo del ejemplo 2.12.
4. Realice las manipulaciones algebraicas del ejercicio anterior sobre el mo-
delo obtenido en el ejercicio 2 de esta sección.
5. Considere el circuito eléctrico mostrado en la figura 2.48. Demuestre que
el voltaje v indicado en la figura es igual a:
1
v= (v1 − v2 )
2

6. Considere el circuito RC mostrado en la figura 2.49. Demuestre que el


voltaje en la resistencia está dado como:
s vc (0)
Vo (s) = 1 Vi (s) − 1
s + RC s + RC
90 2 Modelado matemático de sistemas fı́sicos

donde Vo (s) y Vi (s) son las transformadas de Laplace de vo y vi , mientras


que vc (0) es el voltaje inicial (cuando t = 0) en el capacitor.
7. Un voltı́metro analógico de corriente directa es básicamente un motor de
CD con un resorte firmemente unido entre su eje de giro y un punto fijo
a la parte no móvil del voltı́metro. Esto significa que dicho motor de CD
está restringido a girar menos de una vuelta. En base a esta descripción
obtenga el modelo matemático de un voltı́metro analógico de CD.
8. Considere el sistema conmutado mostrado en la figura 2.50, el cual repre-
senta a un convertidor de potencia de CD/CD tipo Buck. Esta topologı́a
también es conocida como reductora de voltaje, porque la salida de voltaje
υ es menor o igual que el voltaje de entrada E, i.e., υ ≤ E. El objetivo de
control de este sistema consiste en conseguir que el voltaje de salida del
convertidor υ, se estabilice a un valor de voltaje deseado ῡ ≤ E, mediante
el diseño adecuado de u.
Demuestre que el modelo matemático del convertidor de potencia de
CD/CD Buck, está determinado por:
di
L = −υ + uE
dt

R R

+ à
v1 v v2
à +

Figura 2.48. Circuito del ejercicio 5.

C
+ à

+ vo
vi R
à
à

Figura 2.49. Circuito RC.


2.10 Ejercicios propuestos 91

Q
L
i
E D v C R

(a) Construcción del convertidor mediante


transistor-diodo.

i L
u
E v C R
u
(b) Representación ideal del convertidor.

Figura 2.50. Diagrama electrónico del convertidor de potencia de CD/CD Buck.

dυ υ
C = i− (2.190)
dt R
Las variables i, υ representan la corriente presente en el inductor L y el
voltaje entre las terminales del capacitor C, respectivamente. Mientras
que E representa el voltaje de entrada al sistema y R es la resistencia de
salida del sistema. Finalmente, la variable u denota la función de posición
del interruptor o conmutador, la cual actúa como variable de control y
sólo toma el valor de 0 o de 1.
9. El sistema Convertidor de potencia Buck-Motor de CD, mostrado en la
figura 2.51, representa una forma de conveniente de alimentar a un motor
de CD. El objetivo de control de este sistema consiste en lograr que la
velocidad angular de la flecha del motor ω, se estabilice a un valor de
velocidad deseada ω̄ a través del voltaje υ, obtenido del convertidor de
potencia Buck, mediante el diseño adecuado de u.
Partiendo del hecho de que el modelo matemático de un motor de CD
esta determinado por:
dia
La = υ − Ra ia − ke ω,
dt

J = km ia − Bω.
dt
Demuestre que el modelo matemático del sistema Convertidor de potencia
Buck-Motor de CD, representado idealmente en la figura 2.51(b), está de-
terminado por el siguiente sistema de ecuaciones diferenciales lineales:
di
L = −υ + Eu, (2.191)
dt
dυ υ
C = i − ia − ,
dt R
92 2 Modelado matemático de sistemas fı́sicos

dia
La = υ − Ra ia − ke ω,
dt

J = km ia − Bω.
dt
donde:
• i es la corriente presente en el inductor del convertidor Buck.
• υ es el voltaje de salida del convertidor y a su vez es el voltaje aplicado
en las terminales de armadura del motor.
• u representa la función de posición del interruptor o conmutador, la
cual actúa como variable de control y sólo toma el valor de 0 o de 1.
• L denota la inductancia del convertidor Buck.
• C representa la capacitancia del convertidor Buck.
• E es el voltaje de alimentación del sistema convertidor Buck-Motor de
CD.
• R denota la resistencia de salida del convertidor.
• ia es la corriente eléctrica de armadura.
• ω es la velocidad angular del rotor del motor.
• La representa la inductancia de armadura.
• Ra es la resistencia de armadura.

D !

Convertidor Buck Motor de CD

(a) Construcción del sistema convertidor Buck-Motor de CD


mediante transistor-diodo.

Convertidor Buck Motor de CD


(b) Representación ideal del sistema convertidor Buck-
Motor de CD.

Figura 2.51. Diagrama electrónico del sistema convertidor de potencia de CD/CD


Buck-Motor de CD.
2.10 Ejercicios propuestos 93

• J es la inercia del rotor del motor.


• ke representa la constante de fuerza contra-electromotriz.
• km representa la constante de par del motor.
• B es la constante de fricción viscosa del motor.
10. Considere el circuito RLC en serie del ejemplo 2.14, cuyo modelo ma-
temático está dado en (2.123). La Energı́a almacenada en el circuito es
igual a la energı́a magnética de el inductor más la energı́a eléctrica en el
capacitor E = 12 Li2 + 2C1 2
q . Compruebe que Ė = ivi − Ri2 . ¿Qué significa
cada término de esta expresión?
11. Considere el sistema inercia-resorte-amortiguador del ejemplo 2.6, cuyo
modelo matemático está dado en (2.68). La Energı́a almacenada en el
sistema es igual a la energı́a cinética más la energı́a en el resorte E =
1 2 1 2 2
2 I θ̇ + 2 Kθ . Compruebe que Ė = T θ̇ − bθ̇ . ¿Qué significa cada término
de esta expresión?
12. Considere el modelo en (2.114),(2.115), correspondiente al sistema electro-
mecánico del ejemplo 2.12. La energı́a almacenada en este sistema es igual
a la energı́a magnética en el inductor de armadura más la energı́a cinética
del mecanismo. ¿Puede proceder como en los dos ejemplos previos para
encontrar la expresión correspondiente a dE dt ? ¿Qué significa cada uno de
los términos que aparecen en dE dt ? ¿Puede identificar a los términos que
representan el intercambio de energı́a entre los subsistemas eléctrico y
mecánico?
Referencias

1. P.E. Wellstead, Physical system modelling, Academic Press, Londres, 1979.


2. M. Alonso and E.J. Finn, Fı́sica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
3. R.K. Wangsness, Campos Electromagnéticos, Limusa-Noriega Editores, México,
D.F., 1987.
4. R. Kelly, J. Llamas, and R. Campa, A measurement procedure for viscous and
coulomb friction, IEEE Transactions on Instrumentation and Measurement, vol.
49, no. 4, pp. 857-861, 2000.
5. C.T.A. Johnk, Teorı́a electromagnética: campos y ondas, Limusa-Noriega Edi-
tores, México, D.F., 1993.
6. N.S. Nise, Sistemas de control para ingenierı́a, 1a. edición en español, 1a. Re-
impresión, CECSA, México, 2004.
7. F. W. Sears, M. W. Zemansky y H. D. Young, Fı́sica Universitaria, 6a. Edición,
Addison-Wesley Iberoamericana, Wilmington, Delaware, 1988.
8. M.E. Van Valkenburg, Análisis de redes, Limusa-Noriega Editores, México, D.F.,
1994.
9. W. H. Hayt y J. E. Kemmerly, Análisis de circuitos en ingenierı́a, McGraw-Hill,
México, D.F., 1985.
10. R. Silva Ortigoza, Control de convertidores resonantes mediante planitud dife-
rencial: diseño y construcción, Tesis Maestrı́a en Ciencias, CINVESTAV-IPN
(Zacatenco), Febrero (2002).
3
Base matemática: ecuaciones diferenciales

E(t)
50

[V] 0

-50

0 0.5 1 1.5 2
t [s] x 10
-4
30
P(t)
20
[Watt]

10

0
0 2 4 6 8
t [s] x 10
-4
1.5
i(t)
0.5
[A]

-0.5
v(t)

-1.5
-500 -250 0 250 500
[V]

Las ecuaciones diferenciales describen el comportamiento de los sistemas


fı́sicos y de los sistemas de control en lazo cerrado. Por ejemplo, en los cir-
cuitos eléctricos y electrónicos, resolviendo las ecuaciones diferenciales corres-
pondientes se puede contar con una descripción cuantitativa y cualitativa de
las corrientes en los inductores y los voltajes en los capacitores. A partir de
estos valores se pueden calcular otras variables importantes como la potencia
y la energı́a.
98 3 Base matemática: ecuaciones diferenciales

Objetivos del capı́tulo


En el capı́tulo 2 se ha mostrado que la evolución de los sistemas fı́sicos que
interesa controlar en esta obra está descrita por ecuaciones diferenciales ordi-
narias, lineales y de coeficientes constantes. Es de mucha utilidad identificar
cuales son las propiedades que determinan la forma de la solución de este tipo
de ecuaciones diferenciales porque, según se verá en capı́tulos posteriores, el
diseño de un controlador consiste en construir un dispositivo que modifique
convenientemente esas propiedades para conseguir una respuesta satisfactoria.
El presente capı́tulo pretende que el lector aprenda lo siguiente respecto de las
ecuaciones diferenciales ordinarias, lineales y de coeficientes constantes:
Qué es la respuesta forzada y qué es la respuesta natural, y que la solu-
ción completa de la ecuación diferencial está dada como la suma de estas
respuestas.
Cómo depende la solución de la ecuación diferencial de las raı́ces del po-
linomio caracterı́stico (o, equivalentemente, de los polos de la función de
transferencia).
Identificar gráficamente cómo es la solución de las ecuaciones diferencia-
les de primero y segundo orden e interpretar con ejemplos prácticos el
significado de dichas formas gráficas. A partir de este estudio, ser capaz
de comprender cuáles son las posibles formas gráficas de las ecuaciones
diferenciales de orden arbitrario.
Identificar cuáles son las caracterı́sticas que determinan la forma de la
respuesta transitoria, el valor final de la respuesta y la estabilidad de la
ecuación diferencial.
Identificar el principio de superposición como la propiedad fundamental
que determina la linealidad de una ecuación diferencial.
Las técnicas de control que se utilizan en esta obra requieren del modelo
matemático del proceso fı́sico a controlar. Estos modelos matemáticos resul-
tan ser ecuaciones diferenciales. El diseño del controlador se realiza buscando
que la ecuación diferencial que representa al sistema controlado en lazo cerra-
do tenga las propiedades matemáticas que aseguran que el sistema de control
responderá como se desea. Por tanto, es importante saber cuáles son las ca-
racterı́sticas de una ecuación diferencial que determinan como es su solución.
Aunque existen varios enfoques para estudiar ecuaciones diferenciales, sin em-
bargo el uso de la transformada de Laplace es el método preferido en la teorı́a
de control clásico. Es por esta razón que en este capı́tulo se estudian las ecua-
ciones diferenciales ordinarias, lineales, de coeficientes constantes usando la
transformada de Laplace.
La transformada de Laplace se define del siguiente modo. Suponga que
se tiene una función del tiempo f (t), la transformada de Laplace de f (t) se
representa por F (s) y se puede calcular como [2], pág. 185,[3], pág. 285:
Z ∞
F (s) = L{f (t)} = f (t)e−st dt
0
3.1 Ecuación diferencial de primer orden 99

El resultado fundamental de la transformada de Laplace que se utiliza en la


solución de ecuaciones diferenciales ordinarias, lineales, de coeficientes cons-
tantes es el siguiente [2], pág. 192,[3], pág. 293:
( )
dn f (t)
L =
dtn
sn F (s) − sn−1 f (0) − sn−2 f (1) (0) − · · · − sf (n−2) (0) − f (n−1) (0) (3.1)

donde el exponente entre paréntesis indica el orden de la derivada respecto al


tiempo. También es útil la siguiente propiedad [2], pág. 193,[3], pág. 293:
(Z )
t
F (s)
L f (τ )dτ = (3.2)
0 s

Otro resultado importante es el teorema del valor final [1], pág. 25, [3], pág.
304:

lı́m f (t) = lı́m sF (s) (3.3)


t→∞ s→0

expresión que es válida si dichos lı́mites existen.

3.1. Ecuación diferencial de primer orden


Considere la siguiente ecuación diferencial ordinaria, lineal, de coeficientes
constantes de primer orden:

ẏ + a y = k u, y(0) = y0 (3.4)

donde k y a son constantes reales, y0 se conoce como el valor inicial o la con-


dición inicial de y(t) y ẏ = dy
dt . El objetivo de resolver esta ecuación diferencial
es, conociendo los valores de a, k y de la función del tiempo u, obtener y co-
mo una función del tiempo que al ser sustituida en (3.4) satisfaga la igualdad
ahı́ establecida. Usando (3.1) en (3.4) se obtiene:

sY (s) − y0 + a Y (s) = k U (s) (3.5)

Despejando Y (s) se puede escribir:

k 1
Y (s) = U (s) + y0 (3.6)
s+a s+a
Para continuar es necesario especificar la función del tiempo u. Suponga que:
A
u = A, U (s) = (3.7)
s
100 3 Base matemática: ecuaciones diferenciales

donde A es una constante. Por tanto, ahora se puede escribir (3.6) como:
kA 1
Y (s) = + y0 (3.8)
s(s + a) s + a
De acuerdo al método de expansión en fracciones parciales [2], Cap. 4, [3],
pág. 319, si a 6= 0 entonces se debe escribir:
kA B C
= + (3.9)
s(s + a) s+a s
donde B y C son dos constantes. El valor de B se obtiene multiplicando ambos
lados de (3.9) por el factor (s + a) y evaluando las expresiones resultantes en
s = −a:
¯ ¯ ¯
kA ¯ B ¯ C ¯
(s + a)¯¯ = (s + a)¯¯ + (s + a)¯¯
s(s + a) s=−a s+a s=−a s s=−a

es decir:
¯
kA ¯¯ kA
B= =− (3.10)
s ¯s=−a a

El valor de C se calcula multiplicando ambos lados de (3.9) por el factor s y


evaluando las expresiones resultantes en s = 0:
¯ ¯ ¯
kA ¯ B ¯¯ C ¯¯
s¯ = s + s¯
s(s + a) ¯s=0 s + a ¯s=0 s s=0

es decir:
¯
kA ¯¯ kA
C= ¯ = (3.11)
s + a s=0 a

Sustituyendo (3.9), (3.10), (3.11) en (3.8) se tiene:


kA 1 kA 1 y0
Y (s) = − + + (3.12)
a s+a a s s+a
A partir de tablas de transformadas de Laplace [4], cap. 32, se sabe que:
1
L{eβt } = (3.13)
s−β
donde β es cualquier constante real. Usando (3.13) se encuentra que la trans-
formada inversa de Laplace de (3.12) está dada como:
kA −at kA
y(t) = − e + + y0 e−at (3.14)
a a
la cual constituye la solución de (3.4).
3.1 Ecuación diferencial de primer orden 101

Ejemplo 3.1 Para comprobar que (3.14) es la solución de (3.4) se procede


del siguiente modo. Primero se obtiene la derivada de y(t) = − kA
a e
−at
+ kA
a +
−at
y0 e , es decir:

ẏ(t) = kAe−at − ay0 e−at

y se sustituye ẏ(t) e y(t) en (3.4) para obtener:


µ ¶
kA −at kA
ẏ(t) + ay(t) = kAe−at − ay0 e−at + a − e + + y0 e−at = kA = ku
a a
porque en (3.7) se ha definido u = A. Esto significa que la expresión para
y(t) presentada en (3.14) satisface a (3.4) y, por tanto, se ha comprobado que
(3.14) es la solución de (3.4). Este procedimiento debe seguirse para comprobar
la solución de cualquier ecuación diferencial.
La solución dada en (3.14) se puede descomponer en dos partes:

y(t) = yn (t) + yf (t) (3.15)


µ ¶
kA
yn (t) = − + y0 e−at (3.16)
a
kA
yf (t) = (3.17)
a
donde yn (t) y yf (t) reciben los nombres de respuesta natural y respuesta
forzada, respectivamente.
La respuesta forzada yf (t) recibe este nombre porque es debida única-
mente a la presencia de la función del tiempo u. Por otro lado, la respuesta
natural yn (t) recibe dicho nombre porque está determinada únicamente por la
estructura (o naturaleza) de la ecuación diferencial, es decir, por los términos
ẏ +ay presentes en el lado izquierdo de (3.4). Todo esto se explica del siguiente
modo. Considere el procedimiento de solución previo suponiendo por un mo-
mento que y0 = 0. La expansión en fracciones parciales presentada en (3.9) y
la subsecuente aplicación de la transformada inversa de Laplace muestran que
y(t) es obtenida como la suma de varias funciones del tiempo cuyas “formas”
dependen de las fracciones 1s y s+a 1
. Nótese que la presencia de la primera
de estas fracciones, s , en (3.9) es debida a que U (s) = As está presente en
1

(3.8) lo cual, a su vez, se debe a que u = A donde A es una constante. Nótese


que la respuesta forzada yf (t) es una constante que resulta del término kA 1
a s
1
en (3.12), es decir, tiene su origen en la fracción s . Esto confirma que yf (t)
depende únicamente de la función del tiempo u. Por otro lado, la presencia de
1
la fracción s+a es debida a los términos ẏ +ay ya que L{ẏ +ay} = (s+a)Y (s).
De acuerdo a (3.13) esta fracción da origen a la función e−at que conforma a la
respuesta natural yn (t). Esto confirma que yn (t) está determinada únicamente
por la estructura (o naturaleza) de la ecuación diferencial. Una consecuencia
importante de este hecho es que yn (t) siempre estará dada en este ejemplo co-
mo una función de la forma e−at sin importar cual sea el valor de u. El lector
102 3 Base matemática: ecuaciones diferenciales

puede repasar el procedimiento seguido para resolver la ecuación diferencial y


darse cuenta que la condición inicial y0 siempre aparecerá en la solución y(t)
como parte de la respuesta natural yn (t).
Antes de continuar, un poco de nomenclatura. En sistemas de control y
y u se conocen como la salida y la entrada, respectivamente. El polinomio
que surge de aplicar la transformada de Laplace a la ecuación diferencial, es
decir s + a que tiene su origen en L{ẏ + ay} = (s + a)Y (s), se conoce como
el polinomio caracterı́stico.
La solución en (3.14) o, equivalentemente, en (3.15) puede tener uno de
los siguientes comportamientos.
1. Si a > 0, es decir si la raı́z del polinomio caracterı́stico s = −a es negativa,
entonces lı́mt→∞ yn (t) = 0 y lı́mt→∞ y(t) = yf (t).
2. Si a < 0, es decir si la raı́z del polinomio caracterı́stico s = −a es positiva,
entonces yn (t) y y(t) crecen sin lı́mite conforme el tiempo crece.
3. El caso en el que a = 0, es decir cuando la raı́z del polinomio caracterı́stico
está en s = 0, no puede ser estudiado con las fórmulas desarrolladas
hasta aquı́ y se estudia como un caso especial en la siguiente sección. Sin
embargo, con el fin de presentar un resumen de todos los casos, aquı́ se
anticipa lo que se va a encontrar en la siguiente sección. Cuando la raı́z
del polinomio caracterı́stico está en s = −a = 0, la respuesta natural
permanece constante yn (t) = y0 , ∀t ≥ 0 y la respuesta forzada es la
Rt
integral de la entrada yf (t) = k 0 u(t)dt.

Estudio gráfico de la solución

En esta sección se estudia la forma gráfica de la solución en (3.15). De


acuerdo a lo que se acaba de estudiar, si a > 0 entonces la respuesta natu-
ral tiende a cero conforme el tiempo crece: lı́mt→∞ yn (t) = 0 y, por tanto,
para tiempos muy grandes la solución de la ecuación diferencial es igual a la
respuesta forzada únicamente: lı́mt→∞ y(t) = yf (t) = kA a . Esto significa que
mientras más rápido desaparezca la respuesta natural yn (t) (lo cual ocurre
conforme a > 0 es mayor) más rápido la solución completa y(t) alcanzará a
la respuesta forzada yf (t). Por tanto, se puede pensar que la respuesta na-
tural es el medio que permite que la solución completa y(t) transite desde el
valor inicial y(0) = y0 hasta la respuesta forzada yf (t). La existencia de tal
intermediario se justifica recordando que la solución de la ecuación diferencial
ordinaria en (3.4), es decir y(t), es una función continua del tiempo. Esto sig-
nifica que no pueden existir brincos discontinuos en y(t) y, por tanto, no se
puede saltar jamás desde el valor y(t) = y0 a y(t) = yf (t) 6= y0 en un intervalo
de tiempo de duración cero.
En la figura 3.1 se muestra graficada la solución en (3.15) cuando y0 = 0
y a > 0, es decir:
kA ¡ ¢
y(t) = 1 − e−at (3.18)
a
3.1 Ecuación diferencial de primer orden 103

Se define la constante de tiempo:


1
τ= (3.19)
a
como una medida de la rapidez con la que desaparece la respuesta natural, es
decir, la rapidez con la que y(t) alcanza a la respuesta forzada yf (t). Mediante
sustitución directa de (3.19) en (3.18), es sencillo comprobar que:

kA
y(τ ) = 0.632 (3.20)
a
Finalmente, es importante señalar que y(t) crece sin lı́mite si a < 0. Si a = 0
entonces se tiene el caso estudiado en la sección 3.2, es decir y(t) = kAt crece
sin lı́mite al aumentar el tiempo.

y(t)

kA
a

0:632 kA
a

ü ü ü ü ü ü ü
tiempo

Figura 3.1. Estudio gráfico de y(t) en (3.18).

Función de transferencia

Suponga que la condición inicial es cero, y0 = 0, entonces (3.6) se puede


escribir como:
k
Y (s) = U (s)
s+a
104 3 Base matemática: ecuaciones diferenciales

o también:
Y (s) k
= G(s) = (3.21)
U (s) s+a

La función G(s) se conoce como la función de transferencia de la ecuación


diferencial en (3.4). El polinomio que divide en G(s), es decir s + a, se conoce
como el polinomio caracterı́stico y sus raı́ces se conocen como los polos de
G(s). En este caso solo existe un polo en s = −a. De acuerdo al estudio
previo se pueden hacer las siguientes afirmaciones en lo que se refiere a la
salida y(t) de la función de transferencia G(s):
Si el polo ubicado en s = −a es negativo (a > 0) entonces al crecer
el tiempo la respuesta natural yn (t) desaparece y la respuesta total y(t)
alcanza a la respuesta forzada yf (t). Si u(t) = A es una constante, entonces
yf (t) = kA
a .
La rapidez con la que y(t) alcanza a yf (t) (rapidez con la que yn (t) de-
saparece) es mayor conforme el polo en s = −a está colocado más hacia
la izquierda del punto s = 0. Esta rapidez se puede cuantificar usando la
constante de tiempo τ = a1 . Una constante de tiempo grande implica una
respuesta lenta y una constante de tiempo pequeña implica una respuesta
rápida.
Si k = a > 0 entonces se dice que la función de transferencia G(s) es
de ganancia unitaria en estado estacionario, porque si u(t) = A es una
constante entonces se puede usar el teorema del valor final (3.3) para
encontrar que:
k A k
lı́m y(t) = lı́m sY (s) = lı́m s = A=A (3.22)
t→∞ s→0 s→0 s+a s a
En general, la ganancia en estado estacionario de la función de transferen-
cia en (3.21) se calcula como el cociente ka .
Si el polo ubicado en s = −a es positivo (a < 0) entonces al crecer el
tiempo la respuesta total y(t) crece sin lı́mite. Nótese que esto implica que
el polo está colocado en el lado derecho del plano s (véase la figura 3.2).
El caso cuando el polo está ubicado en s = a = 0, no puede ser estudiado
con las fórmulas desarrolladas hasta aquı́ y se estudia como un caso especial
en la siguiente sección. Sin embargo, de nuevo, con el fin de presentar un
resumen de todos los casos aquı́ se anticipa lo que se va a encontrar en la
siguiente sección. Cuando el polo está ubicado en s = a = 0, la respuesta
natural no desaparece pero no crece
R t sin lı́mite y la respuesta forzada es la
integral de la entrada yf (t) = k 0 u(t)dt.

Ejemplo 3.2 Suponga que se tiene un tanque que almacena un lı́quido incom-
presible como el agua (véase la figura 3.3). El tanque es de paredes paralelas,
es decir de sección constante cuya área es representada por C. El lı́quido es
3.1 Ecuación diferencial de primer orden 105

Im (s)

àa 0 àa Re (s)
a>0 a<0

Figura 3.2. Ubicación de polos de la función de transferencia en (3.21). Es costum-


bre representar un polo en el plano s usando una cruz “×”.

introducido al tanque a razón de un flujo de entrada (en m3 /s) representa-


do por qi . El lı́quido sale del tanque a través de una válvula de salida cuya
resistencia hidráulica es R. La rapidez con la que sale el lı́quido del tanque
está dada por el flujo de salida (en m3 /s) el cual se representa por qo . El
nivel del agua dentro del tanque es h. El modelo matemático que describe este
sistema se obtiene a partir de la Ley de Conservación de la Materia, ya que
al ser el agua incompresible esta ley puede ser expresada en términos de la
masa o del volumen del agua. Suponga que durante un intervalo de tiempo de
duración ∆t, entra un volumen de lı́quido ∆V (entra) y sale un volumen de
lı́quido ∆V (sale). La rapidez con la que se incrementa el volumen de lı́quido
en el tanque durante ese intervalo de tiempo se puede calcular como:
∆V (dentro del tanque) ∆V (entra) ∆V (sale)
= − (3.23)
∆t ∆t ∆t
Por otro lado, se tienen las siguientes relaciones:

∆V (dentro del tanque) = C∆h


∆V (entra) = qi ∆t
∆V (sale) = qo ∆t

Sustituyendo en (3.23) y suponiendo pequeños incrementos tales que ∆t → dt,


∆h → dh:
dh
C = qi − qo (3.24)
dt
Por otro lado, si el flujo a través de la válvula de salida es laminar, entonces
se cumple [1], pág. 155:
h
qo = (3.25)
R
Para entender el porqué de esta expresión considere los siguientes casos.
106 3 Base matemática: ecuaciones diferenciales

qi

h
R qo

Figura 3.3. Sistema de nivel de lı́quido.

a) Suponga que la válvula de salida se mantiene con la misma abertura,


es decir que R se mantiene constante. Ahora suponga que aumenta el nivel
de lı́quido en el tanque, es decir que h crece. La experiencia y la expresión en
(3.25) nos indican que el flujo de salida qo aumenta bajo esta situación.
b) Suponga que se mantiene constante el nivel de lı́quido h, usando una
bomba hidráulica para compensar exactamente el lı́quido que sale, y que se
cierra, poco a poco, la válvula de salida, es decir que R aumenta. La experien-
cia y la expresión en (3.25) indican que el flujo de salida qo disminuye bajo
esta situación.
Sustituyendo (3.25) en (3.24):

dh h
C = qi −
dt R
Entonces, el modelo matemático del sistema de nivel de la figura 3.3 queda
expresado como:
dh 1
C + h = qi
dt R
Dividiendo entre C, se puede expresar este modelo como la siguiente ecuación
diferencial ordinaria, lineal, de coeficientes constantes, de primer orden:
dh
+ ah = kqi
dt
1 1
a= , k= (3.26)
RC C
La razón por la cual esta ecuación diferencial es el modelo de este sistema
de nivel de lı́quido es porque mediante su solución se puede conocer como
evoluciona el nivel h(t) en el tiempo, si se conocen el flujo del lı́quido que se
introduce qi (t), el area de la sección del tanque C, si se tiene información a
cerca de que tan grande es la abertura de la vávula de salida, es decir si se
conoce R, y si se conoce el nivel inicial.
3.1 Ecuación diferencial de primer orden 107

Ejemplo 3.3 Considere el tanque que contiene agua mostrado en la figura


3.3. En el ejemplo 3.2 se encontró que el modelo matemático correspondiente
es:
dh
+ ah = kqi
dt
1 1
a= > 0, k = (3.27)
RC C
Nótese que esta ecuación diferencial se puede escribir como la ecuación en
(3.4) si se considera que y = h, u = qi y y0 = h0 . Esto significa que si qi = A,
entonces la solución h(t) tiene la misma forma que (3.14), es decir:
kA −at kA
h(t) = − e + + h0 e−at , h0 = h(0) (3.28)
a a
A continuación se explica cómo la expresión en (3.28) describe correctamente
la evoluación del nivel de lı́quido ante diferentes situaciones.
1. Suponga que el tanque está inicialmente vacı́o (h0 = 0) y que se empieza
a introducir lı́quido con un flujo constante de valor A > 0. De acuerdo a
lo anteriormente expuesto, el nivel del lı́quido en el tanque h(t) es descrito
gráficamente como en la figura 3.1 considerando que h(t) = y(t) (nótese
1
que a = RC > 0). A partir de esta figura y la solución en (3.28) se pueden
estudiar varios casos. Para comprobar que el comportamiento descrito en
(3.28) es correcto, el lector puede usar su experiencia previa para verificar
que lo descrito a continuación verdaderamente se observa en un depósito
de agua:
Si A es mayor entonces el nivel final alcanzado por el lı́quido h(∞) =
kA
a = RA también es mayor.
Si la válvula de salida se ajusta a con una abertura menor (R mayor)
entonces el nivel final alcanzado por el lı́quido lı́mt→∞ h(t) = kAa = RA
es mayor.
El área de la sección transversal del tanque no tiene efecto en el valor
final del nivel alcanzado, es decir, el nivel final es igual para un tanque
muy delgado y para uno muy grueso.
Si el producto RC es mayor, entonces a es menor, por lo que la res-
puesta es más lenta, es decir, debe transcurrir más tiempo para al-
canzar el nivel h(τ ) = 0.632 kAa = 0.632RA y, por tanto, el nivel final
lı́mt→∞ h(t) = kA a = RA. Esto se debe a que la función e−at tiende
1
a cero más lentamente cuando a = RC > 0 es menor. Nótese que un
valor grande de RC puede obtenerse incrementando C (el área de la
sección transversal del tanque), es decir usando un tanque más grueso,
o disminuyendo la abertura de la válvula de salida (aumentando R).
2. Suponga que no se introduce lı́quido al tanque, es decir, que qi (t) = A = 0
y que el tanque inicialmente contiene una cantidad determinada de agua,
es decir que h0 > 0. A partir de la solución en (3.28) y usando la expe-
riencia del lector se puede verificar (véase la figura 3.4) que el nivel del
108 3 Base matemática: ecuaciones diferenciales

1
tanque decrece (nótese que a = RC > 0) hasta que el tanque se vacı́a
lı́mt→∞ h(t) = 0. Esto ocurre más rápido si el producto RC es menor
(cuando a es mayor) y más lentamente cuando RC es mayor (cuando a
es menor).

h0
h(t)

R 1C 1 R 2C 2

tiempo

Figura 3.4. Comportamiento del nivel cuando h0 > 0 y qi (t) = A = 0 (R1 C1 <
R2 C2 ).

3. El caso cuando a < 0 no es posible en un sistema de nivel de lı́quido


porque C y R sólo pueden ser positivas (no existen áreas de secciones
transversales negativas ni aberturas negativas). Sin embargo, la situación
en la que a < 0 ocurre con frecuencia en sistemas de control realimentados,
debido a la interconexión de diversos componentes.
4. El caso cuando a = 0 se estudia a continuación.

3.2. Un integrador
Considere la siguiente ecuación diferencial:
ẏ = ku (3.29)
donde k es una constante real diferente de cero. Nótese que esta ecuación se
obtiene a partir de (3.4) cuando a = 0. Integrando directamente:
Z y(t) Z t
dy = ku dt
y(0) 0
Z t
y(t) = k u(t) dt + y(0) (3.30)
0
3.2 Un integrador 109

y(t) = yn (t) + yf (t)


Z t
yn (t) = y(0), yf (t) = k u(t) dt
0

En este caso yn (t) permanece constante cuando el tiempo crece. Nótese que si
u = A es constante, entonces la respuesta forzada crece sin lı́mite yf (t) = kA t.
En la figura 3.5 se muestra graficada la solución y(t) = y(0) + kA t, para los
casos a) y(0) 6= 0 y u = A =constante positiva, y b) y(0) 6= 0 y u = A = 0. A
los sistemas fı́sicos representados por este tipo de ecuación diferencial se les
llama “integradores” porque, si y(0) = 0 la solución y(t) (salida) es la integral
de la entrada u.
Ejemplo 3.4 Considere el tanque con agua mostrado en la figura 3.3. Su-
ponga que la válvula de salida está totalmente cerrada por lo que R → ∞.
Entonces, el modelo en (3.26) se reduce a:

dh
= kqi
dt
1
porque a = RC → 0 cuando R → ∞. Entonces, la evolución del nivel en el
tiempo esta descrita por (3.30), es decir:
Z t
h(t) = h(0) + k qi (t) dt
0

Por tanto, el sistema de nivel de lı́quido se comporta en este caso como un


integrador. Si qi = A > 0, entonces:

h(t) = h(0) + kAt (3.31)

Se puede hacer uso de la figura 3.5, haciendo h(t) = y(t) y qi (t) = u, para
apreciar gráficamente la solución en (3.31) en los casos i) h(0) > 0 y qi =
A =constante positiva, e ii) h(0) > 0 y qi = A = 0. Nótese que el nivel
permanece constante si no se introduce lı́quido (cuando A = 0) y que el nivel
crece sin lı́mite cuando A > 0 es constante. El lector puede usar su experiencia
previa para comprobar que estas dos situaciones verdaderamente suceden en
un sistema de nivel de lı́quido real.
Ejemplo 3.5 La ecuación diferencial en (3.29) también puede resolverse
usando expansión en fracciones parciales, es decir, usando el método de la
sección 3.1. Usando (3.1) en (3.29) se obtiene:

sY (s) − y0 = k U (s)

Despejando Y (s) se puede escribir:

k 1
Y (s) = U (s) + y0 (3.32)
s s
110 3 Base matemática: ecuaciones diferenciales

y(t)

kA

y0

0
0
tiempo
(a) y0 6= 0 y u = A =constante positiva
y(t)

y0

tiempo
(b) y0 6= 0 y u = A = 0

Figura 3.5. Solución de la ecuación diferencial en (3.29).

Para continuar es necesario especificar la función del tiempo u. Suponga que:


A
u = A, U (s) =
s
donde A es una constante. Por tanto, ahora se puede escribir (3.32) como:
kA 1
Y (s) = + y0 (3.33)
s2 s
De acuerdo al método de expansión en fracciones parciales [2], Cap. 4, [3],
Cap 7, se debe escribir:
3.2 Un integrador 111

kA B C
2
= + 2 (3.34)
s s s
donde B y C son dos contantes. El valor de C se obtiene multiplicando ambos
lados de (3.34) por s2 y evaluando en s = 0, es decir:
¯ ¯ ¯
¯
2 kA ¯ B 2 ¯¯ C 2 ¯¯
s 2¯ = s ¯ + 2s ¯
s s=0 s s=0 s s=0

De donde se obtiene que C = kA. Para calcular B se multiplican ambos lados


de (3.34) por s2 , se deriva una vez respecto a s y se evalúa en s = 0:
µ ¶¯ µ ¶¯ µ ¶¯
d 2 kA ¯
¯ d B 2 ¯¯ d C 2 ¯¯
s 2 ¯ = s ¯ + s ¯
ds s s=0 ds s s=0 ds s2 s=0

De donde se obtiene que B = 0. Por tanto, usando estos valores y (3.34) se


puede escribir (3.33) como:
kA 1
Y (s) = + y0 (3.35)
s2 s
A partir de tablas de transformadas de Laplace [4], cap. 32, se sabe que:
1
L{t} = (3.36)
s2
Usando (3.36) se encuentra que la transformada inversa de Laplace de (3.35)
está dada como:

y(t) = kAt + y0 (3.37)

la cual constituye la solución de (3.29). Esta solución se puede descomponer


en dos partes:

y(t) = yn (t) + yf (t) (3.38)


yn (t) = y0
yf (t) = kAt

donde yn (t) y yf (t) reciben los nombres de respuesta natural y respuesta for-
zada, respectivamente.
Tal como se explicó en la sección 3.1, la respuesta natural yn (t) recibe
dicho nombre porque está determinada únicamente por la estructura (o natu-
raleza) de la ecuación diferencial, es decir, por la transformada de Laplace de
ẏ presente en el lado izquierdo de (3.29). Esto da origen al término 1s y0 en
(3.35), lo cual permite tener yn (t) = y0 en (3.38).
La respuesta forzada yf (t) es debida a la excitación (entrada) u = A.
Sin embargo, en este caso la respuesta forzada también recibe el efecto de la
transformada de Laplace del término ẏ presente en el lado izquierdo de (3.29),
pues ambos generan el término kA s2 , del cual se obtiene yf (t) = kAt.
112 3 Base matemática: ecuaciones diferenciales

El polinomio caracterı́stico de la ecuación diferencial en (3.29) es s y, por


tanto, sólo tiene una raı́z en s = 0. Por tanto, la función de transferencia
correspondiente G(s) (cuando y0 = 0):
Y (s) k
= G(s) = (3.39)
U (s) s

sólo tiene un polo en s = 0. Nótese que la entrada U (s) = As también tiene


un polo en s = 0. La combinación de estos dos polos repetidos en (3.33)
produce una respuesta forzada de la forma yf (t) = kAt (un polinomio del
tiempo de primer grado), cuando la entrada es u = A (un polinomio del
tiempo de grado cero). Nótese que la respuesta forzada correspondiente a la
ecuación diferencial en (3.4) tiene la forma yf (t) = kA a (un polinomio del
tiempo de grado cero) cuando la entrada es u = A (un polinomio del tiempo
de grado cero). A partir de estos dos ejemplos se llega a la siguiente conclusión
importante:
“La respuesta forzada de una ecuación diferencial de primer orden excita-
da con una entrada constante, también será constante si el polinomio carac-
terı́stico no tiene raı́ces en s = 0.”
En la figura 3.2 se muestra la ubicación en el plano s del polo de la función
de transferencia en (3.39), es decir, el polo en s = 0. El lector debe aprender a
relacionar la ubicación en el plano s de los polos de la función de transferencia
correspondiente con la forma en el tiempo de la solución y(t) correspondiente
(véanse los casos listados antes del ejemplo 3.2).

3.3. Ecuación diferencial de segundo orden


Considere la siguiente ecuación diferencial ordinaria, lineal, con coeficientes
constantes, de segundo orden:

ÿ + 2ζωn ẏ + ωn2 y = kωn2 u, y(0) = y0 , ẏ(0) = ẏ0 (3.40)

donde ωn y k son constantes reales positivas. Supóngase que u = A es una


constante. Usando (3.1) y U (s) = A/s se puede escribir:

s2 Y (s) − sy0 − ẏ0 + 2ζωn (sY (s) − y0 ) + ωn2 Y (s) = kωn2 U (s)

para obtener:
ωn2 A y0 (s + 2ζωn ) + ẏ0
Y (s) = k + 2 (3.41)
(s2 + 2ζωn s + ωn2 )s s + 2ζωn s + ωn2
Suponga primero que las condiciones iniciales son cero ẏ0 = 0, y0 = 0, enton-
ces:
A ωn2
Y (s) = k
(s2 + 2ζωn s + ωn2 )s
3.3 Ecuación diferencial de segundo orden 113

Suponga también que 0 ≤ ζ < 1 es una constante real, entonces:

s2 + 2ζωn s + ωn2 = (s − a)(s − ā) (3.42)



a = σ + jωd , ā = σ − jωd , j = −1
p
ωd = ωn 1 − ζ 2 > 0, σ = −ζωn ≤ 0

Ahora, nótese que:

s2 + 2ζωn s + ωn2 = (s − [σ + jωd ])(s − [σ − jωd ]) = (s − σ)2 + ωd2

De acuerdo al método de expansión en fracciones parciales [2], cap. 4, [3], cap.


7, en este caso se debe escribir:
Aωn2 Aωn2 Bs + C D
Y (s) = k = k = +
(s2 + 2ζωn s + ωn2 )s [(s − σ)2 + ωd2 ]s (s − σ)2 + ωd2 s
(3.43)

donde B, C y D son constantes que deben ser calculadas. La transformada


inversa de (3.43) está dada como:
" #
e−ζωn t
y(t) = kA 1 − p sin (ωd t + φ) (3.44)
1 − ζ2
p
1 − ζ2
φ = arctan
ζ
Que constituye la solución de (3.40) cuando las condiciones iniciales son cero
ẏ0 = 0, y0 = 0. A continuación se presenta el procedimiento detallado que se
utiliza para obtener (3.44) a partir de (3.43). El lector que no esté interesado
en los detalles técnicos de este procedimiento puede pasar directamente a la
ecuación (3.49).
Multiplicando ambos miembros de (3.43) por el factor (s − σ)2 + ωd2 y
evaluando en s = a (véase (3.42)) se puede escribir:
¯ ¯
Aωn2 2 2 ¯
¯ Bs + C 2 2 ¯
¯
k 2 [(s − σ) + ω d ]¯ = 2 [(s − σ) + ω d ]¯
[(s − σ)2 + ωd ]s s=a
(s − σ)2 + ωd s=a
¯
D ¯
+ [(s − σ)2 + ωd2 ]¯¯
s s=a

para obtener:
Aωn2
k = B(σ + jωd ) + C
σ + jωd
Multiplicando el lado izquierdo por (σ − jωd )/(σ − jωd ):
(σ − jωd )
kAωn2 = Bσ + C + jBωd
σ 2 + ωd2
114 3 Base matemática: ecuaciones diferenciales

Igualando partes imaginarias se tiene:


kAωn2
B=− (3.45)
σ 2 + ωd2
Igualando partes reales se tiene:
kAωn2 σ
Bσ + C =
σ 2 + ωd2
Sustituyendo (3.45):
2kAωn2 σ
C= (3.46)
σ 2 + ωd2
Usando (3.45) y (3.46) se puede escribir:
kAω 2 2kAω 2 σ
Bs + C − σ2 +ωn2 s + σ2 +ωn2
= d d

(s − σ)2 + ωd2 (s − σ)2 + ωd2


kAωn2 (s − σ) kAωn2 σ 1
=− +
(σ + ωd ) [(s − σ) + ωd ] (σ + ωd ) [(s − σ)2 + ωd2 ]
2 2 2 2 2 2

Usando las transformaciones inversas [4], cap. 32:


( )
s − σ
L−1 = eσt cos(ωd t)
(s − σ)2 + ωd2
( )
ωd
L−1
= eσt sin(ωd t)
(s − σ)2 + ωd2

se obtiene:
( )
Bs + C kAωn2 σt kAωn2 σ
L−1 =− e cos(ω d t) + eσt sin(ωd t)
(s − σ)2 + ωd2 2
σ 2 + ωd ωd (σ 2 + ωd2 )
kAωn2 σt σ
= e [− cos(ωd t) + sin(ωd t)]
σ 2 + ωd2 ωd
sµ ¶
2
kAωn2 σt σ
= e [sin β cos(ωd t) + cos β sin(ωd t)] +1
σ 2 + ωd2 ωd
Nótese que en el último paso se han usado algunas relaciones de la figura
3.6(a). Por otro lado, se puede seguir reduciendo:
1
sin β cos(ωd t) + cos β sin(ωd t) = [sin(β − ωd t) + sin(β + ωd t)] +
2
1
+ [sin(ωd t − β) + sin(ωd t + β)]
2
= sin(ωd t + β)
3.3 Ecuación diferencial de segundo orden 115

û=! d

CA ì
à1 (à )
ñ2 + 1
rð û
CO
!d (à )

(a) (b)

Figura 3.6. Relaciones importantes para el ejemplo de la sección 3.3.

porque sin(−x) = − sin(x). Con esto se obtiene:


r³ ´
2
( ) σ
+1
Bs + C 2
ω d
L−1 = kAωn eσt sin(ωd t + β)
(s − σ)2 + ωd2 σ 2 + ωd2

Por otro lado, de la figura 3.6(a):


−1 −1 −1
tan β = = p = −ζ
σ/ωd 2
(−ζωn )/(ωn 1 − ζ ) √
1−ζ 2
p
1−ζ 2
β = π + arctan
ζ
donde se ha tomado en consideración el signo del cateto adyacente y del cateto
opuesto para determinar que β representa un ángulo en el tercer cuadrante
(ver figura 3.6(b)). Esto permite hacer la siguiente simplificación [4], cap. 5:

sin(ωd t + β) = sin (ωd t + π + φ)


= − sin (ωd t + φ)
p
1 − ζ2
φ = arctan
ζ
por lo que ahora se puede reescribir:
r³ ´2
( ) σ
+1
Bs + C ωd
L−1 = −kAωn2 eσt sin (ωd t + φ)
(s − σ)2 + ωd2 σ2 + ωd2
p
σ 2 + ωd2 σt
= −kAωn2 e sin (ωd t + φ)
ωd (σ 2 + ωd2 )
1
= −kAωn2 p eσt sin (ωd t + φ)
ωd σ 2 + ωd2
116 3 Base matemática: ecuaciones diferenciales
( )
Bs + C 1
L−1
= −kA p eσt sin (ωd t + φ) (3.47)
(s − σ)2 + ωd2 1 − ζ2
p
donde se ha usado σ = −ζωn y ωd = ωn 1 − ζ 2 . Por otro lado, el valor de
D en (3.43) se obtiene fácilmente multiplicando ambos miembros de dicha
expresión por el factor s y evaluando en s = 0:
¯
kA ωn2 ¯
¯
D= 2 = kA (3.48)
s + 2ζωn s + ωn ¯s=0
2

Usando (3.43), (3.47) y (3.48) se encuentra la solución buscada:


" #
e−ζωn t
y(t) = kA 1 − p sin (ωd t + φ)
1 − ζ2

Si ahora se considera que las condiciones iniciales no son cero entonces:


" #
e−ζωn t
y(t) = kA 1 − p sin (ωd t + φ) + p(t) (3.49)
1 − ζ2

donde:
½ ¾
−1 y0 (s + 2ζωn ) + ẏ0
p(t) = L (3.50)
s2 + 2ζωn s + ωn2

La transformación inversa de Laplace que define a p(t) puede ser obtenida


usando un procedimiento similar al que se acaba de mostrar. Más aún, el
lector puede darse cuenta que p(t) está dada por una función de la forma
presentada en (3.47) y que su coeficiente depende de y0 y ẏ0 .
La solución dada en (3.44) se puede descomponer en dos partes:

y(t) = yn (t) + yf (t) (3.51)


−ζωn t
e
yn (t) = −kA p sin (ωd t + φ) (3.52)
1 − ζ2
yf (t) = kA (3.53)

donde yn (t) y yf (t) constituyen la respuesta natural y la respuesta forzada,


respectivamente. Nótese que de acuerdo a (3.43) y (3.47), la respuesta natural
en (3.52) es debida únicamente a la estructura (o naturaleza) de la ecuación
diferencial pues depende del polinomio caracterı́stico s2 + 2ζωn s + ωn2 = (s −
σ)2 + ωd2 que resulta de aplicar la transformada de la Laplace al término
ÿ + 2ζωn ẏ + ωn2 y. Ası́ que sin importar cual sea el valor de u, la respuesta
natural yn (t) tendrá la forma presentada en (3.52). Por otro lado, nótese que
la respuesta forzada en (3.53) debe su origen al término D/s en (3.43) el
cual, a su vez, es introducido por la presencia de la función constante u = A,
3.3 Ecuación diferencial de segundo orden 117

ya que U (s) = A/s. Nótese que de acuerdo al párrafo que sigue a (3.50),
cuando las condiciones iniciales son diferentes de cero éstas sólo afectan a la
respuesta natural en el sentido de que su coeficiente se verá afectado por las
condiciones iniciales y0 y ẏ0 , pero la “forma” de la función del tiempo siempre
será e−ζωn t sin (ωd t + φ). De hecho, p(t) forma parte de la respuesta natural
cuando las condiciones iniciales son diferentes de cero.
El lector puede revisar el procedimiento presentado después de (3.44) para
comprobar que en el caso en que −1 < ζ < 0 con k y ωn positivos, la solución
en (3.51) o, equivalentemente, en (3.44) se transforma en:

y(t) = yn (t) + yf (t) (3.54)


à Ãp !!
e−ζωn t 1 − ζ2
yn (t) = kA p sin ωd t − arctan
1 − ζ2 abs(ζ)
yf (t) = kA

donde abs(·) representa la función valor absoluto.


Utilizando (3.51) cuando 0 ≤ ζ < 1 y (3.54) cuando −1 < ζ < 0 se
concluye que la solución de la ecuación diferencial en (3.40) tiene uno de los
siguientes comportamientos.
1. Si 0 < ζ < 1, es decir si las dos raı́ces del polinomio caracterı́stico, ubi-
cadas en s = −ζωn ± jωd , tienen parte real negativa −ζωn < 0, entonces
lı́mt→∞ yn (t) = 0 y lı́mt→∞ y(t) = yf (t).
2. Si −1 < ζ < 0, es decir si las dos raı́ces del polinomio caracterı́stico,
ubicadas en s = −ζωn ±jωd , tienen parte real positiva −ζωn > 0, entonces
yn (t) y y(t) crecen sin lı́mite, de manera oscilatoria, conforme el tiempo
crece.
3. Si ζ = 0, es decir si las dos raı́ces del polinomio caracterı́stico, ubicadas
en s = −ζωn ± jωd , tienen parte real cero −ζωn = 0, entonces de (3.51)
se obtiene:

y(t) = yn (t) + yf (t) (3.55)


yn (t) = −kA cos(ωn t), yf (t) = kA

cuando las condiciones iniciales son cero, es decir, yn (t) es una función
oscilatoria cuya amplitud no aumenta pero tampoco disminuye. Esto sig-
nifica que aunque y(t) no crece sin lı́mite, sin embargo no alcanzará de
manera permanente a la respuesta forzada yf (t).
4. El comportamiento obtenido cuando ζ está fuera del rango −1 < ζ < 1 es
estudiado en las secciones que siguen bajo los casos en los que las raı́ces
del polinomio caracterı́stico son reales y repetidas o reales y diferentes.
Finalmente, nótese que de acuerdo a lo anteriormente expuesto y a (3.49),
(3.50), la solución de una ecuación diferencial de segundo orden puede pre-
sentar oscilaciones sostenidas (ζ = 0) aún cuando la entrada o excitación sea
cero (u = 0) si las condiciones iniciales son diferentes de cero. Esto explica el
118 3 Base matemática: ecuaciones diferenciales

funcionamiento de los circuitos osciladores presentados en el capı́tulo 8 (véase


el último párrafo de la sección 8.3.1).

Estudio gráfico de la solución


A continuación se estudia de manera gráfica la solución presentada en
(3.51) para la ecuación diferencial en (3.40). Recuérdese que se supone que
0 ≤ ζ < 1, que ωn , k son constantes positivas y que las condiciones iniciales
son cero y0 = 0, ẏ0 = 0. Nótese que la respuesta natural tiende a cero conforme
el tiempo crece si 0 < ζ < 1:
à !
e−ζωn t
lı́m yn (t) = lı́m −kA p sin (ωd t + φ) = 0 (3.56)
t→∞ t→∞ 1 − ζ2
porque ζωn > 0. Recuérdese también que en el caso en que las condiciones
iniciales no son cero, la respuesta natural también tiende a cero al crecer
el tiempo. Por tanto, para tiempos muy grandes la solución de la ecuación
diferencial es igual a la respuesta forzada únicamente:
lı́m y(t) = yf (t) = kA (3.57)
t→∞

Esto significa que mientras más rápido desaparezca la respuesta natural yn (t)
(lo cual ocurre conforme el producto ζωn > 0 es mayor) más rápido la solución
completa y(t) alcanzará a la respuesta forzada yf (t). Tal como se mencionó pa-
ra las ecuaciones diferenciales de primer orden, la respuesta natural permite
que la respuesta total y(t) transite de manera continua desde el valor dictado
por las condiciones iniciales (iguales a cero en este caso) hasta la respuesta
forzada yf (t).
Dos caracterı́sticas importantes de la respuesta en (3.51) son el tiempo de
subida tr y el sobre paso Mp , las cuales se indican en la figura 3.7. La manera
de medir el sobre paso es mediante la expresión:
yp − yf
Mp ( %) = × 100 (3.58)
yf
donde yf = kA representa la respuesta forzada. Recuérdese que se supone que
y0 = ẏ0 = 0. A partir del análisis detallado de la expresión en (3.51) se puede
demostrar que [1], pág. 232:
" Ãp !#
1 1 − ζ2
tr = π − arctan (3.59)
ωd ζ
ζ
−√ π
Mp ( %) = 100 × e 1−ζ 2

En las figuras 3.8 y 3.9 se muestra como se ve afectada la solución en (3.51)


cuando los parámetros ζ y ωn cambian. Nótese que el sobre paso Mp es afec-
tado exclusivamente por ζ mientras que el tiempo de subida tr es afectado
principalmente por ωn , aunque ζ también tiene un pequeño efecto sobre tr .
3.3 Ecuación diferencial de segundo orden 119

y(t)

yp

yf

tr
tiempo

Figura 3.7. Caracterı́sticas de y(t) en (3.51).

Finalmente, es importante señalar que cuando u = A = 0 pero alguna de


las condiciones iniciales ẏ0 o y0 es diferente de cero, la forma de la respuesta
y(t) es como la función del tiempo en (3.52) y su aspecto gráfico es como
la parte oscilatoria sin la componente constante (alrededor de y = 0) en
cualquiera de las figuras 3.7, 3.8 o 3.9. Esto es debido a la función p(t) que
aparece en (3.49).

Función de transferencia

Suponga que las condiciones iniciales son y0 = 0, ẏ0 = 0, entonces (3.41)


se puede escribir como:

kωn2
Y (s) = U (s) (3.60)
s2 + 2ζωn s + ωn2

o también:
Y (s) kωn2
= G(s) = 2 (3.61)
U (s) s + 2ζωn s + ωn2

donde G(s) es la función de transferencia de la ecuación diferencial en (3.40).


Nótese que G(s) definida en (3.61) tiene un polinomio caracterı́stico (polino-
mio en el denominador) de segundo grado por lo que G(s) tiene dos polos
120 3 Base matemática: ecuaciones diferenciales

y(t)
2kA
ð=0

0:1

0:2

0:3
0:4
0:5
0:6
kA
0:7
1:0

2:0

tiempo

Figura 3.8. Efecto sobre la solución en (3.51) al usar diferentes valores de ζ. El


valor de ωn permanece constante.

(raı́ces del polinomio caracterı́stico). Por tanto, G(s) es una función de trans-
ferencia de segundo orden. De acuerdo a (3.42) estos polos están ubicados en
s = a y en s = ā, donde:

a = σ + jωd , ā = σ − jωd

Es importante subrayar que estos polos son complejos conjugados sólo bajo la
suposición de que −1 < ζ < 1. El lector puede verificar que los polos son reales
si ζ no satisface la condición anterior. Ese caso es estudiado en las secciones
que siguen.
De acuerdo al estudio realizado en las secciones previas se pueden hacer
las siguientes afirmaciones en lo que se refiere a la salida y(t) de la función de
transferencia G(s):
Si los polos tienen parte real negativa σ = −ζωn < 0, es decir ζ > 0,
entonces al crecer el tiempo la respuesta natural yn (t) desaparece y la
respuesta total y(t) alcanza a la respuesta forzada yf (t). Cuando la entrada
es una constante u(t) = A, entonces la respuesta forzada es yf (t) = kA.
La rapidez con la que yn (t) desaparece es mayor conforme el producto ζωn
es mayor. En la figura 3.10 se muestra cómo la respuesta del sistema de
segundo orden permanece envuelta por dos funciones exponenciales cuya
rapidez de decaimiento está determinada por el producto ζωn .
3.3 Ecuación diferencial de segundo orden 121

y(t)
!n 3 !n 2 !n 1

kA

tiempo

Figura 3.9. Efecto sobre la solución en (3.51) al usar diferentes valores de ωn :


ωn2 = 2ωn1 , ωn3 = 3ωn1 . El valor de ζ permanece constante.

y(t)

ò ó
e àð! nt
kA 1 + p 1àð 2

kA

ò ó
e àð! nt
p
kA 1 à 1àð 2

tiempo

Figura 3.10. Envoltura exponencial de la respuesta de un sistema de segundo orden


ante una entrada constante cuando las condiciones iniciales son cero.
122 3 Base matemática: ecuaciones diferenciales

El tiempo de subida tr disminuye si se incrementa ωn . Esto se puede


comprobar al observar que si ωn aumenta entonces, de acuerdo a (3.42),
ωd aumenta y, de acuerdo a (3.59), tr disminuye.
El sobre paso Mp disminuye si ζ aumenta.
De acuerdo a la figura 3.11: i) el tiempo de subida tr disminuye conforme
los polos complejos conjugados están
p más alejados de s = 0 porque ωn crece
(véase (3.59) junto con ωd = ωn 1 − ζ 2 ), ii) el parámetro ζ aumenta (y
por tanto, el sobre paso Mp disminuye) conforme la ubicación de los polos
complejos conjugados forma un ángulo θ mayor porque ζ = sin(θ), iii) la
rapidez con la que yn (t) desaparece es mayor conforme los polos complejos
conjugados están ubicados más hacia la izquierda del punto s = 0 porque
el producto ζωn es mayor.
Si k = 1 entonces se dice que la función de transferencia G(s) es de ganan-
cia unitaria en estado estacionario, porque cuando u = A es una constante
se puede usar el teorema del valor final (3.3) para encontrar que:

kωn2 A kωn2
lı́m y(t) = lı́m sY (s) = lı́m s = A = A(3.62)
t→∞ s→0 s→0 s2 + 2ζωn s + ωn2 s ωn2

La constante k representa la ganancia en estado estacionario de la función

Im (s)

j! d
!n

à ð! n Re (s)

Figura 3.11. Uno de los polos de G(s) en (3.61) cuando 0 < ζ < 1.

de transferencia en (3.61).
Si −1 < ζ < 0 entonces la parte real de los polos σ = −ζωn es positiva por
lo que la respuesta total y(t) crece sin lı́mite al crecer el tiempo. Nótese
que esto implica que los polos complejos conjugados se encuentran en el
lado derecho del plano s.
El coeficiente ζ recibe el nombre de factor de amortiguamiento porque es
el que determina que tan oscilatoria es la respuesta y(t) (véase (3.59), para
el sobre paso, y la figura 3.8).
3.3 Ecuación diferencial de segundo orden 123

La constante ωd se conoce como la frecuencia natural amortiguada porque,


de acuerdo a lo visto previamente (véase (3.51)), ωd es la frecuencia de
oscilación de y(t) cuando el amortiguamiento ζ es diferente de cero. Nótese
que la frecuencia de oscilación ωd es la parte imaginaria de los polos de la
función de transferencia en (3.61) (véase (3.42)).
La constante ωn se conoce como la frecuencia natural no amortiguada
porque, de acuerdo a (3.51) y (3.55), ωn es la frecuencia de oscilación de
la respuesta cuando el amortiguamiento es cero.
Ejemplo 3.6 Considere el sistema masa-resorte-amortiguador mostrado en
la figura 3.12. En el ejemplo 2.3 de la sección 2.6 en el capı́tulo 2 se mues-
tra que la posición x del carrito está determinada por la siguiente ecuación
diferencial de segundo orden:

mẍ = −Kx − bẋ + f (3.63)

donde K es la constante de rigidez del resorte, b es el coeficiente de fricción


viscosa del amortiguador, m es la masa del carrito y f es una fuerza externa.
La expresión en (3.63) se puede escribir como:

b K 1
ẍ + ẋ + x = f
m m m
lo cual, a su vez, se puede escribir como la expresión en (3.40):

ẍ + 2ζωn ẋ + ωn2 x = kωn2 f (3.64)


b K 1
2ζωn = , ωn2 = , k =
m m K
donde x juega el papel de la salida y mientras que f juega el papel de la entrada
u. Por tanto, x(t) tiene la forma mostrada para y(t) en (3.51) si 0 ≤ ζ < 1
cuando las condiciones iniciales son cero. Nótese que todas las constantes
en (3.63) son positivas: la masa m, el coeficiente de fricción viscosa b y la
constante de rigidez del resorte K sólo pueden ser positivas. De acuerdo a
(3.64), el factor de amortiguamiento está dado como:

b
ζ= √ (3.65)
2 mK
Por tanto, si se aplica una fuerza constante f = A se pueden usar los resul-
tados en las figuras 3.7, 3.8 y 3.9 para concluir lo siguiente.
Si no hay fricción, es decir si b = 0, entonces ζ = 0 y el carrito osci-
1
lará permanentemente alrededor de la posición xf = kA = K A. En el
caso en que la fuerza externa aplicada sea cero f = 0 pero alguna de las
condiciones iniciales ẋ0 o x0 sea diferente de cero, entonces el carrito tam-
bién oscilará permanentemente pero alrededor de la posición x = 0, como
lo describe la función p(t) que aparece en (3.49).
124 3 Base matemática: ecuaciones diferenciales

Si la fricción b > 0 se incrementa poco a poco, entonces ζ > 0 también


se incrementa y el carrito oscilará cada vez menos veces porque el sistema
masa-resorte-amortiguador estará cada vez más amortiguado (cuando ζ =
1 el sistema tiene dos raı́ces reales repetidas y ya no presenta oscilaciones,
como se ve en las secciones siguientes). En todos estos casos, cuando el
1
carrito deje de oscilar se detendrá en la posición x = xf = kA = K A. En
el caso en que la fuerza externa aplicada sea cero f = 0 pero alguna de
las condiciones iniciales ẋ0 o x0 sea diferente de cero, entonces el carrito
también oscilará cada vez menos (conforme ζ > 0 se aproxima a 1) y
se detendrá en la posición x = 0. De nuevo, esto está descrito por la
función p(t) que aparece en (3.49). Nótese que de acuerdo a (3.65) el
amortiguamiento ζ también aumenta si decrece la masa m o la constante
de rigidez del resorte K. Para entender la razón de esto considérese el
caso contrario: valores mayores de m y K producen fuerzas más grandes
(mẍ para la masa y Kx para el resorte) que, por tanto, pueden vencer con
mayor facilidad a la fuerza de fricción (bẋ) y por ello el movimiento puede
permanecer durante más tiempo.
Debido a que el tiempo de subida qtr depende inversamente de la frecuencia
natural no amortiguada ωn = K m , entonces un resorte más rı́gido (con
una K mayor) o una masa más pequeña producen respuestas más rápi-
das (tr menores). Por otro lado, el hechoq que la frecuencia de oscilación
p
esté dada por ωd = ωn 1 − ζ con ωn = K
2
m es el principio mediante el
cual se ajusta la cadencia o ritmo de un reloj mecánico mediante el uso de
un sistema masa-resorte-amortiguador oscilatorio: si el reloj se “atrasa”
hay que aumentar su frecuencia de oscilación (ritmo o cadencia), lo cual
se consigue tensando más el resorte para aumentar K. Se hace lo contrario
si el reloj se “adelanta”.
El caso cuando −1 < ζ < 0 no es posible en este ejemplo porque todas las
constantes b, m y K son positivas. Sin embargo, la situación en la que −1 <
ζ < 0 ocurre con frecuencia en sistemas de control realimentados, debido a la
interconexión de diversos componentes.

K
m f
b

Figura 3.12. Sistema masa-resorte-amortiguador.


3.4 Raı́ces reales diferentes 125

3.4. Raı́ces reales diferentes


Considere la siguiente ecuación diferencial ordinaria, lineal, con coeficientes
constantes de orden n:

y (n) + an−1 y (n−1) + · · · + a1 ẏ + a0 y = ku (3.66)


dj y
donde los coeficientes ai , i = 0, . . . , n − 1, son constantes reales e y (j) = dtj .
Aplicando la transformada de Laplace (3.1) a (3.66) se obtiene:

sn Y (s) + an−1 sn−1 Y (s) + · · · + a1 sY (s) + a0 Y (s) + P (s) = kU (s)

donde P (s) es un polinomio de s cuyos coeficientes dependen de las condiciones


iniciales y(0), ẏ(0),...,y (n−1) (0) y de los coeficientes de la ecuación diferencial.
Entonces puede escribirse:

k P (s)
Y (s) = U (s)− n
sn + an−1 sn−1 + · · · + a1 s + a0 s + an−1 sn−1 + · · · + a1 s + a0

Suponga que u(t) = A es una constante, es decir U (s) = A/s. Entonces:

k A P (s)
Y (s) = −
N (s) s N (s)
N (s) = sn + an−1 sn−1 + · · · + a1 s + a0

Suponga por lo pronto que todas las condiciones iniciales son cero. Esto sig-
nifica que P (s) = 0 y se puede escribir:

k A
Y (s) =
N (s) s

Suponga que N (s) sólo tiene raı́ces reales, distintas entre sı́ y, además, distintas
de s = 0, es decir:

N (s) = (s − p1 )(s − p2 ) · · · (s − pn )

donde pi 6= 0, i = 1, . . . , n, con pj 6= pi si i 6= j, representan las raı́ces de


N (s). De acuerdo al método de expansión en fracciones parciales [2], cap. 4,
[3], cap. 7, en este caso se debe escribir:

k A c1 c2 cn f
Y (s) = = + + ··· + + (3.67)
N (s) s s − p1 s − p2 s − pn s

donde ci , i = 1, . . . , n, y f representan constantes reales que deben ser calcula-


das. Una manera de calcular ci es la siguiente. Multiplı́quense ambos miembros
de (3.67) por el factor (s − pi ) y evalúese toda la expresión en s = pi para
obtener:
126 3 Base matemática: ecuaciones diferenciales
¯
k A ¯
ci = (s − pi )¯¯ , i = 1, . . . , n
N (s) s s=pi

De manera similar se puede calcular:


¯
kA ¯¯
f=
N (s) ¯s=0
Usando la transformación inversa de Laplace, [4], cap.32:
( )
k
L −1
= keat
s−a
se obtiene finalmente:
y(t) = c1 ep1 t + c2 ep2 t + · · · + cn epn t + f
que representa la solución buscada. Nótese que se puede escribir:
y(t) = yn (t) + yf (t)
yn (t) = c1 ep1 t + c2 ep2 t + · · · + cn epn t (3.68)
yf (t) = f
donde la respuesta natural yn (t) sólo depende de las raı́ces del polinomio
caracterı́stico N (s) mientras que la respuesta forzada yf (t) sólo depende de
la fracción 1s introducida por U (s). Considérense las siguientes posibilidades.
1. Si todas las raı́ces del polinomio caracterı́stico N (s) son negativas, es
decir si pi < 0 para toda i = 1, . . . , n, entonces lı́mt→∞ yn (t) = 0 y
lı́mt→∞ y(t) = yf (t).
2. Si al menos una raı́z del polinomio caracterı́stico N (s) es positiva, es decir
si pi > 0 para alguna i, entonces, yn (t) → ∞ y y(t) → ∞, conforme
t → ∞.
Por último, si las condiciones iniciales no son cero, entonces la solución tiene
la forma:
y(t) = c1 ep1 t + c2 ep2 t + · · · + cn epn t + f + q(t)
donde:
½ ¾
P (s)
q(t) = L−1 − (3.69)
N (s)
La transformación inversa de Laplace que define a q(t) puede ser obtenida
usando un procedimiento similar al que se acaba de mostrar. Más aún, el
lector puede darse cuenta de que q(t) está dada por una función de la forma
presentada para yn (t) en (3.68) y que sus coeficientes dependen de las condi-
ciones iniciales y(0) . . . , y (n−1) (0). Esto significa que si yn (t) → ∞ en (3.68)
entonces q(t) → ∞ también y si yn (t) → 0 en (3.68) entonces q(t) → 0 tam-
bién. De hecho, q(t) forma parte de la respuesta natural cuando las condiciones
iniciales no son cero.
3.4 Raı́ces reales diferentes 127

Ejemplo 3.7 Considere la siguiente ecuación diferencial de segundo orden


dada en (3.40):

ÿ + 2ζωn ẏ + ωn2 y = kωn2 u, y(0) = y0 , ẏ(0) = ẏ0 (3.70)

Si ζ > 1 entonces las dos raı́ces, p1 y p2 , del polinomio caracterı́stico N (s) =


s2 + 2ζωn s + ωn2 son reales y diferentes:
p
p1 = −ζωn + ωn ζ 2 − 1
p
p2 = −ζωn − ωn ζ 2 − 1
p1 6= p2

Además, ambas raı́ces son negativas:

p1 < 0, p2 < 0

Aunque esto es obviop para p2 , para p1 se requiere un


p poco de observación:
p nóte-
se que −ζωn + ωn ζp 2 = 0, y como −ζω + ω 2 2
n n ζ > −ζωn + ωn ζ − 1,
entonces −ζωn + ωn ζ 2 − 1 < 0. En la figura 3.13 se muestra la solución
y(t) de la ecuación diferencial en (3.70) cuando ζ > 1, u = A y las condicio-
nes iniciales son cero. Nótese que y(t) no presenta oscilaciones en este caso.
Recuérdese que cuando −1 < ζ < 1 la frecuencia de oscilación es igual a la
parte imaginaria de ambas raı́ces. Por tanto, cuando ζ > 1 no hay oscilación
porque al ser cero la parte imaginaria de ambas raı́ces, la frecuencia de las
oscilaciones también es cero.

Ejemplo 3.8 Considérese de nuevo el sistema masa-resorte-amortiguador


del ejemplo 3.6. Recuérdese que (3.64) describe el movimiento del carrito.
Suponga que:
b
ζ= √ >1
2 mK
Entonces, de acuerdo al ejemplo anterior, las raı́ces, p1 y p2 , del polinomio
caracterı́stico s2 + 2ζωn s + ωn2 son reales, distintas y negativas. Nótese que
este caso se presenta cuando el coeficiente de fricción viscosa b > 0 es muy
grande o bién cuando la constante de rigidez del resorte K > 0 o la masa
m del carritop son muy pequeñas. Nótese también que una de las raı́ces (p1 =
−ζωn + ωn ζ 2 − 1 < 0) se aproxima al origen conforme ζ > 1 se hace más
grande. De acuerdo a lo expuesto en la presente sección, esto significa que
el movimiento del carrito es cada vez más lento conforme ζ crece porque la
función ep1 t tarda más tiempo en desaparecer (a
p pesar de que la función e
p2 t
2
desaparece más rápido porque p2 = −ζωn − ωn ζ − 1 < 0 se aleja cada vez
más del origen). Esto explica porqué en la figura 3.13 se obtienen respuestas
cada vez más lentas conforme ζ > 1 es más grande.
128 3 Base matemática: ecuaciones diferenciales

y(t)
0<ð<1

kA
ð=1

ð>1

tiempo
(a) Respuesta en el tiempo
Im (s)

ï
p2 à ð! n p1 Re (s)

(b) Ubicación de los polos cuando ζ > 1

Figura 3.13. Solución de una ecuación diferencial de segundo orden en (3.70),


cuando ζ > 1, y en (3.75), cuando ζ = 1, con u = A y las condiciones iniciales son
cero.

Ejemplo 3.9 Considere la siguiente ecuación:

ÿ + cẏ + dy = eu, y(0) = y0 , ẏ(0) = ẏ0

con c, d y e constantes reales. Las dos raı́ces, p1 y p2 , del polinomio carac-


terı́stico N (s) = s2 + cs + d están dadas como:

c c2 − 4d
p1 = − +
2 √ 2
c c2 − 4d
p2 = − −
2 2
3.5 Raı́ces reales repetidas 129

Se tienen los siguientes casos:


Si d < 0 entonces:
p
c c2 + 4 abs(d)
p1 = − +
2 p 2
c 2
c + 4 abs(d)
p2 = − −
2 2
las dos raı́ces son reales y diferentes siendo una positiva y otra negativa,
sin importar el valor de c. En el ejemplo 7.3 del capı́tulo 7 se muestra que
este caso corresponde al de un sistema masa-resorte-amortiguador con co-
eficiente de rigidez negativo y que esto se obtiene en la práctica cuando un
péndulo simple funciona alrededor de su configuración invertida (también
llamada inestable).
Si c > 0 y d > 0 se recupera el caso estudiado en la sección 3.3 cuando
1 > ζ > 0 y en la presente sección cuando ζ > 1.
Si c < 0 y d > 0, con abs(c) pequeño y d grande, se recupera el caso
estudiado en la sección 3.3 cuando −1 < ζ < 0. La situación cuando
ζ < −1 también se obtiene en este caso cuando abs(c) es grande y d es
pequeño, pero las dos raı́ces son positivas y diferentes:
p
p1 = −ζωn + ωn ζ 2 − 1 > 0
p
p2 = −ζωn − ωn ζ 2 − 1 > 0
p1 6= p2

Los casos ζ = −1 y ζ = 1 se estudian en la siguiente sección.

3.5. Raı́ces reales repetidas


Considere la siguiente ecuación diferencial ordinaria, lineal, con coeficientes
constantes de orden n:

y (n) + an−1 y (n−1) + · · · + a1 ẏ + a0 y = ku (3.71)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en


la sección 3.4 se obtiene:
k A P (s)
Y (s) = −
N (s) s N (s)
N (s) = sn + an−1 sn−1 + · · · + a1 s + a0

Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P (s) = 0, entonces:
k A
Y (s) =
N (s) s
130 3 Base matemática: ecuaciones diferenciales

Suponga que N (s) sólo tiene una raı́z la cual está repetida n veces y que es
diferente de cero, es decir:

N (s) = (s − p)n

con p 6= 0. De acuerdo al método de expansión en fracciones parciales [2], cap.


4, [3], cap. 7, en este caso se debe escribir:

k A cn cn−1 cn−2 c2 c1 f
= + + + ··· + + +
N (s) s (s − p)n (s − p)n−1 (s − p)n−2 (s − p)2 s−p s
(3.72)

donde ci , i = 1, . . . , n, y f representan constantes reales que deben ser calcu-


ladas. Una manera de calcular cn es multiplicando ambos miembros de (3.72)
por el factor (s − p)n y evaluando en s = p para obtener:

kA
cn =
p
Por otro lado, las constantes ci , i = 1, . . . , n − 1, se pueden calcular multipli-
cando ambos miembros de (3.72) por el factor (s − p)n , derivando n − i veces
respecto a s y evaluando en s = p para obtener:
µ ¶¯
dn−i kA ¯¯
ci = , i = 1, . . . , n − 1
dsn−i s ¯s=p

Finalmente, la constante f se puede calcular multiplicando ambos miembros


de (3.72) por el factor s y evaluando en s = 0 para obtener:
¯
kA ¯¯
f=
N (s) ¯s=0

Entonces, se puede escribir:


cn cn−1 cn−2 c2 c1 f
Y (s) = + + + ··· + + +
(s − p)n (s − p)n−1 (s − p)n−2 (s − p)2 s−p s

Usando la transformación inversa de Laplace [4], cap. 32:


( )
1 tj−1
L −1
j
= eat , j = 1, 2, 3, . . . , 0! = 1
(s − a) (j − 1)!

se obtiene finalmente:
tn−1 tn−2 tn−3
y(t) = cn ept + cn−1 ept + cn−2 ept + · · ·
(n − 1)! (n − 2)! (n − 3)!
+ c2 t ept + c1 ept + f
3.5 Raı́ces reales repetidas 131

que representa la solución buscada. Nótese que se puede escribir:


y(t) = yn (t) + yf (t)
tn−1 tn−2 tn−3
yn (t) = cn ept + cn−1 ept + cn−2 ept + · · ·
(n − 1)! (n − 2)! (n − 3)!
+c2 t ept + c1 ept (3.73)
yf (t) = f
Obsérvese de nuevo que yn (t) sólo depende de las raı́ces del polinomio ca-
racterı́stico N (s) y que yf (t) sólo depende de la fracción 1s introducida por
U (s). Finalmente, si las condiciones iniciales son diferentes de cero entonces
la solución está dada como:
tn−1 tn−2 tn−3
y(t) = cn ept + cn−1 ept + cn−2 ept + · · ·
(n − 1)! (n − 2)! (n − 3)!
+ c2 t ept + c1 ept + f + q(t)
½ ¾
P (s)
q(t) = L−1 −
N (s)
donde q(t) es una función del tiempo cuya “forma” es idéntica a la de yn (t)
en (3.73) y cuyos coeficientes dependen de las condiciones iniciales. De hecho,
q(t) forma parte de la respuesta natural en el caso en que las condiciones
iniciales son diferentes de cero.
Considérense las siguientes posibilidades:
1. Si p < 0 es de utilidad calcular el siguiente lı́mite, donde j es cualquier
número entero positivo:
tj
lı́m tj ept = lı́m
t→∞ t→∞ e−pt
lo cual da una indeterminación porque −pt → +∞. Entonces puede usarse
la regla de L’Hopital [13], pág. 303:
dtj
tj j tj−1
lı́m tj ept = lı́m = lı́m dt
= lı́m
t→∞ e−pt t→∞ de t→∞ −p e−pt
−pt
t→∞
dt

Como se sigue obteniendo una indeterminación se puede aplicar L’Hopital


de nuevo varias veces hasta obtener:
dtj
tj j tj−1
lı́m tj ept = lı́m = lı́m dt
= lı́m
t→∞ e−pt t→∞ de t→∞ −p e−pt
−pt
t→∞
dt
j−2
j(j − 1) t j!
= lı́m 2
= · · · = lı́m =0
t→∞ (−p) e −pt t→∞ (−p)j e−pt
Aplicando esto a la solución obtenida se concluye que lı́mt→∞ yn (t) = 0,
lı́mt→∞ y(t) = yf (t) para cualquier valor p < 0 sin importar que tan
cercano a cero esté dicho valor.
132 3 Base matemática: ecuaciones diferenciales

2. Si p > 0 es claro que yn (t) → ∞ y y(t) → ∞ conforme t → ∞.


3. Por último, para considerar el caso en el que el polinomio caracterı́stico
tiene n raı́ces repetidas en p = 0 suponga que U (s) = 0. Por tanto:
P (s)
Y (s) = − , N (s) = sn
N (s)
Entonces, de acuerdo al método de expansión en fracciones parciales [2],
cap 4, [3], cap. 7, en este caso se debe escribir:
P (s) cn cn−1 cn−2 c2 c1
− n
= n + n−1 + n−2 + · · · + 2 +
s s s s s s
Usando la transformada de Laplace [4], cap.32:
( )
−1 1 tj−1
L = , j = 1, 2, 3, . . . , 0! = 1
sj (j − 1)!
se obtiene:
tn−1 tn−2 tn−3
y(t) = yn (t) = cn + cn−1 + cn−2 + ···
(n − 1)! (n − 2)! (n − 3)!
+c2 t + c1 (3.74)
yf (t) = 0
Es claro que yn (t) → ∞ y y(t) → ∞ cuando t → ∞ para n ≥ 2 y que
yn (t) es una constante si n = 1. Nótese que en el caso en que U (s) = A/s,
yn (t) contendrı́a, además de los términos en (3.74), el término tn mientras
que yf (t) estarı́a dada como:
Z t Z t
kA n
yf (t) = ··· A dtn . . . dt1 = t
| {z } n!
| 0 {z 0} n dif erenciales
n integrales

Ejemplo 3.10 Considere la siguiente ecuación diferencial de segundo orden


dada en (3.40):
ÿ + 2ζωn ẏ + ωn2 y = kωn2 u, y(0) = y0 , ẏ(0) = ẏ0 (3.75)
Si ζ = 1 entonces las dos raı́ces, p1 y p2 , del polinomio caracterı́stico N (s) =
s2 + 2ζωn s + ωn2 son reales, negativas e iguales:
p1 = p2 = −ζωn
En la figura 3.13 se muestra la solución y(t) de la ecuación diferencial en
(3.75) cuando ζ = 1, u = A y las condiciones iniciales son cero. Nótese que
y(t) no presenta oscilaciones en este caso porque ambas raı́ces tienen parte
imaginaria igual a cero. Este caso, ζ = 1, representa la frontera entre una
solución oscilatoria ζ < 1 y una solución que no oscila ζ > 1. De hecho el
caso ζ = 1 produce la respuesta más rápida sin que haya oscilaciones ya que
cuando ζ > 1 la respuesta es cada vez más lenta conforme ζ crece.
3.5 Raı́ces reales repetidas 133

Ejemplo 3.11 Considérese de nuevo el sistema masa-resorte-amortiguador


del ejemplo 3.6. Recuérdese que (3.64) describe el movimiento del carrito.
Suponga que:
b
ζ= √ =1
2 mK
Entonces, en este caso el polinomio caracterı́stico s2 + 2ζωn s + ωn2 sólo tiene
una raı́z real y negativa:

p = −ζωn

la cual está repetida dos veces. La posición x(t) del carrito evoluciona exac-
tamente de la misma forma en que lo hace y(t) en la figura 3.13. Este tipo
de respuesta puede ser de mucha utilidad si se desea que el movimiento del
carrito sea rápido y sin oscilaciones.
Ejemplo 3.12 Suponga que en la figura 3.12 no existe ningún resorte ni
amortiguador, es decir, suponiendo que b = 0 y K = 0 la ecuación (3.63) se
reduce a:

mẍ = f (3.76)

Nótese que el polinomio caracterı́stico es en este caso s2 el cual tiene una


raı́z real p = 0 repetida dos veces. Ahora suponga que todas las condiciones
iniciales son cero y que el carrito recibe una pequeña perturbación descrita
por:
½
ε0 , 0 ≤ t ≤ t 1
f= (3.77)
0, en otro caso

donde ε0 > 0 y t1 > 0 son números constantes pequeños. Integrando (3.76)


una vez se obtiene:
Z
1 t
ẋ(t) = f (τ )dτ + ẋ(0)
m 0

Integrando de nuevo se tiene (suponiendo que ẋ(0) = 0):


Z ½Z r ¾
1 t
x(t) = f (τ )dτ dr + x(0)
m 0 0
Z ½Z r ¾
1 t
x(t) = f (τ )dτ dr, x(0) = 0
m 0 0

Sustituyendo (3.77) se obtiene:


½ 1 2
x(t) = 2m ε0 t , 0 ≤ t ≤ t1
1 2 1
ε
2m 0 1t + ε t
m 0 1 (t − t 1 ), t > t1
134 3 Base matemática: ecuaciones diferenciales

Nótese que x(t) → ∞ conforme t → ∞ (véase la figura 3.14) a pesar de que


f = 0 para t > t1 , es decir, a pesar de que la respuesta forzada es cero para
todo t > t1 . Esto significa que la respuesta natural xn (t) → ∞ cuando t → ∞,
lo cual confirma los resultados obtenidos en la presente sección para raı́ces
reales iguales a cero que están repetidas dos veces o más. El lector puede
recurrir a su experiencia para verificar que un pequeño golpe (f en (3.77))
sobre el carrito es suficiente para que éste empiece a moverse para nunca
detenerse (x(t) → ∞) si no existe fricción entre el carrito y el piso.

x(t)

"0
m t1

"0 2
2m
t

t1 t [s]

Figura 3.14. Posición del carrito de la figura 3.12 cuando es perturbado y no existe
ningún resorte ni amortiguador.

Ejemplo 3.13 Considere la siguiente ecuación diferencial de segundo orden


dada en (3.40):

ÿ + 2ζωn ẏ + ωn2 y = kωn2 u, y(0) = y0 , ẏ(0) = ẏ0

Si ζ = −1 entonces las dos raı́ces, p1 y p2 , del polinomio caracterı́stico N (s) =


s2 + 2ζωn s + ωn2 son reales, positivas e iguales:

p1 = p2 = −ζωn > 0

3.6. Raı́ces complejas conjugadas diferentes


Considere la siguiente ecuación diferencial ordinaria, lineal, con coeficientes
constantes de orden n:

y (n) + an−1 y (n−1) + · · · + a1 ẏ + a0 y = ku (3.78)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en


la sección 3.4 se obtiene:
3.6 Raı́ces complejas conjugadas diferentes 135

k A P (s)
Y (s) = −
N (s) s N (s)
N (s) = sn + an−1 sn−1 + · · · + a1 s + a0

Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P (s) = 0, entonces:

k A
Y (s) =
N (s) s

Suponga que N (s) tiene n/2 raı́ces complejas conjugadas diferentes, es decir:
i=n/2
Y
N (s) = [(s − σi )2 + ωdi
2
]
i=1

donde σi 6= σj o ωdi 6= ωdj si i 6= j. Entonces, de acuerdo al método de


expansión en fracciones parciales [2], cap. 4, [3], cap. 7, en este caso se debe
escribir:
i=n/2
k A X Fi s + Ci f
= 2 + ω2 ]
+
N (s) s i=1
[(s − σ i ) di s

donde f es una constante que se puede calcular como en las secciones previas,
es decir:
¯
kA ¯¯
f=
N (s) ¯s=0

mientras que Fi y Ci son constantes que pueden calcularse del mismo modo
en que se calculan B y C en la sección 3.3. Por tanto, usando (3.47) se puede
escribir:

y(t) = yn (t) + yf (t) (3.79)


i=n/2
X
yn (t) = βi e−ζi ωni t sin (ωdi t + φi )
i=1
yf (t) = f

donde βi , ωni , ζi y φi , i = 1, . . . , n/2, son constantes reales (véase la sección


3.3). El comportamiento de la solución en (3.79) satisface uno de los siguientes
casos.
1. Si 0 < ζi < 1 para toda i = 1, . . . , n/2, es decir si la parte real de to-
das las raı́ces del polinomio caracterı́stico N (s) es estrictamente negativa,
−ζi ωni < 0 para toda i = 1, . . . , n/2, entonces y(t) oscila de manera que
lı́mt→∞ yn (t) = 0 y lı́mt→∞ y(t) = yf (t).
136 3 Base matemática: ecuaciones diferenciales

2. Si −1 < ζi < 0 para alguna i = 1, . . . , n/2, es decir si la parte real de


alguna de las raı́ces del polinomio caracterı́stico N (s) es estrictamente
positiva, −ζi ωni > 0 para alguna i = 1, . . . , n/2, entonces y(t) oscila de
manera que yn (t) y y(t) crecen sin lı́mite conforme el tiempo aumenta.
3. Si ζi = 0 para toda i = 1, . . . , n/2, es decir si la parte real de todas las
raı́ces del polinomio caracterı́stico N (s) es cero, −ζi ωni = 0 para toda
i = 1, . . . , n/2, entonces yn (t) no desaparece al crecer el tiempo pero
tampoco crece sin lı́mite. Por tanto, aunque y(t) no crece sin lı́mite, sin
embargo no converge a yf (t). Nótese que para que esta situación ocurra
es suficiente que ζi = 0 para al menos una i y que para todas las demás i
se cumpla 0 < ζi < 1.
Finalmente, si las condiciones iniciales son diferentes de cero, entonces:

y(t) = yn (t) + yf (t) + q(t)


i=n/2
X
yn (t) = βi e−ζi ωni t sin (ωdi t + φi )
i=1
yf (t) = f

donde:
½ ¾
−1 P (s)
q(t) = L −
N (s)

Es sencillo verificar que q(t) está dado por funciones de la misma “forma” que
las funciones que componen a yn (t). De hecho q(t) forma parte de la respuesta
natural cuando las condiciones iniciales son diferentes de cero.
Es importante señalar que si ζ ≥ 1 o ζ ≤ −1 entonces se obtienen raı́ces
reales y se recupera uno de los casos de las secciones 3.4 o 3.5.
Es conveniente aclarar que se asume que las raı́ces complejas siempre apa-
recen con sus parejas conjugadas debido a que esa es la única manera en
que el producto (s − a)(s − ā), con a un número complejo y ā su conjugado,
resulte en un polinomio cuyos coeficientes son todos números reales. Enton-
ces, cualquier polinomio que contenga raı́ces complejas y también sus parejas
conjugadas sólo tendrá coeficientes reales. Este es un aspecto importante en
ingenierı́a de control donde las ecuaciones diferenciales representan sistemas
fı́sicos que, por tanto, sólo manejan variables y parámetros reales. Por ejemplo,
el polinomio caracterı́stico del sistema masa-resorte-amortiguador presentado
b
en (3.64) está dado como s2 + m s+ Km donde los coeficientes representan la
masa, el coeficiente de fricción viscosa y la constante de rigidez del resorte.
Es claro que ninguno de estos parámetros pueden tener parte imaginaria pues
representan propiedades cuyos efectos pueden ser apreciados experimental-
mente.
Ejemplo 3.14 En el ejemplo 2.5 del capı́tulo 2 se ha obtenido el modelo
matemático del sistema compuesto por dos cuerpos y tres resortes mostrado
3.6 Raı́ces complejas conjugadas diferentes 137

en la figura 3.15. A partir de ese resultado se puede abordar el caso en el que


el resorte de la izquierda no está presente. Esto se consigue considerando que
K1 = 0, es decir:
b K2 1
ẍ1 + (ẋ1 − ẋ2 ) + (x1 − x2 ) = F (t)
m1 m1 m1
b K3 K2
ẍ2 − (ẋ1 − ẋ2 ) + x2 − (x1 − x2 ) = 0
m2 m2 m2

F(t) x1 K2 x2
K1 K3
m1 m2

Figura 3.15. Sistema con dos cuerpos y tres resortes.

Aplicando la transformada de Laplace (3.1) a cada una de estas ecuaciones


diferenciales y considerando todas las condiciones iniciales iguales a cero se
obtiene:
³ ´
1 b K2
m1 F (s) + m1 s + m1 X2 (s)
X1 (s) = K2
s2 + mb1 s + m 1
³ ´
b K2
m2 s + m2 X1 (s)
X2 (s) = 2
s + mb2 s + K2m+K 2
3

Sustituyendo la segunda ecuación en la primera y después de realizar algunas


manipulaciones algebraicas se obtiene:
³ ´
1 2 b K2 +K3
m1 s + m2 s + m2 F (s)
X1 (s) = ³ ´³ ´ ³ ´³ ´
K2 2 + b s + K2 +K3 − K2 K2
s2 + mb1 s + m 1
s m2 m2
b
m1 s + m1
b
m2 s + m2

Con el fı́n de simplificar el álgebra correspondiente, supongamos que b = 0,


entonces:
³ ´
1 2 K2 +K3
m1 s + m2
X1 (s) = ³ ´³ ´ 2
F (s)
s2 + mK2
s2 + K2 +K3 − K2
1 m2 m1 m2

o, equivalentemente:
138 3 Base matemática: ecuaciones diferenciales
³ ´
1 K2 +K3
m1 s2 + m2
X1 (s) = ³ ´ F (s) (3.80)
K2 K2 +K3 K2 K3
s4 + m1 + m2 s2 + m1 m2

Por otro lado, nótese que si se multiplican dos polinomios de segundo orden
con coeficientes reales a, d, c, e, se obtiene:

(s2 + as + c)(s2 + ds + e) = s4 + (a + d)s3 + (c + ad + e)s2 + (cd + ea)s + ce

Esto significa que la siguiente simplificación:

(s2 + as + c)(s2 + ds + e) = s4 + (c + ad + e)s2 + ce (3.81)

es posible si y sólo si:

a+d=0 y cd + ea = 0 (3.82)

La primera condición implica que a = −d lo cual, sustituido en la segunda


condición, implica que d(c− e) = 0. Por tanto, la igualdad en (3.81) es posible
si y sólo si ocurre una de las siguientes posibilidades: i) d = a = 0, ii)
c = e 6= 0, a = −d, o bien, iii) d = a = e = c = 0. La razón de estudiar la
igualdad en (3.81) es el poder determinar cómo se puede descomponer en dos
factores el polinomio en el denominador de (3.80). En este sentido, nótese
que la situación en iii) no es de interés porque en tal caso sólo aparecerı́a el
término de s4 en el lado derecho de (3.81). Por otro lado, cuando es aplicado
al polinomio en el denominador de (3.80), el caso en ii) implica que:

K2 K2 + K3
2e − a2 = +
m m2
r1
K2 K3
e=
m1 m2
Combinando ambas expresiones se obtiene:
r µ ¶
2 K2 K3 K2 K3 K2
a =2 − + − <0 (3.83)
m1 m2 m1 m2 m2

La razón para la desigualdad al final de esta expresión es que, por definición,


el siguiente binomio al cuadrado siempre es positivo o cero:
Ãr r !2 r
K2 K3 K2 K3 K2 K3
− = + −2 ≥0
m1 m2 m1 m2 m1 m 2

Por tanto, de acuerdo a (3.83), el valor de a serı́a un número imaginario.


Este caso debe desecharse porque viola la hipótesis inicial de que todos los
coeficientes a, d, c, e, deben ser reales (véase también el párrafo previo a este
3.6 Raı́ces complejas conjugadas diferentes 139

ejemplo). Entonces, el único caso posible es i) d = a = 0, el cual, cuando es


aplicado al polinomio en el denominador de (3.80), implica:
K2 K2 + K3
c+e = + (3.84)
m1 m2
K2 K3
ce = (3.85)
m1 m2
K2
Definiendo f = m 1
+ K2m+K2
3
yg= m K2 K3
1 m2
se tiene, de la segunda expresión,
c = g/e y, sustituyendo en la primera expresión, g/e + e = f . Finalmente,
multiplicando este resultado por e se obtiene:

e2 − ef + g = 0

Es interesante observar que, siguiendo el mismo procedimiento, se encuentra


que la misma ecuación es válida para c:

c2 − cf + g = 0

Resolviendo estas ecuaciones cuadráticas se encuentran las siguientes dos so-


luciones:
r³ ´2
K2 K2 +K3 K2 K2 +K3 4K 2
m1 + m2 + m1 − m2 + m1 m2 2
e1 = c1 =
r³ 2 ´ 2
K2 K2 +K3 K2 K2 +K3 4K22
m1 + m2 − m1 − m2 + m1 m2
e2 = c2 =
2
Nótese que el caso e = c no es posible porque entonces (3.84) y (3.85) impli-
carı́an que:
r
K2 K2 + K3 K2 K3
+ =2
m1 m2 m1 m 2
lo cual conducirı́a a:
Ãr r !2
K2 K3 K2
− =−
m1 m2 m2

que no es posible porque el miembro izquierdo de esta expresión no puede ser


negativo. De este modo, sólo son posibles los casos: a) e = e1 y c = c2 o, b)
e = e2 y c = c1 , los cuales son equivalentes porque, debido a que d = a = 0,
(3.80) se puede escribir como:
³ ´
1 2 K2 +K3
m1 s + m2
X1 (s) = F (s) (3.86)
(s2 + c)(s2 + e)
140 3 Base matemática: ecuaciones diferenciales
r³ ´2
K2 K2 +K3 K2 K2 +K3 K2
Por otro lado, es claro que m1 + m2 + m1 − m2 = 2m 1
, lo
K2
cual asegura que e1 = c1 > 0. Obsérvese, sin embargo, que aunque m +
r³ ´2
1

K2 +K3 K2 K2 +K3
m2 − m1 − m2 = 2 K2m+K
2
3
> 0 esto no asegura que e2 = c2 > 0
4K 2
por el término adicional m1 m2 2 dentro del radical. Este problema se resuelve
recurriendo a (3.85): los valores de e y c deben tener el mismo signo porque
el miembro derecho de (3.85) es positivo. Entonces, ambos e y c deben ser
positivos porque de acuerdo a los únicos casos posibles a) y b) se debe usar
e = e1 > 0 (lo cual fuerza que c = c2 > 0) o c = c1 > 0 (lo cual fuerza
que e = e2 > 0). Finalmente, el razonamiento al principio de este párrafo
también muestra que, a excepción de algunos posibles valores muy especiales
para m1 , m2 , K2 , K3 , ambos e1 = c1 y e2 = c2 , son diferentes de K2m+K
2
3
. Esto
asegura que no existen cancelaciones entre los polinomios del numerador y
del denominador en (3.86) y el hecho de que e y c sean positivos y diferentes
asegura que el polinomio caracterı́stico de (3.86) tiene dos pares de raı́ces
complejas (imaginarias puras) conjugadas diferentes.

3.7. Raı́ces complejas conjugadas repetidas


Considere la siguiente ecuación diferencial ordinaria, lineal, con coeficientes
constantes de orden n:

y (n) + an−1 y (n−1) + · · · + a1 ẏ + a0 y = ku (3.87)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en


la sección 3.4 se obtiene:
k A P (s)
Y (s) = −
N (s) s N (s)
N (s) = sn + an−1 sn−1 + · · · + a1 s + a0

Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P (s) = 0, entonces:

k A
Y (s) =
N (s) s

Suponga que el polinomio caracterı́stico N (s) tiene dos raı́ces complejas con-
jugadas repetidas n/2 veces (para tener un total de n raı́ces):

N (s) = (s2 + 2ζωn s + ωn2 )n/2 = [(s − σ)2 + ωd2 ]n/2

Entonces, la expansión en fracciones parciales correspondiente a este caso es


[2], cap. 4:
3.7 Raı́ces complejas conjugadas repetidas 141

k A F1 s + C1 F2 s + C2
= 2
+ + ···
N (s) s 2
[(s − σ) + ωd ] n/2 [(s − σ)2 + ωd2 ]n/2−1
Fn/2−1 s + Cn/2−1 Fn/2 s + Cn/2 f
+ 2 2 2
+ 2 2 +
[(s − σ) + ωd ] (s − σ) + ωd s
En el caso de raı́ces reales se encontró que cuando estas son sencillas intro-
ducen términos de la forma ept donde p es la raı́z en cuestión. Cuando dicha
raı́z es repetida j veces, se encontró que los términos introducidos se transfor-
man en la forma tj−1 ept . En el caso de raı́ces complejas conjugadas repetidas
ocurre algo similar. En este caso no se hará una demostración formal de lo
que sigue debido a la complejidad del tema. Sólo se presenta la idea intuitiva
de la solución para comprender el porqué de la forma obtenida.
Usando la transformación inversa obtenida en (3.47) se encontró que una
raı́z compleja conjugada no repetida (sencilla) introduce en el tiempo un térmi-
no de la forma:
( )
Bs + C
L−1
= βeσt sin(ωd t + φ)
(s − σ)2 + ωd2

para algunas constantes β y φ. Entonces y(t), formada por el efecto de raı́ces


complejas conjugadas repetidas, tiene la forma:
y(t) = yn (t) + yf (t) (3.88)
n/2−1 σt n/2−2 σt
yn (t) = βn/2 t e sin(ωd t + φn/2 ) + βn/2−1 t e sin(ωd t + φn/2−1 )
+ · · · + β2 teσt sin(ωd t + φ2 ) + β1 eσt sin(ωd t + φ1 )
yf (t) = f
La solución en (3.88) tiene uno de los siguientes comportamientos.
1. Si la raı́z compleja conjugada tiene parte real positiva σ = −ζωn > 0, es
decir si −1 < ζ < 0, es fácil ver que yn (t) → ∞ y y(t) → ∞ conforme
t → ∞.
2. Si la raı́z compleja conjugada tiene parte real negativa σ = −ζωn < 0, es
decir si 0 < ζ < 1, se puede proceder como en la sección 3.5 para calcular
el siguiente lı́mite:
lı́m tj eσt sin(ωd t + φ) = 0
t→∞

para cualquier entero j positivo y cualquier número real estrictamente


negativo σ. Entonces, para raı́ces complejas conjugadas, repetidas, con
parte real negativa se tiene que lı́mt→∞ yn (t) = 0 y lı́mt→∞ y(t) = yf (t).
3. Si la raı́z repetida tiene parte real cero, es decir, σ = 0. Entonces:
y(t) = yn (t) + yf (t)
yn (t) = βn/2 tn/2−1 sin(ωd t + φn/2 ) + βn/2−1 tn/2−2 sin(ωd t + φn/2−1 ) + · · ·
+β2 t sin(ωd t + φ2 ) + β1 sin(ωd t + φ1 )
yf (t) = f
142 3 Base matemática: ecuaciones diferenciales

Nótese que en este caso la respuesta natural, yn (t), crece sin lı́mite confor-
me el tiempo crece en el caso en que la raı́z se repita al menos dos veces.
Pero si la raı́z es sencilla entonces yn (t) esta formada por una función os-
cilatoria cuya amplitud no crece ni disminuye, es decir, aunque y(t) nunca
alcanzará de manera permanente a yf (t) la solución y(t) permanece sin
crecer demasiado.
Finalmente, es sencillo verificar que si las condiciones iniciales no son cero
entonces:

y(t) = yn (t) + yf (t) + q(t)


yn (t) = βn/2 tn/2−1 eσt sin(ωd t + φn/2 ) + βn/2−1 tn/2−2 eσt sin(ωd t + φn/2−1 )
+ · · · + β2 teσt sin(ωd t + φ2 ) + β1 eσt sin(ωd t + φ1 )
yf (t) = f

donde:
½ ¾
−1 P (s)
q(t) = L −
N (s)

La función q(t) está dada por las mismas funciones que componen a yn (t) y
las tres posibilidades enumeradas previamente también siguen vigentes en este
caso. De hecho q(t) forma parte de la respuesta natural cuando las condiciones
iniciales son diferentes de cero.
Ejemplo 3.15 (Tomado de [2], cap. 4)Considere el sistema masa-resorte
mostrado en la figura 3.12. Suponga que no existe ningún amortiguador, es
decir que b =q0, y que se aplica una fuerza externa con la forma f = F0 sin(ωt)
K
donde ω = m . Se desea describir la posición del carrito x(t) si x(0) = 0
y ẋ(0) = 0. No es necesario calcular el valor numérico de las constantes que
aparecen en x(t).
Solución. La ecuación diferencial que describe la situación en la figura 3.12
cuando b = 0 es:
r
K
mẍ + Kx = f, f = F0 sin(ωt), ω = (3.89)
m
Aplicando la transformada de Laplace a (3.89):

K 1
s2 X(s) + X(s) = F (s)
m m
Nótese que esta expresión tiene la forma:

s2 X(s) + ωn2 X(s) = γωn2 F (s)


q
K 1
donde ωn = m = ω, γ = K. Se sabe que:
3.7 Raı́ces complejas conjugadas repetidas 143

F0 ω
F (s) =
s2 + ω2
Entonces:
γω 3 F0
X(s) =
(s2 + ω 2 )2
Expandiendo en fracciones parciales:
As + B Cs + D
X(s) = + 2
(s2 + ω 2 )2 s + ω2
Por tanto, de acuerdo a lo expuesto en la presente sección, se puede escribir:
x(t) = β1 t sin(ωt + φ1 ) + β2 sin(ωt + φ2 )
Donde β1 , β2 , φ1 , φ2 son algunas constantes
q reales. En la figura 3.16 se mues-
tra una gráfica de x(t) cuando ω = K m = 10[rad/s], m = 1[Kg] y F0 = 1[N].
A este fenómeno se le conoce como “resonancia” y significa que aunque la
entrada es acotada la salida puede alcanzar valores muy grandes a pesar de
que el polinomio caracterı́stico no tiene raı́ces con parte real positiva ni repe-
tidas en s = 0, por lo que este es un fenómeno diferente al que se presenta en
el ejemplo 3.12. Nótese que el problema de la resonancia aparece cuando un
sistema (ecuación diferencial) está mal amortiguado (ζ ≈ 0) y se excita con
una señal oscilatoria cuya frecuencia es igual (o muy cercana) a la frecuencia
natural del sistema. Debido a que la posición del carrito crece sin lı́mite la
resonancia es un fenómeno que se considera peligroso.

x [m]
0,8

0,6

0,4

0,2

-0,2

-0,4

-0,6

-0,8

0 2 4 6 8 10 12 14 16 18 20
t [s]

Figura 3.16. Posición de un sistema masa-resorte sometido a condiciones de reso-


nancia.
144 3 Base matemática: ecuaciones diferenciales

3.8. Una ecuación diferencial general


Una ecuación diferencial ordinaria, lineal, con coeficientes constantes de
orden n siempre puede escribirse como:
y (n) + an−1 y (n−1) + · · · + a1 ẏ + a0 y = b0 u + b1 u̇ + · · · + bm u(m) (3.90)
donde n ≥ m. Si n < m la ecuación diferencial no tiene sentido fı́sico, es
decir, en la práctica no existe ningún dispositivo real que esté representado
por dicha ecuación diferencial y, por tanto, no es de interés para los ingenie-
ros. Nótese que todas las derivadas que aparecen son con respecto al tiempo.
Esta caracterı́stica permite llamar a estas ecuaciones diferenciales sistemas
dinámicos. La función y es la incógnita de la ecuación mientras que u es una
función del tiempo conocida que también es llamada excitación. El objetivo
de resolver la ecuación diferencial es encontrar la función y(t) que satisfaga la
igualdad definida por la ecuación diferencial. Para encontrar y(t) es necesario
conocer u(t), las constantes reales ai , i = 0, . . . , n − 1, bj , j = 0, . . . , m, y el
conjunto de n constantes y(0), ẏ(0) ... y (n−1) (0), conocidas como condiciones
iniciales del problema, que representan los valores que la función incógnita y
sus derivadas tienen en t = 0.
Aplicando la transformada de Laplace (3.1) a (3.90):
sn Y (s) + an−1 sn−1 Y (s) + · · · + a1 sY (s) + a0 Y (s) + P (s)
= b0 U (s) + b1 sU (s) + · · · + bm sm U (s)
donde P (s) es un polinomio de s cuyos coeficientes dependen de las condiciones
iniciales y(0), ẏ(0),...,y (n−1) (0), u(0), u̇(0),...,u(m−1) (0) y los coeficientes de la
ecuación diferencial. Entonces se puede escribir:
b0 + b1 s + · · · + bm sm P (s)
Y (s) = U (s)− n
sn + an−1 sn−1 + · · · + a1 s + a0 s + an−1 sn−1 + · · · + a1 s + a0
Suponga que u(t) = A es una constante, es decir U (s) = A/s. Entonces:
B(s) A P (s)
Y (s) = −
N (s) s N (s)
N (s) = sn + an−1 sn−1 + · · · + a1 s + a0
B(s) = b0 + b1 s + · · · + bm sm
Suponga por lo pronto que todas las condiciones iniciales son cero. Esto sig-
nifica que P (s) = 0 y se puede escribir:
B(s) A
Y (s) =
N (s) s
De acuerdo al método de expansión en fracciones parciales [2], cap. 4, [3], cap.
7, la solución en el tiempo y(t) depende de las raı́ces del polinomio carac-
terı́stico N (s), es decir, de los polos de la siguiente función de transferencia:
3.8 Una ecuación diferencial general 145

Y (s) B(s)
= G(s) = (3.91)
U (s) N (s)

y del factor 1s introducido por U (s) = A/s. La variable y(t) se conoce como
la salida y u(t) como la entrada de la función de transferencia G(s). El orden
de G(s) se define como el grado del polinomio caracterı́stico N (s). Como un
polinomio de grado n tiene n raı́ces, entonces una función de transferencia de
orden n tiene n polos (véase el párrafo que sigue a (3.21)). Por otro lado, las
raı́ces del polinomio B(s) se conocen como los ceros de la función de transfe-
rencia G(s). Si B(s) es de grado m entonces G(s) tiene m ceros. Recuérdese
la condición n ≥ m impuesta al principio de esta sección. En las secciones
previas se ha visto que siempre se puede escribir y(t) = yn (t) + yf (t) y que
el efecto de las condiciones iniciales siempre se pueden considerar como parte
de yn (t). También se ha visto que yn (t) depende de la naturaleza de las raı́ces
del polinomio caracterı́stico N (s), es decir, si son reales, sencillas o repetidas,
si son complejas conjugadas, sencillas o repetidas y si tienen parte real nega-
tiva, positiva o cero. Si yn (t) tiende a cero conforme el tiempo crece se dice
que la ecuación diferencial en (3.90) o, equivalentemente, que la función de
transferencia G(s) es estable. Resumiendo todos los casos estudiados en las
secciones anteriores ahora se puede afirmar lo siguiente:

Condiciones para la estabilidad de una función de transferencia


1. Si todos los polos de G(s) tienen parte real estrictamente negativa entonces
G(s) es estable.
2. Si todos los polos de G(s) tienen parte real estrictamente negativa a ex-
cepción de algunos polos sencillos (no repetidos) que tienen parte real cero
entonces la función de transferencia G(s) es marginalmente estable. Esto
significa que aunque yn (t) no desaparece al crecer el tiempo sin embargo
tampoco crece sin lı́mite.
3. Si al menos un polo de G(s) tiene parte real estrictamente positiva en-
tonces la función de transferencia G(s) es inestable, es decir, yn (t) crece
hasta el infinito conforme el tiempo crece.
4. Si existe al menos un polo de G(s) con parte real cero que esta repetido
al menos dos veces entonces G(s) es inestable.
Por otro lado, también se ha visto que yf (t) depende de la entrada u(t) y
que, de hecho, ambas tienen la misma “forma” si el polinomio caracterı́stico
no tiene raı́ces en s = 0 (si G(s) no tiene polos en s = 0). Esto significa que
en un sistema de control la variable u(t) puede ser usada como el valor que
se desea que alcance la salida y(t), es decir, u(t) puede ser usada para espe-
cificar el valor deseado de y(t). Esto se consigue de la siguiente manera. Si la
función de transferencia es estable (es decir, yn (t) → 0) entonces y(t) → yf (t)
y, por tanto, sólo resta asegurar que yf (t) = u. A continuación se establecen
las condiciones para cumplir esto en el caso en que u = A es una constante.
146 3 Base matemática: ecuaciones diferenciales

Condiciones que aseguran que lı́mt→∞ y(t) = A.


La respuesta total y(t) alcanza a la salida deseada u = A conforme el tiem-
po crece, es decir yf (t) = A y yn (t) → 0, si G(s) es estable y los coeficientes
de los términos independientes de los polinomios B(s) y N (s) son iguales, es
decir, si B(0) = N (0). Esto se comprueba usando el teorema del valor final
(3.3):
B(s) A B(0)
lı́m y(t) = lı́m sY (s) = lı́m s = A=A (3.92)
t→∞ s→0 s→0 N (s) s N (0)
Bajo estas condiciones se dice que G(s) es una función de transferencia de
ganancia unitaria en estado estacionario. Cuando u no es una constante y
se desea que lı́mt→∞ y(t) = u(t), también se requiere que G(s) sea estable,
yn (t) → 0, pero algunas condiciones adicionales deben ser satisfechas. La
determinación de estas condiciones y la manera de satisfacerlas es parte de lo
que se estudia en los capı́tulos restantes de esta obra (véase la sección 4.4).
Ejemplo 3.16 Considere la situación presentada en el ejemplo 3.12. A partir
de ese ejemplo se puede establecer un experimento que nos permite saber si un
sistema, ecuación diferencial o función de transferencia es estable o inestable:

Si se perturba ligeramente a un sistema que originalmente está en “reposo”


puede haber dos comportamientos:
Si el sistema es estable entonces se “mueve” y después de cierto tiempo
regresa al reposo en el mismo lugar en que originalmente se encontraba
Si el sistema es inestable entonces se “mueve” cada vez más de manera
que se aleja más y más del lugar en donde inicialmente estaba.
Ejemplo 3.17 Considere el tanque que contiene agua estudiado en el ejemplo
3.2 y mostrado en la figura 3.3. Suponga que se utiliza una bomba de agua que
produce un flujo qi que es proporcional al voltaje u aplicado en las terminales
de la bomba, es decir:

qi = k1 u (3.93)

donde k1 es una constante positiva. Suponga también que el voltaje aplicado


a la bomba se obtiene de acuerdo a la expresión:

u = kp (hd − h) (3.94)

donde hd es un valor constante que representa el nivel de agua deseado, h es el


nivel de agua actual en el tanque y kp es una constante positiva. Combinando
estas expresiones junto con el modelo en (3.26) se obtiene:
dh
+ ah = kk1 kp (hd − h)
dt
Agrupando términos:
3.8 Una ecuación diferencial general 147

dh
+ b1 h = b2 h d (3.95)
dt
b1 = a + kk1 kp > 0, b2 = kk1 kp > 0, b1 > b2

Nótese que esta expresión tiene la forma de la ecuación diferencial en (3.4)


de manera que b1 , b2 , h y hd juegan los papeles, respectivamente,de a, k, y y
u. Entonces la solución h(t) tiene la misma forma que (3.14), es decir:

b2 hd −b1 t b2 hd
h(t) = − e + + h0 e−b1 t , h0 = h(0)
b1 b1
Nótese que, debido a que b1 > b2 > 0:
b2 h d
lı́m h(t) = < hd (3.96)
t→∞ b1
es el valor que alcanza en estado estacionario el nivel de agua en el tanque y es
menor (diferente) que el nivel deseado hd . Esto puede explicarse usando (3.92)
del siguiente modo. La función de transferencia de la ecuación diferencial en
(3.95) es:

H(s) b2
G(s) = =
Hd (s) s + b1

Entonces:
b2 h d b2
lı́m h(t) = lı́m sH(s) = lı́m s = hd < hd
t→∞ s→0 s→0 s + b1 s b1
Ahora bien, este resultado también puede explicarse usando la experiencia
cotidiana del siguiente modo. Supóngase por un momento que lı́mt→∞ h(t) =
hd . Entonces, de acuerdo a (3.93) y (3.94):

qi = k1 kp (hd − h) = 0

el flujo de agua que entra al tanque es cero porque h = hd . Como el agua con-
tinúa fluyendo a través de la válvula de salida, qo 6= 0, lo anterior resultará en
h < hd de nuevo. Esto significa que no es posible mantener h = hd de manera
permanente, lo que justifica el resultado en (3.96).
Ahora suponga que se usa (3.93) junto con:
Z t
u = kp (hd − h) + ki (hd − h(r))dr (3.97)
0

donde ki es una constante positiva. Combinando (3.93), (3.97) y (3.26) se


obtiene:
µ Z t ¶
dh
+ ah = kk1 kp (hd − h) + ki (hd − h(r))dr
dt 0
148 3 Base matemática: ecuaciones diferenciales

Derivando una vez respecto al tiempo a toda la ecuación se tiene:


µ ¶
d2 h dh d
+a = kk1 kp (hd − h) + ki (hd − h)
dt2 dt dt
Agrupando términos:
d2 h dh dhd
2
+ (a + kk1 kp ) + kk1 ki h = kk1 kp + kk1 ki hd
dt dt dt
Usando la transformada de Laplace bajo la suposición de condiciones iniciales
iguales a cero se obtiene la siguiente función de transferencia:
H(s) kk1 kp s + kk1 ki
G(s) = = 2
Hd (s) s + (a + kk1 kp )s + kk1 ki

Usando (3.92) se obtiene:


kk1 kp s + kk1 ki hd kk1 ki
lı́m h(t) = lı́m sH(s) = lı́m s = hd = hd
t→∞ s→0 s→0 s2 + (a + kk1 kp )s + kk1 ki s kk1 ki
(3.98)

lo cual es completamente cierto si a + kk1 kp > 0 y kk1 ki > 0 (se deja como
ejercicio consultar la sección 4.2.1, del capı́tulo 4, para verificar que estas
condiciones aseguran que las dos raı́ces del polinomio caracterı́stico s2 + (a +
kk1 kp )s + kk1 ki tienen parte real negativa). De nuevo, este resultado puede
ser explicado usando la experiencia cotidiana. Dado que h = hd en estado
estacionario, entonces es de esperarse que la señal de error e = hd −h tenga un
comportamiento
Rt como el mostrado en la figura 3.17. Recuérdese que la integral
0
(h d −h(r))dr es el area debajo de la curva mostrada en la figura 3.17 la cual
es positiva. Esto significa que cuando h = hd la integral permanece constante
(el integrando vale cero) en un valor positivo. Entonces, de acuerdo a (3.93)
y (3.97) continúa entrando agua al tanque con un flujo qi que permanece
constante en este valor positivo multiplicado por k1 ki > 0. Este flujo resulta
ser exactamente igual al flujo del agua que sale qo de manera que el nivel de
agua h = hd permanece igual al nivel deseado, tal como lo predice (3.98).

Ejemplo 3.18 Considere el sistema masa-resorte-amortiguador estudiado en


el ejemplo 3.6 pero ahora suponga que no hay ningún resorte. Haciendo K = 0
en (3.63) se obtiene:

mẍ + bẋ = f

Suponga que se utiliza algún dispositivo (un motor tan rápido que su ecuación
diferencial puede no ser considerada, por ejemplo) que genera una fuerza de
acuerdo a la siguiente expresión:

f = kp (xd − x) (3.99)
3.8 Una ecuación diferencial general 149

e [m]

t [s]

Rt
Figura 3.17. La integral 0 (hd − h(r))dr es el área sombreada debajo de la curva
definida por e = hd − h. Se supone que hd > h(0).

donde kp es una constante positiva, xd es una constante que representa la


posición deseada y x es la posición medida del carrito. Combinando estas
expresiones se obtiene:

mẍ + bẋ = kp (xd − x)

y agrupando:
b kp kp
ẍ + ẋ + x = xd
m m m
Usando la transformada de Laplace bajo la suposición de condiciones iniciales
iguales a cero se encuentra la siguiente función de transferencia:
kp
X(s) m
G(s) = = kp
Xd (s) s2 + b
ms + m

Se deja como ejercicio encontrar las raı́ces del polinomio caracterı́stico s2 +


b kp b kp
m s + m y comprobar que ambas tienen parte real negativa si m > 0 y m > 0.
Entonces, usando (3.92) se encuentra que la posición alcanzada en estado
estacionario:
kp kp
m xd m
lı́m x(t) = lı́m sX(s) = lı́m s kp
= kp
xd = xd
t→∞ s→0 s→0 s2 + b s
ms + m m

es igual a la posición deseada xd . La razón de este resultado puede explicar-


se usando, de nuevo, la experiencia: cuando x = xd la fuerza producida de
acuerdo a (3.99) es f = 0 por lo que el carrito puede detenerse y permanecer
en dicha posición. Más aún, si x < xd entonces f > 0 y el carrito incrementa
su posición x acercándose a xd (véase la figura 3.12 para recordar la dirección
en se aumenta x y en la que f es positiva). Si x > xd entonces f < 0 y el
carrito decrementa su posición x acercándose, de nuevo, a xd .
150 3 Base matemática: ecuaciones diferenciales

Se deja como ejercicio que el lector haga el análisis correspondiente para


verificar que en el caso que exista un resorte, es decir cuando K > 0, entonces
lı́mt→∞ x(t) 6= xd si xd 6= 0. Nótese sin embargo que, de nuevo, esto puede
explicarse de manera sencilla usando la experiencia:
Si x = xd entonces, de acuerdo a (3.99), la fuerza externa aplicada sobre
el carrito es cero f = 0 y la fuerza de fricción también es cero −bẋ = 0 si se
supone que el carrito ya está en reposo. Sin embargo, si x = xd 6= 0 entonces
la fuerza del resorte sobre el carrito −Kx es diferente de cero por lo que el
carrito abandonará la posición x = xd 6= 0. El carrito alcanzará el reposo en
una posición x tal que la fuerza del resorte y la fuerza f en (3.99) se cancelen
exactamente, es decir, donde kp (xd − x) = Kx.

3.9. Polos y ceros en sistemas de orden superior


En los sistemas de orden 3 o mayor no es posible hacer un estudio gráfico
detallado de la respuesta y(t) como se ha hecho en el caso de sistemas de pri-
mer y segundo orden. La principal razón es la complejidad de las expresiones
obtenidas cuando una función de transferencia tiene tres polos o más. Por esta
razón, cuando se tiene un sistema de orden alto es importante poder apro-
ximarlo usando un sistema de orden menor. Hay dos maneras de conseguir
esto: i) cancelando algunos polos con algunos ceros de la función de transfe-
rencia correspondiente e ii) despreciando el efecto de los polos “rápidos”. A
continuación se presentan algunos ejemplos de como se puede hacer esto.

3.9.1. Cancelación polo-cero y modelos reducidos

Considere el siguiente sistema de segundo orden:

k(s − d)
Y (s) = U (s) (3.100)
(s − p1 )(s − p2 )

Suponga que U (s) = A/s, p1 6= p2 , p1 < 0, p2 < 0, d < 0, y que p1 p2 ≈ −kd


con el fin de que la función de transferencia en (3.100) sea de ganancia apro-
ximadamente unitaria en estado estacionario. Usando expansión en fracciones
parciales:

k(s − d) A B C D
Y (s) = = + + (3.101)
(s − p1 )(s − p2 ) s s − p1 s − p2 s

Multiplicando ambos miembros por el factor (s − p1 ) y evaluando en s = p1


se obtiene:
¯
k(s − d)A ¯¯ k(p1 − d)A
B= =
(s − p2 )s ¯s=p1 (p1 − p2 )p1
3.9 Polos y ceros en sistemas de orden superior 151

Multiplicando ambos miembros de (3.101) por el factor (s − p2 ) y evaluando


en s = p2 se obtiene:
¯
k(s − d)A ¯¯ k(p2 − d)A
C= =
(s − p1 )s ¯ (p2 − p1 )p2
s=p2

Multiplicando ambos miembros de (3.101) por el factor s y evaluando en s = 0


se obtiene:
¯
k(s − d)A ¯¯ kdA
D= =−
(s − p1 )(s − p2 ) ¯s=0 p1 p2
Si p1 ≈ d < 0 entonces, de acuerdo a la condición p1 p2 ≈ −kd, se tiene que
k ≈ −p2 y, por tanto:
B≈0 (3.102)
k(p2 − d)A kA
C≈ = (3.103)
(p2 − d)p2 p2
kA
D≈− (3.104)
p2
para obtener finalmente:
kA p2 t kA
y(t) ≈ e − (3.105)
p2 p2
El lector puede verificar que:
kA p2 t kA
y(t) = e − (3.106)
p2 p2
es la solución de:
k
Y (s) = U (s) (3.107)
s − p2
con U (s) = A/s y k = −p2 . Por tanto, se concluye. Si un polo y un cero de una
función de transferencia están muy cercanos, entonces se pueden cancelar para
obtener una función de transferencia de orden reducido. Es decir, se puede
usar (3.107) en lugar de (3.100) para obtener resultados muy similares. Las
ventajas de usar el modelo (3.107) son: i) se trata un modelo de orden menor
que (3.100) e ii) no tiene ningún cero. La ventaja de disponer de un modelo de
orden reducido que describe aproximadamente a un modelo de orden superior
es que con mucha frecuencia el modelo reducido es de orden suficientemente
pequeño de modo que su respuesta puede especificarse gráficamente como
el de un sistema de primer o segundo orden. Por otro lado, un cero en la
función de transferencia modifica su respuesta de una manera que no es fácil
de cuantificar por lo que es muy conveniente que la función de transferencia
no tenga ceros.
Es importante mencionar que la cancelación de un polo y un cero sólo es
permitida si ambos tienen parte real negativa, pues de otro modo su efecto se
hará presente, tarde o temprano, conforme el tiempo crece.
152 3 Base matemática: ecuaciones diferenciales

3.9.2. Polos dominantes y modelos reducidos

Considere la siguiente función de transferencia:


k d
Y (s) = 1 s + a U (s) (3.108)
s + RC

donde U (s) = A/s. Usando expansión en fracciones parciales:


k d A B C D
Y (s) = 1 s+a s = 1 + s+a + s (3.109)
s + RC s + RC
1 1
Multiplicando ambos miembros por el factor s+ RC y evaluando en s = − RC :
¯
d A ¯¯ d A
B=k =k ¡ 1 ¢ (3.110)
s + a s ¯s=− 1 1
a − RC − RC
RC

Multiplicando ambos miembros de (3.109) por el factor s + a y evaluando en


s = −a:
¯
d A ¯¯ d A
C=k 1 s¯ =k 1 (−a) (3.111)
s + RC s=−a
−a + RC

Multiplicando ambos miembros de (3.109) por el factor s y evaluando en s = 0:


¯
d A ¯¯ d A
D=k 1 (s + a) ¯ =k 1 (3.112)
s + RC s=0 RC
a
1
Si a ≫ RC > 0 entonces:

d A
B ≈ −k 1 (3.113)
a RC
dA
C ≈k 2 ≪D (3.114)
a
Por tanto, usando (3.109) y despreciando C se obtiene:
d A − 1 t d A
y(t) ≈ −k 1 e
RC + k
1 a (3.115)
a RC RC

El lector puede verificar que:


d A − 1 t d A
y(t) = −k 1 e
RC + k
1 a (3.116)
a RC RC

es la solución de:
kd
Y (s) = 1 U (s) (3.117)
a(s + RC )
3.9 Polos y ceros en sistemas de orden superior 153

con U (s) = A/s. Por tanto, se puede utilizar (3.117) en lugar de (3.108). La
1
condición a ≫ RC se interpreta diciendo que “el polo en s = −a es muy
1 1
rápido comparado con el polo en s = − RC ”. Al polo en s = − RC se le conoce
como el polo dominante porque su efecto es el que sobresale en la respuesta del
sistema. Por tanto, se concluye. Si un polo es mucho más rápido que los otros,
entonces se puede obtener una función de transferencia de orden reducido si
se desprecia el polo rápido y se conservan los polos dominantes (lentos). Un
criterio aceptado es que los polos rápidos (los que se pueden despreciar) tienen
una parte real de al menos 5 veces la parte real de los polos dominantes (los que
se conservan). Nótese, sin embargo, que no es cuestión de simplemente hacer
desaparecer el factor s + a en el denominador de la función de transferencia:
la constante a aún aparece dividiendo en (3.117) porque es necesaria para
conservar la ganancia en estado estacionario de la función de transferencia en
(3.108).
Una manera sencilla de obtener (3.117) a partir de (3.108) es la siguiente:

k d k d
Y (s) = 1 s + a U (s) = 1 U (s) (3.118)
s + RC s + RC a( a1 s + 1)
1
Si a es muy grande se puede suponer que as ≪ 1 y, por tanto:

kd
Y (s) ≈ 1 U (s) (3.119)
a(s + RC )

que es la expresión en (3.117).


Finalmente, es importante mencionar que una reducción de orden como la
presentada es válida sólo si el polo que se desprecia tiene parte real negativa.
Si el polo que se desprecia tiene parte real positiva entonces, por pequeña que
sea C la contribución de este polo crecerá con el tiempo hasta el infinito y no
podrá ser despreciada de ninguna manera.

Ejemplo 3.19 De acuerdo al ejercicio 9 y el ejemplo 2.12 del capı́tulo 2, el


modelo de un motor de CD está dado como:
dia
La = υ − Ra ia − ke ω,
dt

J = km ia − Bω (3.120)
dt
donde ω es la velocidad del motor (véanse también (9.9) y (9.10) del capı́tu-
lo 9). Suponga que este motor acciona un sistema hidráulico que por efecto
centrı́fugo produce un flujo de agua, qi , que es proporcional a la velocidad del
motor, es decir, qi = γω, donde γ es una constante positiva. Finalmente, este
flujo de agua es utilizado para llenar el tanque del ejemplo 3.2 en el presente
capı́tulo, cuyo modelo está dado en (3.26) y que por facilidad de referencia se
reescribe a continuación:
154 3 Base matemática: ecuaciones diferenciales

dh
+ ah = kqi
dt
1 1
a= , k=
RC C
Usando la transformada de Laplace (3.1) y considerando todas las condiciones
iniciales iguales a cero, no es difı́cil comprobar que las ecuaciones correspon-
dientes adquieren la forma:
1/La
I(s) = (V (s) − ke ω(s)) (3.121)
s+ R a
La
km /J
ω(s) = I(s) (3.122)
s+ BJ
1/C
H(s) = 1 Qi (s) (3.123)
s + RC

Combinando (3.121) y (3.122) se obtiene:

km /J 1/La
ω(s) = (V (s) − ke ω(s))
s+ B Ra
J s + La

De acuerdo a (3.118) se puede escribir:

k /J 1/La
ω(s) = B
¡ Jm ¢ ³ ´ (V (s) − ke ω(s))
Bs + 1
Ra La
J La Ra s + 1

En motores de CD pequeños, la inductancia La y la constante de fricción


La J
viscosa B son pequeñas por lo que Ra
≪ B . Por tanto, se puede considerar
La
que Ra s ≪ 1 sólamente y que entonces se puede aproximar:

1 km
ω(s) = (V (s) − ke ω(s))
s+ B
J
JRa

Para continuar, se pueden reagrupar los términos que contienen ω(s) para
reescribir esta expresión del siguiente modo:
km
³ JR ´V
ω(s) = (s)
B km ke
s+ J + JRa

Sustituyendo esto y Qi (s) = γω(s) en (3.123) se encuentra:


1 km
C ³ JR ´V
H(s) = 1 γ (s)
s+ RC s+ B
+ km ke
J JRa

Procediendo de nuevo como en (3.118) se puede escribir:


3.10 El principio de superposición 155
γ km
C JR
H(s) = 1 ³ ´µ ¶ V (s)
RC (RCs + 1) B km ke 1
J + JRa B
+ km ke
s+1
J JRa

Si el tanque tiene una sección suficientemente amplia, el motor alcanzará su


velocidad nominal mucho tiempo antes de que el nivel de agua en el tanque
se incremente apreciablemente. Esto se cuantifica de manera más precisa es-
tableciendo que la constante de tiempo del tanque es muy grande comparada
con la constante de tiempo del motor, es decir, que RC ≫ B + k1m ke . Enton-
J JRa
1
ces, se puede decir que B km ke s ≪ 1 sólamente y que, por tanto, se puede
J + JRa
aproximar:
γ km
C ³ JR ´V
H(s) = 1 (s)
(RCs + 1) B km ke
RC J + JRa

o bién:
1 km
C ³ JR γ ´V
H(s) = 1 (s)
s+ B km ke
RC J + JRa

Por lo que definiendo:


km
JR γ
k1 = B km ke
J + JRa

y comparando con (3.123) se justifica la expresión presentada en (3.93), es


decir, que se puede considerar que el flujo de agua es proporcional al vol-
taje aplicado al motor a través de una constante k1 . Esto es posible si: 1)
la constante de tiempo de la dinámica eléctrica del motor es más pequeña
que la constante de tiempo de la dinámica mecánica del motor, es decir si
La J
Ra ≪ B , y 2) si la constante de tiempo del tanque es muy grande comparada
con la constante de tiempo del motor completo, es decir si RC ≫ B + k1m ke .
J JRa
Finalmente, es importante mencionar que este procedimiento es válido porque
B km ke Ra
J + JRa > 0 y La > 0, es decir, los polos despreciados son negativos.

3.10. El principio de superposición


Toda ecuación diferencial lineal satisface el principio de superposición. Más
aún, el hecho de que una ecuación diferencial satisfaga el principio de super-
posición se acepta como una prueba de que la ecuación diferencial es lineal.
Con el fin de simplificar la exposición, a continuación se presenta el principio
de superposición para el caso en el que todas las condiciones iniciales son cero.
156 3 Base matemática: ecuaciones diferenciales

Principio de superposición. Considere la siguiente ecuación diferencial


ordinaria, lineal con coeficientes constantes de orden n:
y (n) + an−1 y (n−1) + · · · + a1 ẏ + a0 y = b0 u + b1 u̇ + · · · + bm u(m) (3.124)
donde n ≥ m. Suponga que todas las condiciones iniciales son cero. Suponga
también que y1 (t) es la solución de (3.124) cuando u1 (t) se usa como entra-
da y que y2 (t) es la solución de (3.124) cuando u2 (t) se usa como entrada.
Entonces, α1 y1 (t) + α2 y2 (t), donde α1 y α2 son constantes arbitrarias, es la
solución de (3.124) cuando α1 u1 (t) + α2 u2 (t) se usa como entrada.

A continuación se presenta una manera de comprobar este resultado. Como


la ecuación diferencial en (3.124) es lineal y todas las condiciones iniciales son
cero entonces se puede expresar en términos de su función de transferencia:
Y (s) = G(s)U (s) (3.125)
Esto significa que se puede escribir:
Y1 (s) = G(s)U1 (s)
Y2 (s) = G(s)U2 (s)
Sumando estas expresiones se obtiene:
α1 Y1 (s) + α2 Y2 (s) = α1 G(s)U1 (s) + α2 G(s)U2 (s)
= G(s)(α1 U1 (s) + α2 U2 (s))
Esto es posible gracias a que α1 y α2 son constantes. Esta expresión comprueba
que α1 y1 (t) + α2 y2 (t) es la solución de (3.125) y, por tanto, de (3.124) cuando
α1 u1 (t) + α2 u2 (t) se usa como entrada.
Ejemplo 3.20 En el circuito mostrado en la figura 3.18(a) se desea conocer
el voltaje en la impedancia Z4 (s), según la polaridad mostrada. Con el fin
de simplificar el circuito y conseguir el objetivo planteado, se hará uso de un
resultado importante en el análisis de circuitos: el teorema de intercambio de
fuentes.
Teorema 3.1 Teorema de intercambio de fuentes [5], pág. 214, [11],
pág. 61.
Cuando se tiene en serie una impedancia, Z(s), y una fuente de vol-
taje, Vf v (s), entre dos terminales a y b, se le puede sustituir por una
fuente de corriente, If c (s), conectada en paralelo a la misma impedan-
cia del circuito serie. La magnitud de la fuente de corriente es igual a
If c (s) = Vf v (s)/Z(s).
Cuando se tiene en paralelo una impedancia, Z(s), y una fuente de corrien-
te, If c (s), entre dos terminales a y b, se le puede sustituir por una fuente de
voltaje, Vf v (s), conectada en serie a la misma impedancia del circuito pa-
ralelo. La magnitud de la fuente de voltaje es igual a Vf v (s) = Z(s)If c (s).
3.10 El principio de superposición 157

Z 1(s) Z 5(s)

Z 3(s)

V 1(s) + Z 2(s) + V (s)


2
à + à
Z 4(s)
à

(a)

Z 3(s)

I 1(s) Z 1(s) Z 2(s) Z 5(s) I 2(s)


+
Z 4(s)
à

(b)

I 3(s)
I a (s)
Z 3(s)

I 1(s) + I 2(s) Z a (s)


+
Z 4(s)
à

(c)

Figura 3.18. Circuito eléctrico estudiado en el ejemplo 3.20.

Aplicando la primera parte de este resultado a las fuentes V1 (s) y V2 (s), se


obtiene el circuito de la figura 3.18(b) donde:

V1 (s) V2 (s)
I1 (s) = , I2 (s) = (3.126)
Z1 (s) Z5 (s)

Es claro que Z1 (s), Z2 (s) y Z5 (s) están conectadas en paralelo y su equivalente


es (véase (2.139)):
1
Za (s) = 1 1 1
Z1 (s) + Z2 (s) + Z5 (s)
158 3 Base matemática: ecuaciones diferenciales

Usando esto y la combinación de las fuentes de corriente se obtiene el circuito


de la figura 3.18(c). A continuación se hará uso de otro resultado importante
en el análsis de circuitos elécticos: el divisor de corriente.
Resultado 3.1 Divisor de corriente [5], pág. 176, [11], pág. 38.
Cuando se tienen dos impedancias en paralelo que están a su vez conectadas
en paralelo a una fuente de corriente, la corriente que circula por cualquier
impedancia es igual a el valor de la fuente de corriente multiplicada por la
impedancia contraria a la que se desea calcular la corriente y dividida ente la
suma de las dos impedancias.
Por tanto, aplicando la regla de divisor de corriente y la Ley de Ohm al circuito
en la figura 3.18(c) se obtienen las siguientes relaciones:
Za (s)
I3 (s) = (I1 (s) + I2 (s))
Za (s) + Z3 (s) + Z4 (s)
Vz4 (s) = Z4 (s)I3 (s)

donde Vz4 (s) es el voltaje en la impedancia Z4 (s). Combinando estas expre-


siones se obtiene:
Za (s)Z4 (s)
Vz4 (s) = (I1 (s) + I2 (s))
Za (s) + Z3 (s) + Z4 (s)
Finalmente, utilizando (3.126) se encuentra:
µ ¶
Za (s)Z4 (s) V1 (s) V2 (s)
Vz4 (s) = +
Za (s) + Z3 (s) + Z4 (s) Z1 (s) Z5 (s)
Se concluye que el voltaje en la impedancia Z4 (s) se puede obtener como la su-
ma de los voltajes en Z4 (s) debidos a cada una de las fuentes, V1 (s) y V2 (s),
cuando la otra fuente es puesta en corto circuito (igual a cero) y sumando
ambos resultados. Esto es precisamente lo que establece el principio de super-
posición. Es interesante subrayar que el principio de superposición ha sido
establecido más arriba en la presente sección, suponiendo que las diferentes
entradas se suman directamente y luego se aplican al sistema. Sin embargo,
este ejemplo muestra que el principio de superposición es válido en sistemas
lineales aún y cuando las fuentes de voltaje, V1 (s) y V2 (s), no se pueden sumar
inmediatamente (véase la figura 3.18(a)).
Ejemplo 3.21 En el circuito mostrado en la figura 3.19(a) se desea conocer
el voltaje en la impedancia Z3 (s), según la polaridad mostrada. Con el fin de
simplificar el problema y conseguir el objetivo planteado, primero se obtiene el
circuito equivalente mostrado en la figura 3.19(b). Entonces se puede hacer uso
del teorema de intercambio de fuentes (véase el ejemplo previo) para obtener
el circuito de la figura 3.19(c), donde:
V1 (s)
I1 (s) = (3.127)
Z1 (s)
3.10 El principio de superposición 159

Z 1(s)

+
Z 3(s)
+ à
V 1(s) Z 2(s) Z 4(s)
à
+ V (s)
2
à

(a)
Z 1(s) Z 3(s)

+ à

V 1(s) + Z 2(s) Z 4(s) + V (s)


2
à à

(b)
Z 3(s)

+ à

I 1(s) Z 1(s) Z 2(s) Z 4(s) + V (s)


2
à

(c)
Z a (s) Z 3(s) I(s)

+ à

V 3(s) + + V 2(s)
à à

(d)

Figura 3.19. Circuito eléctrico estudiado en el ejemplo 3.21.


160 3 Base matemática: ecuaciones diferenciales

Como las impedancias Z1 (s), Z2 (s) y Z4 (s) están conectadas en paralelo,


se encuentra que su equivalente está dado como (véase (2.139)):
1
Za (s) = 1 1 1
Z1 (s) + Z2 (s) + Z4 (s)

Como la impedancia equivalente Za (s) queda conectada en paralelo con la


fuente de corriente I1 (s), se puede usar la segunda parte del teorema de in-
tercambio de fuentes, listado en el ejemplo previo, para obtener el circuito de
la figura 3.19(d), donde:

V3 (s) = Za (s)I1 (s)


V3 (s) − V2 (s)
I(s) =
Za (s) + Z3 (s)
Vz3 (s) = Z3 (s)I(s)

donde Vz3 (s) es el voltaje en la impedancia Z3 (s). Combinando estas expre-


siones y usando (3.127) se obtiene:

Z3 (s)
Vz3 (s) = (V3 (s) − V2 (s))
Za (s) + Z3 (s)
Z3 (s)
= (Za (s)I1 (s) − V2 (s))
Za (s) + Z3 (s)
µ ¶
Z3 (s) Za (s)
= V1 (s) − V2 (s)
Za (s) + Z3 (s) Z1 (s)

Se concluye, de nuevo, que el voltaje en la impedancia Z3 (s) se puede obtener


como la suma de los voltajes en Z3 (s) debidos a cada una de las fuentes,
V1 (s) y V2 (s), cuando la otra fuente es puesta en corto circuito (igual a cero)
y sumando ambos resultados. Además, este ejemplo también muestra que el
principio de superposición es válido en sistemas lineales aún y cuando las
fuentes de voltaje, V1 (s) y V2 (s), no se pueden sumar inmediatamente (véase
la figura 3.19(a)).

3.11. Caso de estudio. Un convertidor electrónico de


potencia de CD a CD tipo resonante serie de alta
frecuencia

En la sección 2.7 del capı́tulo 2 se obtuvo el modelo matemático de un


convertidor electrónico de potencia de CD a CD tipo resonante serie de alta
frecuencia. Este modelo es presentado en (2.186)-(2.188) y a continuación se
reescribe para facilitar la referencia:
3.11 Caso de estudio 161

di
L = −v − v0 sign(i) + E(t) (3.128)
dt
dv
C =i (3.129)
dt
dv0 v0
C0 = abs(i) − (3.130)
dt R
donde:
½
+1, i > 0
sign(i) = (3.131)
−1, i < 0

mientras que abs(i) representa el valor absoluto de i. En la presente sección se


estudiará el funcionamiento de este circuito mediante la solución del modelo
en (3.128)-(3.130). Para esto, es de mucha utilidad realizar un cambio de
coordenadas para las variables involucradas en el modelo. Por esta razón se
definen las siguientes variables (véase la sección 2.7 del capı́tulo 2 para una
explicación del significado de los parámetros involucrados):
r
i L v v0 t
z1 = , z2 = , z3 = , τ = √ (3.132)
E C E E LC
Sustituyendo esto en (3.128), (3.129), (3.130) se tiene:
³ q ´
d E C z
L 1
L ³ √ ´ = −Ez2 − Ez3 sign(z1 ) + E(t)
d τ LC
r
d (Ez2 ) C
C ³ √ ´ = z1 E
d τ LC L
à r !
d(Ez3 ) C Ez3
C0 ³ √ ´ = abs E z1 −
d τ LC L R

Simplificando se encuentra:

ż1 = −z2 − z3 sign(z1 ) + u (3.133)


ż2 = z1 (3.134)
z3
αż3 = abs(z1 ) − (3.135)
Q
donde el punto “·” representa lapderivada respecto al tiempo normalizado τ
mientras que α = C0 /C, Q = R C/L y u es una variable que sólo toma los
valores de +1 (cuando E(t) = +E) y −1 (cuando E(t) = −E). Normalmente,
el valor del capacitor de salida C0 se selecciona muy grande comparado con
el valor del capacitor resonante C porque esto asegura que z3 , es decir v0 , se
mantendrá aproximadamente constante durante varios ciclos de la corriente
162 3 Base matemática: ecuaciones diferenciales

resonante z1 , es decir i. Por tanto, bajo esta suposición (z3 constante), se


puede despreciar (3.135) y el uso de (3.133) y (3.134) es suficiente para re-
presentar la evolución de las variables resonantes z1 y z2 , al menos durante
varias oscilaciones.
Por otro lado, para conseguir que el circuito opere en resonancia, los tran-
sistores Q1 , Q3 se activan (conducen) cuando z1 > 0 (es decir i > 0) con lo
que u = +1 (porque E(t) = +E en este caso), de acuerdo a las figuras 2.44(a),
2.45 y 2.46, mientras que los transistores Q2 , Q4 se activan (conducen) cuando
z1 < 0 (es decir i < 0) con lo que u = −1 (porque E(t) = −E en este ca-
so). Una manera abreviada de indicar esto es especificando que u = sign(z1 ),
donde sign(z1 ) = +1 si z1 > 0 y sign(z1 ) = −1 si z1 < 0. Lo anterior significa
que, de acuerdo a (3.133) y (3.134), la evolución de las variables resonantes
puede ser descrita como:
ż1 = −z2 + ve (3.136)
ż2 = z1 (3.137)
½
1 − z3 , Q1 , Q3 conducen
ve =
−(1 − z3 ), Q2 , Q4 conducen
donde z3 se considera constante. Aplicando el cambio de variable z4 = z2 − ve
a las ecuaciones anteriores se obtiene ż4 = ż2 = z1 , porque v̇e = 0 al ser ve
constante, y z̈4 = ż1 = −z2 + ve = −z4 , es decir:
z̈4 + z4 = 0 (3.138)
Nótese que se trata de una ecuación diferencial ordinaria, de segundo orden,
lineal y de coeficientes constantes, como la definida en (3.40) con ζ = 0 y
ωn = 1. Como además la excitación, o entrada, de esta ecuación diferencial es
igual a cero entonces A = 0 y la solución completa está dada por la respuesta
natural únicamente. Por tanto, de acuerdo a la sección 3.3 y, en particular, a
(3.49) y (3.50), la solución de (3.138) está dada como:
½ ¾ ½ ¾
−1 z40 (s + 2ζωn ) + ż40 −1 z40 s + ż40
z4 (τ ) = p(τ ) = L =L
s2 + 2ζωn s + ωn2 s2 + 1
½ ¾
z40 s ż40
= L−1 2
+ 2 = z40 cos(τ ) + ż40 sin(τ ) (3.139)
s +1 s +1
donde se han usado los pares transformados [4], cap. 32:
( )
−1 s
L = cos(aτ )
s2 + a2
( )
−1 a
L = sin(aτ )
s2 + a2

mientras que z40 = z4 (0) = z2 (0) − ve y ż40 = ż4 (0) = z1 (0). Derivando
(3.139) una vez respecto a τ se obtiene:
3.11 Caso de estudio 163

ż4 (τ ) = −z40 sin(τ ) + ż40 cos(τ ) (3.140)

Entonces, usando (3.139) y (3.140) es sencillo verificar que:

z42 (τ ) + ż42 (τ ) = z40


2 2
+ ż40 (3.141)

Esto significa que si la solución de (3.138) se dibuja sobre un plano donde el eje
horizontal es z4 y el eje vertical es ż4 , entonces se obtiene un cı́rculo centrado
en el origen, (z4 , ż4 ) = (0, 0), que tiene
p un radio (constante) determinado
por las condiciones iniciales, es decir z40 2 + ż 2 . Más aún, de acuerdo a los
40
cambios de variable z4 = z2 − ve y ż4 = z1 , se concluye que si la solución
de (3.136), (3.137), se dibuja sobre un plano donde el eje horizontal es z2
y el eje vertical es z1 , entonces se obtiene un cı́rculo centradop en el punto
(z2 , z1 ) = (ve , 0), que tiene un radio (constante) igual a (z20 − ve )2 + z10 2

donde z20 = z2 (0) y z10 = z1 (0). Es importante mencionar que, de acuerdo a


(3.136) y (3.137), los valores de z1 y z2 no pueden presentar discontinuidades
porque para eso se necesitarı́an valores infinitos de ż1 y ż2 , respectivamente,
lo cual no es posible dado que los miembros derechos de (3.136) y (3.137)
no toman valores infinitos. Esto significa que, al combinar las soluciones en
ambas regiones (cuando z1 > 0 y cuando z1 < 0), las condiciones iniciales en
cada región deben ser iguales a los valores finales de la solución alcanzados en
la región previa. Todo lo anterior se muestra gráficamente en la figura 3.20. La
trayectoria cerrada mostrada en esta figura indica que las variables resonantes
z2 , z1 (es decir v e i) oscilan de manera permanente. Se debe subrayar que esta
trayectoria cerrada se recorre en sentido horario porque, de acuerdo a (3.137),
z2 crece cuando z1 > 0 (si ż2 > 0 entonces z2 crece) y z2 disminuye cuando
z1 < 0. Nótese que debido a que ve puede tomar dos valores diferentes, 1 − z3
(cuando z1 > 0) y −(1 − z3 ) (cuando z1 < 0), la única manera de conseguir
la situación mostrada en la figura 3.20 es que z3 = 1, es decir, que ve = 0 en
ambas regiones. Esto significa que el voltaje entregado a la salida es igual al
voltaje de suministro v0 = E.
A continuación se muestra como puede ser utilizado un convertidor re-
sonante serie de CD a CD para entregar voltajes de salida menores que la
unidad z3 < 1 (es decir v0 < E), lo cual es una aplicación importante de este
tipo de convertidores. Sea la función s = z1 − γz2 , con γ una constante posi-
tiva, y ası́gnese u = sign(s). Esto define las regiones mostradas en la figura
3.21. Nótese que los transistores Q1 , Q3 están encendidos cuando u = +1 (por
encima de la lı́nea recta definida por z1 = γz2 ), pero sólo conducen cuando
z1 > 0 pues, aunque Q1 , Q3 estén encendidos, cuando z1 < 0 la corriente
eléctrica fluye a través de los diodos D1 , D3 (cualquiera de los transistores
Q1 , Q2 , Q3 , Q4 sólo conducen en una dirección). Por otro lado, los transistores
Q2 , Q4 están encendidos cuando u = −1 (por debajo de la lı́nea recta definida
por z1 = γz2 ), pero sólo conducen cuando z1 < 0 pues, aunque Q2 , Q4 estén
encendidos, cuando z1 > 0 la corriente eléctrica fluye a través de los diodos
D2 , D4 .
164 3 Base matemática: ecuaciones diferenciales

Z1

Z2
(à 1 + Z3; 0) (1 à Z3; 0)

Figura 3.20. Evolución de las variables resonantes z2 y z1 cuando u = sign(z1 ).

Las variables resonantes siguen evolucionando de acuerdo a (3.136) y


(3.137) pero ahora ve toma los siguientes los valores constantes:


 1 − z3 , Q1 , Q3 conducen, (z1 > γz2 , z1 > 0)

−(1 − z3 ), Q2 , Q4 conducen, (z1 < γz2 , z1 < 0)
ve =

 1 + z3 , D1 , D3 conducen, (z1 > γz2 , z1 < 0)

−(1 + z3 ), D2 , D4 conducen, (z1 < γz2 , z1 > 0)

Esto significa que, de nuevo y de acuerdo a los argumentos establecidos entre


(3.136) y el párrafo que sigue de (3.141), las variables resonantes describen
cı́rculos sobre el plano z2 − z1 . El radio de estos cı́rculos está determinado
por las condiciones iniciales en cada región (iguales a los valores finales en
la región previa). El centro de estos cı́rculos está ubicado en los siguientes
puntos, dependiendo de la región en que se está trabajando:

(z2 , z1 ) = (1 − z3 , 0), z1 > γz2 , z1 > 0,


3.11 Caso de estudio 165

z1
s=0
z 1 = íz 2

z 1 > íz 2
z1 > 0
Q1; Q3
z 1 < íz 2
z1 > 0
D2; D4

à 1 à z3 à 1 + z3 1 à z3 1 + z3 z2

D1; D3 Q2; Q4
z 1 > íz 2 z 1 < íz 2
z1 < 0 z1 < 0

Figura 3.21. Evolución de las variables resonantes z2 y z1 cuando u = sign(s) con


s = z1 − γz2 .

(z2 , z1 ) = (−1 + z3 , 0), z1 < γz2 , z1 < 0,


(z2 , z1 ) = (1 + z3 , 0), z1 > γz2 , z1 < 0,
(z2 , z1 ) = (−1 − z3 , 0), z1 < γz2 , z1 > 0
En la figura 3.21 se muestra la situación correspondiente cuando γ = 3 que,
como antes, implica que las variables resonantes z2 , z1 (es decir v e i) oscilan de
manera permanente. El lector puede proceder del siguiente modo para obtener
la trayectoria cerrada mostrada en la figura 3.21. Proponga cualquier valor tal
que z3 < 1 y utilice cualquier punto sobre el plano z2 − z1 como valor inicial.
Usando un compás dibuje cı́rculos con centro en los puntos arriba listados
según la región en cuestión. Recuerde que, según se explicó previamente y
de acuerdo a (3.137), estos cı́rculos deben ser recorridos en sentido horario.
166 3 Base matemática: ecuaciones diferenciales

Notará que se empezará a obtener una trayectoria con forma de espiral, como
la lı́nea punteada mostrada en la figura 3.21, que finalmente terminará en una
trayectoria cerrada. El hecho de que dicha trayectoria cerrada sea alcanzada a
partir de cualquier punto inicial sobre el plano z2 − z1 es una muestra de que
tal trayectoria cerrada es estable (o atractiva). El lector puede proceder de la
misma manera usando un valor z3 > 1 para verificar que en este caso no se
consigue alcanzar ninguna trayectoria cerrada. Esto es un indicativo de que
en un convertidor resonante serie no es posible obtener un voltaje de salida v0
que sea mayor que el voltaje de suministro E, es decir no es posible obtener
un valor de z3 mayor que la unidad (recuérdese que v0 = Ez3 ). Si se desea
un voltaje de salida tal que v0 > E se puede utilizar el convertidor resonante
paralelo mostrado en la figura 2.44(b).
Por otro lado, en la figura 3.21, los arcos de cı́rculo con centro en
(z2 , z1 ) = (1 − z3 , 0) y (z2 , z1 ) = (−1 − z3 , 0) se dibujan de manera conse-
cutiva. Entonces, si ambos estuvieran centrados en el origen (z2 , z1 ) = (0, 0),
juntos completarı́an un ángulo de 180 grados. Sin embargo, los centros de estos
arcos de cı́rculo están colocados en el cuadrante donde z2 tiene signo contrario
al cuadrante donde está ubicado dicho arco de cı́rculo. Esta observación junto
con el uso de geometrı́a básica permite concluir que los arcos de cı́rculo con
centro en (z2 , z1 ) = (1 − z3 , 0) y (z2 , z1 ) = (−1 − z3 , 0) describen juntos un
ángulo menor que 180 grados a pesar de que juntos completan un semiciclo
completo en ambas variables resonantes z2 , z1 . Por tanto, los cuatro arcos de
cı́rculo que componen a la trayectoria cerrada completa en la figura 3.21 des-
criben juntos un ángulo menor que 360 grados a pesar de que describen un
ciclo completo en ambas variables resonantes. Nótese que la frecuencia con la
que se recorren los arcos de cı́rculo mencionados sigue siendo ωn = 1 pero, de
acuerdo a lo recién explicado, ahora se requiere menos tiempo para realizar
una oscilación completa porque los cuatro arcos de cı́rculo describen un ángu-
lo menor a la misma velocidad angular. Por tanto, la frecuencia de operación
ωo de las variables resonantes es mayor que ωn = 1, es decir ωo > ωn . Usando
(3.132) se puede comprobar que:
ωn 1 ωo
ωnt = √ =√ , ωot = √ > ωnt
LC LC LC
donde ωnt y ωot representan, respectivamente, la frecuencia de resonancia del
circuito y la frecuencia de operación del circuito, expresadas respecto a la
base de tiempo real t. Por tanto, se concluye que el circuito debe operar a
frecuencias mayores que la frecuencia de resonancia para entregar voltajes de
salida menores que el voltaje de suministro v0 < E (es decir z3 < 1). Por esta
razón, cuando los transistores se activan de acuerdo a la regla u = sign(s),
el circuito en las figuras 2.44(a) y 2.45 se denomina convertidor electrónico
de potencia de CD a CD tipo resonante serie de alta frecuencia. Para mayor
información sobre convertidores de potencia de CD a CD tipo resonantes
se recomienda consultar [8], donde se diseñan, construyen, controlan y se
prueban experimentalmente (ambos tipos: serie y paralelo), y [7], donde se
3.12 Resumen del capı́tulo 167

abunda sobre el método aquı́ presentado para obtener la respuesta de un


convertidor resonante serie usando arcos de cı́rculo. Por otro lado, en [9] y [10]
se introdujo por primera vez el uso del plano de fase (z2 − z1 ) para estudiar
el funcionamiento de convertidores electrónicos de potencia tipo resonantes.

3.12. Resumen del capı́tulo

Los sistemas que interesa controlar en ingenierı́a, ası́ como cada uno de
los componentes de un sistema de control en lazo cerrado, están descritos
por ecuaciones diferenciales ordinarias, lineales, de coeficientes constantes.
Ası́ que, para el ingeniero de control, el estudio de las ecuaciones diferenciales
debe estar dirigido hacia la comprensión de las caracterı́sticas de una ecuación
diferencial que determinan la forma gráfica de la solución.
La solución de una ecuación diferencial lineal y de coeficientes constantes
está dada como la suma de la respuesta natural y la respuesta forzada. La
respuesta natural depende exclusivamente del polinomio caracterı́stico de la
ecuación diferencial y siempre está presente, aunque la excitación o entrada
sea igual a cero. En cambio, la respuesta forzada depende de la entrada apli-
cada y si ésta es cero entonces la respuesta forzada también es cero. Cuando el
polinomio caracterı́stico no tiene raı́ces con parte real igual a cero y la entra-
da es un polinomio del tiempo, entonces la respuesta forzada también es un
polinomio del tiempo del mismo grado que la entrada. La importancia de este
hecho es que, si la respuesta natural tiende a cero (si la ecuación diferencial
es estable), entonces la respuesta total convergerá a la respuesta forzada. Por
tanto, la entrada de una ecuación diferencial puede ser seleccionada de modo
tal que represente la manera en que se desea se comporte la solución de la
ecuación diferencial.
De este modo, el diseño de sistemas de control se reduce a lo siguiente:
dado un sistema a controlar (ecuación diferencial), seleccionar un controlador
(otra ecuación diferencial, en general) para que al ser conectado en realimen-
tación con el sistema a controlar se obtenga una nueva ecuación diferencial
que 1) sea estable, 2) la respuesta forzada sea igual a la entrada aplicada al
sistema realimentado (o valor deseado a la salida) y 3) que la respuesta natural
desaparezca suficientemente rápido y sin producir demasiadas oscilaciones.
Las caracterı́sticas listadas en el párrafo anterior se consiguen del siguiente
modo:

1. Estabilidad. Esta propiedad está determinada exclusivamente por las


raı́ces del polinomio caracterı́stico de la ecuación diferencial o, equiva-
lentemente, de los polos de la función de transferencia que representa al
sistema de control (véase la sección 3.8).
2. Respuesta en estado estacionario. Este aspecto tiene que ver con el con-
seguir que la respuesta forzada sea igual a la entrada aplicada al sistema
realimentado. En la sección 3.8 se indica que, en el caso de que la entrada
168 3 Base matemática: ecuaciones diferenciales

sea una constante, esto está determinado por los términos independientes
de los polinomios de la función de transferencia.
3. Respuesta transitoria. Este aspecto se refiere a darle la forma adecuada a
la respuesta natural y depende de la selección adecuada de los polos de la
función de transferencia en lazo cerrado.

En los capı́tulos 5, 6, 7 se estudia la manera de diseñar controladores para


plantas arbitrarias usando los métodos del lugar de las raı́ces, la respuesta
en frecuencia y la variable de estado. La idea es conseguir que el sistema en
lazo cerrado sea estable, que la respuesta en estado estacionario sea igual a la
entrada del sistema en lazo cerrado (para cualquier entrada) y que la respuesta
transitoria tenga la “forma” más adecuada.

3.13. Preguntas de Repaso

1. ¿Por qué una función de transferencia es inestable si tiene un polo con


parte real cero que está repetido dos o más veces?
2. Se ha dicho que la respuesta forzada tiene la misma forma que la entrada
¿Por qué esto puede no ser cierto si la función de transferencia tiene polos
con parte real cero? Dé un ejemplo de una entrada y una función de
transferencia para las cuales esto pueda suceder.
3. Cuando una lámpara incandescente (foco) se enciende, se calienta. Sin
embargo, la temperatura del foco no crece de manera indefinida sino que se
detiene en un cierto valor. De todas las ecuaciones diferenciales estudiadas,
¿Cuál cree usted que mejor describe la evolución de la temperatura del
foco? ¿Por qué?
4. ¿Qué relación existe entre una función de transferencia y una ecuación
diferencial?
5. ¿Cuáles son las cuatro reglas que determinan la estabilidad de una función
de transferencia?
6. ¿Bajo qué condiciones un motor de CD con escobillas podrı́a comportarse
como un integrador? ¿Y como un doble integrador?
7. ¿Cómo cree que serı́a la gráfica de la solución completa (respuesta natural
más respuesta forzada) de una ecuación diferencial que tiene dos pares de
polos complejos conjugados poco amortiguados: un par con parte imagi-
naria mucho mas grande que la parte imaginaria del otro par?
8. ¿Cómo cree que serı́a la gráfica de la respuesta natural de una ecuación
diferencial de segundo orden con dos raı́ces reales, repetidas y negativas?
9. Se ha visto que las funciones del tiempo que forman parte de la respuesta
natural están determinadas por los polos de la función de transferencia
(raı́ces del polinomio caracterı́stico) pero, ¿Cuál es el efecto que tienen
los ceros de la función de transferencia? ¿De qué cree que dependen los
coeficientes de las fracciones parciales obtenidas antes de aplicar la trans-
formada inversa de Laplace? (vea las secciones 3.1 y 3.9).
3.14 Ejercicios propuestos 169

10. Dibuje el plano complejo s y sobre él ubique la zona donde deben colocarse
i) los polos reales que corresponden a respuestas rápidas, ii) los polos
complejos conjugados que corresponden a respuestas poco oscilatorias, iii)
los polos complejos conjugados que corresponden a respuestas rápidas, iv)
los polos complejos conjugados que corresponden a respuestas que oscilan
de manera permanente y v) los polos inestables.

3.14. Ejercicios propuestos


1. Considere el tanque con agua descrito en el ejemplo 3.2. La gráfica mos-
trada en la figura 3.22 se obtiene cuando se aplica un flujo qi constante y
el tanque tiene una sección de 0.5[m2 ]. Encuentre los valores de R y qi .

h
[m]

t [s]

Figura 3.22. Nivel en un tanque cuando se aplica un flujo de entrada constante.

2. Considere el control proporcional de nivel presentado en el ejemplo 3.17


(cuando se usa u = kp (hd − h), es decir, la expresión en (3.94)). Utilice las
expresiones obtenidas en este caso para el nivel de agua para determinar
lo que sucede con la diferencia hd − h(t), cuando t → ∞, conforme se
utilizan valores cada vez mayores de kp > 0. Use su experiencia cotidiana
para explicar por qué sucede esto.
3. Considere el control proporcional-integral de nivel presentado en el ejem-
plo 3.17 (cuando se usa la expresión en (3.97)). Demuestre que existirán
170 3 Base matemática: ecuaciones diferenciales

oscilaciones en el nivel de agua si se utiliza un valor suficientemente grande


de ki > 0. ¿Cómo puede explicar este fenómeno de acuerdo a su experien-
cia cotidiana?
4. Dada la siguiente ecuación diferencial:

ÿ + 127ẏ + 570y = 3990u, y(0) = 0, ẏ(0) = 0, u=1

encuentre los valores de ζ, ωn y el parámetro k introducido en la ecuación


(3.40). Usando estos datos diga cómo está expresada y(t).
5. Considere el sistema masa-resorte-amortiguador descrito en el ejemplo
3.6. La gráfica mostrada en la figura 3.23 se obtiene cuando se aplica una
fuerza f =0.5[Nm] constante. Encuentre los valores de b, K y m.

x
[m]

t [s]

Figura 3.23. Posición de la masa en un sistema masa-resorte-amortiguador cuando


se aplica una fuerza de entrada constante. La lı́nea punteada representa el valor final
de la posición de la masa.

6. Considere las siguientes funciones de transferencia:

Y1 (s) = G1 (s)U (s), Y2 (s) = G2 (s)U (s)


ab b
G1 (s) = , G2 (s) = , a > 0, b > 0
(s + a)(s + b) s+b

donde U (s) = A/s, con A una constante. Realice simulaciones en las que
use valores de a que aumentan desde valores pequeños hasta valores muy
3.14 Ejercicios propuestos 171

grandes (respecto a b) y compare gráficamente a y1 (t) e y2 (t). Explique lo


que observa.
7. De acuerdo a la sección 3.1, se sabe que para cualquier condición inicial
la siguiente ecuación diferencial ẏ + 7y = 2 tiene una solución de la forma
y(t) = Ee−7t + D donde E y D son algunas constantes que no interesa
calcular en este ejercicio. Encuentre del mismo modo la solución para cada
una de las siguientes ecuaciones diferenciales.

ÿ + 4ẏ + y = 2
−ÿ + ẏ + 10y = 3t
ÿ + 7ẏ = 2 sin(t)
ÿ + 3ẏ + 2y = 2e−t
ÿ + 2ẏ + 2y = 2 cos(2t) − 4 sin(2t)
ÿ − 4y = 8t2 − 4
y (4) + 11y (3) + 28ÿ = 10

8. Para las siguientes ecuaciones diferenciales diga cuanto vale lı́mt→∞ y(t).
Nótese que el mismo resultado se obtiene sin importar el valor de las
condiciones iniciales.

y (3) + ÿ − 2ẏ + y = 8
ÿ + ẏ − 10y = cos(5t)
ÿ + aẏ + by = kA, a > 0, b > 0, a, b, A, k son constantes

9. Diga cuál de las soluciones de las siguientes ecuaciones diferenciales pre-


senta menor sobre paso y cuál tiene un tiempo de subida más corto.

3ÿ + 3ẏ + y6 = 2A
ÿ + 4ẏ + 10y = 9A

A es una constante.
10. Considere la solución de una ecuación diferencial de segundo orden ante
una entrada constante o tipo escalón, considerando condiciones iniciales
cero, presentada en (3.44). Obtenga los máximos de dicha respuesta y
resolviendo para el primero de dichos máximos demuestre que el sobre
paso se puede calcular como:
ζ
−√ π
Mp ( %) = 100 × e 1−ζ 2

Encuentre los instantes de tiempo en los cuales la respuesta natural es


cero y resolviendo para el primero de esos instantes demuestre que:
" Ãp !#
1 1 − ζ2
tr = π − arctan
ωd ζ
172 3 Base matemática: ecuaciones diferenciales

11. Considere las siguientes expresiones:


as + b d
Y (s) = U (s), Z(s) = U (s)
s2 + c s2 +c
donde U (s) = A/s con A, a, b, c, d constantes positivas. Exprese y(t) en
función de z(t).
12. Considere la siguiente función de transferencia:
c
G(s) = 2
s + bs + c
¿Qué debe hacer con b y/o c para que el sistema responda más rápido?,
¿Qué debe hacer con b y/o c para que el sistema responda con menos
oscilaciones?
13. Considere la solución y(t) de una ecuación diferencial lineal de coeficientes
constantes de orden n arbitrario.
Si la excitación o entrada es acotada, ¿Cuáles son las condiciones para
que y(t) sea acotada para todo tiempo? Es decir, para que y(t) no se
haga infinita.
¿Cuáles son las condiciones para que, cuando el tiempo tiende a infi-
nito, la única parte de y(t) que permanezca sea la llamada respuesta
forzada?
Suponga que la excitación o entrada es cero. Diga cuáles son las dife-
rentes posibilidades para el comportamiento de y(t) cuando el tiempo
crece y bajo qué condiciones se presenta cada una de ellas.
Suponga que la excitación o entrada es un polinomio del tiempo. De-
muestre que la solución no puede tener un polinomio del tiempo de
grado mayor que el contenido en la excitación o entrada si todas las
raı́ces del polinomio caracterı́stico de la ecuación diferencial tienen
parte real negativa.
Suponga que la entrada o excitación está dada como la suma de muchas
funciones seno y coseno del tiempo, de diferentes frecuencias. Recor-
dando como es la respuesta ante una excitación tipo seno o coseno
del tiempo y el principio de superposición ¿Puede explicar el resultado
fundamental de la respuesta de las ecuaciones diferenciales lineales que
dice ([6], pág. 389) “si la excitación es una función periódica cualquiera
de periodo T y si todas las raı́ces del polinomio caracterı́stico tienen
parte real negativa, entonces cuando t → ∞ la solución y(t) también
es una función periódica de periodo T aunque con una forma de onda
posiblemente diferente a la de la excitación”? (recuerde el concepto de
series de Fourier).
14. Verifique las siguientes igualdades:
5 −5/3 5/3
i) = +
s2 + s − 2 s+2 s−1
2 1/3 2/3 −1
ii) = + +
s(s + 2)(s − 1) s+2 s−1 s
3.14 Ejercicios propuestos 173

1 1/2 −1/4 1/4


iii) = + +
s3 s2
− −s+1 (s − 1) 2 s−1 s+1
1 1 1/2 −3/4 −1/4
iv) = + + +
s4 − s3 − s2 + s s (s − 1)2 s−1 s+1
2 1 −s
v) = + 2
s3 + 2s s s +2
3 −1 −1/3 −1/9 1/9
vi) 4 3
= 3 + 2 + +
s − 3s s s s s−3
8 −1/2 1/4 1/4
vii) = + +
s(s + 4)(s − 4) s s+4 s−4
8 1 −1
viii) 2
= +
s − 16 s−4 s+4
4 2 −1 s−1
ix) = 2+ + 2
s4 + s3 + 2s2 s s s +s+2
4 2 2 1 −s − 1
x) = + + + 2
s5 + 3s4 + 4s3 + 4s2 + 3s (s + 1)3 (s + 1)2 s+1 s +1
2
3s + 3s − 2 −1 2 1
xi) = 2 + +
s3 + 2s2 s s s+2
s+2 2 −3 1 3
xii) = 2+ + +
s2 (s + 1)2 s s (s + 1)2 s+1
15. Un horno de inducción consiste básicamente de un inductor (L) dentro
del cual se coloca un recipiente de material refractario que contiene una
cantidad de metal (conductor de la electricidad) a fundir. En serie al
inductor se conecta un capacitor (C) para corregir el factor de potencia. Al
circuito se le aplica un voltaje alterno de alta frecuencia (audiofrecuencia)
con lo cual se inducen corrientes de remolino (o de eddy) en el metal
contenido dentro del recipiente refractario, por lo que se produce calor y
el metal se funde.
El dispositivo constituye un circuito RLC en serie donde la resistencia (R)
es el equivalente de la resistencia eléctrica del metal a fundir. El voltaje
alterno de alta frecuencia que se aplica al circuito está dado como una
onda cuadrada de valor u = E sign(i) donde i es la corriente eléctrica a
través del circuito, E es una constante positiva y sign(i) = +1 si i ≥ 0 o
sign(i) = −1 si i < 0.
Considere que el valor inicial de la corriente eléctrica en el circuito es
cero. Demuestre que si el coeficiente de amortiguamiento del circuito
es menor que la unidad (0 < ζ < 1) la corriente en el inductor pes cero
de manera periódica cada π/ωd segundos, donde ωd = ωn 1 − ζ 2 ,
1 R
ωn = √LC y ζ = 2Lω n
.
De acuerdo a u = E sign(i), el voltaje aplicado, u, cambia de valor
cada que i = 0. Considerando esto y un valor inicial vc (0) para el
voltaje en el capacitor, encuentre una expresión para el voltaje en el
capacitor que sea válida en el próximo instante en el que i = 0.
174 3 Base matemática: ecuaciones diferenciales

Proponga los valores numéricos que desee para R, L y C (tales que


0 < ζ < 1). Sabiendo que el voltaje en el capacitor y la corriente en el
inductor no son discontinuos cuando el valor de u cambia (¿Por qué?),
use de manera iterativa (utilizando un programa de computadora) la
fórmula obtenida en el inciso anterior para calcular de manera numéri-
ca el voltaje en el capacitor después de varios cambios en el valor de
u. Verifique que al crecer el tiempo el voltaje en el capacitor converge
a un valor constante cada que i = 0.
Simule el comportamiento del circuito RLC en serie cuando u =
E sign(i), para comprobar los resultados del inciso anterior.
16. De acuerdo al ejemplo 3.19, cuando la inductancia de armadura se consi-
dera despreciable, el modelo de un motor de CD está dado como:
km
³ JR ´V
ω(s) = (s)
B km ke
s+ J + JRa

donde ω(s) y V (s) son las transformadas de Laplace de la velocidad del


motor y del voltaje aplicado en las terminales de armadura.
Suponga que el voltaje aplicado es cero y que la velocidad inicial es
diferente de cero. Nótese que aplicar un voltaje igual a cero en las ter-
minales del motor equivale a poner en corto las terminales de armadura
y el voltaje inducido es diferente de cero si la velocidad es diferente de
cero. Dibuje la respuesta natural bajo estas condiciones. ¿Cómo puede
hacer que la respuesta natural desaparezca más rápido? ¿Qué pasa con
la corriente eléctrica? ¿Puede explicar por qué la respuesta natural dis-
minuye más rápidamente si la resistencia de armadura tiende a cero?
¿Conoce lo que significa el término “frenado dinámico”? ¿Por qué la
constante de tiempo depende directamente de la inercia?¿Qué signifi-
ca esto desde el punto de vista de las Leyes de la Mecánica (Leyes de
Newton)? ¿Por qué la constante de tiempo depende inversamente de
la constante de fuerza contraelectromotriz?
Suponga que se aplica un voltaje diferente de cero a partir de una ve-
locidad inicial igual a cero. Dibuje la respuesta total del sistema. ¿Por
qué la velocidad final no depende de la inercia J? Dé una interpretación
desde el punto de vista de la fı́sica.
Referencias

1. K. Ogata, Ingenierı́a de Control Moderna, 4a. edición, Pearson Prentice-Hall,


Madrid, 2003.
2. E. Kreyszig, Matemáticas avanzadas para ingenierı́a, Vol. 1, Limusa, México,
1980.
3. C. Ray Wylie, Matemáticas superiores para ingenierı́a, McGraw-Hill, 4a. Edi-
ción, México, 1994.
4. M. R. Spiegel, Manual de fórmulas y tablas matemáticas., McGraw-Hill, Serie
Schaum, México, 2002.
5. I. Benitez Serrano, Analisis de redes eléctricas: Circuitos 1, Instituto Politécnico
Nacional, ESIME, México, D.F., 1983.
6. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
7. V. Hernández Guzmán, A new stability analysis method for DC to DC series
resonant converters, Computación y Sistemas, vol. 11, no. 1, pp. 14-25, 2007.
8. R. Silva Ortigoza, Control de convertidores resonantes mediante planitud dife-
rencial: diseño y construcción, Tesis Maestrı́a en Ciencias, CINVESTAV-IPN
(Zacatenco), Febrero (2002).
9. R. Oruganti y F.C. Lee, Resonant power processors, Part I-State plane analysis,
IEEE Trans. Industry Applications, vol. AI-21, no. 6, pp. 1453-1460, 1985.
10. R. Oruganti y F.C. Lee, Resonant power processors, Part II-Methods of control,
IEEE Trans. Industry Applications, vol. AI-21, no. 6, pp. 1461-1471, 1985.
11. W. H. Hayt y J. E. Kemmerly, Análisis de circuitos en ingenierı́a, McGraw-Hill,
México, D.F., 1985.
12. V. Valkenburg, Análisis de redes, Limusa, México, D.F., 1994.
13. J. Stewart, Cálculo. Diferencial e integral, International Thomson Editores,
México, D.F., 2003.
4
Criterios de estabilidad y error en estado
estacionario

!d + üã I ãq + vq
PI 1=Ð M PI !
à à vd (dq) à1 PMSM
PI

Id dq
I ãd = 0
+ à Iq

Los sistemas de control en lazo cerrado pueden ser complejos. En ellos, los
componentes del sistema de control se conectan entre sı́ dando origen a los
diagramas de bloques. La manera de trabajar estos problemas es simplificando
los diagramas de bloques para obtener una única función de transferencia de
lazo cerrado que representa al sistema completo. Una vez conseguido esto, se
puede determinar la estabilidad del sistema completo estudiando la ubicación
de los polos de la función de transferencia de lazo cerrado. Este problema
puede ser complejo incluso para sistemas de segundo orden. Por esta razón,
se propone un método que determina la estabilidad simplemente analizando
los signos de los coeficientes del polinomio caracterı́stico. Para sistemas de
orden superior se utiliza el criterio de Routh. Por otro lado, el estudio del
error en estado estacionario permite determinar qué tipo de controlador se
debe utilizar para conseguir que la respuesta forzada sea igual o muy parecida
a la entrada del sistema en lazo cerrado (o valor deseado a la salida).
178 4 Criterios de estabilidad y error

Objetivos del capı́tulo

Dado un sistema en lazo cerrado, aprender a manipular el diagrama de


bloques correspondiente para obtener una función de transferencia equiva-
lente.
Identificar la regla de los signos para determinar la ubicación de las raı́ces
de un polinomio, como un método sencillo que permite establecer la esta-
bilidad de sistemas de primero y segundo orden.
Identificar el criterio de estabilidad de Routh como el método que da con-
diciones necesarias y suficientes para determinar cuándo un sistema de
orden arbitrario es estable.
Dado un sistema en lazo cerrado y a partir del estudio del error en estado
estacionario, conseguir que la respuesta forzada sea igual o muy parecida
a la entrada.
Un sistema de control general esta formado por varios componentes que
interactúan entre sı́: planta a controlar, controlador, sistemas de medición, ac-
tuadores, etc. Por esta razón un sistema de control puede ser muy complejo. A
pesar de esto, cualquier sistema de control en lazo cerrado puede ser reducido
para ser representado por una sola función de transferencia la cual relacio-
na a la salida controlada con la referencia o salida deseada. Esta función de
transferencia de lazo cerrado puede ser estudiada como se hace en el capı́tulo
3. En el presente capı́tulo se presenta el concepto de diagramas de bloques
para indicar como está constituido un sistema de control en lazo cerrado y se
presenta la manera de manipularlos para obtener la función de transferencia
de lazo cerrado.
Por otro lado, un sistema de control siempre se diseña de modo que cumpla
tres requisitos: a) que sea estable, b) que tenga las caracterı́sticas deseadas de
respuesta transitoria y c) que tenga las caracterı́sticas deseadas de respuesta
en estado estacionario. De acuerdo a lo estudiado en el capı́tulo 3, una función
de transferencia es estable si todos sus polos tienen parte real negativa. Sin
embargo, verificar este requisito de manera analı́tica puede presentar algunas
dificultades y por ello surge la necesidad de encontrar métodos sencillos para
conseguirlo. En este capı́tulo se presentan dos alternativas: 1) la regla de los
signos para determinar la ubicación de las raı́ces de un polinomio y, 2) el
Criterio de estabilidad de Routh.
Las caracterı́sticas de respuesta transitoria de un sistema de control depen-
den de la ubicación de los polos y de los ceros de la función de transferencia en
lazo cerrado. Hay dos métodos para el diseño de un controlador que asigne los
polos y los ceros de la función de transferencia de lazo cerrado en los lugares
requeridos para que se consigan las caracterı́sticas deseadas de respuesta tran-
sitoria: el lugar de las raı́ces (capı́tulo 5) y la respuesta en frecuencia (capı́tulo
6).
Finalmente, las caracterı́sticas deseadas de respuesta en estado estaciona-
rio se refieren al diseño de un controlador que consiga que, una vez que la
4.1 Diagramas de bloques 179

respuesta natural es cero1 , la respuesta del sistema en lazo cerrado alcance la


referencia o salida deseada de manera exacta o, al menos, dentro de ciertos
márgenes de tolerancia. Esto se consigue si la respuesta forzada del sistema
en lazo cerrado es igual o muy cercana a la referencia o salida deseada. Este
tema también es estudiado en el presente capı́tulo.

4.1. Diagramas de bloques


A continuación se muestra, a base de ejemplos, como se puede manipular
un diagrama de bloques formado por la interconexión de varias funciones de
transferencia para ser simplificado y ser representado por una sola función de
transferencia. También se muestra como se pueden simplificar los diagramas
de bloques correspondientes a sistemas que tienen dos (o más) entradas.
Ejemplo 4.1 Suponga que se tienen dos sistemas tales que la entrada de uno
es la salida del otro (conectados en cascada), como se muestra en la figura
4.1. Entonces se puede escribir:

Y1 (s) = G1 (s)U1 (s), Y2 (s) = G2 (s)U2 (s), U1 (s) = Y2 (s)

para obtener:

Y1 (s) = G1 (s)G2 (s)U2 (s), G(s) = G1 (s)G2 (s)


Y1 (s) = G(s)U2 (s)

U 2(s) Y 1(s) U 2(s) Y 1(s)


G 2(s) G 1(s) ) G(s)

Figura 4.1. Sistemas conectados en cascada.

Esto significa que los sistemas conectados en cascada, como en la figura


4.1, pueden ser representados por una sola función de transferencia G(s) que
se calcula como el producto de las funciones de transferencia de los sistemas
en cascada. El lector puede verificar que esto es cierto sin importar el número
de sistemas conectados en cascada.

Ejemplo 4.2 Suponga que se tienen dos sistemas conectados en paralelo co-
mo se muestra en la figura 4.2. Entonces se puede escribir:

Y1 (s) = G1 (s)U (s), Y2 (s) = G2 (s)U (s)


1
Cuando el tiempo es suficientemente grande, o en estado estacionario
180 4 Criterios de estabilidad y error

para obtener:
Y1 (s) + Y2 (s) = (G1 (s) + G2 (s))U (s) G(s) = G1 (s) + G2 (s)
Y1 (s) + Y2 (s) = G(s)U (s)

Y 1(s)
G 1(s)
U(s)
+
Y 1(s) + Y 2(s)
+
G 2(s)
Y 2(s)

U(s)
) G(s) Y 1(s) + Y 2(s)

Figura 4.2. Sistemas conectados en paralelo.

Esto significa que los sistemas conectados en paralelo, como en la figura


4.2, pueden ser representados por una sola función de transferencia G(s) que
se calcula como la suma de las funciones de transferencia de los sistemas
conectados en paralelo. El lector puede verificar que esto es cierto sin importar
el número de sistemas conectados en paralelo.
Ejemplo 4.3 Considere el sistema de control en lazo cerrado mostrado en la
figura 4.3. Los bloques G(s) y H(s) representan las funciones de transferencia
de los diferentes componentes de un sistema de control. De hecho, G(s) y
H(s) pueden ser el resultado de combinar las funciones de transferencia de
varios componentes del sistema de control como se indica en los dos ejemplos
previos. De acuerdo a la definición de función de transferencia, a partir de la
figura 4.3 se encuentra que:
C(s) = G(s)E(s), E(s) = R(s) − Y (s), Y (s) = H(s)C(s)
Sustituyendo sucesivamente estas expresiones se encuentra que:
C(s) = G(s)[R(s) − Y (s)]
= G(s)[R(s) − H(s)C(s)]
= G(s)R(s) − G(s)H(s)C(s)
C(s)[1 + G(s)H(s)] = G(s)R(s)
G(s)
C(s) = R(s)
1 + G(s)H(s)
4.1 Diagramas de bloques 181

donde:
C(s) G(s)
M (s) = = (4.1)
R(s) 1 + G(s)H(s)
se conoce como la función de transferencia de lazo cerrado.

R(s) + E(s) C(s)


G(s)
à
Y(s)
H(s)

Figura 4.3. Sistema en lazo cerrado.

Ejemplo 4.4 Considere el diagrama de bloques de la figura 4.4(a). Para redu-


cir este diagrama de bloques es conveniente recorrer el punto de resta colocado
a la derecha de U (s) hasta donde se encuentra I ∗ (s). Para conseguirlo es in-
dispensable que la variable I(s) en 4.4(a) permanezca sin alterarse. Es decir,
de acuerdo a la figura 4.4(a):
1
I(s) = [KAp (I ∗ (s) − I(s)) − nke sθ(s)]
Ls + R
Nótese que esta expresión también es válida en el diagrama de bloques de la
figura 4.4(b) y, por tanto, este diagrama de bloques es equivalente al de la
figura 4.4(a). A continuación, es claro que el lazo existente entre el segundo
punto de resta en 4.4(b) e I(s) es idéntico al sistema en lazo cerrado mostrado
en la figura 4.3 con:
KAp
G(s) = , H(s) = 1
Ls + R
donde se ha usado el resultado del ejemplo 4.1 para calcular la función de
transferencia de dos sistemas en cascada como el producto de las funciones de
transferencia de los sistemas en cascada. Por tanto, usando (4.1) se encuentra
que la siguiente función de transferencia debe ser colocada antes de I(s):
KAp
Ls + R + KAp
Esto se muestra en la figura 4.4(c). El diagrama de bloques en la figura 4.4(c)
tiene dos entradas. Para encontrar la salida θ(s) como función de las dos
entradas se usa el principio de superposición (véase la sección 3.10), es decir:

θ(s) = G1 (s)I ∗ (s) + G2 (s)Tp (s) (4.2)


182 4 Criterios de estabilidad y error
U i ( s) T p ( s)
à
I ã(s) + U ( s) 1 I(s) + 1 ò ( s)
K Ap nkm
+ Ls+R Js 2 +bs
à
à

nke s

(a)
T p ( s)
I ã(s) + à ò(s)
+ 1 I(s) + 1
KAp nkm
Ls+R Js 2 +bs
à à

nke
KA p
s

(b)
T p ( s)
à
I ã(s) + KA p I(s) + 1 ò(s)
nkm
Ls+R+KA p Js 2 +bs
à

nke
KA p
s

(c)

Figura 4.4. Simplificación de un diagrama de bloques que contiene un lazo interno.

donde G1 (s) es la función de transferencia obtenida con I ∗ (s) como entrada y


θ(s) como salida cuando se considera que Tp (s) = 0 en el diagrama de bloques
en la figura 4.4(c), es decir, cuando el diagrama de bloques tiene la forma
mostrada en la figura 4.5(a). Por tanto, usando (4.1) se define:

G(s) θ(s)
M (s) = = ∗ = G1 (s)
1 + G(s)H(s) I (s)
con:
KAp nkm nke s
G(s) = , H(s) =
(Ls + R + KAp )(Js2 + bs) KAp
para obtener:
nkm
G1 (s) = h³ ´ i (4.3)
sL+R n2 km ke
KAp + 1 (sJ + b) + KAp s
4.1 Diagramas de bloques 183

Iã(s) + ò(s)
KA p 1
Ls+R+KA p
nkm Js 2+bs
à

nk e
KA p
s
(a) Diagrama de bloques cuando Tp (s) = 0.

T p(s) à 1
ò(s)
Js 2+bs
à

nk mKA p nk e
Ls+R+KA p KA p
s
(b) Diagrama de bloques cuando I ∗ (s) = 0.

Iã(s) G1(s)
+
ò(s)
+
T p(s) G2(s)
(c) Diagrama de bloques equivalente a cualquiera de los diagra-
mas mostrados en la figura 4.4.

Figura 4.5. Simplificación del diagrama de bloques en la figura 4.4(c).

Por otro lado, G2 (s) es la función de transferencia obtenida con Tp (s) como
entrada y θ(s) como salida cuando se considera que I ∗ (s) = 0 en el diagrama
de bloques en la figura 4.4(c), es decir, cuando el diagrama de bloques tiene
la forma mostrada en la figura 4.5(b). Por tanto, usando (4.1) se define:
−G(s) θ(s)
M (s) = = = G2 (s)
1 + G(s)H(s) Tp (s)
con:
1 n2 km ke s
G(s) = 2
, H(s) =
Js + bs Ls + R + KAp
para obtener:
184 4 Criterios de estabilidad y error
³ ´
sL+R
− KAp +1
G2 (s) = h³ ´ i (4.4)
sL+R n2 km ke
KAp + 1 (sJ + b) + KAp s

Por tanto, cualquiera de los diagramas de bloques de las figuras 4.4(a), 4.4(b)
o 4.4(c) se puede representar como el diagrama de bloques de la figura 4.5(c)
con G1 (s) y G2 (s) dadas en (4.3) y (4.4).
Ejemplo 4.5 Considere el sistema en lazo cerrado mostrado en la figura
4.6(a). Este ejemplo representa un esquema de control conocido como contro-
lador con dos grados de libertad. Este es un sistema con dos entradas y una
salida. Por tanto, se puede proceder como en el ejemplo previo para, usando
el principio de superposición, escribir:

C(s) = G1 (s)R(s) + G2 (s)D(s)

donde G1 (s) es la función de transferencia obtenida usando R(s) como entrada


y C(s) como salida cuando D(s) = 0, es decir, cuando se usa el diagrama de
bloques de la figura 4.6(b). Por otro lado, G2 (s) es la función de transferencia
obtenida usando D(s) como entrada y C(s) como salida cuando R(s) = 0, es
decir, cuando se usa el diagrama de bloques de la figura 4.6(c).
Primero se procede a obtener G1 (s). Para simplificar el diagrama de blo-
ques de la figura 4.6(b) nótese que:

V (s) = Gc1 (s)(R(s) − C(s)) − Gc2 (s)C(s)


= Gc1 (s)(R(s) − C(s)) + Gc2 (s)(R(s) − C(s)) − Gc2 (s)R(s)
= (Gc1 (s) + Gc2 (s))(R(s) − C(s)) − Gc2 (s)R(s)

Por lo que se obtienen, sucesivamente, los diagramas de bloques de las figu-


ras 4.7(a), 4.7(b) y 4.7(c). Nótese que, de acuerdo al ejemplo 4.2, se puede
escribir:
· ¸
Gc2 (s)
F (s) = 1 − R(s)
Gc1 (s) + Gc2 (s)
Gc1 (s) + Gc2 (s) − Gc2 (s)
= R(s)
Gc1 (s) + Gc2 (s)
Gc1 (s)
= R(s) (4.5)
Gc1 (s) + Gc2 (s)

Por otro lado, se puede hacer uso de (4.1) junto con:

G(s) = (Gc1 (s) + Gc2 (s))Gp (s), H(s) = 1

para obtener:
(Gc1 (s) + Gc2 (s))Gp (s)
C(s) = F (s) (4.6)
1 + (Gc1 (s) + Gc2 (s))Gp (s)
4.1 Diagramas de bloques 185

D(s)
R(s) + + C(s)
G c1 ( s)
+ + G p ( s)
à à
G c2 ( s)

(a) Sistema en lazo cerrado.

R(s) + V(s) C(s)


G c1 ( s)
+ G p ( s)

à à
G c2 ( s)

(b) Caso cuando D(s) = 0


D(s) + C(s)
G p ( s)

à
G c1 ( s)
+
+
G c2 ( s)
(c) Caso cuando R(s) = 0

Figura 4.6. Sistema de control con dos grados de libertad.

Sustituyendo (4.5) en (4.6) se obtiene:


Gc1 (s)Gp (s)
C(s) = R(s)
1 + (Gc1 (s) + Gc2 (s))Gp (s)
por lo que se concluye que:
Gc1 (s)Gp (s)
G1 (s) = (4.7)
1 + (Gc1 (s) + Gc2 (s))Gp (s)

Por otro lado, del diagrama de bloques de la figura 4.6(c) y de acuerdo al


ejemplo 4.2 se obtiene el diagrama de bloques de la figura 4.8. Usando (4.1)
junto con:

G(s) = Gp (s), H(s) = Gc1 (s) + Gc2 (s)


186 4 Criterios de estabilidad y error

G c2(s)

R(s) + à V(s) C(s)


G c1(s) + G c2(s) G p ( s)
+
à
(a)
G c2(s)
G c1(s)+G c2(s) G c1(s) + G c2(s)

R(s) +
à V(s) C(s)
G c1(s) + G c2(s) G p ( s)
+
à
(b)

G c2(s)
G c1(s)+G c2(s)

R(s)
à F(s) V(s) C(s)
G c1(s) + G c2(s) G p ( s)
+
+ à
1

(c)

Figura 4.7. Simplificación del diagrama de bloques mostrado en la figura 4.6(b).

se obtiene:
Gp (s)
C(s) = D(s)
1 + (Gc1 (s) + Gc2 (s))Gp (s)

es decir:
Gp (s)
G2 (s) = (4.8)
1 + (Gc1 (s) + Gc2 (s))Gp (s)

Por tanto, el diagrama de bloques de la figura 4.6(a) se puede representar


como el diagrama de bloques de la figura 4.9 con G1 (s) y G2 (s) dadas en
(4.7) y (4.8).
4.2 Regla de los signos 187

D(s) C(s)
+ G p ( s)

à
G c1(s) + G c2(s)

Figura 4.8. Simplificación del diagrama de bloques en la figura 4.6(c).

R(s) G 1(s)
+ C(s)

+
D(s) G 2(s)

Figura 4.9. Diagrama de bloques equivalente al de la figura 4.6(a).

4.2. Regla de los signos para determinar la ubicación


de las raı́ces de un polinomio
De acuerdo a la sección 3.8, la estabilidad de una función de transferencia
está asegurada si la parte real de todos sus polos es negativa, es decir si
todas las raı́ces de su polinomio caracterı́stico tienen parte real negativa. Sin
embargo, en ocasiones es difı́cil calcular el valor exacto de los polos, sobre
todo si el polinomio es de grado tres o mayor. La razón de esto es que el
procedimiento para calcular las raı́ces de polinomios de orden 3 y 4 es un poco
complicado. Más aún, para polinomios de grado 5 o mayor ni siquiera existen
procedimientos analı́ticos para esto. Incluso para polinomios de segundo grado
en ocasiones es un poco tedioso tener que hacer el cálculo correspondiente aún
cuando la fórmula existente para tal caso es bien conocida. Ası́ que es muy
conveniente contar con un medio sencillo que permita determinar si los polos
de un polinomio tienen parte real negativa o si existe alguno con parte real
positiva. En esta sección se introducen criterios sencillos que resuelven este
problema y que están basados en el estudio de los signos de los coeficientes
de un polinomio.

4.2.1. Polinomios de segundo grado

Criterio 4.1 Si un polinomio de segundo grado tiene todos sus coeficientes


con el mismo signo, entonces todas sus raı́ces tienen parte real negativa.
Prueba. Considere el siguiente polinomio:

p(s) = s2 + cs + d
188 4 Criterios de estabilidad y error

donde c > 0, d > 0. Si todos los coeficientes de un polinomio tuvieran signo


negativo, entonces se puede factorizar dicho signo y proceder como se muestra
a continuación. Las dos raı́ces de p(s) se obtienen usando la fórmula general:

−c ± c2 − 4d
s1,2 = (4.9)
2
Caso i): c2 − 4d < 0.
En este caso ambas raı́ces son complejas conjugadas con parte real negativa
porque c > 0:

−c 4d − c2
s1,2 = ± j
2 2
Caso ii): c2 − 4d > 0.
En este caso

c2 > c2 − 4d > 0

porque d > 0. Aplicando la raı́z cuadrada en ambos lados de la desigualdad


se obtiene:
p
c > c2 − 4d

porque la raı́z cuadrada es una función estrictamente creciente. Entonces:


p
c − c2 − 4d > 0

De acuerdo a (4.9), esto significa que ambas raı́ces son reales, distintas y
negativas en este caso:

c + c2 − 4d
s1 = − <0
√2
c − c2 − 4d
s2 = − <0
2
Caso iii): c2 − 4d = 0.
En este caso ambas raı́ces son reales, iguales y negativas:
−c
s1,2 = (4.10)
2
Ejemplo 4.6 Nótese que el polinomio s2 + s + 1 satisface el caso i) por lo que
sus raı́ces son complejas conjugadas con parte real negativa. De hecho, no es
difı́cil verificar que estas raı́ces son −0.5 + j0.866 y −0.5 − j0.866. Por otro
lado, el polinomio s2 + 2.5s + 1 satisface el caso ii) por lo que sus dos raı́ces
son reales, distintas y negativas. No es difı́cil verificar que dichas raı́ces son
−2 y −0.5. Finalmente, el polinomio s2 + 2s + 1 satisface el caso iii) por lo
que sus dos raı́ces son reales, iguales y negativas. No es difı́cil verificar que
dichas raı́ces son −1 y −1.
4.2 Regla de los signos 189

Criterio 4.2 Si un polinomio de segundo grado tiene algunos de sus coefi-


cientes con signo contrario al de los otros coeficientes, entonces al menos una
de sus raı́ces tiene parte real positiva.
Prueba. Considere el siguiente polinomio:

p(s) = s2 + cs + d

donde hay tres posibilidades:


1) c < 0, d > 0.
2) c > 0, d < 0.
3) c < 0, d < 0.
Las dos raı́ces correspondientes se obtienen usando la fórmula general:

−c ± c2 − 4d
s1,2 = (4.11)
2
Caso i): c2 − 4d < 0.
En este caso ambas raı́ces son complejas conjugadas con parte real positiva
si se cumple 1). Los casos 2) y 3) no son posibles porque d < 0 implica
que c2 − 4d > 0.
Caso ii): c2 − 4d > 0.
Este caso es posible para d < 0, con c < 0 o c > 0 y algunos valores
pequeños de d > 0 con c < 0. Para valores mayores de d > 0 se recupera
el caso i). Si d < 0 entonces:

c2 < c2 − 4d

Aplicando la raı́z cuadrada en ambos lados de la desigualdad se obtiene:


p
abs(c) < c2 − 4d

porque la raı́z cuadrada es una función estrictamente creciente. Entonces:


p
abs(c) − c2 − 4d < 0

Esto significa que ambas raı́ces son reales y distintas con una de ellas
positiva:

c + c2 − 4d
s1 = − <0
√2
c − c2 − 4d
s2 = − >0
2
Si d > 0 con c < 0 entonces:

c2 > c2 − 4d
190 4 Criterios de estabilidad y error

Aplicando la raı́z cuadrada en ambos lados de la desigualdad se obtiene:


p
abs(c) > c2 − 4d
p
abs(c) − c2 − 4d > 0

Como c < 0, ya que d > 0, entonces hay dos raı́ces reales positivas:

c + c2 − 4d
s1 = − >0
√2
c − c2 − 4d
s2 = − >0
2
Caso iii): c2 − 4d = 0.
En este caso d = c2 /4 > 0, por lo que c < 0 (véase 1)). Esto implica que
ambas raı́ces son reales, iguales y positivas:
−c
s1,2 = >0 (4.12)
2
Ejemplo 4.7 A continuación se presentan varios polinomios de segundo or-
den y sus correspondientes raı́ces. Se deja como ejercicio para el lector que
verifique estos resultados, que identifique a que caso de los anteriores corres-
ponde cada uno y que compruebe que se cumplen las predicciones hechas en el
análisis arriba presentado.
s2 + 2s − 1, raı́ces: −2.4142 y 0.4142.
s2 − 2.5s + 1, raı́ces: 2 y 0.5.
s2 − s − 1, raı́ces: 1.618 y −0.618.
s2 − s + 1, raı́ces: 0.5 + j0.866 y 0.5 − j0.866.
s2 − 2s + 1, raı́ces: 1 y 1.

4.2.2. Polinomios de primer grado

En este caso es muy fácil demostrar que se cumple algo similar a los poli-
nomios de segundo grado:

Criterio 4.3 Si los dos coeficientes tienen el mismo signo entonces la única
raı́z es real y negativa. Si un coeficiente tiene signo contrario al otro coeficiente
entonces la única raı́z es real y positiva.

4.2.3. Polinomios de grado 3 o mayor

Criterio 4.4 Si al menos un coeficiente tiene signo contrario a los otros coefi-
cientes entonces es seguro que existe al menos una raı́z con parte real positiva.
4.3 Criterio de estabilidad de Routh 191

Prueba. Considere el siguiente polinomio donde n ≥ 3:


p(s) = sn + an−1 sn−1 + . . . + a1 s + a0 = (s − p1 )(s − p2 ) · · · (s − pn ()4.13)
Del estudio de polinomios de segundo grado se sabe que el producto (s −
pi )(s − pj ) = s2 + cs + d será tal que c < 0 y/o d < 0 si una de las raı́ces
pi o pj o ambas tienen parte real positiva. Por otro lado, el polinomio de
primer orden (s − pk ) tiene un coeficiente negativo si su raı́z pk es positiva.
Nótese también que los coeficientes aj , j = 0, . . . , n − 1 que se encuentran en
el lado izquierdo de (4.13) se obtienen como la suma de los productos de los
coeficientes de los polinomios de la forma s2 + cs + d y (s − pk ) que existen en
el miembro de la derecha de (4.13). Entonces, la única manera de que exista
un coeficiente aj < 0 en el lado izquierdo de (4.13) es que exista una raı́z con
parte real positiva en el miembro derecho de (4.13), es decir que alguno de los
polinomios s2 + cs + d o (s − pk ) tenga un coeficiente negativo.
Criterio 4.5 Aún cuando todos los coeficientes tengan el mismo signo, no
puede asegurarse que todas las raı́ces tienen parte real negativa.
Esto puede explicarse usando los mismos argumentos del párrafo anterior,
recordando que el producto de dos coeficientes negativos da un resultado po-
sitivo. Entonces, aún cuando todos los coeficientes del polinomio en el lado
izquierdo de (4.13) sean positivos, existe la posibilidad de que dos coeficien-
tes negativos (raı́ces con parte real positiva) del lado derecho de (4.13) se
multipliquen para dar un coeficiente positivo del lado izquierdo de (4.13).
Ejemplo 4.8 Para ilustrar lo que sucede cuando un polinomio es de orden
mayor a 2, a continuación se presentan algunos polinomios y sus raı́ces. El
lector puede comprobar estos resultados verificando que s3 + a2 s2 + a1 s + a0 =
(s−p1 )(s−p2 )(s−p3 ) donde p1 , p2 , p3 son las raı́ces del polinomio en cuestión.
s3 + s2 + s + 1.5, raı́ces: −1.2041, 0.102 + j1.1115 y 0.102 − j1.1115.
Dos raı́ces con parte real positiva, a pesar de que todos los coeficientes del
polinomio tienen el mismo signo.
s3 − s2 + s + 1, raı́ces: 0.7718 + j1.1151, 0.7718 − j1.1151 y −0.5437.
Dos raı́ces con parte real positiva porque un coeficiente del polinomio tiene
signo contrario a los otros coeficientes.
s3 + s2 + 1, raı́ces: −1.4656, 0.2328 + j0.7926, 0.2328 − j0.7926. Dos raı́ces
con parte real positiva porque un coeficiente tiene valor cero, aunque los
demás coeficientes tienen el mismo signo.
s3 + s2 + 3s + 1, raı́ces: −0.3194 + j1.6332, −0.3194 − j1.6332 y −0.3611.
Todas las raı́ces tienen parte real negativa y todos los coeficientes del poli-
nomio tienen el mismo signo.

4.3. Criterio de estabilidad de Routh


Como se ve en la sección anterior, la regla de los signos para determinar
la ubicación de las raı́ces de un polinomio, aunque muy cómoda, tiene su
192 4 Criterios de estabilidad y error

principal desventaja cuando se trata de aplicar a polinomios de grado mayor


o igual a 3: si todos los coeficientes de dicho polinomio tienen el mismo signo
nada se puede asegurar a cerca del signo de la parte real de sus raı́ces. La
solución a este problema la da el criterio de estabilidad de Routh el cual,
dado un polinomio de grado arbitrario, establece condiciones necesarias y
suficientes para asegurar que todas las raı́ces tienen parte real negativa.

Tabla 4.1. Tabla que se debe construir para aplicar el criterio de Routh.
sn an an−2 an−4 an−6 ... 0
n−1
s an−1 an−3 an−5 an−7 ... 0
sn−2 b1 b2 b3 b4 ... 0
sn−3 c1 c2 c3 c4 ... 0
sn−4 d1 d2 d3 d4 ... 0
.. .. .. .. ..
. . . . . ... 0
s2 p1 p2 0
s1 q1 0
s0 p2

Dado un polinomio arbitrario, ordénelo en orden descendente de potencias:


an sn + an−1 sn−1 + · · · + a1 s + a0 (4.14)
El criterio de estabilidad de Routh consiste en realizar los siguientes dos pasos:
1. Construya la tabla 4.1. Nótese que los primeros dos renglones de la tabla
anterior se construyen usando directamente los coeficientes del polinomio
bajo estudio. Observe también que los últimos elementos de los dos pri-
meros renglones terminan en ceros, pues ese es el valor de los coeficientes
de las potencias que no aparecen en el polinomio en (4.14). Los elementos
de los otros renglones se calculan de acuerdo a las siguientes reglas:
an−1 an−2 − an an−3 an−1 an−4 − an an−5
b1 = , b2 = ,
an−1 an−1
an−1 an−6 − an an−7
b3 =
an−1
..
.
b1 an−3 − an−1 b2 b1 an−5 − an−1 b3 b1 an−7 − an−1 b4
c1 = , c2 = , c3 =
b1 b1 b1
..
.
c1 b2 − b1 c2 c1 b3 − b1 c3 c1 b4 − b1 c4
d1 = , d2 = , d3 =
c1 c1 c1
..
.
4.3 Criterio de estabilidad de Routh 193

Nótese que, de acuerdo a estas reglas, el último elemento de cada renglón


es cero y que la tabla tiene una forma triangular.
2. Analice únicamente la primera columna de la tabla construida. El número
de cambios de signos al recorrer de arriba hacia abajo los elementos de la
primera columna es igual al número de raı́ces con parte real positiva.
A continuación se presentan varios ejemplos.
Ejemplo 4.9 Sea el siguiente polinomio de segundo orden:

s2 + as + b

con a y b dos constantes reales. Dado que este polinomio es de segundo grado
(tiene dos raı́ces) entonces se puede usar la regla de los signos vista en la
sección 4.2 para concluir que las dos raı́ces tiene parte real negativa si

a > 0, b>0

ya que el coeficiente de s2 es positivo e igual a uno. Ahora se hará uso del


criterio de Routh para verificar este resultado. De acuerdo a las reglas del
criterio de Routh se construye la tabla 4.2. El criterio de Routh establece
que el número de cambios de signo al recorrer los elementos de la primera
columna es igual al número de raı́ces con parte real positiva. Por tanto, si
no hay cambios de signo entonces las dos raı́ces tendrán parte real negativa.
Como el primer elemento de la primera columna es igual a 1, el cual es un
número positivo, entonces las condiciones:

a > 0, b>0

deben cumplirse simultáneamente para asegurar que ambas raı́ces tienen parte
real negativa. De este modo, el criterio de Routh y la regla de los signos de la
sección 4.2 dan el mismo resultado, como se esperaba.

Tabla 4.2. Aplicación del criterio de Routh al polinomio s2 + as + b.


s2 1 b 0
s1 a 0
s0 b

Ejemplo 4.10 Sea el siguiente polinomio:

s3 + 5s2 + 2s − 8

Dado que existe un coeficiente de signo contrario al de los otros (−8) se puede
usar la regla de los signos vista en la sección 4.2 para concluir que existe al
menos una raı́z con parte real positiva. Ahora se hará uso del criterio de Routh
194 4 Criterios de estabilidad y error

para verificar este resultado. De acuerdo a las reglas del criterio de Routh se
construye la tabla 4.3. El criterio de Routh establece que el número de cambios
de signo al recorrer los elementos de la primera columna es igual al número
de raı́ces con parte real positiva. Por tanto, se concluye que el polinomio s3 +
5s2 + 2s − 8 tiene una raı́z con parte real positiva. De hecho, usando software
especializado se pueden usar métodos numéricos para encontrar que:
s = −2, s = 1, s = −4
son las raı́ces del polinomio en cuestión.

Tabla 4.3. Aplicación del criterio de Routh al polinomio s3 + 5s2 + 2s − 8.


s3 1 2 0
s2 5 -8 0
5×2−1×(−8)
s1 5
= 3.6 0
s0 −8

Ejemplo 4.11 Sea el siguiente polinomio:


s3 + 1.8s2 + 0.61s + 2.02
Nótese que todos los coeficientes del polinomio tienen el mismo signo (todos
son positivos). En este caso la regla de los signos vista en la sección 4.2 no es
de utilidad porque el polinomio es de tercer grado. En este tipo de situaciones
el criterio de Routh es de gran utilidad. De acuerdo a las reglas del criterio de
Routh se construye la tabla 4.4. El criterio de Routh establece que el número
de cambios de signo al recorrer los elementos de la primera columna es igual
al número de raı́ces con parte real positiva. Por tanto, se concluye que el
polinomio s3 + 1.8s2 + 0.61s + 2.02 tiene dos raı́ces con parte real positiva. De
hecho, usando software especializado se pueden usar métodos numéricos para
encontrar que:
s = −2, s = 0.1 + j, s = 0.1 − j
son las raı́ces del polinomio en cuestión.

Tabla 4.4. Aplicación del criterio de Routh al polinomio s3 + 1.8s2 + 0.61s + 2.02.
s3 1 0.61 0
s2 1.8 2.02 0
s1 1.8×0.61−1×2.02
1.8
= −0.512 0
s0 2.02
4.3 Criterio de estabilidad de Routh 195

Ejemplo 4.12 Sea el siguiente polinomio:

s3 + as2 + bs + c

donde a, b y c son constantes reales desconocidas. Este tipo de situaciones es


muy común en sistemas de control donde los coeficientes del polinomio carac-
terı́stico dependen de las ganancias del controlador, las cuales no se conocen
de antemano y deben ser determinadas de modo que se asegure la estabilidad
en lazo cerrado. Esto se consigue asegurando que todas las raı́ces del polino-
mio caracterı́stico de lazo cerrado tengan parte real negativa. Sin embargo, el
cálculo de las raı́ces de un polinomio de tercer orden usando fórmulas analı́ti-
cas es un proceso tedioso y, por tanto, esa no es una solución práctica. Este
es otro tipo de problema en el que el criterio de Routh es de gran utilidad.
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.5. El
criterio de Routh establece que el número de cambios de signo al recorrer los
elementos de la primera columna es igual al número de raı́ces con parte real
positiva. Por tanto, como el primer elemento de la columna es igual a 1, es
decir es positivo, entonces si:
ab − c
a > 0, >0 c>0 (4.15)
a
se asegura que las tres raı́ces tiene parte real negativa. Nótese que las condi-
ciones en (4.15) son equivalentes a:
c
a > 0, b> >0 c>0
a
Esto indica que aunque a los coeficientes a y c sólo se les exige que deben ser
positivos, en el caso del coeficiente b esto no es suficiente y se le exige un poco
más: b > ac > 0.

Tabla 4.5. Aplicación del criterio de Routh al polinomio s3 + as2 + bs + c.


s3 1 b0
s2 a c0
s1 ab−1×c
a
0
s0 c

Ejemplo 4.13 (Caso especial. Sólo el elemento de la primera colum-


na de un renglón es igual a cero) Sea el siguiente polinomio:

s5 + 2s4 + 3s3 + 6s2 + 5s + 3

De acuerdo a las reglas del criterio de Routh se construye la tabla 4.6. Sin
embargo, la construcción de la tabla se detiene en el renglón correspondiente a
196 4 Criterios de estabilidad y error

s3 porque el elemento de la primera columna de ese renglón es cero. Esto trae


como consecuencia algunas divisiones entre cero al continuar construyendo los
siguientes renglones. Se recomienda sustituir el cero de la primera columna
por un valor ε > 0 pequeño pero positivo y continuar construyendo la tabla
como se muestra en la tabla 4.7.

Tabla 4.6. Aplicación del criterio de Routh al polinomio s5 +2s4 +3s3 +6s2 +5s+3.
s5 1 3 5
s4 2 6 3
s3 2×3−1×6
2
=0 2×5−1×3
2
= 3.5 0
s2
s1
s0

Tabla 4.7. Aplicación del criterio de Routh al polinomio s5 +2s4 +3s3 +6s2 +5s+3
(continuación).
s5 1 3 5
s4 2 6 3
s3 ε 3.5 0
s2 ε×6−2×3.5 ε×3−2×0
ε ε
=30
42ε−49−6ε2
s1 12ε−14
0
s0 3

Ahora determı́nese el número de cambios de signo en la primera columna


conforme ε > 0 tiende a cero. Nótese que en el caso de este ejemplo hay dos
cambios de signo. Esto significa que el polinomio bajo estudio tiene dos raı́ces
con parte real positiva. De hecho, se puede usar software especializado para
encontrar, usando métodos numéricos, que las raı́ces del polinomio s5 + 2s4 +
3s3 + 6s2 + 5s + 3 son:

s = 0.3429 + j1.5083, s = 0.3429 − j1.5083, s = −1.6681,


s = −0.5088 + j0.7020, s = −0.5088 − j0.7020

Si al considerar ε > 0 no hubiera cambios de signo al recorrer la primera


columna entonces el sistema es marginalmente estable, es decir, hay raı́ces
sobre el eje imaginario.
Ejemplo 4.14 (Caso especial. Un renglón está formado por ceros
exclusivamente o un renglón está formado por un sólo elemento el
cual, además, es cero) Sea el siguiente polinomio:
4.3 Criterio de estabilidad de Routh 197

s3 + 3s2 + s + 3
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.8. Sin
embargo, la construcción de la tabla se detiene en el renglón correspondien-
te a s1 porque todo ese renglón está formado exclusivamente por ceros. Este
es un caso especial que indica la existencia de raı́ces: 1) simétricas y reales,
2) simétricas e imaginarias, o 3) 4 raı́ces colocadas sobre los vértices de un
rectángulo centrado en el origen. Para continuar con el método se debe for-
mar un polinomio con los elementos del renglón inmediato superior al renglón
formado exclusivamente por ceros:
P (s) = 3s2 + 3,
se obtiene su derivada:
dP (s)
= 6s
ds
y se sustituyen estos coeficientes en el renglón formado exclusivamente por
ceros, como se muestra en la tabla 4.9, para continuar construyendo la tabla.

Tabla 4.8. Aplicación del criterio de Routh al polinomio s3 + 3s2 + s + 3.


s3 1 10
s2 3 30
s1 3×1−1×3
3
=00
s0

Tabla 4.9. Aplicación del criterio de Routh al polinomio s3 + 3s2 + s + 3 (conti-


nuación).
s3 110
s2 330
s1 60
s0 3

Como no hay cambios de signo al recorrer los elementos de la primera


columna se concluye que no hay raı́ces con parte real positiva y se concluye,
por tanto, que de los tres casos mencionados anteriormente sólo es posible el
caso 2): hay raı́ces simétricas e imaginarias. Es más, un aspecto importante
en este caso especial es el siguiente:
“Con los elementos del renglón inmediato superior al renglón formado ex-
clusivamente por ceros forme un polinomio. Las raı́ces de dicho polinomio
también son raı́ces del polinomio original”.
198 4 Criterios de estabilidad y error

Esto significa que las raı́ces del polinomio 3s2 + 3 también son raı́ces del
polinomio s3 + 3s2 + s + 3. Estas raı́ces se pueden obtener como:
3s2 + 3 = 0, ⇒ s = ±j
Por tanto, el polinomio s3 + 3s2 + s + 3 tiene una raı́z en s = j y otra en
s = −j. De hecho, se puede usar software especializado para encontrar, usando
métodos numéricos, que las raı́ces del polinomio s3 + 3s2 + s + 3 son:
s = −3, s = j, s = −j
Ejemplo 4.15 (Caso especial. Un renglón está formado por ceros
exclusivamente o un renglón está formado por un sólo elemento el
cual, además, es cero) Sea el siguiente polinomio:
s4 + s2 + 1
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.10. Como
hay un renglón formado exclusivamente por ceros se procede como en el ejem-
plo anterior. El polinomio formado con los elementos del renglón inmediato
superior (igual al polinomio original en este caso) es derivado respecto a s:
dP (s)
P (s) = s4 + s2 + 1, = 4s3 + 2s
ds

Tabla 4.10. Aplicación del criterio de Routh al polinomio s4 + s2 + 1.


s4 1 1 1 0
s3 0 0 0
s2
s1
s0

Tabla 4.11. Aplicación del criterio de Routh al polinomio s4 +s2 +1 (continuación).


s4 1 1 10
s3 4 2 0
s2 4×1−1×2
4
= 0.5 4×1−1×0
4
=1
s1 0.5×2−4×1
0.5
= −1.5 0
s0 1

Los coeficientes del polinomio resultante se sustituyen en el renglón for-


mado exclusivamente por ceros y se continúa con la construcción de la tabla
4.3 Criterio de estabilidad de Routh 199

como se muestra en la tabla 4.11. Como hay dos cambios de signo al recorrer
la primera columna de la tabla 4.11 se concluye que existen dos raı́ces con
parte real positiva. Esto significa que es posible uno de los siguientes casos:
hay raı́ces simétricas y reales, o hay 4 raı́ces colocadas sobre los vértices de
un rectángulo centrado en el origen. De hecho, se puede hacer uso de softwa-
re especializado para encontrar, usando métodos numéricos que las raı́ces del
polinomio s4 + s2 + 1 son:

s = −0.5 ± j0.8660, s = 0.5 ± j0.8660

es decir, hay 4 raı́ces colocadas sobre los vértices de un rectángulo centrado


en el origen.
Ejemplo 4.16 (Raı́ces repetidas sobre el eje imaginario) Cuando el
polinomio caracterı́stico tiene raı́ces repetidas sobre el eje imaginario la fun-
ción de transferencia es inestable. Sin embargo, este tipo de inestabilidad no
es detectado por el método del criterio de Routh. Por ejemplo, suponga que el
siguiente es el polinomio caracterı́stico de una función de transferencia:

s4 + 2s2 + 1 = [(s + j)(s − j)]2

Nótese que hay dos raı́ces repetidas sobre el eje imaginario. De acuerdo a las
reglas del criterio de Routh se construye la tabla 4.12. Como hay un renglón
formado exclusivamente por ceros se obtiene la derivada del siguiente polino-
mio:
dP (s)
P (s) = s4 + 2s2 + 1, = 4s3 + 4s
ds
y se continúa con el método como se muestra en la tabla 4.13.

Tabla 4.12. Aplicación del criterio de Routh al polinomio s4 + 2s2 + 1.


s4 1 2 1 0
s3 0 0 0
s2
s1
s0

Como hay otro renglón formado exclusivamente por ceros se obtiene la


derivada del siguiente polinomio:
dP1 (s)
P1 (s) = s2 + 1, = 2s
ds
y se continúa con el método como se muestra en la tabla 4.14. Nótese que
no hay cambios de signo en la primera columna de la tabla 4.14 por lo que
200 4 Criterios de estabilidad y error

Tabla 4.13. Aplicación del criterio de Routh al polinomio s4 +2s2 +1 (continuación).


s4 1 2 10
s3 4 4 0
s2 4×2−4×1
4
=1 4×1−1×0
4
=10
s1 0 0
s0

Tabla 4.14. Aplicación del criterio de Routh al polinomio s4 +2s2 +1 (continuación).


s4 1 210
s3 4 40
s2 1 10
s1 2 0
s0 1

el método indica, correctamente, que no hay raı́ces con parte real positiva.
Además, las raı́ces del polinomio P1 (s) = s2 + 1 son s = ±j, por lo que se
concluye estabilidad marginal. Nótese que esto es incorrecto porque el poli-
nomio s4 + 2s2 + 1 tiene dos raı́ces imaginarias repetidas dos veces, lo cual
implica inestabilidad. Ası́ que debe tenerse cuidado con estos casos.

4.4. Error en estado estacionario

Se ha visto que la solución de una ecuación diferencial siempre está dada


como la suma de la respuesta natural y la respuesta forzada. Si la ecuación
diferencial es estable o, equivalentemente, si la función de transferencia es es-
table entonces la respuesta natural desaparece al crecer el tiempo y la solución
alcanza la respuesta forzada. Recuérdese que la respuesta forzada depende de
(o es similar a) la entrada aplicada a la ecuación diferencial. De acuerdo a
este razonamiento, en un sistema de control en lazo cerrado se procede del
siguiente modo. 1) La entrada del sistema en lazo cerrado es una señal que
representa el valor que se desea alcance la salida del sistema en lazo cerrado.
Por esto, a dicha señal de entrada se le conoce como la referencia o la salida
deseada. 2) El controlador se diseña de manera que el sistema en lazo cerrado
sea estable y que la respuesta forzada del sistema en lazo cerrado sea igual o
muy cercana a la referencia o salida deseada.
En esta sección se estudian las propiedades que debe tener un sistema de
control en lazo cerrado para que la respuesta forzada del sistema realimentado
sea igual o muy cercana a la entrada del sistema en lazo cerrado, es decir a la
referencia o salida deseada. Nótese que esto equivale a conseguir que la señal
de error, definida como la diferencia entre la salida del sistema y la referencia
o salida deseada, sea cero o muy cercana a cero en estado estacionario, es
4.4 Error en estado estacionario 201

decir, cuando el tiempo es muy grande. Por esta razón, en lo que sigue se
estudia el comportamiento del error en estado estacionario.
Considere el sistema en lazo cerrado con realimentación unitaria mostrado
en la figura 4.10. Como se muestra en esta sección, un concepto fundamental
para la determinación del error en estado estacionario es el tipo del sistema,
el cual se define a continuación. Una función de transferencia de lazo abierto
de orden n siempre se puede escribir del siguiente modo:
k(s − z1 )(s − z2 ) · · · (s − zm )
G(s) =
sN (s − p1 )(s − p2 ) · · · (s − pn−N )
donde n es el número de polos de lazo abierto y m es el número de ceros de
lazo abierto con n > m, zj 6= 0, j = 1, . . . , m y pi 6= 0, i = 1, . . . , n − N .
De este modo, N es el número de polos que la función de transferencia de
lazo abierto tiene en el origen (una vez cancelados los ceros que la función de
transferencia de lazo abierto pueda tener en el origen). Por definición, el tipo
del sistema es igual a N , es decir, es el número de integradores que el sistema
tiene en lazo abierto.
Por otro lado, la señal de error está dada como la diferencia entre la salida
del sistema realimentado y la referencia o salida deseada:

E(s) = R(s) − C(s) ⇒ C(s) = R(s) − E(s)

y por otro lado:

C(s) = G(s)E(s) = R(s) − E(s)

de donde se encuentra que:

R(s) + E(s) C(s)


G(s)
à

Figura 4.10. Sistema en lazo cerrado con realimentación unitaria.

E(s)[1 + G(s)] = R(s)


1
E(s) = R(s) (4.16)
1 + G(s)
El error en estado estacionario ess se obtiene usando (4.16) y el teorema del
valor final presentado en (3.3), es decir:
s
ess = lı́m e(t) = lı́m sE(s) = lı́m R(s) (4.17)
t→∞ s→0 s→0 1 + G(s)
202 4 Criterios de estabilidad y error

Como el error en estado estacionario es la diferencia entre la salida del siste-


ma c(t) y la referencia o salida deseada r(t), en estado estacionario, es lógico
que en la expresión anterior ess dependa de la referencia R(s). Por tanto, para
continuar con el estudio es necesario conocer el valor de R(s) lo cual motiva la
definición de señales de prueba. Una señal de prueba debe ser una función del
tiempo con dos caracterı́sticas: 1) que tenga un significado fı́sico de importan-
cia en aplicaciones reales y 2) que sea sencilla de manejar matemáticamente.
A continuación se definen algunas de las señales (o entradas) de prueba más
comúnes en control clásico.
Considere el problema del control de la posición de un cañón antiaéreo.
En este problema se desea que el cañón apunte todo el tiempo hacia un avión
que se mueve a gran velocidad. Algunas situaciones que pueden presentarse
son las siguientes.
Entrada de prueba escalón. Suponga que el avión se dirige directa-
mente hacia el cañón sobre una dirección de valor constante A. Si el cañón
inicialmente apunta hacia una dirección diferente (cero) a donde se en-
cuentra el avión, entonces la referencia o la dirección en la que se desea
apunte el cañón tiene la forma mostrada en la figura 4.11. Esta señal se
conoce como escalón y representa un cambio muy rápido (discontinuo) en
la dirección en que se desea apunte el cañón. Entonces el cañón debe mo-
verse rápidamente para que la dirección en que realmente apunta alcance
la dirección deseada, mostrada en la figura 4.11. Más aún, se desea que en
estado estacionario la diferencia entre estas señales sea cero o al menos,
en el peor de los casos, muy cercana a cero. Si r(t) es un escalón:
½
0, t < 0
r(t) =
A, t ≥ 0

donde A es una constante, entonces R(s) = L{r(t)} = As es una función


suficientemente sencilla para ser manejada matemáticamente.

r(t)

0 t
Figura 4.11. Entrada de prueba escalón.

Entrada de prueba rampa. Suponga que el avión pasa enfrente del


cañón con velocidad constante A, dirigiéndose hacia otro punto, y que
4.4 Error en estado estacionario 203

inicialmente el cañón está apuntando hacia el avión (en cero). Entonces la


referencia o la dirección en la que se desea apunte el cañón tiene la forma
mostrada en la figura 4.12. Esta señal se conoce como rampa e indica
que se desea que la dirección en la que apunta el cañón cambie con una
velocidad constante A (la velocidad del avión). Si r(t) es una rampa:
½
0, t < 0
r(t) =
At, t ≥ 0

donde A = dr(t)dt es una constante que representa la velocidad con que


r(t) cambia, entonces R(s) = L{r(t)} = sA2 es una función suficientemente
sencilla para ser manejada matemáticamente.

r(t)

0 t
Figura 4.12. Entrada de prueba rampa.

Entrada de prueba parábola. Suponga que ahora el avión pasa enfrente


del cañón con aceleración constante A (tratando de escapar), dirigiéndose
hacia otro punto, y que inicialmente el cañón está apuntando hacia el avión
(en cero). Entonces la referencia o la dirección en la que se desea apunte
el cañón tiene la forma mostrada en la figura 4.13. Esta señal se conoce
como parábola e indica que se desea que la dirección en la que apunta el
cañón cambie con una aceleración constante A (la aceleración del avión).
Si r(t) es una parabola:
½
0, t<0
r(t) = 1 2
2 At , t≥0
2
donde A = d dtr(t)
2 es una constante que representa la aceleración con que
r(t) cambia, entonces R(s) = L{r(t)} = sA3 es una función suficientemente
sencilla para ser manejada matemáticamente.
Como cualquiera de las tres situaciones anteriores puede aparecer durante
el funcionamiento del sistema de control de posición del cañón antiaéreo, el
diseño del controlador debe ser tal que el error de estado estacionario sea cero
o muy pequeño ante cualquiera de las tres señales de prueba. A continuación
se determinan las condiciones que permiten conseguir estas especificaciones
para cada señal de prueba.
204 4 Criterios de estabilidad y error

r(t)
1
2
At2

0 t
Figura 4.13. Entrada de prueba parábola.

4.4.1. Referencia tipo escalón

Suponga que R(s) = A/s es un escalón de altura A. Usando la expresión


en (4.17) se obtiene:

s A
ess = lı́m
s→0 1 + G(s) s
A
= , kp = lı́m G(s)
1 + kp s→0

donde kp se conoce como la constante de error estática de posición y su va-


lor está directamente relacionado con el tipo del sistema. Por esta razón se
consideran los siguientes casos:
Sistemas tipo 0 (N = 0). En este caso la función de transferencia de lazo
abierto tiene la forma:
k(s − z1 )(s − z2 ) · · · (s − zm )
G(s) =
(s − p1 )(s − p2 ) · · · (s − pn )

por lo que:

k(−z1 )(−z2 ) · · · (−zm )


kp = lı́m G(s) =
s→0 (−p1 )(−p2 ) · · · (−pn )

kp es finito. Esto significa que el error en estado estacionario es diferente


de cero:
A
ess = 6= 0
1 + kp

Sistemas tipo mayor o igual a 1 (N ≥ 1). En este caso la función de


transferencia de lazo abierto tiene la forma:
k(s − z1 )(s − z2 ) · · · (s − zm )
G(s) =
sN (s − p1 )(s − p2 ) · · · (s − pn−N )

por lo que:
4.4 Error en estado estacionario 205

k(−z1 )(−z2 ) · · · (−zm )


kp = lı́m G(s) = →∞
s→0 sN (−p1 )(−p2 ) · · · (−pn−N )

Esto significa que el error en estado estacionario es igual a cero:


A
ess = =0
1 + kp

4.4.2. Referencia tipo rampa

Suponga que R(s) = A/s2 es una rampa de pendiente A. Usando la ex-


presión en (4.17) se obtiene:

s A
ess = lı́m
s→0 1 + G(s) s2
A
= , kv = lı́m sG(s)
kv s→0

donde kv se conoce como la constante de error estática de velocidad y su


valor está directamente relacionado con el tipo del sistema. Por esta razón se
consideran los siguientes casos:
Sistemas tipo 0 (N = 0). En este caso la función de transferencia de lazo
abierto tiene la forma:
k(s − z1 )(s − z2 ) · · · (s − zm )
G(s) =
(s − p1 )(s − p2 ) · · · (s − pn )

por lo que:

k(−z1 )(−z2 ) · · · (−zm )


kv = lı́m sG(s) = (0) =0
s→0 (−p1 )(−p2 ) · · · (−pn )

Esto significa que el error en estado estacionario crece sin lı́mite (tiende a
infinito):

A
ess = →∞
kv
Sistemas tipo igual a 1 (N = 1). En este caso la función de transferencia
de lazo abierto tiene la forma:
k(s − z1 )(s − z2 ) · · · (s − zm )
G(s) =
s(s − p1 )(s − p2 ) · · · (s − pn−1 )

por lo que:

k(−z1 )(−z2 ) · · · (−zm )


kv = lı́m sG(s) =
s→0 (−p1 )(−p2 ) · · · (−pn−1 )
206 4 Criterios de estabilidad y error

kv es un número diferente de cero y finito. Esto significa que el error en


estado estacionario es diferente de cero:
A
ess = 6= 0
kv
Sistemas tipo mayor o igual a 2 (N ≥ 2). En este caso la función de
transferencia de lazo abierto tiene la forma:
k(s − z1 )(s − z2 ) · · · (s − zm )
G(s) =
sN (s − p1 )(s − p2 ) · · · (s − pn−N )
por lo que:
k(−z1 )(−z2 ) · · · (−zm )
kv = lı́m sG(s) = N −1
→∞
s→0 s (−p1 )(−p2 ) · · · (−pn−N )
porque N − 1 ≥ 1. Esto significa que el error en estado estacionario es
igual a cero:
A
ess = =0
kv

4.4.3. Referencia tipo parábola

Suponga que R(s) = A/s3 es una parábola con segunda derivada igual a
A. Usando la expresión en (4.17) se obtiene:
s A
ess = lı́m
s→0 1 + G(s) s3
A
= , ka = lı́m s2 G(s)
ka s→0

donde ka se conoce como la constante de error estática de aceleración y su


valor está directamente relacionado con el tipo del sistema. La función de
transferencia de lazo abierto tiene la forma:
k(s − z1 )(s − z2 ) · · · (s − zm )
G(s) =
sN (s − p1 )(s − p2 ) · · · (s − pn−N )
por lo que:
k(−z1 )(−z2 ) · · · (−zm )
ka = lı́m s2 G(s) =
s→0 sN −2 (−p1 )(−p2 ) · · · (−pn−N )
Esto significa que:
El error en estado estacionario crece sin lı́mite (tiende a infinito) para
sistemas tipo menor o igual a 1:
A
ess = → ∞, N ≤1
kv
4.4 Error en estado estacionario 207

El error en estado estacionario es diferente de cero para sistemas tipo igual


a 2:
A
ess = 6= 0, N =2
kv
El error en estado estacionario es igual a cero para sistemas tipo mayor o
igual a 3:
A
ess = = 0, N ≥3
kv
Nótese que, para las tres referencias o señales de prueba consideradas, el
error en estado estacionario se hace cero si se incrementa convenientemente el
número de integradores que tiene la función de transferencia de lazo abierto
(tipo del sistema). Esto explica porqué algunos controladores incluyen un
integrador (véase la sección 5.2.4 donde se estudia el controlador PI). Por
otro lado, es muy importante subrayar que los resultados que se acaban de
presentar sólo se cumplen si se asegura que el sistema en lazo cerrado es
estable ya que los resultados anteriores se han obtenido suponiendo que la
respuesta natural tiende a cero conforme el tiempo crece. Más adelante, en los
capı́tulos 5 y 6, se explica que el adicionar polos de lazo abierto (integradores,
cuando dichos polos están en s = 0) tiende a hacer inestable al sistema en lazo
cerrado. Ası́ que no siempre será posible, o conveniente, diseñar un sistema
de control con error en estado estacionario igual a cero y se deberá conformar
con un error en estado estacionario pequeño.
Finalmente, y por razones didácticas, en la figura 4.14 se muestra gráfica-
mente el comportamiento de la salida c(t) con respecto a la referencia r(t),
cuando ésta es una rampa, para los distintos tipos de sistema.

r(t)
e ss6=0
e ss = 0 c(t)

e ss ! 1

0 t
Figura 4.14. Comportamiento de la salida c(t) cuando la referencia r(t) es una
rampa. Nótese que ess = 0 cuando el tipo es mayor o igual a 2, ess 6= 0 cuando el
tipo es igual a 1 y ess → ∞ cuando el tipo es igual a 0.

Ejemplo 4.17 En la figura 4.15 se muestra un sistema de control de veloci-


dad de un motor de CD (véase el capı́tulo 9). El modelo del motor está dado
208 4 Criterios de estabilidad y error

k
por la función de transferencia Gm (s) = s+a , con k > 0 y a > 0, mientras que
la constante positiva kp representa la función de transferencia de un controla-
dor proporcional. Esto significa que la corriente usada como señal de control
se calcula como:

i∗ = kp (ωd − ω)

donde ω es la velocidad medida, ωd es la velocidad deseada e I ∗ (s) es la


transformada de Laplace de i∗ . La función de transferencia de lazo abierto es:
kp k
G(s)H(s) =
s+a
Nótese que al ser a > 0 este sistema es tipo 0 porque la función de transferen-
cia de lazo abierto no tiene ningún polo en el origen (en s = 0). Por tanto,
de acuerdo a la sección 4.4.1, si la velocidad deseada es constante (es decir,
un escalón) entonces el error en estado estacionario ess = ωd − lı́mt→∞ ω(t)
es constante y diferente de cero, es decir, un controlador proporcional de ve-
locidad no es útil para conseguir que el motor alcance la velocidad deseada.
Nótese que, de acuerdo a las secciones 4.4.2 y 4.4.3, el problema es más grave
(es decir, el error en estado estacionario es mayor) si la velocidad deseada
tuviera la forma de una rampa o de una parábola.

! d(s) + I ã(s) !(s)


k
kp s+a
à

Figura 4.15. Sistema de control proporcional de velocidad.

La manera de resolver este problema, cuando la velocidad deseada es una


constante, es usando un controlador proporcional-integral (PI). El controlador
PI realiza la siguiente operación sobre el error de velocidad:
Z t
i∗ = kp e + ki e(r)dr, e = ωd − ω
0

donde kp y ki son constantes positivas.Usando la transformada de Laplace se


obtiene:
E(s)
I ∗ (s) = kp E(s) + ki
µ ¶ s
ki
= kp + E(s)
s
4.4 Error en estado estacionario 209
µ ¶
kp s + ki
= E(s)
s
à !
s + kkpi
= kp E(s)
s

donde E(s) es la transformada de Laplace del error de velocidad. Con esto


es posible construir el diagrama de bloques de lazo cerrado que se muestra
en la figura 4.16. Nótese que ahora el sistema es tipo 1 porque la función de
transferencia de lazo abierto:
à !
s + kkpi k
G(s)H(s) = kp
s s+a

tiene un polo en s = 0 y, por tanto, de acuerdo a la sección 4.4.1 el error en


estado estacionario es cero, es decir, la velocidad del motor alcanza la veloci-
dad deseada cuando el tiempo sea suficientemente grande y si ωd es constante
(un escalón). Ası́, el término integral en un controlador PI es introducido con
el fin de llevar a cero el error en estado estacionario. Finalmente, debe acla-
rarse que este resultado será totalmente cierto sólo hasta que se asegure que
el sistema en lazo cerrado sea estable, es decir, hasta que todos los polos de
lazo cerrado tengan parte real negativa.
Por otro lado, nótese que, de acuerdo a las secciones 4.4.2 y 4.4.3 el con-
trolador PI de velocidad sólo es útil para referencias tipo escalón, pues el error
en estado estacionario sigue siendo diferente de cero si la referencia de velo-
cidad tiene forma de una rampa o de una parábola.

! d(s) + k I ã(s) !(s)


s+k pi k
kp s
s+a
à

Figura 4.16. Sistema de control proporcional-integral de velocidad.

Ejemplo 4.18 Considere el sistema de control proporcional de posición de


un motor de CD mostrado en la figura 4.17. Nótese que la función de trans-
ferencia del motor tiene un polo en s = 0 cuando la posición es la salida a
controlar, por lo que el sistema es de tipo 1 y el error en estado estacionario
es cero si la posición deseada es una constante (un escalón) (véase la sección
4.4.1). Es interesante darse cuenta que este resultado se mantiene (la posición
del motor alcanzará a la posición deseada) si se usa cualquiera de los siguien-
tes controladores (véanse los capı́tulos 5 y 10): a) un controlador PD (figura
210 4 Criterios de estabilidad y error

4.18), b) un controlador proporcional de posición con realimentación de velo-


cidad (figura 4.19), o c) o un compensador de adelanto (figura 4.20). Aunque
con cualquiera de estos controladores, el requisito de un error cero en estado
estacionario es satisfecho automáticamente por las propiedades matemáticas
del modelo del motor (el polo en el origen con el que cuenta), sin embargo el
propósito de todos estos controladores es introducir el amortiguamiento y la
rapidez de respuesta deseados ası́ como asegurar la estabilidad del sistema en
lazo cerrado. Es importante aclarar que si la estabilidad en lazo cerrado no
es asegurada, entonces tampoco se asegura que el error en estado estacionario
sea cero, a pesar de que el sistema sea de tipo 1.

òd ( s) + I ã(s) k
ò(s)
kp s ( s+a)

Figura 4.17. Control proporcional de posición.

òd(s) + ð ñ Iã(s) ò(s)


kp k
kd s + k d s(s+a)
à

Figura 4.18. Sistema de control proporcional-derivativo de posición.

òd ( s) + I ã(s) ò(s)
+ k
kp s ( s+a)

à à

kv s

Figura 4.19. Control proporcional de posición con realimentación de velocidad.


4.4 Error en estado estacionario 211

òd ( s) + I ã(s) k
ò(s)
í s+d
s+c s ( s+a)
à

Figura 4.20. Control de posición con un compensador de adelanto.

Ejemplo 4.19 ¿Qué sucede en un motor de CD que pueda explicar el porqué,


cuando la referencia es un escalón, un controlador proporcional de velocidad
no puede conseguir un error cero en estado estacionario y, en cambio, sı́ lo
puede conseguir un controlador proporcional de posición?
La respuesta a esta pregunta es la siguiente. Cuando en un sistema de
control proporcional de posición el error es igual a cero (cuando la posición
del motor es igual a la posición deseada) entonces la corriente i∗ = kp (θd − θ)
ordenada al motor es cero, el motor se detiene y, por tanto, la condición
θd = θ puede mantenerse para siempre.
En cambio, en un sistema de control proporcional de velocidad, si la velo-
cidad del motor es igual a la velocidad deseada entonces la corriente ordenada
al motor i∗ = kp (ωd − ω) es cero y el motor se detendrı́a. Esto significa que
la condición ωd = ω no puede mantenerse para siempre y como resultado,
en un sistema de control proporcional de velocidad ésta variable alcanza, en
estado estacionario, un valor constante tal que la diferencia entre ω y ωd sea
suficiente para generar una corriente i∗ = kp (ωd − ω) que mantenga girando
al motor en esa velocidad. Cuando
Rt se utiliza un controlador PI de velocidad
entonces la integral del error 0 (ωd − ω(r))dr es constante cuando ωd = ω y
ese valor constante, multiplicado por la ganancia integral ki es suficiente para
producir una corriente que mantiene girando al motor a la velocidad deseada.
Ejemplo 4.20 Considere un sistema de control de posición de un motor de
CD que cuenta con un controlador PID, es decir, la consigna de corriente
está dada como:
Z t
de
i∗ = kp e + kd + ki e(r)dr, e = θd − θ
dt 0
Usando la transformada de Laplace se obtiene:
E(s)
I ∗ (s) = kp E(s) + kd sE(s) + ki
µ ¶ s
ki
= kp + kd s + E(s)
s
kp ki
s2 + kd s + kd
= kd E(s)
s
De este modo se obtiene el diagrama de bloques mostrado en la figura 4.21.
Nótese que el motor tiene un polo en s = 0 y el controlador tiene otro polo en
212 4 Criterios de estabilidad y error

s = 0, es decir el sistema es tipo 2 porque la función de transferencia de lazo


abierto tiene dos polos en el origen (en s = 0). Esto significa, de acuerdo a
las secciones 4.4.1 y 4.4.2 que la posición alcanzará a la posición deseada θd
si ésta tiene la forma de un escalón o de una rampa. En cambio, el error en
estado estacionario será diferente de cero y constante si la posición deseada
tiene la forma de una parábola (véase la sección 4.4.3).

ò d(s) + kp
s 2+k s+k i
k I ã(s) ò(s)
d d k
kd s s(s+a)
à

Figura 4.21. Sistema de control PID de posición.

Xd (s) s+ b + + k ú X(s)
Ax í s+ c
ï ë
s ( s+ a ) ï
s2
+ 1 2
à à à

ký s Aò

Figura 4.22. Control de un sistema ball and beam.

Por otro lado, considere el sistema mostrado en la figura 4.22. Se trata del
sistema de control de posición de un sistema ball and beam (véase el capı́tulo
12). Nótese que la función de transferencia de lazo abierto cuenta con dos
polos en s = 0. En este caso, estos dos polos de lazo abierto en el origen son
parte del modelo del sistema ball and beam a controlar, es decir, la planta posee
de manera natural dichos polos y no es necesario introducir un controlador
de tipo integral para generarlos. Por tanto, el error en estado estacionario
será igual a cero si la posición deseada xd es un escalón o una rampa, pero si
la referencia es una parábola entonces el error en estado estacionario será una
constante diferente de cero.
Ejemplo 4.21 Suponga que tiene un motor de CD con función de transferen-
cia Gm (s) = Iθ(s) k
∗ (s) = s(s+a) y que se desea que el error en estado estacionario

sea igual a cero cuando la referencia de posición θd sea una parábola. En este
caso se necesita que el sistema sea de tipo 3 y como la planta tiene un polo
4.5 Resumen del capı́tulo 213

en s = 0 es necesario introducir un controlador que tenga dos polos en s = 0.


Por tanto, se propone un controlador de la forma:
Z t Z tZ r
de
i∗ = kp e + kd + ki e(r)dr + kii e(τ )dτ dr, e = θd − θ
dt 0 0 0

el cual se puede escribir como:


kd s3 + kp s2 + ki s + kii
I ∗ (s) = E(s) (4.18)
s2
donde E(s) es la transformada de Laplace del error de posición, lo cual mues-
tra que tiene dos polos en s = 0 y que, por tanto, es útil para resolver el
problema en cuestión. Nótese que además de introducir el término de la in-
tegral doble, con ganancia kii , también se ha incluido el término de una in-
tegral sencilla con ganancia ki . Esto se hace para mejorar la estabilidad en
lazo cerrado. Si no se introduce el término de la integral sencilla entonces se
obtendrán pobres desempeños en la respuesta transitoria o incluso se puede
producir inestabilidad. Como regla general, si el controlador ha de introducir
una integral iterada de orden k entonces se deberán incluir también términos
que incluyan todas las integrales iteradas de orden 1 hasta k−1. Esto con el fin
de mejorar la respuesta transitoria y asegurar la estabilidad en lazo cerrado.

4.5. Resumen del capı́tulo


En este capı́tulo se han presentado las herramientas preliminares básicas
para el análisis y diseño de sistemas de control de orden arbitrario. Primero se
debe entender que la respuesta de cualquier sistema de control en lazo cerra-
do, por complejo que sea, está determinada por la función de transferencia
equivalente en lazo cerrado.
La representación de un sistema de control mediante diagramas de bloques
y su correspondiente simplificación son fundamentales para obtener la función
de transferencia de lazo cerrado. A partir de esta función de transferencia se
puede determinar i) la estabilidad en lazo cerrado y la respuesta transitoria
(polos de la función de transferencia de lazo cerrado), y ii) la respuesta en
estado estacionario (o valor final).
En el capı́tulo 3 se explica que para que una función de transferencia sea
estable es necesario y suficiente que todos sus polos tengan parte real negativa.
Sin embargo, el verificar esta condición mediante el cálculo exacto de dichos
polos es un problema complejo. Esto es particularmente cierto cuando el valor
de los coeficientes del polinomio no se conocen numéricamente. Esta situación
es frecuente en el diseño de sistemas de control ya que los coeficientes del poli-
nomio caracterı́stico dependen de las ganancias del controlador las cuales aún
no se conocen. Más aún, es deseable que las ganancias del controlador puedan
seleccionarse dentro de un rango de valores con el fin de hacer flexible el di-
seño del sistema de control. Estas caracterı́sticas requieren el uso de técnicas
214 4 Criterios de estabilidad y error

analı́ticas (y no numéricas) para determinar cuándo el sistema de control en


lazo cerrado es estable. Este hecho representa un grave problema porque las
fórmulas analı́ticas para determinar las raı́ces de polinomios de grado superior
son complejas. Más aún, no existe solución analı́tica para polinomios de grado
quinto o mayor. Esta problemática es resuelta, finalmente, usando el crite-
rio de estabilidad de Routh el cual, debe recordarse, simplemente representa
una herramienta para verificar si todas las raı́ces del polinomio caracterı́stico
tienen sus partes reales negativas. Por otro lado, la regla de los signos para
determinar la ubicación de las raı́ces de un polinomio, vista en la sección 4.2,
es un método que tiene sus limitaciones. Sin embargo, al ser mucho más simple
que el criterio de Routh puede tener algunas ventajas en ciertas aplicaciones
y por eso también se ha presentado en este capı́tulo.
El estudio del error en estado estacionario que se ha presentado en este
capı́tulo, establece criterios para seleccionar el controlador más conveniente
a fin de conseguir que la respuesta en estado estacionario alcance al valor
deseado. Dicho de otro modo, para que la respuesta forzada sea igual, o muy
cercana, a la entrada del sistema en lazo cerrado o valor deseado a la salida.
Finalmente, la selección del controlador también debe hacerse de modo que se
consiga la respuesta transitoria deseada, a partir de una adecuada ubicación
de los polos de lazo cerrado. La solución de este problema se presenta en el
capı́tulo siguiente.

4.6. Preguntas de repaso

1. ¿Qué es el tipo de un sistema en lazo cerrado?


2. ¿Cómo se puede aumentar el tipo de un sistema de control?
3. ¿Cuál es la relación entre el criterio de estabilidad de Routh y el requeri-
miento de que todas las raı́ces del polinomio caracterı́stico tengan parte
real negativa?
4. ¿Para qué sirve y cuál es la principal desventaja de la regla de los signos
vista en la sección 4.2?
5. Suponga que de acuerdo al estudio del error en estado estacionario se con-
cluye que el valor final de la salida alcanzará el valor deseado ¿Por qué es
necesario que el sistema sea estable para que esto sea completamente cier-
to?
6. Suponga que para conseguir un error en estado estacionario igual a cero
necesita usar un controlador que incluya una integral quı́ntuple (5 inte-
grales anidadas) ¿Por qué debe incluir también las integrales cuádruple
(4 integrales anidadas), triple y doble? ¿También debe incluir la integral
sencilla? ¿Por qué? Justifique su respuesta usando un motor de CD como
planta y usando el criterio de Routh.
7. ¿Qué relación existe entre el estudio del error en estado estacionario, pre-
sentado en este capı́tulo, y el objetivo de conseguir que la respuesta for-
4.7 Ejercicios propuestos 215

zada alcance a la entrada del sistema en lazo cerrado (o valor deseado a


la salida)?
8. Considere el tanque que contiene agua estudiado en el ejemplo 3.2 del
capı́tulo 3. ¿Por qué un controlador proporcional de nivel no consigue un
error en estado estacionario igual a cero, pero un controlador proporcional-
integral sı́ puede conseguirlo? Justifique su respuesta también desde el
punto de vista de la fı́sica del sistema: ¿Qué pasa con el flujo de entrada
cuando el nivel es igual al nivel deseado?
9. ¿Qué cuidado debe tener al aplicar el criterio de Routh a polinomios con
raı́ces repetidas con parte real cero?
10. El estudio del error en estado estacionario que se ha presentado sólo consi-
dera valores deseados a la salida tipo escalón, rampa y parábola ¿Qué su-
cede en aplicaciones como la del cañón antiaéreo (capı́tulo 1) donde no se
conoce de manera exacta cuál es la salida deseada?

4.7. Ejercicios propuestos


1. En base al conocimiento del tipo que debe tener un sistema para asegurar
un error en estado estacionario igual a cero para referencias escalón, ram-
pa y parábola, demuestre que la función de transferencia de lazo cerrado
correspondiente (véase la figura 4.10) debe tener las siguientes caracterı́sti-
cas:
Los términos independientes de s, en el numerador y en el denomina-
dor, deben ser iguales para conseguir un error cero en estado estacio-
nario ante una referencia tipo escalón.
Los términos independientes de s ası́ como los de primer orden en s,
tanto en el numerador como en el denominador, deben ser iguales para
conseguir un error cero en estado estacionario ante una referencia tipo
rampa.
Los términos independientes de s ası́ como los de primer orden y los de
segundo orden en s, en el numerador y en el denominador, deben ser
iguales para conseguir un error cero en estado estacionario ante una
referencia tipo parábola.
Nótese que esto significa que el controlador también debe asignar conve-
nientemente los ceros de la función de transferencia, lo cual respalda los
argumentos presentados en el ejemplo 4.21 (véase (4.18)).
2. En los ejemplos 3.17 y 3.18 del capı́tulo 3 se presentan explicaciones
basadas en la experiencia cotidiana para entender porqué el control
proporcional-integral (expresión en (3.97)) de nivel de agua y el control
proporcional de un sistema masa-amortiguador consiguen que h → hd y
x → xd cuando t → ∞ y hd y xd son constantes. Ahora revise esos ejem-
plos y explique esos resultados a partir del conocimiento del tipo de dichos
sistemas de control.
216 4 Criterios de estabilidad y error

3. Considere el sistema masa-resorte-amortiguador presentado en el ejemplo


3.6 del capı́tulo 3. Si se aplica una fuerza constante de valor A y la masa
alcanza el reposo, es decir ẋ = 0 y ẍ = 0, entonces sustituyendo esto
directamente en la ecuación diferencial correspondiente se obtiene que la
A
posición que alcanza la masa es x = K . Ahora utilice el teorema del valor
final para calcular el valor final de x cuando f = A. ¿Qué relación existe
entre las condiciones ẋ = 0 y ẍ = 0 y el requisito s → 0 del teorema del
valor final?
4. Considere el sistema masa-resorte-amortiguador rotativo:

J θ̈ + f θ̇ + Kθ = T

donde J es la inercia, f es el coeficiente de fricción viscosa, K es la cons-


tante de rigidez del resorte, θ es la posición angular del cuerpo y T es el
par aplicado el cual está dado como el siguiente controlador PID:
Z t
de
T = kp e + kd + ki e(r)dr, e = θd − θ
dt 0

Use el criterio de Routh para demostrar que las siguientes condiciones:


f + kd ki
J > 0 ki > 0, K + kp > 0, > >0
J K + kp
aseguran la estabilidad en lazo cerrado. Nótese que una ganancia integral
ki grande tiende a producir inestabilidad y que este efecto puede ser com-
pensado usando valores grandes de kp y de kd . También puede observarse
que una inercia J pequeña permite el uso de ganancias integrales más
grandes antes de que aparezca la inestabilidad y que lo mismo ocurre si la
constante de rigidez K es grande. ¿Puede encontrar una explicación desde
el punto de vista de la mecánica (fı́sica) para este fenómeno?
5. Procediendo como en el ejemplo 4.3 de este capı́tulo, demuestre que la
función de transferencia del sistema de lazo cerrado mostrado en la figura
4.3 es:
C(s) G(s)
M (s) = =
R(s) 1 − G(s)H(s)
cuando el sistema tiene realimentación positiva, es decir, cuando el tra-
yecto de realimentación se suma (en lugar de restarse) en la figura 4.3.
6. Considere el sistema mecánico mostrado en la figura 4.23. En el ejemplo
2.4 del capı́tulo 2 se encontró que el modelo matemático correspondiente
está dado como:
d2 xm1 b1 dxm1 K 1
+ + (xm1 − xm2 ) = F (t)
dt2 m1 dt m1 m1
d2 xm2 b2 dxm2 K
2
+ − (xm1 − xm2 ) = 0
dt m2 dt m2
4.7 Ejercicios propuestos 217

donde xm1 es la posición de m1 y xm2 es la posición de m2 . Aplique la


transformada de Laplace a cada una de las expresiones anteriores para ex-
presar Xm1 (s) y Xm2 (s) como las salidas de dos funciones de transferencia.
Obtenga el diagrama de bloques correspondiente conectando conveniente-
mente estas dos funciones de transferencia de acuerdo a las entradas que
cada una de ellas tiene. Usando el resultado del ejercicio previo, reduzca
este diagrama de bloques para comprobar que:

G1 (s)G2 (s)/m1
Xm2 (s) = F (s)
1 − G1 (s)G2 (s)K/m1

donde F (s) es la transformada de Laplace de F (t) y:


1
G1 (s) = b1 K
s2 + m1 s + m1
K
m2
G2 (s) = b2 K
s2 + m2 s + m2

Usando este resultado compruebe que la función de transferencia


Xm2 (s)
F (s) tiene un polo en s = 0 ¿Qué significa esto? Para ello suponga
que se aplica una fuerza constante F (t) en el tiempo ¿Qué pasa con
la posición de la masa m2 bajo el efecto de esta fuerza? ¿Y que pa-
sará con la posición de la masa m1 ? Para esto encuentre la función de
transferencia existente entre Xm1 (s) y Xm2 (s).
Use el criterio de Routh para encontrar las condiciones bajo las cuales
la función de transferencia XFm2(s)(s) no es inestable.
Nótese que se puede proceder del mismo modo con los otros ejemplos del
capı́tulo 2 que también incluyen resortes.

F (t)
K
m1 m2

b1 b2

Figura 4.23. Dos cuerpos unidos por un resorte.

Al final del capı́tulo 5 se proponen otros ejercicios cuya solución involucra


el uso de los conceptos estudiados en el presente capı́tulo.
Referencias

1. S. Bennett, A brief history of automatic control, IEEE Control Systems Maga-


zine, pp. 17-25, June 1996.
2. K. Ogata, Ingenierı́a de Control Moderna, 4a. edición, Pearson Prentice-Hall,
Madrid, 2003.
3. N.S. Nise, Sistemas de control para ingenierı́a, 1a. edición en español, 1a. Re-
impresión, CECSA, México, 2004.
4. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edición, Pearson
Prentice-Hall, Madrid, 2008.
5. B.C. Kuo, Sistemas de control automático, 7a. edición, Prentice-Hall Hispanoa-
mericana, México, 1995.
6. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edición en
español, McGraw-Hill, México, 1992.
5
Diseño usando la respuesta en el tiempo

La herramienta más importante para diseñar sistemas de control usando la


respuesta en el tiempo es el método del lugar de las raı́ces propuesto por W.R.
Evans entre 1948 y 1950. El propio Evans dijo que la motivación especı́fica que
recibió para desarrollar el método del lugar de las raı́ces vino de una pregunta
que le planteó un alumno durante un curso que impartı́a en North American
Aviation. De hecho, los primeros en usar el método fueron los diseñadores de
North American Aviation.
222 5 Diseño usando la respuesta en el tiempo

Objetivos del capı́tulo

Entender que significa “lugar de las raı́ces”.


Aprender a dibujar el lugar de las raı́ces.
Analizar y diseñar sistemas de control usando el método del lugar de las
raı́ces.
Considere el sistema en lazo cerrado mostrado en la figura 5.1. En el ejem-
plo 4.3 de la sección 4.1 se muestra que la función de transferencia del sistema
en lazo cerrado está dada como:
C(s) G(s)
M (s) = = (5.1)
R(s) 1 + G(s)H(s)
En el capı́tulo 3 se explica que la respuesta en el tiempo c(t) = L−1 {C(s)} =

R(s) + C(s)
G(s)
à

H(s)

Figura 5.1. Sistema en lazo cerrado.

L−1 {M (s)R(s)} está dada como la suma de la respuesta natural y de la


respuesta forzada: c(t) = cn (t) + cf (t). Los objetivos del sistema de control en
la figura 5.1 son:
Que el sistema de control en lazo cerrado sea estable, es decir que
lı́mt→∞ cn (t) = 0, lo cual se asegura si todos los polos de la función de
transferencia de lazo cerrado M (s) tienen parte real menor que cero. Esto
es importante porque consigue que conforme el tiempo crece la respuesta
del sistema c(t) converge a la respuesta forzada cf (t).
Que la convergencia cn (t) → 0 sea conseguida rápidamente.
Que la respuesta forzada sea igual a la salida deseada cf (t) = r(t) =
L−1 {R(s)}.
El último punto constituye las caracterı́sticas de respuesta en estado estacio-
nario y la manera de asegurar que el sistema en lazo cerrado responde con las
caracterı́sticas deseadas se estudia en la sección 4.4. El segundo punto cons-
tituye las caracterı́sticas de respuesta transitoria deseadas y en este capı́tulo
se estudia la manera de diseñar un controlador que asegure que el sistema en
lazo cerrado responda con las caracterı́sticas deseadas. Debe subrayarse que al
asegurar que se obtienen las caracterı́sticas deseadas de respuesta transitoria
también se debe asegurar la estabilidad del sistema en lazo cerrado.
5.1 Diseño con el lugar de las raı́ces 223

El problema de diseñar un controlador consiste en asignar conveniente-


mente los polos 1 + G(s)H(s) = 0 y los ceros G(s) = 0 de la función de
transferencia de lazo cerrado M (s). En control clásico los polos y los ceros de
la planta siempre se consideran conocidos y la estructura del controlador se
propone como algo conocido (para satisfacer las caracterı́sticas de respuesta
en estado estacionario, por ejemplo). Sin embargo la ubicación exacta de los
polos y los ceros del controlador debe ser seleccionada de modo que se asegure
que los polos de lazo cerrado 1 + G(s)H(s) = 0 estén colocados en los valores
deseados y que los ceros de lazo cerrado G(s) = 0 estén colocados convenien-
temente. En este capı́tulo se presenta una de las herramientas principales de
control clásico para resolver este problema: el método del lugar de las raı́ces.
Este método determina la ubicación de los polos de la función de transferencia
de lazo cerrado M (s) a partir del estudio de la función de transferencia de
lazo abierto G(s)H(s). Además, es posible ubicar los ceros de la función de
transferencia de lazo cerrado M (s) de modo que su efecto sobre la respuesta
del sistema en lazo cerrado sea pequeño.

5.1. Diseño con el lugar de las raı́ces. Caracterı́sticas


deseadas de la respuesta transitoria

Suponiendo que los polos y los ceros de la planta se conocen, el método del
lugar de las raı́ces es una herramienta gráfica que es útil para determinar cuales
serán los polos de lazo cerrado si se usa un controlador que contiene ciertos
polos y ceros que se proponen o que se deben calcular. Por otro lado, también
es posible utilizar el lugar de las raı́ces para conseguir que uno o varios ceros de
lazo cerrado se cancelen con uno o varios polos de lazo cerrado. De acuerdo a la
sección 3.9.1 esto permite reducir el orden del sistema y eliminar la presencia
de ceros de manera que la respuesta transitoria del sistema en lazo cerrado
puede ser aproximada por uno de los casos sencillos estudiados en las secciones
3.1 y 3.3. Estas caracterı́sticas facilitan la tarea de diseñar el controlador de
manera que la función de transferencia de lazo cerrado M (s) tenga los polos
y los ceros que aseguren las caracterı́sticas deseadas de respuesta transitoria.
El lugar de las raı́ces está representado por varias curvas cuyos puntos cons-
tituyen los polos del sistema de lazo cerrado obtenidos conforme un parámetro,
k, es variado desde k = 0 hasta k = +∞. De acuerdo a (5.1), todo punto s
que sea un polo de lazo cerrado (y que, por tanto, pertenezca al lugar de las
raı́ces) debe cumplir 1 + G(s)H(s) = 0. El lugar de las raı́ces se construye
proponiendo puntos s en el plano complejo s, los cuales deben ser verificados
si satisfacen la condición para ser polos de lazo cerrado: 1 + G(s)H(s) = 0.
Para verificar esta condición de una manera sencilla se propone un conjunto
de reglas que se listan a continuación. Estas reglas dan lugar a la construcción
gráfica del lugar de las raı́ces el cual se dibuja a partir de los polos y los ceros
de la función de transferencia de lazo abierto G(s)H(s). Esto significa que los
224 5 Diseño usando la respuesta en el tiempo

polos de lazo cerrado serán determinados a partir de los polos y los ceros de
lazo abierto.
La función de transferencia de lazo abierto se puede escribir como:
Qm
j=1 (s − zj )
G(s)H(s) = k Qn , n>m (5.2)
i=1 (s − pi )

donde zj , j = 1, . . . , m, son los ceros de lazo abierto y pi , i = 1, . . . , n, son


los polos de lazo abierto. Siendo zj , pi y s números complejos, en general,
ubicados en el plano s se puede escribir:

s − zj = lj ∠θj
s − pi = li ∠θi

como se ilustra en la figura 5.2. Entonces:

Im (s)
s

zj

lj li
pi

òi
òj
zj pi Re (s)

Figura 5.2. Representación gráfica de los factores s − zj y s − pi .

Qm Qm  
Xm Xn
j=1 l j ∠θ j j=1 l j
G(s)H(s) = k Qn = k Qn ∠ θj − θi  (5.3)
i=1 li ∠θi i=1 li j=1 i=1

Por otro lado, los valores de s que satisfacen lo siguiente son los polos de lazo
cerrado:

1 + G(s)H(s) = 0 (5.4)

Esto significa que los polos de lazo cerrado son los valores de s que satisfacen:

G(s)H(s) = −1 = 1∠ ± (2q + 1)180◦ , q = 0, 1, 2, . . . (5.5)

Usando (5.3) y (5.5) se obtiene la condición de magnitud (5.6) y la condición


de ángulo (5.7) que debe satisfacer todo s que sea polo de lazo cerrado y que,
por tanto, pertenezca al lugar de las raı́ces:
5.1 Diseño con el lugar de las raı́ces 225
Qm
j=1 lj
k Qn =1 (5.6)
i=1 li
m
X Xn
θj − θi = ±(2q + 1)180◦ , q = 0, 1, 2, . . . (5.7)
j=1 i=1

A partir de estas condiciones se obtienen las siguientes reglas.

5.1.1. Reglas para construir el lugar de las raı́ces.

1. El lugar de las raı́ces empieza (k = 0) en los polos de lazo abierto.


Usando (5.2) y (5.4):
Qm
j=1 (s − zj )
1 + G(s)H(s) = 1 + k Qn =0
i=1 (s − pi )
Qn Qm
i=1 (s − pi ) + k j=1 (s − zj )
= Qn =0
i=1 (s − p i)
n
Y Ym
= (s − pi ) + k (s − zj ) = 0 (5.8)
i=1 j=1
Yn
= (s − pi ) = 0
i=1

si k = 0. Lo que significa que los polos de lazo cerrado (los que satisfacen
1 + G(s)H(s) = 0) son idénticos a los polos de lazo abierto (s = pi ,
i = 1, . . . , n).
2. El lugar de las raı́ces termina (k → ∞) en los ceros de lazo
abierto.
Partiendo de (5.8):
n
Y m
Y
1 + G(s)H(s) = (s − pi ) + k (s − zj ) = 0
i=1 j=1
m
Y
≈k (s − zj ) = 0
j=1
Qn Qm
porque i=1 (s − pi ) ≪ k j=1 (s − zj ) si k → ∞. Lo que significa que los
polos de lazo cerrado (los que satisfacen 1 + G(s)H(s) = 0) son idénticos
a los ceros de lazo abierto (s = zj , j = 1, . . . , m).
3. Cuando k → ∞ hay n−m ramas del lugar de las raı́ces que tienden
hacia algún punto en el infinito del plano s. Esto significa que
la función de transferencia de lazo abierto G(s)H(s) tiene n − m
ceros en el infinito.
Estas ramas pueden ser identificadas mediante la inclinación de la linea
226 5 Diseño usando la respuesta en el tiempo

recta a la que cada una de dichas ramas tiende asintóticamente conforme


k → ∞. El ángulo que cada ası́ntota forma con el eje real positivo se
puede calcular como:
±180◦ (2q + 1)
ángulo de la ası́ntota = , q = 0, 1, 2, . . . (5.9)
n−m
Esta fórmula se puede obtener del siguiente modo. Cuando se considera un

asíntota
Im (s) s

ò
polos y ceros Re (s)
de lazo abierto

Figura 5.3. Polos y ceros de lazo abierto para determinar las ası́ntotas de la regla
3.

punto s que se encuentra muy lejos del origen sobre una ası́ntota, todos
los polos y todos los ceros de G(s)H(s), o de lazo abierto, se observan
todos reunidos en un punto del plano s, como se muestra en la figura 5.3.
Por tanto, el ángulo con que contribuye cada polo y cada cero de lazo
abierto a la condición en (5.7) (véase la figura 5.3) es idéntico al de los
demás, es decir, representando dicho ángulo por θ la condición de ángulo
(5.7) se puede escribir como:
m
X n
X
θj − θi = (m − n)θ = ±(2q + 1)180◦ , q = 0, 1, 2, . . .
j=1 i=1

Despejando θ de esta expresión se obtiene:


±(2q + 1)180◦
θ= , q = 0, 1, 2, . . .
n−m
lo cual se convierte en (5.9) al hacer θ =ángulo de la ası́ntota (véase la
figura 5.3).
4. El punto σa donde las ası́ntotas intersectan el eje real se calcula
como [5], Cap. 6:
P P
i pi − j zj
σa =
n−m
5.1 Diseño con el lugar de las raı́ces 227

5. Considere un punto sobre el eje real del plano s. Suponga que a


la derecha de dicho punto existe un número de polos (No. po-
losD) y de ceros (No. cerosD) reales que al ser sumados (N =No.
polosD+No. cerosD) dan un número impar N . Entonces dicho
punto sobre el eje real forma parte del lugar de las raı́ces. En
caso contrario tal punto no pertenece al lugar de las raı́ces.
Observe la figura 5.4 y considere la condición de ángulo (5.7). Nótese que
dos polos o dos ceros complejos conjugados producen ángulos que al su-
marse son iguales a 0 o a 360◦ por lo que no tienen contribución en la
condición de ángulo (5.7). Esto significa que, en este caso, en la expre-
sión (5.7) sólo se deben considerar los polos y ceros reales. Por otro lado,
nótese que todo polo y cero real que se encuentre colocado a la izquierda
del punto de prueba s contribuye con un ángulo cero. Esto significa que
en la expresión (5.7) sólo se deben considerar los polos y ceros reales que
se encuentren a la derecha del punto de prueba s. Nótese que cada cero
real a la derecha del punto s contribuye con un ángulo de +180◦ y cada
polo a la derecha del mismo punto contribuye con un ángulo de −180◦ .
Por tanto, en ángulo total con el que contribuyen todos los polos y ceros
que están a la derecha del punto de prueba es:
m
X n
X
θj − θi = No.cerosD × (+180◦ ) + No.polosD × (−180◦ )
j=1 i=1

Por otro lado, si la resta de dos números es un número impar entonces

Im (s)

òj

òi 180 î 180 î
î î s
0 0
Re (s)
ò 0i ò 0j

Figura 5.4. Polos y ceros de lazo abierto para estudiar la regla 5.

la suma de los mismos números es un número impar. Por tanto, si:


m
X n
X
θj − θi = (No.cerosD − No.polosD) × (+180◦ ) = ±(2q + 1)180◦
j=1 i=1
228 5 Diseño usando la respuesta en el tiempo

para algún q = 0, 1, 2, . . ., es decir (No. cerosD−No. polosD) es impar,


entonces también se cumple:
m
X n
X
θj − θj = N × (+180◦ ) = ±(2q + 1)180◦
j=1 i=1

para algún q = 0, 1, 2, . . ., es decir con N =(No. PolosD+No. cerosD)


impar. Nótese que ésta última expresión constituye la condición de ángulo
(5.7) por lo que el punto de prueba s en la figura 5.4 es un polo de lazo
cerrado y forma parte del lugar de las raı́ces.
6. El lugar de las raı́ces es simétrico respecto al eje horizontal.
Esto se entiende fácilmente si se recuerda que todo polo complejo aparece
siempre simultáneamente con su pareja conjugada (véase el último párrafo
de la sección 3.6).
7. El ángulo de salida de un polo complejo se calcula como:
ángulo de salida de
P un polo complejo=
±(2q + 1)180◦ + [ángulos de vectores desde los ceros hacia el polo en
cuestión]
P
− [ángulos de vectores desde los otros polos hacia el polo en cuestión]

(5.10)

La explicación de esta fórmula es como sigue. Considere la figura 5.5. El

s Im (s)
ò pv
pv

òi òj
pi zj
Re (s)

Figura 5.5. Polos y ceros de lazo abierto para estudiar la regla 7.

punto s es un punto que pertenece al lugar de las raı́ces y que está infini-
tesimalmente cercano al polo en el punto pv . El ángulo θpv medido como
el ángulo formado con respecto al eje horizontal positivo por el vector
trazado desde el polo en pv hacia el punto s es igual al ángulo de salida
del polo complejo en pv . La condición de ángulo (5.7) establece que:
m
X n
X
θj − θi =
j=1 i=1
5.1 Diseño con el lugar de las raı́ces 229

= (θz1 + θz2 + · · · + θzm ) − (θp1 + θp2 + · · · + θpv + · · · + θpn )


= ±(2q + 1)180◦ , q = 0, 1, 2, . . .
donde θzj y θpi representan los ángulos debidos a los ceros y a los polos de
lazo abierto, respectivamente (puede considerarse que s = pv ). Despejando
θpv :
θpv = ±(2q + 1)180◦ + (θz1 + θz2 + · · · + θzm ) − (θp1 + θp2 + · · · + θpn )
para q = 0, 1, 2, . . ., que equivale a la fórmula (5.10).
8. El ángulo de llegada a un cero complejo se calcula como:
ángulo de llegadaPa un cero complejo=
±(2q + 1)180◦ − [ángulos de vectores desde los otros ceros hacia el cero
enP cuestión]
+ [ángulos de vectores desde los polos hacia el cero en cuestión]
(5.11)
La explicación de esta fórmula es como sigue. Considere la figura 5.6. El

s Im (s)
ò zv
zv

òi òj
pi zj
Re (s)

Figura 5.6. Polos y ceros de lazo abierto para estudiar la regla 8.

punto s es un punto que pertenece al lugar de las raı́ces y que está infini-
tesimalmente cercano al cero en el punto zv . El ángulo θzv medido como
el ángulo formado con respecto al eje horizontal positivo por el vector
trazado desde el cero en zv hacia el punto s es igual al ángulo de llegada
al cero en zv . La condición de ángulo (5.7) establece que:
m
X n
X
θj − θi =
j=1 i=1
= (θz1 + θz2 + · · · + θzv + · · · + θzm ) − (θp1 + θp2 + · · · + θpn )
= ±(2q + 1)180◦
donde q = 0, 1, 2, . . ., mientras que θzj y θpi representan los ángulos de-
bidos a los ceros y a los polos de lazo abierto, respectivamente (puede
considerarse que s = zv ). Despejando θzv :
230 5 Diseño usando la respuesta en el tiempo

θzv = ±(2q + 1)180◦ − (θz1 + θz2 + · · · + θzm ) + (θp1 + θp2 + · · · + θpn )

para q = 0, 1, 2, . . ., que equivale a la fórmula (5.11).


9. La ganancia de lazo abierto, k, requerida para que un punto s,
perteneciente al lugar de las raı́ces, verdaderamente sea selec-
cionado como un polo de lazo cerrado se calcula de manera que
se satisfaga la condición de magnitud (5.6):
Qn
i=1 li
k = Qm
j=1 lj

10. Los puntos de cruce con el eje imaginario se pueden obtener usando el
criterio de Routh (véase la sección 4.3).

Finalmente dos reglas prácticas:


11. Un polo de lazo abierto (en el semiplano izquierdo) agregado
al lugar de las raı́ces tiende a inestabilizar al sistema en lazo
cerrado. Este efecto inestabilizante es mayor conforme el polo
se coloque cada vez más cerca del origen.
Considere la figura 5.7, donde s representa un punto que pertenece al lugar
de las raı́ces y se está considerando un sistema que en lazo abierto no tiene
ceros y sólo tiene los dos polos mostrados. De acuerdo a la condición de
ángulo (5.7):

−(θp1 + θp2 ) = −180◦

En la figura 5.8 se conservan los polos en p1 y en p2 pero se agrega un

s Im (s)

ò p2 ò p1

p2 p1 Re (s)

Figura 5.7. Un punto perteneciente al lugar de las raı́ces de un sistema con dos
polos en lazo abierto.

tercer polo en p3 . Ahora la condición de ángulo (5.7) se escribe como:


5.1 Diseño con el lugar de las raı́ces 231

Im (s) s

ò p1
ò p2 ò p3

p2 p3 p1 Re (s)

Figura 5.8. El lugar de las raı́ces es empujado hacia la derecha al introducir un


polo adicional de lazo abierto.

−(θp1 + θp2 + θp3 ) = −180◦

Esto significa que la suma θp1 + θp2 debe ser menor en la figura 5.8 que
en la figura 5.7 lo cual se consigue si el punto s en la figura 5.7 se recorre
hacia la derecha como en la figura 5.8, es decir, si el lugar de las raı́ces es
doblado hacia la derecha en la figura 5.8. Es fácil ver que esta desviación
es mayor (el lugar de las raı́ces es empujado cada vez más hacia la zona
de inestabilidad) conforme θp3 es mayor, es decir, conforme p3 es más
cercano al origen. Esto es una muestra de que un controlador integral
tiende a inestabilizar a un sistema en lazo cerrado.
12. Un cero de lazo abierto (en el semiplano izquierdo) agregado al
lugar de las raı́ces tiende a aumentar la estabilidad del sistema
en lazo cerrado. Este efecto estabilizante es mayor conforme el
cero se coloque cada vez más cerca del origen.
Considere de nuevo la figura 5.7. De acuerdo a la condición de ángulo
(5.7):

−(θp1 + θp2 ) = −180◦

En la figura 5.9 se conservan los polos en p1 y en p2 pero se agrega un


cero en z1 . Ahora la condición de ángulo (5.7) se escribe como:

θz1 − (θp1 + θp2 ) = −180◦

Esto significa que la suma θp1 + θp2 debe ser mayor en la figura 5.9 que
en la figura 5.7 lo cual se consigue si el punto s en la figura 5.7 se recorre
hacia la izquierda como en la figura 5.9, es decir, si el lugar de las raı́ces es
doblado hacia la izquierda en la figura 5.9. Es fácil ver que esta desviación
es mayor (el sistema es halado cada vez más hacia la zona de mayor
estabilidad) conforme θz1 es mayor, es decir, conforme z1 es más cercano
232 5 Diseño usando la respuesta en el tiempo

s Im (s)

ò p2 ò z1 ò p1

p2 z1 p1 Re (s)

Figura 5.9. El lugar de las raı́ces es halado hacia la izquierda al introducir un cero
adicional de lazo abierto.

al origen. Esto es una muestra de que el controlador derivativo tiende a


estabilizar a un sistema.

5.2. Ejemplos
5.2.1. Control proporcional de posición

De acuerdo al capı́tulo 10, el siguiente es el modelo de un motor de CD


cuando no existen perturbaciones externas:
k
θ(s) = I ∗ (s) (5.12)
s(s + a)
b nkm
a = > 0, k = >0
J J
donde θ(s) e I ∗ (s) representan la posición (salida) y la consigna de corriente
(entrada), respectivamente. Suponga que se usa el siguiente control propor-
cional de posición:

I ∗ (s) = kp (θd (s) − θ(s))

donde θd (s) es la posición deseada y kp es una constante conocida como la


ganancia proporcional. El sistema en lazo cerrado se puede representar como
en la figura 5.10, de donde se concluye que la función de transferencia en lazo
abierto está dada como:
kp k
G(s)H(s) = (5.13)
s(s + a)
5.2 Ejemplos 233

Nótese que el sistema es tipo 1 por lo que el error en estado estacionario es


cero cuando la posición deseada es un escalón. Por tanto, el único problema
de diseño que resta es seleccionar el valor de kp de manera que los polos de
lazo cerrado estén ubicados en los lugares deseados. A continuación se estudia
este problema usando el método del lugar de las raı́ces. La ganancia kp es

òd(s) + Iã(s) k
ò(s)
kp s(s+a)
à

Figura 5.10. Sistema de control proporcional de posición.

variada por el método para que tome valores desde 0 hasta +∞. Primero se
reescribe G(s)H(s) en la siguiente forma:
kp k
G(s)H(s) = ∠ − (θ1 + θ2 )
l1 l2
donde se han definido los vectores s − 0 = l1 ∠θ1 , s − (−a) = l2 ∠θ2 (véase
la figura 5.11). Las dos condiciones fundamentales que definen el lugar de las
raı́ces son las condiciones de ángulo (5.7) y de magnitud (5.6) las cuales se
expresan, respectivamente, como:

−(θ1 + θ2 ) = ±(2q + 1)180◦ , q = 0, 1, 2, . . .


kp k
=1
l 1 l2
La regla 5 indica que sobre el eje real sólo existe lugar de las raı́ces entre los
puntos s = 0 y s = −a. Además, de acuerdo a la regla 1, el lugar de las raı́ces
inicia (kp = 0) en s = 0 y s = −a. Por otro lado, de acuerdo a las reglas 2 y
3, cuando kp tiende a +∞ las ramas que inician en los puntos s = 0 y s = −a
deben terminar en algún cero de lazo abierto (no existe ninguno en este caso)
o en algún punto en el infinito del plano s. Por tanto, el lugar de las raı́ces
debe alejarse de los puntos s = 0 y s = −a, sobre el eje real, conforme kp
crece de manera que debe existir un punto de separación en algún lugar entre
dichos puntos para luego dirigirse hacia el infinito sobre el plano s.
Por otro lado, de acuerdo a la condición de ángulo, −(θ1 + θ2 ) = −180◦ =
−(α + θ1 ) en la figura 5.11, se concluye que α = θ2 y, por lo que los triángulos
t1 y t2 deben ser idénticos para cualquier polo de lazo cerrado s. Entonces,
las dos ramas mencionadas anteriormente y que son mostradas en la figura
5.11 deben ser paralelas al eje imaginario. Esto significa que el punto donde
las dos ramas se separan del eje real está ubicado en el punto medio entre los
polos ubicados en s = 0, s = −a, es decir en (0 − a)/2 = −a/2. Esto también
234 5 Diseño usando la respuesta en el tiempo

Im (s)
s

ì ì

l2 l1
t1 t2

ò2 ë ò1

àa à a2 0 Re (s)

kp k
Figura 5.11. Lugar de las raı́ces para G(s)H(s) = s(s+a)
.

puede verificarse usando las reglas 3 y 4. Finalmente, de acuerdo a la regla 6


ambas ramas son simétricas respecto al eje horizontal.
La condición de magnitud se usa cuando se necesita conocer el valor exacto
de kp que permita conseguir un punto especı́fico sobre el lugar de las raı́ces.
Nótese, por ejemplo, que al crecer kp hacia +∞ las longitudes l1 y l2 deben
crecer para satisfacer la condición de magnitud
kp k
=1 (5.14)
l1 l2
lo cual significa que los polos de lazo cerrado correspondientes a valores gran-
des de kp tienden a algún punto en el infinito del plano s. Por tanto, se
concluye: i) los dos polos de lazo cerrado son reales, negativos y diferentes
cuando kp > 0 es pequeña y ambos se aproximan al punto s = −a/2; esto
significa que la rapidez del sistema aumenta porque el polo más lento se aleja
del origen, ii) de acuerdo a la condición de magnitud, cuando:

l1 l2 a2 a
kp = = , con l1 = l2 = ,
k 4k 2
los dos polos de lazo cerrado son reales, repetidos, negativos y ubicados en
s = − a2 ; por lo que se alcanza la mayor rapidez sin que haya oscilaciones, iii)
a2
conforme kp > 4k se incrementa los dos polos se alejan del eje real (uno hacia
arriba y el otro hacia abajo) sobre la linea vertical que pasa por s = − a2 ;
esto significa que el sistema es más rápido (porque ωn , la distancia de los
polos al origen, aumenta; véase la sección 3.3) y la respuesta del sistema
5.2 Ejemplos 235

en lazo cerrado (de segundo orden) es cada vez más oscilatoria (porque el
ángulo 90◦ − α disminuye y el amortiguamiento, dado como ζ = sin(90◦ − α),
disminuye; véase la sección 3.3).
Todo lo anterior significa que no es posible conseguir simultáneamente una
respuesta tan rápida y tan amortiguada como se desee. Esto es una consecuen-
cia directa de que los polos de lazo cerrado no pueden ser ubicados en cualquier
lugar del plano s y sólo pueden ser colocados sobre la linea gruesa mostrada
en la figura 5.11. En el siguiente ejemplo se muestra que la introducción de
un cero en la función de transferencia de lazo abierto permite colocar los dos
polos de lazo cerrado en cualquier punto del plano s.

5.2.2. Control proporcional-derivativo (PD) de posición

Considere de nuevo el modelo de un motor de CD mostrado en (5.12), pero


ahora junto con el siguiente controlador proporcional-derivativo:
de
i∗ = kp e + kd , e = θd − θ
dt
donde kp es, como antes, la ganancia proporcional y kd es una constante
conocida como la ganancia derivativa. Usando la transformada de Laplace se
obtiene:

I ∗ (s) = kp E(s) + kd sE(s)


= (kp + kd s)E(s)
µ ¶
kp
= kd s + E(s)
kd
por lo que se obtiene el diagrama de bloques mostrado en la figura 5.12.
Entonces, la función de transferencia de lazo abierto está dada como:
kd k(s + c) kp
G(s)H(s) = , c= >0 (5.15)
s(s + a) kd
Nótese que ahora es kd la ganancia que el método varı́a desde 0 hasta +∞ para

òd(s) + ð ñ Iã(s) ò(s)


kd s + kk pd k
s(s+a)
à

Figura 5.12. Sistema de control proporcional-derivativo de posición.

dibujar el lugar de las raı́ces. Primero se reescribe G(s)H(s) en la siguiente


forma:
236 5 Diseño usando la respuesta en el tiempo

kd k l3
G(s)H(s) = ∠θ3 − (θ1 + θ2 ) (5.16)
l1 l2
donde se han definido los vectores s − 0 = l1 ∠θ1 , s − (−a) = l2 ∠θ2 , s − (−c) =
l3 ∠θ3 . Las condiciones de ángulo y de magnitud se expresan, respectivamente,
como:

θ3 − (θ1 + θ2 ) = ±(2q + 1)180◦ , q = 0, 1, 2, . . .


kd k l3
=1
l1 l2
El lugar de las raı́ces correspondiente a este caso se puede obtener a par-
tir del obtenido para la función de transferencia en (5.13) considerando que
simplemente se ha adicionado un cero en s = −c.
De acuerdo a la regla 12 el cero será la causa para que las dos ramas del
lugar de las raı́ces mostrado en la figura 5.11 se “doblen” hacia la izquierda.
Esto puede comprobarse usando la regla 3 para encontrar que ahora existe una
sola rama del lugar de las raı́ces que tiende hacia una ası́ntota que forma un
ángulo de ±1800 con el eje real positivo. Como se muestra en la figura 5.13 el

Im(s)

àc àa Re(s)

(a) c > a
Im(s)

Re(s)
àa àc

(b) c < a

kd k(s+c)
Figura 5.13. Lugar de las raı́ces para G(s)H(s) = s(s+a)
.

lugar de las raı́ces puede tener dos formas diferentes dependiendo de en dónde
5.2 Ejemplos 237

se coloque el cero en s = −c. Si se coloca a la izquierda del polo en s = −a


(como en la figura 5.13(a)) entonces, de acuerdo a la regla 5, existirá lugar de
las raı́ces sobre dos segmentos del eje real negativo: entre los puntos s = 0 y
s = −a y a la izquierda del cero en s = −c. Además, de acuerdo a las reglas
2 y 3 una de las dos ramas del lugar de las raı́ces que inician (kd = 0) en
los polos de lazo abierto colocados en s = 0 y s = −a debe tender al cero en
s = −c mientras que la otra rama debe tender hacia el infinito del plano s
siguiendo la ası́ntota que forma un ángulo de ±1800 con el eje real positivo. Por
tanto, debe existir un punto de separación entre los puntos s = 0 y s = −a.
Además, como el lugar de las raı́ces es simétrico respecto al eje real (regla
6) entonces después de separarse estas ramas deben formar dos semicı́rculos
hacia la izquierda del punto de separación para volverse a unir sobre el eje
real negativo en un punto a la izquierda del cero en s = −c para que, luego,
una de las ramas se aproxime al cero en s = −c y la otra se vaya hacia el
infinito sobre el eje real negativo.
Por otro lado, si el cero en s = −c se coloca entre los polos de lazo abierto
en s = 0 y s = −a entonces, de acuerdo a la regla 5, existirá lugar de las sobre
los segmentos del eje real negativo colocados entre los puntos s = −c y s = 0
ası́ como a la izquierda del polo en s = −a. Nótese que ahora la rama que
inicia (kd = 0) en s = 0 tiende al cero en s = −c mientras que la rama que
inicia (kd = 0) en s = −a tiende al infinito sobre el eje real negativo. Nótese
también que ésto es posible sin necesidad de que existan ramas fuera del eje
real, como se muestra en la figura 5.13(b).
A partir de este estudio del lugar de las raı́ces, se puede ver que el sistema
en lazo cerrado es estable para cualquier kp > 0 y kd > 0 porque las dos
posibilidades para el lugar de las raı́ces que han sido presentadas en la figura
5.13 muestran que los polos de lazo cerrado siempre están sobre el semipla-
no complejo izquierdo s (polos con parte real negativa). A continuación se
muestra que siempre existen ganancias kp y kd que permiten colocar los polos
de lazo cerrado en cualquier punto sobre el semi plano complejo izquierdo s
que se desee. De acuerdo a (5.1), la función de transferencia de lazo cerrado
está dada como:
θ(s) kd k(s + c)
= 2 (5.17)
θd (s) s + (a + kd k)s + ckd k
es decir, existen dos polos de lazo cerrado, dados por el lugar de las raı́ces, y
un cero en s = −c que es precisamente el cero de lazo abierto que aparece en
los lugares de las raı́ces mostrados en la figura 5.13. Nótese que el polinomio
caracterı́stico en (5.17) tiene la forma estándar:
s2 + 2ζωn s + ωn2 (5.18)
Por esta razón se pueden igualar ambos polinomios para concluir que, igua-
lando coeficientes:
a + kd k
ωn2 = ckd k = kp k, ζ = p (5.19)
2 kp k
238 5 Diseño usando la respuesta en el tiempo
p
polos deseados en lazo cerrado: s = −ζωn ± ωn ζ2 − 1

Esto significa que usando kp y kd se pueden colocar los polos de lazo cerrado en
cualquier punto del semiplano complejo izquierdo s porque se puede asignar
cualquier valor a ζ y a ωn . Por a otro lado, es común ubicar los polos de
lazo cerrado (complejos conjugados) de manera que se consiga el tiempo de
subida tr y el sobre paso Mp ( %) deseados. Para esto, normalmente se usan
las expresiones en (3.59) para encontrar:

abs(ln(Mp ( %)/100))
ζ= q (5.20)
π 2 + ln2 (Mp ( %)/100)
à Ãp !!
1 1 − ζ2
ωd = π − atan
tr ζ
ωd
ωn = p (5.21)
1 − ζ2

Sin embargo, en el caso del control PD de posición que se está estudiando,


la ubicación de los polos de lazo cerrado en los puntos deseados no asegura
que se obtendrá la respuesta transitoria deseada debido a la presencia del cero
colocado en s = −c en la función de transferencia de lazo cerrado presentada
en (5.17). Este problema motiva el ejemplo mostrado a continuación en el cual
se usa un compensador de adelanto para controlar la posición. Sin embargo,
antes de continuar, es conveniente aclarar que a pesar del inconveniente que
se acaba de mencionar para el control PD de posición su uso es muy común
en las aplicaciones. Esto se debe a que la sintonı́a del control PD en este tipo
de aplicaciones no necesita del cálculo exacto de las ganancias, pues éstas se
pueden seleccionar a prueba y error usando la siguiente regla (recuerde que la
función de transferencia en (5.17) es estable si kp > 0 y kd > 0):
Fije kd > 0 en un valor e incremente kp > 0 hasta obtener una respuesta
suficientemente rápida. Esto trae como consecuencia una respuesta muy
oscilatoria porque el amortiguamiento disminuye al incrementar kp (véase
(5.19)). En ese momento continúe con el siguiente paso.
Mantenga kp > 0 en el último valor obtenido en el paso anterior y em-
piece a incrementar kd > 0 hasta obtener una respuesta suficientemente
amortiguada. Esto, sin embargo, reduce la rapidez de la respuesta porque
el amortiguamiento aumenta. Ası́ que mantenga el último valor de kd , re-
grese al punto anterior y repita el procedimiento hasta tener la rapidez y
el sobre paso (amortiguamiento) deseados.

5.2.3. Control de posición usando un compensador de adelanto

Considere de nuevo el modelo de un motor de CD mostrado en (5.12), pero


ahora junto con el siguiente controlador:
5.2 Ejemplos 239

s+d
I ∗ (s) = γ , c > d > 0, γ>0
s+c
el cual se conoce como compensador de adelanto porque c > d. Esta condi-
ción (c > d) se introduce cuando se quiere aumentar el amortiguamiento del
sistema, es decir, cuando los polos de lazo cerrado deben ser recorridos hacia
la izquierda del semi plano complejo izquierdo (véanse las reglas 11 y 12). El
diagrama de bloques en lazo cerrado se muestra en la figura 5.14. La función
de transferencia de lazo abierto está dada como:

òd ( s) + s+d
I ã(s) k
ò(s)
í s+c s ( s+a)
à

Figura 5.14. Control de posición con una red de adelanto.

k(s + d)
G(s)H(s) = γ (5.22)
s(s + a)(s + c)

Si el valor de d se propone tal que:

d=a (5.23)

entonces la función de transferencia en lazo cerrado es:


θ(s) γk ωn2
= 2 = 2
θd (s) s + cs + γk s + 2ζωn s + ωn2

lo que significa que:

ωn2
c = 2ζωn , γ= (5.24)
k
Ası́ que si se usan las expresiones en (5.20) y (5.21) para calcular ζ y ωn de
manera que se consiga el tiempo de subida y el sobre paso deseados, entonces
(5.23) y (5.24) representan una regla de sintonı́a muy simple. En la figura 5.15
se muestra que cuando d = a el lugar de las raı́ces es muy similar al obtenido
en la sección 5.2.1 porque, al cancelarse el polo en s = −a y el cero en s = −d,
la función de transferencia de lazo abierto se reduce a:
γk
G(s)H(s) =
s(s + c)
240 5 Diseño usando la respuesta en el tiempo

Im(s)

àd
à c2 àa Re(s)
àc

Figura 5.15. Lugar de las raı́ces para G(s)H(s) en (5.22) cuando d = a.

que es idéntica a la función de transferencia en (5.13) intercambiando kp por


γ y a por c. La diferencia radica en que, en el presente caso, al seleccionar c
de acuerdo a (5.24) se asegura que el lugar de las raı́ces pasará por los puntos
deseados del semiplano izquierdo complejo s:
p p
s1 = −ζωn + jωn 1 − ζ 2 , s2 = −ζωn − jωn 1 − ζ 2
cuando, de acuerdo a la condición de magnitud (véase (5.14) y la figura 5.11
con c en lugar de a y γ en lugar de kp ):
γk ωn2
= 1, l1 = l2 = |s1 | = |s2 | = ωn ⇒ γ=
l1 l2 k
Por tanto, si d = a no es necesario dibujar el lugar de las raı́ces. A continuación
se obtiene el lugar de las raı́ces para el caso en que d 6= a, con el fin de entender
que sucederı́a en tal caso. Por tanto, considérese la función de transferencia
de lazo abierto presentada en (5.22). La constante γ es la ganancia que el
método varı́a desde 0 hasta +∞ para dibujar el lugar de las raı́ces. Nótese
que, de acuerdo a (5.1) y la figura 5.14, la función de transferencia de lazo
cerrado tiene la forma:
θ(s) γ k(s + d)
= (5.25)
θd (s) (s − e)(s − g)(s − h)
donde e, g y h representan las ubicaciones de los tres polos de lazo cerrado.
Primero se reescribe G(s)H(s) en la siguiente forma:
γ k l3
G(s)H(s) = ∠[θ3 − (θ1 + θ2 + θ4 )] (5.26)
l1 l2 l4
donde se han definido los vectores s − 0 = l1 ∠θ1 , s − (−a) = l2 ∠θ2 , s − (−d) =
l3 ∠θ3 , s − (−c) = l4 ∠θ4 . Las condiciones de ángulo (5.7) y de magnitud (5.6)
se expresan, respectivamente, como:
5.2 Ejemplos 241

θ3 − (θ1 + θ2 + θ4 ) = ±(2q + 1)180◦ , q = 0, 1, 2, . . . (5.27)


γ k l3
=1 (5.28)
l1 l2 l4
Nótese que ahora se tiene n = 3, m = 1, p1 = 0, p2 = −a, p3 = −c, z1 = −d.
De acuerdo a las reglas 1, 2 y 3, una de las tres ramas que inician (γ = 0)
en los puntos s = 0, s = −a, s = −c (polos de lazo abierto) debe terminar
(γ = +∞) en el cero de lazo abierto colocado en s = −d. Por tanto, existirán
dos ramas del lugar de las raı́ces que tienden a algún punto del infinito sobre el
plano s. De acuerdo a la regla 3, los ángulos de las ası́ntotas a las que tienden
estas ramas son:
±180◦ (2 × 0 + 1) ±180◦ (2 × 0 + 1)
= = ±90◦
n−m 3−1
Además, de acuerdo a la regla 4 la intersección de estas ası́ntotas con el eje
real puede ser ajustada usando el cero en s = −d y el polo en s = −c:
p1 + p2 + p3 − (−d) 0−a−c+d
σa = = (5.29)
n−m 2
Como c y d deben ser positivas por motivos de estabilidad entonces las ası́nto-
tas se mueven hacia la izquierda (mayor estabilidad) conforme el cero es ubi-
cado más cerca del origen (d → 0) y/o el polo en −c es movido hacia la
izquierda. Esto significa que los polos de lazo cerrado se pueden ubicar del si-
guiente modo: e y g complejos conjugados, mientras que h se selecciona como
real y cercano al cero colocado en s = −d. De este modo, el polo y el cero
tienden a disminuir sus efectos sobre la respuesta transitoria del sistema en
lazo cerrado, la cual tiende a ser parecida a la de una función de transferencia
con la forma:
θ(s) eg
= (5.30)
θd (s) (s − e)(s − g)
es decir, la forma estándar de segundo orden (5.18) para que el tiempo de
subida y el sobre paso puedan ser calculados a partir de los valores e y g usando
(3.59) o (5.20) y (5.21). Nótese, sin embargo, que esto sólo será completamente
cierto si d = a.
De acuerdo a la regla 5 existe lugar de las raı́ces sobre dos segmentos
del eje real porque se tienen cuatro polos y ceros reales de lazo abierto. La
ubicación de dichos segmentos sobre el eje real dependen del valor de d usado,
como se muestra en las figuras 5.16(a) y 5.16(b). Sin embargo, nótese que en
cualquiera de estos casos existe un polo de lazo cerrado que se aproxima al
cero en s = −d conforme γ crece, lo cual es una caracterı́stica deseable para
conseguir (5.30) y que ocurre cuando d = a.

5.2.4. Control proporcional-integral (PI) de velocidad


De acuerdo al capı́tulo 9, el siguiente es el modelo de un motor de CD
cuando la salida a controlar es la velocidad ω(s):
242 5 Diseño usando la respuesta en el tiempo

Im(s)

àc àa Re(s)
àd

(a) a > d

Im(s)

àc àd àa Re(s)

(b) a < d

Figura 5.16. Lugares de las raı́ces para G(s)H(s) en (5.22).

1 1
ω(s) = [kI ∗ (s) − Tp (s)]
s+a J
b nkm
a = > 0, k = >0
J J
donde la consigna de corriente I ∗ (s) es la entrada y Tp (s) es una perturbación
externa de par. Se propone diseñar un controlador PI de velocidad, es decir,
se escoge:
Z t
i∗ = kp e + ki e(r)dr, e = ωd − ω
0
5.2 Ejemplos 243

donde ωd es la velocidad deseada, kp es la ganancia proporcional y la constante


ki es conocida como la ganancia integral. Usando la transformada de Laplace:

E(s)
I ∗ (s) = kp E(s) + ki
µ ¶ s
ki
= kp + E(s)
s
µ ¶
kp s + ki
= E(s)
s
à !
s + kkpi
= kp E(s)
s

Por tanto, en lazo cerrado se obtiene el diagrama de bloques mostrado en la


figura 5.17(a). Como este sistema tiene dos entradas, se puede hacer uso del
principio de superposición (véase la sección 3.10) para escribir:

ω(s) = G1 (s)ωd (s) + G2 (s)Tp (s)

donde G1 (s) es la función de transferencia usando ωd (s) como la entrada y


ω(s) como la salida cuando Tp (s) = 0, es decir, cuando se usa el diagrama de
bloques de la figura 5.17(b), mientras que G2 (s) es la función de transferencia
usando Tp (s) como la entrada y ω(s) como la salida cuando ωd (s) = 0, es
decir, cuando se usa el diagrama de bloques de la figura 5.17(c). Es importante
subrayar que cuando Tp (s) es la entrada entonces ω(s) representa la desviación
de la velocidad (respecto de ωd (s)) producida por la perturbación.
A continuación se estudia el problema de seleccionar las ganancias del
controlador PI de manera que la respuesta en lazo cerrado tenga las carac-
terı́sticas deseadas de respuesta transitoria ante la referencia de velocidad ωd .
Para esto se usa el diagrama de bloques de la figura 5.17(b), de donde se
observa que la función de transferencia de lazo abierto es:

kp k(s + c) ki
G(s)H(s) = , c= (5.31)
s(s + a) kp

Nótese que el sistema es tipo 1, lo cual asegura que ω(t) = ωd en estado


estacionario si ωd es una constante. Esta es una de las razones de haber elegido
usar un controlador PI en este ejemplo. Por tanto, como las caracterı́sticas
deseadas de la respuesta en estado estacionario están aseguradas (la velocidad
alcanza la velocidad deseada) sólo resta seleccionar las ganancias kp y ki de
manera que sean satisfechas las caracterı́sticas de respuesta transitoria. Para
esto, nótese que la función de transferencia en lazo abierto mostrada en (5.31)
es idéntica a la función de transferencia mostrada en (5.15) correspondiente al
control PD de posición ya que sólo hay que reemplazar kd por kp . Por tanto, el
lugar de las raı́ces correspondiente al control PI de velocidad es idéntico a los
dos casos mostrados en la figura 5.13 y se obtienen las mismas conclusiones: i)
244 5 Diseño usando la respuesta en el tiempo

T p(s)

1
J

à
! d(s) + k I ã(s) + !(s)
s+k pi 1
kp k s+a
s
à

(a) Sistema de control completo.


! d(s) + k !(s)
s+k pi k
kp s s+a
à

(b) Caso cuando Tp (s) = 0.

T p(s) !(s)
1 à 1
J s+a
à
k
s+k pi
k pk s

(c) Caso cuando ωd (s) = 0.

Figura 5.17. Sistema de control proporcional-integral de velocidad

siempre existen ganancias kp y ki que permiten colocar los dos polos de lazo
cerrado en cualquier punto sobre el semi plano complejo izquierdo; por tanto,
es posible sintonizar el controlador PI usando un procedimiento de prueba
y error idéntico al presentado al final de la sección 5.2.2: sólo se debe usar
la ganancia ki (control PI) en lugar de kp (control PD) y usar la ganancia
kp (control PI) en lugar de kd (control PD), ii) el cero colocado en s = −c
también es un cero de la función de transferencia en lazo cerrado G1 (s) lo
que afecta a las caracterı́sticas de respuesta transitoria ante la referencia de
velocidad. Es decir, que la respuesta transitoria no tendrá las caracterı́sticas
5.2 Ejemplos 245

diseñadas usando (5.20) y (5.21) para seleccionar los polos de lazo cerrado.
Esto plantea las siguientes dos posibilidades para el diseño.
1. El problema indicado en el inciso ii) puede ser eliminado si se elige:

ki
c=a= (5.32)
kp

porque en tal caso, de acuerdo a la figura 5.17(b) y a (5.1), la función de


transferencia de lazo cerrado es:
ω(s) kp k
=
ωd (s) s + kp k

Esto significa que la repuesta en lazo cerrado, ante la referencia de velo-


cidad, es como la de un sistema de primer orden con ganancia unitaria en
estado estacionario y una constante de tiempo igual a kp1k . Entonces, si se
especifica una constante de tiempo deseada igual a τ se debe establecer:
1
kp k = (5.33)
τ
Ası́ que las condiciones en (5.33) y (5.32) representan una sencilla regla

Im(s)

àc
àa Re(s)

kp k
Figura 5.18. Lugar de las raı́ces para c = a, G(s)H(s) = s
.

de sintonı́a. Finalmente, el lugar de las raı́ces correspondientes al caso que


k k
se acaba de estudiar (c = a, G(s)H(s) = ps ) se muestra en la figura
5.18. Esto puede deducirse fácilmente usando las reglas 3 y 5, ya que al
sólo existir un polo de lazo abierto, sólo existe un polo de lazo cerrado, el
cual debe ser real y debe tender a un cero en el infinito (sobre el eje real,
sobre una ası́ntota que forma −180◦ con el eje real positivo) porque no
hay ningún cero de lazo abierto. Además, la condición de magnitud:
kp k
=1
l1
246 5 Diseño usando la respuesta en el tiempo

donde l1 es la distancia del polo de lazo cerrado deseado al origen, establece


que el polo deseado en lazo cerrado ubicado en s = − τ1 es alcanzado
cuando:
1 1
kp k = l1 , l1 = ⇒ kp k =
τ τ
lo cual coincide con (5.33). Sin embargo, a continuación se muestra que
esta regla de sintonı́a trae un problema en cuanto a la respuesta del sistema
en lazo cerrado ante la perturbación externa Tp (s). Para esto, considérese
el diagrama de bloques de la figura 5.17(c). Si se selecciona c = a entonces
la función de transferencia de lazo cerrado es:

ω(s) − Jk s
= (5.34)
Tp (s) (s + kp k)(s + a)

Usando el teorema del valor final se encuentra que:

lı́m ω(t) = lı́m sω(s)


t→∞ s→0
− Jk s td
= lı́m s =0
s→0 (s + kp k)(s + a) s

la desviación producida por una perturbación externa de par de valor


constante igual a td es reducida a cero en estado estacionario. Esta es la
otra razón por la cual se ha elegido usar un controlador PI de velocidad.
Sin embargo, existe un problema. La rapidez con la que tal desviación es
llevada a cero depende de los polos de la función de transferencia mostrada
en (5.34), los cuales están ubicados en s = −kp k y s = −a. Aunque uno
de estos polos puede ser hacerse tan rápido como se desee usando un valor
grande de kp , la rapidez del otro polo (s = −a) no puede ser modificada y
depende de la rapidez que el motor de CD tiene en lazo abierto. Esto trae
como consecuencia que la desviación debida a la perturbación puede ser
llevada a cero muy lentamente, lo cual representa un serio inconveniente.
2. Tratando de resolver el problema que se acaba de indicar se puede optar
por abandonar la regla de sintonı́a representada por (5.33) y (5.32). Como
ahora c 6= a, la función de transferencia de lazo cerrado correspondiente
al diagrama de bloques de la figura 5.17(c) es:

ω(s) − Jk s
= 2 (5.35)
Tp (s) s + (a + kp k)s + kp kc

Usando de nuevo el teorema del valor final se puede verificar fácilmente


que si la perturbación externa es constante Tp (s) = tsd entonces la desvia-
ción producida en estado estacionario es cero de nuevo: lı́mt→∞ ω(t) = 0,
debido a que la función de trasferencia en (5.35) tiene un cero en s = 0.
Por otro lado, los polos de la función de transferencia en (5.35), que son los
5.2 Ejemplos 247

que determinan la rapidez con la que la desviación de velocidad desapare-


ce, son idénticos a los polos de la función de transferencia ωω(s)
d (s)
= G1 (s),
por lo que pueden ser determinados usando el método del lugar de las
raı́ces a partir de (5.31). Tal como ya se ha explicado, el lugar de las
raı́ces correspondiente es idéntico a los dos casos mostrados en la figura
5.13 sustituyendo el uso de kd por el de kp . Es muy importante subrayar
que la función de transferencia en (5.35) no tiene el cero en s = −c que
se muestra en el lugar de las raı́ces de la figura 5.13. Esto significa que
ninguno de los dos polos de lazo cerrado obtenidos con el método del lugar
de las raı́ces podrá cancelarse con el cero en s = −c y el polo más lento
tendrá el efecto más importante sobre la rapidez con la que la desviación
debida a la perturbación es llevada a cero. Con esto en mente se concluye
lo siguiente.
Con el fin de que el cero en s = −c tenga poco efecto sobre la respuesta
transitoria ante la referencia de velocidad, uno de los polos de lazo
cerrado debe seleccionarse cerca del cero en s = −c. El otro polo de
lazo cerrado (el más rápido) se aleja hacia la izquierda y tiende al
infinito conforme el polo lento se acerca a s = −c.
Esto significa que el polo rápido determina las caracterı́sticas de res-
puesta transitoria (constante de tiempo) ante la referencia de velo-
cidad. Entonces, si se desea establecer cierto valor para la constante
de tiempo (de manera que el polo rápido ocupe un punto finito sobre
el eje real negativo), el polo lento siempre estará relativamente lejos
del cero en s = −c (a donde convergerı́a cuando el polo rápido llegue
al infinito). Esto significa que la respuesta transitoria estará afecta-
da por los dos polos y el cero en s = −c. Por tanto, si c 6= a, no se
puede determinar una regla de sintonı́a que de manera exacta fije las
caracterı́sticas de respuesta transitoria ante la referencia de velocidad.
Es más conveniente seleccionar c > a porque el polo de lazo cerrado
más lento (el que se aproxima a s = −c) queda colocado más a la
izquierda (es más rápido) que si selecciona c < a.
Por esta misma razón, si se quiere aumentar la rapidez con la que el
efecto de la perturbación desaparece, se debe seleccionar c 6= a con
c > 0 cada vez más grande. De acuerdo a c = ki /kp , esto significa que
se necesita una ganancia integral mayor.
Por tanto, aunque es posible aumentar la rapidez con la que desaparece
la desviación producida por la perturbación, se concluye que no se pue-
den calcular de manera exacta las ganancias kp y ki que aseguren que
se consiguen, simultáneamente, las caracterı́sticas deseadas de respuesta
transitoria ante la referencia deseada y un rechazo rápido de los efectos
de la perturbación. Esta afirmación es verificada experimentalmente en
el capı́tulo 9 y, por ello, en ese capı́tulo se presenta un controlador PI
modificado de velocidad que resuelve este problema.
248 5 Diseño usando la respuesta en el tiempo

Previendo su uso experimental en el capı́tulo 9, a continuación se propone una


regla de sintonı́a para el caso cuando c 6= a. De acuerdo a (5.31) la condición
de magnitud es:
kp kl1
=1
l3 l2

donde s − (0) = l2 ∠θ2 , s − (−a) = l3 ∠θ3 , s − (−c) = l1 ∠θ1 . El criterio


de sintonı́a seleccionado es proponer que el polo más lento esté ubicado en
un valor conocido s = −p1 , para fijar un lı́mite inferior en la rapidez con
la que se rechaza el efecto de la perturbación. Por otro lado, de acuerdo a
los puntos listados previamente, se propone c cercano a p1 de manera que
p1 > c. Entonces, usando la condición de magnitud previa se obtiene la regla
de sintonı́a:
ki l 2 l3
= c, c < p1 , kp = (5.36)
kp l1 k
l1 = abs(−p1 + c), l2 = abs(−p1 ), l3 = abs(−p1 + a)

De acuerdo a lo expuesto previamente, la respuesta ante la referencia de ve-


locidad será mucho más rápida que la dictada por el polo en s = −p1 . Para
propósitos de comparación, esto es muy importante pues en el capı́tulo 9 se
diseñan algunos controladores de velocidad que consiguen simultaneamente
respuestas transitorias ante una referencia de velocidad y una perturbación
externa que son determinadas por un polo en s = −p1 . En cambio con el
control PI de velocidad aquı́ estudiado, si se desea aumentar la rapidez de res-
puesta ante una perturbación externa (con un polo en s = −p1 ), la respuesta
ante la referencia de velocidad debe ser mucho más rápida.

5.2.5. Control proporcional-integral-derivativo (PID) de posición

Considere de nuevo el modelo de un motor de CD pero ahora considerando


la presencia de una perturbación externa:
1 1
θ(s) = [kI ∗ (s) − Tp (s)]
s(s + a) J

junto con el siguiente controlador proporcional-integral-derivativo:


Z t
de
i∗ = kp e + kd + ki e(r)dr, e = θd − θ
dt 0

donde θd es la posición deseada y las constantes kp , kd y ki se conocen como


las ganancias proporcional, derivativa e integral, respectivamente. Usando la
transformada de Laplace se obtiene:
5.2 Ejemplos 249

E(s)
I ∗ (s) = kp E(s) + kd sE(s) + ki
µ ¶ s
ki
= kp + kd s + E(s)
s
kp ki
s2 + kd s + kd
= kd E(s)
s
por lo que se obtiene el diagrama de bloques mostrado en la figura 5.19(a).
Como este sistema tiene dos entradas entonces se puede usar el principio de
superposición (véase la sección 3.10) para escribir:

θ(s) = G1 (s)θd (s) + G2 (s)Tp (s)

donde G1 (s) es la función de transferencia usando θd (s) como la entrada y


θ(s) como la salida cuando Tp (s) = 0, es decir, cuando se usa el diagrama de
bloques de la figura 5.19(b) para encontrar:
³ ´
2 kp ki
θ(s) kd k s + kd s + kd
= G1 (s) = 3 , Tp (s) = 0 (5.37)
θd (s) s + (a + kd k)s2 + kp ks + ki k
Por otro lado, G2 (s) es la función de transferencia usando Tp (s) como la
entrada y θ(s) como la salida cuando θd (s) = 0, es decir, cuando se usa el
diagrama de bloques de la figura 5.19(c) para encontrar:

θ(s) − Jk s
= G2 (s) = 3 , θd (s) = 0 (5.38)
Tp (s) s + (a + kd k)s2 + kp ks + ki k
Es importante subrayar que cuando Tp (s) es la entrada entonces θ(s) re-
presenta la desviación de la posición (respecto de θd (s)) producida por la
perturbación. Usando el teorema del valor final se encuentra que:

lı́m θ(t) = lı́m sθ(s)


t→∞ s→0
− Jk s td
= lı́m s =0
s→0 s3 + (a + kd k)s2 + kp ks + ki k s
la desviación de posición en estado estacionario producida por una pertur-
bación externa de par constante Tp (s) = tsd es cero. Utilizando de nuevo el
teorema del valor final, no es difı́cil comprobar que, usando (5.37), el valor
final de posición θ es igual al valor deseado θd cuando éste es constante. Estas
son las principales razones para usar un controlador PID de posición.
A continuación se estudia el problema de seleccionar las ganancias del
controlador PID de manera que la respuesta en lazo cerrado tenga las ca-
racterı́sticas deseadas de respuesta transitoria ante la referencia de posición
θd . Con este propósito, los tres polos de la función de transferencia en (5.37)
deben ser asignados en los puntos deseados sobre el semiplano complejo iz-
quierdo. Esto se consigue igualando el polinomio caracterı́stico de la función
250 5 Diseño usando la respuesta en el tiempo

T p(s)

1
J

à
ò d(s) + s 2 kp k
+k s+k i
I ã(s) + ò(s)
1
kd d
s
d k s(s+a)
à

(a) El sistema de control completo.

ò d(s) + kp k
s 2+k s+k i
ò(s)
d d
k
kd s s(s+a)

(b) Caso cuando Tp (s) = 0.

T p(s) ò(s)
1 à 1
J s(s+a)
à
kp k
s 2+k s+k i
d d
k dk s
(c) Caso cuando θd (s) = 0.

Figura 5.19. Sistema de control PID de posición

de transferencia en (5.37) con un polinomio que tiene sus tres raı́ces en los
puntos deseados s = p1 , s = p2 , s = p3 :
s3 + (a + kd k)s2 + kp ks + ki k = (s − p1 )(s − p2 )(s − p3 )
Es claro que a los tres coeficientes del polinomio caracterı́stico se les puede
asignar cualquier valor con combinaciones adecuadas de las ganancias kp , kd
y ki . Esto significa que los tres polos del sistema en lazo cerrado pueden ser
asignados en cualquier lugar que se desee del semiplano complejo izquierdo.
Una manera de seleccionar los polos deseados es: dos complejos conjugados
con parte real negativa y el otro real y negativo (para asegurar estabilidad),
es decir:
5.2 Ejemplos 251

p1 = σ1 + jω1 , p2 = σ1 − jω1 , p3 < 0, σ1 < 0, ω1 > 0

Si se desea que la respuesta sea dominada por los dos polos complejos conju-
gados entonces se puede proponer:

|p3 | > 6|σ1 |

Con estos datos se obtiene:

s3 + (a + kd k)s2 + kp ks + ki k = (s − p1 )(s − p2 )(s − p3 ) (5.39)


= s3 − (2σ1 + p3 )s2 + (σ12 + ω12 + 2σ1 p3 )s − p3 (σ12 + ω12 )

de donde, igualando coeficientes, se obtiene la siguiente regla de sintonı́a:

−(2σ1 + p3 ) − a
kd = (5.40)
k
σ12 + ω12 + 2σ1 p3
kp =
k
−p3 (σ1 + ω12 )
2
ki =
k
Nótese que las tres ganancias del controlador son positivas. Aunque la parte
real e imaginaria de los polos en p1 y p2 pueden ser calculadas usando (5.20) y
(5.21) de manera que se obtenga el tiempo de subida tr y el sobre paso Mp ( %)
deseados, sin embargo la respuesta obtenida tendrá diferencias importantes
respecto de estos valores deseados debido a los dos ceros que tiene la función
de transferencia en (5.37). Aunque esta es una desventaja importante de la
regla de sintonı́a en (5.40), estos valores pueden ser usados como una simple
aproximación de las ganancias requeridas del controlador para posteriormente
hacer ajustes finos, a prueba y error, hasta obtener las caracterı́sticas deseadas
de respuesta transitoria. Para esto, dado que el sistema en lazo cerrado es de
tercer orden, es muy importante tener presente la regla de estabilidad obtenida
en el ejemplo 4.12 de la sección 4.3. La posibilidad de ajustar a prueba y error
las ganancias de un controlador PID (véase la sección 5.3) es una de las
principales razones por las que este tipo de controlador tiene tanto uso en la
industria.
Con el fin de buscar una regla de sintonı́a que permita calcular de mane-
ra exacta las ganancias de un controlador PID, a continuación se procede a
estudiar el lugar de las raı́ces para el control PID de posición. Para esto se
usa el diagrama de bloques de la figura 5.19(b), de donde se observa que la
función de transferencia de lazo abierto es:
kd k(s + α)(s + β) kp ki
G(s)H(s) = , (s + α)(s + β) = s2 + s + (5.41)
s2 (s + a) kd kd

para algunas constantes α y β diferentes de cero cuyos valores se proponen


como parte del proceso del diseño para después, a partir de estos valores,
252 5 Diseño usando la respuesta en el tiempo

calcular kp y ki . Nótese que kd es la ganancia que el método varı́a desde 0


hasta +∞ para dibujar el lugar de las raı́ces. Es claro que el sistema es tipo
2 (el motor tiene un integrador por naturaleza y el otro integrador es debido
al controlador PID) y, por tanto, el error en estado estacionario ante una
referencia de posición constante es cero.
En la figura 5.20 se presentan tres posibilidades para el lugar de las raı́ces
correspondiente, las cuales dependen de los valores propuestos para α y β. Se
invita al lector a usar las reglas presentadas en la sección 5.1.1 para comprobar
estos resultados. De acuerdo a la figura 5.20(a), se puede diseñar el sistema
de control de manera que dos polos de lazo cerrado sean muy próximos a
los dos ceros colocados en s = −α y s = −β para que el sistema en lazo
cerrado responda como un sistema de primer orden con un polo real y negativo.
También se puede elegir que un polo de lazo cerrado sea muy próximo al cero
en s = −α de modo que el sistema en lazo cerrado responda como un sistema
de segundo orden, con polos complejos conjugados, que contiene un cero.
Aunque la presencia de este cero modifica la forma de la respuesta transitoria,
es una manera de conseguir una respuesta con especificaciones aproximadas
de tiempo de subida y sobre paso deseados. Este es el criterio de diseño que
se usa a continuación.
En casos como este, los métodos tradicionales del lugar de las raı́ces pro-
ponen seguir los siguientes tres pasos:
Diseñe un controlador PD de posición con función de transferencia:

kd (s + β)

de manera que se obtengan el tiempo de subida y el sobre paso deseados.


A la función de transferencia de lazo abierto diseñada en el paso anterior,
agregue el factor:
s+α
s
con α un valor positivo muy cercano a cero.
Calcule las ganancias PID usando (5.41), es decir:

kp = (α + β)kd , ki = αβkd (5.42)

A continuación se diseña un controlador PD de la forma kd (s + β) para


k
la planta s(s+a) , es decir, cuando el sistema en lazo cerrado tiene la forma
presentada en la figura 5.21 y la función de transferencia de lazo abierto es:
kd k(s + β)
G(s)H(s) = (5.43)
s(s + a)
La función de transferencia de lazo cerrado es, en este caso:
θ(s) kd k(s + β)
= 2
θd (s) s + (a + kd k)s + kd kβ
5.2 Ejemplos 253

Im(s)

+
àì àë àa Re(s)

(a)
Im(s)

+
àì àa àë Re(s)

(b)

àë Im(s)

+
àa Re(s)

àì
(c)

Figura 5.20. Diferentes posibilidades para el lugar de las raı́ces del control PID de
posición.
254 5 Diseño usando la respuesta en el tiempo

Igualando a un polinomio de segundo grado estándar:

s2 + (a + kd k)s + kd kβ = s2 + 2ζωn s + ωn2

se obtiene:
2ζωn − a ωn2
kd = , β= (5.44)
k kd k
Los valores de ζ y ωn se pueden calcular usando (5.20) y (5.21) a partir de

ò d(s) + ò(s)
k d(s + ì) k
s(s+a)
à

Figura 5.21. Control PD de posición.

los valores deseados de tiempo de subida y sobre paso. El lugar de las raı́ces
correspondiente a este caso se muestra en la figura 5.22 y es idéntico al caso
c > a mostrado en la figura 5.13, porque sólo en este caso el control PD de
posición puede producir polos complejos conjugados de lazo cerrado. A partir
de (5.43) se encuentra que las condiciones de ángulo y de magnitud establecen:
kd kl3
θ3 − (θ1 + θ2 ) = ±180◦ (2q + 1), q = 1, 2, . . . =1 (5.45)
l1 l2
donde l1 , l2 , l3 , θ1 , θ2 y θ3 están definidas en la figura 5.22. Cuando se agrega el
factor s+α
s a la función de transferencia de lazo abierto en (5.43) se encuentra
que la función de transferencia de lazo abierto ahora es:
kd k(s + β)(s + α)
G(s)H(s) = (5.46)
s2 (s + a)
Como α > 0 es pequeña, el lugar de las raı́ces correspondiente tiene la forma
mostrada en la figura 5.23 (se invita al lector a usar las reglas presentadas
en la sección 5.1.1 para comprobar este resultado). Las condiciones de ángulo
y de magnitud correspondientes a este caso se establecen a partir de (5.46)
como:
kd kl3 l5
θ3 + θ5 − (2θ1 + θ2 ) = ±180◦ (2q + 1), q = 1, 2, . . . = 1 (5.47)
l12 l2

donde l1 , l2 , l3 , θ1 , θ2 y θ3 son idénticas a las definidas en la figura 5.22,


mientras que l5 y θ5 se definen en la figura 5.23. La razón de seleccionar
5.2 Ejemplos 255
POLO DESEADO
Im(s)

l3 l2 l1
ò1
ò3 ò2

àì àa Re(s)

Figura 5.22. Lugar de las raı́ces para el sistema en la figura 5.21.

Im(s)

ò5
l1
l3 l2 l5 ò1
ò3 ò2
ï
à "à ë+
àì àa Re(s)

Figura 5.23. Lugar de las raı́ces para la función de transferencia de lazo abierto
mostrada en (5.46).

α > 0 cercana a cero es para conseguir que l1 y l5 sean casi iguales de manera
que l5 /l1 ≈ 1. Esto también asegura que θ1 y θ5 son casi iguales por lo que
θ5 − θ1 ≈ 0. Entonces, las condiciones de ángulo y de magnitud en (5.45) y
(5.47) son casi idénticas. Esto asegura que los polos de lazo cerrado que se
obtienen cuando la función de transferencia de lazo abierto es la presentada
en (5.43) son casi idénticos a los polos de lazo cerrado obtenidos cuando la
función de transferencia de lazo abierto es la presentada en (5.46). Ası́ se
asegura que las caracterı́sticas de respuesta transitoria (tiempo de subida y
sobre paso) deseñadas con el controlador PD en (5.44) también se consiguen
con el controlador PID:
256 5 Diseño usando la respuesta en el tiempo
k ki
(s + α)(s + β) s2 + kdp s + kd
kd = kd
s s
es decir, cuando las ganancias se seleccionan de acuerdo a (5.42).
Sin embargo, es importante resaltar una gran desventaja de este método
de diseño: de acuerdo a (5.42) un valor pequeño de α resulta en un valor
pequeño de la ganancia integral ki . La principal consecuencia de esto es que
la desviación de posición debida a la perturbación externa es llevada a cero
muy lentamente y esto puede ser inaceptable en la práctica. Esto también se
puede explicar a partir del lugar de las raı́ces de la figura 5.23. Nótese que
un polo de lazo cerrado (colocado digamos en s = −ε, ε > 0) se aproxima
al cero colocado en s = −α, por lo que ambos se cancelan en la función de
transferencia presentada en (5.37) y no se aprecia el efecto de ninguno de
ellos en la respuesta transitoria ante la referencia de posición. Sin embargo, el
cero en s = −α no aparece en la función de transferencia mostrada en (5.38).
Pero el polo en s = −ε aún esta presente en esta función de transferencia y
afecta considerablemente a la respuesta transitoria: este polo lento (cercano
al origen) es el responsable de una respuesta transitoria muy lenta cuando
aparece una perturbación externa.
A pesar de estos inconvenientes, el método del lugar de las raı́ces reco-
mienda diseñar los controladores PID de esta manera. Más aún, es interesante
mencionar que estos inconvenientes en los métodos clásicos de diseño siguen
sin solución a pesar de que ya han sido puntualizados previamente en algunos
trabajos internacionales como el de la referencia [10].
Por otro lado, de acuerdo a (5.42), se puede obtener una ganancia integral
más grande (para obtener un rechazo más rápido de la perturbación) selec-
cionando un valor más grande de α. Sin embargo, de acuerdo a lo expuesto
previamente, esto resultará en una respuesta transitoria ante la referencia de
posición que no tiene las caracterı́sticas deseadas. Estos razonamientos per-
miten afirmar que no existe una regla de sintonı́a que permita calcular de
manera exacta las ganancias de un controlador PID de posición de modo que
se consigan simultáneamente las caracterı́sticas deseadas de respuesta transi-
toria ante una referencia de posición y un rechazo satisfactorio de los efectos
de una perturbación externa de par. Estas observaciones se verifican experi-
mentalmente en el capı́tulo 10 donde, dada la problemática que se acaba de
describir, se presentan y se prueban experimentalmente nuevos controladores
que eliminan estas desventajas.
Finalmente, a pesar de las desventajas arriba mencionadas, es importante
recordar lo que se indicó justo después de (5.40): el controlador PID es uno
de los controladores más utilizados a nivel industrial debido a que puede ser
sintonizado a prueba y error (véase la sección 5.3) de manera que se respete
la regla de estabilidad obtenida en el ejemplo 4.12 de la sección 4.3.
5.2 Ejemplos 257

5.2.6. Asignación de los polos de lazo cerrado deseados

En esta parte se presenta un ejemplo para mostrar cómo se usa el lugar


de las raı́ces para diseñar un controlador de modo que se asignen los polos de
lazo cerrado deseados. Considere la siguiente función de transferencia:
k
G(s)H(s) = (5.48)
(s − 35.7377)(s + 36.5040)

La ganancia k es variada por el método para que tome valores desde 0 hasta
+∞. Primero se reescribe G(s)H(s) en la siguiente forma:

k
G(s)H(s) = ∠ − (θ1 + θ2 )
l1 l 2

donde se han definido los vectores s − 35.7377 = l1 ∠θ1 , s − (−36.5040) =


l2 ∠θ2 . Las dos condiciones fundamentales que definen el lugar de las raı́ces
son las condiciones de ángulo (5.7) y de magnitud (5.6) las cuales se expresan,
respectivamente, como:

−(θ1 + θ2 ) = ±(2q + 1)180◦ , q = 0, 1, 2, . . .


k
=1
l1 l2
La regla 5 indica que sobre el eje real sólo existe lugar de las raı́ces entre
los puntos s = 35.7377 y s = −36.5040. Además, de acuerdo a la regla 1, el
lugar de las raı́ces inicia (k = 0) en s = 35.7377 y s = −36.5040. Por otro
lado, de acuerdo a las reglas 2 y 3, cuando k tiende a +∞ las ramas que
inician en los puntos s = 35.7377 y s = −36.5040 deben terminar en algún
cero de lazo abierto (no existe ninguno en este caso) o en algún punto en el
infinito del plano s. Por tanto, el lugar de las raı́ces debe alejarse de los puntos
s = 35.7377 y s = −36.5040, sobre el eje real, conforme k crece de manera
que debe existir un punto de separación en algún lugar entre dichos puntos
para luego dirigirse hacia el infinito sobre el plano s.
Por otro lado, de acuerdo a la condición de ángulo, −(θ1 + θ2 ) = −180◦ =
−(α + θ1 ), y la figura 5.24 se puede observar que α = θ2 y, por tanto, que
los triángulos t1 y t2 deben ser idénticos para cualquier polo de lazo cerrado
s. Entonces, las dos ramas mencionadas anteriormente y que son mostradas
en la figura 5.24 deben ser paralelas al eje imaginario. Esto significa que el
punto donde las dos ramas se separan del eje real está ubicado en el punto
medio entre los polos ubicados en s = 35.7377, s = −36.5040, es decir en
(35.7377 − 36.5040)/2 = −0.7663. Esto también puede verificarse usando las
reglas 3 y 4. Finalmente, de acuerdo a la regla 6 ambas ramas son simétricas
respecto al eje horizontal.
La condición de magnitud se usa cuando se necesita conocer el valor exacto
de k que permita conseguir un punto especı́fico sobre el lugar de las raı́ces.
258 5 Diseño usando la respuesta en el tiempo

Im (s)
s

ì ì

l2 l1
t1 t2

ò2 ò1
ë

à 36:50 à 0:7663 35:73


Re (s)

Figura 5.24. Lugar de las raı́ces para G(s)H(s) en (5.48).

Nótese, por ejemplo, que al crecer k hacia +∞ las longitudes l1 y l2 deben


crecer para satisfacer la condición de magnitud
k
=1
l1 l2
lo cual significa que los polos de lazo cerrado correspondientes a valores gran-
des de k tienden a algún punto en el infinito del plano s.
Suponga ahora que se incluye un polo adicional a la función de transferen-
cia en (5.48) para tener:
116137 k
G(s)H(s) = =
s3 + 72.54s2 − 1250s − 9.363 × 104
116137 k
= (5.49)
(s − 35.7377)(s + 36.5040)(s + 71.7721)
De nuevo, la constante k es la ganancia que el método varı́a desde 0 hasta
+∞ para dibujar el lugar de las raı́ces. Primero se reescribe G(s)H(s) en la
siguiente forma:
116137 k
G(s)H(s) = ∠ − (θ1 + θ2 + θ3 )
l 1 l 2 l3
donde se han definido los vectores s−35.7377 = l1 ∠θ1 , s−(−36.5040) = l2 ∠θ2 ,
s − (−71.7721) = l3 ∠θ3 . Las condiciones de ángulo (5.7) y de magnitud (5.6)
se expresan, respectivamente, como:
−(θ1 + θ2 + θ3 ) = ±(2q + 1)180◦ , q = 0, 1, 2, . . .
116137 k
=1
l1 l2 l3
5.2 Ejemplos 259

El lugar de las raı́ces correspondiente a este caso se puede obtener a par-


tir del obtenido para la función de transferencia en (5.48) considerando que
simplemente se ha adicionado un polo en s = −71.7721.
De acuerdo a la regla 11 el nuevo polo será causa para que las dos ramas del
lugar de las raı́ces mostrado en la figura 5.24 se “doblen” hacia la derecha como
se alcanza a apreciar ligeramente en la figura 5.25. Esto puede comprobarse
usando la regla 3 para encontrar que ahora existen tres ramas del lugar de las
raı́ces que tienden hacia ası́ntotas que forman ángulos de ±180◦ y ±60◦ con
el eje real positivo.

Root Locus
15

10

5
Imaginary Axis

−5

−10

−15
−80 −60 −40 −20 0 20 40
Real Axis

Figura 5.25. Lugar de las raı́ces para G(s)H(s) en (5.49).

Por otro lado, el punto de separación entre los puntos s = 35.7377 y


s = −36.5040 que en la figura 5.24 estaba colocado en el punto (35.7377 −
36.5040)/2 = −0.7663 ahora en la figura 5.25 se encuentra colocado más hacia
la derecha que −0.7663. La razón de esto se explica en la figura 5.26 donde s′
y s representan dos puntos sobre el lugar de las raı́ces que están muy cerca del
punto de separación para el caso de las figuras 5.24 y 5.25, respectivamente.
Como en la figura 5.25 se debe cumplir que −(θ1 + θ2 + θ3 ) = −180◦ mientras
que en la figura 5.24 se debe cumplir −(θ1′ + θ2′ ) = −180◦ , entonces ambos θ1
y θ2 deben ser menores que θ1′ y θ2′ . Esto significa que el punto s debe estar
desplazado hacia la derecha del punto s′ . Nótese que este desplazamiento del
punto de separación hacia la derecha del punto −0.7663 es mayor conforme
el ángulo θ3 introducido por el polo en s = −71.7721 sea mayor, es decir,
260 5 Diseño usando la respuesta en el tiempo

conforme este polo se encuentre colocado más hacia la derecha. De hecho,


en la figura 5.25 se observa que el punto de separación está colocado en el
semiplano derecho.

Im (s )
s; s

ò2
;
; ò1 ò2
ò3 ò1

à 0:7663 Re (s )

Figura 5.26. Un polo adicional recorre el punto de separación hacia la derecha.

Esta descripción del lugar de las raı́ces de la figura 5.25 permite concluir
que siempre existirá al menos un polo de lazo cerrado que tiene parte real
positiva, es decir, habrá inestabilidad en lazo cerrado para cualquier valor
positivo de k. Debido a que k se puede interpretar como la ganancia de un
controlador proporcional, se concluye que no es posible estabilizar el sistema
usando ningún controlador proporcional y debe intentarse otro controlador.
De acuerdo a la regla 12 se requiere usar un controlador que introduzca un
cero de lazo abierto ya que esto consigue “doblar” el lugar de las raı́ces hacia
la izquierda para conseguir estabilidad de lazo cerrado.
Considere la siguiente función de transferencia de lazo abierto:
116137(s + b)
G(s)H(s) = k = (5.50)
s3 + 72.54s2 − 1250s − 9.363 × 104
116137(s + b)
=k
(s − 35.7377)(s + 36.5040)(s + 71.7721)
con b una constante positiva. De nuevo, la constante k es la ganancia que el
método varı́a desde 0 hasta +∞ para dibujar el lugar de las raı́ces. Primero
se reescribe G(s)H(s) en la siguiente forma:
116137 k l4
G(s)H(s) = ∠[θ4 − (θ1 + θ2 + θ3 )] (5.51)
l1 l2 l3
donde se han definido los vectores s−35.7377 = l1 ∠θ1 , s−(−36.5040) = l2 ∠θ2 ,
s − (−71.7721) = l3 ∠θ3 , s − (−b) = l4 ∠θ4 . Las condiciones de ángulo (5.7) y
de magnitud (5.6) se expresan, respectivamente, como:

θ4 − (θ1 + θ2 + θ3 ) = ±(2q + 1)180◦ , q = 0, 1, 2, . . . (5.52)


116137 k l4
=1 (5.53)
l1 l2 l3
5.2 Ejemplos 261

Nótese que ahora se tiene n = 3, m = 1, p1 = 35.7377, p2 = −36.5040,


p3 = −71.7721, z1 = −b. De acuerdo a las reglas 1, 2 y 3, una de las tres ramas
que inician (k = 0) en los puntos s = 35.7377, s = −36.5040, s = −71.7721
(polos de lazo abierto) debe terminar (k = +∞) en el cero de lazo abierto
colocado en s = −b. Por tanto, existirán dos ramas del lugar de las raı́ces que
tienden a algún punto del infinito sobre el plano s. De acuerdo a la regla 3,
los ángulos de las ası́ntotas a las que tienden estas ramas son:

±180◦ (2 × 0 + 1) ±180◦ (2 × 0 + 1)
= = ±90◦
n−m 3−1
Además, de acuerdo a la regla 4 la ubicación de estas ası́ntotas sobre el eje
real puede ser ajustada usando el cero en s = −b:

p1 + p2 + p3 − (−b) 35.7377 − 36.5040 − 71.7721 + b


σa = = (5.54)
n−m 2
Nótese que b debe ser positivo pues de otra manera una rama del lugar de las
raı́ces serı́a halado hacia el semiplano derecho generando polos de lazo cerrado
inestables. Nótese también que las ası́ntotas se mueven hacia la izquierda
(mayor estabilidad) conforme el cero es ubicado más cerca del origen, es decir
conforme b tiende a cero. Todo esto significa que existe un lı́mite en cuanto
a que tan a la izquierda se pueden colocar los polos complejos conjugados de
lazo cerrado.
De acuerdo a la regla 5 ahora existirá lugar de las raı́ces sobre dos seg-
mentos del eje real porque ahora se tienen cuatro polos y ceros reales de lazo
abierto. La ubicación de dichos segmentos sobre el eje real depende del va-
lor de b usado, como se muestra en las figuras 5.27(a) y 5.27(b). Más aún,
en la figura 5.27(c) se muestra que si se selecciona b = 36.5040 entonces se
cancela el cero de lazo abierto en s = −b con el polo de lazo abierto ubicado
s = −36.5040. Esto significa que, en tal caso, sólo existirá lugar de las raı́ces
en un segmento del eje real.
En la figura 5.27(c) se aprecia que sólo existen dos polos de lazo cerrado.
En las figuras 5.27(a) y 5.27(b) se puede apreciar que existen tres polos de
lazo cerrado y que uno de esos polos estará en el semiplano complejo dere-
cho (inestabilidad en lazo cerrado) si la ganancia k es demasiado pequeña. Por
otro lado, si k es demasiado grande se tendrán dos polos complejos conjugados
con parte imaginaria demasiado grande, por lo que la respuesta oscilará rápi-
damente. Aunque en teorı́a esto puede funcionar porque los tres polos tienen
parte real negativa, sin embargo un valor grande de k hace que se sature el
amplificador de potencia por lo que el sistema de control no podrá funcionar
satisfactoriamente en la práctica. Ası́ que un buen diseño será aquel que per-
mita obtener los polos de lazo cerrado deseados usando una ganancia k que
no sea ni muy grande ni muy pequeña.
Suponga que se desean los siguientes polos complejos conjugados de lazo
cerrado s = −25 ± j40. A continuación se presenta la manera de calcular los
262 5 Diseño usando la respuesta en el tiempo

àb

(a) b = 31.24 < 36.50


Root Locus
150

100

50
Imaginary Axis

0
àb

-50

-100

-150
-80 -60 -40 -20 0 20 40
Real Axis

(b) b > 36.50


Root Locus
2

1.5

0.5
Imaginary Axis

0
àb

-0.5

-1

-1.5

-2
-80 -60 -40 -20 0 20 40
Real Axis

(c) b = 36.50

Figura 5.27. Lugares de las raı́ces para G(s)H(s) definida en (5.50) obtenidos al
cambiar el valor de b.
5.2 Ejemplos 263

Im (s )

à 25 + j40
ï
l3
l2 l1
l4
ò3 ò2 ò4 ò1

à 71:7 à 36:5 àb 35:7 Re (s )

Figura 5.28. Polos y ceros de lazo abierto para ubicar los polos deseados de lazo
cerrado en s = −25 ± j40.

valores exactos de b y de k que permiten conseguir estos polos de lazo cerrado.


De acuerdo a la figura 5.28 se calculan los siguientes ángulos:
µ ¶
40
θ3 = arctan
71.7721 − 25
µ ¶
40
θ2 = arctan
36.5040 − 25
µ ¶
40
θ1 = 1800 − arctan
35.7377 + 25
Usando la condición de ángulo (5.52) se calcula θ4 y con esto el valor de b:
θ4 = −1800 + (θ1 + θ2 + θ3 )
40
b= + 25 = 31.2463
tan(θ4 )
Por otro lado, de acuerdo a la figura 5.28 se calculan las siguientes longitudes:
p
l4 = 402 + (b − 25)2
p
l3 = 402 + (71.7721 − 25)2
p
l2 = 402 + (36.5040 − 25)2
p
l1 = 402 + (35.7377 + 25)2
con las que finalmente se usa la condición de magnitud (5.53) para calcular k:
l1 l2 l3
k= = 0.0396
116137 l4
La ubicación del tercer polo de lazo cerrado se puede encontrar de la condición
1 + G(s)H(s) = 0 usando G(s)H(s) dada en (5.50) ası́ como b = 31.2463 y
k = 0.0396 es decir:
264 5 Diseño usando la respuesta en el tiempo

116137(s + 31.2463)
1 + 0.0396 =0 (5.55)
s3 + 72.54s2 − 1250s − 9.363 × 104
de donde:

s3 + 72.54s2 + (0.0396 × 116137 − 1250)s


+(0.0396 × 116137 × 31.2463 − 9.363 × 104 ) = 0

Las raı́ces de este polinomio son los polos de lazo cerrado conseguidos con
b = 31.2463 y k = 0.0396. Usando un programa de computadora se encuentra
que estas raı́ces son −25.0037 + j39.9630, −25.0037 − j39.9630 y −22.5326.
Estos polos también son mostrados en la figura 5.27(a) usando signos “+”.
Nótese que se han conseguido los polos complejos conjugados deseados y el
tercer polo, el cual es real, también esta colocado en el semiplano complejo
izquierdo, es decir, se ha conseguido estabilidad en lazo cerrado. Recuérdese
que el factor k(s + b) representa un controlador proporcional-derivativo.
Es importante mencionar que este sistema de control es utilizado para
regular la salida en un valor deseado igual a cero. Esto implica que indepen-
dientemente del tipo del sistema la salida deseada será alcanzada . Ası́ que no
es necesaria ninguna consideración respecto a la respuesta en estado estacio-
nario.
En la figura 5.29 se muestra la respuesta en lazo cerrado (lı́nea continua)
ante una entrada cero, r = 0 (véase la figura 5.1). Se usa (5.50), b = 31.2463
y k = 0.0396. También se muestra, con lı́nea interrumpida, la respuesta de
ω2
un sistema cuya función de transferencia es s2 +2ζωnn s+ω2 cuyos polos están
n
ubicados en s = −25 ± j40. Por tanto, este sistema representa el modelo de
referencia pues su respuesta posee las caracterı́sticas deseadas de la respuesta
transitoria. Ambas respuestas inician a partir de un valor de salida igual a
2.85. Nótese que ambas respuestas son parecidas. Sin embargo, las diferencias
existentes entre ellas se deben al cero en s = −31.2463 y al polo de lazo
cerrado en s = −22.5326, los cuales no están suficientemente cerca como para
que sus efectos sean cancelados completamente.

5.2.7. Control proporcional-integral-derivativo (PID) de un


sistema de levitación magnética

En esta sección se presenta la manera de usar el lugar de las raı́ces para


seleccionar las ganancias de un controlador PID para el sistema de levitación
magnética que se construye y se prueba experimentalmente en el capı́tulo 11.
La función de transferencia de lazo abierto es la siguiente:
à k
!
11613700 kd s2 + kdp s + kkdi
G(s)H(s) = 3 (5.56)
s + 2739s2 − 1250s − 3.536 × 106 s

donde kd es el parámetro que varı́a el método desde 0 hasta +∞ para dibujar


k
el lugar de las raı́ces, mientras que los valores de kdp y kkdi deben ser propuestos.
5.2 Ejemplos 265

2.5

1.5

0.5

−0.5
0 0.05 0.1 0.15 0.2 0.25

Figura 5.29. Respuesta en lazo cerrado del sistema (5.50) a partir de una condición
inicial diferente de cero. Lı́nea continua: respuesta diseñada. Lı́nea interrumpida:
respuesta deseada. Eje vertical: y[m]. Eje horizontal: tiempo en segundos.

En el capı́tulo 11 se explica que se utiliza un controlador PID para asegurar que


se alcanza la posición deseada (constante) aún cuando exista incertidumbre en
el peso de la bola a levitar. Nótese que el controlador PID introduce dos ceros
de lazo abierto. Usando software especializado se encuentra que los cuatro
polos de lazo abierto están colocados en:

s1 = 35.9, s2 = −2739.4, s3 = −35.9, s4 = 0

Usando la regla 3 se encuentra que existen n − m = 4 − 2 = 2 ramas del lugar


de las raı́ces que tienden al infinito en el plano s siguiendo ası́ntotas cuyos
ángulos están dados como:
±180◦
= ±90◦
2
Además, de acuerdo a la regla 4, el punto sobre el eje real donde estas ası́ntotas
se intersectan es:
35.9 − 2739.4 − 35.9 + σz1 + σz2
σa =
2
donde −σz1 < 0 y −σz2 < 0 son las partes reales de los dos ceros de lazo abier-
to introducidos por el controlador PID (estos valores deben ser propuestos).
Es claro que σa se mueve hacia la izquierda (lo que implica que el sistema de
266 5 Diseño usando la respuesta en el tiempo

lazo cerrado se hace más estable) si −σz1 < 0 y −σz2 < 0 se eligen cercanos
a cero. Nótese que esto está de acuerdo con la regla 12. A partir de esto se
concluye que σa < −1100 está colocado muy a la izquierda del origen. Usando
estas observaciones, ası́ como las reglas 1, 2, 5 y 6 se encuentra que existen
las tres posibilidades mostradas en la figura 5.30 para el lugar de las raı́ces de
este problema.
Si se conociera la ubicación de los polos de lazo cerrado que resultan en
un buen desempeño experimental del sistema en lazo cerrado, se podrı́a pro-
ceder como en la sección 5.2.6 para determinar la ubicación adecuada de los
ceros de lazo abierto (introducidos por el controlador PID). Sin embargo, este
no es el caso de este problema y por ello el principal objetivo del diseño es
simplemente conseguir que el sistema en lazo cerrado sea estable. Como ya
se mencionó, es preferible que los dos ceros de lazo abierto estén colocados
cerca del origen. Esto significa que es preferible que el lugar de las raı́ces ten-
ga la forma mostrada en la figura 5.30(a). Por otro lado, dos ceros complejos
forzarı́an la existencia de polos complejos conjugados de lazo cerrado, lo cual
resulta en un sistema menos amortiguado (más difı́cil de estabilizar). Por esta
razón, también se desecha el lugar de las raı́ces de figura 5.30(c). Por tanto,
buscando obtener el lugar de las raı́ces de la figura 5.30(a) se proponen los
siguientes valores:
kp ki 31.24
= 31.24, = (5.57)
kd kd 0.8
pues esto coloca los dos ceros de lazo abierto en:
s5 = −29.9355, s6 = −1.3045
es decir, están colocados entre los polos de lazo abierto ubicados en:
s3 = −35.9, s4 = 0
Nótese que el hecho de que σa < −1100 está colocado muy a la izquierda del
origen y que las ası́ntotas forman ángulos de ±90◦ asegura que existe un valor
mı́nimo de kd a partir del cual todos los polos de lazo cerrado están colocados
en el semi plano complejo izquierdo. Usando los valores numéricos en (5.57)
se utiliza el criterio de Routh para encontrar que:
kd > 0.01 (5.58)
asegura que todos los polos de lazo cerrado están colocados en el semi plano
complejo izquierdo y que el sistema en lazo cerrado es estable. Esto se hace
del siguiente modo. De la condición 1 + G(s)H(s) = 0 (es decir, usando (5.56)
y (5.57)) se obtiene el polinomio caracterı́stico:
s4 + a3 s3 + a2 s2 + a1 s + a0 = 0 (5.59)
a3 = 2739, a2 = 11613700 kd − 1250,
a1 = 11613700 × 31.24 kd − 3.536 × 106 ,
31.28
a0 = 11613700 × kd
8
5.2 Ejemplos 267

Im(s)

ûa Re(s)

(a)
Im(s)

ûa Re(s)

(b)

Im(s)

ûa Re(s)

(c)

Figura 5.30. Diferentes posibilidades para el lugar de las raı́ces del control PID de
un sistema de levitación magnética.
268 5 Diseño usando la respuesta en el tiempo

Para aplicar el criterio de Routh se construye la tabla 5.1. Para que haya

Tabla 5.1. Aplicación del criterio de Routh al polinomio en (5.59).


s4 1 a 2 a0
s3 a3 a1 0
s2 a3 a2 −a1
a3
= e a0 0
s1 ea1 −a3 a0
e
0
s0 a0

estabilidad en lazo cerrado se requiere que no haya cambios de signo en la


primera columna de la tabla 5.1, es decir que:
a3 a2 − a1 ea1 − a3 a0
> 0, > 0, a3 > 0, a0 > 0 (5.60)
a3 e
Nótese que la tercera condición en (5.60) se satisface de manera natural mien-
tras que de la primera y la última condiciones se encuentra que:

kd > −3.5695 × 10−6 , kd > 0 (5.61)

De la segunda condición en (5.60) se obtiene:


µ ¶
2 b1 b3 2 b5 b1 b3
kd + − − 2739 kd − >0 (5.62)
b2 b4 b2 b4 b2 b4
b1 = 112250, b2 = 3.1447 × 1010 , b3 = 3.536 × 106 ,
31.28
b4 = 11613700 × 31.24, b5 = 11613700
8
Dado que se trata de un polinomio de segundo grado, no es difı́cil encontrar
que las raı́ces del polinomio en (5.62) son kd = 0.01 y kd = −3.5 × 10−6 . Más
aún, se puede evaluar numéricamente para encontrar que:

(kd − 0.01)(kd + 3.5 × 10−6 ) > 0, si kd < −3.5 × 10−6


(kd − 0.01)(kd + 3.5 × 10−6 ) < 0, si − 3.5 × 10−6 < kd < 0.01
(kd − 0.01)(kd + 3.5 × 10−6 ) > 0, si kd > 0.01

Por tanto, para satisfacer simultáneamente (5.61) y (5.62) y asegurar estabili-


dad en lazo cerrado, se debe seleccionar (5.58). En el capı́tulo 11 se usan estos
resultados para proponer varios conjuntos de ganancias para el controlador
PID que son probados experimentalmente.

5.2.8. Control de un sistema ball and beam

En esta sección se diseña un controlador para el sistema ball and beam


que se construye y prueba experimentalmente en el capı́tulo 12, sección 12.7.
5.2 Ejemplos 269

Inicialmente suponga que se usará un controlador proporcional de ganancia γ.


Lo primero que se procede a hacer es estudiar la posibilidad de que el sistema
en lazo cerrado pueda ser estable para algún valor positivo de la ganancia γ
(los otros parámetros también son positivos pero no se pueden cambiar). El
diagrama de bloques en lazo cerrado correspondiente se muestra en la figura
5.31. La función de transferencia de lazo cerrado es:

Xd (s) k ú X(s)
Ax í
+ s ( s+ a ) s2
à

Figura 5.31. Sistema en lazo cerrado. Control proporcional de ganancia γ.

X(s) γAx kρ
= 4
Xd (s) s + as3 + γAx kρ
Ax = 5.3750, k = 16.6035, a = 3.3132, ρ=5
La estabilidad del sistema en lazo cerrado se estudia usando el criterio de
Routh. Para ello se construye la tabla 5.2 usando el polinomio caracterı́stico
de lazo cerrado s4 + as3 + γAx kρ. Nótese que un elemento de la primera

Tabla 5.2. Aplicación del criterio de Routh al polinomio s4 + as3 + γAx kρ.
s4 1 0 γAx kρ
s3 a 0 0
s2 0 ≈ ε γAx kρ
s1 −aγA
ε
x kρ
0
0
s γAx kρ

columna es igual a cero por lo que, de acuerdo al método, debe ser sustituido
por un valor ε > 0 pequeño. Nótese que bajo esta condición, existen dos
cambios de signo en la primera columna de la tabla 5.2 y que esto no puede
ser modificado ajustando el valor de γ (positivo). Entonces, se concluye que
no existe ningún controlador proporcional que pueda hacer que el sistema en
lazo cerrado sea estable y debe intentarse con otro controlador.
De acuerdo a la regla 12 de la sección 5.1.1 un controlador PD hace más
estable aquello que no lo es, porque un controlador PD introduce un cero de
lazo abierto. Sin embargo, un controlador PD amplifica el ruido debido a su
parte derivativa. Esto se ve claramente en el capı́tulo 6 porque un contro-
lador PD es un filtro pasa altas y el ruido es una señal de alta frecuencia.
270 5 Diseño usando la respuesta en el tiempo

Una manera de conseguir las propiedades estabilizantes de un controlador PD


pero disminuyendo un poco el efecto del ruido es usando un compensador de
adelanto de la forma γ s+δ
s+c con c > δ > 0. Por esta razón, a continuación se
estudia la posibilidad de estabilizar el sistema en cuestion usando el diagrama
de bloques mostrado en la figura 5.32. La función de transferencia de lazo

Xd (s) k ú X(s)
Ax í s+ î
s+ c s ( s+ a ) s2
+
à

Figura 5.32. Sistema en lazo cerrado. Uso de un compensador de adelanto.

cerrado es:
X(s) γAx kρ(s + δ)
= 5
Xd (s) s + (a + c)s4 + acs3 + γAx kρs + γAx kρδ
La estabilidad del sistema en lazo cerrado se estudia usando el criterio de
Routh. Para ello se construye la tabla 5.3 usando el polinomio caracterı́stico
de lazo cerrado s5 + (a + c)s4 + acs3 + γAx kρs + γAx kρδ. Nótese que, dado que

Tabla 5.3. Aplicación del criterio de Routh al polinomio s5 + (a + c)s4 + acs3 +


γAx kρs + γAx kρδ.
s5 1 ac γAx kρ
s4 a+c 0 γAx kρδ
(a+c)γAx kρ−γAx kρδ
s3 ac a+c
=e
s2 −(a+c)e
ac
=f γAx kρδ
s1 f e−acγAx kρδ
f
0
s0 γAx kρδ

todos los parámetros son positivos, hay al menos dos cambios de signo en la
primera columna de la tabla 5.3. Entonces, se concluye que no existe ningún
compensador de adelanto que pueda hacer que el sistema en lazo cerrado sea
estable y debe intentarse otra estrategia de control. Analizando cuidadosa-
mente la tabla 5.3 se encuentra que el problema es originado por el primer
elemento correspondiente al renglón s2 , es decir −(a+c)e
ac , el cual es negativo.
Nótese que esto es una consecuencia de que el segundo elemento correspon-
diente al renglón s4 es igual a cero. Esto es debido a que la potencia s2 tiene
un coeficiente cero en el polinomio s5 + (a + c)s4 + acs3 + γAx kρs + γAx kρδ.
5.2 Ejemplos 271

Por tanto, se concluye que el sistema en lazo cerrado puede ser estable si el
polinomio caracterı́stio de la función de transferencia de lazo abierto tiene la
potencia s2 con un coeficiente positivo. A continuación se muestra que esto es
posible si se usan dos lazos internos como se muestra en la figura 5.33. Nótese
que se sigue manteniendo el uso del compensador de adelanto. En este caso,

Xd (s) s+ b + + k ú X(s)
Ax í s+ c
ï ë
s ( s+ a ) ï
s2
+ 1 2
à à à

ký s Aò

Figura 5.33. Sistema en lazo cerrado. Uso de lazos internos y un compensador de


adelanto.

la función de transferencia de lazo abierto está dada como:


Ax ρ γ s + b αkAθ 1
G(s)H(s) =
Aθ s + c s2 + (a + kv kAθ )s + αkAθ s2
c > b > 0, γ > 0, Aθ = 0.9167

Nótese que el sistema es tipo 2, por lo que el error en estado estacionario es


cero si la referencia deseada es una constante o una rampa. El lector pue-
de obtener la función de transferencia de lazo cerrado XX(s) d (s)
para verificar
que el polinomio caracterı́stico correspondiente es de grado 5 y con todos los
coeficientes de sus potencias positivos (incluido el coeficiente de s2 ), como se
esperaba. De acuerdo a la discusión previa, esto significa que existe la posibili-
dad de encontrar valores positivos para γ, c, b (con c > b), kv y α que consigan
que el sistema en lazo cerrado sea estable. A continuación se encuentran estos
valores usando el método del lugar de las raı́ces.
Suponga que las raı́ces del polinomio s2 + (a + kv kAθ )s + αkAθ son com-
plejas conjugadas, es decir, que se puede escribir:

s2 + (a + kv kAθ )s + αkAθ = (s + σ + jω)(s + σ − jω), σ > 0, ω>0

De acuerdo a la regla 3 existen n − m = 4 ramas del lugar de las raı́ces que


tienden hacia el infinito del plano s sobre cuatro ası́ntotas cuyos ángulos están
dados como:
±180◦
= ±45◦
4
±180◦ (3)
= ±3(45◦ ) = ±135◦
4
Por tanto, usando estos resultados ası́ como las reglas 1,2 y 5, se concluye que
272 5 Diseño usando la respuesta en el tiempo

Im(s)

x
àû
x x
+
àc àb Re(s)

(a)

Im(s)

x
x àû +
x
àc àb Re(s)
x

(b)

Im(s)

x x
+
à ûà b Re(s)
àc
x

(c)

Figura 5.34. Diferentes posibilidades para el lugar de las raı́ces de un sistema ball
and beam.
5.2 Ejemplos 273

existen las posibilidades mostradas en la figura 5.34. De acuerdo a la regla 4,


el punto donde se intersectan las ası́ntotas mencionadas anteriormente con el
eje real está dado como:
−2σ + (b − c)
σa =
4
Esto significa que las 4 ramas son haladas hacia la izquierda (por lo que el
sistema en lazo cerrado tiende a ser más estable) si:
Se elige un valor mayor de σ > 0, es decir, si el sistema:
αkAθ
(5.63)
s2 + (a + kv kAθ )s + αkAθ
está suficientemente amortiguado, lo cual se consigue usando un valor su-
ficientemente grande de la ganancia kv > 0.
b > 0 se aproxima a cero y c > 0 es grande, es decir si c > b. Nótese que
esto está en completo acuerdo con las reglas 11 y 12.
Siguiendo la segunda opción se obtiene el diagrama del lugar de las raı́ces
mostrado en la figura 5.34(b). Nótese que las dos ramas que inician en los dos
polos colocados en s = 0 siempre permanecen sobre el semiplano complejo
derecho, lo cual implica que el sistema en lazo cerrado es inestable. La principal
razón para este comportamiento es que las ramas que inician en los polos de
la función de transferencia en (5.63) son halados hacia el segmento sobre
el eje real entre s = −c y s = −b. Esto, a su vez, se debe a que los dos
polos complejos de lazo abierto están muy cerca del segmento entre s = −c
y s = −b. Si dichos polos complejos se alejan de dicho segmento entonces se
abre la posibilidad de que las dos ramas que inician en los polos colocados en
s = 0 sean haladas hacia el segmento entre s = −c y s = −b para obtener
el diagrama mostrado en la figura 5.34(c). Esto implica que hay estabilidad
en lazo cerrado para algunos valores pequeños de la ganancia de lazo. Para
conseguir esto, es necesario usar valores grandes del coeficiente αkAθ (esto
incrementa la distancia al origen de los polos complejos de lazo abierto arriba
mencionados), es decir, usando un valor grande de α.
La discusión anterior indica que se deben usar valores grandes de kv y
α. Sin embargo, en la práctica estos valores están limitados por el contenido
de ruido del sistema, por lo que kv y α deben ser obtenidos usando pruebas
experimentales. De hecho, el ruido también es una razón importante para no
seleccionar reales los polos de la función de transferencia en (5.63): obtener
polos reales implica un sistema muy amortiguado lo cual requiere un valor
de kv aún mayor. De acuerdo a las pruebas experimentales reportadas en el
capı́tulo 12 se seleccionaron los siguientes valores:
α = 12, kv = 0.2
Por tanto, los únicos valores que falta determinar son γ, c y b. Aunque estos
parámetros se pueden determinar de manera que los polos de lazo cerrado
274 5 Diseño usando la respuesta en el tiempo

sean asignados en los valores deseados (usando la metodologı́a presentada


en la sección 5.2.6), sin embargo en este problema no se conoce cual es la
ubicación de los polos de lazo cerrado que resultan en un buen desempeño.
Por esta razón, el objetivo de diseño es simplemente que el sistema en lazo
cerrado sea estable. Para conseguir esto se procede del siguiente modo.
Se proponen valores para b y c de modo que c > b > 0.
Se hace uso de software especializado para dibujar el lugar de las raı́ces.
Se elige un valor de γ > 0 para el cual todos los polos de lazo cerrado
estén ubicados en el semi plano complejo izquierdo. Esto significa que γ es
el parámetro usado por el método para dibujar el lugar de las raı́ces.
Si no existe tal valor de γ > 0 se regresa al primer paso.
De este modo se obtiene el lugar de las raı́ces de la figura 5.35 donde se
observa que todos los polos de lazo cerrado (marcados con el sı́mbolo “+”)
tienen parte real negativa si se usa:

γ = 1.2, c = 20, b = 2.5

Finalmente, es conveniente decir que se debe incluir un paso adicional para el


procedimiento arriba listado:
Una vez seleccionados los valores de γ, c y b se deben realizar pruebas
experimentales para verificar que se obtiene un buen desempeño con el
sistema de control diseñado. Si no es ası́, entonces regrese de nuevo al
primer paso del procedimiento arriba listado.

Root Locus

15

10

5
Imaginary Axis

−5

−10

−15

−20 −15 −10 −5 0


Real Axis

Figura 5.35. Lugar de las raı́ces del sistema ball and beam diseñado.
5.3 Caso de estudio 275

5.3. Caso de estudio. Notas adicionales sobre el control


PID de posición de un motor de CD
En la sección 5.2.5 se estudia el uso de un controlador PID para regular
la posición de un motor de CD. Ahı́ se encontró que la posición del motor se
relaciona con la posición deseada y la perturbación externa de par, a través
de dos funciones de transferencia que, sin embargo, tienen el mismo polinomio
caracterı́stico:

s3 + (a + kd k)s2 + kp ks + ki k (5.64)

También se encontró que si se desean asignar los siguientes polos de lazo


cerrado p1 , p2 , p3 :

p1 = σ1 + jω1 , p2 = σ1 − jω1 , p3 < 0, σ1 < 0, ω1 > 0

entonces las ganancias del controlador se deben seleccionar de acuerdo a


(5.40), es decir:

−(2σ1 + p3 ) − a
kd = >0 (5.65)
k
σ 2 + ω12 + 2σ1 p3
kp = 1 >0 (5.66)
k
−p3 (σ12 + ω12 )
ki = >0 (5.67)
k
Por otro lado, en el ejemplo 4.12, del capı́tulo 4, se encontró que todas las
raı́ces del siguiente polinomio:

s3 + as2 + bs + c

tienen parte real negativa si y sólo si:


c
a > 0, b> >0 c>0
a
Aplicando estas condiciones al polinomio caracterı́stico dado en (5.64) se ob-
tiene:
ki k
a + kd k > 0, kp k > , ki k > 0 (5.68)
a + kd k
Usando las expresiones en (5.65), (5.66), (5.67) y (5.68) se puede concluir que
las ganancias de un controlador PID de posición para un motor de CD tienen
los siguientes efectos sobre la respuesta del sistema en lazo cerrado:
Valores mayores y positivos de la ganancia integral, ki , resultan en una
respuesta más rápida y que oscila cada vez más. La primera parte de esta
observación se justifica a partir de (5.67), donde ωn2 = σ12 + ω12 , recordando
276 5 Diseño usando la respuesta en el tiempo

que dos polos complejos conjugados producen una respuesta más rápida si
ωn es mayor y que un polo real y negativo, p3 < 0, produce una respuesta
más rápida si su valor absoluto, −p3 , es mayor. La segunda parte de la
observación se justifica a partir de la segunda desigualdad en (5.68), es
ki k
decir kp k > a+k dk
. Si ki es mayor, entonces esta condición tiende a no ser
válida, es decir, el sistema en lazo cerrado se acerca a la inestabilidad y
por eso oscila cada vez más.
Valores mayores y positivos de la ganancia proporcional, kp , resultan en
una respuesta más rápida cuyas oscilaciones, al menos, no se incrementan
de manera importante. La primera parte de esta observación se justifica a
partir de (5.66) usando argumentos similares a los de la ganancia integral
en el párrafo anterior: recordando que ωn2 = σ12 + ω12 , σ1 p3 > 0, que dos
polos complejos conjugados producen una respuesta más rápida si ωn es
mayor y que un polo real y negativo, p3 , produce una respuesta más rápi-
da si su valor absoluto es mayor. La segunda parte de la observación se
justifica, de nuevo, a partir de la segunda desigualdad en (5.68), es decir
ki k
kp k > a+k dk
. Si kp es mayor, entonces esta condición es cada vez más váli-
da, es decir, el sistema en lazo cerrado se hace cada vez más estable. Sin
embargo, esto, unido al incremento en la rapidez (que en general tiende
a aumentar las oscilaciones de la respuesta), puede resultar en un com-
portamiento transitorio donde, al menos, las oscilaciones no aumentan de
manera importante.
Valores mayores y positivos de la ganancia derivativa, kd , producen una
respuesta que oscila menos. Esta observación se justifica a partir de la
ki k
segunda desigualdad en (5.68), es decir kp k > a+k dk
. Nótese que si kd > 0
es mayor, entonces esta condición es más válida y, por tanto, el sistema en
lazo cerrado es más estable. Ası́, un valor mayor de kd > 0 puede reducir las
oscilaciones debidas a un valor grande de ki > 0. Por otro lado, a partir de
(5.65) se concluye que valores mayores de kd > 0 producen valores mayores
de −σ1 > 0 y/o de −p3 > 0. Usando este hecho, junto con (5.66), (5.67), y
si kp y ki se mantienen constantes, se concluye que si ωn2 = σ12 +ω12 aumenta
(o disminuye), al variar σ1 , entonces −p3 disminuye (o aumenta) por lo
que la rapidez de respuesta no se ve claramente afectada. Sin embargo,
en la prática es común encontrar que al aumentar kd > 0 la rapidez de
respuesta del sistema en lazo cerrado disminuye un poco.
Es conveniente advertir que la función de transferencia entre la posición y
su valor deseado (G1 (s) en (5.37)) tiene dos ceros cuyo efecto sobre la respuesta
transitoria no es del todo clara. Ası́ que es posible que en algunas ocasiones
existan algunas variaciones respecto de los efectos que se acaban de mencionar
para las ganancias de un controlador PID. Además, estas variantes pueden ser
favorecidas por el hecho de que en algunos mecanismos la perturbación externa
está presente desde que se ordena un nuevo valor deseado de posición.
Para ilustrar mejor estas ideas, a continuación se presentan los resultados
obtenidos de manera experimental al controlar la posición de un motor de
5.3 Caso de estudio 277

CD. El prototipo experimental es el mismo que se describe en el capı́tulo 10


con una variante adicional (no presente en dicho capı́tulo): la flecha del motor
se une firmemente a un péndulo como el mostrado en la figura 5.36. De este
modo, y por efecto de la gravedad g, se introduce una perturbación de par
que trata de desviar la posición del motor respecto de su valor deseado. En la
figura 5.36, T (t) representa el par generado por el motor y θ es la variable que
se controla. Los parámetros del péndulo l y m no se miden para mostrar que se
puede sintonizar un controlador PID sin necesidad de conocer los parámetros
de la planta, si se entienden cuales son los efectos de las ganancias de un
controlador PID (listados más arriba).

T(t)

l
ò
g
m

Figura 5.36. Péndulo simple que se conecta a la flecha de un motor de CD.

En las figuras 5.37 y 5.38 se muestran los resultados experimentales corres-


pondientes. Se usa el valor deseado de posición θd = π/2[rad] pues es ahı́ donde
la perturbación de par debida a la gravedad tiene su mayor efecto. Además se
muestra una lı́nea vertical ubicada en t = 0.13[s] y una lı́nea horizontal ubica-
da en θ = 1.8[rad] para indicar el tiempo de subida y el sobre paso deseados.
La intención es variar un parámetro a la vez con el fin de apreciar claramente
su efecto. De este modo, las curvas dibujadas en la figura 5.37 corresponden
a los siguientes parámetros de controlador PID:
1. Gráfica superior:
Lı́nea contı́nua: kp = 0.5, ki = 0, kd = 0.
Lı́nea-punto: kp = 1, ki = 0, kd = 0.
Lı́nea punteada: kp = 1, ki = 0, kd = 0.05.
2. Gráfica inferior:
Lı́nea contı́nua: kp = 1, ki = 2, kd = 0.05.
Lı́nea-punto: kp = 1, ki = 5, kd = 0.05.
Lı́nea punteada: kp = 2, ki = 5, kd = 0.05.
Lı́nea interrumpida: kp = 2, ki = 5, kd = 0.1.
Como el sistema en lazo cerrado es de tercer orden cuando se usa un con-
trolador PID y, además, no se conocen los parámetros del motor a controlar,
278 5 Diseño usando la respuesta en el tiempo

es difı́cil saber que ganancias del controlador hay que utilizar para evitar la
inestabilidad. Ası́ que lo mejor es iniciar con un controlador PD (asignando
ki = 0), que produce un sistema en lazo cerrado de segundo orden el cual es
estable para cualquier valor positivo de kp con kd = 0 (pues todo mecanismo
real posee un poco de fricción). Posteriormente, de acuerdo a la respuesta
transitoria que se vaya obteniendo y a las reglas de sintonı́a arriba listadas,
se podrá empezar a ajustar las ganancias ki y kd de manera que se consigan
respuestas estables. Por esta razón, en la parte superior de la figura 5.37 se
utiliza un controlador PD. Nótese que se obtiene un error en estado esta-
cionario diferente de cero debido a la perturbación de par que introduce la
gravedad (porque ki = 0). En esta parte del experimento, la idea es acercar
la rapidez del sistema a la rapidez deseada asegurando un comportamiento
suficientemente estable. Por esta razón, primero se incrementa la ganancia
proporcional hasta kp = 1 y luego se incrementa la ganancia derivativa has-
ta kd = 0.05. De este modo, en la parte inferior de la figura 5.37, se puede
introducir el término integral que aunque lleva a cero el error en estado es-
tacionario produce respuestas más oscilatorias. De nuevo, la idea es tratar de
aproximarse a la rapidez de respuesta deseada. Esto se consigue incrementan-
do primero la ganancia integral hasta ki = 5. Como esto también incrementa
las oscilaciones, posteriormente se usa kp = 2 consiguiendo mayor rapidez pero
sin aumentar notablemente las oscilaciones. Finalmente, se usa kd = 0.1 para
obtener una respuesta suficientemente amortiguada. Nótese que el incremento
de kd reduce un poco la rapidez de la repuesta (tiempo de subida mayor).
Las curvas dibujadas en la figura 5.38 corresponden a los siguientes
parámetros de controlador PID:
1. Gráfica superior:
Lı́nea contı́nua: kp = 2, ki = 5, kd = 0.1.
Lı́nea-punto: kp = 2, ki = 5, kd = 0.2.
Lı́nea punteada: kp = 2, ki = 8, kd = 0.2.
2. Gráfica inferior:
Lı́nea contı́nua: kp = 2, ki = 8, kd = 0.2.
Lı́nea-punto: kp = 2.5, ki = 8, kd = 0.2.
Lı́nea punteada: kp = 3, ki = 8, kd = 0.2.
Lı́nea interrumpida: kp = 3.5, ki = 8, kd = 0.2.
En la gráfica superior de la figura 5.38 se observa que la respuesta es aún más
amortiguada y más lenta al incrementar la ganancia derivativa de kd = 0.1
a kd = 0.2. Como en este momento la respuesta es muy lenta y el sobre
paso es muy pequeño, se usa ki = 8 para producir un sistema más rápido
y con un sobre paso mayor que coincide con el sobre paso deseado. Con el
fin de incrementar la rapidez, sin afectar notablemente el sobre paso, en la
parte inferior de la figura 5.38 se incrementa la ganancia proporcional hasta
kp = 3.5. De este modo se consigue la rapidez y el sobre paso deseados.
Es conveniente aclarar lo siguiente. Al conectar un péndulo a la flecha de
un motor de CD, el sistema de control es no lineal. Esto significa que en ciertas
5.3 Caso de estudio 279

ò
[rad]

tiempo[s]
ò
[rad]

tiempo[s]

Figura 5.37. Control PID de posición de un motor de CD con una carga pendular.
Resultados experimentales.

regiones el comportamiento del sistema de control no es predicho adecuada-


mente por el análisis matemático presentado más arriba. Por ejemplo, si el
valor deseado de posición es cercano a θd = ±π, un simple control PD puede
ser inestable si la ganancia proporcional (positiva) no es mayor que un cierto
umbral inferior. Este resultado se obtiene usando un controlador PD en el caso
x∗1 = ±π, x∗2 = 0 del ejemplo 7.3 estudiado en el capı́tulo 7 y obteniendo los
polos de dicha aproximación lineal. También pueden consultarse los trabajos
reportados en [4], [2], cap. 8, [3], cap. 7. Esta situación es más grave cuando se
trata de un controlador PID pero el problema no aparece si el valor deseado
de posición se mantiene alejado de θd = ±π, situación que corresponde a los
experimentos aquı́ presentados.
Finalmente, nótese que se ha conseguido seleccionar las ganancias de un
controlador PID de posición para un motor de CD sin necesidad de conocer el
valor numérico de ningún parámetro del motor ni del péndulo. Sin embargo, el
conocimiento mı́nimo con el que se debe contar para resolver este problema,
desde el punto de vista de construcción del mecanismo, es verificar previa-
mente que el motor puede producir par suficiente. Esto debe incluir el par
necesario para compensar el efecto de la gravedad más una parte adicional de
par que permita alcanzar la rapidez de respuesta deseada.
280 5 Diseño usando la respuesta en el tiempo

ò
[rad]

tiempo[s]
ò
[rad]

tiempo[s]

Figura 5.38. Control PID de posición de un motor de CD con una carga pendular.
Resultados experimentales.

5.4. Resumen del capı́tulo

El método más poderoso para el diseño de sistemas de control usando la


respuesta en el tiempo es el lugar de las raı́ces. Esto significa que las plantas
a controlar pueden ser sistemas de orden arbitrario con cualquier número de
ceros. Este método provee las herramientas necesarias para determinar, de
manera gráfica, la ubicación de los polos de lazo cerrado a partir de los polos
y ceros de lazo abierto. Algunos de los polos y ceros de lazo abierto son intro-
ducidos por el controlador y la idea del método es ajustar la ubicación de los
polos y ceros del controlador (mediante la selección adecuada de sus ganan-
cias) de manera que se consigan los polos de lazo cerrado deseados. Los polos
de lazo cerrado deseados se determinan a partir del conocimiento de cómo
afectan los polos de una función de transferencia a la respuesta transitoria
correspondiente. Para esto es muy importante el estudio previo del capı́tulo
3. Por otro lado, la estructura del controlador se selecciona a partir del co-
nocimiento de cómo influyen los polos (de lazo abierto) del controlador sobre
la respuesta en estado estacionario del sistema en lazo cerrado. Para esto es
muy importante el estudio previo del error en estado estacionario presentado
en el capı́tulo 4.
5.5 Preguntas de repaso 281

Aunque el lugar de las raı́ces ha sido usado como un método de diseño


de controladores, también es una herramienta poderosa para el análisis de
sistemas de control. Esto significa que se puede utilizar para determinar: i)
que tan estable es un sistema de control, ii) cómo afecta el cambio de un
parámetro a la respuesta del sistema de control, iii) qué debe hacerse para
modificar las propiedades del sistema de control, etc. El uso del método del
lugar de las raı́ces en estas aplicaciones depende en gran medida de un buen
entendimiento del método y del conocimiento del material presentado en los
capı́tulos 3 y 4.

5.5. Preguntas de repaso

1. ¿Cuándo y para qué utilizarı́a cada uno de los siguientes controladores?


Proporcional.
Proporcional-derivativo.
Proporcional-integral.
Proporcional-integra-derivativo.
2. ¿Por qué cree que no es recomendable el uso de controladores: i) derivati-
vos, ii) integrales y iii) derivativos-integrales, sin la presencia de la parte
proporcional? Explique.
3. ¿De qué manera el error en estado estacionario determina los polos y/o
ceros (la estructura) del controlador?
4. ¿Cuál es el componente principal que debe tener un controlador si se desea
mejorar la estabilidad del sistema en lazo cerrado? ¿Cuál es el efecto de
esto sobre el lugar de las raı́ces?
5. ¿Cuál es el componente principal que debe tener un controlador si se desea
mejorar el error en estado estacionario? ¿Cuál es el efecto de esto sobre el
lugar de las raı́ces?
6. ¿Por qué el lugar de las raı́ces inicia en los polos de lazo abierto y ter-
mina en los ceros de lazo abierto? ¿Qué significan las palabras “inicia” y
“termina”?
7. Si la función de transferencia de lazo abierto no tiene ceros ¿En dónde
termina el lugar de las raı́ces?
8. Con frecuencia se dice que al aumentar la ganancia de lazo el sistema en
lazo cerrado tiende a hacerse inestable. Sin embargo, esto no siempre es
cierto pues depende de las caracterı́sticas de la planta que se está contro-
lando. Revise los ejemplos presentados en este capı́tulo y dé un ejemplo
de una planta a controlar que requiera que la ganancia de lazo sea sufi-
cientemente grande para que el sistema en lazo cerrado sea estable.
9. ¿Qué es un compensador de adelanto, cuál es su principal caracterı́stica y
para qué se usa?
10. Consulte la sección 9.8 del capı́tulo 9, las secciones 10.2.2 y 10.5 del capı́tu-
lo 10 y la sección 8.2 del capı́tulo 8 para explicar cómo construirı́a un con-
282 5 Diseño usando la respuesta en el tiempo

trolador PID y un compensador de adelanto usando software y electrónica


analógica.

5.6. Ejercicios propuestos


1. Considere el sistema de control de la figura 5.39 donde:
k = 35.2671, a = 3.5201, c = 10.3672, γ = 2.0465, d = 3.8935
Verifique que cuando ki = 0 y kp = 1 hay dos polos complejos conjugados
de lazo cerrado en s = −4.8935 ± j6.6766. Con la ayuda de algún software
especializado, obtenga el lugar de las raı́ces para los siguientes valores de
ki :
ki = 0.001, 0.01, 0.1, 1, 10
Use el valor de kp como la ganancia que el método varı́a desde 0 hasta +∞
para dibujar el gráfico. Seleccione el valor de kp = 1 y observe que pasa con
los polos de lazo cerrado correspondientes con respecto a los puntos s =
−4.8935±j6.6766. Utilice software especializado para realizar simulaciones
en cada caso cuando la referencia es un escalón unitario. Compare la
respuesta obtenida conforme ki crece con la respuesta obtenida cuando
kp = 1 y ki = 0. Elabore los lugares de las raı́ces correspondientes usando
el método propuesto en este capı́tulo y explique lo que sucede.

òd ( s) + k ò(s)
k
kp + si í s+d
s+c s(s+a)
à

Figura 5.39. Controlador PI en cascada con una red de adelanto.

2. Considere la siguiente planta:


k
Y (s) = H1 (s)U (s), H1 (s) = , k = 35.2671, a = 3.5201
s(s + a)
a) Utilice las expresiones en (3.59) del capı́tulo 3 para obtener los valores
de kp y kv que consigan las siguientes caracterı́sticas de respuesta
transitoria:
tr = 0.33[s], Mp ( %) = 10
cuando yd es un escalón unitario (constante igual a uno) y se utiliza
la siguiente entrada: u(t) = kp (yd − y) − kv ẏ, control proporcional con
realimentación de velocidad.
5.6 Ejercicios propuestos 283

b) Considere que la entrada está dada como:


d(yd − y)
u(t) = kp (yd − y) + kd , control proporcional-derivativo
dt
Obtenga la función de transferencia de lazo cerrado y use las expre-
siones en (3.59) del capı́tulo 3 para determinar kp y kd de manera que
los polos de lazo cerrado se ubiquen en lugares tales que determinen
las siguientes carcterı́sticas de lazo cerrado:
tr = 0.33[s], Mp ( %) = 10
Haga simulaciones para cada uno de los incisos anteriores y compare las
respuestas obtenidas. ¿A qué se debe la diferencia existente entre estas
respuestas? ¿Los ceros de una función de transferencia pueden afectar la
forma exacta de la respuesta? ¿Puede usar el lugar de las raı́ces para
explicar esta diferencia?
3. Considere un sistema en lazo cerrado como el de la figura 5.1 con H(s) = 1
y G(s) = s3 +s21+s+1 .
Usando las reglas presentadas en la sección 5.1.1 construya el lugar de
las raı́ces correspondiente a un controlador proporcional. Compruebe
que el sistema en lazo cerrado es inestable para cualquier valor positivo
de la ganancia del controlador proporcional. Use el criterio de Routh
como alternativa para encontrar este resultado.
Con el fin de estabilizar el sistema en lazo cerrado y para conseguir un
error cero en estado estacionario ante una referencia tipo escalón diseñe
un controlador PID del siguiente modo. i) Proponga kd s2 + kp s + ki =
kd (s − z1 )(s − z2 ), con z1 = −0.5 + 1.3j, z2 = −0.5 − 1.3j. Usando
las reglas presentadas en la sección 5.1.1 dibuje el lugar de las raı́ces
correspondiente para verificar que no existe ningún valor positivo de la
ganancia derivativa que produzca un sistema en lazo cerrado estable.
ii) Proponga kd s2 +kp s+ki = kd (s−z1 )(s−z2 ), con z1 = −0.25+1.3j,
z2 = −0.25 − 1.3j. Usando las reglas presentadas en la sección 5.1.1
dibuje el lugar de las raı́ces correspondiente para verificar que existe un
rango de valores positivos de la ganancia derivativa kd que producen
un sistema en lazo cerrado estable. Utilice el criterio de Routh para
encontrar el rango de valores de kd que consiguen estabilidad en lazo
cerrado.
De acuerdo a lo anterior ¿Cómo debe seleccionar los ceros de un con-
trolador PID para mejorar la estabilidad del sistema en lazo cerrado?
4. Verifique que la función de transferencia del circuito mostrado en la figura
5.40 es:
Vo (s) s+a 1 1 1
= , a= , b= +
Vi (s) s+b R1 C R1 C R2 C
Nótese que como b > a esta red eléctrica puede usarse como un compen-
sador de adelanto.
284 5 Diseño usando la respuesta en el tiempo

+
+ R1
vi vo
à
R2 à

Figura 5.40. Compensador de adelanto.

5. Considere la siguiente planta:


4(s + 0.2)
G(s) =
(s + 0.5)(s2 − 0.2s + 0.3)
Use la técnica del lugar de las raı́ces para diseñar un controlador que ase-
gure estabilidad en lazo cerrado y un error cero en estado estacionario
cuando la referencia deseada es un escalón. Se sugiere proponer la ubica-
ción de los polos y ceros del controlador y luego seleccionar la ganancia
de lazo abierto de manera que todos los polos de lazo cerrado pertenezcan
al semiplano complejo izquierdo.
6. Considere el control PD de posición estudiado en la sección 5.2.2. Demues-
tre que el valor de la ganancia derivativa kd no afecta al error en estado
estacionario cuando la referencia deseada es una constante.
7. Considere el control PID de posición estudiado en la sección 5.2.5. De-
muestre que los valores de las ganancias proporcional kp y derivativa kd
no afectan al error en estado estacionario a pesar de la presencia de una
perturbación constante cuando la referencia deseada también es constante.
En este mismo problema suponga que no existe la parte integral del contro-
lador, es decir que ki = 0. Demuestre que el valor de la ganancia derivativa
kd no afecta al error en estado estacionario a pesar de la presencia de la
perturbación.
8. Considere el sistema masa-resorte-amortiguador mostrado en la figura 5.41
y modelado en el ejemplo 2.2 del capı́tulo 2. En el ejemplo 3.18 del capı́tu-
lo 3 se explica porqué hay un error en estado estacionario diferente de cero
cuando se usa un controlador proporcional de posición y la posición de-
seada xd es una constante diferente de cero. Recuerde que la fuerza F (t)
aplicada sobre la masa es la señal entregada por el controlador.
Ahora suponga que se usa un controlador PID de posición. Encuentre el
error en estado estacionario cuando la posición deseada xd es un valor
5.6 Ejercicios propuestos 285

constante diferente de cero. Use su experiencia cotidiana para explicar el


porqué de su respuesta, es decir, trate de explicar pensando en qué pasa
con la fuerza F (t) aplicada sobre la masa y qué efecto tiene el resorte
sobre la masa.

K F (t) b
m

Figura 5.41. Sistema masa-resorte-amortiguador.

9. Considere el péndulo simple estudiado en el ejemplo 2.13 del capı́tulo 2 y


mostrado en la figura 5.42. Nótese que la gravedad ejerce un par diferente
de cero sobre el péndulo si la posición angular θ no es igual a cero. Suponga
que se desea llevar la posición θ del péndulo a un valor constante θd
igual a 90◦ . Nótese que el par T (t) es la entrada del péndulo. Usando
la experiencia del ejercicio previo, diga qué tipo de controlador utilizarı́a
para calcular T (t) de manera que θ consiga alcanzar a θd . Explique por
qué. Este problema está hecho para que razone y no necesita utilizar el
modelo matemático del péndulo. De hecho, dicho modelo matemático es
no lineal y por eso no puede ser analizado usando las técnicas estudiadas
hasta aquı́.

T(t)

l
ò
g
m

d
Figura 5.42. Péndulo simple.
286 5 Diseño usando la respuesta en el tiempo

10. Considere una planta cualquiera G(s) y los siguientes controladores colo-
cados en cascada con G(s):
s+a
Gc (s) = , 0<a<b
s+b
s+c
Gd (s) = , c>d>0
s+d
Gc (s) se conoce como un compensador de adelanto mientras que Gd (s) se
conoce como un compensador de atraso.
¿Cuál es el efecto de cada uno de estos compensadores sobre el error
en estado estacionario ante una referencia escalón?
¿Cuál es el efecto de cada uno de estos compensadores sobre la esta-
bilidad relativa del sistema en lazo cerrado?
¿Con cuál de estos compensadores se relaciona un controlador PI y
con cuál un controlador PD? Explique por qué.
¿Cómo construirı́a con estos dos compensadores un controlador que
tenga caracterı́sticas similares a las de un PID? Explique.
11. En un barco es común contar con un único girocompás que indica el rum-
bo actual de barco. Sin embargo, se debe contar con esta información en
diferentes puntos del barco por lo que es necesario transmitir esta infor-
mación electrónicamente para exhibirla en cada punto del barco donde se
necesita usando un instrumento de aguja. La posición angular de la aguja
es ajustada con un motor de CD usando la información suministrada por
el girocompás como la posición deseada. Diseñe un sistema de control en
lazo cerrado de manera que la posición de la aguja del instrumento siga
fielmente a la orientación suministrada por el girocompás de acuerdo a las
siguientes especificaciones:
Que ante un cambio tipo escalón de 8◦ en la orientación del girocompás,
el error en estado estacionario se reduzca y se mantenga en menos de
1◦ en 0.3 segundos o menos y que el sobre paso sea menor o igual al
25 %.
Cuando la orientación del girocompás cambie de acuerdo a una rampa
de 5◦ por segundo, que el error en estado estacionario sea de 0.3◦ o
menos.
No existen perturbaciones externas.
¿Bajo que condiciones de operación del barco pueden ocurrir estas situa-
ciones? La función de transferencia entre el voltaje aplicado al motor y la
posición de la aguja en grados es:

45.84 × 10−5
G(s) =
s(4.4 × 10−9 s2 + 308.5 × 10−9 s + 3.3 × 10−6 )
Sugerencia.
i) En base las especificaciones suministradas decida qué controlador de-
berá usar. ii) Usando la primera especificación determine una zona, en el
5.6 Ejercicios propuestos 287

dominio del tiempo, dentro de la cual debe estar la respuesta del siste-
ma en lazo cerrado. iii) Recuerde que, de acuerdo a la figura 3.10 en el
capı́tulo 3, la respuesta de un sistema de segundo orden esta contenida
dentro de dos envolventes exponenciales que dependen de ζ y de ωn . Con
esta información, usando el amortiguamiento deseado y usando el punto
ii) anterior, determine la zona del plano complejo s dentro de la cual de-
ben caer los polos dominantes (complejos conjugados) del sistema en lazo
cerrado. iv) Determine un punto conveniente sobre la frontera de dicha
zona del plano s y use las reglas vistas para construir el lugar de las raı́ces
para determinar las ganancias de un controlador que consiga que dicho
punto sea un polo de lazo cerrado. v) Una vez conseguido esto, seleccio-
ne una ganancia de lazo abierto que asegure que todos los polos de lazo
cerrado estén dentro de la zona deseada. vi) Verifique que se cumple la se-
gunda especificación y, si no es ası́, rediseñe el controlador. vii) Mediante
simulaciones verifique que se satisfacen todas las especificaciones.
Referencias

1. G.W. Evans, The story of Walter R. Evans and his textbook Control-Systems
Dynamics, IEEE Control Systems Magazine, pp. 74-81, December 2004.
2. R. Kelly, V. Santibáñez and A. Lorı́a, Control of robot manipulators in joint
space, Springer, London, 2005.
3. R. Kelly y V. Santibáñez, Control de movimiento de robots manipuladores, Pear-
son Prentice Hall, Madrid, 2003.
4. R. Kelly, PD control with desired gravity compensation of robotic manipulators:
a review, The International Journal of Robotcs Research, vo. 16, No. 5, pp. 660-
672, 1997.
5. K. Ogata, Ingenierı́a de Control Moderna, 4a. edición, Pearson Prentice-Hall,
Madrid, 2003.
6. N.S. Nise, Sistemas de control para ingenierı́a, 1a. edición en español, 1a. Re-
impresión, CECSA, México, 2004.
7. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edición, Pearson
Prentice-Hall, Madrid, 2008.
8. B.C. Kuo, Sistemas de control automático, 7a. edición, Prentice-Hall Hispanoa-
mericana, México, 1995.
9. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edición en
español, McGraw-Hill, México, 1992.
10. W. Ali and J.H. Burghart, Effects of lag controllers on the transient response,
IEE Proceedings-D, Control theory and applications, vol. 138, no. 2, pp. 119-122,
March 1991.
6
Diseño usando la respuesta en frecuencia

Uno de los problemas más importantes y urgentes por resolver durante


la Segunda Guerra Mundial fue el direccionamiento de cañones antiaéreos.
La solución de este problema motivó en buena medida el desarrollo del con-
junto de herramientas que hoy conocemos como las técnicas de respuesta en
frecuencia. Aunque las ideas de Nyquist fueron formuladas un poco antes de
este perı́odo, las ideas de Bode sobre los márgenes de fase y de ganancia,
ası́ como el ancho de banda, fueron establecidas durante este perı́odo. El uso
de estas herramientas, en conjunto con el desarrollo de otras ideas como los
diagramas de bloques, fue fundamental para resolver el problema de controlar
cañones antiaéreos.
292 6 Diseño usando la respuesta en frecuencia

Objetivos del capı́tulo

Entender qué significa respuesta en frecuencia y conocer los conceptos fun-


damentales de este enfoque.
Conocer la relación entre las caracterı́sticas de respuesta en frecuencia y
las caracterı́sticas de respuesta en el tiempo.
Usar los conceptos de respuesta en frecuencia para el análisis y diseño de
sistemas de control.
En el capı́tulo 5 se presenta un método para diseñar sistemas de control
que se conoce como el método de la respuesta en el tiempo. La caracterı́stica
principal de ese método es que trata de ubicar convenientemente los polos de
lazo cerrado de manera que la respuesta transitoria tenga las caracterı́sticas
deseadas. Para ese método es fundamental saber cómo es la respuesta transi-
toria en el tiempo que introducen los polos de lazo cerrado: reales, complejos
conjugados, sencillos, repetidos, etc.
En el presente capı́tulo se introduce un nuevo método para el diseño de
sistemas de control que se conoce como el método de la respuesta en frecuencia.
Fundamental para este estudio es entender que si una ecuación diferencial
lineal se excita con una entrada que es una función sinusoidal del tiempo,
entonces la salida también será, en estado estacionario, una función sinusoidal
del tiempo de la misma frecuencia que la entrada pero con una amplitud y
una fase diferentes. La base de este método radica en estudiar como varı́an la
amplitud y la fase de la señal de salida al cambiar la frecuencia de la señal
sinusoidal aplicada a la entrada. Esto es lo que se conoce como respuesta en
frecuencia. Como se muestra en este capı́tulo, la manera en que cambian la
amplitud y la fase de la señal de salida depende de cómo son y en dónde están
ubicados los polos y los ceros de la función de transferencia correspondiente a
la ecuación diferencial bajo estudio. La estrategia de diseño en este método es
modificar convenientemente las caracterı́sticas de respuesta en frecuencia del
sistema en lazo abierto de manera que se obtengan las caracterı́sticas deseadas
de la respuesta en el tiempo del sistema en lazo cerrado.
Puede afirmarse que cualquier problema de diseño en control clásico puede
ser resuelto usando cualquiera de los métodos: el método de la respuesta en
el tiempo o el método de la respuesta en frecuencia. Esto significa que ambos
métodos suministran las herramientas necesarias para cualquier problema de
control clásico. Sin embargo, dado que cada método analiza el mismo problema
desde puntos de vista diferentes, cada uno suministra información que puede
ser complementaria a la suministrada por el otro método. Ası́ que es muy
importante que se dominen ambos métodos.

6.1. Un circuito RC de corriente alterna


A continuación se presentan algunos resultados experimentales obtenidos
con el circuito eléctrico de la figura 6.1(a). Se utiliza un generador de señales
6.1 Un circuito RC de corriente alterna 293

para aplicar el siguiente voltaje de entrada:

vi (t) = A sin(ωt) (6.1)

En el osciloscopio se observa una situación como la que se muestra en la figura


6.1(b), es decir el voltaje de salida (en el capacitor) tiene la forma:

v0 (t) = B sin(ωt + φ)
360 tφ
φ= [grados]
T
Esto significa que ambas señales vi (t) y v0 (t) son funciones sinusoidales de la

ýi (t) i (t) C ý0 (t)

(a)

A
B

tþ t
ý 0 (t)
ý i (t)

(b)

Figura 6.1. Relaciones entre los voltajes de entrada y de salida en un circuito RC.

misma frecuencia. Es importante aclarar que, bajo la situación mostrada en la


figura 6.1(b), el valor de φ es considerado negativo, es decir que el voltaje de
salida, v0 (t), está atrasado respecto de la entrada, vi (t). Utilizando diferentes
valores de frecuencia, ω, se obtienen las mediciones mostradas en la tabla 6.1
las cuales se muestran graficadas en la figura 6.2 (lı́nea continua). La primera
de estas figuras muestra cómo varı́a el cociente B/A al cambiar la frecuencia
ω y la otra como varı́a la fase φ al cambiar la frecuencia ω.
294 6 Diseño usando la respuesta en frecuencia

Tabla 6.1. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a).


f [Hz] ω = 2πf [×105 rad/s] A [V] B [V] φ [grados]
50 0.0031 1.04 1.04 0
60 0.0038 1.04 1.04 0
70 0.0044 1.04 1.04 0
80 0.0050 1.08 1.08 0
90 0.0057 1 1 0
100 0.0063 0.7 0.7 0
200 0.0126 0.7 0.68 0
300 0.0188 0.98 0.94 -11.92
400 0.0251 1.02 0.9 -13.06
500 0.0314 1.2 1.1 -18
600 0.0377 1.2 1.1 -23.85
700 0.0440 1.22 1.1 -25.71
800 0.0503 1.24 1.1 -29.03
900 0.0565 1.22 1.08 -29.45
1000 0.0628 1.04 0.88 -29.38
2000 0.1257 1.22 0.8 -52.89
3000 0.1885 1.22 0.62 -65.8
4000 0.2513 1.22 0.5 -79.28
5000 0.3142 1.2 0.4 -79.2
6000 0.3770 1.12 0.28 -81.42
7000 0.4398 1.02 0.252 -88.73
8000 0.5027 0.83 0.22 -85.71
9000 0.5655 1.08 0.212 -94
10000 0.6283 1.08 0.28 -86.4
20000 1.2566 1.2 0.112 -83.22
30000 1.8850 1.2 0.08 -86.74
40000 2.5133 1.2 0.057 -83.52
50000 3.1416 1.18 0.047 -86.4

Se dice que el comportamiento mostrado en la figura 6.2 es el de un filtro


pasa bajas. Esto significa que las señales de baja frecuencia (cercanas a ω = 0)
son poco atenuadas, B/A ≈ 1, mientras que las señales de alta frecuencia (ω
muy grande) son fuertemente atenuadas, B/A ≈ 0. Por “atenuar” se debe
entender que el voltaje de salida v0 (t) tiene un amplitud menor que la amplitud
del voltaje de entrada vi (t), es decir, B es menor que A.

6.1.1. Representaciones gráficas comunes

Gráficas de Bode

Suponga que se tiene un número k. El valor correspondiente en decibeles


(dB) se obtiene mediante la operación:
6.1 Un circuito RC de corriente alterna 295
B
A

p1
2

1
RC

þ
[grados]
à 45

1
RC
! [rad=s]

Figura 6.2. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a)


(véase la tabla 6.1).

kdB = 20 log(k)
donde log(k) representa el logaritmo base 10 de k. El logaritmo base 10 de k
se define del siguiente modo. Si:
10z = k
entonces z = log(k). A continuación se presentan algunas propiedades impor-
tantes y algunos valores que toman los logaritmos:
log(xy) = log(x) + log(y), log(x/y) = log(x) − log(y), (6.2)
log(xm ) = m log(x), log(1) = 0,
Si x → 0 entonces log(x) → −∞
Las gráficas de Bode se dibujan sobre papel semilogarı́tmico: el eje horizontal
(ω) tiene escala logarı́tmica mientras que el eje vertical tiene escala lineal.
Utilizando los valores de la tabla 6.1 se obtienen los datos mostrados en la
tabla 6.2. En la figura 6.3 se muestran las gráficas de Bode correspondientes
(lı́nea continua).
Nótese lo siguiente:
Cuando ω → 0. En la figura 6.3 se tiene que 20log(B/A) → 0 [dB] lo
cual corresponde, en la figura 6.2, a B/A → 1. Esto está de acuerdo con
log(1) = 0. En ambas figuras 6.3 y 6.2 se tiene que φ → 0[grados].
296 6 Diseño usando la respuesta en frecuencia

Tabla 6.2. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a).


ω = 2πf [×105 rad/s] 20log(B/A) [dB] φ [grados]
0.0031 0 0
0.0038 0 0
0.0044 0 0
0.0050 0 0
0.0057 0 0
0.0063 0 0
0.0126 -0.2518 0
0.0188 -0.3620 -11.92
0.0251 -1.0872 -13.06
0.0314 -0.7558 -18
0.0377 -0.7558 -23.85
0.0440 -0.8993 -25.71
0.0503 -1.0406 -29.03
0.0565 -1.0587 -29.45
0.0628 -1.4510 -29.38
0.1257 -3.6654 -52.89
0.1885 -5.8794 -65.8
0.2513 -7.7478 -79.28
0.3142 -9.5424 -79.2
0.3770 -12.0412 -81.42
0.4398 -12.1440 -88.73
0.5027 -11.5331 -85.71
0.5655 -14.1418 -94
0.6283 -11.7253 -86.4
1.2566 -20.5993 -83.22
1.8850 -23.5218 -86.74
2.5133 -26.4661 -83.52
3.1416 -27.9957 -86.4

Cuando ω → +∞. En la figura 6.3 se tiene que 20log(B/A) → −∞ [dB]


lo cual corresponde, en la figura 6.2, a B/A → 0. Esto está de acuerdo
con log(x) → −∞ si x → 0. En ambas figuras 6.3 y 6.2 se tiene que
φ → −90[grados].
Cuando ω = 1/RC =10 000[rad/s]. En la figura 6.3 se tiene que
√ 20log(B/A)
= −3 [dB] lo cual corresponde, en la figura 6.2, a B/A = 1/ 2. En ambas
figuras 6.3 y 6.2 se tiene que φ = −45[grados].
Es posible observar que en las gráficas de Bode es más fácil identificar la
frecuencia a partir de la cual el circuito RC atenúa las señales de salida. Esta
es una de las razones por las que se introducen las gráficas de Bode.
6.1 Un circuito RC de corriente alterna 297
ð ñ
20log B A
[dB] à3

1
RC

þ
[grados]

à 45

1
RC

! [rad=s]

Figura 6.3. Gráficas de Bode para el circuito en la figura 6.1(a).

Gráficas polares
En la figura 6.4 se define el número complejo G de la siguiente manera:
B
G= ∠φ = Re(G) + jIm(G)
A
B B B
|G| = , Re(G) = cos(φ), Im(G) = sin(φ)
A A A

G
Im (G)
jG j

þ
Re (G)

Figura 6.4. Número complejo.

Usando estas definiciones, los valores mostrados en la tabla 6.1 se pueden


graficar como en la figura 6.5 (lı́nea continua). Esta gráfica se conoce como
298 6 Diseño usando la respuesta en frecuencia

gráfica polar. En esta gráfica la frecuencia crece desde ω = 0 hasta ω = +∞


de acuerdo a la dirección indicada por la flecha. De acuerdo a la definición de
G, el cociente B/A esta determinado por la distancia hacia el origen medida
desde el punto correspondiente y φ es el ángulo medido respecto del eje real
positivo. Con estas observaciones es posible identificar los puntos a los cuales
ω = 0, ω = +∞ y ω = 1/RC (aquel en el cual el ángulo formado con el eje
real positivo es −45[grados]). La razón principal por la que se introduce la
gráfica polar tiene que ver con el criterio de estabilidad que se presentará más
adelante.

! =+1 !=0
Im(G) ï ï

à 45

ï
! = R1C

Re(G)

Figura 6.5. Gráfica polar para el circuito de la figura 6.1(a).

6.1.2. Modelo matemático

Aplicando la ley de voltajes de Kirchhoff al circuito de la figura 6.1(a) se


encuentra:
Z Z
1 t 1 t
vi (t) = iR + i(τ )dτ, v0 (t) = i(τ )dτ
C 0 C 0
Aplicando la transformada de Laplace (3.2):
1 1
Vi (s) = I(s)R + I(s), V0 (s) = I(s)
sC sC
6.1 Un circuito RC de corriente alterna 299

Combinando estas expresiones se tiene:


a 1
V0 (s) = Vi (s), a= (6.3)
s+a RC
Sea vi (t) la señal presentada en (6.1), entonces su transformada de Laplace
está dada como:
ωA
Vi (s) = (6.4)
s2 + ω 2
Por tanto, expandiendo en fracciones parciales:
a ωA F Cs + D
V0 (s) = = + 2 (6.5)
s + a s2 + ω 2 s+a s + ω2
Las constantes C y de D se calculan del siguiente modo. Multiplicando ambos
miembros de (6.5) por el factor s2 + ω 2 y evaluando en s = jω:
aωA
= jωC + D
jω + a
Multiplicando el miembro izquierdo por el factor (−jω + a)/(−jω + a) e igua-
lando partes reales e imaginarias se tiene:

a2 ωA −aωA
D= , C=
ω 2 + a2 ω 2 + a2
Entonces:
Cs + D −aωA s a2 A ω
2 2
= 2 2 2 2
+
s +ω ω +a s +ω ω + a s + ω2
2 2 2

Usando los pares transformados:


s ω
L{cos(ωt)} = , L{sin(ωt)} =
s2 + ω2 s2 + ω2
se encuentra:
½ ¾
Cs + D aA
L−1 = [−ω cos(ωt) + a sin(ωt)]
s2 + ω 2 ω2 + a2
De acuerdo a la figura 6.6 se puede escribir:
½ ¾ √
−1 Cs + D aA ω 2 + a2
L = [sin(φ) cos(ωt) + cos(φ) sin(ωt)]
s2 + ω 2 ω 2 + a2
µ ¶
a −ω
= A√ sin(ωt + φ), φ = atan (6.6)
ω 2 + a2 a

Por tanto, aplicando la transformada inversa de Laplace a (6.5) se obtiene:


300 6 Diseño usando la respuesta en frecuencia
a

p
a2 à!
+
!2

Figura 6.6. Triángulo definido por la fase φ.

a
v0 (t) = F e−at + A √ sin(ωt + φ)
ω2+ a2
1
Como a = RC > 0 entonces:
a
v0 (t) → B sin(ωt + φ), B = A√ (6.7)
ω 2 + a2
conforme t → ∞. Esto significa que si el voltaje de entrada vi (t) es una
función seno del tiempo entonces, en estado estacionario, el voltaje de salida
v0 (t) también es una función seno del tiempo con la misma frecuencia ω pero
con amplitudes y fases diferentes.
A continuación se muestra que los valores de B/A y φ obtenidos en (6.6)
y (6.7) también se pueden calcular a partir de la función de transferencia en
(6.3) usando el cambio de variable s = jω. Defina:
a
G(s) =
s+a
y considere el cambio de variable s = jω, entonces:
¯ ¯ ¯ ¯
¯ a ¯ ¯ a a − jω ¯
|G(jω)| = ¯¯ ¯=¯ ¯=
jω + a ¯ ¯ jω + a a − jω ¯
¯ ¯
¯ a(a − jω) ¯
= ¯¯ 2 ¯= √ a =
B
(6.8)
ω + a2 ¯ ω 2 + a2 A
µ ¶ µ ¶
Im(G(jω)) −ω
φ = ∠G(jω) = atan = atan (6.9)
Re(G(jω)) a

En este punto es conveniente recordar que una función de transferencia se


a
define como el cociente de la salida sobre la entrada, es decir G(s) = s+a =
V0 (s)
Vi (s) .
Ası́ que no es extraño que |G(jω)| esté dado como el cociente de las
amplitudes de la salida y de la entrada. Por otro lado, si de manera intuitiva se
asume que G(jω), V0 (jω), Vi (jω) son números complejos, entonces el ángulo
6.1 Un circuito RC de corriente alterna 301

de V0 (jω) debe obtenerse como la suma de los ángulos de G(jω) y de Vi (jω)


porque V0 (jω) = G(jω)Vi (jω). Esto significa que la diferencia de ángulo entre
Vi (jω) y V0 (jω) es igual al ángulo de G(jω).
En las figuras 6.2, 6.3 y 6.5 se muestran las gráficas correspondientes (lı́nea
interrumpida) obtenidas utilizando |G(jω)| y φ definidas en (6.8) y (6.9).
La semejanza que se aprecia en estas figuras entre las lı́neas continuas y las
interrumpidas son una muestra de que las relaciones obtenidas analı́ticamente
representan satisfactoriamente la situación experimental.
De acuerdo a (6.7), (6.8), (6.9) si vi (t) está dada como en (6.1) entonces:
µ ¶
Im(G(jω))
v0 (t) = A|G(jω)| sin(ωt + φ), φ = atan (6.10)
Re(G(jω))

Por otro lado, puede repetirse el procedimiento anterior para encontrar que si
vi (t) = A cos(ωt) entonces:
µ ¶
Im(G(jω))
v0 (t) = A|G(jω)| cos(ωt + φ), φ = atan (6.11)
Re(G(jω))

6.1.3. Componentes de frecuencia

De acuerdo a las Series de Fourier, cualquier señal periódica puede ser


representada como la suma de muchas señales seno y coseno de frecuencias
diferentes. Por ejemplo, sea la función f (t) presentada en la figura 6.7. Su
expansión en series de Fourier está dada como [1], pág. 457:
µ ¶
4k 1 1
f (t) = sin(t) + sin(3t) + sin(5t) + · · · (6.12)
π 3 5

El espectro de frecuencias |F (ω)| es una función de la frecuencia ω que indica


las frecuencias contenidas en la función f (t) y cual es la contribución de cada
una de esas frecuencias a la señal total f (t). El espectro |F (ω)| puede ser
interpretado como la amplitud que tiene la señal seno o coseno de frecuencia
ω, es decir 4k 4k 1 4k 1
π , π 3 , π 5 ,. . ., en (6.12). El espectro de frecuencias obtenido con
las series de Fourier es discreto, es decir, sólo existe contribución de frecuencias
que son múltiplos enteros de una frecuencia fundamental. En el caso de (6.12)
la frecuencia fundamental es 1, mientras que 3, 5,. . . son sus múltiplos enteros
a los que se hace referencia.
El uso de la transformada de Fourier permite representar cualquier función
no periódica como la suma de señales seno y coseno de muchas frecuencias. En
este caso, el espectro de frecuencias es continuo, es decir, |F (ω)| está definido
para frecuencias que no necesitan ser múltiplos enteros de ninguna frecuencia
fundamental. A las frecuencias que contribuyen al espectro |F (ω)| se les conoce
como componentes de frecuencia.
El razonamiento que se presenta a continuación es intuitivo pues un análisis
exacto está fuera del alcance de este libro. Considere el sistema:
302 6 Diseño usando la respuesta en frecuencia

f (t)

à 2ù àù ù 2ù t

àk

Figura 6.7. Función del tiempo periódica.

a
V0 (s) = Vi (s) (6.13)
s+a
Suponga que vi (t) es la señal escalón que se muestra en la la figura 6.8. A

ýi (t)

Figura 6.8. Entrada tipo escalón.

continuación se muestra que el uso de la transformada de Fourier permite


expresar a vi (t) como la suma de señales seno y coseno de muchas frecuencias.
En análisis de Fourier es común encontrar la transformada de Fourier a partir
de las series de Fourier al suponer que la frecuencia fundamental ω0 = ∆ω → 0
tiende a cero y que el “armónico” nω0 = n∆ω → ω tiende a la frecuencia
continua ω. Esto significa que se puede escribir (véase, por ejemplo [2], pág.
6.1 Un circuito RC de corriente alterna 303

72):
n=+∞
X
vi (t) = An [cos(n∆ωt) + j sin(n∆ωt)]∆ω (6.14)
n=−∞

donde, j = −1, el factor ∆ω colocado en el extremo derecho se introduce
para asegurar la convergencia de la sumatoria, que en el lı́mite ω0 = ∆ω → 0
se convierte en una integral y ∆ω se convierte en una diferencial, y An es en
general un número complejo que representa la amplitud del “armónico” de
frecuencia n∆ω → ω.
De acuerdo a lo expuesto en la sección 3.10 el sistema en (6.13) es lineal
y, por tanto, satisface el principio de superposición, es decir si v01 (t) es la
solución cuando vi1 (t) es la entrada y v02 (t) es la solución cuando vi2 (t) es la
entrada entonces α1 v01 (t) + α2 v02 (t) es la solución cuando α1 vi1 (t) + α2 vi2 (t)
es la entrada, donde α1 y α2 son constantes arbitrarias. Por tanto, se puede
usar el principio de superposición, (6.10), (6.11), (6.14) para obtener:
n=+∞
X
v0 (t) = An |G(jn∆ω)| [cos(n∆ωt + φn ) + j sin(n∆ωt + φn )]∆ω
n=−∞
µ ¶
Im(G(jn∆ω))
φn = atan (6.15)
Re(G(jn∆ω))
Es decir, la contribución de cada una de las señales seno y coseno a la función
del tiempo v0 (t) está determinada por las componentes de frecuencia ω = n∆ω
de la señal de entrada y por la amplificación o atenuación que el sistema
efectúa sobre cada una de esas componentes de frecuencia. Esto significa que
la salida, v0 (t), contiene básicamente las mismas componentes de frecuencia
que, vi (t), pero amplificadas o atenuadas según lo determine el sistema, G(s).
También se dice que la salida se obtiene como el filtraje de la entrada bajo el
efecto del sistema.

Componentes de frecuencias grandes

En la figura 6.9 se muestran dos señales con forma de onda seno de diferente
frecuencia. Nótese que una señal de frecuencia mayor muestra variaciones más
rápidas en el tiempo. Esto significa que si f (t) tiene componentes de frecuencia
mayores entonces f (t) contiene variaciones más rápidas. Por ejemplo, sea la
función f (t) presentada en la figura 6.7. Su expansión en series de Fourier
está dada como:
µ ¶
4k 1 1
f (t) = sin(t) + sin(3t) + sin(5t) + · · ·
π 3 5
En la figura 6.10 se muestran varias aproximaciones de esta función que in-
cluyen diferentes componentes de frecuencia [1], pág. 458. Nótese que mien-
tras exista mayor contenido de frecuencias grandes la función obtenida tiene
304 6 Diseño usando la respuesta en frecuencia

sen (! 1t)
1

sen (! 2t)

!1 > !2

Figura 6.9. Comparación entre dos funciones seno de diferente frecuencia.

variaciones más rápidas en el tiempo y se aproxima, poco a poco, a las dis-


continuidades abruptas que la función f (t) tiene en puntos especı́ficos.

àk

t [s]

Figura 6.10. Diferentes aproximaciones de la función f (t) presentada en la


figura
¡ 6.7. Lı́nea continua
¢ f1 (t) = 4k π
sin(t).
¡ Lı́nea interrumpida f2¢(t) =
4k
π
sin(t) + 3 sin(3t) . Linea-punto f3 (t) = 4k
1
π
sin(t) + 31 sin(3t) + 15 sin(5t) .
6.1 Un circuito RC de corriente alterna 305

Ruido

El ruido es una señal indeseable que varı́a rápidamente. Esto significa que
el ruido tiene componentes de frecuencia muy grandes.

Componentes de frecuencia cero

Una señal de frecuencia cero es una señal constante. Esto se puede concluir
partir de lo siguiente:

Au cos(ωt) = Au = constante, si ω = 0

Entonces, usando términos propios de las ingenierás eléctrica y electrónica,


una señal f (t) que contiene una componente de frecuencia cero es una señal
que tiene una componente de CD. Esto significa que si f (t) presenta varia-
ciones entonces estas se realizan alrededor de un valor constante diferente de
cero.

6.1.4. Relación entre la respuesta en la frecuencia y en la


respuesta en el tiempo

De acuerdo a lo expuesto en la sección previa se concluye lo siguiente:


Considere el sistema en (6.13). Si vi (t) = A es una señal constante, es decir
de frecuencia cero ω = 0, entonces la salida correspondiente, en estado
estacionario, es v0 (t) = A|G(j0)| = A (véanse (6.14) y (6.15)), porque
|G(j0)| = |G(jω)|ω=0 = 1 y φ = 0 cuando ω = 0 (véase (6.9)).
Es interesante darse cuenta que esto también se cumple, en estado estacio-
nario, cuando a un sistema de control se le aplica una entrada tipo escalón.
En la sección 3.8 se muestra que si vi (t) es un escalón de altura A enton-
ces el valor final (en estado estacionario) de la salida se calcula usando el
teorema del valor final, es decir:
A
lı́m v0 (t) = lı́m sV0 (s) = lı́m sG(s) = G(0)A
t→∞ s→0 s→0 s
donde es importante observar que que si s = σ + jω → 0 también se tiene
que ω → 0.
En la siguiente sección se explica que estos resultados también se pueden
generalizar al caso en que G(s) es una función de transferencia arbitraria de
orden n. Por tanto, se puede afirmar que dada una función de transferencia
G(s), la cantidad |G(jω)|ω=0 representa: i) la relación entre la entrada y la
salida cuando la entrada es constante, o bién ii) la relación entre la entrada
y la salida, en estado estacionario, cuando la entrada es un escalón. Nótese
que en una función de transferencia arbitraria no se cumple, en general,
que G(0) = 1.
306 6 Diseño usando la respuesta en frecuencia

Considere el sistema en (6.13). Las componentes de alta frecuencia que


contiene la entrada vi (t) son fuertemente atenuadas, es decir casi no tienen
efecto sobre la salida v0 (t), porque |G(jω)| → 0 conforme ω → ∞ (véase
(6.14), (6.15) y (6.8)). De nuevo, este resultado puede extenderse al caso de
una función de transferencia arbitraria G(s) de orden n que cumpla que
|G(jω)| → 0 conforme ω → ∞. Esta condición tiene dos consecuencias
importantes:
i) Suponga que vi (t) es un escalón. Tal como se menciona en la sección pre-
via, las componentes de alta frecuencia son las que generan la discontinui-
dad que tiene esta función en t = 0. Como el efecto de estas componentes
es fuertemente atenuado, entonces la salida v0 (t) no presentará ninguna
discontinuidad en t = 0 (véase la figura 3.1 en el capı́tulo 3).
ii) El efecto del ruido sobre la salida es fuertemente atenuado.
La rapidez de respuesta del sistema en (6.13) se incrementa al aumentar
el parámetro a > 0. Esto se concluye del siguiente modo.
Se ha mencionado que la rapidez de una señal se incrementa al aumentar
su contenido de frecuencias mayores. Por tanto, la rapidez de respuesta del
sistema en (6.13) se puede incrementar si v0 (t) tiene una mayor contribu-
ción de componentes de frecuencias mayores. En la figura 6.11 se muestra
que el valor de |G(jω)| puede incrementarse para frecuencias mayores si
se usa un valor más grande de a. Esto se comprueba con lo expuesto en
la sección 3.1 del capı́tulo 3 donde se explica que la rapidez de un sistema
con función de transferencia G(s) = a/(s + a) se incrementa al aumentar
el valor de a.

jG (j!)j

p
1= 2

0 a1 a2
!

a
Figura 6.11. Un valor mayor de a en el sistema s+a permite un mayor efecto de las
frecuencias intermedias y, por tanto, una mayor rapidez de respuesta en el tiempo.

Es importante subrayar que se busca incrementar la contribución de fre-


cuencias mayores pero no aquellas que son demasiado elevadas (ω → ∞)
las cuales acentuarı́an el efecto del ruido. Con el fin de resaltar esta ca-
6.2 Sistemas arbitrarios de orden n 307

racterı́stica, se usa el término “frecuencias intermedias” para referirse a


aquellas frecuencias que se utilizan para mejorar la rapidez de respuesta.
Esta idea puede extenderse al caso de una función de transferencia arbi-
traria G(s) de orden n, indicando que su rapidez de respuesta es mayor
conforme sus polos se colocan más lejos del origen.

6.2. Sistemas arbitrarios de orden n


Los conceptos presentados en la sección 6.1 se han realizado considerando
la función de transferencia en (6.13). Esto se ha hecho con el propósito de
explicar de manera sencilla los conceptos introducidos ahı́. En la presente
sección se muestra que todas las ideas expuestas en la sección 6.1 también
pueden generalizarse al caso de sistemas lineales arbitrarios de orden n.
Considere la función de transferencia arbitraria de orden n:
Y (s) E(s)
= G(s) = (6.16)
U (s) N (s)
N (s) = sn + an−1 sn−1 + · · · + a1 s + a0
E(s) = b0 + b1 s + · · · + bm sm
ω
donde n ≥ m y u(t) = A sin(ωt), por lo que U (s) = A s2 +ω 2 . Sustituyendo

U (s) en (6.16) y usando expansión en fracciones parciales:


ω Cs + D
Y (s) = G(s)A = Yn (s) + 2 (6.17)
s2 + ω 2 s + ω2
donde Yn (s) = L{yn (t)} es la respuesta natural la cual, de acuerdo al capı́tulo
3, satisface lı́mt→∞ yn (t) = 0 si G(s) es estable. Con el fin de facilitar la
exposición se supone que G(s) no tiene polos en s = ±jω. Multiplicando
ambos miembros de (6.17) por el factor s2 + ω 2 y evaluando en s = jω se
encuentra:

ωAG(jω) = jωC + D

Igualando partes reales e imaginarias se obtiene:

C = AIm(G(jω)), D = ωARe(G(jω))

donde G(jω) = Re(G(jω)) + jIm(G(jω)). Por tanto:


Cs + D s ω
2 2
= AIm(G(jω)) 2 2
+ ARe(G(jω)) 2
s +ω s +ω s + ω2
Usando los pares transformados:
s ω
L{cos(ωt)} = , L{sin(ωt)} =
s2 + ω 2 s2 + ω 2
308 6 Diseño usando la respuesta en frecuencia

se obtiene:
½ ¾
Cs + D
L−1 = A[Im(G(jω)) cos(ωt) + Re(G(jω)) sin(ωt)]
s2 + ω 2
Usando la figura 6.12 se encuentra que:
½ ¾
Cs + D
L−1 = A|G(jω)| [sin(φ) cos(ωt) + cos(φ) sin(ωt)] (6.18)
s2 + ω 2
= B sin(ωt + φ), B = A|G(jω)|,
µ ¶
Im(G(jω))
φ = atan ,
Re(G(jω))
q
|G(jω)| = Re2 (G(jω)) + Im2 (G(jω))

Entonces, de acuerdo a (6.17) se encuentra que:

) )
(j!
2 (G
Im
)+
j! ) Im (G (j!) )
(G( 2
p Re

Re (G (j!) )

Figura 6.12. Triángulo definido por la fase φ.

y(t) → A|G(jω)| sin(ωt + φ)

conforme t → ∞ si G(s) es estable. Por tanto, si la entrada u(t) de un sistema


lineal G(s) de orden n es una función seno, entonces la salida y(t) también
es, en estado estacionario, una función seno de la misma frecuencia pero con
una amplitud y una fase que son, en general, diferentes a la amplitud y a la
fase de la entrada. La relación entre la amplitud de la entrada y la amplitud
de la salida a la frecuencia ω se puede calcular como:
B
= |G(jω)|
A
y se conoce como magnitud de la función de transferencia mientras que la
diferencia de fase entre la entrada y la salida está dada por φ en (6.18) y se
conoce como fase de la función de transferencia. Este resultado es idéntico al
6.3 Gráficas polares y de Bode 309

encontrado en la sección 6.1. Por tanto, todas las afirmaciones realizadas para
G(s) en esa sección son válidas cuando G(s) es una función de transferencia
arbitraria de orden n. Entonces, se está en posición de afirmar lo siguiente:
Por respuesta en frecuencia debemos entender, la descripción de:
Cómo varı́a el cociente de la amplitud de la señal de salida entre la am-
plitud de la señal de entrada cuando se varı́a la frecuencia de la señal de
entrada.
Cómo varı́a el defasaje entre la señal de entrada y la señal de salida cuando
se varı́a la frecuencia de la señal de entrada
Estas dos cracterı́sticas son muy importantes, pues permiten determinar de
manera exacta la manera en que responde un sistema de control: respues-
ta transitoria (rapidez y oscilaciones) y respuesta en estado estacionario.
Además, tal como se muestra en las secciones subsecuentes, también se pue-
den establecer métodos que permiten determinar la estabilidad de un sistema
en lazo cerrado. En este sentido es importante mencionar que todas las ideas
expuestas en las secciones 6.1 y 6.2 también pueden ser extendidas a funciones
de transferencia inestables: sólo hay que recordar que, aunque en tal caso la
respuesta natural no desaparece al crecer el tiempo, la respuesta forzada es
una sinusoide si la entrada también lo es.

6.3. Gráficas polares y de Bode

Un concepto importante en gráficas de Bode es el denominado “década”


cuya abreviación es “dec”. En gráficas de Bode es de mucho interés analizar
la frecuencia ω por décadas. Una década representa un incremento de diez
veces en el valor de la frecuencia. Por ejemplo si ω1 = 2.5 y ω2 = 25 entonces
se dice que hay una década entre ω1 y ω2 .
La función de transferencia arbitraria de orden n definida en (6.16) se
puede escribir como:
Qj=m
bm j=1 (s − zj )
G(s) = Qi=n (6.19)
i=1 (s − pi )

donde zj , j = 1, . . . , m, son los ceros de G(s) y pi , i = 1, . . . , n, son los polos de


G(s). Dado que los polos y los ceros pueden ser reales o complejos conjugados
entonces las gráficas polares y de Bode de G(s) siempre pueden construirse
a partir del conocimiento de las gráficas polares y de Bode de los siguientes
factores fundamentales de primero y segundo orden:
1 s+a a
s, , , , (6.20)
s a s+a
s2 + 2ζωn s + ωn2 ωn2
,
ωn2 s + 2ζωn s + ωn2
2
310 6 Diseño usando la respuesta en frecuencia

por esta razón, en las figuras 6.13, 6.14, 6.15 y 6.16 se presentan las gráficas
de Bode y polares de estos factores.
Recuérdese que las gráficas de Bode de magnitud son curvas que represen-
tan la cantidad:

20 log (|G(jω)|)

como función de la frecuencia ω. Las gráficas de Bode de fase son curvas que
representan la cantidad:
µ ¶
Im(G(jω))
φ = atan
Re(G(jω))

como función de la frecuencia ω. Por otro lado, cada punto de las gráficas
polares representa la cantidad:

G(jω) = Re(G(jω)) + jIm(G(jω)) = |G(jω)|∠φ

Las flechas que aparecen en las gráficas polares siempre apuntan en el sentido
en el que la frecuencia crece, es decir, desde ω = −∞ pasando por ω = 0
hasta ω = +∞. El lector puede recurrir a [3], [4] si desea conocer el método
detallado que se utiliza normalmente para obtener las gráficas mostradas en
las figuras 6.13, 6.14, 6.15 y 6.16.
Las lı́neas gruesas en las gráficas de Bode de las figuras 6.13 y 6.14 se
conocen como ası́ntotas, mientras que las lı́neas finas representan el valor
exacto de las funciones representadas. Las ası́ntotas sólo son aproximaciones
que, sin embargo, son de mucha utilidad para reconocer la forma fundamen-
tal de las gráficas de Bode correspondientes. Nótese que en algunas de las
gráficas de Bode de magnitud las ası́ntotas forman una esquina. La frecuen-
cia a la cual ocurre dicha esquina se conoce como “frecuencia de esquina” y
está directamente relacionada con el cero o el polo del factor de primero o
segundo orden que se representa. Recuérdese que, de acuerdo a la sección 3.3,
ωn es la distancia medida desde la raı́z correspondiente (polo o cero) hasta
el origen y que p las raı́ces de un factor de segundo orden están dadas como
s = −ζωn ± jωn 1 − ζ 2 .
De acuerdo a lo que describen las ası́ntotas, para frecuencias menores a la
frecuencia de esquina la magnitud de todos los factores en (6.20) (a excepción
de s y 1/s) es de 0[dB], pero para frecuencias mayores que la frecuencia de
esquina la magnitud crece (ceros) o disminuye (polos) con una rapidez de
±20[dB/dec] para los factores de primer orden y de ±40[dB/dec] para los
factores de segundo orden. Nótese que en el caso de los factores de segundo
orden, el comportamiento de la curva exacta cerca de la frecuencia de esquina
depende fuertemente del factor de amortiguamiento ζ. De hecho, si ζ < 0.7071,
alrededor de la frecuencia de esquina existe un máximo de magnitud cuyo valor
crece hacia el infinito conforme ζ tiende a cero. Este máximo de magnitud se
conoce como pico de resonancia y su valor se representa por Mr .
6.3 Gráficas polares y de Bode 311
jG(j!)j
[dB]

pendiente :
à 20 dB=dec

G(j!)
[grados]

0:1 1 10
! [rad=s]
1
(a) G(s) = s
jG(j!)j
[dB]
pendiente :
+ 20 dB=dec

G(j!)
[grados]

0:1 1 10
! [rad=s]

(b) G(s) = s

jG(j!)j
[dB]
pendiente :
à 20 dB=dec

G(j!)
[grados]

ï à 45

0:01a 0:1a a 10a 100a


! [rad=s]
a
(c) G(s) = s+a

Figura 6.13. Gráficas de Bode de los factores de primero y segundo orden en (6.20).
312 6 Diseño usando la respuesta en frecuencia
jG(j!)j
[dB]
pendiente :
+ 20 dB=dec

G(j!)
[grados]

ï + 45

0:01a 0:1a a 10a 100a


! [rad=s]
s+a
(a) G(s) = a
jG(j!)j ð = 0:1
0:3
[dB]
0:7
0:9
pendiente :
2 à 40 dB=dec

G(j!) ð = 0:1
[grados] 0:5 0:3

ï à 90
0:9 2
0:7

0:1! n !n 10! n
! [rad=s]
2
ωn
(b) G(s) = s2 +2ζωn s+ωn
2

jG(j!)j
[dB]
pendiente :
2 + 40dB=dec
0:9
0:7
0:3
ð = 0:1

G(j!)
[grados] 0:7 0:9
2
ï+ 90

0:5 0:3
ð = 0:1

0:1! n !n 10! n
! [rad=s]
s2 +2ζωn s+ωn
2
(c) G(s) = 2
ωn

Figura 6.14. Gráficas de Bode de los factores de primero y segundo orden en (6.20)
(cont.).
6.3 Gráficas polares y de Bode 313
Im (G(j!))
! ! 0à

! ! à1
ï Re (G(j!))
! ! +1

! ! 0+

1
(a) G(s) = s

Im (G(j!))
! ! +1

!=0 Re (G(j!))
ï

! ! à1

(b) G(s) = s
Im (G(j!))

! ! à1
ï ï !=0 Re (G(j!))
! ! +1

a
(c) G(s) = s+a

Figura 6.15. Gráficas polares de los factores de primero y segundo orden en (6.20).
314 6 Diseño usando la respuesta en frecuencia
Im (G(j!))
! ! +1

! = 0ï Re (G(j!))

! ! à1

s+a
(a) G(s) = a
Im (G(j!))

ð = 0:1

0:3
0:5
0:7
2 à1
0:9 ! !
ï ï !=0 Re (G(j!))
! ! +1

2
ωn
(b) G(s) = s2 +2ζωn s+ωn
2

Figura 6.16. Gráficas polares de los factores de primero y segundo orden en (6.20)
(cont.).

En cuanto a las gráficas de Bode de fase se puede decir lo siguiente. Cada


factor de primer orden introduce una fase que va de cero hasta +90 grados
(ceros) o hasta −90 grados (polos). Cada factor de segundo orden introduce
una fase que va de cero hasta +180 grados (ceros) o hasta −180 grados (polos).
En todos los casos, cuando la frecuencia es igual a la frecuencia de esquina
la fase es igual a la mitad del rango correspondiente. De nuevo, en el caso de
factores de segundo orden y alrededor de la frecuencia de esquina, la curva
de fase depende fuertemente del factor de amortiguamiento ζ: la fase cambia
más rápidamente entre 0 y ±180 grados conforme ζ tiende a cero.
Es importante observar que si el factor en (6.20) contiene ceros, entonces
las gráficas polares y de Bode correspondientes muestran que dicho factor se
comporta como un filtro pasa altas y que esto va acompañado de un adelanto
de fase, es decir el factor contribuye con fase positiva. Esta observación es im-
6.3 Gráficas polares y de Bode 315

portante porque significa que los ceros de una función de transferencia tienden
a incrementar el efecto que el ruido tiene sobre un sistema de control. Esto
implica que el uso de una ganancia derivativa excesivamente grande en un con-
trolador PD o PID puede resultar en un sistema de control cuyo desempeño se
ve deteriorado. Para entender esto obsérvese que un controlador PD introduce
un cero de lazo abierto mientras que un controlador PID introduce dos ceros
de lazo abierto. Por otro lado, tal como se menciona en la sección 5.1.1, un
cero de lazo abierto tiende a mejorar la estabilidad de un sistema de control
en lazo cerrado. Ası́ que al diseñar un sistema de control se debe de tratar
de establecer un compromiso entre estabilidad y deterioro del desempeño por
efectos del ruido. En la sección 6.6 se explica que el efecto estabilizante de un
cero de lazo abierto se debe al adelanto de fase que introduce en la respuesta
en frecuencia de la función de transferencia de lazo abierto.
Por otro lado, si el factor en (6.20) contiene polos, entonces las gráficas
polares y de Bode correspondientes muestran que dicho factor se comporta
como un filtro pasa bajas y que esto va a compañado de un atraso de fase, es
decir el factor contribuye con fase negativa. Esto significa que los polos de una
función de transferencia reducen el efecto del ruido. Por otro lado, tal como
se menciona en la sección 5.1.1, un polo de lazo abierto tiende a deteriorar
la estabilidad de un sistema de control en lazo cerrado. En la sección 6.6 se
explica que este efecto se debe al atraso de fase que un polo introduce en la
respuesta en frecuencia de la función de transferencia de lazo abierto.
Las gráficas de respuesta en frecuencia de la función de transferencia arbi-
traria de orden n definida en (6.19) se obtiene mediante la combinación de los
factores en (6.20). En el caso de las gráficas de Bode este proceso de combina-
ción de factores de primero y segundo orden es muy sencillo, como se explica
a continuación. Nótese que la función de transferencia arbitraria de orden n,
G(s), dada en (6.19) se puede escribir como:
k=r
Y
G(s) = β Gk (s)
k=1

para alguna constante real β y algún número entero positivo r, donde Gk (s),
para k = 1, . . . , r, tiene la forma de uno de los factores presentados en (6.20).
Entonces:
¯ k=r ¯
¯ Y ¯ k=r
Y
¯ ¯
|G(jω)| = ¯β Gk (jω)¯ = |β| |Gk (jω)|
¯ ¯
k=1 k=1

De acuerdo a esto, a la definición de decibeles |G(jω)|dB = 20 log(|G(jω)|) y


a la propiedad log(xy) = log(x) + log(y) presentada en (6.2) se puede escribir:
k=r
X
|G(jω)|dB = 20 log(|β|) + 20 log(|Gk (jω)|)
k=1
316 6 Diseño usando la respuesta en frecuencia

Esto significa que la gráfica de Bode de magnitud (y la gráfica de Bode de


fase) de una función de transferencia arbitraria de orden n, G(s), siempre se
puede obtener como la suma de las gráficas de Bode de magnitud (y de las
gráficas de Bode de fase) de todos los factores de primero y de segundo orden
de G(s)1 . Nótese, sin embargo, que esto no es cierto para las gráficas polares
donde se deberá realizar el producto de las magnitudes y la suma de las fases
de todos los factores de primero y segundo orden de G(s). Para simplificar este
procedimiento se recomienda obtener primero las gráficas de Bode y a partir
de ellas obtener la información requerida para dibujar las gráficas polares
correspondientes. En la siguiente sección se presentan algunos ejemplos de
aplicación de estas ideas.
Ejemplo 6.1 (Resonancia). Sea el sistema masa-resorte-amortiguador mos-
trado en la figura 6.17. La función de transferencia es en este caso igual a la
del ejemplo 3.6 del capı́tulo 3, es decir:

kωn2
X(s) = G(s)F (s), G(s) = 2
s + 2ζωn s + ωn2
r
K b 1
ωn = , ζ= √ , k=
m 2 mK K
donde x = 0 se define como la posición en la cual el sistema alcanza el reposo
cuando f (t) = 0 y bajo el efecto del peso de la masa y el resorte. La disposición
de la figura 6.17 es equivalente a la de un automóvil que se encuentra en reposo
sobre el suelo: m representa la masa del automóvil, K representa la rigidez
del sistema de suspensión y b representa el efecto de los amortiguadores. La
experiencia cotidiana nos ha enseñado que, aunque es muy pesado, un auto
pequeño puede ser volteado por unas pocas personas si las personas lo someten
a una fuerza como la siguiente. Se empuja el auto hacia arriba y se le suelta
para que después de rebotar abajo se le vuelve a aplicar la misma fuerza hacia
arriba cuando el auto se encuentra moviéndose hacia arriba. Aunque la fuerza
aplicada cada vez es pequeña como para voltear al auto, sin embargo, después
de aplicar esta misma acción varias veces se consigue voltear el auto. Este es
un ejemplo claro de lo que puede conseguirse cuando se somete un automóvil
a resonancia y a continuación se analiza dicha situación.
La fuerza que es aplicada por las personas tiene una forma periódica que
tiene una componente fundamental con forma de onda coseno. Cuando es-
ta fuerza es positiva se empuja al auto hacia arriba, cuando es negativa se
deja caer el auto. El hecho de aplicar fuerza sólo cuando el auto se mueve
hacia arriba implica que esta componente cosenoidal tiene una frecuencia ω
que es igual a la frecuencia natural de oscilación del auto ωn . Si se supone
que no hay amortiguadores entonces b = 0, lo cual implica que ζ = 0. De
acuerdo a la figura 6.14(b), bajo esta situación la salida x(t) (posición del
1
Recuérdese que dados tres números complejos z, x, y tales que z = xy, la fase de
z es igual a la suma de las fases de x y de y
6.3 Gráficas polares y de Bode 317

x
m

K b

Figura 6.17. Suspensión de un automóvil.

auto) está atrasada 90◦ respecto de la fuerza aplicada. Esto significa que si
f (t) = A cos(ωt) entonces x(t) = B sin(ωt), para alguna constante B positiva,
si ω = ωn . Entonces, de acuerdo a la figura 6.18, se aplica una fuerza máxima
(f tiene una cresta) justo cuando el auto se está moviendo hacia arriba (x
está pasando de un valle a una cresta), lo cual está en completo acuerdo con
la aplicación intuitiva de fuerza por parte de las personas. Además si ω = ωn
y ζ = 0 la amplitud B de la osiclación descrita por el auto crecerá sin lı́mite
aún cuando la amplitud de la fuerza de entrada A sea pequeña (B = |G(ωn )|A
y |G(ωn )| → ∞) por lo que finalmente el auto podrá ser volteado.
Ahora se presentará una explicación desde el punto de vista de la fı́sica
que ayude a entender porqué sucede esto. La energı́a del sistema está dada
como la suma de la energı́a cinética más la energı́a potencial:
E = E c + Ep ,
1 1
Ec = mẋ2 , Ep = Kx2
2 2
El efecto de la gravedad no se toma en consideración porque se ha supuesto
que x = 0 es la posición en la que el cuerpo alcanza el reposo cuando f = 0
bajo el efecto de la gravedad y del resorte. Conforme el tiempo transcurre la
variación de esta energı́a está dada como:
Ė = Ėc + Ėp = mẋẍ + Kxẋ
Utilizando el modelo para calcular ẍ, es decir:
b K 1
ẍ = − ẋ − x + f
m m m
se obtiene que:
318 6 Diseño usando la respuesta en frecuencia

f(t) = Acos(! n t)

x(t) = Bsin(! n t)

tiempo

Figura 6.18. Fuerza aplicada y posición resultante cuando se somete a resonancia


el cuerpo de la figura 6.17.

Ė = −bẋ2 + ẋf

Considérense dos casos:


1. ζ = 0, f = A cos(ωn t). En este caso b = 0 y de acuerdo a la figura
6.14(b), la salida x(t) está atrasada 90◦ respecto de la fuerza aplicada, es
decir x(t) = B0 sin(ωn t) y ẋ = ωn B0 cos(ωn t) para alguna B0 positiva y,
entonces:

Ė = ẋf = ωn AB0 cos2 (ωn t)

Por lo que la energı́a de la masa crece sin lı́mite conforme el tiempo


aumenta porque, dado que cos2 (ωn t) ≥ 0 para todo t:
Z t
E = ωn A B0 cos2 (ωn r)dr → ∞, cuando t → ∞
0

Como E = Ec + Ep con x(t) y ẋ sinusoidales entonces la amplitud de


estas oscilaciones crece sin lı́mite también, tal como lo describe la figura
6.14(b).
2. ζ > 0, f = A cos(ωn t). En este caso b > 0 y de acuerdo a la figura 6.14(b),
la salida x(t) converge (después de que la respuesta natural se hace des-
preciable) a una función que está atrasada un ángulo igual a 90◦ respecto
de la fuerza aplicada, es decir x(t) = B0 sin(ωn t) y ẋ = ωn B0 cos(ωn t)
para alguna B0 positiva y, entonces:
6.4 Gráficas de respuesta en frecuencia. Ejemplos 319

Ė = −bẋ2 + ẋf = −bωn2 B02 cos2 (ωn t) + ωn AB0 cos2 (ωn t)

Por tanto, la energı́a de la masa está dada como:


Z t
E= [−bωn2 B02 cos2 (ωn r) + ωn AB0 cos2 (ωn r)]dr
0
Z t
= [−bωn2 B02 + ωn AB0 ] cos2 (ωn r)dr (6.21)
0

Mientras la amplitud B0 de la posición sea pequeña se cumplirá que


−bωn2 B02 + ωn AB0 > 0 y, por tanto, la energı́a E y la amplitud B0 aumen-
tan. Entonces B0 aumentará hasta que −bωn2 B02 + ωn AB0 < 0 porque A
es constante. En ese momento, la energı́a deja de aumentar y se obtiene
un estado estacionario cuando bωn2 B 2 = ωn AB, es decir, la amplitud de
la posición B permanece constante en un valor finito dado como:
A A A kA
B= = √ q = = (6.22)
bωn 2ζ mK K 2ζK 2ζ
m

Nótese que la amplitud de la posición B crece sin lı́mite conforme ζ tiende


a cero, lo cual está en completo acuerdo con la figura 6.14(b) y al mismo
tiempo explica porqué el pico de resonancia disminuye conforme aumenta
ζ. En este sentido, obsérvese que el término −bẋ2 ≤ 0 si b > 0 (es decir,
si ζ > 0). Esto representa la energı́a que se disipa en forma de calor por
motivos de rozamiento (fricción). Ası́ que la fricción es la que evita que
la energı́a y, por tanto, la amplitud de las oscilaciones crezcan sin lı́mite.
Se puede afirmar que mientras más rozamiento haya un mayor porcentaje
de la energı́a suministrada a la masa mediante la fuerza f se convierte
en calor y es menos la energı́a que se almacena en la masa y por ello la
menor amplitud de las oscilaciones.
k
Finalmente nótese que |G(jω)|ω=ωn = 2ζ , lo cual está en completo acuer-
do con (6.22). También es importante recordar que el pico de resonancia
ocurre a una frecuencia ligeramente diferente a ωn cuando ζ > 0. Sin
embargo, la magnitud de la función de transferencia en ω = ωn también
crece cuando ζ se aproxima a cero.

6.4. Gráficas de respuesta en frecuencia. Ejemplos

6.4.1. Ejemplo 1

Considere la siguiente función de transferencia:

s + T1
Gd (s) = 1 , 0 < ξ < 1, T >0 (6.23)
s + ξT
320 6 Diseño usando la respuesta en frecuencia

De acuerdo a las propiedades en (6.2) la gráfica de Bode de magnitud (en


dB) de Gd (s) en (6.23) se obtiene como la suma de las gráficas de Bode de
magnitud de dos factores de primer orden:
1 1 1
T s+ T ξT
Gd (s) = 1 1 1 (6.24)
ξT T s+ ξT

1
El polo tiene una frecuencia de esquina en ω = ξT la cual es mayor que la
1
frecuencia de esquina del cero ω = T porque 0 < ξ < 1. Este hecho determina
que Gd (s) introduzca un adelanto de fase y que tenga las caracterı́sticas de un
filtro pasa altas: las frecuencias bajas son atenuadas pero las frecuencias altas
no. El adelanto de fase máximo producido y la atenuación a bajas frecuencias
dependen sólamente de la constante ξ, es decir de la separación existente entre
las frecuencias de esquina del polo y del cero. Estas observaciones pueden
apreciarse en la figura 6.19 donde se muestran las gráficas de Bode de Gd (s)
y de los factores que la componen.

dB ii)
iv) !
0 1
1
T øT iii)
i)

fase
[grados]

+ 90
ii)
iv)
0 1 1 !
T øT
iii)
à 90

1
Figura 6.19. Gráficas de Bode para el ejemplo 1 (véase (6.24)): i) 0 < T
1 < 1, ii)
ξT
1 1
s+ T ξT
1 , iii) 1
s+ ξT
, iv) Gd (s).
T

La función de transferencia en (6.23) es muy útil para diseñar un tipo es-


pecial de controladores que reciben el nombre de compensadores de adelanto.
6.4 Gráficas de respuesta en frecuencia. Ejemplos 321

Esta aplicación, sin embargo, es facilitada si se utilizan algunas manipulacio-


nes algebraicas:
Ts + 1
Gd (T s) =
T s + 1ξ

Al hacer el cambio de variable s = jω se obtiene:


jωT + 1
Gd (jωT ) =
jωT + 1ξ

Las gráficas de Bode se pueden obtener fácilmente al descomponer esta ex-


presión en los factores de primer orden que la componen:
jωT + 1 1/ξ
Gd (jωT ) = ξ
1 jωT + 1ξ

considerando que el producto ωT es la variable que se usa como variable


independiente, es decir en el eje horizontal de la figura 6.20. Aquı́ se muestran
las gráficas de Bode de Gd (s) para diferentes valores de 0 < ξ < 1.
Por otro lado, la gráfica polar de Gd (T s) se puede obtener fácilmente uti-
lizando la información proporcionada por las gráficas de Bode en la figura
6.19. Para esto se debe recordar que la gráfica de Bode de magnitud está en
dB pero la gráfica polar no. Se deben observar la magnitud y la fase para
las frecuencias cero e infinito para dibujar en la gráfica polar trazos que re-
presenten los comportamientos correspondientes. Luego se dibujan trazos que
representen, aproximadamente, los comportamientos a las frecuencias inter-
medias y que satisfagan los trazos correspondientes a las frecuencias cero e
infinito. Finalmente, las gráficas polares para frecuencias negativas, es decir
desde ω = −∞ hasta ω = 0 son las imágenes al espejo de las gráficas para
frecuencias positivas. Compare la gráfica polar mostrada en la figura 6.21 y
las gráficas de Bode en la figura 6.19.

6.4.2. Ejemplo 2

Considere la función de transferencia:


Ax γk ρ
G(s)H(s) = (6.25)
s + a s3
donde las constantes Ax , γ, k, a, ρ son todas positivas. Descomponiendo esta
función de transferencia en los factores fundamentales que la forman se puede
escribir:
ρAx γk a 1
G(s)H(s) =
a s + a s3
De acuerdo a las propiedades en (6.2), la gráfica de Bode de magnitud del
factor s13 es una linea recta de pendiente igual a −60[dB/dec]. En la figura
322 6 Diseño usando la respuesta en frecuencia

0:9
0:7

0:4

0:2

ø = 0:14

ø = 0:14
0:2

0:4

0:7
0:9
!T
0:01 0:1 1 10 100 1000

Figura 6.20. Gráficas de Bode para Gd (s) en (6.23).

Im (G d (j! ))

ø 1 ! ! +1
ï ï
!=0 ! ! à1
0 Re (G d (j! ))

Figura 6.21. Gráfica polar de Gd (s) en (6.23).

6.22 se presentan las gráficas de Bode de G(s)H(s), ası́ como de los factores
que la componen. Tal como se explica en el ejemplo previo, la gráfica polar
de la figura 6.23 se puede obtener fácilmente a partir de las gráficas de Bode
la figura 6.22.

6.4.3. Ejemplo 3

Siguiendo procedimientos como los descritos en los dos ejemplos previos


se pueden obtener las gráficas polares y de Bode de las siguientes funciones
de transferencia:
6.4 Gráficas de respuesta en frecuencia. Ejemplos 323

dB ii)
i)
a !
0
1 iii)
iv)

fase
[grados] a !
0
iii)
à 90
à 180
à 270 ii)
à 360 iv)

ρAx γk 1
Figura 6.22. Gráficas de Bode de G(s)H(s) definida en (6.25): i) a
, ii) s3
,
a
iii) s+a , iv) G(s)H(s).

Im (G (j! ) H (j! ) )
! = 0+

!! +1
!! à1 Re (G (j! ) H (j! ) )

! = 0à

Figura 6.23. Gráfica polar de G(s)H(s) en (6.25).

s+b k ρ
G(s)H(s) = Ax γ (6.26)
s + c s(s + a) s2
Ax γ s + b αkAθ ρ
G(s)H(s) = (6.27)
Aθ s + c s2 + (a + kv kAθ )s + αkAθ s2
324 6 Diseño usando la respuesta en frecuencia

donde Ax , Aθ , γ, k, a, ρ, b, c, α, kv son constantes positivas. Las gráficas


correspondientes se muestran en las figuras 6.24, 6.25, 6.26 y 6.27.

dB
ii)

i)
b c 1 a
0 !
v) iii)
iv)
vi)

fase
[grados]
+ 90
v) c
0 b a !
iv) iii)
à 90
à 180
à 270 ii)
à 360 vi)

Ax γbkρ 1 a
Figura 6.24. Gráficas de Bode de G(s)H(s) en (6.26): i) ac
, ii) s3
, iii) s+a
,
c
iv) s+c , v) s+b
b
, vi) G(s)H(s).

Im (G (j! ) H (j! ) )
! = 0+

!! +1
!! à1 Re (G (j! ) H (j! ) )

! = 0à

Figura 6.25. Gráfica polar de G(s)H(s) en (6.26).


6.5 Criterio de estabilidad de Nyquist 325

dB

ii)
p i)
b 1 ëkA ò
0 !
v) c iv) iii)

vi)

fase
[grados]
+ 90 v) p
c ëkA ò !
0
b iv) iii)
à 90
à 180 ii)
à 270
à 360 vi)

Ax γbρ 1
Figura 6.26. Gráficas de Bode de G(s)H(s) en (6.27): i) Aθ c
, ii) s2
, iii)
αkAθ c s+b
s2 +(a+kv kAθ )s+αkAθ
, iv) s+c
, v) b
, vi) G(s)H(s).

Im (G (j! ) H (j! ) )

! = 0à !! +1
! ! à 1 Re (G (j! ) H (j! ) )
! = 0+

Figura 6.27. Gráfica polar de G(s)H(s) en (6.27).

6.5. Criterio de estabilidad de Nyquist


En la literatura existente sobre control clásico es común utilizar el criterio
de Routh como el método que sirve para determinar si un sistema tiene alguno
326 6 Diseño usando la respuesta en frecuencia

de sus polos en el semiplano derecho. De no ser ası́ entonces todos los polos
deben estar en el semiplano izquierdo y entonces se asegura su estabilidad. El
criterio de Routh debe aplicarse al polinomio caracterı́stico del sistema en lazo
cerrado y se introduce como el criterio de estabilidad para sistemas de control
cuando se estudian desde el punto de vista de su respuesta en el tiempo. El
lector puede consultar el capı́tulo 4 de la presente obra, o las referencias [3],
[4], para mayor información a cerca del uso del criterio de Routh.
Ahora se introduce un nuevo criterio de estabilidad para sistemas de con-
trol en lazo cerrado que está fundamentado, sin embargo, en la respuesta en
frecuencia del mismo sistema pero en lazo abierto. Esta curiosa caracterı́stica
debe ser entendida correctamente pues es frecuente confundirse por completo
debido a la siguiente pregunta: ¿Como es posible determinar la estabilidad del
sistema en lazo cerrado estudiando la respuesta en frecuencia del sistema
en lazo abierto? En esta sección se presenta la respuesta a tal pregunta y el
criterio que resuelve este problema se conoce como el Criterio de Nyquist.

6.5.1. Recorridos cerrados alrededor de polos y ceros

Considere la siguiente función de transferencia:

G(s) = s − a

donde a es cualquier número constante, real o complejo. Nótese que este siste-
ma sólo posee un cero en s = a. Considere una trayectoria cerrada Γ trazada
sobre el plano s encerrando al cero en s = a y que es recorrida en sentido
horario (véase la figura 6.28). Cuando G(s) se evalúa sobre Γ significa que
el argumento s de G(s) toma sucesivamente todos los valores de s que se
encuentran sobre Γ . Evalúese G(s) sobre Γ :

G(s) = l∠θ, l = |s − a|, θ = ∠(s − a)

Nótese que s − a puede ser representado como un vector que inicia en a


y termina en s. Es fácil observar que cada vez que el recorrido sobre Γ se
completa una vez el ángulo θ tiene un incremento negativo (sentido horario)
de −2π radianes. Por otro lado, como Γ no pasa sobre s = a entonces l > 0
en todo el recorrido. Esto significa que cada que el recorrido horario Γ es
completado una vez el vector l∠θ describe una vuelta horaria alrededor del
origen. Como G(s) = l∠θ decimos que la vuelta horaria ha sido completada
alrededor del origen del plano G(s), es decir, alrededor de G(s) = 0 (véase la
figura 6.29).
A partir de esto no es difı́cil ver que si G(s) sólo tiene m ceros y si Γ
encierra por completo a todos esos ceros, entonces cada vez que se completa
un recorrido horario sobre Γ se completan m vueltas horarias alrededor del
origen del plano G(s).
Considere ahora la siguiente función de transferencia:
6.5 Criterio de estabilidad de Nyquist 327

Im (s)

Re (s)

Figura 6.28. Recorrido cerrado alrededor de un cero.

Im (G (s))

G (s )

Re (G (s))
à 2ù

Figura 6.29. Recorrido horario alrededor del origen del plano G(s).
328 6 Diseño usando la respuesta en frecuencia

1
G(s) =
s−a
donde a es cualquier número constante, real o complejo. Nótese que este siste-
ma sólo posee un polo en s = a. Considere una trayectoria cerrada Γ trazada
sobre el plano s encerrando al polo en s = a y que es recorrida en sentido
horario (véase la figura 6.30). Evalúese G(s) sobre Γ :
1 1
G(s) = = ∠ − θ, l = |s − a|, θ = ∠(s − a)
l∠θ l
Nótese, de nuevo, que s − a puede ser representado como un vector que inicia

Im (s)

Re (s)

Figura 6.30. Recorrido cerrado alrededor de un polo.

en a y termina en s. Es fácil observar que cada vez que el recorrido sobre


Γ se completa una vez el ángulo −θ tiene un incremento positivo (sentido
antihorario) de +2π radianes. Por otro lado, como Γ no pasa sobre s = a
entonces 1/l > 0 (y es finito) en todo el recorrido. Esto significa que cada vez
que el recorrido horario Γ es completado una vez el vector 1l ∠ − θ describe
una vuelta antihoraria alrededor del origen. Como G(s) = 1l ∠ − θ decimos
que la vuelta antihoraria ha sido completada alrededor del origen del plano
G(s), es decir, alrededor de G(s) = 0 (véase la figura 6.31).
A partir de esto no es difı́cil ver que si G(s) sólo tiene n polos y si Γ
encierra por completo a todos esos polos, entonces cada vez que se completa
6.5 Criterio de estabilidad de Nyquist 329

Im (G (s))

+ 2ù

Re (G (s))
àò

1=l

G (s )

Figura 6.31. Recorrido antihorario alrededor del origen del plano G(s).

un recorrido horario sobre Γ se completan n vueltas antihorarias alrededor


del origen del plano G(s).

6.5.2. Trayectoria de Nyquist

R(s) + C(s)
G(s)
à

H(s)

Figura 6.32. Sistema en lazo cerrado.

Considere la función de transferencia del sistema en lazo cerrado de la


figura 6.32:

C(s) G(s)
=
R(s) 1 + G(s)H(s)
330 6 Diseño usando la respuesta en frecuencia

Si se consigue probar que esta función de transferencia no tiene polos en el


semiplano derecho entonces la estabilidad del sistema en lazo cerrado está ase-
gurada. La idea es investigar la existencia de tales polos usando una trayectoria
cerrada como en la sección previa. Suponga que se usa una trayectoria cerra-
da como la mostrada en figura 6.33, la cual es recorrida en sentido horario.
Nótese que esta trayectoria encierra por completo a cualquier polo o cero que
G(s)
la función 1+G(s)H(s) tenga en el semiplano derecho. Esta trayectoria cerrada
se conoce como “Trayectoria de Nyquist”. Suponga que la función de transfe-
G(s)
rencia 1+G(s)H(s) tiene p polos y z ceros en el semiplano derecho. De acuerdo
a la sección anterior, si se recorre la trayectoria de Nyquist una vez el núme-
G(s)
ro de vueltas horarias alrededor del origen del plano 1+G(s)H(s) será igual a
z − p, donde un resultado negativo significa número de vueltas antihorarias.
Suponga que tal número de vueltas es igual a z, es decir, z − p = z. Esto
implicarı́a que p = 0, es decir, no habrı́a ningún polo de lazo cerrado en el
semiplano derecho y por tanto se asegurarı́a estabilidad del sistema en lazo
cerrado. Esta es la idea fundamental detrás del criterio de Nyquist que se des-
arrolla a continuación. Sin embargo, algunas sutilezas deben ser consideradas
antes.

Im (s)
+1

r!1

0 Re (s)

à1

Figura 6.33. Trayectoria de Nyquist.


6.5 Criterio de estabilidad de Nyquist 331

El criterio de Nyquist fue desarrollado bajo la siguiente consigna. Dado un


sistema en lazo cerrado, la función de transferencia de lazo abierto G(s)H(s)
es conocida (planta y controlador) pero la función de transferencia de lazo
G(s)
cerrado 1+G(s)H(s) es desconocida. Es decir, aún cuando los polos y ceros de
G(s)
G(s)H(s) son conocidos, los polos de 1+G(s)H(s) son desconocidos. Si se cono-
G(s)
cieran los polos de 1+G(s)H(s) el problema de estabilidad ya estarı́a resuelto y
cualquier criterio de estabilidad estarı́a de más. Entonces, una de las consignas
del criterio de Nyquist es determinar la estabilidad en lazo cerrado a partir
del conocimiento de la función de transferencia de lazo abierto sólamente.
G(s)
Lo anterior significa que la función 1+G(s)H(s) no puede ser evaluada mien-
tras se hace el recorrido de la trayectoria de Nyquist como se describe en los
párrafos anteriores. Esto implica que no puede conocerse el número de vueltas
G(s)
obtenidas al rededor del origen de 1+G(s)H(s) y, por tanto, dicho método debe
ser modificado. Esto es lo que se hace en las siguientes secciones.

6.5.3. Polos y ceros

Considere la función de transferencia del sistema en lazo cerrado de la


figura 6.32:

C(s) G(s)
= (6.28)
R(s) 1 + G(s)H(s)

Los polos del sistema en lazo cerrado son los ceros de 1 + G(s)H(s). Re-
cuérdese que los polos de lazo cerrado son los valores de s que satisfacen
1 + G(s)H(s) = 0.
Los polos de G(s)H(s) (polos de lazo abierto) también son los polos de
1 + G(s)H(s). Nótese que si G(s)H(s) → ∞ entonces 1 + G(s)H(s) → ∞
también.

6.5.4. Criterio de Nyquist. Caso especial

Suponga que G(s)H(s) tiene P polos en el semiplano derecho (polos de


lazo abierto inestables con parte real positiva), es decir, de acuerdo a la sección
previa, la función 1+G(s)H(s) tiene P polos en el semiplano derecho. También
suponga que la función 1 + G(s)H(s) tiene Z ceros en el semiplano derecho
(polos de lazo cerrado inestables). Suponga que, una vez que se recorre en
sentido horario la trayectoria de Nyquist, se obtienen N vueltas alrededor del
origen del plano 1 + G(s)H(s), es decir N = Z − P . Si N = −P < 0 es
decir, si se consiguen P vueltas antihorarias alrededor del origen del plano
1 + G(s)H(s) entonces el número de polos de lazo cerrado inestables es cero,
Z = 0, y se asegura la estabilidad del sistema en lazo cerrado.
Sólo falta un pequeño detalle para terminar de establecer el criterio de
Nyquist. El origen del plano 1+G(s)H(s) satisface la condición 1+G(s)H(s) =
332 6 Diseño usando la respuesta en frecuencia

0 que equivale a G(s)H(s) = −1. Por tanto, el origen del plano 1 + G(s)H(s)
corresponde al punto (−1, j0) del plano G(s)H(s). Esto significa que el número
de vueltas N alrededor del origen del plano 1+G(s)H(s) es idéntico al número
de vueltas alrededor del punto (−1, j0) en el plano G(s)H(s). Esto es algo
muy conveniente porque sólo se requiere conocer G(s)H(s) (en lugar de 1 +
G(s)H(s)).
Finalmente, nótese que si G(s)H(s) es una función que tiene un número de
polos que es mayor o igual al número de ceros, entonces lı́ms→∞ G(s)H(s) =
constante. Esto significa que mientras se recorre toda la parte semicircular
de radio infinito de la trayectoria de Nyquist la función G(s)H(s) representa
un único punto. Entonces, la parte realmente interesante de G(s)H(s) es la
que se obtiene durante el recorrido del eje imaginario, desde jω = −j∞ has-
ta jω = +j∞. Nótese que durante este recorrido G(s)H(s) se convierte en
G(jω)H(jω) lo que representa la gráfica polar del sistema en lazo abierto que
ya se ha aprendido a dibujar. Todo lo anterior permite establecer el siguiente
criterio.

Criterio de Nyquist. Caso especial en el que G(s)H(s) no tiene polos


y/o ceros sobre sobre el eje imaginario.
En el sistema de lazo cerrado mostrado en la figura 6.32, si la función de trans-
ferencia de lazo abierto G(s)H(s) tiene P polos en el semiplano derecho del
plano s y lı́ms→∞ G(s)H(s) = constante, entonces para que haya estabilidad
en lazo cerrado la gráfica polar de G(jω)H(jω) (al variar ω de −∞ a +∞)
debe rodear P veces en sentido antihorario al punto (−1, j0).

La clave para recordar el criterio de Nyquist es expresándolo en la forma:

Z =N +P

donde P representa el número de polos de lazo abierto inestables, Z representa


el número de polos de lazo cerrado inestables y N representa el número de
vueltas que la gráfica polar G(jω)H(jω) realiza alrededor del punto (−1, j0),
cuando ω varı́a desde −∞ hasta +∞. Un valor positivo de N representa
vueltas horarias y mientras que un valor negativo de N representa vueltas
antihorarias. La estabilidad en lazo cerrado se asegura cuando Z = 0, es decir
cuando N = −P .

6.5.5. Criterio de Nyquist. Caso general

El truco del recorrido cerrado Γ introducido en la sección 6.5.1 sólo es


válido si dicho recorrido contiene por completo a los polos y ceros en cuestión.
Ası́ que no es aplicable en el caso en que un polo o un cero están sobre el
recorrido cerrado. Nótese que en el caso en que la función de lazo abierto
G(s)H(s) tiene polos o ceros sobre el eje imaginario la trayectoria de Nyquist
contiene a dichos polos o ceros por lo que el criterio establecido en la sección
6.5 Criterio de estabilidad de Nyquist 333

6.5.4 no es aplicable. Este problema se resuelve definiendo un nuevo recorrido


conocido como la “trayectoria de Nyquist modificada” que se muestra en la
figura 6.34. Esta trayectoria es idéntica a la trayectoria de Nyquist introducida
en la figura 6.33 y sólo difiere de ésta en los puntos que contienen a los polos
o ceros de G(s)H(s) sobre el eje imaginario. La idea es rodear tales puntos
usando una trayectoria semicircular de radio pequeño ε → 0 que describe
un ángulo que varı́a de −90o a +90o . La razón de introducir un radio muy
pequeño es el asegurar que la trayectoria de Nyquist modificada encierre por
completo a cualquier posible polo o cero de lazo cerrado (desconocidos) que se
encuentren en el semiplano derecho cerca del eje imaginario. La forma general
del criterio de Nyquist puede establecerse del siguiente modo.

Im (s)

r!1
polos y
ceros de
G (s ) H (s ) Re (s)

Figura 6.34. Trayectoria de Nyquist modificada.

Criterio de Nyquist. Caso general en el que G(s)H(s) tiene polos y/o


ceros sobre sobre el eje imaginario.
En el sistema de lazo cerrado mostrado en la figura 6.32, si la función de
transferencia de lazo abierto G(s)H(s) tiene P polos en el semiplano derecho
del plano s, entonces para que haya estabilidad en lazo cerrado, cuando un
punto representativo s recorre la trayectoria de Nyquist modificada en sentido
horario la gráfica de G(s)H(s) debe rodear P veces en sentido antihorario al
334 6 Diseño usando la respuesta en frecuencia

punto (−1, j0).

Es importante subrayar que en este caso también se requiere que G(s)H(s)


→ constante cuando s → ∞, es decir, que G(s)H(s) tenga un número de polos
mayor o igual al número de sus ceros. Además, también sigue aplicándose la
relación Z = N + P con Z el número de polos inestables de lazo cerrado, P el
número de polos inestables de lazo abierto y N el número de vueltas alrededor
del punto (−1, j0).

6.6. Márgenes de estabilidad


El criterio de Nyquist es válido para sistemas cuyas funciones de trans-
ferencia son de fase mı́nima o de fase no mı́nima, es decir, se trata de un
resultado que se puede aplicar a cualquier caso. Sin embargo, lo que a conti-
nuación se describe se hace suponiendo que el sistema tiene una función de
transferencia de lazo abierto de fase mı́nima (todos los polos y ceros tienen
parte real menor o igual que cero), pues esta consideración simplifica grande-
mente la exposición de las ideas.
Si el sistema es de fase mı́nima entonces P = 0 por lo que la estabilidad de
lazo cerrado queda asegurada si N = 0, entonces el criterio de Nyquist puede
simplificarse a lo siguiente:
“Considere que la frecuencia ω varı́a únicamente desde 0 hasta +∞. Trace
la gráfica polar de G(s)H(s) correspondiente a estas frecuencias. Suponga
que esta gráfica representa un camino que usted puede recorrer sobre el papel
desde ω = 0 hasta ω → +∞. Si el punto (−1, j0) queda a la izquierda de
dicho camino recorrido entonces el sistema en lazo cerrado es estable. Si tal
punto queda a la derecha entonces hay inestabilidad.”
Ante esta descripción salta a la vista la siguiente pregunta: ¿Qué sucede si
la gráfica polar obtenida pasa exactamente sobre el punto (−1, j0)? En tal caso
se dice que se está en el lı́mite de la estabilidad, lo que significa que hay polos
de lazo cerrado que tienen parte real cero. En base a esto se puede afirmar que
mientras el punto (−1, j0) esté mas lejos de la gráfica polar de G(s)H(s)|s=jω
pero siempre a su izquierda entonces el sistema en lazo cerrado será más
estable (más lejos de la inestabilidad). A la lejanı́a que guarda el sistema en
lazo cerrado respecto a la inestabilidad se le llama margen de estabilidad y
existen dos maneras de medir dicha lejanı́a: el margen de fase y el margen de
ganancia.
Margen de fase. Es la cantidad de atraso de fase que se requiere añadir
a la frecuencia de cruce de ganancia ω1 , para llevar el sistema al bor-
de de la inestabilidad. La frecuencia de cruce de ganancia es aquella a
la cual |G(jω1 )H(jω1 )| = 1. Sea Kf el margen de fase y φ la fase de
G(jω1 )H(jω1 ), entonces:

Kf = 180o + φ
6.6 Márgenes de estabilidad 335

En la figura 6.35 puede observarse que un margen de fase negativo implica


inestabilidad en lazo cerrado, mientras que un margen de fase positivo im-
plica estabilidad en lazo cerrado. De acuerdo a estos razonamientos un cero
que se agregue en lazo abierto tiende a mejorar la estabilidad del sistema
en lazo cerrado porque introduce una fase positiva, es decir, incrementa o
hace positivo el valor de Kf . Nótese que, de acuerdo a las gráficas en las
figuras 6.13 y 6.15, el adelanto de fase debido un cero es mayor para una
frecuencia especı́fica conforme la frecuencia de esquina es menor (la cual es
numéricamente igual al valor absoluto de la ubicación del cero). Por tanto,
el efecto estabilizante del cero de lazo abierto aumenta conforme éste se
coloca más cerca del origen (dentro del semiplano izquierdo).
Por otro lado, un polo que se agregue en lazo abierto tiende a hacer menos
estable al sistema en lazo cerrado porque introduce una fase negativa, es
decir, disminuye o hace negativo el valor de Kf . Nótese que, de acuer-
do a las gráficas en las figuras 6.13 y 6.15, el atraso de fase debido un
polo es mayor para una frecuencia especı́fica conforme la frecuencia de
esquina es menor (la cual es numéricamente igual al valor absoluto de la
ubicación del polo). Por tanto, el efecto inestabilizante del polo de lazo
abierto aumenta conforme éste se coloca más cerca del origen (dentro del
semiplano izquierdo).
Margen de ganancia. Sea Kg el margen de ganancia, entonces:

1
Kg =
|G(jω2 )H(jω2 )|

donde ω2 representa la frecuencia en la que la fase de G(jω2 )H(jω2 ) es


−180[grados ] (ω2 también es conocida como frecuencia de cruce de fase).
En la figura 6.35 puede observarse que Kg > 1 (20 log(Kg ) > 0[dB])
implica estabilidad en lazo cerrado, mientras que Kg < 1 (20 log(Kg ) <
0[dB]) implica inestabilidad en lazo cerrado.

Es importante resaltar que los márgenes de fase y de ganancia están definidos


sobre las gráficas de respuesta en frecuencia de la función de transferencia
de lazo abierto y, sin embargo, dan información sobre la estabilidad y las
caracterı́sticas de respuesta transitoria del sistema en lazo cerrado.
336 6 Diseño usando la respuesta en frecuencia

dB dB
!1 !1
0 ! 0 !2 !
!2

fase fase
[grados] ! [grados] 0 !
0
à 90 à 90
à 180 à 180
(a) Estabilidad en lazo cerrado. (b) Inestabilidad en lazo cerrado.

Im (G (j! ) H (j! ) )

!! +1
ï ï1
à1 Kg Re (G (j! ) H (j! ) )
! = 0+

(c) Estabilidad en lazo cerrado.

Im (G (j! ) H (j! ) )

1
Kg !! +1
ï ï
à1 Re (G (j! ) H (j! ) )
! = 0+

(d) Inestabilidad en lazo cerrado.

Figura 6.35. Respuesta en frecuencia de G(jω)H(jω). Los márgenes de fase y de


ganancia se determinan a partir de la respuesta en frecuencia obtenida a partir de
la función de transferencia de lazo abierto.

6.7. Relación entre las caracterı́sticas de respuesta en


la frecuencia y en el tiempo
Como se menciona en el capı́tulo 5, la respuesta de un sistema de control
se compone de dos partes: la respuesta transitoria y la respuesta en estado es-
6.7 Relación entre las caracterı́sticas de respuesta en la frecuencia y en el tiempo 337

tacionario. Es importante saber como se relacionan las caracterı́sticas de estas


respuestas en el tiempo con las caracterı́sticas de la respuesta en frecuencia
del sistema a controlar, a fin de saber qué es lo que se debe modificar en estas
últimas para poder diseñar adecuadamente las primeras. A continuación se
describen los puntos más sobresalientes de esta relación.

6.7.1. Respuesta en lazo abierto


Existe una relación muy estrecha entre las caracterı́sticas de respuesta en
frecuencia de un sistema en lazo abierto y las caracterı́sticas de respuesta en
el tiempo del mismo sistema en lazo abierto, como se describe a continuación.
1. La altura del pico de resonancia Mr está relacionada inversamente con
el valor del amortiguamiento, ζ: cuanto mayor es Mr menor es ζ (véase
la figura 6.14(b)). Recuérdese que menores amortiguamientos ζ producen
mayores sobre pasos, Mp ( %), en la respuesta en el tiempo cuando se aplica
un escalón. Por tanto, el sobre paso es mayor (y el sistema presenta más
oscilaciones) conforme Mr es mayor. En términos muy generales puede
afirmarse que cuando 1.0 < Mr < 1.4 (0[dB]< Mr < 3[dB]) entonces el
amortiguamiento está en el rango 0.7 > ζ > 0.4 [3] pág. 571, [4] pág. 637.
2. La magnitud de la frecuencia de esquina indica la velocidad de respuesta
del sistema [3] pág. 573, [4] pág 638. Recuérdese que en un sistema de
segundo orden la frecuencia de esquina es ωn la cual, cuando aumenta,
reduce el tiempo de subida (véase la sección 3.3). En el caso de un sistema
de primer orden la frecuencia de esquina es igual al valor absoluto del polo
del sistema. De acuerdo a la sección 3.1 el tiempo de respuesta (constante
de tiempo) se reduce si el valor absoluto del polo tiene un valor mayor.
En el caso general de un sistema arbitrario de orden n se define el ancho
de banda para describir su rapidez de respuesta en el tiempo en términos
de su respuesta en frecuencia. El ancho de banda es la frecuencia a la cual
la magnitud de la función de transferencia se reduce en −3[dB] respecto
de su magnitud a frecuencia cero. La rapidez de respuesta en el tiempo
del sistema es mayor conforme su ancho de banda es mayor.
3. El valor final de la salida del sistema definido por Y (s) = G(s)U (s) ante
una entrada tipo escalón de altura A está determinada por la respuesta
del sistema a frecuencia cero G(jω)|ω=0 :
A
lı́m y(t) = lı́m sG(s) = G(0)A = |G(j0)|A
t→∞ s→0 s
Nótese que los dos últimos puntos están en completo acuerdo con lo examinado
en la sección 6.1.4.

6.7.2. Respuesta en lazo cerrado


También existe una relación entre la respuesta en frecuencia de la función
de lazo abierto G(s)H(s) y la respuesta en el tiempo del sistema en lazo
338 6 Diseño usando la respuesta en frecuencia

cerrado C(s)
R(s) . Esta relación es muy importante para el diseño de sistemas de
control realimentados.
1. El margen de fase Kf (medido a partir de la respuesta en frecuencia del
sistema en lazo abierto) se relaciona con el factor de amortiguamiento del
sistema en lazo cerrado de acuerdo a la siguiente tabla [3] pág. 570,[4] pág.
648:

Tabla 6.3. Relación entre el margen de fase (lazo abierto) y el amortiguamiento de


un sistema en lazo cerrado.
Kf [grados] 0 11 23 33 43 52 59 65 70 74 76
ζ 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Nótese que para el rango 0 ≤ ζ ≤ 0.6 se cumple aproximadamente que


K
ζ = 100f . Debe aclararse que estas relaciones se calculan a partir de la
respuesta de un sistema de segundo orden sin ceros. Aunque para sistemas
de orden mayor y con ceros se esperan diferencias respecto a estos valores
sin embargo es posible considerarlos como directivas para el diseño.
2. A mayor frecuencia de cruce de ganancia (medida a partir de la respuesta
en frecuencia del sistema en lazo abierto) mayor es la rapidez del sistema
en lazo cerrado [3], pág. 571. Esto puede explicarse del siguiente modo. La
frecuencia de cruce de ganancia es la frecuencia a la cual |G(jω)H(jω)| =
0[dB] y generalmente esta magnitud disminuye al aumentar la frecuencia.
Por tanto, una mayor frecuencia de cruce de ganancia en lazo abierto
implica un mayor ancho de banda en lazo cerrado y esto último implica
una mayor rapidez de respuesta del sistema en lazo cerrado.
3. El error en estado estacionario de la respuesta en lazo cerrado se obtiene
a partir de la respuesta de la función de lazo abierto a frecuencia cero.
Por ejemplo, si en el sistema en lazo cerrado se tiene que R(s) = A/s
entonces:
A
ess = lı́m [r(t) − y(t)] = , kp = G(0)H(0) = |G(jω)H(jω)|ω=0
t→∞ 1 + kp

6.8. Ejemplos

6.8.1. Ejemplo de análisis

En esta parte se presenta un ejemplo de análisis usando la técnica de la


respuesta en frecuencia. Este ejemplo es estudiado usando el método del lugar
de las raı́ces en la sección 5.2.6.
6.8 Ejemplos 339

Análisis de estabilidad
Considere la siguiente función de transferencia:
116137 k
G(s)H(s) = (6.29)
s3 + 72.54s2 − 1250s − 9.363 × 104
116137 k
=
(s − 35.7377)(s + 36.5040)(s + 71.7721)
116137 k 35.7377 36.5040 71.7721
=
(35.7377)(36.5040)(71.7721) (s − 35.7377) (s + 36.5040) (s + 71.7721)
Para este ejemplo es importante encontrar las caracterı́sticas de respuesta en
frecuencia de la siguiente función de transferencia:
a
G1 (s) = , a>0
s−a
Usando el cambio de variable s = jω se puede obtener:
a
G1 (jω) =
jω − a
a −jω − a
=
jω − a −jω − a
a(−jω − a)
=
ω 2 + a2
√ µ ¶
a ω 2 + a2 −ω
= ∠atan
ω 2 + a2 −a
µ ¶
a −ω
= √ ∠atan
ω 2 + a2 −a
µ ¶
a −ω
|G1 (jω)| = √ , ∠G1 (jω) = atan
ω 2 + a2 −a
De aquı́ se encuentra que:
si ω = 0 : |G1 (jω)| = 1, ∠G1 (jω) = −180o
si ω → ∞ : |G1 (jω)| → 0, ∠G1 (jω) → −90o
1
si ω = a : |G1 (jω)| = √ , ∠G1 (jω) = −135o
2
Usando esta información y los resultados de la sección 6.3 se obtienen las
gráficas de Bode mostradas en la figura 6.36. Usando estas gráficas de Bode
se obtiene la gráfica polar de la figura 6.37. Es conveniente aclarar que también
es correcto decir que:
si ω = 0 : |G1 (jω)| = 1, ∠G1 (jω) = +180o
si ω → ∞ : |G1 (jω)| → 0, ∠G1 (jω) → +270o
1
si ω = a : |G1 (jω)| = √ , ∠G1 (jω) = +225o
2
340 6 Diseño usando la respuesta en frecuencia

Esto trae como consecuencia que en este caso la gráfica de Bode de fase
esté desplazada 360◦ hacia arriba respecto de la gráfica de Bode de fase mos-
trada en la figura 6.36. Sin embargo, el lector puede verificar que la gráfica
polar en ambos casos es idéntica a la mostrada en la figura 6.37. Por esta
razón, el análisis presentado en la siguiente subsección para estudiar el efecto
de un compensador es válido en ambos casos.
Continuando con la figura 6.37, nótese que para k mayores crece la dis-
tancia al origen de cualquier punto sobre la gráfica polar. Por tanto, para k
pequeñas se tiene que N = 0 y para k grandes se tiene N = 1. Nótese que
el número de polos inestables de lazo abierto es P = 1. Entonces, de acuer-
do al criterio de Nyquist el número de polos inestables en lazo cerrado es
Z = P + N > 0. Esto significa que el sistema en lazo cerrado es inestable para
cualquier valor de k > 0. A continuación se muestra que este problema puede
ser resuelto si se introduce convenientemente un adelanto de fase, es decir, si
se adiciona un cero a la función de transferencia de lazo abierto.

dB
i)
35:73 71:77 !
0 36:5
ii) iii) iv)

v)

fase
[grados]
35:73 36:5 71:77
0 !
iii) iv)
à 90
ii)
à 180

v)
à 270

116137 k
Figura 6.36. Gráficas de Bode de G(s)H(s) en (6.29): i) (35.7377)(36.5040)(71.7721)
,
35.7377 36.5040 71.7721
ii) (s−35.7377) , iii) (s+36.5040) , iv) (s+71.7721) , v) G(s)H(s).

Considere la siguiente función de transferencia de lazo abierto:


6.8 Ejemplos 341

Im (G(j!)H(j!))

!=0 ! ! +1
ï ï
à1 ! ! à1 0 Re (G(j!)H(j!))

Figura 6.37. Gráfica polar de G(s)H(s) en (6.29).

116137(s + b)
G(s)H(s) = k (6.30)
s3
+ 72.54s2 − 1250s − 9.363 × 104
116137(s + b)
=k
(s − 35.7377)(s + 36.5040)(s + 71.7721)
116137 k b 35.7377 36.5040 71.7721 s + b
=
(35.7377)(36.5040)(71.7721) (s − 35.7377) (s + 36.5040) (s + 71.7721) b
con b una constante positiva. Si se elige b < 35.7377 entonces se obtienen
las gráficas de Bode mostradas en la figura 6.38 y con ellas la gráfica polar
de la figura 6.39. Esto significa que si k es suficientemente grande entonces
N = −1 y como P = 1 entonces el sistema en lazo cerrado es estable porque
Z = P + N = 0.

Análisis usando gráficas de Bode


En esta parte se usan las gráficas de Bode para analizar las caracterı́sticas
del sistema en lazo cerrado estudiado en la sección 5.2.6. En la figura 6.40 se
muestran las gráficas de Bode de la función de transferencia:
116137
s3 + 72.54s2 − 1250s − 9.363 × 104
Nótese que el adelanto de fase del polo en s = 35.73, y que se muestra en
la figura 6.36, no se aprecia en la figura 6.40 debido a la presencia del polo en
s = −36.50. Obsérvese también que el margen de fase2 es negativo por lo que
2
De acuerdo a la sección 6.6, el margen de fase y el margen de ganancia se definen
para sistemas de fase mı́nima y aunque el sistema aquı́ estudiado es de fase no
mı́nima (por el polo inestable en s = 35.7377), se utilizará el término “margen
de fase” para indicar la comparación de la fase del sistema respecto del valor
fundamental de −180◦ .
342 6 Diseño usando la respuesta en frecuencia

dB
i)
vi) 35:73 36:5 71:77 !
0
b
iii) iv)
ii)
v)
fase
[grados]
+ 90
vi)
35:73 36:5 71:77
0 !
b iii)
iv)
à 90

ii)
à 180 v)

116137 k b
Figura 6.38. Gráficas de Bode de G(s)H(s) en (6.30): i) (35.7377)(36.5040)(71.7721) ,
35.7377 36.5040 71.7721 s+b
ii) (s−35.7377) , iii) (s+36.5040) , iv) (s+71.7721) , v) G(s)H(s), vi) b , b < 35.7377.

Im (G(j!)H(j!))

!=0 ï ! ! à1
ï ï
à1 0 ! ! +1
Re (G(j!)H(j!))

Figura 6.39. Gráfica polar de G(s)H(s) en (6.30).

el sistema en lazo cerrado es inestable. Tal como se describe en la subsección


previa, se puede conseguir estabilidad en lazo cerrado si se introduce suficiente
adelanto de fase colocando en cascada un factor de la forma:
k(s + b) (6.31)
Al mismo tiempo, se puede hacer rápida la respuesta del sistema en lazo cerra-
do si se consigue una frecuencia de cruce de ganancia suficientemente grande.
Estas dos caracterı́sticas pueden ser conseguidas si seleccionan adecuadamen-
te los valores de k y de b. Usando b =31.2463 y k =0.0396 determinados en
6.8 Ejemplos 343

Figura 6.40. Gráficas de Bode del sistema sin compensar


116137
.
s3 +72.54s2 −1250s−9.363×104

la sección 5.2.6 se consigue lo siguiente. Para ω =38.5[rad/s] la magnitud y la


fase son de −5.85[dB] y −208[grados], respectivamente, en la figura 6.40. La
figura 6.41 muestra que a esta misma frecuencia la magnitud y la fase son de
5.87[dB] y 50.9[grados] para el factor en (6.31). En la figura 6.42 se muestra
que con esto se consigue que la función de transferencia G(s)H(s) mostrada
en (6.30) tenga una magnitud de 0[dB] y una fase de −157[grados] cuando
ω =38.5[rad/s]. Esto significa que el sistema en lazo cerrado tiene un margen
de fase de 23[grados]. De acuerdo a la sección 6.7.2, si el sistema fuera de
segundo orden y sin ceros, esto corresponderı́a a un amortiguamiento en lazo
cerrado de aproximadamente 0.2. Ası́ que, aunque el sistema estudiado es de
tercer orden y tiene un cero, es de esperarse que la respuesta del sistema en
lazo cerrado esté poco amortiguada.
344 6 Diseño usando la respuesta en frecuencia

Figura 6.41. Gráficas de Bode del compensador k(s + b), b =31.2463, k =0.0396.

6.8.2. Un sistema ball and beam

En esta parte se presenta un ejemplo de diseño usando la técnica de la


respuesta en frecuencia. Este ejemplo constituye la aplicación a un prototipo
conocido como ball and beam el cual es construido y controlado experimen-
talmente en el capı́tulo 12.

Análisis de estabilidad

Considere el diagrama de bloques mostrado en la figura 6.43, donde Ax , a,


ρ, γ y k son constantes positivas. La función de transferencia de lazo abierto
está dada como:
ρAx γk a 1
G(s)H(s) = (6.32)
a s + a s3

Esta función de transferencia de lazo abierto tiene tres polos en el origen, es


decir sobre el eje imaginario del plano complejo s. Por tanto, se deberá utilizar
6.8 Ejemplos 345

Figura 6.42. G(s)H(s) en (6.30), b =31.2463 y k =0.0396.

Xd (s) k ú X(s)
Ax í
+ s ( s+ a ) s2
à

Figura 6.43. Sistema en lazo cerrado. Primera propuesta.

la trayectoria de Nyquist modificada que se muestra en la figura 6.44. La


gráfica polar de G(s)H(s), dada en (6.32), obtenida al recorrer la trayectoria
de Nyquist modificada se muestra en la figura 6.45. A continuación se explica
como se obtiene esta gráfica polar.
En la figura 6.23 se muestra la gráfica polar de (6.32). Para considerar el
rodeo alrededor de s = 0 que incluye la trayectoria de Nyquist modificada se
procede del siguiente modo. En primer lugar se hace el cambio de variable
s = ε∠φ en la función de transferencia (6.32) para obtener:
346 6 Diseño usando la respuesta en frecuencia

Im (s)
j!

! = 0+
þ = + 90 ä
s=" þ
"

Re (s)
r!1
! = 0à
þ = à 90

à j!

Figura 6.44. Trayectoria de Nyquist modificada usada en la sección 6.8.2.

ρAx γk 1
G(s)H(s) = ∠ − 3φ
ε∠φ + a ε3
Como ε → 0 es un valor constante muy pequeño se puede considerar que
a ≫ ε para aproximar:
ρAx γk
G(s)H(s) = ∠ − 3φ = β1 ∠ − 3φ
aε3
donde β1 = ρAaεx3γk → +∞ es una constante real muy grande porque ε → 0. Por
otro lado, φ varı́a desde −90 (cuando ω = 0− ) hasta +90 (cuando ω = 0+ ).
Entonces se tiene que:
½
β1 ∠ + 270, cuando ω = 0−
G(s)H(s) = β1 ∠ − 3φ = (6.33)
β1 ∠ − 270, cuando ω = 0+
Esto explica la presencia de las circunferencias de radio infinito que aparecen
en la figura 6.45 y que, de acuerdo a (6.33), deben ser recorridas en sentido
horario al pasar desde ω = 0− hasta ω = 0+ .
6.8 Ejemplos 347

Im (G (j! ) H (j! ) )

à 270 o
! = 0+

r!1
!! +1

à1 !! à1 Re (G (j! ) H (j! ) )

+ 270 oà
!=0

Figura 6.45. Gráfica polar de G(s)H(s) en (6.32) obtenida al recorrer la trayectoria


de Nyquist modificada mostrada en la figura 6.44.

Nótese que P = 0 porque G(s)H(s) dada en (6.32) no tiene polos con


parte real positiva y que N = 2 porque al recorrer la trayectoria de Nyquist
modificada en el sentido mostrado, la gráfica polar en la figura 6.45 da dos
vueltas en sentido horario al punto (−1, j0). Por tanto, la aplicación del cri-
terio de Nyquist Z = N + P = 2 indica que existen dos polos de lazo cerrado
que están en el semiplano complejo derecho y, por tanto, el sistema en lazo
cerrado de la figura 6.43 es inestable. Nótese también que debido a que en la
figura 6.45 hay circunferencias de radio infinito este resultado no cambia aún
cuando se redujera el valor de la ganancia:
ρAx γk
(6.34)
a
reduciendo por ejemplo el valor del parámetro γ. Esto se debe a que el valor
de β1 tiende a infinito para cualquier valor finito de (6.34) porque ε → 0 y,
por tanto, se sigue cumpliendo que P = 0, N = 2 y Z = 2.

Xd (s) k ú X(s)
Ax í s+ î
s+ c s ( s+ a ) s2
+
à

Figura 6.46. Sistema en lazo cerrado. Segunda propuesta.


348 6 Diseño usando la respuesta en frecuencia

Ahora considere el diagrama de bloques mostrado en la figura 6.46, donde


δ y c son constantes positivas. La motivación para usar este diagrama de
bloques es el tratar de conseguir estabilidad en lazo cerrado mediante el uso
de un controlador PD con función de transferencia (γs + γδ). Sin embargo,
en lugar de un controlador PD se propone usar una red de adelanto con
función de transferencia γ s+δ
s+c con δ < c pues este tipo de controlador reduce
el efecto del ruido que introduce un controlador PD. En este caso la función
de transferencia de lazo abierto está dada como:
ρAx γδk s + δ c a 1
G(s)H(s) = (6.35)
ac δ s + c s + a s3
Esta función de transferencia de lazo abierto también tiene tres polos en el
origen, es decir sobre el eje imaginario del plano complejo s y, por tanto, se
deberá utilizar la trayectoria de Nyquist modificada que se muestra en la figura
6.44. La gráfica polar de G(s)H(s), dada en (6.35), obtenida al recorrer la
trayectoria de Nyquist modificada se muestra en la figura 6.47. A continuación
se explica como se obtiene esta gráfica polar.

Im (G (j! ) H (j! ) )

à 270 o+
!=0

à1 !! +1

r!1 !! à1 Re (G (j! ) H (j! ) )

o
+ 270 à
!=0

Figura 6.47. Gráfica polar de G(s)H(s) en (6.35) obtenida al recorrer la trayectoria


de Nyquist modificada mostrada en la figura 6.44.

En la figura 6.25 se muestra la gráfica polar de (6.35). Para considerar el


rodeo al rededor de s = 0 que incluye la trayectoria de Nyquist modificada se
procede del siguiente modo. Primero se hace el cambio de variable s = ε∠φ
en la función de transferencia (6.35) para obtener:
ε∠φ + δ 1
G(s)H(s) = ρAx γk ∠ − 3φ
(ε∠φ + c)(ε∠φ + a) ε3
6.8 Ejemplos 349

Como ε → 0 es un valor constante muy pequeño se puede considerar que


a ≫ ε, c ≫ ε y δ ≫ ε para aproximar:
ρAx γkδ
G(s)H(s) = ∠ − 3φ = β2 ∠ − 3φ
acε3
donde β2 = ρAacε
x γkδ
3 → +∞ es una constante muy grande porque ε → 0. Por
otro lado, φ varı́a desde −90 (cuando ω = 0− ) hasta +90 (cuando ω = 0+ ).
Entonces se tiene que:
½
β2 ∠ + 270, cuando ω = 0−
G(s)H(s) = β2 ∠ − 3φ = (6.36)
β2 ∠ − 270, cuando ω = 0+
Esto explica la presencia de las circunferencias de radio infinito que aparecen
en la figura 6.47 y que, de acuerdo a (6.36), deben ser recorridas en sentido
horario al pasar desde ω = 0− hasta ω = 0+ .
Nótese que, de nuevo, P = 0, N = 2 y Z = N + P = 2. Por tanto, existen
dos polos de lazo cerrado que tienen parte real positiva y el sistema en lazo
cerrado es inestable. Además, usando argumentos similares al los usados en el
ejemplo anterior, se concluye que la inestabilidad no se puede corregir dando
valores pequeños a la siguiente ganancia:
ρAx γkδ
(6.37)
ac
Ası́ que ni el uso de una red de adelanto es suficiente para conseguir esta-
bilidad en lazo cerrado. Es momento entonces de analizar cuidadosamente lo
que esta sucediendo. Recuérdese que en la sección 6.6 se mencionó que cuando
se introduce un polo de lazo abierto (con parte real negativa) el sistema en
lazo cerrado se acerca hacia la inestabilidad. También se dijo que este efec-
to inestabilizante crece conforme dicho polo se coloca más cerca del origen.
Ahora observe que las funciones de transferencia en (6.32) y en (6.35) tienen
tres polos en el origen. Entonces es razonable preguntarse si los problemas de
inestabilidad que se han encontrado hasta ahora son debidos a que la función
de transferencia de lazo abierto tiene demasiados polos en el origen.

Xd (s) s+ b + + k ú X(s)
Ax í s+ c
ï ë
s ( s+ a ) ï
s2
+ 1 2
à à à

ký s Aò

Figura 6.48. Sistema en lazo cerrado. Tercera propuesta.

Considere el diagrama de bloques de la figura 6.48, donde α, Aθ , kv , b


y c son constantes positivas. El objetivo de los dos lazos internos alrededor
350 6 Diseño usando la respuesta en frecuencia

k
de la función de transferencia s(s+a) es sacar uno de los polos del origen re-
corriéndolo hacia la izquierda. Nótese también que la red de adelanto está dada
como:
s+b
Gc (s) = γ , 0<b<c (6.38)
s+c
La función de transferencia entre los puntos 1 y 2 de la figura 6.48 está dada
como:
αk
Gm (s) =
s2 + (a + kv kAθ )s + αkAθ

Por tanto, la función de transferencia de lazo abierto es:


Ax ρ γb s + b c αkAθ 1
G(s)H(s) = (6.39)
cAθ b s + c s + (a + kv kAθ )s + αkAθ s2
2

Nótese que esta función de transferencia de lazo abierto tiene dos polos en el
origen, es decir sobre el eje imaginario del plano complejo s y, por tanto, se
deberá utilizar la trayectoria de Nyquist modificada que se muestra en la figura
6.44. La gráfica polar de G(s)H(s), dada en (6.39), obtenida al recorrer la
trayectoria de Nyquist modificada se muestra en la figura 6.49. A continuación
se explica como se obtiene esta gráfica polar.

Im (G (j! ) H (j! ) )

à
+ 180 î ! = 0 ! ! +1
î
à 180 ! = 0 + à1 ! ! à1 Re (G (j! ) H (j! ) )
r!1

Figura 6.49. Gráfica polar de G(s)H(s) en (6.39) obtenida al recorrer la trayectoria


de Nyquist modificada mostrada en la figura 6.44.

En la figura 6.27 se muestra la gráfica polar de (6.39). Para considerar el


rodeo alrededor de s = 0 que incluye la trayectoria de Nyquist modificada se
6.8 Ejemplos 351

procede del siguiente modo. Primero se hace el cambio de variable s = ε∠φ


en la función de transferencia (6.39) para obtener:

ε∠φ + b αk 1
G(s)H(s) = Ax ρ γ ∠ −(6.40)

ε∠φ + c ε2 ∠2φ + (a + kv kAθ )ε∠φ + αkAθ ε2

Como ε → 0 es un valor constante muy pequeño se puede aproximar:


Ax ρ γ b
G(s)H(s) = ∠ − 2φ (6.41)
cAθ ε2

donde β3 = AcAx ρ γ b
θε
2 → +∞ es una constante muy grande porque ε → 0. Por
otro lado, φ varı́a desde −90 (cuando ω = 0− ) hasta +90 (cuando ω = 0+ ).
Entonces se tiene que:
½
β3 ∠ + 180, cuando ω = 0−
G(s)H(s) = β3 ∠ − 2φ = (6.42)
β3 ∠ − 180, cuando ω = 0+

Esto explica la presencia de la circunferencia de radio infinito que aparece en


la figura 6.49 y que, de acuerdo a (6.42), debe ser recorrida en sentido horario
al pasar desde ω = 0− hasta ω = 0+ .
Nótese que ahora se tiene P = 0, N = 0 y Z = N + P = 0. Por tanto,
no existe ningún polo de lazo cerrado con parte real positiva y entonces el
sistema en lazo cerrado es estable.

Diseño usando gráficas de Bode

Considere los siguientes valores numéricos:

k = 16.51, a = 3.04, Aθ = 1.43, (6.43)


Ax = 5.64, ρ = 5, α = 4, kv = 0.2

Las constantes α y kv forman parte del controlador a diseñar, por lo que se


requiere de un criterio para su selección. Sin embargo, este criterio depende de
aspectos prácticos y sólo puede definirse en base a las condiciones del prototipo
experimental que se va a controlar. En el capı́tulo 12 se define dicho criterio
y se explica como se pueden seleccionar α y kv . En la figura 6.50 se muestran
las gráficas de Bode de la siguiente función de transferencia:
Ax ρ αkAθ 1
(6.44)
Aθ s + (a + kv kAθ )s + αkAθ s2
2

las cuales son obtenidas usando los valores presentados en (6.43). Puede verse
que la fase es aproximadamente igual a −208 grados cuando la magnitud es
igual a 0[dB] (cuando ω = 4.8[rad/s]). Esto significa que el margen de fase
es negativo y, por tanto, el sistema en lazo cerrado obtenido con (6.44) como
función de transferencia de lazo abierto serı́a inestable. Con el fin de estabilizar
352 6 Diseño usando la respuesta en frecuencia

Bode Diagram

50

System: gh
Frequency (rad/sec): 4.84
Magnitude (dB): −0.0804
0
Magnitude (dB)

−50

−100
−180

−225 System: gh
Frequency (rad/sec): 4.84
Phase (deg): −208
Phase (deg)

−270

−315

−360
0 1 2
10 10 10
Frequency (rad/sec)

Figura 6.50. Gráficas de Bode de la función de transferencia en (6.44)

el sistema en lazo cerrado se introduce el compensador presentado en (6.38),


por lo que la función de transferencia en lazo abierto del sistema compensado
es la presentada en (6.39).
El compensador en (6.38) se diseña bajo el criterio de que el margen de
fase del sistema compensado sea de 20 grados. Esto representa un margen de
fase razonable y no requiere un adelanto de fase excesivo. Más adelante se
mencionan las desventajas de introducir demasiado adelanto de fase. Elı́jase
ω = 4.8[rad/s] como la frecuencia a la cual el sistema en lazo abierto compen-
sado debe tener una magnitud de 0[dB]. Nótese lo siguiente:
El sistema sin compensar tiene una fase de −208 grados y una magnitud
de 0[dB] a la frecuencia ω = 4.8[rad/s]. Esto puede apreciarse en la figura
6.50.
El compensador en (6.38) debe introducir, a la frecuencia ω = 4.8[rad/s],
un adelanto de fase de 208−160=48 grados, para tener un margen de fase
de 20 grados, y una magnitud igual a 0[dB], para que la magnitud del
sistema compensado sea de 0[dB] a la frecuencia ω = 4.8[rad/s].
En la figura 6.51 se muestran las gráficas de Bode de la función de transferencia
(véase la sección 6.4.1):
6.8 Ejemplos 353

s + T1
Gd (s) = 1 , ξ = 0.14 (6.45)
s + ξT

Se elige un valor de ξ = 0.14 porque en la figura 6.51 se observa que esto

!T

!T

!T

Figura 6.51. Gráficas de Bode para Gd (s) en (6.45)

consigue que la red en (6.45) produzca un máximo adelanto de fase de apro-


ximadamente 48 grados. Esto ocurre cuando ωT = 2.6 lo cual introduce una
magnitud de aproximadamente −8.7[dB]. El valor de T se calcula del siguiente
modo:
2.6 2.6
T = = = 0.541
ω 4.8
porque ω = 4.8[rad/s] es la frecuencia a la cual se debe introducir el adelanto
de fase de 48 grados. Por tanto, (6.45) toma la forma:
s + 1.84
Gd (s) =
s + 13.2
Nótese que el compensador en (6.38) se puede obtener como:
354 6 Diseño usando la respuesta en frecuencia

Gc (s) = γGd (s) (6.46)

si se selecciona b = 1.84 y c = 13.2. El compensador Gc (s) debe introducir una


magnitud de 0[dB] a la frecuencia ω = 4.8[rad/s]. De acuerdo a (6.46), esta
cantidad está dada como la suma en decibeles de la magnitud de la función
de transferencia Gd (s) a dicha frecuencia (es decir, −8.7[dB]) y el equivalente
en decibeles de la ganancia γ:

−8.7[dB] + 20 log(γ) = 0[dB]

Despejando se obtiene:
8.7
γ = 10 20 ≈ 2.6

Finalmente, se puede escribir:


s + 1.84
Gc (s) = 2.6 (6.47)
s + 13.2
En la figura 6.52 se muestra la gráfica de Bode del sistema compensado (6.39)
usando el controlador (6.47). Nótese que la frecuencia de cruce de ganancia
es aproximadamente ω = 4.8[rad/s] y que el margen de fase es de aproxima-
damente 22 grados, lo cual comprueba que se satisfacen las especificaciones
de diseño. En la figura 6.53 se muestra la respuesta al escalón del sistema en
lazo cerrado de la figura 6.48 usando (6.47) y los valores numéricos en (6.43).
Nótese que la respuesta es poco amortiguada debido al pequeño margen de
fase. Sin embargo, este tipo de respuesta es satisfactoria en la práctica para
un sistema ball and beam.
Finalmente, es conveniente aclarar los siguiente. La frecuencia de cruce
de ganancia (4.8[rad/s] en este ejemplo) determina la rapidez de respuesta
del sistema en lazo cerrado. Sin embargo, (exceptuando las aproximaciones
de segundo orden) no existe una regla exacta que permita calcular el valor
de la frecuencia de cruce de ganancia en función de la rapidez deseada. Lo
que se sabe es que aumentando esta frecuencia se obtienen respuestas más
rápidas. Por otro lado, elegir una frecuencia de cruce de ganancia grande
también incrementa el efecto del ruido. Ası́ que es recomendable proponer una
frecuencia de cruce de ganancia, hacer el diseño con ella y al final verificar si la
rapidez en lazo cerrado es la deseada y si el efecto del ruido no es prohibitivo. Si
la respuesta fuera muy lenta y el efecto del ruido no es importante, entonces
propóngase una frecuencia de cruce de ganancia mayor y repita el proceso
hasta obtener la rapidez y el desempeño que se deseen.
En este ejemplo se ha decidido no intentar mejorar la rapidez de los resul-
tados obtenidos en la figura 6.53. Por un lado, puede observarse en esta figura
que el sistema alcanza el reposo en casi 3[s] lo cual es un tiempo muy bueno
para un sistema ball and beam en la práctica. Por otro lado, de acuerdo a la
figura 6.50, si se elige una frecuencia de cruce de ganancia mayor entonces se
necesitará incrementar el adelanto de fase que debe introducir el compensador
6.8 Ejemplos 355

Bode Diagram

20

0
System: ghctrl
Frequency (rad/sec): 4.68
−20 Magnitude (dB): 0.00958
Magnitude (dB)

−40

−60

−80

−100
−135

−180 System: ghctrl


Frequency (rad/sec): 4.68
Phase (deg): −158
Phase (deg)

−225

−270

−315

−360
0 1 2
10 10 10
Frequency (rad/sec)

Figura 6.52. Gráficas de Bode del sistema ball and beam compensado.

Gc (s) (o equivalentemente Gd (s)). Esto implica elegir un valor de ξ menor que


el utilizado, es decir 0.14, que dicho sea de paso ya es un valor pequeño. El
problema de usar valores pequeños de ξ es que se incrementa el efecto del
ruido en el sistema de control lo cual, como se explica en el capı́tulo 12, es
una limitante en la práctica. De hecho, el haber elegido ω = 4.8[rad/s] como
frecuencia de cruce de ganancia responde a la necesidad de poder conseguir
un margen de fase satisfactorio (20 grados) sin usar un valor de ξ demasiado
pequeño.

6.8.3. Control PD de posición de un motor de CD


Considere el modelo de un motor de CD presentado en (5.12), capı́tulo 5,
el cual se reescribe a continuación:
k
θ(s) = I ∗ (s) (6.48)
s(s + a)
b nkm
a = > 0, k = >0
J J
donde θ(s) e I ∗ (s) representan la posición (salida) y la consigna de corriente
(entrada), respectivamente. Las gráficas de Bode correspondientes a la función
356 6 Diseño usando la respuesta en frecuencia

Step Response
2

1.8

1.6

1.4

1.2
Amplitude

0.8

0.6

0.4

0.2

0
0 0.5 1 1.5 2 2.5 3
Time (sec)

Figura 6.53. Respuesta del sistema en la figura 6.48 ante una referencia xd = 1[m].
La señal graficada es x(t).

de transferencia:
k
G(s) = (6.49)
s(s + a)
se muestran en la figura 6.54. Usando este resultado se obtiene la gráfica polar
mostrada en la figura 6.55, la cual corresponde al recorrido de la trayectoria
de Nyquist modificada mostrada en la figura 6.56. Es conveniente aclarar que
G(s) tiene un polo sencillo en s = 0 y eso da origen al semicı́rculo de radio
infinito que aparece en la figura 6.55. Esto se consigue de manera similar a
como se procedió en la sección 6.8.2. Es decir, se hace el cambio de variable
s = ε∠φ para reescribir (6.49) como:
k k k
G(s) = = = ∠−φ
ε∠φ(ε∠φ + a) ε∠φ(a) εa
Recordando que ε → 0 y que φ pasa de −90◦ a +90◦ conforme se hace el
rodeo alrededor de s = 0, mostrado en la figura 6.56, entonces se obtiene el
semicı́rculo de radio infinito que aparece en la figura 6.55. Debido a que la fase
de G(jω) tiende asintóticamente a −180◦ conforme ω → +∞, es claro que
la gráfica polar mostrada en la figura 6.55 nunca rodeará al punto (−1, j0)
para cualquier valor positivo de k y a. Es decir N = 0. Como G(s) no tiene
polos en el semiplano derecho, entonces P = 0. Por esta razón, si se cierra el
lazo alrededor de G(s) agregando una ganancia kp positiva para obtener un
6.8 Ejemplos 357

sistema de control de posición proporcional, entonces el sistema de control en


lazo cerrado será estable para cualquier kp positiva porque Z = N + P = 0.
Sin embargo, para valores mayores de kp , la gráfica polar de la figura 6.55 se
aproxima más y más al punto (−1, j0) por lo que el margen de fase disminuye
(nótese que el margen de ganancia es infinito ya que el eje real negativo es
tocado sólo en el origen). Como consecuencia, la respuesta es más rápida pero
cada vez oscila más (lo cual coincide con lo concluido en la sección 5.2.1). Con
el fin de conseguir una respuesta en el tiempo que sea rápida (usando valores
de kp mayores) pero suficientemente amortiguadas, a continuación se realiza
el diseño de un controlador proporcional-derivativo (PD).

dB
i)
a !
0
1 ii)
iii)
iv)

fase
[grados] a !
0
iii)
à 90 ii)
à 180 iv)

Figura 6.54. Gráficas de Bode de G(s) presentada en (6.49). i) ka , ii) 1s , iii) s+a
a
,
k
iv) s(s+a) .

Considere el modelo de un motor de CD, presentado en (6.48), junto con


el siguiente controlador proporcional-derivativo:
de
i∗ = kp e + kd
, e = θd − θ
dt
Aplicando la transformada de Laplace se obtiene:
I ∗ (s) = (kp + kd s)E(s), E(s) = θd (s) − θ(s)
El diagrama de bloques del sistema de control en lazo cerrado es se muestra
en la figura 6.57. La función de transferencia de lazo abierto es:
µ ¶
kp k
G(s)H(s) = kd s + (6.50)
kd s(s + a)
En particular, el controlador se puede reescribr, sucesivamente, del siguiente
modo:
358 6 Diseño usando la respuesta en frecuencia

Im (G (j!)) ! = 0à

!! à1
!! +1 Re (G (j!))

! = 0+

Figura 6.55. Gráfica polar de G(s) presentada en (6.49).

Im (s)
j!

! = 0+
þ = + 90 ä
s=" þ
"

Re (s)
r!1
! = 0à
þ = à 90

à j!

Figura 6.56. Trayectoria de Nyquist modificada para la función de transferencia


en (6.49).
6.8 Ejemplos 359

òd(s) + ð ñ Iã(s) ò(s)


kp k
kd s + k d s(s+a)
à

Figura 6.57. Sistema de control proporcional-derivativo de posición.

I ∗ (s) kp
= kd (s + b), b = (6.51)
E(s) kd
µ ¶
s+b 1
= kd b = kd b s+1
b b

Definiendo el cambio de variable z = 1b s se tiene:

I ∗ (s)
= kd b(z + 1)
E(s)

En la figura 6.58 se muestran las gráficas de Bode del factor z + 1. Nótese que
el eje horizontal de estas gráficas de Bode corresponde a 1b ω (véase la sección
6.4.1). Por tanto, la función de transferencia de lazo abierto, dada en (6.50),
ahora se escribe como:
k
G(s)H(s) = kd b(z + 1) (6.52)
s(s + a)

Considere el caso del motor de CD estudiado experimentalmente en el capı́tulo


10. Los valores numéricos de este motor son:

k = 675.4471, a = 2.8681
k
Usando estos datos se obtienen las gráficas de Bode del factor s(s+a) , las cuales
se muestran en la figura 6.59. En estas gráficas se observa que la frecuencia
de cruce de ganancia es ω1 = 25.9[rad/s] y que la fase a esa frecuencia es de
−174◦ , que corresponde a un margen de fase de +6◦ . Como este margen de
fase es muy pequeño, la respuesta en el tiempo es muy oscilatoria cuando se
usa un controlador proporcional con kp = 1, lo cual se muestra en la figura
6.60. Nótese que el tiempo de subida es tr = 0.0628[s] y el sobre paso es
Mp = 83 %. A continuación se diseña un controlador proporcional-derivativo
(PD) de modo que la respuesta en el tiempo, en lazo cerrado, mantenga el
mismo tiempo de subida tr = 0.0628[s] pero que el sobre paso sea Mp = 20 %.
Con el fin de mantener la misma rapidez de respuesta se propone mantener
la misma frecuencia de cruce de ganancia, es decir, se usará:

ω1 = 25.9[rad/s] (6.53)
360 6 Diseño usando la respuesta en frecuencia

Bode Diagram

25

20
Magnitude (dB)

15

10

System: gc
Frequency (rad/sec): 0.882
5
Magnitude (dB): 2.5

0
90
Phase (deg)

45

System: gc
Frequency (rad/sec): 0.882
Phase (deg): 41.4

0
−1 0 1
10 10 10
Frequency (rad/sec)

Figura 6.58. Gráfica de Bode del factor z + 1, donde z = 1b s.

Por otro lado, usando el sobre paso deseado Mp = 20 % y:


v ³ ´
u
u ln2 M p( %)
u 100
ζ=t ³ ´
2 M p( %)
ln 100 + π2

se obtiene ζ = 0.4559. Usando interpolación lineal en la tabla 6.3 se encuentra


que este amortiguamiento corresponde a un margen de fase de:
Kf = +47.5◦ (6.54)
Como el margen de fase del motor sin compensar es de +6◦ , entonces se
necesita que el controlador introduzca un adelanto de fase de +47.5◦ − 6◦ =
41.5◦ . En la figura 6.58 se observa que esto sucede cuando 1b ω = 0.882. Por
tanto, el parámetro b se obtiene forzando que esto suceda cuando ω = ω1 =
25.9[rad/s], es decir:
ω ¯¯
b= ¯ = 29.3984
0.882 ω=25.9
Por otro lado, como se desea que el sistema compensado tenga la misma
frecuencia de cruce de ganancia que el sistema sin compensar, ω = ω1 =
6.8 Ejemplos 361

Bode Diagram

20

15

10 System: gh
Frequency (rad/sec): 25.9
5
Magnitude (dB): 0.00458
Magnitude (dB)

−5

−10

−15

−20

−25

−30
−160

−165
Phase (deg)

−170

−175 System: gh
Frequency (rad/sec): 25.9
Phase (deg): −174

−180
1 2
10 10
Frequency (rad/sec)

k
Figura 6.59. Gráfica de Bode del factor s(s+a)
, donde k = 675.4471 y a = 2.8681.

25.9[rad/s], es necesario que el controlador completo introduzca una magnitud


de 0[dB] cuando ω = ω1 . Esto se consigue imponiendo lo siguiente sobre la
magnitud del controlador completo:

|kd b(z + 1)|dB = 20 log(kd b) + |z + 1|dB = 0[dB] (6.55)

donde, de acuerdo a la figura 6.58, se debe usar |z +1|dB = 2.5[dB]. Por tanto,
despejando kd y realizando los cálculos correspondientes se encuentra:
1 −2.5
kd = 10 20 = 0.0255
b
Finalmente, usando (6.51) se obtiene:

kp = bkd = 0.7499

En la figura 6.61 se muestran las gráficas de Bode de la función de transferencia


de lazo abierto del sistema compensado (mostrada en (6.50)). En esta figura
se puede verificar que la frecuencia de cruce de ganancia es ω = 25.9[rad/s] y
que la fase a esa frecuencia es −132◦ , lo cual corresponde a un margen de fase
de +48◦ . Esto significa que se han conseguido las especificaciones de respuesta
362 6 Diseño usando la respuesta en frecuencia

ò 2

[rad] 1.8
System: Mc
Time (sec): 0.119
Amplitude: 1.83
1.6

1.4

1.2 System: Mc
Time (sec): 0.0628
Amplitude: 1
1

0.8

0.6

0.4

0.2

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

tiempo [s]

Figura 6.60. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la


figura 6.57 cuando kp = 1, kd = 0, k = 675.4471 y a = 2.8681.

en frecuencia establecidas en (6.53) y (6.54). Por otro lado, en la figura 6.62


se muestra la respuesta en el tiempo, del sistema en lazo cerrado correspon-
diente, cuando el valor deseado de posición es un escalón unitario. Se puede
observar que el tiempo de subida es de 0.0612[s] y que el sobre paso es del
30 %. Aunque estos valores no son exactamente iguales a los especificados al
principio (tr = 0.0628[s] y Mp = 20 %), sin embargo son relativamente cerca-
nos. Esta diferencia se atribuye al hecho de que el cero que posee la función
de transferencia de lazo cerrado, y que es introducido por el controlador PD,
modifica un tanto la forma de la respuesta transitoria de una manera que no
se ha cuantificado de manera exacta. Si se desea cumplir exactamente con las
especificaciones de respuesta en el tiempo que se han indicado al principio,
se puede proceder a hacer un rediseño. Es decir, proponga un margen de fase
un poco mayor para reducir el sobre paso. Si al conseguir el sobre paso de-
seado el sistema sigue siendo más rápido que lo deseado, entonces proponga
una frecuencia de cruce de ganancia un poco menor para obtener un tiempo
de subida un poco más grande. Sin embargo, en lugar de hacer esto, en la
siguiente sección se buscará cumplir con otra especificación para el tiempo de
subida.
6.8 Ejemplos 363

Bode Diagram

60

50

Magnitude (dB) 40

30

20
System: ghcomp
10 Frequency (rad/sec): 25.9
Magnitude (dB): 0.0325
0

−10

−20
−90
Phase (deg)

−120

System: ghcomp
Frequency (rad/sec): 25.8
Phase (deg): −132
−150
0 1 2
10 10 10
Frequency (rad/sec)

Figura 6.61. Gráficas de Bode de la función de transferencia en (6.50), cuando


kd = 0.0255, kp = 0.7499, k = 675.4471 y a = 2.8681.

6.8.4. Rediseño del control PD de posición de un motor de CD

Considere de nuevo el control PD de posición de un motor de CD. Es


decir, el diagrama de bloques del sistema de control en lazo cerrado es el que
se muestra en la figura 6.57 y la función de transferencia de lazo abierto es
la que se muestra en (6.50), expresión que se reescribe a continuación para
facilitar la referencia:
k kp
G(s)H(s) = kd (s + b) , b= (6.56)
s(s + a) kd

En la sección 6.8.3 se mostró que cuando los valores numéricos del motor son:

k = 675.4471, a = 2.8681
k
y se usa sólo el factor s(s+a) entonces la frecuencia de cruce de ganancia es
ω1 = 25.9[rad/s]. Además, en lazo cerrado se obtiene un tiempo de subida de
tr = 0.0628[s] y un sobre paso de Mp = 83 % cuando se usa un controlador
proporcional de ganancia kp = 1. A continuación se diseñará un controlador
364 6 Diseño usando la respuesta en frecuencia

ò 1.4

[rad] System: Mc
1.2 Time (sec): 0.116
Amplitude: 1.3

1
System: Mc
Time (sec): 0.0612
Amplitude: 1

0.8

0.6

0.4

0.2

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

tiempo [s]

Figura 6.62. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la


figura 6.57, cuando kd = 0.0255, kp = 0.7499, k = 675.4471 y a = 2.8681.

proporcional-derivativo para conseguir la mitad del tiempo de subida y un


sobre paso del 20 %, es decir ahora se desea:
0.0628
tr = = 0.0314[s], Mp = 20 % (6.57)
2
Como ya se ha mencionado, para reducir el tiempo de subida (aumentar la
rapidez de respuesta en el tiempo), se debe aumentar la frecuencia de cruce
de ganancia ω1 . Sin embargo, no se ha definido una expresión matemática
que relacione al tiempo de subida con la frecuencia de cruce de ganancia. A
continuación se explicará como puede seleccionar ω1 a fin de obtener un valor
especificado de tr .
Primero, considere el sistema en lazo cerrado de la figura 6.63. La función
de transferencia de lazo abierto es:
kp k
G(s) = (6.58)
s(s + a)
mientras que la función de transferencia de lazo cerrado es:
θ(s) G(s) ωn2
= = 2 , ωn2 = kp k, 2ζωn = a (6.59)
θd (s) 1 + G(s) s + 2ζωn s + ωn2
6.8 Ejemplos 365

òd ( s) + I ã(s) k
ò(s)
kp s ( s+a)

Figura 6.63. Control proporcional de posición.

Las gráficas de Bode de (6.58) tienen la forma presentada en la figura 6.64,


mientras que las gráficas de Bode de (6.59) tienen la forma presentada en la
figura 6.14(b). De acuerdo a esta última figura, la función de transferencia
en (6.59) tiene magnitud unitaria cuando ω → 0. Esto puede entenderse a
G(s)
partir de la expresión 1+G(s) y la figura 6.64, observando que |G(jω)| → +∞
cuando
¯ ω¯ → 0. Esto significa que la función de transferencia de lazo cerrado
¯ G(jω) ¯
¯ 1+G(jω) ¯ → 1 cuando ω → 0.

dB
i)
a !
0
1 ii)
iii)
iv)

fase
[grados] a !
0
iii)
à 90 ii)
à 180 iv)
kp k
Figura 6.64. Gráficas de Bode de G(s) presentada en (6.58). i) a
, ii) 1s , iii) s+a
a
,
kp k
iv) s(s+a) .

Por otro lado, de acuerdo a la figura 6.14(b), la función de transferencia en


(6.59) tiene magnitud que tiende a cero cuando ω → +∞. De nuevo, esto pue-
G(s)
de entenderse a partir de la expresión 1+G(s) y la figura 6.64, observando que
|G(jω)| → 0 cuando
¯ ω →¯ +∞. Esto significa que la función de transferencia
¯ G(jω) ¯
de lazo cerrado ¯ 1+G(jω) ¯ → 0 cuando ω → +∞.
De acuerdo a estas ideas, la frecuencia de esquina que la función de trans-
ferencia en (6.59) presenta en ω = ωn (véase la figura 6.14(b)) debe ocurrir
366 6 Diseño usando la respuesta en frecuencia

aproximadamente cuando se alcanza la frecuencia¯ de cruce


¯ de ganancia en la
¯ G(jω) ¯
figura 6.64 (cuando |G(jω)| ≈ 1 y, por tanto, ¯ 1+G(jω) ¯ empieza a decrecer de
manera importante). Esta observación permite concluir que ωn en la figura
6.14(b) crece si ω1 , medida en la figura 6.64, también crece.
Por otro lado, de acuerdo a:
" Ãp !#
1 1 − ζ2 p
tr = p π − arctan , ωd = ω n 1 − ζ 2 ,
ωn 1 − ζ 2 ζ

si se desea reducir el tiempo de subida a la mitad (despreciando el efecto


debido a la variación del amortiguamiento ζ) entonces debe aumentarse ωn al
doble. Esto significa, de acuerdo a la discusión anterior, que la frecuencia de
cruce de ganancia ω1 debe aumentarse al doble.
Entonces, si tr = 0.0628[s] cuando ω1 = 25.9[rad/s], debe usarse:

ω1 = 51.8[rad/s] (6.60)

para conseguir el tiempo de subida tr = 0.0314[s]. Por otro lado, en la sección


6.8.3 se encontró que para obtener un sobre paso del 20 % se debe buscar un
margen de fase de:

Kf = +47.5◦ (6.61)
k
En la figura 6.65 se muestran las gráficas de Bode de s(s+a) cuando k =
675.4471 y a = 2.8681. Se observa que la magnitud y la fase valen −12[dB]
y −177◦ cuando ω = 51.8[rad/s]. Esto corresponde a un margen de fase de
+3◦ . Como el margen de fase deseado es de +47.5◦ entonces se necesita que
el controlador introduzca una fase positiva de 47.5◦ − 3◦ = 44.5◦ cuando ω =
51.8[rad/s]. Recuérdese que, de acuerdo a (6.52), la función de transferencia
de lazo abierto del sistema compensado está dada como:
k
G(s)H(s) = kd b(z + 1)
s(s + a)
k
donde kd b(z + 1) = kd s + kp , con b = kpd y z = 1b s, es el controlador PD. En la
figura 6.66 se muestran las gráficas de Bode del factor z + 1. Recuérdese que
en éstas gráficas el eje horizontal corresponde a 1b ω (véase la sección 6.4.1). El
adelanto de fase requerido de +44.5◦ ocurre cuando 1b ω = 0.982. Como este
adelanto de fase debe ocurrir cuando la frecuencia sea igual a la frecuencia de
cruce de ganancia deseada ω = 51.8[rad/s] entonces:
ω ¯¯
b= ¯ = 52.8033
0.982 ω=51.8
Por otro lado, se desea que la frecuencia de cruce de ganancia sea ω =
51.8[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia,
6.8 Ejemplos 367

Bode Diagram

60

50

40

30
Magnitude (dB)

20

10
System: gh
0 Frequency (rad/sec): 51.8
Magnitude (dB): −12
−10

−20

−30

−40
−90

−120
Phase (deg)

−150
System: gh
Frequency (rad/sec): 51.7
Phase (deg): −177

−180
0 1 2
10 10 10
Frequency (rad/sec)

k
Figura 6.65. Gráficas de Bode de s(s+a)
cuando k = 675.4471 y a = 2.8681.

la misma magnitud, pero de signo contrario, que la magnitud introducida


k
(−12[dB]) por el factor s(s+a) en esta frecuencia (para que la magnitud del
sistema compensado sea de 0[dB] a la nueva frecuencia de cruce de ganancia).
Esto implica que se debe exigir lo siguiente:

|kd b(z + 1)|dB = 20 log(kd b) + |z + 1|dB = 12[dB] (6.62)

donde, de acuerdo a la figura 6.66, se debe usar |z + 1|dB = 2.95[dB]. Por


tanto, despejando kd y realizando los cálculos correspondientes se encuentra:
1 12−2.95
kd = 10 20 = 0.0537
b
kp
Finalmente, usando b = kd se obtiene:

kp = bkd = 2.8347

En la figura 6.67 se muestran las gráficas de Bode de la función de transferencia


de lazo abierto del sistema compensado (mostrada en (6.56)). En esta figura
se puede verificar que la frecuencia de cruce de ganancia es ω = 51.8[rad/s]
368 6 Diseño usando la respuesta en frecuencia

Bode Diagram

25

20
Magnitude (dB)

15

10

System: gc
Frequency (rad/sec): 0.983
5 Magnitude (dB): 2.95

0
90
Phase (deg)

45
System: gc
Frequency (rad/sec): 0.982
Phase (deg): 44.5

0
−1 0 1
10 10 10
Frequency (rad/sec)

Figura 6.66. Gráficas de Bode del factor z + 1.

y que la fase a esa frecuencia es −132◦ , lo cual corresponde a un margen


de fase de +48◦ . Esto significa que se han conseguido las especificaciones de
respuesta en frecuencia establecidas en (6.60) y (6.61). Por otro lado, en la
figura 6.68 se muestra la respuesta en el tiempo, del sistema en lazo cerrado
correspondiente, cuando el valor deseado de posición es un escalón unitario.
Se puede observar que el tiempo de subida es de 0.03[s] y que el sobre paso es
del 31 %. Aunque estos valores no son exactamente iguales a los especificados
al principio (tr = 0.0314[s] y Mp = 20 %), sin embargo son relativamente
cercanos. La razón de esta diferencia y la manera de corregirla ya ha sido
explicada en la sección 6.8.3 por lo que se sugiere consultar dicha parte de la
presente obra.

6.8.5. Control PID de posición de un motor de CD

Considere el modelo de un motor de CD presentado en (5.12), capı́tulo 5,


el cual se reescribe a continuación para facilitar la referencia:
k
θ(s) = I ∗ (s) (6.63)
s(s + a)
6.8 Ejemplos 369

Bode Diagram

30

25

Magnitude (dB) 20

15

10
System: ghcomp
5 Frequency (rad/sec): 51.9
Magnitude (dB): −0.0529
0

−5

−10
−90

−120
Phase (deg)

System: ghcomp
Frequency (rad/sec): 51.8
−150 Phase (deg): −132

−180
1 2
10 10
Frequency (rad/sec)

Figura 6.67. Gráficas de Bode de la función de transferencia en (6.56), cuando


kd = 0.0537, kp = 2.8347, k = 675.4471 y a = 2.8681.

b nkm
a= > 0, k= >0
J J
donde θ(s) e I ∗ (s) representan la posición (salida) y la consigna de corriente
(entrada), respectivamente. En esta parte se diseñará el siguiente controlador
PID de posición:
Z t
de
i∗ = kp e + kd + ki e(r)dr, e = θd − θ
dt 0

donde θd es la posición deseada y las constantes kp , kd y ki se conocen como


las ganancias proporcional, derivativa e integral, respectivamente. Usando la
transformada de Laplace se obtiene:
E(s)
I ∗ (s) = kp E(s) + kd sE(s) + ki
µ ¶ s
ki
= kp + kd s + E(s)
s
kp ki
s2 + kd s + kd
= kd E(s)
s
370 6 Diseño usando la respuesta en frecuencia

System: Mc

ò 1.4 Time (sec): 0.0579


Amplitude: 1.31

[rad]
1.2
System: Mc
Time (sec): 0.03
Amplitude: 1
1

0.8

0.6

0.4

0.2

0
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

tiempo [s]

Figura 6.68. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la


figura 6.57, cuando kd = 0.0537, kp = 2.8347, k = 675.4471 y a = 2.8681.

Entonces, el sistema en lazo cerrado se representa por el diagrama de bloques


mostrado en la figura 6.69. La función de transferencia de lazo abierto es:

ò d(s) + kp k
s 2+k s+k i
ò(s)
d d
k
kd s s(s+a)

Figura 6.69. Sistema en lazo cerrado del control PID de posición de un motor de
CD.

kp ki
s2 + kd s + kd k
G(s)H(s) = kd (6.64)
s s(s + a)
Definiendo:
kp ki
s2 + s+ = (s + z1 )(s + z2 ) = s2 + (z1 + z2 )s + z1 z2
kd kd
6.8 Ejemplos 371

se concluye que:
kp ki
= z1 + z2 , = z1 z2 (6.65)
kd kd
En la figura 6.70 se muestra un bosquejo de la gráfica polar de (6.64) cuando
se recorre la trayectoria de Nyquist modificada mostrada en la figura 6.56.
Nótese que existen dos polos en s = 0 y se debe proceder de nuevo como en
la sección 6.8.3 para rodear el origen en el plano s. Esta es la razón para el
cı́rculo de radio infinito en la figura 6.70. Además, no es difı́cil darse cuenta
k
que, para 0 < ω < +∞, la gráfica polar del factor s2 (s+a) es como la mostrada

en la figura 6.55, pero girada 90 en sentido horario (en sentido antihorario
para −∞ < ω < 0). Por tanto, el adelanto de fase debido al factor de segundo
k
orden s2 + kdp s + kkdi debe modificar la gráfica polar como en la figura 6.70.
De este modo se obtiene estabilidad en lazo cerrado pues P = 0, N = 0 y
Z = N + P = 0. Para alcanzar este objetivo se propone usar el siguiente
criterio de diseño:

Im (G (j!) H (j!) )

à
+ 180 î ! = 0 ! ! +1
î
à 180 ! = 0 + à1 ! ! à1 Re (G (j!) H (j!) )
r!1

Figura 6.70. Gráfica polar de (6.64) cuando se recorre la trayectoria de Nyquist


modificada mostrada en la figura 6.56.

z1 = a (6.66)

porque esto simplifica a la función de transferencia de lazo abierto, presentada


en (6.64), del siguiente modo:
k
G(s)H(s) = kd (s + z2 ) (6.67)
s2
372 6 Diseño usando la respuesta en frecuencia

Se debe subrayar que la cancelación de los factores s + z1 y s + a es válida


porque ambos corresponden a polos y ceros con parte real negativa pues a > 0
y z1 > 0. Realizando algunos pasos algebraicos adicionales en (6.67) se obtiene:
µ ¶
s + z2 k 1 k k
G(s)H(s) = kd z2 = kd z2 s + 1 2 = kd z2 (z + 1) 2 (6.68)
z2 s2 z2 s s

donde se ha definido z = z12 s. Ahora el factor sk2 representa el sistema sin


compensar y sus gráficas de Bode se presentan en la figura 6.71 cuando se
usan los valores numéricos del motor de CD controlado experimentalmente en
el capı́tulo 10, es decir:

k = 675.4471

Bode Diagram

60

50

40

30
Magnitude (dB)

20

10
System: gh
0 Frequency (rad/sec): 51.9
Magnitude (dB): −12
−10

−20

−30

−40
−179

−179.5
Phase (deg)

−180
System: gh
Frequency (rad/sec): 51.7
Phase (deg): −180
−180.5

−181
0 1 2
10 10 10
Frequency (rad/sec)

k
Figura 6.71. Gráficas de Bode del factor s2
cuando k = 675.4471.

Se puede observar que la magnitud y la fase son iguales a −12[dB] y −180◦


cuando la frecuencia es igual a 51.8[rad/s]. De acuerdo a la sección 6.8.4, se
propone usar la siguiente frecuencia de cruce de ganancia:

ω1 = 51.8[rad/s] (6.69)
6.8 Ejemplos 373

y el siguiente margen de fase:


Kf = +47.5◦ (6.70)
para conseguir el tiempo de subida tr = 0.0314[s] y un sobre paso de 20 %.
Por tanto, el controlador definido por kd z2 (z + 1) debe introducir un adelanto
de fase de +47.5◦ y una magnitud de +12[dB] cuando la frecuencia sea igual
a 51.8[rad/s]. En la figura 6.72 se observa que el factor z + 1 introduce una
fase de +47.4◦ cuando z12 ω = 1.09 (véase la sección 6.4.1). Como esto debe
ocurrir cuando ω = 51.8[rad/s], entonces:
ω ¯¯
z2 = ¯ = 47.5229
1.09 ω=51.8
Por otro lado, se desea que la frecuencia de cruce de ganancia sea ω =

Bode Diagram

25

20
Magnitude (dB)

15

10
System: gc
Frequency (rad/sec): 1.09
5 Magnitude (dB): 3.4

0
90
Phase (deg)

45
System: gc
Frequency (rad/sec): 1.09
Phase (deg): 47.4

0
−1 0 1
10 10 10
Frequency (rad/sec)

Figura 6.72. Gráficas de Bode del factor z + 1.

51.8[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia,


la misma magnitud, pero de signo contrario, que la magnitud introducida
(−12[dB]) por el factor sk2 en esta frecuencia (para que la magnitud del sistema
compensado sea de 0[dB] a la nueva frecuencia de cruce de ganancia). Esto
implica que se debe exigir lo siguiente:
374 6 Diseño usando la respuesta en frecuencia

|kd z2 (z + 1)|dB = 20 log(kd z2 ) + |z + 1|dB = 12[dB] (6.71)

donde, de acuerdo a la figura 6.72, se debe usar |z +1|dB = 3.4[dB]. Por tanto,
despejando kd y realizando los cálculos correspondientes se encuentra:
1 12−3.4
kd = 10 20 = 0.0566
z2

Finalmente, usando (6.65), (6.66) y a = 2.8681 (véase el capı́tulo 10) se ob-


tiene:

kp = kd (z1 + z2 ) = 2.8540, ki = kd z1 z2 = 7.7196

En la figura 6.73 se muestran las gráficas de Bode de la función de transferencia


de lazo abierto, del sistema compensado, mostrada en (6.64). En esta figura
se puede verificar que la frecuencia de cruce de ganancia es ω = 51.8[rad/s]
y que la fase a esa frecuencia es −133◦ , lo cual corresponde a un margen
de fase de +47◦ . Esto significa que se han conseguido las especificaciones de
respuesta en frecuencia establecidas en (6.69) y (6.70). Por otro lado, en la
figura 6.74 se muestra la respuesta en el tiempo, del sistema en lazo cerrado
correspondiente, cuando el valor deseado de posición es un escalón unitario. Se
puede observar que el tiempo de subida es de 0.0291[s] y que el sobre paso es
del 33 %. Aunque estos valores no son exactamente iguales a los especificados
al principio (tr = 0.0314[s] y Mp = 20 %), sin embargo son relativamente
cercanos. La razón de esta diferencia y la manera de corregirla ya ha sido
explicada en la sección 6.8.3 por lo que se sugiere consultar dicha parte de la
presente obra.
6.8 Ejemplos 375

Bode Diagram

30

25

20

Magnitude (dB)
15

10
System: ghcomp
5 Frequency (rad/sec): 51.8
Magnitude (dB): 0.0218
0

−5

−10
−90

−120
Phase (deg)

System: ghcomp
Frequency (rad/sec): 51.7
−150 Phase (deg): −133

−180
1 2
10 10
Frequency (rad/sec)

Figura 6.73. Gráficas de Bode de la función de transferencia en (6.64), cuando


kd = 0.0566, kp = 2.8540, ki = 7.7196 k = 675.4471 y a = 2.8681.

ò 1.4

[rad] System: Mc
Time (sec): 0.0577
1.2 Amplitude: 1.33

1
System: Mc
Time (sec): 0.0291
Amplitude: 1

0.8

0.6

0.4

0.2

0
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

tiempo [s]

Figura 6.74. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la


figura 6.69, cuando kd = 0.0566, kp = 2.8540, ki = 7.7196 k = 675.4471 y a = 2.8681.
376 6 Diseño usando la respuesta en frecuencia

6.9. Caso de estudio. Control PID de un sistema de


levitación magnética
Considere el modelo de un sistema de levitación magnética presentado
en (11.31), capı́tulo 11, el cual se reescribe a continuación para facilitar la
referencia:
11613700
G(s) =
s3 + 2739s2 − 1250s − 3.536 × 106
El polinomio caracterı́stico de esta función de transferencia se puede factorizar
del siguiente modo s3 + 2739s2 − 1250s − 3.536 × 106 = (s + 35.9)(s − 35.9)(s +
2739). Ası́ que este sistema es inestable en lazo abierto debido a que tiene un
polo con parte real positiva ubicado en s = 35.9. Para resolver este problema
se usará el siguiente controlador PID (véase la sección 6.8.5):
kp ki
s2 + kd s + kd
kd = kd (s + z1 )(s + z2 ) = kd (s2 + (z1 + z2 )s + z1 z2 )
s
kp ki
= z1 + z2 , = z1 z2 (6.72)
kd kd
Entonces la función de transferencia de lazo abierto es:
(s + z1 )(s + z2 ) k
G(s)H(s) = kd (6.73)
s s3 + 2739s2 − 1250s − 3.536 × 106
(s + z1 )(s + z2 ) k
= kd , k = 11613700
s (s + 35.9)(s − 35.9)(s + 2739)
De esta manera, el sistema es de tipo 1 y, ante una referencia constante, el
error en estado estacionario será igual a cero si el sistema en lazo cerrado
es estable. El controlador PID deberá ser diseñado para asegurar que esta
condición se cumple. Para esto se considerará el siguiente criterio de diseño:

z1 = 35.9 (6.74)

De este modo se obtiene:


k
G(s)H(s) = kd (s + z2 )
s(s − 35.9)(s + 2739)
o bién:
k
G(s)H(s) = kd z2 (z + 1) (6.75)
s(s − 35.9)(s + 2739)

donde se ha definido z = z12 s. Se debe subrayar que la cancelación de los


factores s + z1 y s + 35.9 es válida porque ambos corresponden a polos y ceros
con parte real negativa pues 35.9 > 0 y z1 > 0. En la figura 6.75 se muestra
un bosquejo de las gráficas de Bode de la función de transferencia:
6.9 Caso de estudio 377

dB
i)
35:9 2739 !
0 1
iii) iv)
ii)

v)

fase
[grados]

0 35:9 2739 !
iv)
à 90 ii)
iii)
à 180

v)
à 270

k
Figura 6.75. Gráficas de Bode de (6.76). i) (35.9)(2739) , ii) 1s , iii) s−35.9
35.9 2739
, iv) s+2739 ,
k
v) s(s−35.9)(s+2739) .

k
G0 (s) = (6.76)
s(s − 35.9)(s + 2739)

donde se ha hecho uso de los resultados obtenidos en la sección 6.8.1 para


a
obtener las gráficas de Bode de un factor de la forma s−a con a > 0. Usando
la figura 6.75 se procede a dibujar la gráfica polar mostrada en la figura 6.76.
Es importante subrayar que la función de transferencia en (6.76) tiene un
polo en el origen por lo que se debe usar la trayectoria de Nyquist modificada
mostrada en la figura 6.56. De acuerdo a esto, se debe dar un rodeo alrededor
de s = 0 del siguimiente modo. En (6.76) se debe hacer el cambio de variable
s = ε∠φ:
k k
G0 (ε∠φ) = =
ε∠φ(ε∠φ − 35.9)(ε∠φ + 2739) ε∠φ(−35.9)(2739)
k k
= ∠−φ= ∠(−φ − 180o )
ε(−35.9)(2739) ε(35.9)(2739)
378 6 Diseño usando la respuesta en frecuencia

recordando que ε → 0. Esto justifica el semicı́rculo de radio infinito que

Im ( G 0 (j!))

! = 0+ à 270 o

à1 !! +1

!! à1 Re ( G 0 (j!))

r!1
à 90 o
! = 0à

Figura 6.76. Gráfica polar de (6.76) cuando se recorre la trayectoria de Nyquist


modificada mostrada en la figura 6.56.

pasa de −90◦ cuando ω = 0− a −270◦ cuando ω = 0+ (véase la figura 6.56).


En la figura 6.76 es claro que N = 1 y como P = 1 (véase (6.76) entonces
Z = N +P = 2, por lo que habrı́a inestabilidad en lazo cerrado. Por esta razón,
para conseguir estabilidad en lazo cerrado usando la función de transferencia
de lazo abierto (6.75) (con un controlador PID), el factor kd z2 (z + 1) debe
introducir un adelanto de fase suficiente como para que se obtenga una gráfica
polar como se muestra en la figura 6.77. De este modo N = −1 y como P = 1
entonces Z = N + P = 0 y el sistema en lazo cerrado será estable. En la
figura 6.78 se muestran las gráficas de bode de (6.76). Se puede observar que
la magnitud y la fase son iguales a 0[dB] y −212◦ cuando la frecuencia es igual
a 60[rad/s]. Se propone mantener la misma frecuencia de cruce de ganancia:

ω1 = 60[rad/s] (6.77)

y conseguir el siguiente margen de fase3 :

Kf = +20◦ (6.78)
3
Aunque el margen de fase fue presentado en la sección 6.6 para sistemas de fase
mı́nima, este concepto es aplicable de manera directa en este ejemplo
6.9 Caso de estudio 379

Im(G(j!)H(j!))
! = 0+ à 270 o

à1 !! à1

!! +1
Re(G(j!)H(j!))

r!1
! = 0 à à 90 o

Figura 6.77. Gráfica polar de (6.75) cuando se recorre la trayectoria de Nyquist


modificada mostrada en la figura 6.56.

Bode Diagram

50

0
System: gh
Frequency (rad/sec): 60
Magnitude (dB)

Magnitude (dB): 0.0673


−50

−100

−150

−200
−180
Phase (deg)

System: gh
−225 Frequency (rad/sec): 60.1
Phase (deg): −212

−270
0 1 2 3 4 5
10 10 10 10 10 10
Frequency (rad/sec)

Figura 6.78. Gráficas de Bode de (6.76).

Ya que la planta a controlar es naturalmente inestable, la idea es simplemente


asegurar estabilidad en lazo cerrado sin preocuparse por ninguna otra espe-
cificación como podrı́an ser el tiempo de subida y el sobrepaso. Por tanto,
380 6 Diseño usando la respuesta en frecuencia

el controlador definido por kd z2 (z + 1) debe introducir un adelanto de fase


de +52◦ y una magnitud de 0[dB] cuando la frecuencia sea igual a 60[rad/s].
En la figura 6.79 se observa que el factor z + 1 introduce una fase de +52◦
cuando z12 ω = 1.28 (véase la sección 6.4.1). Como esto debe ocurrir cuando
ω = 60[rad/s], entonces:
ω ¯¯
z2 = ¯ = 46.875
1.28 ω=60
Por otro lado, se desea que la frecuencia de cruce de ganancia sea ω =

Bode Diagram

40

35

30
Magnitude (dB)

25

20

15
System: Adel
10 Frequency (rad/sec): 1.28
Magnitude (dB): 4.24
5

0
90
Phase (deg)

45 System: Adel
Frequency (rad/sec): 1.28
Phase (deg): 52

0
−2 −1 0 1 2
10 10 10 10 10
Frequency (rad/sec)

Figura 6.79. Gráficas de Bode del factor z + 1.

60[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia, una


magnitud de 0[dB] para que la magnitud del sistema compensado sea de 0[dB]
a la frecuencia de cruce de ganancia. Esto implica que se debe exigir lo siguien-
te:

|kd z2 (z + 1)|dB = 20 log(kd z2 ) + |z + 1|dB = 0[dB] (6.79)

donde, de acuerdo a la figura 6.79, se debe usar |z + 1|dB = 4.24[dB]. Por


tanto, despejando kd y realizando los cálculos correspondientes se encuentra:
1 −4.24
kd = 10 20 = 0.0131
z2
Finalmente, usando (6.72) y (6.74) se obtiene:
6.9 Caso de estudio 381

kp = kd (z1 + z2 ) = 1.0838, ki = kd z1 z2 = 22.0341

En la figura 6.80 se muestran las gráficas de Bode de la función de transferencia


¡de lazo abierto ¢del sistema compensado (dada en (6.73), es decir, G(s)H(s) =
kp + kd s + ksi × s3 +2739s2 −1250s−3.536×10
k
6 ). En esta figura se puede verificar

que la frecuencia de cruce de ganancia es ω = 60[rad/s] y que la fase a esa


frecuencia es −160◦ , lo cual corresponde a un margen de fase de +20◦ . Esto
significa que se han conseguido las especificaciones de respuesta en frecuencia
establecidas en (6.77) y (6.78). Finalmente, en la figura 6.81 se muestra la
respuesta en el tiempo, ante¡ un escalón¢ unitario, cuando se cierra el lazo
alrededor de G(s)H(s) = kp + kd s + ksi s3 +2739s2 −1250s−3.536×10
k
6 . Se puede

observar que el tiempo de subida es de 0.0166[s] y que el sobre paso es del 89 %.


Como se dijo anteriormente, no se ha procurado hacer nada por conseguir
un tiempo de subida y un sobre paso especı́ficos y sólo se busca asegurar
la estabilidad en lazo cerrado. Por esta razón, la respuesta en el tiempo de
la figura 6.81 se considera satisfactoria. Se deja como ejercicio al lector el
conseguir un diseño con el cual se consiga una respuesta más amortiguada.
Para esto, debe especificar un margen de fase mayor.

Bode Diagram

50

System: gh
Frequency (rad/sec): 60
Magnitude (dB): 0.0784
0
Magnitude (dB)

−50

−100
−90

−135
Phase (deg)

System: gh
−180
Frequency (rad/sec): 60
Phase (deg): −160

−225

−270
0 1 2 3 4 5
10 10 10 10 10 10
Frequency (rad/sec)

Figura 6.80. Gráficas


³ de Bode´ de la función de transferencia en (6.73), es de-
cir, G(s)H(s) = kp + kd s + ksi s3 +2739s2 −1250s−3.536×10
k
6 con kd = 0.0131, kp =

1.0838, ki = 22.0341.
382 6 Diseño usando la respuesta en frecuencia

Step Response

1.8 System: M
Time (sec): 0.0449
Amplitude: 1.89

1.6

1.4

1.2 System: M
Amplitude

Time (sec): 0.0166


Amplitude: 1
1

0.8

0.6

0.4

0.2

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
Time (sec)

Figura 6.81. Respuesta en el tiempo,


³ ante un´escalón unitario, cuando se cierra el
lazo alrededor de G(s)H(s) = kp + kd s + ksi s3 +2739s2 −1250s−3.536×10
k
6 con kd =

0.0131, kp = 1.0838, ki = 22.0341.

6.10. Resumen del capı́tulo

Un resultado fundamental del estudio de las ecuaciones diferenciales li-


neales es el siguiente. Dada una ecuación diferencial lineal totalmente arbi-
traria, si se aplica a la entrada una función sinusoidal del tiempo entonces la
respuesta forzada a la salida es otra función sinusoidal del tiempo. Estas fun-
ciones sinusoidales difieren en sus amplitudes y sus fases pero son de la misma
frecuencia. Las relaciones entre las amplitudes y las fases de estas funciones
dependen de su frecuencia y la forma en que varı́an se conoce como respuesta
en frecuencia.
La propiedad fundamental de la respuesta en frecuencia que la teorı́a de
control explota es el hecho de que la manera en que varı́an las relaciones entre
amplitudes y fases de las funciones a la entrada y a la salida depende de la ubi-
cación de los polos y los ceros de la función de transferencia correspondiente.
En sistemas de lazo abierto, esto permite interpretar a las ecuaciones diferen-
ciales lineales, y a los sistemas de control lineales, como filtros. Esto significa
que la rapidez y las oscilaciones presentes en la respuesta de un sistema de
control dependen del contenido de componentes de frecuencia de la entrada
y de qué componentes de frecuencia deja pasar el sistema de control: i) las
componentes de frecuencia altas favorecen una respuesta rápida, ii) si una
banda de frecuencias es favorecida (pico de resonancia) entonces la respuesta
6.11 Preguntas de repaso 383

es oscilatoria, iii) del tratamiento que se dé a las componentes de frecuencias


bajas (cero) depende el valor de la salida en estado estacionario, iv) el efecto
del ruido se reduce si las componentes de muy alta frecuencia son fuertemente
atenuadas.
Un logro importante del estudio de los sistemas de control bajo el en-
foque de la respuesta en frecuencia es el poder relacionar las caracterı́sticas
de respuesta en frecuencia en lazo abierto (frecuencia de cruce de ganancia
y márgenes de estabilidad) con las caracterı́sticas de respuesta en el tiempo
(rapidez y oscilaciones de la respuesta) del sistema de control en lazo cerrado.
De esta manera se puede diseñar un controlador buscando que éste modifique
convenientemente las gráficas de respuesta en frecuencia del sistema en lazo
abierto.

6.11. Preguntas de repaso

1. ¿Qué entiende por respuesta en frecuencia? ¿Qué representan la magnitud


y la fase de una función de transferencia?
2. Las funciones de transferencia están constituidas por polos y ceros ¿Cuáles
de estos componentes contribuyen como filtros pasa altas y cuáles como
filtros pasa bajas? ¿Cuáles de ellos introducen fase positiva y cuales fase
negativa?
3. Dado un sistema de control en lazo cerrado ¿Por qué los ceros contribuyen
a la estabilidad cuando son colocados en la función de transferencia de lazo
abierto? ¿Cómo contribuyen los polos de lazo abierto a la estabilidad?
¿Cuál es la ventaja de agregar polos en la función de transferencia de lazo
abierto?
4. ¿Cuál es la relación del criterio de estabilidad de Nyquist con los márgenes
de estabilidad?
5. Dado un sistema en lazo abierto ¿Por qué una frecuencia de corte (o
de esquina) mayor contribuye a una mayor rapidez de la respuesta en el
tiempo?
6. ¿Qué se debe hacer con la frecuencia de cruce de ganancia para conse-
guir que el sistema en lazo cerrado tenga una respuesta más rápida en el
tiempo?
7. ¿Cómo afecta el margen de fase a la respuesta en el tiempo del sistema
en lazo cerrado?
8. ¿Cuál es la modificación que se debe hacer al criterio de estabilidad de
Nyquist para que pueda ser aplicado a funciones de transferencia de lazo
abierto con polos y/o ceros sobre el eje imaginario? ¿Cuál es la razón para
esto?
9. ¿Qué es un sistema de fase mı́nima?
10. ¿Qué es la trayectoria de Nyquist y qué es la trayectoria de Nyquist mo-
dificada?
384 6 Diseño usando la respuesta en frecuencia

6.12. Ejercicios propuestos


1. ¿Cómo obtiene el error en estado estacionario de un sistema en lazo cerra-
do ante referencias tipo escalón, rampa y parábola, a partir de las gráficas
de Bode? Investigue.
2. Considere un sistema integrador:
Z t
y(t) = k u dt
0

y un sistema derivador:

y(t) = k u̇(t)

a)
En ambos casos suponga que u = A cos(ωt), con A una constante,
y calcule y(t). Haga una gráfica donde muestre como varı́a la ampli-
tud de y(t) respecto de la frecuencia en cada caso y compare con las
gráficas de Bode mostradas en las figuras 6.13(a) y 6.13(b).
b) ¿Cual es el efecto de un derivador cuando u tiene alto contenido de
ruido? (sinusoide de alta frecuencia). En base a lo anterior responda
que piensa que sucederá en los siguientes casos: ¿Que efecto tiene
un controlador que contiene alguna acción derivativa en un sistema
de control de posición que tiene alto contenido de ruido? ¿Cual es
el efecto del ruido en un sistema de control que contiene una acción
integral únicamente?
c) Considere el caso de un pistón neumático. El flujo de aire de entrada
es u y la posición del émbolo del pistón es y. Suponga que el aire no
se comprime ni se expande (que es incompresible) dentro del pistón y
que el émbolo del pistón no tiene masa. Si se extrae flujo de aire del
pistón entonces u < 0, si se introduce flujo de aire al pistón entonces
u > 0. Bajo estas condiciones este sistema se comporta como un inte-
grador. Suponga que se aplica una entrada de la forma u = A cos(ωt)
con un valor de ω que cada vez se acerca más a cero. Usando su ex-
periencia cotidiana explique que sucede con la posición del pistón y
compare con lo que indican las gráficas de Bode correspondientes a
este problema y las gráficas obtenidas en el primer inciso de este ejer-
cicio. ¿Qué significa el término “ganancia infinita a frecuencia cero”?
Aunque un motor de CD con escobillas no es exactamente un integra-
dor, use su experiencia cotidiana para ver si tiene un comportamiento
similar al descrito cuando y es la posición y u = A cos(ωt) el voltaje
aplicado. Desde el punto de vista del modelo del motor ¿Como puede
explicar este comportamiento?
3. Considere el siguiente sistema:
a
Y (s) = U (s), a>0
s+a
6.12 Ejercicios propuestos 385

Suponga que u(t) es una onda cuadrada (de perı́odo igual a 2) que es
igual a la unidad durante el primer medio perı́odo e igual a cero durante el
segundo medio perı́odo. Utilice algún software especializado para realizar
varias simulaciones utilizando diferentes valores de a desde valores muy
cercanos a cero hasta valores considerablemente grandes. Observe la forma
de y(t) en estas simulaciones. ¿Por qué cree que y(t) sea muy diferente
de u(t) cuando a es muy cercana a cero? ¿Por qué cree que y(t) sea cada
vez más parecida a u(t) cuando a es considerablemente grande? ¿Puede
explicar este comportamiento desde el punto de vista de conceptos basados
a
en la respuesta en frecuencia de la función de transferencia s+a ?
4. Existe un resultado fundamental en la teorı́a de sistemas lineales que afir-
ma que si Y (s) = G(s)U (s) con u(t) una función periódica y si todos
los polos de G(s) tienen parte real estrictamente negativa, entonces y(t)
converge a una función periódica con el mismo perı́odo de u(t) pero posi-
blemente no con la misma forma de onda [5], pág. 389 (véase también el
ejercicio 13 del capı́tulo 3) ¿El ejemplo planteado en el ejercicio 3 de este
capı́tulo le sugiere alguna explicación acerca de porque u(t) y y(t) puedan
no tener la misma forma de onda? ¿De qué depende el que las formas de
onda de u(t) y y(t) sean parecidas o muy diferentes?
5. Considere la siguiente ecuación diferencial:

ÿ + ωn2 y = ωn2 u

El problema de calcular y(t) cuando t → ∞ y u(t) = A sin(ωt) se simplifica


enormemente usando las gráficas de Bode de la figura 6.14(b). Usando esta
información elabore gráficas donde se aprecie cómo cambia y(t) cuando
t → ∞ conforme ω cambia desde un valor ω = ω1 < ωn hasta otro valor
ω = ω 2 > ωn .
A partir de lo anterior explique qué sucede cuando se hace el mismo ex-
perimento pero ahora se tiene una ecuación diferencial como la siguiente:

ÿ + 2ζωn ẏ + ωn2 y = ωn2 u

con ωn > 0 y ζ > 0. ¿Qué sucede conforme ζ crece? ¿Por qué la resonancia
se considera peligrosa en muchas aplicaciones?
6. Considere un sistema en lazo cerrado como el de la figura 4.10 y la corres-
1
pondiente expresión para el error dada como E(s) = 1+G(s) R(s) donde
E(s) = R(s) − C(s). Si el valor deseado es una sinusoide r(t) = A sin(ωt)
¿Qué debe hacer para que el error lı́mt→∞ e(t) sea cada vez menor? ¿Es po-
sible que se pueda tener que lı́mt→∞ e(t) = 0? Si la respuesta es afirmativa,
¿Bajo qué condiciones? Verifique su respuesta mediante una simulación.
7. Considere el circuito RLC paralelo mostrado en la figura 6.82. Demuestre
que la función de transferencia está dada como:

V (s) kωn2 s
= 2 (6.80)
I(s) s + 2ζωn s + ωn2
386 6 Diseño usando la respuesta en frecuencia
q
1 1 L
donde ωn = √LC , ζ = 2R C , k = L. Dibuje las gráficas de Bode corres-
pondientes cuando ζ es cercana a cero (¿Cómo puede ser esto posible en la
práctica?) y compruebe que se trata de un filtro pasa banda alrededor de
la frecuencia ω ≈ ωn (de hecho ω → ωn conforme ζ → 0). ¿Cómo puede
variar el valor de ωn en la práctica?

I(s)
+

L R C V(s)

Figura 6.82. Circuito RLC paralelo.

Una aplicación interesante e importante de este ejercicio es el radio-


receptor de AM mostrado en la figura 6.83 [6], pág. 94-99. Se sugiere
al lector que construya este receptor pues no es difı́cil hacerlo y a conti-
nuación se detalla sobre la elaboración de las partes más importantes.
La inductancia se construye enrollando alambre magneto sobre un núcleo
cilı́ndrico de cartón o de plástico de aproximadamente 2.6[cm] de diámetro
y aproximadamente 10[cm] de largo. Las espiras deben estar colocadas
una junto a la otra sin encimarse y sin dejar huecos apreciables entre
ellas. Entonces se utiliza papel lija para retirar completamente el barniz
que cubre al alambre de cobre sobre una franja a lo largo de todo el
cilindro de aproximadamente 0.5[cm] de ancho. Entonces, la inductancia
L se puede variar deslizando un contacto eléctrico a lo largo de esta franja
de alambre desnudo.
La antena consiste de un alambre de cobre de 30[m] de largo. Uno de los
extremos se fija, a través de material aislante, a un punto sólido sobre
una pared o un poste mientras que el otro extremo se conecta al circuito
sintonizador (LC en paralelo). Es importante que la antena no tenga con-
tacto eléctrico con ningún punto que no sea el indicado en la figura 6.83.
Nótese que la función de la antena es recoger la señales eléctricas que son
transportadas por las ondas electromagnéticas que emiten las estaciones
radiodifusoras comerciales de AM. Mientras más larga sea la antena más
intensas serán las señales recuperadas.
La conexión a tierra se realiza conectando firmemente dicho punto a una
tuberı́a de agua de cobre. Es importante que la tuberı́a sea de cobre y que
llegue a una profundidad suficiente dentro del suelo.
6.12 Ejercicios propuestos 387

El diodo 1N34A es de germanio y tiene la función de elemento detector,


es decir, es quien extrae la información que porta la onda electromagnéti-
ca transmitida. Es importante que este diodo sea de germanio pues tiene
una barrera de potencial mucho menor que la de un diodo de silicio. Esto
facilita que la débil señal captada por la antena pueda vencer dicha barre-
ra de potencial. Precisamente debido a lo débil de esta señal también es
importante que todo el circuito de audio represente una alta impedan-
cia. Entonces el circuito basado en amplificador operacional debe tener
una ganancia elevada y su resistencia de entrada debe ser grande (aun-
que se sugiere de 100K[Ohm] pueden utilizarse otros valores para ajustar
convenientemente la ganancia de este amplificador).
El lector puede sintonizar diferentes estaciones simplemente variando la
inductancia L. Si la antena es suficientemente larga, si además se tiene una
buena conexión a tierra y si los audı́fonos son de alta impedancia entonces
se podrán escuchar estaciones de radio incluso sin necesidad de baterı́as, es
decir, se puede sustituir todo el circuito contenido por las lı́neas punteadas
por un simple corto. En caso de usar el amplificador operacional se sugiere
usar dos baterı́as de 9[V] para proveer la alimentación necesaria.
¿Puede explicar el funcionamiento del circuito de sintonı́a de este receptor
a partir de la respuesta en frecuencia de la función de transferencia en
(6.80)? ¿Por qué sólo aparecen los elementos L y C pero no R en la figura
6.83? ¿Qué variables en el radio receptor juegan los papeles de V (s) y I(s)
en (6.80)?

Antena
1M

1N34A 100K
à
+
NA741

L C Audifonos

Tierra

Figura 6.83. Radio-receptor de AM básico.

8. Considere el circuito RC mostrado en la figura 6.84. Si vi (t) es un escalón,


encuentre vo (t) y grafique estas dos señales. ¿La señal vo (t) es continua o
388 6 Diseño usando la respuesta en frecuencia

discontinua en t = 0? Obtenga la función de transferencia VVoi (s)


(s)
, obtenga
las gráficas de Bode correspondientes y diga si se trata de un filtro pasa
altas o pasa bajas. En base a estas observaciones ¿Cómo puede explicar
la continuidad (o discontinuidad) de vo (t) en t = 0 cuando vi (t) es un
escalón?

C
+ à

+ vo
vi R
à
à

Figura 6.84. Circuito RC.

9. En este capı́tulo se ha explicado cómo se obtienen las gráficas de Bode


correspondientes a una función de transferencia conocida. Sin embargo,
también es posible el proceso inverso: dadas las gráficas de Bode se puede
obtener la función de transferencia correspondiente. En este tipo de pro-
blemas las gráficas de Bode son obtenidas experimentalmente y se dice
que al encontrar la función de transferencia correspondiente se ha identi-
ficado al sistema bajo estudio. En la figura 6.85 se muestran unas gráficas
de Bode que se han obtenido experimentalmente. Encuentre la función de
transferencia correspondiente. Verifique su respuesta dibujando las gráfi-
cas de Bode de la función de transferencia identificada y comparándolas
con las de la figura 6.85.
10. En el ejercicio 7 del capı́tulo 2 se explica como obtener el modelo ma-
temático de un voltı́metro analógico de CD. Si se supone que la induc-
tancia del voltı́metro es despreciable (L ≈ 0) el modelo se reduce a un
sistema masa-resorte-amortiguador giratorio (de segundo orden). Con es-
ta información en mente realice el siguiente experimento.
Conecte el voltı́metro analógico en el modo de corriente directa.
Tome un generador de funciones y prográmelo para que genere una
forma de onda sinusoidal. También prográmelo de manera que dicha
función sinusoidal de voltaje sea entregada montada sobre una compo-
nente de CD constante. El valor de esta componente de CD debe ser
igual a la mitad de la escala utilizada del voltı́metro de CD. Además, el
generador de funciones debe entregar un voltaje cuyos valores máximo
6.12 Ejercicios propuestos 389

Bode Diagram

25

20

15
Magnitude (dB)

10

−5
45

0
Phase (deg)

−45

−90
−4 −3 −2 −1 0 1 2 3
10 10 10 10 10 10 10 10
Frequency (rad/sec)

Figura 6.85. Gráficas de Bode de una planta a identificar.

y mı́nimo (cuando aparece la función sinusoidal junto con la componen-


te de CD) no excedan la escala seleccionada del voltı́metro analógico.
Conecte directamente a las terminales del voltı́metro la salida del ge-
nerador de funciones. Aplique una señal sinusoidal de frecuencia ω y
obtenga los valores vmin y vmax como los valores mı́nimo y máximo
obtenidos en la escala del voltı́metro analógico. Utilice un osciloscopio
para medir el voltaje de pico a pico de la señal sinusoidal entregada
por el generador de funciones y desı́gnelo como A. Utilice diferentes
valores de frecuencia ω y forme la siguiente tabla:

Tabla 6.4. Datos de respuesta en frecuencia de un voltı́metro de CD.


B
ω, [rad/seg] B = vmax − vmin , [Volts] A, [Volts] A
390 6 Diseño usando la respuesta en frecuencia

Con estos datos dibuje la gráfica de Bode de magnitud correspondiente


y, a partir de ella, obtenga los valores numéricos de la función de
transferencia G(s) = VVoi (s)
(s)
donde Vi (s) y Vo (s) son las transformadas
de la place del voltaje entregado por el generador de funciones y el
voltaje medido por el voltı́metro, respectivamente. Nótese que esta
función de transferencia debe ser de ganancia unitaria a frecuencia
cero porque a este valor de frecuencia es cuando un voltı́metro de
CD entrega un valor correcto del voltaje medido. Nótese también que
el valor de ωn es un dato que da información a cerca de cual es el
valor máximo de frecuencia a la cual el voltı́metro de CD entrega
mediciones correctas. Esta parte del resultado depende mucho de que
el osciloscopio y el voltı́metro entreguen la misma medición de voltaje
a bajas frecuencias.
Referencias

1. E. Kreyszig, Matemáticas avanzadas para ingenierı́a, Vol. 1, Limusa, México,


1980.
2. H. P. Hsu, Análisis de Fourier, Fondo Educativo Interamericano, México, 1973.
3. K. Ogata, Ingenierı́a de Control Moderna, 4a. edición, Pearson Prentice-Hall,
Madrid, 2003.
4. N.S. Nise, Sistemas de control para ingenierı́a, 1a. edición en español, 1a. Re-
impresión, CECSA, México, 2004.
5. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
6. Fundación Thomas Alva Edison, Experimentos fáciles e increı́bles, Ediciones
Roca, México, 1993.
7. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edición, Pearson
Prentice-Hall, Madrid, 2008.
8. B.C. Kuo, Sistemas de control automático, 7a. edición, Prentice-Hall Hispanoa-
mericana, México, 1995.
9. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edición en
español, McGraw-Hill, México, 1992.
7
La técnica de las variables de estado

A finales de la década de 1950 llegó la era de los vuelos espaciales. El


lanzamiento, direccionamiento, navegación y seguimiento de naves espacia-
les consiste básicamente en el control de objetos balı́sticos. Estos problemas
requieren de la construcción de modelos fı́sicos detallados que puedan ser cons-
truidos en términos de ecuaciones diferenciales, lineales y no lineales. Basados
en el trabajo de Poincaré, los ingenieros que trabajaban en las industrias
aeroespaciales empezaron a formular los problemas de control en términos de
un conjunto de ecuaciones diferenciales de primer orden. Ası́ nació el enfoque
que hoy conocemos como el de las variables de estado.
394 7 La técnica de las variables de estado

Objetivos del capı́tulo

Entender el concepto de variables de estado.


Conocer las herramientas principales usadas en el enfoque de las variables
de estado.
Conocer la relación entre la representación en variables de estado y la
representación en función de transferencia.
Analizar y diseñar sistemas de control usando el enfoque de las variables
de estado.
Los métodos de diseño presentados en los capı́tulos 5 y 6 constituyen la
base de lo que se conoce hoy en dı́a como los métodos de Control Clásico. Una
de las caracterı́sticas del control clásico es que se basa en el enfoque entrada-
salida dictado por el uso de la función de transferencia. Esto significa que una
función de transferencia es como una caja negra a la que se le aplica una señal
(la entrada) y sólo se ve el efecto que se produce en la salida, es decir no se
sabe que es lo que ocurre en el interior de la caja negra. Una desventaja de
este método es que para diseñar un sistema de control sólo se puede utilizar
la información suministrada por una sola señal: la salida. Esto establece un
lı́mite en el desempeño que se puede conseguir.
La técnica de las variables de estado se introduce con el fin de mejorar
algunos de los aspectos mencionados en el párrafo anterior. Por ejemplo, dado
que la variable de estado es una técnica que permite utilizar la información
suministrada por todas las variables internas de un sistema, además de la
salida, es posible diseñar sistemas de control que tienen mejores desempeños.
Esta es la idea fundamental detrás del control por realimentación del estado
que es explotado por la técnica de las variables de estado.
El estudio formal de la técnica de las variables de estado es un tema com-
plejo porque involucra el manejo de herramientas matemáticas avanzadas. Sin
embargo, el objetivo de este capı́tulo no es presentar una exposición formal de-
tallada de esta técnica sino presentar los conceptos básicos que permiten usar
esta técnica para controlar plantas sencillas. Ası́, sólo se consideran plantas
que tienen una entrada y una salida y que son controlables y observables.

7.1. Representación en variables de estado


Considere las siguientes dos ecuaciones diferenciales lineales de coeficientes
constantes:
di
L = u − R i − n ke θ̇ (7.1)
dt
J θ̈ = −b θ̇ + n km i (7.2)

Nótese que cada una de estas ecuaciones diferenciales tiene efecto sobre la
otra ecuación diferencial. Se dice que estas ecuaciones diferenciales deben ser
7.1 Representación en variables de estado 395

resueltas simultaneamente. Una manera muy útil de estudiar este tipo de


ecuaciones diferenciales es el enfoque de las variables de estado. Las variables
de estado pueden ser definidas de la siguiente manera.
Definición 7.1 ( [1], pág. 83) Si se conoce la entrada u(t) para t ≥ t0 , las
variables de estado son el conjunto de variables cuyo conocimiento en t = t0
permite calcular la solución de las ecuaciones diferenciales para todo t ≥ t0 .
Nótese que las variables de estado se definen de una manera muy ambi-
gua. Aunque esto pudiera parecer una desventaja, sin embargo se convierte
en una ventaja porque permite que las variables de estado sean seleccionadas
de la manera que más convenga. De acuerdo a ésto, aunque en la literatura se
proponen varios criterios diferentes para seleccionar las variables de estado,
se debe entender que sin importar cual criterio se utilice las variables selec-
cionadas deben ser tales que permitan conocer la solución de las ecuaciones
diferenciales para todo tiempo futuro. Siguiendo esta lı́nea de ideas en esta
obra se utilizará el siguiente criterio para seleccionar las variables de estado.
Criterio 7.1 Identifique la variable incógnita de cada una de las ecuaciones
diferenciales involucradas. Identifique el orden de cada una de las ecuaciones
diferenciales y desı́gnelo como r. Seleccione las variables de estado como el
conjunto formado por las variables incógnita y sus primeras r − 1 derivadas
en cada una de las ecuaciones diferenciales involucradas. También se pue-
de seleccionar a alguna de estas variables multiplicada por alguna constante
diferente de cero.
Es una costumbre usar la letra n para designar el número de variables de
estado. Por otro lado, el estado es un vector cuyas componentes están dadas
por cada una de las variables de estado. Entonces el estado es un vector de n
dimensiones. De acuerdo a este criterio las variables de estado seleccionadas
para las ecuaciones (7.1), (7.2) son i, θ, θ̇, por lo que n = 3 y el estado se
puede formar como el siguiente vector:
   
x1 i
x =  x2  =  θ 
x3 θ̇

Usando esta nomenclatura, las ecuaciones diferenciales en (7.1), (7.2) se pue-


den escribir como:

L ẋ1 = u − R x1 − n ke x3 (7.3)
J ẋ3 = −b x3 + n km x1 (7.4)

o, de manera vectorial:
   
x1 (u − R x1 − n ke x3 )/L
d    
x2 = x3 (7.5)
dt
x3 (−b x3 + n km x1 )/J
396 7 La técnica de las variables de estado

lo cual se puede escribir de manera compacta como:


ẋ = Ax + Bu
 R   
− L 0 − nLke 1
L
A =  0 0 1 , B=0 (7.6)
n km
J 0 − Jb 0
Por otro lado, se acostumbra usar la letra y para representar la salida a con-
trolar. Se debe resaltar que el estado x está constituido por variables que son
internas al sistema y, por tanto, en general no se conocen y no se pueden
medir. En cambio, la salida y representa una variable que siempre se puede
medir. Si la salida se define como la posición, es decir, si y = θ = x2 entonces
se puede escribir:
y = Cx, C = [0 1 0]
Al conjunto de las dos ecuaciones:
ẋ = Ax + Bu (7.7)
y = Cx (7.8)
se le conoce como ecuación dinámica lineal e invariante en el tiempo (A, B y
C son constantes). La ecuación en (7.7) se conoce como ecuación de estado y
la ecuación en (7.8) se conoce como ecuación de salida.
Aunque la ecuación de estado en (7.7) se ha obtenido a partir de una
ecuación diferencial que cuenta sólo con una entrada, es decir u es un escalar,
es muy sencillo extender (7.7) al caso en el que existen p entradas, sólo hay que
definir u como un vector de p componentes, cada una de las cuales representa
una entrada, y B debe ser definida como una matriz de n renglones y p
columnas. Por otro lado, también es muy sencillo generalizar la ecuación de
salida en (7.8) al caso en que se tienen q salidas, sólo hay que definir y como
un vector de q componentes, cada una de las cuales representa una salida, y
C debe ser definida como una matriz de q renglones y n columnas.
Nótese que una ecuación de estado esta constituida por un conjunto de
n ecuaciones diferenciales de primer orden. Una caracterı́stica de (7.7), (7.8),
es decir de una ecuación dinámica lineal e invariante en el tiempo, es que
el miembro derecho de cada una de las ecuaciones diferenciales involucradas
en (7.7) está dado como una combinación lineal de las variables de estado y
la entrada a través del uso de coeficientes constantes. Nótese también que el
miembro derecho de (7.8) esta constituido por la combinación lineal de las
variables de estado a través del uso de coeficientes constantes.
Una propiedad fundamental de las ecuaciones de estado lineales e inva-
riantes en el tiempo es que satisfacen el principio de superposición, lo cual es
lógico ya que este tipo de ecuaciones de estado se obtienen, según se acaba
de explicar, a partir de ecuaciones diferenciales lineales, ordinarias y de co-
eficientes constantes las cuales, según se explica en la sección 3.10, también
satisfacen el principio de superposición.
7.1 Representación en variables de estado 397

Ejemplo 7.1 Considere el sistema mecánico mostrado en la figura 7.1. El


modelo matemático correspondiente fue obtenido en el ejemplo 2.5 del capı́tulo
2 y a continuación se reescribe para facilitar la referencia

F(t) x1 K2 x2
K1 K3
m1 m2

Figura 7.1. Sistema mecánico.

b K1 K2 1
ẍ1 + (ẋ1 − ẋ2 ) + x1 + (x1 − x2 ) = F (t) (7.9)
m1 m1 m1 m1
b K3 K2
ẍ2 − (ẋ1 − ẋ2 ) + x2 − (x1 − x2 ) = 0 (7.10)
m2 m2 m2
Nótese que se tienen dos ecuaciones diferenciales de segundo orden cada una.
Esto significa que sólo habrán cuatro variables de estado: la incógnita de cada
una de estas ecuaciones diferenciales, es decir x1 y x2 , y la primer derivada
de cada una de estas incógnitas, es decir ẋ1 y ẋ2 :
   
x1 x1
 x2   x2 

x= =    , u = F (t)
x3 ẋ1 
x4 ẋ2

Usando esta nomenclatura, las ecuaciones diferenciales en (7.9), (7.10) se


pueden escribir como:
b K1 K2 1
ẍ1 = ẋ3 = − (x3 − x4 ) − x1 − (x1 − x2 ) + u
m1 m1 m1 m1
b K3 K2
ẍ2 = ẋ4 = (x3 − x4 ) − x2 + (x1 − x2 )
m2 m2 m2
o, de manera vectorial:
   
x1 x3
d   
 x2  =  b x4 

   K1 K2 1  (7.11)
dt x3 − m1 (x 3 − x4 ) − x
m1 1 − m1 (x1 − x2 ) + m1 u
b K3 K2
x4 m2 (x3 − x 4 ) − x
m2 2 + m2 (x1 − x 2 )

de donde se obtiene la ecuación de estado:


398 7 La técnica de las variables de estado

ẋ = Ax + Bu
   
0 0 1 0 0
 0 0 0 1   0 
A= K1 K2 K2 b ,
 B=  (7.12)
−m
1
− m1 m1 − mb1 m1
 1 
m1
K2 K2 K3 b
m2 −m 2
− m2 m2 − mb2 0

Por otro lado, la ecuación de salida depende de qué se desea controlar. Por
ejemplo, si lo que interesa controlar es la posición de la masa 1 entonces:

y = Cx = x1 , C = [1 0 0 0]

pero si se desea controlar la posición de la masa 2 entonces:

y = Cx = x2 , C = [0 1 0 0]

Ejemplo 7.2 En el capı́tulo 12 se estudia un mecanismo conocido como el


sistema ball and beam. En ese capı́tulo se obtiene el modelo matemático corres-
pondiente y se presenta en la ecuación (12.16). A continuación se reescribe
dicho modelo con el fin de facilitar la referencia:
X(s) ρ k
= 2, θ(s) = I ∗ (s)
θ(s) s s(s + a)
Usando la transformada inversa de Laplace se pueden recuperar las ecuacio-
nes diferenciales de las que se han obtenido las funciones de transferencia
involucradas en las expresiones anteriores, es decir:

ẍ = ρθ, θ̈ + aθ̇ = ki∗ (7.13)

Como se trata de dos ecuaciones diferenciales de segundo orden entonces ha-


brá cuatro variables de estado: las incógnitas de cada ecuación diferencial, es
decir x y θ, y las primeras derivadas de dichas incógnitas, es decir ẋ y θ̇:
   
z1 x
 z2   ẋ 
z=   
 z3  =  θ  , u = i

z4 θ̇

Usando esta nomenclatura, las ecuaciones diferenciales en (7.13) se pueden


escribir como:

ẍ = ż2 = ρz3 , θ̈ = ż4 = −az4 + ku

o, de manera vectorial:
   
z1 z2
d   
 z2  =  ρz3 

    (7.14)
dt z 3 z 4
z4 −az4 + ku
7.2 Linealización aproximada 399

de donde se obtiene la ecuación de estado:

ż = Az + Bu
   
010 0 0
0 0 ρ 0  0
A= 0 0 0 1 ,
 B=
0
 (7.15)
0 0 0 −a k

Tal como se explica en el capı́tulo 12 la variable que se desea controlar es x


y, por tanto, la ecuación de salida está dada como:

y = Cz = x = z1 , C = [1 0 0 0]

7.2. Linealización aproximada de ecuaciones de estado


no lineales
Es muy frecuente encontrar ecuaciones de estado que no son lineales, es
decir, ecuaciones de estado dadas como:

ẋ = f (x, u) (7.16)
     
f1 (x, u) x1 u1
 f2 (x, u)   x2   u2 
     
f = .. , x =  . , u= . 
 .   ..   .. 
fn (x, u) xn up

donde al menos una de las funciones fi (x, u), i = 1, . . . , n, es una función


escalar no lineal de x y/o de u, es decir, que no se puede escribir como una
combinación lineal de las componentes de x y/o de u. Por ejemplo, para una
ecuación de estado con tres variables de estado y dos entradas se puede tener:

fi (x, u) = 3 sin(x3 ) + x1 u2
ex1
fi (x, u) =
5x2
fi (x, u) = u21

Es importante subrayar que la notación fi (x, u) significa que la componente i


del vector f es función, en general, de las componentes de los vectores estado
x y entrada u. Sin embargo, tal como se muestra en los ejemplos anteriores, no
es forzoso que fi (x, u) sea función de todas las variables de estado y de todas
la entradas. Más aún, puede darse el caso en que fi (x, u) no es función de
ninguna variable de estado pero sı́ lo es de algunas entradas y viceversa. Una
ecuación de estado de la forma (7.16) que tiene las caracterı́sticas mencionadas
se conoce como una ecuación de estado no lineal invariante en el tiempo (no
depende explı́citamente del tiempo).
400 7 La técnica de las variables de estado

El estudio de ecuaciones de estado no lineales es mucho mas complejo


que el estudio de ecuaciones de estado lineales. Sin embargo, la mayorı́a de los
procesos fı́sicos que son de interés para los ingenieros de control son no lineales
por naturaleza, es decir, sus modelos tienen la forma dada en (7.16). Ası́ que
deben desarrollarse métodos de estudio y diseño para este tipo de ecuaciones
de estado. Uno de los métodos mas sencillos consiste en encontrar una ecuación
de estado lineal como la mostrada en (7.7) que represente satisfactoriamente la
evolución de (7.16). La ventaja de este método es que las ecuaciones de estado
lineales de la forma (7.7) pueden ser estudiadas con mayor facilidad. Entonces
el análisis y el diseño de controladores para (7.16) se realizan utilizando un
modelo más sencillo de la forma (7.7). Aunque este método es muy útil se debe
mencionar que su principal desventaja es que los resultados que se obtienen
sólo son válidos en una región restringida del espacio de trabajo del proceso
que se desea controlar. En las siguientes secciones se explican en detalle todas
estas ideas.

7.2.1. Procedimiento para ecuaciones de primer orden sin


entrada
Considere una ecuación diferencial no lineal de primer orden sin entrada:
ẋ = f (x) (7.17)
donde x es un escalar y f (x) es una función no lineal de x. Se desea obtener

h (x )
f (x )

f (x ã )
xã x

Figura 7.2. Aproximación de una función no lineal f (x) usando una linea recta
h(x).

una ecuación diferencial lineal que represente a (7.17) al menos de manera


7.2 Linealización aproximada 401

aproximada. Defı́nase un punto de equilibrio x∗ de (7.17) como aquel valor


de x que satisface f (x∗ ) = 0. De acuerdo a (7.17) esto significa que en un
punto de equilibrio ẋ∗ = f (x∗ ) = 0, es decir, el sistema puede permanecer en
“reposo” en ese punto. En términos prácticos esto significa que un punto de
equilibrio x∗ representa la configuración constante en la que puede mantenerse
sin movimiento un robot, por ejemplo, bajo la acción de la gravedad.
Suponga que f (x) está representada por la curva que se muestra en la
figura 7.2. La linea recta punteada h(x) es tangente a f (x) en el punto x∗ .
Debido a esta caracterı́stica, h(x) y f (x) son aproximadamente iguales para
valores de x que sean cercanos a x∗ , es decir, si x − x∗ ≈ 0. Sin embargo,
la diferencia entre h(x) y f (x) crece conforme los valores de x se alejan de
x∗ , es decir, para valores grandes de x − x∗ . Ası́ que se puede usar h(x) en
lugar de f (x) si la variable x se restringe a tomar sólamente valores que sean
cercanos a x∗ . En el caso del ejemplo del robot, esto significa que aunque sı́ se
permitirá que el robot se mueva, sin embargo estos movimientos no deben ser
tales que la configuración del robot sufra cambios demasiado grandes respecto
de su configuración de equilibrio o “reposo”. En la figura 7.2 se observa que:
¯
h(x) − f (x∗ ) df (x) ¯¯
m= , m= (7.18)
x − x∗ dx ¯x=x∗

donde la constante m es la pendiente de h(x), es decir, la derivada de f (x)


evaluada en el punto de punto de equilibrio x∗ . Entonces, de la primera ex-
presión:

h(x) = m(x − x∗ ) + f (x∗ ) (7.19)

y debido a que h(x) ≈ f (x), se puede escribir:

f (x) ≈ m(x − x∗ ) + f (x∗ ) (7.20)

Como x∗ es un punto de equilibrio entonces f (x∗ ) = 0 y se obtiene:

f (x) ≈ m(x − x∗ ) (7.21)

Entonces la ecuación (7.17) se puede aproximar por:

ẋ = m(x − x∗ ) (7.22)

Definiendo una nueva variable z = x − x∗ , se tiene ż = ẋ, porque ẋ∗ = 0. Por


tanto, la aproximación lineal de (7.17) está dada por:

ż = m z (7.23)

la cual es válida sólamente bajo la restricción x − x∗ ≈ 0. Una vez que se usa


(7.23) para calcular z se puede usar z = x − x∗ para obtener x ya que el punto
de equilibrio x∗ es conocido.
402 7 La técnica de las variables de estado

7.2.2. Procedimiento general para ecuaciones de orden arbitrario


y número de entradas arbitrario

Considere ahora la ecuación diferencial:

ẋ = f (x, u) (7.24)

donde x ∈ Rn es un vector de n dimensiones y u ∈ Rp es un vector de p


dimensiones que representa la entrada o excitación de la ecuación diferencial.
Nótese que f (x) debe ser una función vectorial de n dimensiones. Esto sig-
nifica que (7.24) tiene la forma definida en (7.16). En este caso se prefiere
usar el concepto “punto de operación” en lugar de “punto de equilibrio” ya
que este último concepto se define sólamente para ecuaciones diferenciales sin
entradas. Un punto de operación se define como aquella pareja (x∗ , u∗ ) tal que
f (x∗ , u∗ ) = 0. Esto significa que la solución de la ecuación diferencial puede
permanecer en “reposo” en el valor constante x∗ , porque ẋ∗ = f (x∗ , u∗ ) = 0,
si se aplican las entradas adecuadas u∗ (p entradas) que también resultan ser
constantes.
Nótese que f (x, u) depende de n + p variables. Defı́nase el siguiente vector:
· ¸
x
y= (7.25)
u

de n + p dimensiones. Entonces (7.24) se puede escribir como:

ẋ = f (y) (7.26)

Siguiendo las ideas de la sección previa, se desea aproximar la función no


lineal f (y) mediante una función h(y) que sea “tangente” a f (y) en el punto
de operación y ∗ definido como:
· ∗¸
x
y∗ =
u∗

Generalizando la expresión en (7.19) al caso de n+p variables se puede escribir:

h(y) = M (y − y ∗ ) + f (y ∗ ) (7.27)
¯
¯
donde M = ∂f∂y(y) ¯ es una matriz constante definida como:
y=y ∗
 
∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u)
∂x1 ∂x2 ... ∂xn ∂u1 ∂u2 ... ∂up
 ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) 
 ... ... 
 ∂x1 ∂x2 ∂xn ∂u1 ∂u2 ∂up 
M = .. .. .. .. .. .. .. .. 
 . . . . . . . . 
 
∂fn (x,u) ∂fn (x,u) ∂fn (x,u) ∂fn (x,u) ∂fn (x,u) ∂fn (x,u)
∂x1 ∂x2 ... ∂xn ∂u1 ∂u2 ... ∂up x=x∗ ,u=u∗

Usando f (y) ≈ h(y) se puede aproximar (7.26) por:


7.2 Linealización aproximada 403

ẋ = M (y − y ∗ ) + f (y ∗ ) (7.28)

Como f (y ∗ ) = f (x∗ , u∗ ) = 0 y ẋ − ẋ∗ = ẋ, porque ẋ∗ = 0, se tiene:

ż = Az + Bv (7.29)
 ∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u)

∂x1 ∂x2 ... ∂xn
 ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) 
 ∂x1 ∂x2 ... ∂xn 
A=
 .. .. .. ..

 (7.30)
 . . . . 
∂fn (x,u) ∂fn (x,u) ∂fn (x,u)
∂x1 ∂x2 ... ∂xn x=x∗ ,u=u∗
 
∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u)
∂u1 ∂u2 ... ∂up
 ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) 
 ... 
 ∂u1 ∂u2 ∂up 
B= .. .. .. ..  (7.31)
 . . . . 
 
∂fn (x,u) ∂fn (x,u) ∂fn (x,u)
∂u1 ∂u2 ... ∂up x=x∗ ,u=u∗

donde se ha definido z = x − x∗ y v = u − u∗ . Las expresiones (7.29), (7.30),


(7.31) constituyen el modelo lineal aproximado que se utiliza para el estudio
y el diseño de controladores para el sistema no lineal en (7.24). Nótese que
este modelo lineal aproximado sólo es válido si el estado x y la entrada u son
tales que no se alejan mucho del punto de operación (x∗ , u∗ ), es decir, sólo si
z = x − x∗ ≈ 0 y v = u − u∗ ≈ 0. Normalmente es difı́cil determinar desde el
punto de vista práctico cuales valores de x y de u satisfacen estas condiciones
y lo que se hace es simplemente limitar sus variaciones de manera empı́rica.
Ejemplo 7.3 En la figura 7.3 se muestra un péndulo simple. En el ejemplo
2.13 del capı́tulo 2 se encontró que el modelo matemático correspondiente
está dado por la siguiente ecuación diferencial no lineal:

T(t)

l
ò
g
m

Figura 7.3. Péndulo simple.

ml2 θ̈ + bθ̇ + mgl sin(θ) = T (t) (7.32)


404 7 La técnica de las variables de estado

La caracterı́stica de ser una ecuación diferencial no lineal es determinada


exclusivamente por la función sin(θ) que aparece por efecto de la gravedad. Al
tratarse de una ecuación diferencial de segundo orden, entonces sólo hay dos
estados: la incógnita θ y su primer derivada θ̇:
· ¸ · ¸
x1 θ
x= = , u = T (t)
x2 θ̇

Usando esta nomenclatura, la ecuación diferencial en (7.32) se puede escribir


como:
b g 1
θ̈ = ẋ2 = − 2
x2 − sin(x1 ) + u
ml l ml2
o, de manera vectorial:
· ¸ · ¸
d x1 x2
= g (7.33)
dt x2 − mlb 2 x2 − l sin(x1 ) +
1
ml2 u

de donde se obtiene la ecuación de estado:

ẋ = f (x, u)
· ¸ · ¸
f1 (x, u) x2
f (x, u) = = g
f2 (x, u) − mlb 2 x2 − l sin(x1 ) +
1
ml2 u

Nótese que en este caso no se puede obtener la forma lineal ẋ = Ax+Bu debido
a la presencia de la función sin(θ). Con el fin de obtener una aproximación
lineal de esta ecuación de estado no lineal, primero se encuentran los puntos
de operación, es decir las parejas (x∗ , u∗ ) que satisfacen f (x∗ , u∗ ) = [0 0]T :
· ¸ · ¸
∗ ∗ x∗2 0
f (x , u ) = =
− mlb 2 x∗2 − gl sin(x∗1 ) + ml1 2 u∗ 0

de donde se obtiene:

x∗2 = 0, u∗ = −mgl sin(x∗1 )

Esto significa que el valor de la entrada, en el punto de operación, depende


del valor de la posición del péndulo en el punto de operación. Esto es debido a
que, para mantener al péndulo en reposo, es necesario que la entrada compense
de manera exacta al efecto de la gravedad. Para continuar, debe seleccionarse
algún valor especı́fico para x∗1 . Aquı́ se considerarán dos casos:
Cuando x∗1 = 0, x∗2 = 0, u∗ = 0. Usando las expresiones en (7.29), (7.30),
(7.31) se encuentra que:

ż = Az + Bv
" # · ¸
∂f1 (x,u) ∂f1 (x,u)
∂x1 ∂x2 0 1
A= =
∂f2 (x,u) ∂f2 (x,u)
∂x1 ∂x2
− gl cos(x1 ) − mlb 2 x1 =x2 =u=0
x=x∗ ,u=u∗
7.2 Linealización aproximada 405
· ¸
0 1
=
− gl − mlb 2
" # · ¸
∂f1 (x,u)
∂u 0
B= ∂f2 (x,u) = 1
∂u ml2
x=x∗ ,u=u∗

donde se ha definido z = x − x∗ = x y v = u − u∗ = u. Nótese que esta


ecuación de estado especifica que:
g b 1
ż1 = z2 , ż2 = − z1 − z2 + v
l ml2 ml2
Al combinar estas dos ecuaciones diferenciales de primer orden se obtiene
la siguiente ecuación diferencial de segundo orden, lineal y de coeficientes
constantes:
b g 1
z̈1 + 2
ż1 + z1 = v (7.34)
ml l ml2
La cual puede ser analizada utilizando los conceptos vistos en las secciones
3.3 (raı́ces complejas conjugadas con parte real menor o igual a cero),
3.5 (raı́ces reales, repetidas y negativas) y 3.4 (raı́ces reales, diferentes y
negativas) del capı́tulo 3, ya que corresponde a una ecuación diferencial de
la forma:

ÿ + 2ζωn ẏ + ωn2 y = kωn2 v

donde:
b g 1
y = z1 , 2ζωn = , ωn2 = , k=
ml2 l mgl
con ζ ≥ 0, ωn > 0 y k > 0 porque m > 0, g > 0, l > 0 y b ≥ 0.
Cuando x∗1 = ±π, x∗2 = 0, u∗ = 0. Usando las expresiones en (7.29),
(7.30), (7.31) se encuentra que:

ż = Az + Bv
" # · ¸
∂f1 (x,u) ∂f1 (x,u)
∂x1 ∂x2 0 1
A= =
∂f2 (x,u) ∂f2 (x,u)
∂x1 ∂x2
− gl cos(x1 ) − mlb 2 x1 =±π,x2 =u=0
x=x∗ ,u=u∗
· ¸
0 1
= g
l − mlb 2
" # · ¸
∂f1 (x,u)
∂u 0
B= ∂f2 (x,u) = 1
∂u ml2
x=x∗ ,u=u∗

donde se ha definido z = x − x∗ = [x1 − x∗1 , x2 ]T y v = u − u∗ = u. Nótese


que esta ecuación de estado especifica que:
406 7 La técnica de las variables de estado

g b 1
ż1 = z2 , ż2 = z1 − 2
z2 + v
l ml ml2
Al combinar estas dos ecuaciones diferenciales de primer orden se obtiene
la siguiente ecuación diferencial de segundo orden, lineal y de coeficientes
constantes:
b g 1
z̈1 + 2
ż1 − z1 = v (7.35)
ml l ml2
La cual puede ser analizada utilizando los conceptos vistos en la sección
3.4 del capı́tulo 3 (raı́ces reales, diferentes, una positiva y la otra negativa,
véase el ejemplo 3.9) ya que corresponde a una ecuación diferencial de la
forma:

ÿ + cẏ + dy = ev

donde:
b g 1
y = z1 , c= ≥ 0, d=− < 0, e=
ml2 l ml2
Nótese que de acuerdo a (7.34) y a la sección 3.3 del capı́tulo 3, cuando el
péndulo funciona alrededor del punto de operación x∗1p= 0, x∗2 = 0, u∗ = 0,
g
oscila con una frecuencia natural dada como ωn = l . Esto significa que
un péndulo más largo oscila más lentamente mientras que un péndulo más
corto oscila más rápidamente. Estas observaciones son útiles, por ejemplo,
cuando se desea ajustar la rapidez de un reloj de péndulo que se “atrasa” o
se “adelanta”. Más aún, reacomodando (7.34) se obtiene:

ml2 z̈1 + bż1 + mglz1 = v (7.36)

De acuerdo al ejemplo 2.6 del capı́tulo 2 que trata sobre el sistema masa-
resorte-amortiguador rotativo mostrado en la figura 7.4, (7.36) significa que
el factor K = mgl > 0 equivale al coeficiente de rigidez de un resorte que es
introducido por el efecto de la gravedad. Por otro lado, usando argumentos

b K
I

T(t)

Figura 7.4. Sistema masa-resorte-amortiguador rotativo.

similares se observa que, reacomodando (7.35):

ml2 z̈1 + bż1 − mglz1 = v


7.3 Algunos resultados del álgebra lineal 407

cuando el péndulo funciona alrededor de los puntos de operación x∗1 = ±π,


x∗2 = 0, u∗ = 0, su comportamiento es análogo al de un sistema masa resorte
amortiguador que cuenta con un resorte con coeficiente de rigidez negativo
K = −mgl < 0. Esto puede verse del siguiente modo. Un coeficiente de rigidez
positivo K > 0 indica que la fuerza ejercida por el resorte siempre va dirigida
en sentido contrario a la deformación y por eso el resorte forza al cuerpo a
regresar a la posición donde el resorte no está deformado. Esa es la razón
por la que el péndulo oscila alrededor del punto de operación x∗1 = 0, x∗2 = 0,
u∗ = 0. Por otro lado y debido al cambio de signo, un resorte con coeficiente
de rigidez negativo K < 0 debe hacer lo contrario, es decir, la fuerza ejercida
por el resorte ahora va dirigida en el mismo sentido que la deformación. Esto
significa que al deformarse el resorte con K < 0 éste forza a que el resorte se
deforme aún más por lo que el cuerpo se aleja de la configuración en la que el
resorte tiene deformación cero (es decir donde z1 = 0). Esto es precisamente
lo que sucede con el péndulo alrededor de los puntos de operación x∗1 = ±π,
x∗2 = 0, u∗ = 0: si z1 6= 0 entonces la fuerza de la gravedad forza al péndulo
a caer y, por tanto a alejarse cada vez más de la configuración donde z1 =
0, es decir donde x1 = x∗1 = ±π. Este comportamiento es la comprobación
experimental de lo que analı́ticamente queda demostrado al tener un polinomio
caracterı́stico con una raı́z positiva: los puntos de operación x∗1 = ±π, x∗2 = 0,
u∗ = 0 son inestables.

Se recomienda consultar las secciones 11.2 (en el capı́tulo 11), 13.2 (en el
capı́tulo 13) y 14.4 (en el capı́tulo 14) para ver otros ejemplos de cómo utilizar
las expresiones en (7.29), (7.30), (7.31) para encontrar ecuaciones de estado
lineales aproximadas de ecuaciones de estado no lineales.

7.3. Algunos resultados del álgebra lineal

En esta sección se presentan algunos resultados que son útiles para el


estudio de la técnica de las variables de estado.
Resultado 7.1 ( [1], cap. 2) Sean w1 , w2 , . . . , wn , n vectores de n componen-
tes cada uno. Estos vectores son linealmente dependientes si y sólo si existen
n escalares α1 , α2 , . . . , αn , no todos cero tales que:

α1 w1 + α2 w2 + . . . + αn wn = 0 (7.37)

donde el cero del lado derecho representa un vector de n componentes todas


ellas con valor cero. Si la única manera de satisfacer la expresión anterior es
que α1 = α2 = . . . = αn = 0 entonces se dice que w1 , w2 , . . . , wn , son vectores
linealmente independientes.
En la versión más simple de la dependencia lineal de vectores, dos vectores de
dos componentes son linealmente dependientes si son paralelos. Esto puede
408 7 La técnica de las variables de estado

verse del siguiente modo. Sean w1 y w2 dos vectores de n = 2 componentes ca-


da uno. Estos vectores son linealmente dependientes si existen dos constantes
α1 6= 0 y α2 6= 0 tales que:
α1 w1 + α2 w2 = 0
lo cual significa que se puede escribir:
α2
w1 = − w2
α1
Nótese que α1 no puede ser cero por razones obvias. Por otro lado, si α2 fuera
igual a cero entonces w1 = 0 es la única posibilidad por lo que no interesa este
caso y, por tanto, se supone que ambos α1 6= 0 y α2 6= 0. Por tanto, como el
α2
factor − α 1
es un escalar (positivo o negativo), lo anterior significa que w1 y
w2 son vectores que tienen la misma dirección, es decir, que son paralelos1 .
Cuando se tienen 3 o más vectores, entonces la dependencia lineal signi-
fica que uno (aunque no todos) de los vectores puede ser obtenido mediante
la suma de los otros vectores cuando son “amplificados” convenientemente
usando las “ganancias” αi (esto es lo que se conoce como combinación lineal
de vectores). Es decir:
α2 α3
w1 = − w2 − w3
α1 α1
se obtiene directamente de (7.37) cuando n = 3 y α1 6= 0. Como n = 3, esto
significa que w1 , w2 y w3 pertenecen a un mismo plano (o una linea recta, en
el peor de los casos) que esta incrustado en un volumen (en R3 ), es decir, que
la combinación lineal de w1 , w2 y w3 no permite obtener otro vector (o vecto-
res) que no pertenezcan a dicho plano. De acuerdo a todo esto, tres vectores
de 3 componentes son linealmente independientes si la combinación lineal de
ellos permite generar vectores que “cubren” por completo tres dimensiones.
Generalizando, la combinación lineal de n vectores (de n componentes) lineal-
mente independientes “cubre” un espacio de n dimensiones. La combinación
lineal de n vectores (de n componentes) linealmente dependientes “cubre” un
espacio con un número de dimensiones menor que n.
Resultado 7.2 ( [1], cap. 2, [2], cap. 10) Sea la siguiente matriz de n × n:
£ ¤
E = w1 w2 . . . wn
donde w1 , w2 , . . . , wn , son n vectores columna de n componentes. Los vecto-
res w1 , w2 , . . . , wn son linealmente independientes si y sólo si la matriz E es
no singular, es decir, si y sólo si el determinante de E es diferente de cero
(det(E) 6= 0).
1
Algunos autores usan el término “antiparalelos” para designar dos vectores que
tienen la misma dirección pero sentido contrario. En esta obra se utiliza el término
“paralelos” para designar dos vectores que tienen la misma dirección sin importar
su sentido.
7.3 Algunos resultados del álgebra lineal 409

Para explicar este resultado se hace uso de lo siguiente.


Resultado 7.3 ([1], cap. 2) Suponga una matriz E de n × n. La única solu-
ción de la expresión Ew = 0, donde w representa un vector de n componentes,
es w = 0 si y sólo si la matriz E es no singular.
Nótese que la suma de vectores mostrada en (7.37) se puede escribir como:
   
α1 0
£ ¤ α  
 2  0

α1 w1 + α2 w2 + . . . + αn wn = w1 w2 . . . wn  .  =  . 
 ..   .. 
αn 0

De acuerdo al resultado 7.3, el vector [α1 α2 . . . αn ] = [0 0 . . . 0] es la única


solución de este sistema homogéneo si y sólo si la matriz E = [w1 w2 . . . wn ]
es no singular. Esto implica que los vectores w1 , w2 , . . . , wn son linealmente
independientes si y sólo si det(E) 6= 0.
Resultado 7.4 ([1], cap. 2) El rango de una matriz E de n × n es el orden
del determinante más grande y diferente de cero que puede formarse con los
elementos de E. El rango de E es n si y sólo si E es no singular. La matriz
inversa E −1 existe si y sólo si la matriz E es no singular [2], cap. 10.
Resultado 7.5 ([1], cap. 2) Los eigenvalores de una matriz E de n × n son
aquellos escalares λ que satisfacen:

det(λI − E) = 0

donde I representa la matriz identidad de n × n. La expresión det(λI − E)


es un polinomio de grado n en la variable λ y se conoce como el polinomio
caracterı́stico de la matriz E. Los eigenvalores de una matriz E pueden ser
números reales o complejos. La matriz E tiene exactamente n eigenvalores
incluyendo aquellos que se puedan repetir.
Resultado 7.6 ([3], cap. 7) Suponga que dos matrices E y Ē, ambas de n×n,
se relacionan a través de:

Ē = P EP −1 (7.38)

donde P es una matriz constante y no singular de n × n, entonces ambas


matrices E y Ē tienen los mismos eigenvalores. Esto significa que:

det(λI − E) = det(λI − Ē) (7.39)

Para explicar esto es de mucha utilidad lo siguiente.


Resultado 7.7 ([4], pág. 303) Sean D y G dos matrices de n × n. Entonces:

det(DG) = det(D) det(G) (7.40)


410 7 La técnica de las variables de estado

Como P P −1 = I y det(I) = 1, entonces usando (7.40) se encuentra que


1
det(P ) det(P −1 ) = 1, es decir det(P −1 ) = det(P ) . Por otro lado, de acuerdo a
(7.38), (7.40), el polinomio caracterı́stico de Ē es:

det(λI − Ē) = det(λI − P EP −1 ) = det(P [λI − E]P −1 )


= det(P ) det(λI − E) det(P −1 ) = det(λI − E)

Nótese que en la última expresión se ha recuperado (7.39), lo que comprueba


ese resultado.
Resultado 7.8 ([4], pág. 334) Sean E y F dos matrices de n×n con F = E T .
Los eigenvalores de F son idénticos a los eigenvalores de E.
Para explicar esto es de mucha utilidad lo siguiente.
Resultado 7.9 ([2], pág. 504) El determinante de una matriz E es igual a
la suma de los productos de los elementos de cualquier columna o renglón de
E y sus respectivos cofactores.
Resultado 7.10 ([2], pág. 507) Si det(D) es un determinante cualquiera
y det(G) es el determinante cuyos renglones son las columnas de det(D),
entonces det(D) = det(G).
De acuerdo a lo anterior, det(λI − E) puede calcularse usando, por ejemplo,
la primera columna de la matriz λI − E, mientras que det(λI − F ) se puede
calcular usando, por ejemplo, el primer renglón de la matriz λI − F . Nótese
que la primera columna de λI − E es igual al primer renglón de λI − F ya
que (λI − E)T = λI − F debido a que F = E T . Por esta misma razón, los
renglones del cofactor del elemento en el renglón i y la columna 1 en la matriz
λI − E son iguales a las columnas del cofactor del elemento en el renglón 1 y
la columna i en la matriz λI − F . Esto demuestra que E y F tienen el mismo
polinomio caracterı́stico, es decir que:

det(λI − E) = det(λI − F ) (7.41)

y por tanto, los eigenvalores de F son iguales a los eigenvalores de E.

7.4. Solución de una ecuación dinámica, lineal e


invariante en el tiempo
El cálculo de la solución de la ecuación dinámica:

ẋ = Ax + Bu, x ∈ Rn , u∈R (7.42)


y = Cx, y∈R (7.43)

es un problema complejo que require del manejo de conceptos avanzados de


álgebra lineal y cálculo que están fuera del alcance de esta obra. Sin embargo,
7.4 Solución de una ecuación dinámica 411

se pueden explicar las ideas fundamentales involucradas en el procedimiento


correspondiente si se establece una analogı́a con el problema de resolver la
siguiente ecuación diferencial de primer orden:
ẋ = ax + bu, x, u ∈ R
Aplicando la transformada de Laplace se tiene:
sX(s) − x(0) = aX(s) + bU (s)
donde X(s), U (s) representan, respectivamente, las transformadas de Laplace
de x y u. Esto se puede escribir del siguiente modo:
b x(0)
X(s) = U (s) + (7.44)
s−a s−a
Usando los pares transformados [5]:
© ª 1
L eat = = G(s) (7.45)
s−a
½Z t ¾
b
L g(t − τ )bu(τ )dτ = U (s), (convolución)
0 s − a
g(t) = L−1 {G(s)}
se encuentra que, al aplicar la transformada inversa da Laplace a (7.44), se
obtiene:
Z t
x(t) = g(t − τ )bu(τ )dτ + eat x(0)
0

Finalmente, usando (7.45) de nuevo se encuentra:


Z t
x(t) = eat x(0) + ea(t−τ ) bu(τ )dτ, x, u, a, b ∈ R
0

La solución de la ecuación de estado en (7.42) es similar a esta última ecuación


y sólo se debe utilizar notación matricial, es decir, la solución de (7.42) es [1],
pág. 142:
Z t
At
x(t) = e x(0) + eA(t−τ ) Bu(τ )dτ, x ∈ Rn , u ∈ R (7.46)
0

donde e es una matriz de n × n (nótese que eA(t−τ ) = eAr |r=t−τ ) y a


At

continuación se explica como está dada.


Si λ es un eigenvalor real (positivo, negativo o cero) y no repetido de la
matriz A entonces al menos uno de lo elementos de la matriz eAt incluye
la siguiente función:
ceλt
donde c es una constante real.
412 7 La técnica de las variables de estado

Si λ es un eigenvalor real (positivo, negativo o cero) y repetido r veces de


la matriz A entonces cada una de las siguientes funciones:

c0 eλt , c1 teλt , c2 t2 eλt , ..., cr−1 tr−1 eλt

donde ck , k = 1, 2, . . . , r − 1, son constantes reales, está incluida en al


menos uno de los elementos de la matriz eAt . √
Si λ = a+jb es un eigenvalor complejo de la matriz A donde j = −1 con a
un número real (positivo, negativo o cero) y b un número real estrictamente
positivo, si el complejo conjugado de λ también es un eigenvalor de la
matriz A y si estos eigenvalores no están repetidos entonces cada una de
las siguientes funciones:

ceat sin(bt), deat cos(bt)

donde c y d son constantes reales, está incluida en al menos uno de los


elementos de la matriz eAt . √
Si λ = a+jb es un eigenvalor complejo de la matriz A donde j = −1 con a
un número real (positivo, negativo o cero) y b un número real estrictamente
positivo, si el complejo conjugado de λ también es un eigenvalor de la
matriz A y si estos eigenvalores están repetidos r veces entonces cada una
de las siguientes funciones:

c0 eat sin(bt), , c1 teat sin(bt), c2 t2 eat sin(bt), . . . , cr−1 tr−1 eat sin(bt)
d0 eat cos(bt), , d1 teat cos(bt), d2 t2 eat cos(bt), . . . , dr−1 tr−1 eat cos(bt)
(7.47)

donde ck y dk , k = 1, 2, . . . , r − 1, son constantes reales, está incluida en


al menos uno de los elementos de la matriz eAt .
Finalmente, la salida de la ecuación dinámica en (7.42), (7.43) se calcula
usando (7.46) como:
Z t
y(t) = CeAt x(0) + C eA(t−τ ) Bu(τ )dτ (7.48)
0

7.5. Estabilidad de una ecuación dinámica


De particular interés resulta el estudio de la estabilidad de la siguiente
ecuación dinámica sin entrada:

ẋ = Ex (7.49)
y = Cx

donde x ∈ Rn , y ∈ R, E es una matriz constante de n × n y C es un vec-


tor renglón constante de n componentes. Aunque una ecuación dinámica sin
7.6 Controlabilidad y observabilidad 413

entrada puede parecer algo que no corresponde a la realidad, sin embargo en


la sección 7.10 se muestra que una ecuación dinámica realimentada puede ser
escrita en la forma (7.49), debido a que en un sistema realimentado la entrada
se escoge como u = −Kx donde K es un vector renglón de n componentes.
Entonces, sustituyendo esta entrada en (7.42) y definiendo E = A − BK se
encuentra (7.49). Esta es la principal motivación para estudiar la estabilidad
de dicha ecuación dinámica sin entrada.
Aunque definición formal de la estabilidad de (7.49) es algo elaborada,
podemos simplificarla diciendo que la ecuación dinámica (7.49) es estable si
lı́mt→∞ x(t) = 0 (y por tanto, lı́mt→∞ y(t) = 0 también) para cualquier estado
inicial x(0) ∈ Rn . Esto significa que si:
 
x1 (t)
 x2 (t) 
 
x(t) =  . 
 .. 
xn (t)

entonces lı́mt→∞ xi (t) = 0 para toda i = 1, 2, . . . , n, y a partir de cualquier


estado inicial. De acuerdo a la solución encontrada en (7.46), la solución de
(7.49) se encuentra usando u = 0 y A = E en (7.46), es decir:

x(t) = eEt x(0)

Como x(0) es un vector constante, la expresión anterior implica que si se ha de


conseguir que lı́mt→∞ x(t) = 0 entonces se debe conseguir que lı́mt→∞ eEt = 0
donde el “0” representa una matriz de n × n con todos sus elementos iguales
a cero. De acuerdo a lo expuesto en la sección previa a cerca de como están
formados los elementos de la matriz eAt (recuerde que A = E) se llega a la
siguiente conclusión:
Teorema 7.1 ([1], pág. 409) La solución de (7.49) satisface lı́mt→∞ x(t) = 0,
sin importar cual sea el estado inicial x(0), si y sólo si todos los eigenvalores
de la matriz E tienen parte real estrictamente negativa. Se dice que bajo estas
condiciones el origen x = 0 de (7.49) es globalmente asintóticamente estable.
Para comprobar esto es de mucha utilidad recordar que en la sección 3.5
del capı́tulo 3 se ha demostrado que

lı́m tj ept = 0
t→∞

para cualquier j > 0 entero y cualquier número real p < 0.

7.6. Controlabilidad y observabilidad


Dos propiedades importantes de la ecuación dinámica
414 7 La técnica de las variables de estado

ẋ = Ax + Bu, x ∈ Rn , u ∈ R (7.50)
y = Cx, y ∈ R (7.51)

que serán utilizadas a lo largo de este capı́tulo son la controlabilidad y la


observabilidad. A continuación se definen y estudian estas propiedades.

7.6.1. Controlabilidad

Definición 7.2 ([1], pág. 176) Una ecuación de estado es controlable en el


instante t0 si existe un tiempo finito t1 > t0 tal que dados cualquiera dos
estados x0 y x1 existe una entrada u que aplicada desde t = t0 hasta t = t1
consigue trasferir el estado desde x0 en t = t0 hasta x1 en t = t1 . De otro
modo la ecuación de estado es no controlable.

Nótese que esta definición no especifica la trayectoria que se deba seguir


para transferir el estado desde x0 hasta x1 por lo que queda en total liber-
tad. Además, no es necesario que el estado del sistema permanezca en x1
para instantes posteriores a t1 . Nótese también que la controlabilidad es una
propiedad que sólo tiene que ver con la entrada, es decir con la ecuación de
estado, por lo que la ecuación de salida no juega ningún papel. Finalmente,
esta definición es muy general pues también considera la posibilidad de que
la ecuación de estado sea variante en el tiempo, es decir, que los elementos de
A y B sean funciones del tiempo.
En el caso de una ecuación de estado invariante en el tiempo como la
mostrada en (7.50), es decir cuando los elementos de A y B son constantes, si
la ecuación de estado es controlable entonces lo es para cualquier t0 ≥ 0 y el
instante t1 es cualquier valor tal que t1 > t0 , es decir, la transferencia desde x0
a x1 puede ser realizada en cualquier intervalo de tiempo de duración no zero.
Esto permite obtener una manera muy simple de verificar si una ecuación de
estado es controlable:

Teorema 7.2 ([6], pág. 145) La ecuación de estado en (7.50) es controlable si


y sólo si cualquiera de las dos siguientes condiciones equivalentes se satisface:
1. La siguiente matriz de n × n:
Z t Z t ³ ´T
¡ ¢T
Wc (t) = eAτ BB T eAτ dτ = eA(t−τ ) BB T eA(t−τ ) dτ
0 0
(7.52)

es no singular para cualquier t > 0.


2. La matriz de controlabilidad de n × n:
£ ¤
B AB A2 B · · · An−1 B (7.53)

tiene rango igual a n, es decir, su determinante es diferente de cero.


7.6 Controlabilidad y observabilidad 415

La razón de este resultado puede explicarse a grandes rasgos del siguiente


modo. La siguiente entrada:
³ ´T
u(t) = −B T eA(t1 −t) Wc−1 (t1 )[eAt1 x0 − x1 ] (7.54)

transfiere el estado del sistema desde x0 = x(0) en t0 = 0 hasta x1 en t1 > 0.


Esto se puede verificar sustituyendo en la solución presentada en (7.46), pero
evaluada en t = t1 , es decir:
Z t1
x(t1 ) = eAt1 x(0) + eA(t1 −τ ) Bu(τ )dτ
0

la entrada en (7.54), pero evaluada en t = τ , es decir:


³ ´T
u(τ ) = −B T eA(t1 −τ ) Wc−1 (t1 )[eAt1 x0 − x1 ]

para obtener:

x(t1 ) = eAt1 x(0)


Z t1 ½ ³ ´T ¾
+ eA(t1 −τ ) B −B T eA(t1 −τ ) Wc−1 (t1 )[eAt1 x0 − x1 ] dτ
0
At1
=e x(0)
½Z t1 ³ ´T ¾
− eA(t1 −τ ) BB T eA(t1 −τ ) dτ Wc−1 (t1 )[eAt1 x0 − x1 ]
| 0 {z }
Wc (t1 )
= x1

Nótese que este resultado necesita que la matriz Wc (t) de n × n definida


en (7.52) sea no singular (para que Wc−1 (t1 ) exista), lo cual es cierto para
cualquier t1 = t > 0 si la ecuación dinámica es controlable. El hecho de que
t1 sea cualquier instante positivo significa que el estado puede pasar de x0 a
x1 en cualquier intervalo de tiempo de duración no cero.
Por otro lado, la igualdad en (7.52) se puede comprobar del siguiente modo.
Defı́nase v = t − τ , entonces:
Z t ³ ´T Z τ =t ³ ´T
eA(t−τ ) BB T eA(t−τ ) dτ = eA(t−τ ) BB T eA(t−τ ) dτ
0 τ =0
Z v=0 ¡ ¢T
= eAv BB T eAv (−dv)
v=t
Z v=t ¡ ¢T
= eAv BB T eAv dv
v=0

lo cual comprueba la igualdad en (7.52) si se usa τ en lugar de v en la última


integral, lo cual es válido porque el uso de v o de τ como variable de integración
en la última integral no afecta el resultado.
416 7 La técnica de las variables de estado

Finalmente, el hecho de que el rango n de la matriz en (7.53) sea una


condición equivalente a la no singularidad de Wc (t) es de mucha utilidad
porque es más fácil verificar que (7.53) tenga rango n que la no singularidad
de Wc (t).

7.6.2. Observabilidad

Definición 7.3 ([1], pág. 193) Una ecuación dinámica es observable en el


instante t0 si existe un tiempo finito t1 > t0 tal que para cualquier estado
desconocido x0 en t = t0 , es suficiente el conocimiento de la entrada u y de la
salida y sobre el intervalo de tiempo [t0 , t1 ] para determinar de manera única
el estado x0 . De otro modo la ecuación dinámica es no observable.

Nótese que la observabilidad es una propiedad que tiene que ver con la
posibilidad de conocer el estado (interno al sistema) a partir únicamente del
conocimiento de mediciones externas al sistema, es decir a partir de la entrada
y de la salida. Nótese también que esta definición es muy general pues también
considera la posibilidad de que la ecuación de estado sea variante en el tiempo,
es decir, que los elementos de A, B y C sean funciones del tiempo. En el caso
de una ecuación dinámica invariante en el tiempo como la mostrada en (7.50),
(7.51), es decir cuando los elementos de A, B y C son constantes, si la ecuación
de estado es observable entonces lo es para cualquier t0 ≥ 0 y el instante t1
es cualquier valor tal que t1 > t0 , es decir, la determinación del estado inicial
puede ser conseguida en cualquier intervalo de tiempo de duración no zero.
Esto permite obtener una manera muy simple de verificar si una ecuación de
estado es observable:

Teorema 7.3 ([6], pág. 155,156) La ecuación dinámica en (7.50), (7.51), es


observable si y sólo si cualquiera de las dos siguientes condiciones equivalentes
se satisface:
1. La siguiente matriz de n × n:
Z t
¡ Aτ ¢T T Aτ
Wo (t) = e C Ce dτ (7.55)
0

es no singular para cualquier t > 0.


2. La matriz de observabilidad de n × n:
 
C
 CA 
 
 CA2 
  (7.56)
 .. 
 . 
CAn−1

tiene rango igual a n, es decir, su determinante es diferente de cero.


7.6 Controlabilidad y observabilidad 417

La razón de este resultado puede explicarse a grandes rasgos del siguiente


modo. Considere la solución dada en (7.48) y defina:

y(t) = CeAt x(0) (7.57)


Z t
= y(t) − C eA(t−τ ) Bu(τ )dτ (7.58)
0

Nótese que de acuerdo a (7.58) la función y(t) se puede calcular a partir del
conocimiento exclusivo de la entrada y de la salida. Multiplicando ambos lados
¡ ¢T
de (7.57) por eAt C T e integrando sobre [0, t1 ] se obtiene:
½Z t1 ¾ Z t1
¡ ¢
At T T At
¡ ¢T
e C Ce dt x(0) = eAt C T y(t)dt
0 0
| {z }
Wo (t1 )

Si la matriz Wo (t1 ) es no singular, lo cual es cierto si el sistema es observable,


entonces el estado inicial x(0) = x0 se puede calcular de manera única como:
Z t1 ¡ ¢T
x0 = Wo−1 (t1 ) eAt C T y(t)dt
0

Nótese que este resultado necesita que la matriz Wo (t) de n × n definida


en (7.55) sea no singular (para que Wo−1 (t1 ) exista), lo cual es cierto para
cualquier t1 = t > 0 si la ecuación dinámica es observable. El hecho de que t1
sea cualquier instante positivo significa que el estado x0 puede ser calculado
con la información obtenida desde la entrada y desde la salida en cualquier
intervalo de tiempo de duración no cero.
Finalmente, el hecho de que el rango n de la matriz en (7.56) sea una
condición equivalente a la no singularidad de Wo (t) es de mucha utilidad
porque es más fácil verificar que (7.56) tenga rango n que la no singularidad
de Wo (t).

Ejemplo 7.4 Una manera de estimar el estado actual x(t) (y no el estado


inicial x(0)) es utilizando mediciones de la salida y de la entrada ası́ como
algunas de sus derivadas respecto al tiempo. A continuación se muestra que
una condición necesaria para este cálculo es, de nuevo, que la matriz en (7.56)
tenga rango n. Considere la ecuación dinámica en (7.50), (7.51). Las primeras
n − 1 derivadas de la salida se obtienen como:

y = Cx,
ẏ = C ẋ = CAx + CBu,
ÿ = CAẋ + CB u̇ = CA2 x + CABu + CB u̇,
y (3) = CA2 ẋ + CAB u̇ + CB ü = CA3 x + CA2 Bu + CAB u̇ + CB ü,
..
.
418 7 La técnica de las variables de estado

y (i) = CAi x + CAi−1 Bu + CAi−2 B u̇ + · · · + CBu(i−1) ,


..
.
y (n−1) = CAn−1 x + CAn−2 Bu + CAn−3 B u̇ + · · · + CBu(n−2)

donde el exponente entre paréntesis representa el orden de la derivada respecto


al tiempo. Acomodando matricialmente estas expresiones:

Ẏ = Dx(t) + U̇

donde:
   
y C
 ẏ   CA 
   
 ÿ   CA2 
 (3)   
Ẏ =  y , D= CA3 ,
   
 ..   .. 
 .   . 
y (n−1) CAn−1
 
0
 CBu 
 
 CABu + CB u̇ 
 
U̇ =  CA2 Bu + CAB u̇ + CB ü 
 
 .. 
 . 
CAn−2 Bu + CAn−3 B u̇ + · · · + CBu(n−2)

Por tanto, si la matriz en (7.56) tiene rango n entonces la matriz D de n × n


es invertible y el estado actual se puede calcular como:

x(t) = D−1 (Ẏ − U̇ ) (7.59)

es decir, utilizando únicamente mediciones de la salida y la entrada ası́ como


algunas de las derivadas respecto al tiempo de estas variables. La gran desven-
taja de esta manera de calcular el valor del estado x(t) es que generalmente las
mediciones de cualquier variable están contaminadas de ruido en la práctica
y este problema es más grave conforme se calculan derivadas de orden mayor
a partir de estas mediciones. Esta es la razón por la que (7.59) no se utiliza
para calcular el estado x(t) y se prefieren métodos como el presentado en la
sección 7.11.

7.7. Función de transferencia de una ecuación dinámica


Sea la siguiente ecuación dinámica de una entrada-una salida:

ẋ = Ax + Bu (7.60)
y = Cx
7.7 Función de transferencia de una ecuación dinámica 419

donde x ∈ Rn , u ∈ R, y ∈ R son funciones del tiempo, A es una matriz


constante de n × n, B es un vector columna constante de n componentes y C
es un vector renglón constante de n componentes. Aplicando la transformada
de Laplace a (7.60) se obtiene:

sX(s) − x(0) = AX(s) + BU (s) (7.61)


Y (s) = CX(s) (7.62)

donde X(s), Y (s), U (s) representan, respectivamente, la transformada de La-


place del vector de estado x, de la salida escalar y y de la entrada escalar
u mientas que x(0) es el valor inicial del estado x. Recuérdese que dado un
vector x = [x1 , x2 , . . . , xn ]T que es función del tiempo, su transformada de
Laplace se obtiene aplicando esta operación a cada elemento de dicho vector,
es decir [3], cap. 4:
 
L {x1 }
 L {x2 } 
 
X(s) =  . 
 .. 
L {xn }

Una función de transferencia siempre se define bajo la suposición de condicio-


nes iniciales cero. Sustituyendo x(0) = 0 en (7.61) y despejando X(s):

X(s) = (sI − A)−1 BU (s) (7.63)

donde I representa la matriz identidad de n × n. Sustituyendo (7.63) en (7.62)


se obtiene:
Y (s)
= G(s) = C(sI − A)−1 B (7.64)
U (s)

Nótese que la función de transferencia G(s) dada en (7.64) es un escalar. Ahora


se procede a analizar dicha función de transferencia. Con el fin de presentar
una exposición más clara de las ideas, a continuación se supone que n = 3, es
decir que A es una matriz de 3 × 3, I es una matriz identidad de 3 × 3 y que
B y C son vectores columna y renglón, respectivamente, de 3 componentes:
   
a11 a12 a13 b1 £ ¤
A =  a21 a22 a23  , B =  b2  , C = c1 c2 c3
a31 a32 a33 b3

Sin embargo, el lector puede darse cuenta de que el mismo procedimiento es


válido para cualquier valor arbitrario de n. Primero calcúlese la matriz:
 
s − a11 −a12 −a13
sI − A =  −a21 s − a22 −a23 
−a31 −a32 s − a33
420 7 La técnica de las variables de estado
Adj(sI−A)
cuya matriz inversa está dada de acuerdo a la fórmula (sI − A)−1 = det(sI−A)
donde [2], cap. 10:
 T
Cof11 Cof12 Cof13
Adj(sI − A) = Cof T (sI − A) =  Cof21 Cof22 Cof23 
Cof31 Cof32 Cof33

donde Cof (sI − A) es la matriz de cofactores de sI − A y Cofij = (−1)i+j Mij


y Mij es el determinante de (n − 1) × (n − 1), es decir de 2 × 2, que queda
al eliminar el renglón i y la columna j del determinante de la matriz sI − A
[2], cap. 10. Calculando explı́citamente estos elementos se puede observar que
Cofij es un polinomio de s cuyo grado es estrictamente menor que n = 3. Por
otro lado, desarrollando a través del primer renglón se encuentra que:
¯ ¯ ¯ ¯
¯ s − a22 −a23 ¯ ¯ −a21 −a23 ¯
det(sI − A) = (s − a11 ) ¯¯ ¯ ¯
+ a12 ¯ ¯
−a32 s − a33 ¯ −a31 s − a33 ¯
¯ ¯
¯ −a21 s − a22 ¯
−a13 ¯¯ ¯
−a31 −a32 ¯

es decir, det(sI − A) es un polinomio de s de grado igual a n = 3. A partir de


estas observaciones se concluye que todos los elementos de la matriz:
 
Inv11 Inv12 Inv13
Adj(sI − A)
(sI − A)−1 = =  Inv21 Inv22 Inv23 
det(sI − A)
Inv31 Inv32 Inv33

están dados como el cociente de dos polinomios de s de manera que el polino-


mio del numerador es de grado estrictamente menor que n = 3 y el polinomio
del denominador es, para todos los elementos de (sI − A)−1 , un polinomio de
grado n = 3 que está dado como det(sI − A).
Por otro lado, el producto (sI − A)−1 B es un vector columna de n = 3
componentes. Cada uno de estos componentes se obtiene como:
   
d1 Inv11 b1 + Inv12 b2 + Inv13 b3
(sI − A)−1 B =  d2  =  Inv21 b1 + Inv22 b2 + Inv23 b3 
d3 Inv31 b1 + Inv32 b2 + Inv33 b3

De acuerdo a lo expuesto en el párrafo anterior sobre la manera en que está da-


do cada uno de los elementos Invij de la matriz (sI − A)−1 y recurriendo a
la suma de fracciones con el mismo denominador, se concluye que cada uno
de los elementos di del vector columna (sI − A)−1 B también esta dado como
el cociente de dos polinomios de s de manera que el polinomio del numerador
tiene grado estrictamente menor que n = 3 mientras que el polinomio del
denominador es det(sI − A) que tiene grado igual a n = 3. Finalmente, se
encuentra lo siguiente:

C(sI − A)−1 B = c1 d1 + c2 d2 + c3 d3
7.7 Función de transferencia de una ecuación dinámica 421

Razonando de manera similar es posible concluir lo siguiente, lo cual es válido


para cualquier valor de n:
Resultado 7.11 ( [1], caps. 6, 7) La función de transferencia dada en (7.64)
es un escalar que está dado como el cociente de dos polinomios de s de manera
que el polinomio del numerador tiene grado estrictamente menor que n y el
polinomio del denominador es igual a det(sI − A) el cual tiene grado igual a
n, es decir:

Y (s) bm sm + bm−1 sm−1 + · · · + b1 s + b0


= G(s) = C(sI − A)−1 B =
U (s) sn + an−1 sn−1 + · · · + a1 s + a0
(7.65)
det(sI − A) = sn + an−1 sn−1 + · · · + a1 s + a0

para algunas constantes reales bk , al , k = 0, 1, . . . , m, l = 0, 1, . . . , n − 1, con


n > m.
Sin embargo, para que esta afirmación sea cierta es necesario incluir la
siguiente condición adicional [1], cap 7:
Condición 7.1 La ecuación dinámica en (7.60) debe ser controlable, es decir,
el determinante de la matriz en (7.53) debe ser diferente de cero.
Si además se cumple lo siguiente, entonces los polinomios bm sm +bm−1 sm−1
+ · · · + b1 s + b0 y sn + an−1 sn−1 + · · · + a1 s + a0 no tienen raı́ces comunes [1],
cap 6:
Condición 7.2 La ecuación dinámica en (7.60) es observable, es decir, el
determinante de la matriz en (7.56) es diferente de cero.
Ejemplo 7.5 Con el fin de poner en práctica estas ideas, a continuación se
considera un caso sencillo: un motor de CD. En el capı́tulo 9 se muestra que
el modelo de un motor de CD es el siguiente (véase (9.8)):

J θ̈ + bθ̇ = n km i∗ (7.66)

cuando no existe perturbación externa. Además, se puede considerar que la


corriente eléctrica i∗ es la señal de entrada cuando se utiliza un lazo interno
de corriente de alta ganancia. Definiendo las variables de estado como la
posición y la velocidad, no es difı́cil darse cuenta de que se obtiene la siguiente
ecuación dinámica:

ẋ = Ax + Bu, y = Cx (7.67)
· ¸ · ¸ · ¸ · ¸
x1 θ 0 1 0
x= = , A= , B= nkm , u = i∗
x2 θ̇ 0 − Jb J

donde C es un vector renglón que se definirá más adelante dependiendo de la


salida que se desee considerar. Nótese que la siguiente matriz:
422 7 La técnica de las variables de estado
· nkm
¸
£ ¤ 0
B AB = J
nkm
J − nkJm Jb
¡ ¢2
tiene rango n = 2 ya que su determinante es igual a − nkJm 6= 0. A partir
de las definiciones en (7.67) se obtienen los siguientes resultados:
· ¸ µ ¶
s −1 b
sI − A = , det(sI − A) = s s + ,
0 s + Jb J
· ¸ · ¸
s + Jb 0 s + Jb 1
Cof (sI − A) = , Adj(sI − A) = Cof T (sI − A) = ,
1 s 0 s
· ¸
Adj(sI − A) 1 s + Jb 1
(sI − A)−1 = =
det(sI − A) s(s + b ) J
0 s

Para obtener la función de transferencia correspondiente se considerarán los


siguientes dos casos:
La salida es la posición, es deicr y = θ = x1 = Cx, donde C = [1 0].
Entonces:
· ¸· ¸
£ ¤ 1 s + Jb 1 0
G(s) = C(sI − A)−1 B = 1 0 nkm
s(s + b ) J
0 s J
nkm
J
G(s) =
s(s + Jb )

Nótese que en este caso la siguiente matriz:


· ¸ · ¸
C 10
=
CA 01

tiene rango igual a n = 2 ya que su determinante es igual a la unidad, es


decir, es diferente de cero.
La salida es la velocidad, es decir y = θ̇ = x2 = Cx, donde C = [0 1].
Entonces:
· ¸· ¸
−1
£ ¤ 1 s + Jb 1 0
G(s) = C(sI − A) B = 0 1 nkm
s(s + Jb ) 0 s J
nkm
J s
G(s) =
s(s + Jb )

En este caso la siguiente matriz:


· ¸ · ¸
C 0 1
=
CA 0 − Jb

tiene rango menor que n = 2 ya que su determinante es igual a cero.


7.8 Función de transferencia y ecuación dinámica 423

Nótese que en ambos casos la función de transferencia obtenida cumple con lo


establecido en (7.65): que el polinomio del denominador es igual a det(sI −A).
Nótese también que esto es cierto gracias a que la matriz [B AB] tiene ran-
go igual a n = 2 en ambos casos. Finalmente, se puede apreciar el efecto de
que el sistema sea o no observable: en el segundo de los casos el sistema no
es observable y por ello la función de transferencia correspondiente tiene un
polo y un cero que se cancelan lo cual no ocurre en el primero de los casos
porque es observable. Dicha cancelación polo-cero en el segundo de los casos
trae como consecuencia que la función de transferencia sea de primer orden
lo cual significa que sólo uno de los estados (la velocidad) es descrito por la
correspondiente función de transferencia. Es decir, la posición del motor no
tiene ningún efecto cuando se trata de controlar la velocidad del motor. De
esta manera se puede dar una nueva interpretación a la observabilidad, co-
mo se explica a continuación. Cuando la salida es la posición, el sistema es
observable porque conociendo la posición se puede calcular la velocidad (que
es la otra variable de estado) derivando la posición, por ejemplo. Pero si la
salida es la velocidad el conocimiento de esta variable no es suficiente para
conocer la posición (que es la otra variable de estado) como se explica a conti-
nuación. Aunque se podrı́a argumentar que la posición θ(t) se puede calcular
simplemente integrando la velocidad θ̇ sin embargo, de acuerdo a:
Z t
θ(t) − θ(0) = θ̇(r)dr
0

además de conocer la velocidad es necesario conocer la posición inicial θ(0) la


cual es desconocida. Por esto, el sistema no es observable cuando la velocidad
es la salida. Sin embargo, como ya se mencionó, si lo único que se desea es
controlar la velocidad esto no trae ningún problema porque para eso no se
necesita conocer la posición. Ası́ que la observabilidad es importante en otro
tipo de problemas que se abordarán más adelante (secciones 7.11 y 7.12).
Finalmente, el lector puede comprobar la exactitud de estos resultados com-
parando estas funciones de transferencia con las obtenidas en los capı́tulos 9
y 10.

7.8. Una de las ecuaciones dinámicas que corresponden


a una función de transferencia
Una de las caracterı́sticas de la representación en variables de estado es que
no es única. Es decir, dado un mismo sistema fı́sico existen muchas ecuaciones
dinámicas que lo representan correctamente. Esto significa también que dada
una función de transferencia existen muchas ecuaciones dinámicas que la re-
presentan correctamente. A continuación se muestra la manera de obtener una
de esas ecuaciones dinámicas. Considere la siguiente función de transferencia:
Y (s) bm sm + bm−1 sm−1 + · · · + b1 s + b0
= G(s) = (7.68)
U (s) sn + an−1 sn−1 + · · · + a1 s + a0
424 7 La técnica de las variables de estado

Despéjese la salida:
bm sm + bm−1 sm−1 + · · · + b1 s + b0
Y (s) = U (s)
sn + an−1 sn−1 + · · · + a1 s + a0
Defı́nase la nueva variable:
1
V (s) = U (s) (7.69)
sn + an−1 sn−1 + · · · + a1 s + a0
para escribir:
Y (s) = (bm sm + bm−1 sm−1 + · · · + b1 s + b0 )V (s) (7.70)
Considere la expresión (7.69). Pasando el denominador multiplicando al la-
do izquierdo, aplicando la transformada inversa de Laplace y despejando la
derivada de mayor orden se obtiene:
v (n) = −an−1 v (n−1) − · · · − a1 v̇ − a0 v + u (7.71)
donde V (s) = L {v}. De acuerdo a lo expuesto en la sección 7.1, defı́nanse las
variables de estado como la incógnita de la ecuación diferencial (7.71), v, y
sus primeras n − 1 derivadas:
x̄1 = v, x̄2 = v̇, x̄3 = v̈, ..., x̄n = v (n−1) (7.72)
Entonces, (7.71) se puede escribir como:
x̄˙ n = −an−1 x̄n − · · · − a1 x̄2 − a0 x̄1 + u (7.73)
Por otro lado, aplicando la transformada inversa de Laplace a (7.70) se obtiene:
y = bm v (m) + bm−1 v (m−1) + · · · + b1 v̇ + b0 v
Si se considera que m toma su valor máximo, es decir m = n − 1 (recuérdese
que n > m) entonces puede usarse (7.72) para escribir:
y = bn−1 x̄n + bn−2 x̄n−1 + · · · + b1 x̄2 + b0 x̄1 (7.74)
Usando (7.72), (7.73) y (7.74) se obtiene:
x̄˙ = Āx̄ + B̄u (7.75)
y = C̄ x̄
   
0 1 0 0 ··· 0 0 0
 0 0 1 0 ··· 0 0 0
   
 0 0 0 1 ··· 0 0 0
   
 0 0 0 0 ··· 0 0  
Ā =  , B̄ =  0  ,
 .. .. .. .. .. .. ..  .. 
 . . . .  . . . .
   
 0 0 0 0 ··· 0 1  0
−a0 −a1 −a2 −a3 · · · −an−2 −an−1 1
£ ¤
C̄ = b0 b1 b2 b3 · · · bn−2 bn−1 ,
£ ¤T
x̄ = x̄1 x̄2 x̄3 x̄4 · · · x̄n−1 x̄n
7.9 Ecuaciones dinámicas equivalentes 425

La expresión (7.75) representa una ecuación dinámica que corresponde a la


función de transferencia dada en (7.68) y se dice que está en la forma canónica
de controlabilidad. Como se verá más adelante la forma canónica de controla-
bilidad es muy útil para diseñar un controlador por realimentación del estado.

7.9. Ecuaciones dinámicas equivalentes

En la sección 7.7 se ha mostrado a que cualquier ecuación dinámica de una


entrada y una salida que sea controlable y que cuya forma sea la mostrada en
(7.60) le corresponde una función de transferencia de la forma presentada en
(7.65). Nótese que el requisito de la observabilidad sólo sirve para asegurar que
no hay cancelaciones de polos y ceros en la función de transferencia (7.65).
Por otro lado, en la sección 7.8 se ha mostrado que cualquier función de
transferencia de la forma (7.65) puede escribirse en la forma de la ecuación
dinámica mostrada en (7.75). Esto significa que cada una de las ecuaciones
dinámicas en (7.60) y (7.75) puede ser obtenida a partir de la otra, es decir,
que ambas son equivalentes.
A continuación se muestra como pasar de (7.60) a (7.75), y viceversa, sin
necesidad del paso intermedio de una función de transferencia. Considere la
ecuación dinámica (7.60) de una entrada y una salida y defina la siguiente
transformación lineal:

x̄ = P x (7.76)

donde P es una matriz constante de n × n que se define a partir de su inversa


como se indica a continuación [1], cap. 7:
£ ¤
P −1 = q1 · · · qn−2 qn−1 qn , (7.77)
qn = B,
qn−1 = AB + an−1 B,
qn−2 = A2 B + an−1 AB + an−2 B,
..
.
q1 = An−1 B + an−1 An−2 B + · · · + a1 B
det(sI − A) = sn + an−1 sn−1 + · · · + a1 s + a0

Es importante subrayar que la matriz P −1 es invertible, es decir, su inversa


P siempre existe si la matriz definida en (7.53) tiene rango n [1], cap. 7, es
decir si (7.60) es controlable. Esto puede explicarse del siguiente modo. Si
la matriz definida en (7.53) tiene rango n, es decir todas sus columnas son
linealmente independientes, entonces cuando sus columnas se suman como en
las expresiones anteriores que definen a los vectores q1 , . . . , qn−2 , qn−1 , qn , las
columnas q1 , . . . , qn−2 , qn−1 , qn resultan ser linealmente independientes. Esto
426 7 La técnica de las variables de estado

significa que el determinante de P −1 es diferente de cero y, por tanto, su


inversa P existe. Usando (7.76) en (7.60), es decir x̄˙ = P ẋ, se obtiene:
x̄˙ = Āx̄ + B̄u
y = C̄ x̄
Ā = P AP −1 , B̄ = P B, C̄ = CP −1 (7.78)
La matriz Ā y los vectores B̄, C̄ en (7.78) están dados como en la forma
canónica de controlabilidad (7.75) sin importar la forma que tengan A, B y
C mientras la matriz definida en (7.53) tenga rango n. La demostración de
esta última afirmación requiere de herramientas matemáticas que están fuera
del alcance de este libro y por ello no se presenta. Se recomienda consultar la
referencia [1] para una solución completa de este problema. El lector puede
verificar estas ideas proponiendo valores numéricos para las matrices A, B, C
y realizando los cálculos correspondientes. Esto significa que cada una de las
ecuaciones dinámicas (7.60) y (7.75) puede ser obtenida a partir de la otra y
que la relación entre las matrices involucradas está dada por (7.78), es decir,
que ambas son equivalentes. Nótese que la condición fundamental para que
exista esta equivalencia es que la matriz definida en (7.53) tenga rango n [1],
cap 5. Esto se resume del siguiente modo:
Teorema 7.4 ([1], cap. 7) Si (7.60) es controlable, entonces esta ecuación
dinámica es equivalente a (7.75) mediante la transformación lineal (7.76),
(7.77), es decir, a través de (7.78).
Ejemplo 7.6 En el capı́tulo 13 se obtiene la aproximación lineal de un me-
canismo conocido como el péndulo de Furuta. Este modelo se presenta en
(13.13), (13.14), y a continuación se reescribe para facilitar la referencia:
ż = Az + Bv (7.79)
   
01 0 0 0
0 0 −gm21 l12 L0 J1 +m1 l12
 I0 (J1 +m1 l12 )+J1 m1 L20
0

 2 2
k
 m
A= , B =  I0 (J1 +m1 l1 )+J1 m1 L0 
 0 0 0 1  0  ra
(I0 +m1 L20 )m1 l1 g −m1 l1 L0
0 0 I0 (J1 +m1 l2 )+J1 m1 L2 0 I0 (J1 +m1 l12 )+J1 m1 L20
1 0

Para facilitar la manipulación algebraica se definen las siguientes constantes:


−gm21 l12 L0 (I0 + m1 L20 )m1 l1 g
a= 2 2 , b=
I0 (J1 + m1 l1 ) + J1 m1 L0 I0 (J1 + m1 l12 ) + J1 m1 L20
J1 + m1 l12 km −m1 l1 L0 km
c= 2 2 , d= 2 2
I0 (J1 + m1 l1 ) + J1 m1 L0 ra I0 (J1 + m1 l1 ) + J1 m1 L0 ra
La siguiente matriz tiene la forma:
 
0 c 0 ad
£ ¤  c 0 ad 0 
Co = B AB A2 B A3 B = 
0

d 0 bd 
d 0 bd 0
7.9 Ecuaciones dinámicas equivalentes 427

Después de un desarrollo algebraico sencillo, aunque laborioso, se obtiene:


m41 l14 L20 g 2 4
km
det(Co ) = 2 2 6= 0 (7.80)
[I0 (J1 + m1 l1 ) + J1 m1 L0 ] ra4
4

Por tanto, la ecuación dinámica en (7.79) es controlable para cualquier con-


junto de parámetros del péndulo de Furuta. Es decir, este resultado no cambia
si el mecanismo con el que se cuenta es grande o pequeño o si es ligero o pe-
sado. Esto significa que la matriz P introducida en (7.76) es no singular y a
continuación es construida utilizando la fórmula presentada en (7.77). Para
simplificar los cálculos se utilizarán los siguientes valores numéricos:
2 2 2
I0 = 1.137 × 10−3 [kgm ], J1 = 0.38672 × 10−3 [kgm ], g = 9.81[m/s ]
km
l1 = 0.1875[m], m1 = 0.033[kg], L0 = 0.235[m], = 0.0215[Nm/V]
ra
que corresponden a los parámetros del péndulo de Furuta que es construido y
controlado en el capı́tulo 13. Con estos valores se encuentra:
   
01 0 0 0
 0 0 −35.81 0   
A=  , B =  13.4684 
0 0 0 1  0 
0 0 72.90 0 −12.6603
Con estos datos, y calculando numéricamente, se encuentra que las raı́ces del
polinomio det(λI − A) son:

λ1 = 0, λ2 = 0, λ3 = 8.5381, λ4 = −8.5381

Entonces se realiza el producto:

(λ − λ1 )(λ − λ2 )(λ − λ3 )(λ − λ4 ) = λ4 + a3 λ3 + a2 λ2 + a1 λ + a0

de donde se encuentra, al igualar coeficientes:

a3 = 0, a2 = −72.8992, a1 = 0, a0 = 0 (7.81)

Usando estos valores en (7.77) se encuentra:


 
−527.8686 0 13.4600 0
 0 −527.8686 0 13.4600 
P −1 =  −0.0101


0 −12.6600 0
0 −0.0101 0 −12.6600
y, por tanto:
 
−0.0019 0 −0.0020 0
 0 −0.0019 0 −0.0020 
P =
 0.0000

 (7.82)
0 −0.0790 0
0 0.0000 0 −0.0790
428 7 La técnica de las variables de estado

Finalmente, con el fin de comprobar las expresiones en (7.78) se realizan los


siguientes productos:
   
0 1.0000 0 0 0
 0.0008 0 1.0000 0   
P AP −1 =  , PB = 0
 0 0 0 1.0000  0
0.0583 0 72.8992 0 1

Nótese que, una vez que se identifican y eliminan algunos errores numéricos,
estas matrices tienen exactamente la forma presentada en (7.75) para Ā =
P AP −1 y B̄ = P B.

7.10. Control por realimentación del estado

Considere la ecuación de estado de una entrada una salida presentada en


(7.60) en lazo cerrado con el siguiente controlador:

u = −Kx = −(k1 x1 + k2 x2 + . . . + kn xn ) (7.83)


£ ¤
K = k1 k2 . . . kn

donde ki , i = 1, . . . , n, son n escalares constantes. Sustituyendo (7.83) en


(7.60) se obtiene:

ẋ = (A − BK)x (7.84)

Al igual que (7.49), la ecuación dinámica en (7.84) no tiene entrada. Por tanto,
el criterio de estabilidad establecido para (7.49) es aplicable a (7.84). Esto sig-
nifica que el vector x(t) solución de (7.84) satisface lı́mt→∞ x(t) = 0 si y sólo
si todos los eigenvalores de la matriz A − BK tienen parte real estrictamente
negativa. Sin embargo, desde el punto de vista de una aplicación práctica ésto
no es suficiente debido a que, además, se requiere un buen desempeño del
sistema en lazo cerrado. Es importante subrayar que la forma de la respuesta
x(t) de la ecuación en (7.84) depende de la ubicación de los eigenvalores de
A − BK. Por tanto, los eigenvalores de la matriz A − BK deben poder ser
asignados en donde se desee. Esto se indica diciendo que tales eigenvalores de-
ben poder ser asignados arbitrariamente. Dado que el vector renglón K puede
seleccionarse a voluntad, es de interés saber cómo seleccionar K de manera
que los eigenvalores de A − BK queden asignados en donde se especifique. A
continuación se presenta la solución a este problema.
Considere la transformación lineal (7.76), (7.77) y sustitúyala en (7.84)
para obtener:

x̄˙ = Āx̄ − B̄ K̄ x̄ (7.85)


K̄ = KP −1
7.10 Control por realimentación del estado 429

con Ā y B̄ dados como en (7.78) y (7.75). Nótese que K̄ x̄ es un escalar dado


como:

K̄ x̄ = k̄1 x̄1 + k̄2 x̄2 + . . . + k̄n x̄n ,


£ ¤
K̄ = k̄1 k̄2 . . . k̄n

que, de acuerdo a (7.75), sólo afecta el último renglón de (7.85) la cual, por
tanto, puede escribirse como:

x̄˙ = (Ā − B̄ K̄)x̄,


Ā − B̄ K̄ =
 
0 1 0 0 ··· 0 0
 0 0 1 0 ··· 0 0 
 
 0 0 0 1 ··· 0 0 
 
 0 0 0 0 ··· 0 0 
 
 .. .. .. .. .. .. .. 
 . . . . . . . 
 
 0 0 0 0 ··· 0 1 
−k̄1 − a0 −k̄2 − a1 −k̄3 − a2 −k̄4 − a3 · · · −k̄n−1 − an−2 −k̄n − an−1

Entonces, si se selecciona:
£ ¤
K̄ = ā0 − a0 ā1 − a1 . . . ān−1 − an−1 (7.86)

se consigue:
 
0 1 0 0 ··· 0 0
 0 0 1 0 ··· 0  0
 
 0 0 0 1 ··· 0  0
 
 0 0 0 0 ··· 0  0
Ā − B̄ K̄ =  
 .. .. .. .. .. ..  ..
 . . . . . .  .
 
 0 0 0 0 ··· 0 1 
−ā0 −ā1 −ā2 −ā3 · · · −ān−2 −ān−1

Nótese que de acuerdo a (7.78) y (7.85) se puede escribir:

Ā − B̄ K̄ = P AP −1 − P BKP −1 = P (A − BK)P −1 (7.87)

Es decir, las matrices Ā − B̄ K̄ y A − BK satisfacen (7.38) por lo que ambas


tienen los mismos eigenvalores. De acuerdo a lo visto en las secciones previas,
los eigenvalores λ de Ā − B̄ K̄ satisfacen:

det(λI − [Ā − B̄ K̄]) = λn + ān−1 λn−1 + · · · + ā1 λ + ā0


Yn
= (λ − λ̄i )
i=1
430 7 La técnica de las variables de estado

donde λ̄i , i = 1, . . . , n son los eigenvalores deseados y se proponen a voluntad


del diseñador. Debe tenerse el cuidado de que todos los eigenvalores deseados
complejos aparezcan con sus parejas conjugadas para asegurar que todos los
coeficientes āi , i = 0, 1, . . . , n − 1 sean reales lo cual, a su vez, asegura que las
ganancias K̄ y K sean reales. A continuación se resume el procedimiento [1],
cap. 7, para calcular el vector de ganancias K que asigne los eigenvalores que
se deseen a la matriz de lazo cerrado A − BK.
Encuentre el polinomio:

det(λI − A) = λn + an−1 λn−1 + · · · + a1 λ + a0

Proponga los eigenvalores deseados en lazo cerrado λ̄1 , λ̄2 , . . . , λ̄n . Si algu-
no de estos eigenvalores es complejo entonces también debe proponerse su
pareja conjugada como uno de los eigenvalores deseados.
Calcule:
n
Y
(λ − λ̄i ) = λn + ān−1 λn−1 + · · · + ā1 λ + ā0
i=1

Calcule:
£ ¤
K̄ = ā0 − a0 ā1 − a1 . . . ān−1 − an−1

Calcule los vectores q1 , . . . , qn−2 , qn−1 , qn de acuerdo a (7.77), obtenga la


matriz P −1 definida en dicha expresión y encuentre su matriz inversa P .
Calcule la matriz de ganancias del controlador en (7.83) como K = K̄P .
Ejemplo 7.7 Continuando con el ejemplo 7.6, donde se aborda el estudio del
péndulo de Furuta, ahora se desea encontrar el vector de ganancias K que, al
ser utilizado en el controlador (7.83) (con x = z), asigne en:

λ̄1 = −94, λ̄2 = −18, λ̄3 = −0.5, λ̄4 = −1

a los eigenvalores de la matriz A − BK. Para esto, utilizando los valores


anteriores se forma el siguiente polinomio:

(λ − λ̄1 )(λ − λ̄2 )(λ − λ̄3 )(λ − λ̄4 ) = λ4 + ā3 λ3 + ā2 λ2 + ā1 λ + ā0

de donde se encuentra, al igualar coeficientes:

ā3 = 113.5, ā2 = 1860.5, ā1 = 2594, ā0 = 846

Con estos valores y los obtenidos en (7.81) se calcula el vector K̄ de acuerdo


a(7.86):
£ ¤
K̄ = 846 2594 1933.3 113.5

Finalmente, usando estos valores y la matriz P mostrada en (7.82) se calcula


el vector de ganancias K de acuerdo a K = K̄P :
7.11 Observadores de estado 431
£ ¤
K = −1.5997 −4.9138 −154.4179 −14.1895

el cual, a excepción de algunos errores de redondeo, es el vector de ganancias


utilizado para controlar experimentalmente el péndulo de Furuta en el capı́tulo
13.

7.11. Observadores de estado


Como se indicó en la sección 7.1, el estado x está constituido por variables
que son internas al sistema y, por tanto, en general no se conocen y no se
pueden medir. En cambio, la salida y representa una variable que siempre se
puede medir. Esto significa que la construcción práctica de un controlador de
la forma (7.83) puede ser no posible si no se puede medir todo el estado. Por
esta razón es importante contar con una variable x b(t) que sea el estimado del
estado x(t), el cual pueda ser utilizado para construir un controlador de la
forma:

u = −K x
b = −(k1 x b1 + k2 x
b2 + . . . + kn xbn ) (7.88)
£ ¤ £ ¤T
K = k1 k2 . . . kn , xb= x b1 x
b2 . . . x
bn

El mecanismo que se utiliza para calcular el estimado x b recibe el nombre de


“observador de estado” o simplemente “observador”. Un observador debe cal-
cular x
b exclusivamente a partir de información que pueda ser medida, es decir
usando la entrada y la salida exclusivamente. Por otro lado, si el controlador
(7.88) ha de sustituir al controlador en (7.83), entonces una propiedad funda-
mental que debe satisfacer el observador a construir es que debe producir un
estimado xb que converja lo más rápido posible al valor real de x, o al menos
que lo haga de manera sintótica, es decir, que se asegure que:

lı́m x
b(t) = x(t)
t→∞

Un observador que cumple con esta caracterı́stica es el siguiente:

x
ḃ = (A − LC)b
x + Ly + Bu (7.89)

donde L = [L1 , L2 , . . . , Ln ]T es un vector columna constante. Esto puede


explicarse del siguiente modo. Defı́nase el error de estimación como x̃ = x − x
b.
Entonces, restando (7.89) a (7.60) se obtiene:

x̃˙ = Ax − (A − LC)b
x − Ly

Usando y = Cx en esta expresión:

x̃˙ = Ax̃ − LC x̃
= (A − LC)x̃
432 7 La técnica de las variables de estado

Por tanto, usando los resultados de la sección 7.5 se concluye que lı́mt→∞ x̃(t) =
0 y, por tanto, lı́mt→∞ x
b(t) = x(t) si y sólo si todos los eigenvalores de la ma-
triz A−LC tienen parte real estrictamente negativa. Ası́ que el único problema
que resta es cómo seleccionar el vector (columna) de ganancias L de manera
que todos los eigenvalores de la matriz A−LC tengan parte real estrictamente
negativa. Este problema queda resuelto del siguiente modo:
Teorema 7.5 ([1], pág. 358) Si la ecuación dinámica en (7.60) es observable,
entonces su estado puede ser estimado usando el observador en (7.89) y todos
los eigenvalores de la matriz A − LC pueden ser asignados arbitrariamente
previendo que los eigenvalores complejos aparecen con sus parejas conjugadas.
Para explicar esta afirmación es de mucha utilidad el siguiente resultado:
Teorema 7.6 ([1], pág. 195) Considere las dos ecuaciones dinámicas siguien-
tes:
ẋ = Ax + Bu (7.90)
y = Cx

ż = −AT z + C T u (7.91)
T
γ=B z
donde u, y, γ ∈ R, mientras que x, z ∈ Rn . La ecuación en (7.90) es controlable
(observable) si y sólo si la ecuación en (7.91) es observable (controlable).
Por tanto, volviendo al problema del observador, como el par (A, C) es
observable entonces el par (−AT , C T ) y, por tanto, el par (AT , C T ) son con-
trolables (porque el signo “−” de la matriz AT no afecta la independencia
lineal de las columnas de la matriz en (7.53), véase la sección 7.3). A partir de
esto se concluye que, siguiendo el procedimiento presentado en la sección 7.10,
siempre se puede encontrar un vector renglón K constante tal que la matriz
AT − C T K posee cualquier conjunto de eigenvalores deseados (eigenvalores
arbitrarios). Como los eigenvalores de una matriz son iguales a los eigenvalores
de su matriz transpuesta (véase la sección 7.3), entonces la matriz A − K T C
tiene los mismos eigenvalores que la matriz AT − C T K (los eigenvalores de-
seados). Definiendo L = K T se obtiene el vector columna de ganancias que se
necesita para diseñar el observador en (7.89).
Cabe aclarar que la idea de que todos los eigenvalores de la matriz A − LC
puedan ser asignados arbitrariamente significa que puedan ser colocados don-
de se desee según el criterio del diseñador. Obviamente todos los eigenvalores
deben tener parte real estrictamente negativa pero, además, se debe buscar
que estén colocados en lugares del plano complejo que aseguren una rápida
convergencia de x b(t) a x(t). Para decidir donde se deben colocar los eigenvalo-
res de la matriz A − LC, son de mucha utilidad los conceptos sobre respuesta
transitoria que se estudiaron en el capı́tulo 3 respecto de la ubicación de los
polos de funciones de transferencia como la presentada en (7.65).
7.12 El principio de separación 433

7.12. El principio de separación


Cuando se tiene una ecuación dinámica (planta):

ẋ = Ax + Bu (7.92)
y = Cx

y un observador:

x
ḃ = (A − LC)b
x + Ly + Bu (7.93)

y se utiliza el siguiente controlador para unirlos (véase la figura 7.5):

u = −K x
b = −(k1 x
b1 + k2 x
b2 + . . . + kn x
bn ) (7.94)

surge la pregunta de cómo se verá afectada la estabilidad del sistema en lazo


cerrado (7.92), (7.93), (7.94), es decir es importante asegurar que se aún se
cumple que lı́mt→∞ x b(t) = x(t) y que lı́mt→∞ x(t) = 0.
La respuesta a esta pregunta se conoce como el “principio de separación”
el cual establece lo siguiente:
Resultado 7.12 ([1], pág. 367) Los eigenvalores del sistema en lazo cerrado
(7.92), (7.93), (7.94), son la unión de los eigenvalores de las matrices A−BK
y A − LC.
Esto significa que los eigenvalores del observador no son afectados por
la realimentación en (7.94) y que, al menos en cuanto a los eigenvalores se
refiere, no hay diferencia entre realimentar el estimado x b(t) o el estado real
x(t). Sin embargo, se debe prevenir al lector sobre el hecho de que la respuesta
transitoria del sistema generalmente es diferente si se usa x(t) o si se usa
x
b(t) para construir la entrada. Lo importante es que se sigue cumpliendo que
lı́mt→∞ xb(t) = x(t) y lı́mt→∞ x(t) = 0. Por tanto, el diseño de las ganancias
K del controlador y el diseño de las ganancias L del observador pueden ser
realizados de manera independiente.
Ejemplo 7.8 Considere el motor de CD visto en el ejemplo 7.5, es decir,
considere la ecuación dinámica:

ẋ = Ax + Bu, y = Cx (7.95)
· ¸ · ¸ · ¸ · ¸
x1 θ 0 1 0
x= = , A= , B= nkm , C = [1 0], u = i∗
x2 θ̇ 0 − Jb J

donde se considera que la salida es la posición mientras que la velocidad no


se puede medir y, por tanto, deberá ser estimada usando un observador de
estado. Suponga que se desea controlar el motor para que alcance una posición
constante, es decir, los valores deseados de posición y de velocidad son:

x1d = θd , x2d = 0
434 7 La técnica de las variables de estado

u y
planta

observador

c
x
àK

Figura 7.5. Sistema realimentado usando un observador para estimar el estado.

donde θd es una constante que representa la posición deseada y la velocidad


deseada es cero porque la posición deseada es constante. Definiendo las varia-
bles de estado:

x̃1 = x1 − x1d , x̃2 = x2

y calculando x̃˙ 1 = ẋ1 − ẋ1d = x2 = x̃2 y x̃˙ 2 = ẋ2 = θ̈ se obtiene la ecuación


dinámica:

x̃˙ = Ax̃ + Bu, (7.96)


γ = C x̃

donde γ es la nueva salida y la matriz A y los vectores B y C están definidos


como en (7.95). Nótese que la salida medida ahora es el error de posición
γ = x̃1 . A partir de este momento se considerarán los valores numéricos del
motor controlado en el capı́tulo 10, es decir:
nkm b
k= = 675.4471, a= = 2.8681 (7.97)
J J
A continuación se muestra como diseñar el observador de estado correspon-
diente. En el ejemplo 7.5 se mostró que la ecuación dinámica en (7.95) es
observable y, por tanto, también la ecuación dinámica en (7.96). De acuerdo
al teorema 7.6, esto implica que los pares (−AT , C T ) y (AT , C T ) son contro-
lables, es decir, que las siguientes matrices tienen rango n = 2:
£ T ¤ £ T T T¤
C −AT C T , C A C

porque el signo “−” que acompaña a la matriz A no afecta la independencia


lineal de estas columnas (véase la sección 7.3). Con los valores numéricos en
(7.97) se calculan las rı́ces del polinomio det(λI − AT ):
7.12 El principio de separación 435

λ1 = 0, λ2 = −2.8681

Entonces se realiza el producto:

(λ − λ1 )(λ − λ2 ) = λ2 + a1 λ + a0

de donde se encuentra, al igualar coeficientes:

a1 = 2.8681, a0 = 0 (7.98)

Usando B = C T y AT en lugar de A, la fórmula en (7.77) se convierte en:


£ ¤
P −1 = q1 q2 ,
q2 = C T ,
q1 = AT C T + a1 C T ,

Usando los valores numéricos en (7.97) y (7.98), ası́ como la matriz A y el


vector C definidos en (7.95) se obtiene:
· ¸
2.8681 1.0000
P −1 =
1.0000 0

y, por tanto:
· ¸
0 1.0000
P = (7.99)
1.0000 −2.8681

Suponga que se desea asignar los siguientes eigenvalores para la matriz A−LC:

λ̄1 = −150, λ̄2 = −100 (7.100)

Para esto se forma el siguiente polinomio:

(λ − λ̄1 )(λ − λ̄2 ) = λ2 + ā1 λ + ā0

de donde se encuentra, al igualar coeficientes:

ā1 = 250, ā0 = 15000

Con estos valores y los obtenidos en (7.98) se calcula el vector K̄ de acuerdo


a (7.86):
£ ¤
K̄ = 15000 247

Usando estos valores y la matriz P mostrada en (7.99) se calcula el vector K,


de acuerdo a K = K̄P , y se asigna L = K T :
· ¸
247
L= (7.101)
14291
436 7 La técnica de las variables de estado

Por otro lado, siguiendo un procedimiento similar al de los ejemplos 7.13.1 y


7.13.2 se encuentra que el vector de ganancias:
£ ¤
K = 1.6889 0.0414 (7.102)

asigna en:

−15.4 + 30.06j, −15.4 − 30.06j (7.103)

a los eigenvalores de la matriz A−BK. Nótese que los valores de las ganancias
en (7.102) son iguales a las ganancias proporcional y de realimentación de ve-
locidad en el controlador diseñado y probado experimentalmente en la sección
10.2.1 del capı́tulo 10, en donde los polos de lazo cerrado se asignan en los
valores indicados en (7.103). Finalmente, debe aclararse que el observador a
construir es:

ż = (A − LC)z + Lγ + Bu (7.104)

donde z = [z1 z2 ]T es el estimado del vector x̃ = [x̃1 x2 ]T y u = i∗ . Mientras


que el controlador es:
· ¸
z
u = −K 1 (7.105)
z2

donde L y K toman los valores indicados en (7.101) y (7.102). Nótese que el


controlador debe utilizar z1 , es decir el estimado de x̃1 , a pesar de que x̃1 es
una variable que se conoce por medición. Esto es debido a que toda la teorı́a
vista hasta aquı́ supone que es todo el estado estimado el que se realimenta. En
este sentido es conveniente aclarar que también existen observadores llamados
de orden reducido, los cuales sólo estiman una parte del estado si la otra parte
es conocida. Al lector interesado en este tema se le recomienda consultar la
referencia [1].
En la figura 7.6 se muestran resultados en simulación cuando se utiliza el
observador en (7.104) y la realimentación en (7.105) junto con las ganancias
en (7.101) y (7.102) para controlar el motor cuyos parámetros se muestran en
(7.97). La posición deseada es θd = 2, las condiciones iniciales de observador
son z(0) = [0 0]T , mientras que θ(0) = 0 (es decir, x̃1 (0) = −2) y θ̇(0) = 2.
Obsérvese como los estimados z1 y z2 convergen asintóticamente a los valores
reales x̃1 y x2 . Es interesante darse cuenta de que esta convergencia es con-
seguida antes de que el motor termine de responder. Esto se ha conseguido
gracias a que los eigenvalores seleccionados para la matriz A − LC (mostrados
en (7.100)) son mucho más rápidos que los eigenvalores asignados a la matriz
A − BK (mostrados en (7.103)). Este es el criterio que normalmente se debe
utilizar para asignar los eigenvalores del observador.
7.12 El principio de separación 437

[rad]
2,5 x1

x 1d
1,5

0,5

0
0 0,1 0,2 0,3 0,4

t [ s]
(a) Posición del motor
[rad]
0,5

-0,5

-1

z1
-1,5

f
x1
-2
0 0,1 0,2 0,3 0,4

t [ s]
(b) Error de posición x̃1 y su estimado z1 .
[rad=s] 60
x2
40

20

-20

-40

z2
-60

0 0,1 0,2 0,3 0,4

t [ s]
(c) Velocidad del motor x2 y su estimado z2 .

Figura 7.6. Simulaciones. Uso del observador en (7.104) para controlar un motor
de CD.
438 7 La técnica de las variables de estado

7.13. Caso de estudio. El péndulo con rueda inercial


7.13.1. Obtención de la forma en (7.75)

En el capı́tulo 14 se obtiene la aproximación lineal de un mecanismo cono-


cido como el péndulo con rueda inercial. Este modelo se presenta en (14.32),
(14.35), y a continuación se reescribe para facilitar la referencia:

ż = Az + Bw, (7.106)
   
0 1 0 0
km
A =  d11 mg 0 0, B =  d12 
R
d21 mg 0 0 d22

Para simplificar la manipulación algebraica se definen las siguientes constan-


tes:

a = d11 mg, b = d21 mg


km km
c = d12 , d = d22
R R
La siguiente matriz tiene la forma:

£ 0c 0
¤
Co = B AB A2 B =  c 0 ac 
d 0 bc

Después de un desarrollo algebraico sencillo se obtiene:


µ ¶3
2 km
det(Co ) = (d12 ) mg(d11 d22 − d12 d21 ) 6= 0 (7.107)
R

debido a que d11 d22 − d12 d21 6= 0 es una propiedad del mecanismo, tal co-
mo se explica en el capı́tulo 14. Por tanto, la ecuación dinámica en (7.106)
es controlable para cualquier conjunto de parámetros del péndulo con rueda
inercial. Es decir, este resultado no cambia si el mecanismo con el que se cuen-
ta es grande o pequeño o si es ligero o pesado. Esto significa que la matriz P
introducida en (7.76) es no singular y a continuación es construida utilizando
la fórmula presentada en (7.77). Para simplificar los cálculos se utilizarán los
siguientes valores numéricos:

d11 = 0.0014636, d12 = 0.0000076,


d21 = 0.0000076, d22 = 0.0000076,
mg = 0.12597

donde:
· ¸ · ¸
d d 1 d22 −d12
D −1
= 11 12 =
d21 d22 d11 d22 − d12 d21 −d21 d11
7.13 Caso de estudio. El péndulo con rueda inercial 439

que corresponden a los parámetros del péndulo con rueda inercial que es cons-
truido y controlado en el capı́tulo 14. Con estos valores se encuentra:
   
0 1.0000 0 0
A =  86.5179 0 0  , B =  −1.2758 
−86.5179 0 0 245.6998

Con estos datos, y calculando numéricamente, se encuentra que las raı́ces del
polinomio det(λI − A) son:

λ1 = 0, λ2 = 9.3015, λ3 = −9.3015

Entonces se realiza el producto:

(λ − λ1 )(λ − λ2 )(λ − λ3 ) = λ3 + a2 λ2 + a1 λ + a0

de donde se encuentra, al igualar coeficientes:

a2 = 0, a1 = −86.5179, a0 = 0 (7.108)

Usando estos valores en (7.77) se encuentra:


 
0 −1.275 0
P −1 =  5.467 × 10−5 0 −1.275 
−21147.049 0 245.6998

y, por tanto:
 
0 −910.6662 −4.7287
P = 10−5 ×  −78379.7677 0 0  (7.109)
0 −78379.8067 −0.0002

Finalmente, con el fin de comprobar las expresiones en (7.78) se realizan los


siguientes productos:
   
0 1.0000 0 0
P AP −1 =  −0.0000 0 1.0000  , P B =  0 
0 86.5179 0 1

Nótese que estas matrices tienen exactamente la forma presentada en (7.75)


para Ā = P AP −1 y B̄ = P B.

7.13.2. Control por realimentación del estado

Ahora se desea encontrar el vector de ganancias K que, al ser utilizado en


el controlador (7.83) (con x = z y u = w), asigne en:

λ̄1 = −5.8535 + 17.7192j, λ̄2 = −5.8535 − 17.7192j, λ̄3 = −0.5268


440 7 La técnica de las variables de estado

a los eigenvalores de la matriz A − BK. Para esto, utilizando los valores


anteriores se forma el siguiente polinomio:

(λ − λ̄1 )(λ − λ̄2 )(λ − λ̄3 ) = λ3 + ā2 λ2 + ā1 λ + ā0

de donde se encuentra, al igualar coeficientes:

ā2 = 12.2338, ā1 = 354.4008, ā0 = 183.4494

Con estos valores y los obtenidos en (7.108) se calcula el vector K̄ de acuerdo


a (7.86):
£ ¤
K̄ = 183.44 440.91 12.23

Finalmente, usando estos valores y la matriz P mostrada en (7.109) se calcula


el vector de ganancias K de acuerdo a K = K̄P :
£ ¤
K = −345.5910 −11.2594 −0.0086

el cual, a excepción de algunos errores de redondeo, es el vector de ganancias


utilizado para controlar experimentalmente el péndulo con rueda inercial en
el capı́tulo 14.

7.14. Resumen del capı́tulo

La técnica de las variables de estado constituye la primera herramienta de


lo que hoy se conoce como control moderno. La manera de trabajar los proble-
mas en este enfoque es representando los modelos utilizando un conjunto de
ecuaciones diferenciales de primer orden que deben ser resueltas simultánea-
mente. Por tanto, el estudio se realiza de acuerdo a la respuesta en el tiempo y
se abandona el uso de la transformada de Laplace. Esta última caracterı́stica
es fundamental para permitir el estudio de sistemas no lineales, es decir, aque-
llos representados por ecuaciones diferenciales no lineales (véase el capı́tulo
14 para un ejemplo de tales aplicaciones). Recuérdese que la transformada
de Laplace no se puede utilizar cuando se tienen ecuaciones diferenciales no
lineales.
Aunque existe una equivalencia entre la representación en variables de
estado y la representación en función de transferencia, la primera es más
general. Esto se ve reflejado en el hecho de que la función de transferencia
sólo representa la parte de lo que en variables de estado es controlable y
observable de manera simultanea. Es decir, hay partes de un sistema que no
pueden ser descritas por la función de transferencia. Sin embargo, el hecho
de que un sistema sea controlable y observable simplifica mucho las tareas
de análisis y diseño de sistemas de control. De hecho, existen resultados muy
poderosos para este caso como los presentados en las secciones 7.10 y 7.11.
7.16 Ejercicios propuestos 441

Una ventaja del enfoque de las variables de estado es que con él se pue-
den resolver problemas que serı́an más elaborados si se usara el enfoque de
la función de transferencia. Dos ejemplos de esta situación son los prototipos
controlados experimentalmente en los capı́tulos 13 y 14, donde se deben con-
trolar dos variables simultaneamente: las posiciones del brazo y del péndulo
(en el capı́tulo 13) y la posición del péndulo y la velocidad de la rueda inercial
(en el capı́tulo 14). Estos problemas se complican usando el enfoque de la
función de transferencia donde sólo se puede controlar una variable: la sali-
da. Además, otra ventaja del enfoque de las variables de estado es que con
él se puede desarrollar una metodologı́a general para obtener aproximaciones
lineales de sistemas no lineales (véase la sección 7.2 y los capı́tulos 11, 13 y
14)

7.15. Preguntas de repaso

1. ¿Qué significa el hecho de que una ecuación dinámica sea controlable?


2. ¿Qué significa que una ecuación dinámica sea observable?
3. ¿Cómo verifica si una ecuación dinámica es controlable y observable?
4. ¿Qué utilidad tiene el hecho de que una ecuación dinámica sea controlable?
5. ¿Qué utilidad tiene el hecho de que una ecuación dinámica sea observable?
6. ¿Qué diferencia existe entre la salida y el estado?
7. Suponga una ecuación dinámica que es controlable y observable ¿Qué re-
lación existe entre los polos de la función de transferencia correspondiente
y los eigenvalores de la matriz A?
8. ¿Qué significa que el origen sea globalmente asintóticamente estable?
9. ¿Cuáles son las condiciones para que el origen sea globalmente asintótica-
mente estable?
10. ¿Por qué es importante que el origen del estado de una ecuación dinámica
sin entrada sea globalmente asintóticamente estable?
11. ¿Qué significa control por realimentación del estado?
12. ¿Qué es un observador de estado y para que sirve?

7.16. Ejercicios propuestos

1. Diga que entiende por estado y proponga un ejemplo de una planta o


proceso fı́sico indicando cuál es su estado.
2. ¿Cómo sabe si un sistema es controlable u observable? Una vez que sabe
esto ¿Cuál es su utilidad?
3. ¿Qué significa que el estado x = 0 sea globalmente asintóticamente estable
y cómo se asegura esto?
4. Verifique que las siguientes ecuaciones dinámicas son controlables:
442 7 La técnica de las variables de estado
   
21 3 0 £ ¤
A = 5 9 7, B = 0, C= 472
02 8 2

   
0 1 0 0 £ ¤
A =  0 −20 50  , B =  0 , C= 100
0 −5 −250 100

   
01 0 0 0
 0 0 −0.5 0   1  £ ¤
A=
0 0 0 1,
 B= 
 0 , C= 1010
0 0 50 0 −5

Calcule la matriz P definida en (7.77).


Calcule las matrices y vectores Ā = P AP −1 , B̄ = P B, C̄ = CP −1
definidos en (7.78).
Compruebe que estas matrices y vectores tienen las formas definidas
en (7.75).
Con estos resultados diga cual es la función de transferencia de la
ecuación dinámica dada.
Utilice software especializado para calcular la función de transferencia
de la ecuación dinámica dada. Verifique que este resultado y el del
inciso anterior sean iguales.
Use software especializado para simular la respuesta de la ecuación
dinámica dada y de la función de transferencia encontrada ante una
entrada escalón unitario. Grafique la salida en ambas simulaciones y
compárelas. ¿Que concluye?
5. Haga un programa de computadora que ejecute el procedimiento listado
al final de este capı́tulo para calcular el vector de ganancias K que asig-
ne los eigenvalores que se deseen a la matriz de lazo cerrado A − BK.
Utilice este programa para calcular las ganancias de los controladores por
realimentación de estado de los capı́tulos 13 y 14.
6. La siguiente expresión constituye un filtro donde y(t) es una aproximación
de la derivada respecto al tiempo de u(t).
as
Y (s) = U (s), a>0
s+a
De hecho, y(t) es conocida como la derivada “sucia” de u(t) y es muy
utilizada para estimar la velocidad y(t) en sistemas mecánicos a partir
de la posición u(t). Con el fin de construir en la práctica este filtro se
procede obtener una ecuación dinámica que lo represente. Encuentre dicha
ecuación dinámica. Recuerde que u(t) debe ser la entrada. ¿Puede usar
los conceptos de respuesta en frecuencia para elegir el valor de a?
7.16 Ejercicios propuestos 443

7. Considere el sistema ball and beam estudiado en el ejemplo 7.2 del presente
capı́tulo, junto con los siguientes valores numéricos:

k = 16.6035, a = 3.3132, ρ=5

Obtenga la ecuación dinámica correspondiente cuando el estado se


define como z̃ = [x − xd , ẋ, θ, θ̇]T y la salida es γ = x − xd , donde xd
es una constante que representa el valor deseado de la posición x.
Diseñe un controlador por realimentación de estado que permita esta-
bilizar el sistema en x = xd , ẋ = θ = θ̇ = 0. Seleccione los eigenvalores
deseados del siguiente modo. Proponga dos parejas de tiempo de su-
bida y sobre paso deseados. Usando las expresiones presentadas en
(3.59) en el capı́tulo 3, determine dos parejas de eigenvalores comple-
jos conjugados de manera que se obtengan las dos parejas de tiempo
de subida y sobre paso deseados.
Diseñe un observador de estado que permita estimar todo el estado del
sistema. Recuerde que los eigenvalores de la matriz A − LC deben ser
varias veces más rápidos que los eigenvalores de la matriz A − BK.
Construya un sistema en lazo cerrado que use el observador arriba
diseñado y un controlador que realimente el estado estimado para es-
tabilizar el sistema en x = xd , ẋ = θ = θ̇ = 0. Mediante simulaciones
verifique si se han obtenido las caracterı́sticas de respuesta transitoria
deseadas.
Referencias

1. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
2. C.R. Wylie, Matemáticas superiores para ingenierı́a, 2a. edición en español,
McGraw-Hill, México, 1994.
3. W.L. Brogan, Modern control theory, 3rd. edition, Prentice Hall, Upper Saddle
River, 1991.
4. E. Kreyszig, Matemáticas avanzadas para ingenierı́a, Vol. 1, Limusa, México,
1980.
5. M. R. Spiegel, Manual de fórmulas y tablas matemáticas., McGraw-Hill, Serie
Schaum, México, 2002.
6. C.-T. Chen, Linear system theory and design, Oxford University Press, New
York, 1999.
7. K. Ogata, Ingenierı́a de Control Moderna, 4a. edición, Pearson Prentice-Hall,
Madrid, 2003.
8. N.S. Nise, Sistemas de control para ingenierı́a, 1a. edición en español, 1a. Re-
impresión, CECSA, México, 2004.
9. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edición, Pearson
Prentice-Hall, Madrid, 2008.
8
Circuitos electrónicos realimentados

R L
R2

Q ýCC
C1
Rt
C3
CBP R1
RE C2

La primera aplicación importante de la realimentación, desde el punto de


vista tecnológico, fue el regulador de velocidad para la máquina de vapor de-
sarrollado por Watt. Sin embargo, las técnicas de control clásico surgieron
como una solución para los problemas que se presentaban en los circuitos
electrónicos de las compañı́as telefónicas. Se descubrió que si se realimentaba
una pequeña cantidad de la señal a la salida de un amplificador electrónico
entonces se podı́a disminuir la distorsión que producı́a dicho amplificador. Las
técnicas de control clásico también demostraron ser fundamentales para di-
señar circuitos que, realimentados, son capaces de producir señales con forma
de onda sinusoidal como el oscilador Colpitts mostrado en la figura.
448 8 Circuitos electrónicos realimentados

Objetivos del capı́tulo

Usar la realimentación para reducir la distorsión producida por circuitos


electrónicos no lineales.
Construir controladores analógicos usando circuitos electrónicos realimen-
tados.
Diseñar y construir osciladores de audiofrecuencia y de radiofrecuencia
con forma de onda sinusoidal.
En este capı́tulo se presentan algunas aplicaciones de los sistemas reali-
mentados al diseño de circuitos electrónicos. Algunas de estas aplicaciones
serán utilizadas en el diseño de otros sistemas de control que se presentan en
los capı́tulos subsecuentes. Por otro lado, algunas de estas aplicaciones, como
los circuitos osciladores, son en sı́ mismas sistemas de control completos que
requieren el empleo de los conceptos de teorı́a de control vistos en la capı́tulos
precedentes.

8.1. Circuitos electrónicos para reducir no linealidades

R ( s) + C ( s)
A
à

Figura 8.1. Sistema en lazo cerrado.

Considere el sistema en lazo cerrado mostrado en la figura 8.1. La corres-


pondiente función de transferencia es:
R(s) A
=
C(s) 1 + βA
donde A y β son constantes positivas. Suponga que βA ≫ 1, entonces se puede
escribir:
R(s) A 1
= ≈ (8.1)
C(s) 1 + βA β
Las aplicaciones de este hecho son importantes en circuitos electrónicos reali-
mentados como se explica a continuación.
8.1 Circuitos electrónicos para reducir no linealidades 449

Suponga que A es la ganancia de un amplificador de potencia. Tal como


su nombre lo indica, este tipo de amplificadores normalmente están construi-
dos de manera que tengan la capacidad para manejar altas potencias. Esto
significa que sus componentes deberán soportar, entre otras cosas, grandes
variaciones de temperatura. Por esta razón, es común que estos componentes
no sean de gran precisión y es de esperarse que el valor de sus parámetros
cambien en un amplio rango. Por tanto, suponer que el valor de A está sujeto
a cambios es algo que seguramente ocurre en la realidad. De acuerdo a (8.1)
el uso de realimentación alrededor de un amplificador de ganancia A tiene
la ventaja de conseguir que la ganancia del circuito realimentado sólo ten-
ga variaciones muy pequeñas a pesar de que A presente grandes variaciones.
Por tanto, la realimentación puede resolver el problema de un amplificador
de potencia cuya ganancia varia fuertemente. Un aspecto importante es que
la ganancia β no tenga variaciones y esto se consigue si tal ganancia es fijada
por componentes que sólo manejan pequeñas cantidades de potencia y, por
tanto, que puedan ser seleccionados como dispositivos de precisión.
A continuación se presentan algunas aplicaciones donde se usa la reali-
mentación para reducir las variaciones de las ganancias de algunos circuitos
electrónicos, lo cual también puede entenderse como la reducción del compor-
tamiento no lineal de dichas ganancias.

8.1.1. Reducción de la distorsión en amplificadores

Vi + u Vo
Preamplificador Amplificador
no lineal
à

Figura 8.2. Uso de realimentación en un amplificador no lineal para reducir la


distorsión.

Considere el diagrama mostrado en la figura 8.2. El amplificador no lineal


es un amplificador que tiene una ganancia A1 = 2 cuando el voltaje de entrada
u es negativo y una ganancia A2 = 0.5 cuando el voltaje de entrada u es
positivo. Esta caracterı́stica puede representarse como se muestra en la figura
8.3. Por tanto, dicho amplificador entrega a su salida una versión distorsionada
de lo que se aplica a su entrada. En la figura 8.4 se muestra la señal a la salida
del amplificador no lineal cuando se aplica a su entrada una señal sinusoidal.
Este es un buen ejemplo de lo que se quiere decir cuando se habla de distorsión.
450 8 Circuitos electrónicos realimentados

Vo

0:5

u
2

Figura 8.3. Caracterı́stica del amplificador no lineal en la figura 8.2.

Combinando el efecto de todos los amplificadores en el trayecto directo se


concluye que el diagrama de bloques de la figura 8.2 se puede representar por
un diagrama de bloques como el de la figura 8.1 donde:

A = A1 A0 , u < 0,
A = A2 A0 , u > 0,
β = 1, por ejemplo

A0 es la ganancia del preamplificador y tiene un valor muy grande. Nótese


que se obtiene la siguiente función de transferencia de lazo cerrado:

R(s) A 1
= ≈ =1
C(s) 1 + βA β

si las ganancias A0 y β son tales que βA ≫ 1 para ambos valores A1 , A2 .


De esta manera el circuito en lazo cerrado de la figura 8.2 funciona como
un amplificador de ganancia constante β para ambos signos de la señal que
se desea amplificar. Esto significa que se ha eliminado la distorsión debida
al amplificador no lineal de ganancias A1 y A2 . Esto representa la principal
ventaja de usar la realimentación mostrada en la figura 8.2 a pesar de que
se haya tenido que cambiar la ganancia total del amplificador que ahora es
1/β = 1. En la figura 8.5 se muestra la forma de onda obtenida Vo a la salida
del del sistema realimentado de la figura 8.2 cuando Vi es una señal sinusoidal.
Observe como es que Vo tiene amplitudes iguales en ambos semiciclos cuando
un amplificador no lineal (de ganancia A) se encuentra inmerso en el sistema
realimentado. A esto se le llama eliminación o reducción de la distorsión.
8.1 Circuitos electrónicos para reducir no linealidades 451

t
u

Vo

Figura 8.4. Voltajes a la entrada u y a la salida Vo del amplificador no lineal de la


figura 8.3.

V i; V o

Figura 8.5. Voltajes de entrada Vi y de salida Vo en la figura 8.2.

8.1.2. Reducción de la zona muerta en amplificadores.

En la figura 8.6 se muestra un amplificador de potencia en base a dos tran-


sistores conectados en simetrı́a complementaria. Este circuito tiene una zona
muerta entre −0.6[V] y +0.6 [V] debido al voltaje de polarización requerido
en las uniones base-emisor de los transistores. Esto significa que la señal de
salida Vo se mantiene en cero mientras la señal de entrada u se mantenga
en el rango [−0.6, +0.6][V]. En la figura 8.7 se muestra la caracterı́stica que
representa a este amplificador no lineal. En la figura 8.8 se muestra la señal
obtenida a la salida del amplificador Vo cuando se aplica una señal sinusoidal
a la entrada u. Nótese el efecto que la zona muerta tiene para valores de u
cercanos a cero. El circuito de la figura 8.9 se utiliza para reducir el efecto de
dicha zona muerta. El objetivo es conseguir que la forma de onda obtenida a la
salida Vo sea idéntica, o muy parecida, a la forma de onda de la señal aplicada
Vi , tal como se muestra en la figura 8.10 y, de este modo, reducir fuertemente
452 8 Circuitos electrónicos realimentados

+ V cc

u Vo

à V cc
Figura 8.6. Transistores conectados en simetrı́a complementaria. Ejemplo de un
amplificador de potencia no lineal.

Vo

1
à 0:6

1 + 0:6 u

Figura 8.7. Caracterı́stica del amplificador no lineal de la figura 8.6.

o eliminar el efecto de la zona muerta gracias al uso de realimentación. A


continuación se explica como es que se consigue esto.
El circuito de la figura 8.9 se puede representar por el diagrama de bloques
de la figura 8.1. Este sistema realimentado tiene un función de transferencia
en lazo cerrado dada como:
R(s) A
= , R(s) = Vo (s), C(s) = Vi (s)
C(s) 1 + βA
R1
β= ≤1
R1 + R2
8.1 Circuitos electrónicos para reducir no linealidades 453

Vo
t

Figura 8.8. Voltajes a la entrada u y a la salida Vo del amplificador de la figura


8.6.

+ V cc

Vi
+ u Vo
à

à V cc

R2
R1

Figura 8.9. Circuito realimentado para reducir el efecto de la no linealidad presente


en el amplificador de la figura 8.6.

donde A = αA0 , con A0 la ganancia de lazo abierto del amplificador operacio-


nal utilizado para realizar el punto de suma y α la ganancia de la caracterı́stica
mostrada en la figura 8.7 (zona muerta). Es bien sabido que A0 tiene un valor
muy grande, del orden de 100 000, mientas que α tiene un valor que, aunque
variable, es del orden de la unidad. Por tanto, βA = αA0 β ≫ 1 y se puede
aproximar, con poco margen de error a:
Vo (s) A 1
= ≈ (8.2)
Vi (s) 1 + βA β
454 8 Circuitos electrónicos realimentados

V i; V o

Figura 8.10. Voltajes a la entrada Vi y a la salida Vo del circuito de la figura 8.9.

La expresión (8.2) indica que el circuito completo se comporta como un ampli-


ficador de ganancia constante 1/β que elimina o reduce fuertemente el efecto
de la zona muerta de modo que la forma de onda de Vo is igual a la de Vi .
Nótese que R1 y R2 se pueden seleccionar de valor grande para asegurar
que manejen poca corriente (poca potencia) por lo que pueden usarse resis-
tencias de precisión. También es importante aclarar lo siguiente. De acuerdo a
la figura 8.7 el valor de α es cero para valores de u en el rango [−0.6, +0.6][V].
Esto sugiere que la condición βA = αA0 β ≫ 1 no se cumple. Sin embargo,
debe entenderse que la caracterı́stica mostrada en la figura 8.7 es una ideali-
zación de lo que realmente sucede en la práctica y que en la realidad Vo sólo
es cero cuando u también es cero.
En la figura 8.11 se muestran los voltajes u y Vo correspondientes a la
figura 8.6 obtenidos durante un experimento. Se utilizan los transistores tipo
Darlington TIP 141 (NPN) y TIP 145 (PNP). Esto significa que el voltaje de
unión base-emisor tiene un voltaje nominal de polarización directa de alrede-
dor de 1.2[V] y, por tanto, la zona muerta en este caso está en el intervalo
[-1.2,+1.2][V] del voltaje de entrada u. El voltaje u es una señal sinusoidal
de 2.083[KHz] de 1[V] de pico. Esto sitúa al voltaje de la unión base-emisor
claramente por debajo de su valor de polarización directa. Es importante men-
cionar que se conecta una resistencia de carga de 1[KOhm] entre los emisores
y tierra. Nótese que el voltaje Vo tiene una forma de onda muy distinta a
una sinusoide (compare con el trazo punteado en la figura 8.8), por lo que se
confirma experimentalmente que la conexión en simetrı́a complementaria de
dos transistores distorsiona fuertemente la señal.
En la figura 8.12 se muestran las formas de onda de las señales Vi y Vo
correspondientes a la figura 8.9. Estas mediciones se obtuvieron en un expe-
rimento donde se utilizan los transistores tipo Darlington TIP 141 (NPN) y
TIP 145 (PNP) y el voltaje Vi es una señal sinusoidal de 2.083[KHz] de 1[V]
de pico, es decir, como en el experimento de la figura 8.11. También se utilizan
los valores de resistencia R1 = R2 = 10[KOhm] y una resistencia de carga de
1[KOhm] entre los emisores y tierra. El amplificador operacional utilizado es
el TL081. Nótese que la forma de onda de Vo es como la de Vi , es decir, ambas
son sinusoides de la misma frecuencia, aunque la amplitud de Vo es el doble
8.1 Circuitos electrónicos para reducir no linealidades 455

que la de Vi . Esto se debe a que, de acuerdo (8.2) se tiene que:

Vo (s) 1 R1
= = 2, β= = 0.5
Vi (s) β R1 + R2

Figura 8.11. Resultados experimentales. Voltajes a la entrada y a la salida del


circuito de la figura 8.6. Trazo superior: Vo , trazo inferior: u.

Figura 8.12. Resultados experimentales. Voltajes a la entrada y a la salida del


circuito de la figura 8.9. Trazo superior: Vo , trazo inferior: Vi .
456 8 Circuitos electrónicos realimentados

Para el estudio de otras aplicaciones de la realimentación en circuitos elec-


trónicos se recomienda consultar [1].

8.2. Construcción analógica de controladores

Z2 (s)
V 1 (s)
Z1 (s)
E i (s)
E o (s)

Figura 8.13. Construcción de un controlador analógico usando un amplificador


operacional.

Considere el circuito de la figura 8.13 donde Z1 (s) y Z2 (s) representan las


impedancias de dos redes pasivas colocadas en esos lugares. En el amplificador
operacional se cumple:

Eo (s) = (0 − V1 (s))A0 = −V1 (s)A0 (8.3)

donde A0 es la ganancia de lazo abierto del amplificador operacional la cual


es muy grande (del orden de 100 000 [2], pág. 500). Para calcular el valor de
V1 se usan los circuitos auxiliares mostrados en las figuras 8.14(a) y 8.14(b).
De aquı́ se encuentra que:
Z1 (s)
V1 (s) = (Eo (s) − Ei (s)) + Ei (s)
Z1 (s) + Z2 (s)
µ ¶
Z1 (s) Z1 (s)
= Eo (s) + Ei (s) 1 −
Z1 (s) + Z2 (s) Z1 (s) + Z2 (s)
Usando (8.3) se encuentra:
· µ ¶¸
Z1 (s) Z1 (s)
Eo (s) = − Eo (s) + Ei (s) 1 − A0
Z1 (s) + Z2 (s) Z1 (s) + Z2 (s)
de donde se obtiene:
³ ´
Z1 (s)
Eo (s) −A0 1 − Z1 (s)+Z2 (s)
= Z1 (s)
Ei (s) 1 + A0 Z1 (s)+Z 2 (s)
8.2 Construcción analógica de controladores 457

Z2 (s)

V Z1 (s) Z1 (s)

E o (s) V 1 (s)

E i (s)

(a)

Z2 (s)

E o (s) à E i (s) V Z1 (s) Z1 (s)

(b)

Figura 8.14. Circuitos equivalentes del circuito mostrado en la figura 8.13

Reduciendo términos:
³ ´
Z2 (s)
Eo (s) −A0 Z1 (s)+Z2 (s)
= Z1 (s)
Ei (s) 1 + A0 Z1 (s)+Z 2 (s)

Z1 (s)
Se puede considerar que A0 Z1 (s)+Z 2 (s)
≫ 1, debido a que A0 es muy grande,
y por tanto:
Eo (s) Z2 (s)
=− (8.4)
Ei (s) Z1 (s)
Z1 (s)
Nótese, sin embargo, que el cumplimiento de la condición A0 Z1 (s)+Z 2 (s)
≫1
depende del valor de A0 . Es importante mencionar que en los amplificadores
operacionales que se usan en la práctica, la ganancia A0 no es constante sino
que varia con la frecuencia de las señales que está procesando el amplificador
operacional. Es común que A0 disminuya al aumentar dicha frecuencia del
mismo modo en que varı́a la caracterı́stica de magnitud de un filtro pasa
Z1 (s)
bajas [2], pág. 500. Como consecuencia, la condición A0 Z1 (s)+Z 2 (s)
≫ 1 y
(8.4) dejan de ser ciertas a altas frecuencias. Por otro lado, la manera en que
varı́a A0 con la frecuencia depende del amplificador operacional utilizado. Esto
significa que se debe tener cuidado de seleccionar el amplificador operacional
458 8 Circuitos electrónicos realimentados

correcto de acuerdo al tipo de aplicación en cuestión, es decir, de acuerdo a


la rapidez de respuesta de la planta o sistema a controlar.
En la tabla 8.1 se muestran algunos ejemplos de redes usadas para formar
Z1 (s) y Z2 (s), ası́ como el controlador analógico que puede ser construido al
utilizarlas. Se deja como ejercicio que el lector calcule los valores de Z1 (s) y
Z2 (s) para cada una de las redes eléctricas mostradas y que verifique, usando
(8.4), que se obtiene la función de transferencia del controlador mostrado en
la columna del extremo derecho de la figura. Entiéndase con esto la mane-
ra de construir prácticamente y de manera analógica una gran parte de los
controladores que se utilizan en control clásico. Véase [3] para una tabla más
completa que incluye controladores adicionales. Se aclara que, sin embargo,
estos mismos controladores pueden ser construidos usando una computadora
digital o un microcontrolador si no se desea utilizar electrónica analógica.

Tabla 8.1. Construcción analógica de controladores.


2 (s)
Controlador Z1 (s) Z2 (s) −Z
Z1 (s)
³ ´
R2 , C s+ R 1C
PI R1 −R2 2
en serie R1 s

R1 , C ³ ´
PD R2 −R2 C s + R11C
en paralelo ·³ ¸
R1 , C1 R2 , C2 ´ 1
PID − R 2
+ C1
+ R2 C1 s + R1 C2
en paralelo en serie R1
³
C2
´
s
1
R1 , C1 R2 , C2 s+
Red de adelanto −C 1 ³ R C
1 1´
, R1 C1 > R2 C2
en paralelo en paralelo C2 s+ 1
R2 C2

8.3. Diseño de osciladores con forma de onda sinusoidal


El propósito de esta sección es mostrar como se puede usar la teorı́a de
control para diseñar circuitos electrónicos realimentados que generen señales
con forma de onda sinusoidal. Se presenta un diseño basado en un amplificador
operacional y un diseño basado en un transistor.
El circuito que se propone usando amplificadores operacionales simplifica
enormemente el análisis y el diseño, además es muy útil para trabajar a fre-
cuencias bajas ya que evita el uso de inductancias. Es importante subrayar
que el valor de las inductancias que se necesitan para generar oscilaciones de
baja frecuencia es tan grande que el tamaño geométrico de la inductancia se
convierte en un problema. La principal desventaja de este diseño es que no es
útil para trabajar en altas frecuencias (en la banda de radiofrecuencia) debido
a las limitaciones de operación de los amplificadores operacionales.
Por otro lado, el uso de transistores tiene la caracterı́stica de que la impe-
dancia del circuito de entrada se ve reflejada en el circuito de salida. Esto hace
8.3 Diseño de osciladores con forma de onda sinusoidal 459

un poco más elaborado el análisis y diseño simplemente porque la obtención


de las funciones de transferencia involucradas ahora require de más desarrollos
algebraicos. Sin embargo, la principal ventaja de usar transistores es que se
puede construir osciladores que trabajan a altas frecuencias, es decir, en la
banda de radiofrecuencia. También resulta interesante el uso de transistores
por la siguiente situación. Tal como se muestra en lo que resta de esta sección,
cuando se usan amplificadores operacionales el circuito resultante es comple-
tamente lineal y se debe introducir, de manera artificial, un elemento no lineal
para conseguir la construcción práctica del oscilador. Por el contrario, dado
que el transistor es un dispositivo no lineal es precisamente ésta caracterı́stica
la que permite, de manera natural, el correcto funcionamiento del oscilador.

8.3.1. Diseño basado en un amplificador operacional. Puente de


Wien
Considere el circuito mostrado en la figura 8.15. En el ejemplo 2.16 del
capı́tulo 2, se encontró que la relación entre los voltajes Eo (s) y Ei (s) está da-
da en (2.143), expresión que se reescribe a continuación para facilitar la refe-
rencia:

I(s) R C
+ +

E i (s) C R E o (s)

à à

Figura 8.15. Circuito RC serie-paralelo.

Eo (s) Ts
= GT (s) = 2 2 , T = RC (8.5)
Ei (s) T s + 3T s + 1
Ahora considere el circuito de la figura 8.16 donde se introduce un amplificador
no inversor a base de un amplificador operacional. Siguiendo el procedimiento
presentado en la sección 8.2 se encuentra que la ganancia del circuito de la
figura 8.17 es constante e igual a:

R1 + Rf Vo
A= =
R1 Vi
Nótese que que a partir de este circuito se puede obtener el diagrama de blo-
ques mostrado en la figura 8.18(a) de donde se obtiene el diagrama de bloques
460 8 Circuitos electrónicos realimentados

C R

Vo
R Vi C
Rf
R1

Figura 8.16. Circuito oscilador en base a un amplificador operacional.

Vi
Vo

Rf
R1

Figura 8.17. Amplificador no inversor.

de la figura 8.18(b). Es importante observar que de acuerdo a estos diagramas


de bloques el circuito de la figura 8.16 es un circuito con realimentación posi-
tiva. Dado que toda la teorı́a desarrollada en sistemas de control esta hecha
pensando en que se diseñarán sistemas de control con realimentación negativa
como el mostrado en la figura 8.18(d) es necesario transformar el diagrama de
bloques de la figura 8.18(b) en una forma más conveniente. Ésto se consigue
en la figura 8.18(c) donde se introduce un signo negativo en la realimentación
que se ve compensado con un cambio de signo en la función de transferencia
de trayecto directo. Esto significa que ahora se cuenta con un sistema con
realimentación negativa que es equivalente al de la figura 8.18(b) y al de la
figura 8.18(d). Por tanto, la función de transferencia de lazo abierto está dada
8.3 Diseño de osciladores con forma de onda sinusoidal 461

como:

G(s)H(s) = −GT (s)A (8.6)

0 + E i ( s) E o ( s)
Circuito RC
serie à paralelo
+

Amplificador
Vo no inversor Vi

(a)
0 + E i ( s) E o ( s)
G T (s)
+

R f +R 1
R1
Vo Vi
(b)

0 + à E i ( s) E o ( s)
àG T (s)
à

R f +R 1
R1
Vo Vi
(c)
R (s) C(s)
G (s)
+ à
H (s)

(d)

Figura 8.18. Diagramas de bloques equivalentes del circuito en la figura 8.16.


462 8 Circuitos electrónicos realimentados

Análisis basado en la respuesta en el tiempo

Este método se refiere al estudio del circuito a través de localizar la ubi-


cación de sus polos. A partir del estudio sobre ecuaciones diferenciales en el
capı́tulo 3 se sabe que para tener oscilaciones sostenidas los polos de lazo
cerrado deben ser imaginarios puros, es decir, con parte real cero y parte ima-
ginaria diferente de cero. Bajo esta situación, la frecuencia de oscilación, en
radianes/segundo, es igual a la parte imaginaria de dichos polos.
Se sabe que los polos de lazo cerrado satisfacen:

1 + G(s)H(s) = 0

Sustituyendo las ecuaciones (8.6) y (8.5) se obtiene:

T As
1 + G(s)H(s) = 1 − GT (s)A = 1 −
T 2 s2 + 3T s + 1
T 2 s2 + 3T s + 1 − T As
= =0
T 2 s2 + 3T s + 1
y, por tanto, los polos de lazo cerrado satisfacen:

T 2 s2 + (3 − A)T s + 1 = 0

Los polos de lazo cerrado son las raı́ces del polinomio del lado izquierdo, es
decir:
p
−(3 − A)T + (3 − A)2 T 2 − 4T 2
s1 = 2
p2T
−(3 − A)T − (3 − A)2 T 2 − 4T 2
s2 =
2T 2
Nótese lo siguiente:
Ambos polos tienen parte imaginaria diferente de cero y, por tanto, el
circuito presentará oscilaciones si:

(3 − A)2 T 2 − 4T 2 < 0

es decir, si 5 > A > 1.


Si A > 3, entonces ambos polos tienen parte real positiva, es decir, el
circuito es inestable lo cual es altamente indeseable.
Si A < 3, entonces ambos polos tienen parte real negativa, es decir, el
circuito es estable. Esto, sin embargo, tampoco es deseable porque la res-
puesta del circuito será tal que poco a poco dejará de oscilar.
Si A = 3, entonces los dos polos tienen parte real cero y, por tanto, son
imaginarios puros, tal como se desea. Estos polos están ubicados en s1,2 =
±j T1 . Por tanto, la frecuencia de oscilación es ω = T1 = RC
1
.
8.3 Diseño de osciladores con forma de onda sinusoidal 463

Análisis basado en la respuesta en la frecuencia

Introdúzcase el cambio de variable s = jω en (8.5):

jT ω
GT (jω) =
T 2 (jω)2 + 3jT ω + 1

Evaluando en la frecuencia ω = 1/T = 1/(RC) se obtiene:


1
GT (j/T ) =
3
Para obtener la gráfica de Bode de GT (s) se reescribe:
1
T2
GT (s) = T s 3 1 (8.7)
s2 + Ts + T2

La gráfica de Bode de GT (s) se muestra en la figura 8.19. La magnitud de


GT (jω) es máxima (e igual a 13 ) en la frecuencia ω = 1/T = 1/(RC), justo
cuando la fase de GT (jω) es cero.

ii)
dB 1

0 1 T
!
iv)
i)
iii)

1
T
fase + 90 ii)
[grados] !
0
iv)
à 90
iii)
à 180
1
T2
Figura 8.19. Gráficas de Bode de GT (s) en (8.7). i) T , ii) s, iii) 3 s+ 1
s2 + T
, iv)
T 2
GT (s).

La gráfica polar de G(s)H(s) dada en (8.6) se muestra en la figura 8.20. El


uso de la gráfica de Bode de GT (s) mostrada en la figura 8.19 permite concluir
que la gráfica polar de G(s)H(s), mostrada en en la figura 8.20, consiste en una
trayectoria cerrada que es recorrida dos veces en sentido horario. Obsérvese
que el signo negativo en (8.6) cambia la fase en 180◦ de cada uno de los puntos
de la gráfica de Bode de GT (s). Nótese también que la gráfica polar de la figura
R +R
8.20 cruza el eje real negativo en el punto − 13R1 f a la frecuencia ω = 1/T =
464 8 Circuitos electrónicos realimentados

Im (G(j!)H(j!))

à A3 ! =+1
ï
(à 1; j0)
ï! = æ 1 !=0
T
! = à 1 Re (G(j!)H(j!))

Figura 8.20. Gráfica polar de G(s)H(s) en (8.6).

1/(RC). Por otro lado, como la gráfica polar incluye frecuencias positivas
y negativas y es simétrica respecto al eje real para frecuencias negativas y
R +R
positivas entonces el eje real negativo también es cruzado en el punto − 13R1 f
a la frecuencia ω = −1/T = −1/(RC). Nótese también que el número de polos
inestables de lazo abierto que tiene la función dada en (8.6) es cero, es decir
P = 0, ya que todos los coeficientes del polinomio del denominador de GT (s)
son positivos (véase la sección 4.2.1).
Finalmente, antes de aplicar el criterio de Nyquist se debe observar lo
siguiente. Como G(s)H(s) tiene un cero en s = 0, es decir sobre el eje imagi-
nario, se debe hacer un rodeo como el mostrado en la figura 6.44 sólo que en
este caso es un cero (en lugar de un polo) el que se debe rodear. Sin embar-
go, sobre todo ese rodeo s = ε∠φ donde ε → 0 y, por tanto, G(s)H(s) → 0
también sobre todo ese rodeo. Es decir, G(s)H(s) representa un sólo punto
en el origen para todo ese rodeo. Por tanto, al aplicar el criterio de Nyquist
se tienen tres casos:
R +R
1. Si 13R1 f > 1, entonces el número de vueltas alrededor del punto (−1, j0)
es N = 2, por lo que el número de polos inestables de lazo cerrado es Z =
N + P = 2. Esto significa inestabilidad del circuito lo cual es altamente
indeseable.
R +R
2. Si 13R1 f < 1, entonces el número de vueltas alrededor del punto (−1, j0)
es N = 0, por lo que el número de polos inestables de lazo cerrado es
Z = N + P = 0. Aunque esto significa que el circuito es estable, sin
embargo tampoco es deseable porque la respuesta del circuito será tal que
poco a poco dejará de oscilar.
R +R
3. Si 13R1 f = 1, entonces el circuito es marginalmente estable, es decir se tie-
nen polos de lazo cerrado que están sobre el eje imaginario. Esto también
puede entenderse del siguiente modo. De acuerdo a la discusión previa,
8.3 Diseño de osciladores con forma de onda sinusoidal 465

la gráfica polar de la figura 8.20 cruza el eje real negativo en el punto


(−1, j0) a las frecuencias ω = 1/T = 1/(RC) y ω = −1/T = −1/(RC).
Ésto significa que G(jω)H(jω)|ω=1/T = −1 y G(jω)H(jω)|ω=−1/T = −1,
es decir, 1 + G(s)H(s)|s=j/T = 0 y 1 + G(s)H(s)|s=−j/T = 0. Dado que
1 + G(s)H(s) = 0 es la condición que deben satisfacer los valores de s que
son polos de lazo cerrado, se concluye que hay dos polos de lazo cerrado
que son imaginarios puros conjugados colocados en s = j/T y s = −j/T .
Por tanto, el circuito oscilará permanentemente con frecuencia ω = 1/T .

Un circuito oscilador práctico

A partir de la discusión previa se concluye que la ganancia del amplificador


basado en amplificadores operacionales se debe seleccionar como:
R1 + Rf
A= =3
R1
Sin embargo, el circuito de la figura 8.16 no podrá oscilar de manera satis-
factoria. La razón de esto es que es no se pueden obtener resistencias reales
R +R
Rf y R1 cuyos valores satisfagan exactamente 1R1 f = 3, además la más
pequeña variación en sus valores hará inestable al circuito o hará que deje de
oscilar. Esta es una muestra de un hecho bien conocido: un circuito oscilador
lineal no oscila satisfactoriamente en la práctica por lo que todos los circuitos
osciladores que se construyen son no lineales.

33nF 4:7kÒ

+
à
Zeners
10kÒ eo
25:6kÒ 3:6V
4:7kÒ 33nF

10kÒ

Figura 8.21. Circuito oscilador práctico.

La manera de construir un oscilador práctico usando los conceptos teóri-


cos presentados previamente es utilizando el circuito de la figura 8.21, al cual
466 8 Circuitos electrónicos realimentados

se le incluye una no linealidad mediante la introducción de dos diodos zener.


Suponga que A > 3 por lo que el circuito es inestable y empieza a oscilar con
una amplitud que crece con cada oscilación. La función de los diodos zener
es poner en corto a la resistencia de 10[KOhm] cuando alcancen su voltaje de
avalancha. De esta manera se reducirá la ganancia A del amplificador cuando
la amplitud del voltaje de salida supere un umbral determinado. Esto hará que
que A < 3 por lo que la amplitud de la oscilación tenderá a disminuir lo cual,
a su vez, reduce el voltaje en los diodos zener que dejarán de conducir por lo
que desaparecerá el corto alrededor de la resistencia de 10[KOhm] y se obten-

Figura 8.22. Forma de onda del voltaje a la salida del amplificador operacional de
la figura 8.21. El potenciómetro está ajustado a 20[KOhm].

Figura 8.23. Forma de onda del voltaje a la salida del amplificador operacional de
la figura 8.21. El potenciómetro está ajustado a 25.6[KOhm].
8.3 Diseño de osciladores con forma de onda sinusoidal 467

drá A > 3 de nuevo. Finalmente, este proceso producirá un estado estacionario


en el que habrá una oscilación sinusoidal de amplitud constante. Nótese que,
usando los valores de las resistencias en la figura 8.21, A = 45/10 = 4.5 si no
conducen los diodos zener y A = 35/10 = 3.5 si conducen los diodos zener.
Ası́ que se debe ajustar el valor del potenciómetro de 25.6[KOhm] para obte-
ner un valor de A ligeramente mayor que 3 y conseguir la oscilación sostenida.
Nótese que la frecuencia de oscilación esperada es:
1 1 1
ω= = = = 6447[rad/s],
T RC (4.7 × 103 )(0.033 × 10−6 )
ω 6447
f = = = 1.026[KHz]
2π 2π
En las figuras 8.22 y 8.23 se muestran los resultados experimentales obtenidos
con el circuito de la figura 8.21. El amplificador operacional utilizado es el
UA741. La frecuencia obtenida experimentalmente es 1[KHz]. La amplitud
de oscilación puede ser modificada si se incrementa el valor de la resisten-
cia del potenciómetro de 25.6[KOhm], lo cual incrementa la ganancia de del
amplificar operacional realimentado A. Sin embargo, si esta ganancia es muy
grande la forma de onda sinusoidal se distorsiona. Esto es lo que ocurre en la
figura 8.23 donde se usa el potenciómetro 25.6[KOhm] ajustado a su máximo
valor de resistencia. Por el contrario, en la figura 8.22 el potenciómetro de
25.6[KOhm] se usa ajustado a un valor de aproximadamente 20[KOhm]. Este
comportamiento significa que la conducción en la zona de avalancha de los
diodos zener es progresiva, y no abrupta, conforme aumenta la amplitud del
voltaje en la salida del amplificador operacional. De esta manera, una mayor
ganancia de lazo en (8.6) es reducida a la unidad si aumenta la amplitud de
las oscilaciones, es decir, si el funcionamiento de los diodos zener se interna
más en su región de avalancha.
Finalmente, nótese que, de acuerdo a los diagramas de bloques mostrados
en la figura 8.18, el circuito oscilador presentado en esa sección constituye un
sistema en lazo cerrado sin entrada, es decir, la entrada que se aplica para
que el circuito oscile es igual a cero. Esto no debe sorprender al lector pues en
la sección 3.3 del capı́tulo 3 se explica claramente que un sistema de segundo
orden (o de orden mayor) puede oscilar aunque la entrada sea cero si las con-
diciones iniciales son diferentes de cero. En este sentido, debe observarse que
a pesar de que el circuito esté inicialmente desconectado se pueden producir
pequeñas condiciones iniciales diferentes de cero como consecuencia de que el
circuito es perturbado al momento de conectar las fuentes de alimentación.
Estas condiciones iniciales diferentes de cero, aunque pequeñas, son suficientes
para que el circuito empiece a oscilar dada la inestabilidad inicial de circuito
(ya que A > 3 cuando se enciende el circuito).
468 8 Circuitos electrónicos realimentados

8.3.2. Diseño basado en un amplificador operacional. Red RC de


defasaje

Considere el circuito mostrado en la figura 8.24. La relación entre los vol-


tajes V1 (s) y V2 (s) se muestra en (2.146) correspondiente al ejemplo 2.17
del capı́tulo 2. A continuación se reescribe dicha expresión para facilitar la
referencia:

C C C

+ +
V 1(s) I1 R I2 R I3 R V 2(s)

à à

Figura 8.24. Red RC de defasaje.

V2 (s) R3 C 3 s3
= 3 3 3 = F (s) (8.8)
V1 (s) R C s + 6R2 C 2 s2 + 5RCs + 1

Por otro lado, de acuerdo a la sección 8.2, el amplificador inversor mostrado


en la figura 8.25 realiza la operación:
Rf
V1 (s) = − V2 (s) (8.9)
R

Rf

R
+ à
+
V 2(s) +
- V 1(s)
-

Figura 8.25. Amplificador inversor.

Ahora considérese el circuito mostrado en la figura 8.26. Nótese que es-


te circuito puede representarse usando el diagrama de bloques en la figura
8.3 Diseño de osciladores con forma de onda sinusoidal 469

Rf

R
+ - +
V 2(s) + V 1(s)
-
-

C C C

R R

Figura 8.26. Circuito oscilador con red RC de defasaje.

8.27(a). Además, de acuerdo a las expresiones en (8.8) y (8.9) se obtiene el


diagrama de bloques mostrado en la figura 8.27(b), el cual puede representar-
se como en la figura 8.27(c). Esto último es conveniente para poder utilizar
la configuración en lazo cerrado con realimentación negativa. Por tanto, la
función de transferencia de lazo abierto está dada como:
Rf
G(s)H(s) = F (s) (8.10)
R
Se sabe que los polos de lazo cerrado satisfacen:

1 + G(s)H(s) = 0 (8.11)

es decir:
Rf
1+ F (s) = 0 (8.12)
R
De esta condición se obtiene el siguiente polinomio caracterı́stico:

(R4 C 3 + Rf R3 C 3 )s3 + 6R3 C 2 s2 + 5R2 Cs + R = 0 (8.13)

De acuerdo al capı́tulo 3, el comportamiento de este circuito depende de las


raı́ces del polinomio caracterı́stico en (8.13). Como este polinomio es de tercer
orden es de mucha utilidad usar el criterio de Routh (sección 4.3) para estudiar
dichas raı́ces y para lo cual se construye la tabla 8.2. A partir de esta tabla
se pueden predecir tres comportamientos diferentes:
470 8 Circuitos electrónicos realimentados

V 2(s) V 1(s)
0 + Amplificador
inversor
+

Red RC de
defasaje
(a)

V 2(s) Rf V 1(s)
0 +
à R
+

F(s)

(b)

Rf V 1(s)
0 +
R
à

F(s)
(c)

Figura 8.27. Diagramas de bloques equivalentes del circuito en la figura 8.26.

Tabla 8.2. Aplicación del criterio de Routh al polinomio caracterı́stico en (8.13).


s3 R4 C 3 + Rf R3 C 3 5R2 C
s2 6R3 C 2 R
(6R3 C 2 )(5R2 C)−R(R4 C 3 +Rf R3 C 3 )
s1 6R3 C 2
0
s0 R

(6R3 C 2 )(5R2 C) − R(R4 C 3 + Rf R3 C 3 ) > 0, es decir Rf < 29R. En este


caso, todos los elementos de la primer columna de la tabla 8.2 son positivos
por lo que todas las raı́ces del polinomio en (8.13) tienen parte real negativa
8.3 Diseño de osciladores con forma de onda sinusoidal 471

y el circuito es estable. Esto significa que aunque el circuito podrı́a oscilar,


sin embargo esto no serı́a de manera permanente ya que las oscilaciones
desaparecerán al crecer el tiempo.
(6R3 C 2 )(5R2 C) − R(R4 C 3 + Rf R3 C 3 ) < 0, es decir Rf > 29R. En este
caso, hay dos cambios de signo al recorrer la primera columna de la tabla
8.2. Esto significa que hay dos raı́ces del polinomio en (8.13) que tienen
parte real positiva y el circuito es inestable. Esto significa que aunque el
circuito podrı́a oscilar, sin embargo la amplitud de las oscilaciones crecerı́a
sin lı́mite al crecer el tiempo, lo cual no es de utilidad en situaciones
prácticas.
(6R3 C 2 )(5R2 C) − R(R4 C 3 + Rf R3 C 3 ) = 0, es decir Rf = 29R. En este
caso hay un renglón de la tabla 8.2 que esta formado exclusivamente por
ceros (el renglón correspondiente a s1 ). El criterio de Routh establece
(véase la sección 4.3, ejemplo 4.14) que en este caso se debe calcular la
derivada del polinomio formado con los elementos del renglón s2 , es decir
dP (s) 3 2 3 2 2
ds = 12R C s, donde P (s) = 6R C s +R, sustituir sus coeficientes en
1
el renglón s y continuar con la construcción de la tabla como se muestra en
la tabla 8.3. Como no hay cambios de signo al recorrer la primera columna
de la tabla 8.3 se concluye no existen raı́ces con parte real positiva y que
existen raı́ces imaginarias conjugadas. Ası́ que la condición:

Tabla 8.3. Aplicación del criterio de Routh al polinomio caracterı́stico en (8.13)


(continuación).
s3 R4 C 3 + Rf R3 C 3 5R2 C
s2 6R3 C 2 R
1
s 12R3 C 2 0
s0 R

Rf = 29R (8.14)
es necesaria para que el circuito de la figura 8.26 pueda oscilar de manera
permanente. Por tanto, lo único que resta es determinar la frecuencia de
oscilación. Para esto, es de utilidad recordar otra propiedad de los datos
mostrados en la tabla 8.2 (véase la sección 4.3, ejemplo 4.14): “si uno de los
renglones esta formado exclusivamente por ceros, entonces las raı́ces del
polinomio obtenido con los datos del renglón inmediato superior a dicho
renglón de ceros también son raı́ces del polinomio caracterı́stico en (8.13)”.
Es decir, las raı́ces de:
6R3 C 2 s2 + R = 0
también son raı́ces del polinomio caracterı́stico mostrado en (8.13). Resol-
viendo la expresión anterior se encuentra que las raı́ces correspondientes
son imaginarias, como se esperaba:
472 8 Circuitos electrónicos realimentados

1 1
s1 = j √ , s2 = −j √
6RC 6RC

Esto significa que ω = √ 1 = 2πf , es decir, que la frecuencia en Hertz


6RC
está dada como:
1
f= √ (8.15)
2π 6RC
Por tanto, para diseñar el circuito oscilador de la figura 8.26 se deben se-
leccionar los valores de R y C de modo que se obtenga la frecuencia de
oscilación de acuerdo a (8.15) para después asegurar la oscilación seleccio-
nando Rf de acuerdo a (8.14).

Un circuito oscilador práctico

A partir de la discusión previa se concluye que la relación entre Rf y R


debe cumplir lo establecido en (8.14). Sin embargo, de manera similar a lo
que ocurre con el circuito oscilador de la sección 8.3.1, el oscilador de la figura
8.26 debe ser modificado como se muestra en la figura 8.28 para conseguir
una oscilación satisfactoria. Nótese que, usando los valores de las resistencias
R
en la figura 8.28, Rf = 80000 2200 = 36.36 si no conducen los diodos zener y
Rf 47000
R = 2200 = 21.36 si conducen los diodos zener. Ası́ que se debe ajustar el
R
valor del potenciómetro de 47[KOhm] para obtener un valor de Rf ligeramente
mayor que 29 y conseguir la oscilación sostenida. Nótese que la frecuencia de
oscilación esperada es:
1 1
f = √ = √ = 2.9534[KHz]
2π 6RC 2π 6(2200)(0.01 × 10−6 )
En la figura 8.29 se muestran los resultados experimentales obtenidos con el
circuito de la figura 8.28. El amplificador operacional utilizado es el UA741. La
frecuencia obtenida experimentalmente es 2.7027[KHz], que es muy cercana a
la diseñada: 2.9534[KHz].

8.3.3. Diseño basado en un transistor

En esta sección se estudia el circuito oscilador mostrado en la figura 8.30, el


cual se conoce como oscilador Colpitts. El transistor es un dispositivo no lineal.
Por esta razón, el problema es abordado de manera similar a como se hace
con las ecuaciones diferenciales no lineales. Ası́, se considera que el circuito
de la figura 8.30 trabaja en un punto de operación y que permite pequeñas
variaciones de sus señales alrededor de dicho punto de operación. El punto
de operación está determinado por el funcionamiento en corriente directa del
circuito de la figura 8.30, mientras que las variaciones alrededor del punto
de operación se analizan usando un circuito equivalente de señal pequeña
8.3 Diseño de osciladores con forma de onda sinusoidal 473

Zeners 3:6V

47k

33k
2:2k
- +
+ v1
-

0:01 öF 0:01 öF 0:01 öF

2:2k 2:2k

Figura 8.28. Circuito oscilador práctico.

para el circuito de la figura 8.30. El circuito de señal pequeña es similar al


modelo lineal aproximado obtenido para sistemas (ecuaciones diferenciales) no
lineales en la sección 7.2, el cual es válido sólo si permiten pequeñas variaciones
alrededor del punto de operación seleccionado. En el siguiente apartado se

Figura 8.29. Forma de onda del voltaje a la salida del amplificador operacional de
la figura 8.28.
474 8 Circuitos electrónicos realimentados

R L
R2

Q ýCC
C1
Rt
C3
CBP R1
RE C2

Figura 8.30. Oscilador Colpitts.

estudia el circuito bajo condiciones de corriente directa. El análisis del circuito


equivalente de señal pequeña se aborda en las subsecuentes secciones.
Dada la gran cantidad de variables involucradas (corrientes y voltajes en
cada elemento de circuito), se hace la siguiente aclaración en cuanto a la
nomenclatura utilizada. Se usa vR1Q para indicar el voltaje (constante) que
hay en la resistencia R1 en el punto de operación, vr1 representa las variaciones
de voltaje que hay en la resistencia R1 al rededor del punto de operación y vR1
es el voltaje total en la resistencia R1 , es decir vR1 = vR1Q +vr1 . Las corrientes
y voltajes en los otros elementos de circuito se definen de manera análoga.
Por otro lado, se usan letras mayúsculas para representar la transformada de
Laplace de una variable escrita con letras minúsculas, es decir, I(s) = L{i(t)}.

Análisis en corriente directa


El punto de operación de un transistor está determinado por los valores
constantes de la corriente de colector iCQ y del voltaje colector-emisor vCEQ .
diLQ dvC1Q dvC2Q
Primero nótese que vLQ = L dt = 0, iC1Q = C dt = 0, iC2Q = C dt =
dvC3Q
0 e iC3Q = C dt = 0 porque iLQ , vC1Q , vC2Q e vC3Q son constantes. Por
tanto, para el análisis en corriente directa se usa el circuito de la figura 8.31.
Leyes fundamentales que rigen el funcionamiento del transistor en corriente
directa indican que [1], cap. 5:
iCQ = βiBQ , iEQ = (1 + β)iBQ , β ≫ 1, iEQ ≈ iCQ , vBEQ = 0.7[V], silicio
La ley de voltajes de Kirchhoff aplicada a la malla definida por el recorrido
Jc en la figura 8.31 da como resultado:
vcc = vCEQ + vREQ
vcc = vCEQ + RE iEQ (8.16)
8.3 Diseño de osciladores con forma de onda sinusoidal 475

R2

Q Jc ýCC
+

à
R1
Jb RE

Figura 8.31. Circuito equivalente en corriente directa.

La ley de voltajes de Kirchhoff aplicada a la malla definida por el recorrido


Jb en la figura 8.31 da como resultado:
vR1Q = vBEQ + vREQ
vR1Q = 0.7 + RE iEQ (8.17)
Suponga que se dan como datos los valores de iCQ , vCEQ , β y vcc . Usando
(8.16) e iEQ ≈ ICQ se calcula el valor de RE . A continuación se propone iR1Q
a partir de iCQ = βiBQ y la siguiente consideración importante:
iR1Q ≫ iBQ (8.18)
Entonces puede usarse (8.17) para calcular:
vR1Q
R1 = (8.19)
iR1Q
vcc − vR1Q
R2 = (8.20)
iR1Q
El valor de los elementos L, C1 , C2 , C3 , CBP y Rt se calculan a partir del
análisis del circuito equivalente de señal pequeña como se muestra en los
siguientes apartados.

Circuito equivalente de señal pequeña

Primero se determina el modelo de señal pequeña del transistor. Aunque


existen muchos modelos de señal pequeña para el transistor (todos ellos correc-
tos) en esta obra se considera lo siguiente. La corriente de emisor, correspon-
diente al diodo en la unión base-emisor, está dada por la ecuación de Shockley
[1], cap. 5:
476 8 Circuitos electrónicos realimentados
h vBE i
iE = IES e VT − 1 (8.21)

donde IES es una constante de valor entre 10−12 [A] y 10−16 [A] mientras
que VT = 0.026[V] para temperaturas de 300 grados Kelvin. Una relación
importante del transistor indica que iB = (1 − α)iE , donde α es una constante
positiva ligeramente menor que 1. Por tanto:
h vBE i
iB = (1 − α)IES e VT − 1 (8.22)

Dado que se considera que el transistor opera en la región activa entonces se


puede despreciar el uno que se resta en la expresión anterior para escribir:
h vBE i
iB = (1 − α)IES e VT (8.23)

Recordando que iB = iBQ + ib y vBE = vBEQ + vbe se tiene:


· v ¸
BEQ +vbe
iBQ + ib = (1 − α)IES e VT
vBEQ vbe
= (1 − α)IES e VT
e VT (8.24)

Recuérdese que pequeños cambios en iB se deben a pequeños cambios en vBE ,


es decir, ib = 0 si vbe = 0. Entonces, de acuerdo a la expresión anterior se
obtiene:
h vBEQ i
iBQ = (1 − α)IES e VT

Por tanto, (8.24) se puede escribir como:


vbe
iBQ + ib = IBQ e VT (8.25)

Si sólo se permiten valores pequeños de vbe se puede hacer la aproximación


[4], pág. 942:
vbe vbe
e VT ≈ 1 +
VT
lo cual, junto con (8.25), implica que:

vbe VT
ib = , rπ = (8.26)
rπ IBQ

Por otro lado, la siguiente relación también es válida para señal pequeña:

ic = βib (8.27)
8.3 Diseño de osciladores con forma de onda sinusoidal 477
ib ic
B C
+
rù ìib

ý be ie
à
E
(a)
ie ic
E C
à

hib ìib

ý be ib
+
B
(b)

Figura 8.32. Circuitos equivalentes de señal pequeña del transistor.

Usando (8.26) y (8.27) se obtiene el modelo de señal pequeña del transistor


que se muestra en la figura 8.32(a). Se puede encontrar una equivalencia entre
este modelo y el mostrado en la figura 8.32(b). Nótese que la única diferencia
radica en que el voltaje base-emisor ahora está dado como una caı́da de voltaje
debida a la corriente de emisor. Por tanto, la diferencia debe depender del valor
de la nueva resistencia hib , es decir:

vbe = hib ie (8.28)

Comparando (8.26), (8.28), y aclarando que ie = (1 + β)ib también se cumple,


se obtiene:
vbe vbe rπ VT VT
hib = = = = = (8.29)
ie (1 + β)ib 1+β (1 + β)IBQ IEQ

Nótese que el valor de hib depende de IEQ , es decir, del punto de operación.
Una vez que se cuenta con el modelo de señal pequeña del transistor, se
procede a encontrar el circuito equivalente de señal pequeña de todo el circuito
oscilador.
Considere el circuito de la figura 8.33(a). La ley de voltajes de Kirchhoff
aplicada a la malla representada por el recorrido J3 indica que:
diL
vcc = L + vCE + vRE
dt
478 8 Circuitos electrónicos realimentados

n
J3
R L
R2

Q ýCC
C1
Rt
C3
CBP R1
RE C2

(a)
ìib
ic C
J3
B
C1
ib hib ie E Rt
C3 L Rex Rcobre

RE C2

(b)

Figura 8.33. Obtención del circuito de señal pequeña para el circuito oscilador
completo.

iL = iLQ + il (8.30)
vCE = vCEQ + vce (8.31)
vRE = vREQ + vre (8.32)

Sustituyendo convenientemente, la expresión anterior se puede escribir como:


d
vcc = L (iLQ + il ) + vCEQ + vce + vREQ + vre
dt
diLQ
Usando (8.16) y vLQ = L dt = 0 en la expresión anterior se obtiene:

dil
0=L + vce + vre
dt
Por tanto, el circuito equivalente de señal pequeña debe tener un trayecto
como el indicado por J3 en la figura 8.33(b). Procediendo de manera análoga
con cada una de las posibles mallas y nodos del circuito de la figura 8.33(a) se
encuentra que el circuito equivalente de señal pequeña está dado como en la
figura 8.33(b). Es importante aclarar que Rcobre es la resistencia equivalente en
8.3 Diseño de osciladores con forma de onda sinusoidal 479

paralelo de la resistencia interna (debida al cobre) de la inductancia, mientras


que Rex = n2 R donde R es la carga externa a la cual alimenta el circuito
oscilador y n es el cociente del número de vueltas de L y el número de vueltas
de la inductancia conectada a R.
Finalmente, las resistencias R1 y R2 en la figura 8.33(a) desaparecen en
la figura 8.33(b) porque se considera que la impedancia de CBP (en paralelo
con R1 y R2 ) es muy pequeña comparada con el equivalente en paralelo de
R1 y R2 a la frecuencia de oscilación ω1 , es decir ω1 C1BP ≪ RR11+R
R2
2
. Además,
1
si ω1 CBP ≪ hib la impedancia del capacitor puede despreciarse.

Ecuaciones del sistema en lazo cerrado

En esta y en las subsecuentes secciones se analiza el circuito oscilador de la


figura 8.30 en base al circuito equivalente de señal pequeña dado en la figura
8.33(b). Debe recordarse siempre que todo lo que predice este análisis sólo
representa el comportamiento que las señales tienen al rededor del punto de
operación el cual se determina mediante el análisis en corriente directa.

ì ib
ic C i
1
B ih
ib h ib E R t i out i out C1
C3 L R ex R cobre v o
ie
RE v out v out R in C2

Figura 8.34. Circuito usado para propósitos de análisis.

Para propósitos de análisis se abre el lazo de realimentación que hay a


través de la resistencia de emisor, tal como se muestra en la figura 8.34 [5],
pág. 265, [6], pág. 64. El valor de Rin en la figura 8.34 está dado como:

RE hib
Rin = Rt + (8.33)
RE + hib
Ahora se procede a analizar el circuito de la figura 8.34. La impedancia entre
los puntos 1 y 2 está dada como:

1 1 Rin sC1 2 sRin (C1 + C2 ) + 1


Zf (s) = = + = (8.34)
Yf (s) sC1 Rin + sC1 2 sC1 (sC2 Rin + 1)

donde Yf (s) es la admitancia entre los puntos 1 y 2. Por otro lado, Vo (s) e
I(s) se relacionan a través de:
480 8 Circuitos electrónicos realimentados

Vo (s) = Zc (s)I(s) (8.35)

donde:
1 1 1 1
= Yf (s) + + sC3 + + (8.36)
Zc (s) sL Rex Rcobre

Después de algunas manipulaciones algebraicas se obtiene:

sL(sRin (C1 + C2 ) + 1)
Zc (s) = (8.37)
a3 s3 + a2 s2 + a1 s + 1
a3 = L(C1 C2 + C3 (C1 + C2 ))Rin
Rcobre + Rex
a2 = LC1 + LC3 + LRin (C1 + C2 )
Rcobre Rex
Rcobre + Rex
a1 = Rin (C1 + C2 ) + L
Rcobre Rex

El voltaje Vout (s) se puede calcular como:

Vout (s) = M (s)Vo (s) (8.38)

donde Vout (s) y Vo (s) se relacionan con la corriente Ih (s) mediante:


1 1
Vo (s) = Ih (s), Vout (s) = 1 Ih (s) (8.39)
Yf (s) Rin + sC2

Combinando ambas expresiones en (8.39) se obtiene:

1 1 + Rin sC2
Vo (s) = Vout (s)
Yf (s) Rin

Usando (8.34) se puede escribir:


2
Vout (s) s(Rin C1 C2 s + Rin C1 )
M (s) = = 2 (8.40)
Vo (s) Rin C2 (C1 + C2 )s2 + Rin (2C2 + C1 )s + 1

Utilizando sucesivamente (8.38) y (8.35) se encuentra:

Vout (s) 1 1
Iout (s) = = M (s)Vo (s) = M (s)Zc (s)I(s) (8.41)
Rin Rin Rin
Por otro lado, aplicando el divisor de corriente en el circuito de emisor de la
figura 8.34 se encuentra:
−RE
Ie (s) = Iout (s)
RE + hib
Por tanto, si se cumple:
8.3 Diseño de osciladores con forma de onda sinusoidal 481

RE ≫ hib , β≫1 (8.42)

entonces se puede aproximar con buen nivel de exactitud:

Iout (s) ≈ −Ie (s) = −(β + 1)Ib (s) ≈ −βIb (s) = I(s) (8.43)

es decir, la ganancia de corriente del transistor en la configuración en base


común es unitaria. Las expresiones en (8.41) y (8.43) dan origen al diagrama
de bloques de la figura 8.35(a). Este diagrama de bloques tiene realimentación
positiva, lo cual es una caracterı́stica fundamental para producir oscilaciones
sostenidas. En la figura 8.35(b) se muestra un diagrama de bloques equiva-
lente que, sin embargo, ahora se expresa como un sistema con realimentación
negativa. Esto permite la aplicación de las herramientas de análisis y diseño
de la teorı́a de control ya que todas ellas suponen sistemas en lazo cerrado
con realimentación negativa como el mostrado en la figura 8.18(d). Por tanto,
la función de transferencia de lazo abierto es:
1
G(s)H(s) = − M (s)Zc (s) (8.44)
Rin

0 I (s) Iout (s)


M (s )Z c(s )
R in
+ +

(a)

0 à I (s) Iout (s)


M (s )Z c(s )
à R in
+ à

(b)

Figura 8.35. Diagramas de bloques equivalentes del circuito en la figura 8.34.

Condiciones para conseguir oscilaciones sostenidas

Primero se estudian las caracterı́sticas de las funciones de transferencia


M (s) y Zc (s). Nótese que todos los coeficientes de estas funciones de trans-
ferencia son positivos. De acuerdo a los criterios vistos en las secciones 4.2.1
482 8 Circuitos electrónicos realimentados

y 4.2.2 sobre el signo de los coeficientes de polinomios de primero y segundo


grado y sus correspondientes raı́ces, se concluye que M (s) tiene dos polos con
parte real negativa, un cero con parte real negativa y un cero en s = 0.
Sin embargo, de acuerdo a la sección 4.2.3, el criterio de los signos de los
coeficientes no puede aplicarse a Zc (s) porque su denominador es un polinomio
de tercer grado. Sin embargo, se puede hacer uso de un resultado bien conocido
de la teorı́a de circuitos eléctricos lineales. Este resultado afirma [7], cap. 19,
secciones 5 y 6, que la impedancia de cualquier red formada únicamente por
elementos pasivos (resistencias, capacitores e inductancias) es una función de
transferencia que sólo tiene polos con parte real menor o igual a cero. Nótese
que este es el caso de Zc (s). Más aún, dado que Zc (s) tiene en su denominador
un termino independiente de s igual a la unidad, entonces se asegura que Zc (s)
tiene tres polos con parte real negativa, un cero con parte real negativa y un
cero en s = 0.
De acuerdo a lo anterior y a lo expuesto en el capı́tulo 6 se concluye que
las gráficas de Bode y polares de Zc (s) y M (s) tienen las formas mostradas
en las figuras 8.36 y 8.37, respectivamente, mientras que la gráfica polar de
G(s)H(s) dada en (8.44) se muestra en la figura 8.38. Es conveniente subrayar
que la gráfica polar de G(s)H(s) consiste en dos trayectorias cerradas que son
recorridas en sentido horario conforme la frecuencia varı́a de −∞ a +∞. El eje
real negativo es cruzado dos veces a las frecuencias ω = ±ω1 . Nótese que en
estos valores de frecuencia la función de transferencia G(jω)H(jω) tiene parte
imaginaria igual a cero. Finalmente, como G(s)H(s) tiene dos ceros en s = 0
para aplicar el criterio de Nyquist se debe hacer un rodeo como el mostrado
en la figura 6.44 alrededor de dichos ceros en el origen. Sin embargo, como
s = ε∠φ, con ε → 0, entonces G(s)H(s) → 0 sobre todo ese recorrido y es
representado por un único punto en el origen. El uso del criterio de Nyquist
permite obtener las siguiente conclusiones:
Si |G(jω)H(jω)|ω=w1 < 1, entonces hay estabilidad de lazo cerrado por lo
que las oscilaciones no pueden sostenerse. Esto se debe a que Z = P + N ,
donde P = 0 representa el número de polos inestables de G(s)H(s), N = 0
es el número de vueltas horarias alrededor del punto (−1, 0) en la figura
8.38 y Z = 0 es el número de polos inestables de lazo cerrado.
Si |G(jω)H(jω)|ω=w1 > 1, entonces el sistema en lazo cerrado es inestable
porque Z = N + P = 2, con P = 0 y N = 2. Claramente, esta situación
es indeseable.
Si |G(jω)H(jω)|ω=w1 = 1, entonces hay dos polos imaginarios puros por
lo que habrá oscilaciones sostenidas. La parte imaginaria de estos polos es
igual a ±ω1 y representa la frecuencia de oscilación del circuito.
A partir de estas observaciones, a continuación se presenta la manera de cal-
cular los elementos del circuito para asegurar que el circuito presentará osci-
laciones sostenidas. Sin embargo, dada la complejidad de las expresiones que
forman a G(s)H(s) se deberán introducir ciertas consideraciones sobre los
componentes del circuito.
8.3 Diseño de osciladores con forma de onda sinusoidal 483

dB
0 !

fase + 90
[grados] !
0
à 90
(a) Gráficas de Bode de Zc (s)
Im (Z c(j!))

! =à1
!=0
! =+1
Re (Z c(j!))

(b) Gráfica polar de Zc (s) (dos vuel-


tas).

Figura 8.36. Gráficas de respuesta en frecuencia de Zc (s) en (8.37).

Cálculo de los componentes del circuito

Primero se obtiene la siguiente expresión:

1 ω 2 C12 Rin 1 1
= + + +
Zc (jω) (ωRin (C1 + C2 ))2 + 1 Rex Rcobre
· ¸
ω 2 C2 Rin
2
(C1 + C2 ) + 1 1
+ j ωC1 + ωC3 − (8.45)
(ωRin (C1 + C2 ))2 + 1 ωL

al hacer el cambio de variable s = jω en (8.36), y la siguiente expresión:


2
Rin ω 2 (C12 + C1 C2 ) + jωRin C1
M (jω) = 2 ω 2 (C + C )2 (8.46)
1 + Rin 1 2

al hacer el cambio de variable s = jω en (8.40). Con el fin de facilitar la ob-


tención de esta expresión es importante indicar que, durante el procedimiento
484 8 Circuitos electrónicos realimentados

dB
0 !

fase + 90
[grados] !
0
à 90
(a) Gráficas de Bode de M (s).

Im (M(j!))

!=0 ! =+1
! =à1
Re (M(j!))

(b) Gráfica polar de M (s).

Figura 8.37. Gráficas de respuesta en frecuencia de M (s) en (8.40).

Im (Z c(j!))

! = æ !1
! =+1
ï
(à 1; j0) ! = à 1 ! = 0
Re (Z c(j!))

Figura 8.38. Gráfica polar de G(s)H(s) en (8.44).


8.3 Diseño de osciladores con forma de onda sinusoidal 485

2
seguido, el factor 1 + Rin ω 2 C22 aparece en el numerador y el denominador de
M (jω) por lo que se cancela para obtener finalmente (8.46).
Tal como se mencionó previamente la gráfica polar de G(jω)H(jω) cruza
el eje real negativo a la frecuencia ω1 . Esto significa que las partes imaginarias
de (8.45) y (8.46) deben ser cero cuando se evalúan en ω = ω1 . Aplicando esta
condición a (8.45) se obtiene:
1
ω1 = r h i (8.47)
L CC11+C
C2
2
+ C3

que representa la frecuencia de oscilación del circuito. Es muy importante


mencionar que, con el fin de simplificar las expresiones y obtener (8.47), se
deben hacer las siguientes suposiciones:

2 1 2 1
Rin ≫ , Rin ≫ (8.48)
ω12 C2 (C1 + C2 ) ω12 (C1 + C2 )2

Por otro lado, la fase de (8.46) está dada como:


à 1
!
ω(C1 +C2 )
∠M (jω) = arctan (8.49)
Rin

Nótese que esta fase es diferente de cero para cualquier valor de frecuencia.
La condición mencionada previamente que requiere que la parte imaginaria
de M (jω) sea cero es equivalente a requerir que la fase en (8.49) sea cero.
Aunque ésto no es posible, sin embargo puede obtenerse una fase cercana a
cero para ω = ω1 si:
1
Rin ≫ (8.50)
ω1 (C1 + C2 )

Esta y las otras aproximaciones que se han hecho sólo resultarán en pequeñas
diferencias entre los valores calculados y los obtenidos experimentalmente de
la frecuencia de oscilación y la ganancia de la función de transferencia de lazo
abierto.
Finalmente, el valor de G(jω)H(jω)|ω=w1 se obtiene como:
1
|G(jω)H(jω)|ω=w1 = Re(M (jω))|ω=ω1 Re(Zc (jω))|ω=ω1 (8.51)
Rin

donde Re(x) representa la parte real de x. A partir de (8.51) y tomando en


cuenta la suposición (8.50) se encuentra:
 
1  1 
|G(jω)H(jω)|ω=w1 =
Rin C1C+C 2 C12
2 + 1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre
486 8 Circuitos electrónicos realimentados

Por tanto, de acuerdo a la condición |G(jω)H(jω)|ω=w1 = 1 se concluye que


el circuito oscilará de manera sostenida a la frecuencia dada en (8.47) si:
 
1  1 =1 (8.52)
Rin C1C+C 2 C12
2 + 1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre

Al igual que en el caso del oscilador basado en amplificador operacional, es


importante subrayar lo siguiente. En la práctica no es posible satisfacer la
condición (8.52) debido a las incertidumbres que existen en los valores de
los componentes involucrados en dicha condición. Además, estos parámetros
pueden cambiar durante la operación del circuito. La manera de resolver este
problema en la práctica es utilizar la siguiente condición en lugar de (8.52):
 
1  1 >1 (8.53)
Rin C1C+C 2 C12
2 + 1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre

Esto hace que al encender el circuito éste sea inestable por lo que sus oscilacio-
nes incrementarán su amplitud rápidamente. Sin embargo, este crecimiento en
la amplitud de las oscilaciones no se mantendrá de manera indefinida debido
a que, antes de que esto suceda, el transistor alcanzará las regiones de satura-
ción (voltaje de colector a emisor cero) y de corte (corriente de colector cero).
Por tanto, la relación entre Iout e I en la figura 8.35(b) realmente está deter-
minada por una función saturación como I = sat(Iout ) mostrada en la figura
8.39. La ganancia de corriente del transistor corresponde a la pendiente de
sat(Iout ), es decir, a dsat(I
dIout
out )
que depende de la amplitud de Iout . Por tanto,
el diagrama de bloques de la figura 8.35(b) debe ser cambiado por el de la
figura 8.40 y ahora se tiene que:
 
dsat(Iout ) 1  1 
G(jω)H(jω)|ω=w1 =
dIout Rin C1C+C2 C12
2 +
1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre
(8.54)

Nótese que la pendiente dsat(I out )


dIout es igual a la unidad para valores de Iout
cercanos a cero pero disminuye hacia cero conforme Iout se aleja de cero. Por
tanto, si se satisface (8.53), siempre existe una amplitud de las oscilaciones
para la cual el valor dado en (8.54) se convierte en la unidad y se consiguen las
oscilaciones sostenidas que se desean. Aunque esto sugiere que se puede diseñar
el valor del lado izquierdo de (8.53) tan grande como se desee, sin embargo
no es recomendable hacer ésto y se debe diseñar, en cambio, un valor cercano
a la unidad. La razón de esto es que valores muy grandes del lado izquierdo
de (8.53) requieren que se reduzca fuertemente la ganancia de corriente lo
cual implica que el circuito trabaje en una zona fuertemente no lineal y, como
consecuencia, la forma de onda sinusoidal sufrirá fuertes deformaciones.
8.3 Diseño de osciladores con forma de onda sinusoidal 487

I = sat(Iout)

1
1 Iout

Figura 8.39. Caracterı́stica real entre la corriente de emisor y la corriente de co-


lector en un transistor.

0 à I (s) Iout (s)


M (s )Z c(s )
à R in
+ à

dsat (I ou t )
dI ou t

Figura 8.40. Diagrama de bloques que considera la saturación en la corriente de


colector.

Es importante subrayar la diferencia entre lo que sucede en un transistor


y lo que sucede en un amplificador operacional. En un transistor aparece una
función saturación suave sat(Iout ) como resultado de la naturaleza no lineal
del transistor: la ganancia de corriente del transistor disminuye poco a poco al
incrementarse la amplitud de las oscilaciones. Por el contrario, un amplifica-
dor operacional es un dispositivo completamente lineal y su modelo no cambia
al crecer las amplitudes. Por ejemplo, considere el amplificador realimentado
R +R
de la figura 8.41, el cual tiene ganancia 1R1 f . Cuando se alcanza el voltaje
de saturación de salida del amplificador operacional se obtiene una saturación
dura como la mostrada en la figura 8.42. Esto significa que no hay una dismi-
nución progresiva de la ganancia del amplificador operacional realimentado,
R +R
sino que hay un cambio abrupto de 1R1 f a cero. Por tanto, no existe una
ganancia intermedia que asegure que la magnitud de la función de lazo abierto
dada en (8.6) sea igual a la unidad. Esta es la razón de porqué debe recurrirse
R +R
a un ajuste artificial de la ganancia 1R1 f usando el truco de los diodos zener
que se muestra en la figura 8.21.
488 8 Circuitos electrónicos realimentados

ei
eo

Rf
R1

Figura 8.41. Amplificador lineal.

eo

+ V sat
R f+R 1
R1

ei

à V sat

Figura 8.42. Saturación dura en un amplificador operacional.

Por otro lado, nótese que las condiciones (8.48), (8.50) se cumplen automáti-
camente si se satisface:
1
Rin ≫ (8.55)
ω1 C2

Las condiciones (8.42) y (8.55) son importantes para diseño como se explica
a continuación. La primera de estas condiciones asegura que la ganancia de
corriente de la configuración base común sea unitaria mientras que la segunda
asegura que el capacitor C2 no sea puesto en corto circuito por la resistencia
Rin pues si ası́ fuera no funcionarı́a correctamente la realimentación a través
de la red capacitiva formada por C1 y C2 . Nótese también que la expresión
entre corchetes en (8.53) representa la resistencia en paralelo de Rex , Rcobre y
Rin multiplicada por el factor constante [(C1 +C2 )/C1 ]2 . Normalmente Rin es
pequeña comparada con Rex y Rcobre . Si el factor (C1 + C2 )/C1 se selecciona
grande mediante:

C2 ≥ 10C1 (8.56)
8.3 Diseño de osciladores con forma de onda sinusoidal 489

entonces se asegura que el valor del factor entre corchetes en (8.53) es apro-
ximadamente la resistencia equivalente de Rex y Rcobre en paralelo. Entonces
el lado izquierdo de (8.53) está dado por el valor de esta resistencia equiva-
lente en paralelo (que es muy grande comparada con Rin ) dividido entre el
factor Rin (C1 + C2 )/C1 . Por tanto, si se usa (8.56) se puede conseguir que
este cociente sea tan sólo un poco mayor que la unidad. Por tanto, las reglas
de diseño del oscilador se resumen en (8.42), (8.55), (8.56), (8.47) y (8.53). Es
interesante mencionar que estas condiciones son las que aparecen en los libros
que tratan sobre el diseño electrónico de este tipo de osciladores [6], pág. 65,
[8], pág. 9-13.
Finalmente, es interesante resaltar las ventajas que en este problema tiene
el enfoque basado en la respuesta en frecuencia respecto del enfoque basado a
la respuesta en el tiempo (el estudio de la ubicación de los polos del sistema en
lazo cerrado). Si se intenta aplicar el segundo de estos métodos se encuentra un
polinomio caracterı́stico de grado cinco. Al intentar usar el criterio de Routh
para establecer las condiciones en las que hay polos imaginarios puros de lazo
cerrado se encuentra un gran problema: las condiciones resultantes quedan
expresadas de manera muy complicada y es muy difı́cil encontrar reglas de
diseño claras como las indicadas en (8.42), (8.47), (8.53), (8.55), (8.56).

Resultados experimentales

A continuación se diseña un circuito que genera una onda sinusoidal de


1.8 [MHz]. Los datos de diseño son los siguientes. vCC = 12[V], iEQ ≈ iCQ =
1.3[mA], vCEQ = 10.7[V].
Se selecciona un transistor PN2222A que cuenta con un valor de β = 200.
Usando (8.16) se encuentra:

RE = 1[KOhm]

A partir de iCQ = βiBQ se encuentra que iBQ = 6.5 × 10−3 [mA]. Por tanto,
de acuerdo a (8.18) se propone iR1Q = 1[mA]. Con esto y (8.17), (8.19), (8.20)
se calcula:

R1 = 2[KOhm], R2 = 10[KOhm]

Se cuenta con una inductancia de valor L = 0.328×10−3 [Hy], con una resisten-
cia interna en paralelo Rcobre = 101677[Ohm], capacitores C1 = 27×10−12 [F],
C2 = 200 × 10−12 [F] y se supondrá que no existe el capacitor C3 , es decir, que
C3 = 0. Nótese que esta selección de capacitores satisface aproximadamente
(8.56). Por tanto, usando (8.47) se encuentra que la frecuencia de oscilación
del circuito es f1 = 1.8018[MHz], es decir ω1 = 2πf1 = 1.132 × 107 [rad/s].
Por otro lado, también se supondrá que el oscilador no alimenta ninguna
carga externa lo cual significa que Rex → ∞, es decir 1/Rex = 0. Usando
Rt = 10000[Ohm], VT = 0.026[V], iEQ = 1.3[mA], (8.29) y (8.33) se encuentra
Rin = 10020[Ohm]. Con estos datos se obtiene:
490 8 Circuitos electrónicos realimentados
 
1  1  = 1.1363
Rin C1C+C 2 C12
+ 1
+ 1
1 Rin (C1 +C2 )2 Rex Rcobre

es decir, se satisface (8.53) además de (8.55) y (8.42). Por otro lado, se usa un
valor de CBP = 0.1 × 10−6 [F], por lo que ω1 C1BP = 0.883[Ohm]≪ RR11+R R2
2
=
1666[Ohm]. Además, 0.883[Ohm]≪ hib = 20[Ohm]. Por tanto, se cumplen to-
das las condiciones de diseño establecidas en el apartado anterior. En la figura
8.43 se muestran las variaciones de voltaje vo medidas entre las terminales de
la inductancia. La frecuencia medida en este experimento es de 1.388[MHz].

Figura 8.43. Forma de onda obtenida con Rt = 10000[Ohm].

Figura 8.44. Forma de onda obtenida con Rt = 11000[Ohm].


8.3 Diseño de osciladores con forma de onda sinusoidal 491

En la figura 8.44 se muestran las variaciones de vo cuando se utiliza un


valor de Rt = 11000[Ohm], con lo cual se obtiene:
 
1  1  = 1.0460 (8.57)
Rin C1C+C 2 C12
2 + 1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre

Esto significa que la ganancia de lazo disminuye. Nótese que al tener una
ganancia de lazo menor se requieren oscilaciones menos amplias y, por tanto,
una incursion menor de la señal dentro de la región no lineal del transistor para
conseguir la ganancia de lazo unitaria que asegura las oscilaciones sostenidas.
La mayor amplitud de las oscilaciones en el caso de la figura 8.43, cuando se
usa Rt = 10000[Ohm], también se explica de esta manera. De hecho, puede
alcanzarse a apreciar una ligera distorsión en la parte inferior de la onda
sinusoidal en el caso cuando se usa Rt = 10000[Ohm].
Finalmente, en las figuras 8.45(a), 8.45(b) y 8.46(a) se muestran, respec-
tivamente, las gráficas polares de M (s), Zc (s) y G(s)H(s) obtenidas con los
valores numéricos mencionados y Rt = 11000[Ohm]. Nótese el parecido entre
las figuras 8.45(a) y 8.37(b) ası́ como entre las figuras 8.45(b) y 8.36(b). Por
otro lado, las figuras 8.38 y 8.46(a) también son muy parecidas. La aparente
diferencia a frecuencias cercanas a cero se debe a que dicha parte no se alcanza
a apreciar en la figura 8.46(a) porque ocurre a frecuencias muy bajas. Esto se
verifica en la figura 8.46(b) donde se presenta un acercamiento en dicha parte
de la figura 8.46(a) y se alcanza a apreciar la parte de la gráfica polar a la
cual el eje real positivo es tangente en la figura 8.38. En la figura 8.46(a) se
puede apreciar que se cumple (8.57).
492 8 Circuitos electrónicos realimentados
Nyquist Diagram
0.1

0.08

0.06

0.04

System: M
Real: 0.119
0.02 Imag: 0.0047

Imaginary Axis
Frequency (rad/sec): 1.2e+007

0
! = 0ï ï
!= æ1
-0.02

-0.04

-0.06

-0.08

-0.1
-0.05 0 0.05 0.1 0.15
Real Axis

(a) M (s)

!= à1
ï! =0
!= +1

(b) Zc (s)

Figura 8.45. Gráficas polares usando los valores numéricos del circuito construido
experimentalmente.
8.3 Diseño de osciladores con forma de onda sinusoidal 493
Nyquist Diagram
1

0.8

0.6

0.4

System: GH
0.2 Real: -1.04
Imag: 0.00332

Imaginary Axis
Frequency (rad/sec): -1.13e+007
0
! = 0; æ 1 ï

-0.2

-0.4

-0.6

-0.8

-1
-1.2 -1 -0.8 -0.6 -0.4 -0.2 0 0.2
Real Axis

(a) G(s)H(s)
Nyquist Diagram
0.01

0.008

0.006

0.004

0.002
Imaginary Axis

−0.002

−0.004

−0.006

−0.008

−0.01
−0.01 −0.008 −0.006 −0.004 −0.002 0 0.002 0.004 0.006 0.008 0.01
Real Axis

(b) G(s)H(s) (acercamiento)

Figura 8.46. Gráficas polares usando los valores numéricos del circuito construido
experimentalmente (cont.).
494 8 Circuitos electrónicos realimentados

8.4. Resumen del capı́tulo


En este capı́tulo se ha mostrado como reducir la distorsión producida por
circuitos electrónicos no lineales, construir controladores analógicos usando
circuitos electrónicos realimentados y diseñar y construir circuitos osciladores
con forma de onda sinusoidal. La herramienta fundamental para resolver estos
problemas es la teorı́a de control clásico, que incluye la respuesta en el tiempo
y la respuesta en frecuencia.
En el caso de reducir la distorsión producida por circuitos electrónicos
no lineales, la idea fundamental es el uso de la función de transferencia de
sistema en lazo cerrado C(s) G(s)
R(s) = 1+G(s)H(s) . La solución no incluye ningún
análisis de estabilidad ya que se considera que los circuitos involucrados no
tienen dinámica, es decir, que se pueden modelar como simples ganancias
(posiblemente no lineales) y no como ecuaciones diferenciales.
En el caso de la construcción de controladores analógicos es importante
seleccionar el amplificador operacional más adecuado para cada aplicación. En
particular, se debe recordar que la ganancia de lazo abierto del amplificador
operacional (denominada A0 en el presente capı́tulo) en realidad no es una
constante sino que varı́a con la frecuencia a manera de un filtro pasa bajas.
Esto significa que si la planta a controlar funciona a altas frecuencias (lo cual
depende de la rapidez de la misma planta) entonces el valor de A0 puede
verse reducido a esa frecuencia. Por tanto, se deberá usar un amplificador
operacional que tenga un ancho de banda adecuado.
Finalmente, en el caso de los circuitos osciladores, es de fundamental im-
portancia el concepto de estabilidad marginal. Por tanto, los componentes del
circuito se deben seleccionar de manera que se alcance esta caracterı́stica de
funcionamiento. Las herramientas fundamentales para analizar y diseñar estos
circuitos son la técnica de la respuesta en el tiempo (ubicación de los polos de
lazo cerrado), en el caso de circuitos basados en amplificadores operacionales,
y la técnica de la respuesta en frecuencia (criterio de estabilidad de Nyquist),
en el caso de circuitos basados en transistores.

8.5. Preguntas de repaso


1. ¿Cuándo se dice que un sistema es marginalmente estable? ¿Por qué es
importante este concepto para construir circuitos osciladores?
2. ¿Por qué se dice que no se puede construir un buen oscilador usando un
circuito electrónico completamente lineal? ¿Por qué un circuito electrónico
no lineal resuelve el problema?
3. Un transistor es un dispositivo electrónico no lineal, entonces ¿Por qué se
usan técnicas de control lineal (función de transferencia y respuesta en
frecuencia) para diseñar circuitos osciladores basados en transistores?
8.5 Preguntas de repaso 495

4. ¿Por qué se necesita usar diodos zener en los osciladores basados en am-
plificadores operacionales? ¿Por qué no se usan diodos zener en los osci-
ladores basados en transistores?
5. ¿Qué es un modelo de señal pequeña para un transistor?
6. ¿Por qué cree que los circuitos osciladores sean sistemas con realimenta-
ción positiva?
7. Explique el mecanismo mediante el cual es posible reducir, usando reali-
mentación, la distorsión producida por circuitos electrónicos no lineales.
8. ¿Por qué se debe diseñar un circuito oscilador de manera que sea ligera-
mente inestable?
9. ¿Qué opina de la siguiente afirmación? La función de transferencia de lazo
abierto de un circuito oscilador es un filtro pasa banda.
10. De acuerdo a la pregunta anterior, ¿Qué determina la frecuencia de osci-
lación?
Referencias

1. A.R. Hambley, Electronics. A top-down approach to computer-aided circuit de-


sign, Macmillan Publishing Company, New York, 1994.
2. R.F. Coughlin and F. F. Driscoll, Amplificadores operacionales y circuitos inte-
grados lineales, 4a. edición, Prentice Hall Hispanoamericana, México, 1993.
3. N.S. Nise, Sistemas de control para ingenierı́a, 1a. edición en español, 1a. Re-
impresión, CECSA, México, 2004.
4. M. Alonso and E.J. Finn, Fı́sica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
5. W. Hayward, Introduction to radio frequency design, The American Radio Relay
League Inc., 1994.
6. P. H. Young, Electronic communication techniques, Merrill Publishing Company,
1990.
7. C.A. Desoer and E.S. Kuh, Basic circuit theory, International Student Edition,
McGraw-Hill, Tokyo, 13th printing 1983.
8. M. Kaufman y A.H. Seidman, Manual para ingenieros y técnicos en electrónica,
McGraw-Hill, México, 1987.
9
Control de velocidad de un motor de CD

R L
+ i + T Ê T c n1
u ea Jm bL
Tp
à à bm JL
n2 T L ò
Figura 9.1. Motor de CD con carga.

El problema del control de velocidad de un motor de CD es quizá uno


de los más sencillos debido a que el modelo de la planta a controlar es de
primer orden y a que, dada la disponibilidad de motores de CD comerciales
de diferentes capacidades, casi no es necesaria la construcción adicional de
partes mecánicas. Por otro lado, los sistemas de control de velocidad tienen
diversas e importantes aplicaciones en la industria que van desde las bandas
transportadoras hasta los procesos de aplanado de láminas metálicas usando
rodillos. Finalmente, otra razón para incluir este problema de control en la
presente obra es el hecho de que otros procesos de diferente naturaleza, como
los sistemas de control de temperatura y los sistemas de control de nivel,
pueden controlarse de manera similar (usando controladores proporcional-
integral) ya que sus modelos tienen la misma estructura.
500 9 Control de velocidad de un motor de CD

Objetivos del capı́tulo

Construir controladores tipo proporcional-integral usando un microcontro-


lador.
Construir la totalidad de las interfases electrónicas necesarias para cons-
truir el sistema de control completo.
Identificar las ventajas y desventajas de los controladores proporcional-
integral.
Aplicar a una situación experimental los conceptos de la teorı́a de control
clásico.
Un motor eléctrico es un dispositivo que es utilizado para proveer movi-
miento a un sistema mecánico. Existen muchos tipos de motores eléctricos: de
inducción [1], caps. 10 y 11, de paso a paso [2], sı́ncronos [3], de reluctancia
variable [4], de CD con escobillas y sin escobillas [5], cap. 10, etc. Sin embargo,
el motor de corriente directa (CD) con escobillas y con imán permanente es el
más sencillo de controlar. Más aún, dado que su modelo matemático es lineal
y de una entrada-una salida, es el motor ideal para ser usado como prototipo
experimental durante las etapas iniciales de aprendizaje en control automáti-
co. En este capı́tulo se estudia el control de velocidad de un motor de CD
con escobillas y con imán permanente. En el próximo capı́tulo se estudia el
control de posición de este mismo tipo de motor.

9.1. Modelo matemático


En la figura 9.1 se muestra un motor de CD con escobillas y con imán
permanente que mueve a una carga a través de una caja de engranes. La
nomenclatura utilizada es la siguiente.

u es el voltaje aplicado en las terminales de armadura del motor.


i es la corriente eléctrica de armadura.
Θ es la posición angular del rotor del motor.
θ es la posición angular de la carga.
ea = ke Θ̇ es la fuerza contra-electromotriz, donde ke es la constante de
fuerza contra-electromotriz.
T = km i es el par electromagnético generado, donde km es la constante de
par del motor.
Tc es el par equivalente de la carga reflejado sobre la flecha del motor. Este
par se opone al movimiento del motor (sentido contrario a Θ).
TL es el par aplicado (por el motor) sobre la carga.
Tp es un par de perturbación que se aplica desde el exterior. Se supone
que este par se opone al movimiento de la carga (sentido contrario a θ). Si
no es ası́ todo es cuestión de considerar que Tp es negativo.
L es la inductancia de armadura.
9.1 Modelo matemático 501

R es la resistencia de armadura.
Jm es la inercia del rotor del motor.
bm es la constante de fricción viscosa del motor.
JL es la inercia de la carga.
bL es la constante de fricción viscosa de la carga.
n1 y n2 representan el número de dientes del engrane del eje del motor y
del eje de la carga, respectivamente.

Nótese que un motor de CD es un sistema electromecánico compuesto por


un subsistema eléctrico y un subsistema mecánico. El modelo matemático
correspondiente se encuentra modelando por separado cada uno de estos sub-
sistemas para luego unirlos. A continuación se obtiene el modelo de cada una
de estas partes.

Modelo del subsistema eléctrico del motor

Aplicando la Ley de Kirchhoff de voltajes (véase la figura 9.1) se tiene:


X
voltaje aplicado = caı́das de voltaje en la malla
u = caı́da en la inductancia + caı́da en la resistencia +
+fuerza contraelectromotriz
di
u=L + R i + ea (9.1)
dt
donde, de acuerdo a (2.38) en el capı́tulo 2, la fuerza contraelectromotriz
está dada como:

ea = ke Θ̇

y el punto “ ˙ ” representa la primera derivada respecto al tiempo.

Modelo del subsistema mecánico del motor

En esta parte debe usarse la Segunda Ley de Newton. Como existen dos
cuerpos diferentes debe aplicarse la Segunda Ley de Newton a cada uno de
estos cuerpos por separado.

Modelo del rotor

X
inercia × aceleración angular = pares sobre la inercia Jm
Jm Θ̈ = par generado − par de fricción − par de carga
Jm Θ̈ = T − bm Θ̇ − Tc (9.2)
502 9 Control de velocidad de un motor de CD

donde, de acuerdo a (2.39) en el capı́tulo 2, el par electromagnético generado


está dado como:

T = km i

La suma en el miembro derecho de (9.2) es una suma vectorial por lo que el


signo indica el sentido en que se aplican los pares. Un signo negativo indica
que dicho par se opone al movimiento de la inercia Jm mientras que un signo
positivo indica que dicho par favorece el movimiento de la inercia Jm .

Modelo de la carga

Dada la presencia de una caja de engranes, es necesario utilizar (2.32) y


(2.33), vistas en el capı́tulo 2, para concluir que:
n2
Θ = n θ, n= (9.3)
n1
TL = n T c (9.4)

donde n1 y n2 representan, respectivamente, el número de dientes del engrane


unido al eje del motor y al eje de la carga. Aplicando la Segunda Ley de
Newton a la carga:
X
inercia × aceleración angular = pares sobre la inercia JL
JL θ̈ = TL − bL θ̇ − Tp (9.5)

Usando (9.2), (9.5), (9.3) y (9.4) se obtiene el modelo combinado del motor
de CD y la carga como:
1
Jm Θ̈ = km i − bm Θ̇ − TL
n
1³ ´
Jm Θ̈ = km i − bm Θ̇ − JL θ̈ + bL θ̇ + Tp
n
1³ ´
n Jm θ̈ = km i − bm nθ̇ − JL θ̈ + bL θ̇ + Tp
n
¡ 2
¢ ¡ 2
¢
n Jm + JL θ̈ + n bm + bL θ̇ = n km i − T p (9.6)

Si se define:
J = n2 Jm + JL , b = n2 bm + bL (9.7)
entonces se puede escribir (9.6) como:

J θ̈ + bθ̇ = n km i − Tp (9.8)

Finalmente, el modelo matemático del motor completo está dado por (9.1) y
(9.8), es decir:
9.2 Amplificador de potencia 503

di
L = u − R i − n ke θ̇ (9.9)
dt
J θ̈ = −b θ̇ + n km i − Tp (9.10)

Nótese que la ecuación diferencial en (9.10) es idéntica a la presentada en


(2.92) correspondiente al sistema mostrado en la figura 2.28(a) de capı́tulo 2.
Las únicas diferencias se deben a que (2.92) se deja expresada en términos del
par externo aplicado (igual a km i en un motor de CD) y que en (2.92) no se
considera ningún par externo sobre el cuerpo 2 (Tp = 0).
Las ecuaciones diferenciales (9.9) y (9.10) representan el modelo matemáti-
co del conjunto motor de CD-carga porque si se conocen todas las constantes
ası́ como el voltaje de armadura aplicado, u, se puede resolver la ecuación di-
ferencial para calcular la posición de la carga, θ, como una función del tiempo.
Aplicando la transformada de Laplace a las ecuaciones (9.9) y (9.10) conside-
rando todas las condiciones iniciales iguales a cero se encuentra:
1
I(s) = [U (s) − n ke sθ(s)] (9.11)
sL + R
1
θ(s) = 2 [n km I(s) − Tp (s)] (9.12)
s J + sb
donde I(s), U (s), θ(s), Tp (s) representan las transformadas de Laplace de i,
u, θ y Tp , respectivamente.

9.2. Amplificador de potencia


Es importante subrayar la necesidad de usar un amplificador de potencia.
Un sistema de control se puede dividir en dos partes: i) la parte de control y
ii) la parte de potencia. La parte de control incluye a toda la parte electrónica
encargada de procesar la información (sensores y algoritmos de control) que
es utilizada para determinar cual es la orden que debe ser enviada al proceso
a controlar. Esta tarea requiere de circuitos precisos que funcionan utilizando
niveles bajos de corriente, es decir, procesan información pero no procesan
niveles importantes de potencia por lo que las ordenes que envı́an son débiles.
Sin embargo, estas ordenes deben ser capaces de producir cambios importan-
tes en la entrada del proceso a controlar y generalmente la entrada del proceso
maneja niveles importantes de potencia para poder producir los cambios es-
perados en el proceso. Esta es la razón de incluir la etapa de potencia en un
sistema de control. La etapa de potencia normalmente consiste de un ampli-
ficador de potencia que a su entrada recibe la débil señal entregada por el
controlador (señal de control) y a su salida entrega una señal de alta potencia
que se aplica directamente a los actuadores colocados en la entrada del pro-
ceso a controlar. Por ejemplo, en los sistemas electromecánicos los actuadores
utilizados son motores eléctricos que son equipos capaces de transformar una
señal eléctrica en la fuerza o el par que necesita el mecanismo para realizar el
504 9 Control de velocidad de un motor de CD

movimiento deseado. La señal de control es una señal eléctrica débil entrega-


da por el controlador (computadora, microcontrolador o circuitos electrónicos
analógicos) mientras que un motor eléctrico necesita una señal de gran poten-
cia para producir la fuerza requerida. Ası́, el amplificador de potencia utilizado
se debe colocar entre la señal entregada por el controlador y la señal aplicada
al motor eléctrico. De acuerdo a esto, un amplificador de potencia se puede
modelar como una ganancia Ap que relaciona al voltaje recibido en su entrada
ui (señal de control) con el voltaje entregado en su salida u (en las terminales
de armadura del motor):

u = Ap ui (9.13)

9.3. Control de corriente

Una técnica de control para motores eléctricos que es muy usada en la


industria [5], pág. 76, [6], [7], consiste en colocar un lazo interno de corriente.
En su forma más sencilla este lazo consiste en un controlador proporcional de
corriente. Esto significa que la señal de control se calcula como:

ui = K(i∗ − i) (9.14)

donde K es una constante positiva que representa la ganancia del controlador


proporcional de corriente mientras que i∗ representa la consigna de corriente
que debe ser obtenida como la salida de otro controlador (lazo externo) que se
encarga de controlar la variable deseada, es decir, la velocidad o la posición.
Más adelante se explicará como se diseña dicho lazo externo de control. Por
lo pronto supóngase que i∗ es simplemente el valor deseado de corriente que
será especificado de algún modo. Usando (9.13) y (9.14) se encuentra que el
voltaje aplicado en las terminales de armadura del motor de CD está dado
como:

u = Ap K(i∗ − i) (9.15)

Aplicando la transformada de Laplace a (9.15) se encuentra:

U (s) = Ap K(I ∗ (s) − I(s)) (9.16)

donde I ∗ (s) es la transformada de Laplace de i∗ . Combinando (9.11), (9.12) y


(9.16) se obtiene el diagrama de bloques de la figura 9.2(a). Como se muestra
en el ejemplo 4.4 de la sección 4.1 a partir de la figura 9.2(a) se pueden
hacer las simplificaciones mostradas en las figuras 9.2(b) y 9.2(c). También se
muestra en el ejemplo 4.4 de la sección 4.1 que, a partir de la figura 9.2(c), se
puede escribir:

θ(s) = G1 (s)I ∗ (s) + G2 (s)Tp (s) (9.17)


9.3 Control de corriente 505
U i ( s) T p ( s)
à
I ã(s) + U ( s) 1 I(s) + 1 ò ( s)
K Ap nkm
+ Ls+R Js 2 +bs
à
à

nke s

(a)
T p ( s)
I ã(s) + à ò(s)
+ 1 I(s) + 1
KAp nkm
Ls+R Js 2 +bs
à à

nke
KA p
s
(b)
T p ( s)
à
I ã(s) + KA p I(s) + 1 ò(s)
nkm
Ls+R+KA p Js 2 +bs
à

nke
KA p
s

(c)
T p ( s)
à
I ã(s) + ò ( s)
1
nkm Js 2 +bs

(d)

Figura 9.2. Diagramas de bloques equivalentes para un motor de CD con un lazo


proporcional de corriente y un amplificador de potencia.

donde:
nkm
G1 (s) = h³ ´
2k k
i (9.18)
sL+R
KAp + 1 (sJ + b) + nKAm e
p
s
³ ´
− sL+R
KAp + 1
G2 (s) = h³ ´ 2k k
i (9.19)
sL+R
KAp + 1 (sJ + b) + nKAm e
p
s
506 9 Control de velocidad de un motor de CD

Si la ganancia K se selecciona suficientemente grande entonces se puede con-


siderar que [5], pág. 76:

sL + R n2 km ke
≈ 0, ≈0
KAp KAp
para aproximar (9.18) y (9.19) como:
nkm
G1 (s) = (9.20)
s2 J + sb
−1
G2 (s) = 2 (9.21)
s J + bs
Usando (9.20) y (9.21) en (9.17) se obtiene:
1
θ(s) = [nkm I ∗ (s) − Tp (s)] (9.22)
s2 J + sb
lo cual se representa usando un diagrama de bloques en la figura 9.2(d). Nótese
que el objetivo del control de corriente mostrado en (9.15) es hacer desprecia-
ble la dinámica eléctrica del motor de manera que el modelo del motor ahora
sólo está representado por la parte mecánica del mismo. Esto puede apreciarse
claramente si se comparan (9.22) y (9.12). Estas dos expresiones indican que
ahora puede considerarse que es la corriente la que se utiliza como variable
de control y no el voltaje como se indicaba en (9.11). Es claro que el voltaje
sigue siendo la variable que se manipula directamente como lo indica (9.15),
sin embargo, para propósitos de análisis y diseño del sistema de control se
puede suponer que es la corriente la que se manipula directamente a través
de la consigna de corriente i∗ . El propósito del control de corriente (9.15) es
conseguir que el valor actual de la corriente i siga de cerca a la consigna i∗
para lo cual es muy conveniente usar un valor grande de la ganancia K. Nótese
que la expresión en (9.22) se puede reescribir como se muestra a continuación:
1 1
θ(s) = [kI ∗ (s) − Tp (s)] (9.23)
s(s + a) J
b nkm
a= , k=
J J
Finalmente, dado que la velocidad ω y la posición θ se relacionan a través de
ω = dθ
dt , entonces usando la transformada de Laplace con condiciones iniciales
cero se tiene que ω(s) = sθ(s). Por tanto, la expresión en (9.23) se puede
reescribir como:
1 1
ω(s) = sθ(s) = [kI ∗ (s) − Tp (s)] (9.24)
s+a J
En lo que resta de este capı́tulo se utilizará el modelo dado en (9.24) para
diseñar controladores de velocidad. También se presentarán algunos resultados
experimentales obtenidos con dichos controladores.
9.4 Identificación 507

9.4. Identificación
En esta sección es de interés realizar un experimento que permita conocer
los valores de las constantes k y a del modelo en (9.24). A continuación se
explica la manera de diseñar dicho experimento.
Suponga que no hay ninguna perturbación externa aplicada, es decir
Tp (s) = 0, por lo que el modelo (9.24) se reduce a:

k
ω(s) = I ∗ (s) (9.25)
s+a
Este es un sistema de primer orden como el estudiado en la sección 3.1. Por
tanto, si se aplica el valor constante i∗ = A, es decir I ∗ (s) = As , entonces la
velocidad ω evolucionará en el tiempo como se muestra en la figura 9.3, es
decir:

!(t)

kA
a

0:632 kA
a

ü ü ü ü ü ü ü
tiempo

Figura 9.3. Evolución de la velocidad de un motor de CD cuando se aplica un valor


constate i∗ = A.

kA ¡ ¢
ω(t) = 1 − e−at (9.26)
a
La constante de tiempo τ se puede medir como se muestra en la figura 9.3
y sabiendo que τ = a1 , se puede calcular el valor del parámetro a. Por otro
508 9 Control de velocidad de un motor de CD

lado, definiendo el valor final de velocidad como ωf = lı́mt→∞ ω(t) = kA a y



conociendo el valor de a, se puede calcular k = Af .
En la figura 9.4 se presentan los resultados obtenidos al realizar el experi-
mento descrito en el procedimiento anterior. El ruido contenido en la medición
de velocidad es evidencia de un hecho bien conocido en sistemas de control:
la velocidad es una señal ruidosa. Véase la sección 9.6 para una explicación
de porqué ω se mide en volts. Se utiliza un valor i∗ = A = 0.3[A] y midiendo
directamente en la figura 9.4 se encuentran los valores:

τ = 2.7[s], ωf = 2[V] (9.27)

Estas mediciones se simplifican y al mismo tiempo se hacen más exactas si


se utiliza un programa de computadora para realizarlas. Con estos valores se
sigue el procedimiento indicado previamente para encontrar que:

a = 0.3704, k = 2.4691 (9.28)

Finalmente, es importante aclarar que no es de interés calcular el valor del


factor 1/J que aparece como coeficiente de la perturbación Tp (s) en (9.24).
La razón de esto es que normalmente incluso el valor de Tp no es conocido y
a pesar de ello su efecto puede ser compensado.

!
[V]

0:632 â 2

ï
ü = 2:7 tiempo [s]

Figura 9.4. Identificación experimental de un motor de CD.


9.5 Control de velocidad 509

9.5. Control de velocidad


El diseño de un controlador tiene como objetivo asegurar que en lazo cerra-
do se consigan las caracterı́sticas deseadas de respuesta transitoria y en estado
estacionario. Las caracterı́sticas de respuesta transitoria se refieren a la cons-
tante de tiempo (rapidez de respuesta) deseada, la cual se asigna mediante
la ubicación conveniente de los polos de lazo cerrado. Por otro lado, las ca-
racterı́sticas de respuesta en estado estacionario se consiguen al asegurar que
cuando el tiempo crece el valor de la velocidad ω alcanza la velocidad deseada
ωd a pesar de la presencia de una perturbación externa Tp (s). El controla-
dor es el dispositivo que se encarga de que se satisfagan las caracterı́sticas de
respuesta transitoria y en estado estacionario del sistema en lazo cerrado.
Suponga que la velocidad deseada es una constante o un escalón, es decir
ωd es una constante. Dado que la planta en (9.24) no tiene polos en s = 0
entonces es de tipo 0. Esto significa que el uso de un controlador proporcional
de velocidad de la forma i∗ = kp (ωd − ω), con kp > 0, no puede conseguir
que ω = ωd en estado estacionario incluso si no hay perturbaciones externas
de par, es decir, aún cuando Tp = 0. La solución a este problema es utilizar
un controlador que tenga una acción integral, para que el sistema sea de tipo
1, es decir usar un controlador proporcional-integral (PI). Sin embargo, tal
como se explica en la sección 5.2.4, un controlador PI no puede conseguir
simultáneamente las caracterı́sticas de respuesta transitoria deseadas y un
rechazo satisfactorio de las perturbaciones externas Tp (s). Por esta razón, a
continuación se muestra la manera de construir un controlador PI modificado
que puede conseguir simultáneamente estos requerimientos.

9.5.1. Un controlador PI modificado

Aplicando la transformada inversa de Laplace a (9.24) se obtiene la si-


guiente ecuación diferencial:
1
ω̇ + aω = ki∗ − Tp (9.29)
J
A continuación se demuestra que el siguiente controlador:
Z t
∗ a
i = kp (ωd − ω) + ki (ωd − ω(r))dr + ωd + k1 (ω(0) − ωd ) (9.30)
0 k
donde ω(0) es la velocidad inicial, consigue que ante una velocidad deseada
constante ωd la velocidad ω alcance dicho valor deseado en estado estacionario,
que responda con una constante de tiempo fijada a voluntad y que el efecto
de una perturbación constante Tp desaparezca tan rápido como se desee.
Sustituyendo (9.30) en (9.29) y acomodando términos se encuentra:
Z t
1
ω̇ + (a + kp k)(ω − ωd ) + ki k (ω(r) − ωd )dr = k1 k(ω(0) − ωd ) − Tp
0 J
510 9 Control de velocidad de un motor de CD

Definiendo:

kp = kp′ + k1

se obtiene:
Z t
ω̇ + (a + kp′ k)(ω − ωd ) + ki k (ω(r) − ωd )dr
0
1
+k1 k[ω − ωd − (ω(0) − ωd )] = − Tp
J
Nótese que:
Z t
ω − ωd − (ω(0) − ωd ) = (ω̇(r) − ω̇d )dr
0

y si además de define:

ki = ki′ k1

entonces:
Z t
ω̇ + (a + kp′ k)(ω − ωd ) + k1 k [ki′ (ω(r) − ωd ) + (ω̇(r) − ω̇d )] dr
0
1
= − Tp (9.31)
J
Pero como ωd es una constante, entonces ω̇d = 0. Ası́ que si se define:

ki′ = a + kp′ k
Z t
ξ= [ω̇(r) + ki′ (ω(r) − ωd )] dr
0

entonces se puede escribir (9.31) como:


1
ξ˙ + k1 kξ = − Tp
J
Aplicando la transformada de Laplace con condiciones iniciales cero:

− J1
ξ(s) = Tp (s)
s + k1 k
o también:
− J1 s
sξ(s) = Tp (s) (9.32)
s + k1 k
td
Si Tp = td es una constante, es decir Tp (s) = s entonces:
9.5 Control de velocidad 511

− J1 s td
sξ(s) =
s + k1 k s
Aplicando el teorema del valor final se tiene:
˙ = lı́m s [sξ(s)]
lı́m ξ(t)
t→∞ s→0
· ¸
− J1 s td
= lı́m s =0
s→0 s + k1 k s
˙ =
Ası́ que si k1 k > 0, el filtro en (9.32) es estable y se asegura que lı́mt→∞ ξ(t)
˙
0. Más aún, la rapidez con que ξ(t) se aproxima a cero es mayor conforme
k1 k > 0 es mayor. Nótese que lı́mt→∞ ξ(t) ˙ = 0 implica que:
Z
d t
[ω̇(r) + ki′ (ω(r) − ωd )] dr = ω̇ + ki′ (ω − ωd ) → 0
dt 0
también tiende a cero. Esto significa que el efecto de la perturbación constante
desaparece al crecer el tiempo y sólo queda la ecuación diferencial ω̇ + ki′ ω =
ki′ ωd , la cual es estable si ki′ > 0, tiene constante de tiempo τ = k1′ y tiene
i
ganancia unitaria en estado estacionario. Todo esto significa que:
Si no hay perturbación (Tp = 0 y ξ(t) ˙ = 0 para todo t ≥ 0), la respuesta
en velocidad es como la de un sistema de primer orden con constante de
tiempo τ = k1′ . La velocidad ω alcanza la velocidad deseada ωd (constante)
i
en estado estacionario.
Si aparece una perturbación constante (Tp = td 6= 0), la desviación pro-
ducida por la perturbación desaparece al crecer el tiempo. Más aún, si
se escoge un valor de k1 mayor (de manera que el producto k1 k > 0 es
mayor), entonces la desviación producida por la perturbación desaparece
más rápido. Si una vez que la desviación debida a la perturbación es lle-
vada a cero (cuando ω = ωd ) se ordena un cambio en el valor constante
de ωd (se ordena un cambio de velocidad deseada ωd estando presente la
perturbación Tp ), entonces la velocidad responde como si la mencionada
perturbación constante Tp no existiera, es decir, como en el punto anterior:
con una constante de tiempo τ = k1′ y la velocidad ω alcanza la velocidad
i
deseada ωd en estado estacionario.
Debido a que en control clásico siempre se supone que todas las condiciones
iniciales son cero, entonces se puede suponer que ω(0) = 0 y el controlador en
(9.30) se escribe como:
Z t ³a ´

i = kp (ωd − ω) + ki (ωd − ω(r))dr + − k1 ωd (9.33)
0 k
que constituye un simple controlador PI con un término constante de prea-
limentación. Finalmente, la regla de sintonı́a es resumida por la siguientes
expresiones:
512 9 Control de velocidad de un motor de CD

kp = kp′ + k1 (9.34)
ki = ki′ k1
ki′ = a + kp′ k

donde:
kp′ > 0 se elige de modo que quede fijada la constante de tiempo deseada
τ = k1′ = a+k 1
′ k , la cual siempre es menor que la constante de tiempo de
i p

la planta a controlar a1 , lo cual es muy conveniente.


k1 > 0 se elige grande para reducir rápidamente a cero la desviación de-
bida a la perturbación. Esto puede hacerse al tanteo o puede calcularse
recordando que k11k es la constante de tiempo del filtro en (9.32), el cual
es el responsable de eliminar la desviación producida por la perturbación.
Otra manera (más conocida) de diseñar un controlador PI con las mismas
ventajas que el que se acaba de presentar es usando el concepto de contro-
ladores con dos grados de libertad. Esto es lo que se muestra en la siguiente
sección.

9.5.2. Un controlador con dos grados de libertad

Un sistema en lazo cerrado que cuenta con un controlador con dos grados
de libertad tiene la estructura mostrada en la figura 9.5. El controlador esta
formado por los dos componentes con funciones de transferencia Gc1 (s) y
Gc2 (s), mientras que Gp (s) es la planta que se desea controlar. También se
toma en cuenta la presencia de una perturbación a la entrada de la planta
D(s). En el ejemplo 4.5 de la sección 4.1 se muestra que la salida del sistema
en lazo cerrado se puede calcular como:

ω(s) = G1 (s)ωd (s) + G2 (s)D(s)

donde:
Gc1 (s)Gp (s)
G1 (s) =
1 + (Gc1 (s) + Gc2 (s))Gp (s)
Gp (s)
G2 (s) = (9.35)
1 + (Gc1 (s) + Gc2 (s))Gp (s)
son las funciones de transferencia:
ω(s)
G1 (s) = , cuando D(s) = 0
ωd (s)
ω(s)
G2 (s) = , cuando ωd (s) = 0
D(s)
La razón por la cual este esquema recibe el nombre de controlador de dos
grados de libertad es que las dos funciones de transferencia definidas en (9.35)
9.5 Control de velocidad 513

pueden ser sintonizadas independientemente una de la otra utilizando para


ello, como variables independientes (o grados de libertad), a las dos partes del
controlador Gc1 (s) y Gc2 (s). Dado que la planta que interesa en este capı́tulo

D(s)
+
! d (s) + I ã(s) !(s)
G c1 (s) G p ( s)
+ +
à à

G c2 (s)

Figura 9.5. Sistema en lazo cerrado usando un controlador con dos grados de
libertad.

es un motor de CD, suponga que:


k
Gp (s) =
s+a
Suponga también que Gc1 (s) y Gc2 (s) son controladores PI, es decir:
kp1 s + ki1 kp2 s + ki2
Gc1 (s) = , Gc2 (s) =
s s
kp s + ki
Gc (s) = Gc1 (s) + Gc2 (s) = , kp = kp1 + kp2 , ki = ki1 + ki2
s
Por tanto, la primera función de transferencia en (9.35) se puede escribir como:
k
ω(s) Gc1 (s) s+a
= k s+k k
ωd (s) 1 + p s i s+a
skGc1 (s)
= (9.36)
s2 + (a + kp k)s + ki k
Suponga que se desea que la respuesta en lazo cerrado, ante una referencia
deseada, sea la de un primer orden con un polo en s = −p1 , con p1 > 0.
Entonces el polinomio caracterı́stico en la expresión anterior debe satisfacer:
s2 + (a + kp k)s + ki k = (s + p1 )(s + f )
= s2 + (p1 + f )s + p1 f
donde la raı́z en s = −f , f > 0, se introduce sólo para conseguir un poli-
nomio de segundo orden en el miembro derecho de esta expresión. Igualando
coeficientes en ambos miembros se obtiene:
514 9 Control de velocidad de un motor de CD

a + kp k = p1 + f, ki k = p1 f

de donde se encuentra:
p1 + f − a p1 f
kp = , ki =
k k
Por otro lado, con el fin de que la respuesta ante una referencia deseada sea
la de un primer orden con un polo en s = −p1 , la función de transferencia en
(9.36) debe tener la forma:
ω(s) p1 (s + f ) p1 (s + f ) p1
= 2 = = (9.37)
ωd (s) s + (a + kp k)s + ki k (s + p1 )(s + f ) s + p1

Por tanto, igualando (9.36) y (9.37) se encuentra que:

skGc1 (s) = p1 (s + f )

de donde se concluye que Gc1 (s) es un controlador PI:


kp1 s + ki1 p1 p1 f
Gc1 (s) = , kp1 = , ki1 =
s k k
Con este resultado se puede calcular Gc2 (s) como:
kp2 s + ki2 f −a
Gc2 (s) = Gc (s) − Gc1 (s) = , kp2 = , ki2 = 0
s k
Es decir, Gc2 (s) = kp2 es un controlador proporcional. Por otro lado, la se-
gunda función de transferencia en (9.35) toma la forma:
k
ω(s) s+a
= kp s+ki k
D(s) 1+ s s+a
ks
=
s2
+ (a + kp k)s + ki k
ks
= (9.38)
(s + p1 )(s + f )
Usando esta expresión y el teorema del valor final se puede comprobar que
td
el efecto de una perturbación externa constante D(s) = − Jks desaparece
conforme el tiempo crece. Más aún, la rapidez con que esto sucede es mayor
conforme f y p1 son mayores. Como p1 está fijada por la rapidez de respuesta
deseada ante una referencia constante, entonces f es el parámetro que que-
da libre. Entonces, f debe escogerse grande. De acuerdo a la figura 9.5, el
controlador está dado como:

I ∗ (s) = Gc1 (s)(ωd (s) − ω(s)) − Gc2 (s)ω(s)


(ωd (s) − ω(s))
= kp1 (ωd (s) − ω(s)) + ki1 − kp2 ω(s)
s
9.6 Prototipo experimental 515

(ωd (s) − ω(s))


= (kp1 + kp2 )(ωd (s) − ω(s)) + ki1 − kp2 ωd (s)
s
(ωd (s) − ω(s))
= kp (ωd (s) − ω(s)) + ki1 − kp2 ωd (s)
s
(9.39)

Usando la transformada inversa de Laplace se obtiene finalmente:


Z t
i∗ = kp (ωd − ω) + ki1 (ωd − ω(r))dr − kp2 ωd (9.40)
0

Nótese que los controladores en (9.40) y (9.33) son idénticos si se define:

f
k1 = , p1 = ki′
k
Por tanto, se deja al criterio del lector decidir cual de los enfoques presentados
en las secciones 9.5.1 o 9.5.2 para obtener este controlador es el que prefiere.

9.6. Prototipo experimental

A continuación se listan los componentes principales del sistema de control.


Microcontrolador PIC16F877A [8].
Convertidor digital/analógico de 8 bits DAC0800LCN.
2 motores de CD con escobillas e imán permanente. Voltaje nominal de
24[V], corriente nominal de 2.3[A].
Las flechas de los dos motores se unen de modo que uno de los motores se
utiliza como generador. El voltaje generado es utilizado como la medición de
la velocidad del otro motor el cual es controlado de acuerdo a la ley de control
en (9.33).
En la figura 9.6 se muestra el diagrama eléctrico utilizado para construir
el sistema de control de velocidad. El algoritmo de control en (9.33) se calcula
usando el microcontrolador PIC16F877A. Es decir, conocido el valor deseado
de velocidad ωd y la medición de la velocidad ω, el microcontrolador calcula
el valor de la señal de control i∗ en (9.33). En la sección 9.9 se muestra el
listado del programa utilizado.
A continuación se describe la manera en que el microcontrolador PIC16F87
7A realiza su función de controlador. Antes que nada se debe aclarar que no
es el propósito presentar toda una exposición de como trabaja este micro-
controlador. Lo que se presenta es una descripción de los recursos de este
microcontrolador que se utilizan para construir el controlador bajo prueba.
Se usa el canal 0 del convertidor analógico/digital con que cuenta este mi-
crocontrolador. Sólo se utilizan los 8 bits más significativos de este convertidor
el cual tiene un rango analógico de entrada de [0,+5][V]. Por tanto, el dato
516 9 Control de velocidad de un motor de CD

Figura 9.6. Diagrama eléctrico del sistema de control de velocidad de un motor de


CD.
9.6 Prototipo experimental 517

entregado por el convertidor t 0 es sometido a la operación: w=0.0196*t 0


(donde 0.0196=5/255) para obtener en la variable w el voltaje a la entrada
del convertidor analógico/digital. Este voltaje es el entregado por el motor que
se utiliza como generador y es proporcional a la velocidad del motor que se
quiere controlar. Por tanto, se asume que este voltaje representa el valor me-
dido de velocidad. Nótese que antes de entrar al convertidor analógico/digital
(por el pin 2 del microcontrolador), el voltaje del generador pasa a través de un
divisor de tensión que tiene como función adaptar el máximo voltage generado
(12.3[V] a velocidad máxima) a un valor de 5[V], es decir dentro del rango del
voltaje analógico que maneja el convertidor analógico/digital. El amplificador
operacional TL081 es utilizado para proteger al microcontrolador.
Tal como se indica en la figura 9.6 el valor de −i∗ debe aparecer a la entra-
da del amplificador operacional TL081 dentro del recuadro titulado “control
de corriente”. Esto se consigue del siguiente modo. Primero, en el programa
listado en la sección 9.9 se hace iast=-iast, para cambiar el signo de i∗ a −i∗ .
El microcontrolador debe entregar un código digital (iastd) de 8 bits al conver-
tidor digital/analógico de 8 bits DAC0800LCN. Para esto, el microcontrolador
realiza la operación:

iastd = 36.4286 ∗ iast + 127

la cual obedece a la relación mostrada gráficamente en al figura 9.7. Una vez

iastd

255

127

à 3:5 3:5 iast

Figura 9.7. Acondicionamiento de la señal i∗ que debe ser enviada al convertidor


digital-analógico.

calculada “iastd” se entrega al convertidor digital/analógico a través del puer-


to D (PORTD=iastd). El convertidor digital/analógico trabaja en conjunto
con un amplificador operacional TL081. Estos dispositivos están conectados
de acuerdo a las sugerencias del fabricante [9]. Esto asegura que a la salida del
518 9 Control de velocidad de un motor de CD

amplificador operacional se obtiene un voltaje cuyo valor numérico correspon-


de al de −i∗ . Este valor es recibido por otro amplificador operacional TL081
que se encarga de evaluar el lazo de corriente:

ui = 100(i∗ − i)

La razón de que deba aparecer −i∗ en el lugar que se indica en la figura 9.6
tiene que ver con la compatibilidad de signos que deben respetar los amplifi-
cadores operacionales colocados en dicha figura. Por otro lado, el amplificador
de potencia de ganancia unitaria está constituido por un tercer amplificador
operacional TL081 junto con dos transistores de potencia TIP141 y TIP145,
conectados en simetrı́a complementaria
El Manejador/Receptor MAX232 se encarga de enviar la velocidad medi-
da ω y la señal de control i∗ hacia una computadora portátil (a través de un
conector USB a serie) cuyo único propósito es el graficado de dichas variables.
Esto se hace a través de las variables “cuentaH=0x00” y “cuentaL=t 0” (para
enviar la velocidad) o “cuentaH=0x00” y “cuentaL=(iastd) &(0xFF)” (para
enviar la señal de control). Estos datos son enviados a la computadora portátil
mediante las instrucciones: putc(0xAA); putc(cuentaH); putc(cuentaL);. Fi-
nalmente, el timer TMR0 es utilizado para establecer un periodo de muestreo
T = 0.002[seg] (40 cuentas del timer 0).

9.6.1. Control de corriente

El lazo de corriente presentado en (9.14) se construye del siguiente modo.


Se conecta una resistencia de potencia (de cerámica) de 1[Ohm] en serie con
la armadura del motor de CD. Esto permite que en las terminales de dicha
resistencia aparezca un voltaje que numéricamente es igual a la corriente i
que circula por el motor. Entonces, el amplificador operacional mostrado en
el bloque “control de corriente” de la figura 9.6 realiza la operación indicada
en (9.14) con K = 100.

9.6.2. Amplificador de potencia

De acuerdo a lo expuesto en la sección 8.1.2 el bloque denominado “ampli-


ficador de potencia” en la figura 9.6 permite reducir la zona muerta introdu-
cida por los transistores de potencia conectados en simetrı́a complementaria.
Además, con los valores ahı́ presentados se consigue Ap = 1 en (9.13) y en
(9.15). Esto permite obtener Ap K = 100. Este valor fue elegido porque con
él se obtuvieron resultados satisfactorios. Es ilustrativo resaltar que en los
manejadores comerciales para uso industrial es común encontrar valores tan
grandes como Ap K = 700 [7].
9.7 Resultados experimentales 519

9.7. Resultados experimentales


En la figura 9.8 se muestran los resultados experimentales obtenidos con
el controlador en (9.33) (o equivalentemente con el controlador en (9.40)) y
con el prototipo experimental descrito en la sección previa. Partiendo de una
velocidad inicial igual a cero, se ordena la siguiente velocidad deseada que
tiene la forma de tres escalones sucesivos:

 1.5, 0 ≤ t < 4
ωd = 2.5, 4 ≤ t < 12 (9.41)

1.5, t ≥ 12
También se aplica, via software, una perturbación constante de valor Tp = 2.5

! 3

[V] 2.5

1.5

1 0:632 â 1:5
0.5

0 ï
0 2 4 6 8 10 12 14 16 18 20 22
0:623
iã 3
[A] 2

-1

-2

-3
0 2 4 6 8 10 12 14 16 18 20 22

tiempo [s]

Figura 9.8. Control de velocidad usando el controlador PI modificado mostrado en


(9.33) (o equivalentemente con el controlador en (9.40).

en t = 8[s], la cual desaparece en t = 17[s]. Las ganancias del controlador en


(9.33) se calculan de acuerdo a (9.34) junto con los valores numéricos en (9.28)
y:
kp′ = 0.5, k1 = 4.0
lo cual fija la constante de tiempo deseada en τ = 0.6231[s]. En la figura 9.8
se muestra la velocidad medida como resultado del experimento y una linea
520 9 Control de velocidad de un motor de CD

blanca que representa la respuesta, obtenida en simulación, del sistema sin


perturbaciones:

ω̇ + ki′ ω = ki′ ωd (9.42)


1
con ki′ = 0.6231 , es decir el valor calculado de acuerdo a (9.34), y con ωd dada en
(9.41). Nótese que la respuesta experimental de velocidad sigue exactamente
la respuesta teórica dictada por (9.42) y que esto sigue siendo cierto durante
la transición de ωd = 2.5 a ωd = 1.5 en t = 12[s] a pesar de que durante dicha
transición sigue aplicada la perturbación constante Tp = 2.5. Esto comprueba
las afirmaciones establecidas justo antes de (9.33). Además, es importante
subrayar que se han conseguido exactamente las especificaciones de respuesta
transitoria y de estado estacionario y además las desviaciones que aparecen
cuando se aplica y desaparece la perturbación externa son llevadas a cero
rápidamente.
A continuación se muestran los resultados obtenidos con un controlador
PI clásico con el fin de comparar con los resultados obtenidos en la figura 9.8.
En la figura 9.9 se muestran los resultados obtenidos usando un controlador
PI clásico cuando se seleccionan las ganancias de acuerdo a:
ki 1
= a, τ= = 0.6231[s] (9.43)
kp kp k

según se discute en la sección 5.2.4, con τ la constante de tiempo deseada en


lazo cerrado. La velocidad deseada ωd es idéntica a la mostrada en (9.41) y se
aplica una perturbación idéntica a la usada en la figura 9.8, es decir, se aplica
via software una perturbación constante de valor Tp = 2.5 en t = 8[s], la cual
desaparece en t = 17[s]. Se observa lo siguiente:
La parte transitoria de la respuesta, aunque cercana a la deseada, no es
tan exacta como en la figura 9.8 (la lı́nea tenue representa la respuesta
transitoria deseada).
La velocidad medida en estado estacionario alcanza la velocidad deseada
cuando no hay perturbación externa aplicada, es decir, antes de t = 8[s].
La desviación producida por la aparición de una perturbación externa es
mucho más grande que en la figura 9.8 y tarda mucho más tiempo en ser
compensada. De hecho esta desviación no alcanza a ser compensada antes
de que aparezca el nuevo cambio de valor deseado de velocidad en t = 12[s].
Se aprecia lo mismo cuando la perturbación desaparece en t = 17[s]. De
acuerdo a la sección 5.2.4, esto se debe a que la dinámica de respuesta
ante la perturbación tiene una constante de tiempo dominante igual a la
constante de tiempo del motor en lazo abierto a1 , la cual es de 2.7[s] como
se indica en (9.27).
En la figura 9.10 se muestran los resultados obtenidos usando un contro-
lador PI clásico cuando se seleccionan las ganancias de acuerdo a:
9.7 Resultados experimentales 521

! 5

[V] 4

0 ï
0 2 4 6 8 10 12 14 16 18 20 22
0:623
iã 3
[A] 2

-1

-2

-3
0 2 4 6 8 10 12 14 16 18 20 22
tiempo [s]

Figura 9.9. Control PI clásico de velocidad usando la regla de sintonı́a en (9.43).

ki l2 l3
= d, d = 1.4 < p1 , kp = (9.44)
kp l1 k
1
l1 = abs(−p1 + d), l2 = abs(−p1 ), l3 = abs(−p1 + a), p1 = = 1.6
0.6231
Este criterio de sintonı́a es presentado en (5.36) en la sección 5.2.4, con
τ = 0.6231[s] la constante de tiempo más lenta con la que el efecto de la
perturbación es rechazada. Esta constante de tiempo se escoge igual a la cons-
tante de tiempo deseada en la respuesta ante la referencia de velocidad porque,
de acuerdo a (9.38), esta es la constante de tiempo más lenta presente en el
rechazo a la perturbación en el controlador cuyos resultados experimentales
se muestran en la figura 9.8 (f > p1 para los valores numéricos utilizados). La
velocidad deseada ωd es idéntica a la mostrada en (9.41) y se aplica una per-
turbación idéntica a la usada en la figura 9.8, es decir, se aplica via software
una perturbación constante de valor Tp = 2.5 en t = 8[s], la cual desaparece
en t = 17[s]. Se observa lo siguiente:
La desviación producida por la aparición de una perturbación externa es
reducida a cero con una rapidez comparable con la mostrada en la figura
9.8.
Sin embargo, la parte transitoria de la respuesta ante la referencia deseada,
aunque muy rápida, no corresponde a la respuesta transitoria deseada
522 9 Control de velocidad de un motor de CD

representada por la linea tenue mostrada en la figura 9.10. Tal como se


explica en la sección 5.2.4, esto se debe el sistema en lazo cerrado tiene
dos polos, uno se asigna en s = −p1 pero el otro ocupa un lugar muy a la
1
izquierda de este valor. Más aún, el polo ubicado en s = − 0.6231 = −1.6 =
−p1 es muy cercano al cero en s = −d = −1.4 por lo que sus efectos se
compensan (se cancelan) considerablemente y sólo se aprecia la dinámica
del polo rápido colocado muy a la izquierda.

! 3

[V]
2.5

1.5

0.5

0 ï
0 2 4 6 8 10 12 14 16 18 20 22
0:623 tiempo [s]

Figura 9.10. Control PI clásico de velocidad usando la regla de sintonı́a en (9.44).

En conclusión, los resultados experimentales de las figuras 9.9 y 9.10 com-


prueban las afirmaciones presentadas en la sección 5.2.4 sobre el control PI
clásico de velocidad: no se tiene una regla de sintonı́a que permita calcular de
manera exacta las ganancias proporcional e integral para obtener simultánea-
mente las caracterı́sticas deseadas de respuesta transitoria ante una referencia
de velocidad deseada y un rechazo de perturbaciones satisfactorio. Esto jus-
tifica el interés por el uso del controlador PI modificado presentado en (9.33)
cuyos resultados experimentales se muestran en la figura 9.8.

9.8. Cálculo numérico de la integral


Esta operación está representada por:
9.9 Programación del microcontrolador PIC16F877A 523
Z t
y= w(s)ds
0

y se puede aproximar numéricamente mediante:

y(k + 1) = y(k) + w(k)∆t (9.45)

donde y(k) es el valor de la integral calculado en el instante de muestreo


presente con y(0) = 0 y y(k + 1) es el valor de la integral en el instante de
muestreo próximo inmediato en el futuro. Esto significa que y(k) debe usarse
como el valor del término integral en el instante presente mientras que y(k +1)
debe calcularse en el instante presente pero debe ser utilizado como el valor
del término integral sólo hasta el siguiente instante de muestreo. La expresión
en (9.45) se obtiene a partir de la interpretación geométrica de la integral de
w, es decir, el area debajo de la curva definida por w. Ası́, el término w(k)∆t
representa el area que se incrementa en cada instante de muestreo: w(k) y ∆t
representan, respectivamente, la altura y la base del rectángulo que aproxima
a dicho incremento de área.

9.9. Programación del microcontrolador PIC16F877A


Se recomienda consultar la referencia [10] para una explicación precisa de
cada una de las instrucciones que aparecen en el siguiente listado.

// Programa para comunicacion serial entre PC y proyecto Control


// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
#include<stdlib.h>
#include<math.h>

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD

#use delay(clock=20000000) //Base de tiempo para


//retardos(frecuencia del Xtal)
//Config.P.Serie
#use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05

#byte PORTB = 0x06

#byte PORTC = 0x07


#byte PORTD = 0x08
#byte PORTE = 0x09
524 9 Control de velocidad de un motor de CD

#byte ADCON0= 0x1F


#byte ADCON1= 0x9F
#bit PC0 = 0x07.0

#bit PC1 = 0x07.1


//------------Declaracion de variables------------//
int16 inter,cuenta;

int8 cuentaH,cuentaL,puerto,AB,AB_1,aux;

int8 cont,iastd,cont2,cont3,cont4,t_0;

float w,error,iast,wm1,kp,ki,ie,k,a,wd,tiempo,kpp,k3,kib,cte;
unsigned int u,i;
//------------Rutina de interrupcion------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=4;
cont2=0;
cont3=0;
cont4=0;
PORTD=127;
9.9 Programación del microcontrolador PIC16F877A 525

k=2.4691;
a=1/2.7;
kpp=0.5;
k3=4.0;
kp=kpp+k3;
kib=a+k*kpp;
ki=kib*k3;
cte=a/k-k3;
tiempo=0.0;
wm1=0.0;
ie=0.0;
ADCON1=0x04;
ADCON0=0x81;
while(cont2<3)
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE)
{
cont++;
ADCON0=0x81; //Cambiando a CH0
for(i=0;i<37;i++); //estabilizar capacitor interno
t_0=read_adc(); //leer ADC
w=0.0196*t_0;
if(tiempo<4.0)
wd=1.5;
else
if(tiempo<12.0)
wd=2.5;
else
wd=1.5;
// wd=2.5;
error=wd-w;
/* Controlador */
iast=kp*error+ki*ie+cte*wd;
ie=ie+0.002*error;
/* ___________________________________________ */
if(iast<-3.3)
iast=-3.3;
if(iast>3.3)
526 9 Control de velocidad de un motor de CD

iast=3.3;
// iast=0.3;
iast=-iast;
if(tiempo>8.0)
{
if(tiempo<17.0)
iast=iast+2.5;
}
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
wm1=w;
/*
// inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=t_0;//(cuenta)&(0x00FF);
putc(0xAA); //reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
putc(cuentaL);
if(cont==5)
{
cont=0;
cont4++;
if(cont4==255)
cont4=0;
}
*/
if(tiempo>8.0)
{
if(tiempo<17.0)
iast=iast-2.5;
}
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
// inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=(iastd)&(0xFF);
putc(0xAA); // reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
putc(cuentaL);
if(cont==5)
{
cont=0;
cont4++;
if(cont4==255)
cont4=0;
}
PC1=1; //inicia espera del timer
while(TMR0<40) // 1 cuenta=(4/FXtal)*256 seg, 40=2 ms
{
9.11 Preguntas de repaso 527

}
PC1=0; //termina espera del timer
TMR0=0;
tiempo=tiempo+0.002;
} //cierre del while infinito
} //cierre del main

9.10. Resumen del capı́tulo

Se ha presentado la manera de controlar la velocidad de un motor de


CD. Para esto se ha mostrado la manera de construir de manera práctica y
experimental dos controladores de velocidad: uno es un PI clásico y el otro
es un PI modificado. Se ha mencionado cuáles son los problemas que tiene el
controlador PI clásico y como resolverlos usando el controlador PI modificado.
También se ha descrito la manera de construir las interfases necesarias para
el correcto funcionamiento del sistema de control y cómo se puede programar
un microcontrolador para realizar la función de un controlador digital.
Es importante resaltar el hecho de que en la literatura sobre control de
motores eléctricos es común usar como entrada al par generado por el motor
(o bien, la corriente eléctrica de armadura). Esto se hace a pesar de que es
el voltaje aplicado al motor la variable que se puede manipular directamente
en el motor mientras que el par es un producto que resulta de la ecuación
diferencial que describe al circuito eléctrico de armadura. En este capı́tulo
se ha explicado que si se usa un lazo interno de corriente de alta ganancia
se puede, efectivamente, usar la corriente de armadura (y, por tanto, el par
generado ya que ambas variables son proporcionales) como la variable de
entrada. También se ha explotado este ejemplo para resaltar el papel que
juega un amplificador de potencia en un sistema de control.
Un problema importante que se debe resolver antes de diseñar un contro-
lador es el de determinar los valores numéricos de los parámetros del modelo
de la planta a controlar. En este capı́tulo se ha mostrado una manera ex-
perimental que es efectiva para resolver este problema en un motor de CD.
Básicamente la idea es explotar el hecho de que el modelo de la planta es de
primer orden, modelos cuya respuesta ante una entrada escalón es bién cono-
cida. El método que se propone es ampliamente recomendable porque con un
simple experimento se puede resolver el problema completo.

9.11. Preguntas de repaso

1. ¿Qué es un lazo de corriente y para que se usa?


2. ¿Por qué un controlador PI es suficiente para controlar la velocidad de un
motor de CD? ¿Por qué no usar un controlador PID?
528 9 Control de velocidad de un motor de CD

3. Se ha dicho que un controlador PI lleva a cero el error en estado esta-


cionario en un sistema de control de velocidad a pesar de la presencia de
cualquier perturbación constante ¿Qué precaución debe tomar en cuenta
en la práctica para que efectivamente se pueda compensar la presencia de
una perturbación constante?
4. ¿Un controlador PI es efectivo para llevar a cero el error en estado esta-
cionario cuando el valor deseado de velocidad no es constante? ¿Y si la
perturbación no es constante? Explique.
5. ¿Cómo usarı́a las ideas expuestas en el presente capı́tulo para controlar
el voltaje producido por un generador eléctrico que es impulsado por un
motor de CD?
6. ¿Cómo usarı́a las ideas expuestas en el presente capı́tulo para controlar
un sistema de control de temperatura y un sistema de control de nivel de
lı́quido?
7. ¿Qué controlador usarı́a para los sistemas de la pregunta anterior? ¿Usarı́a
un controlador PID? ¿Por qué?
8. ¿Bajo qué condiciones el modelo de velocidad de un motor de CD se con-
vertirı́a en un integrador? ¿Qué controlador usarı́a bajo estas condiciones
para compensar el efecto de una perturbación constante? Justifique su
respuesta.
9. Si un controlador PI clásico compensa muy lentamente el efecto de una
perturación ¿Qué ajustes harı́a en las ganancias del controlador?
10. ¿Cuáles son los efectos de las ganancias proporcional e integral en un
controlador PI clásico?
Referencias

1. R. Ortega, A. Lorı́a, P. J. Nicklasson and H. Sira-Ramı́rez, Passivity-based con-


trol of Euler-Lagrange Systems, Springer, London, 1998.
2. V.M Hernández Guzmán and R.V. Carrillo Serrano, Global PID position control
of PM stepper motors and PM synchronous motors, International Journal of
Control, vol. 84, no. 11, pp. 1807-1816, 2011.
3. V.M Hernández Guzmán and R. Silva-Ortigoza, PI control plus electric current
loops for PM synchronous motors, IEEE Transactions on Control Systems Te-
chnology, vol. 19, no. 4, pp. 868-873, 2011.
4. G. Espinosa-Pérez, P. Maya-Ortiz, M. Velasco-Villa and H. Sira-Ramı́rez,
Passivity-based control of switched reluctance motors with nonlinear magne-
tic circuits, IEEE Transactions on Control Systems Technology, Vol. 12, pp.
439–448, 2004.
5. J. Chiasson, Modeling and High-performance control of electric machines, IEEE
Press-Wiley Interscience, New Jersey, 2005.
6. Parker Automation, Position systems and Controls, Training and Product Ca-
talog DC-ROM, Compumotor’s Virtual Classroom, 1998.
7. R. Campa, E. Torres, V. Santibáñez and R. Vargas, Electromechanical dyna-
mics characterization of a brushless direct-drive servomotor. Proc. VII Mexican
Congress on Robotics, COMRob 2005, México, D.F., October 27-28, 2005.
8. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
9. DAC0800 8-bit Digital-to-Analog Converter, Data sheet, National Semiconduc-
tor Corporation, 1995.
10. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
10
Control de posición de un motor de CD

El problema de control de posición tiene muchas e importantes aplicacio-


nes en la industria. Quizá una de las aplicaciones más claras es la del control
de robots manipuladores. En estas tareas, el robot debe ensamblar las piezas
que conforman a un componente más complejo. Para ello, el robot debe to-
mar una pieza, llevarla a un lugar especificado y colocarla dentro del espacio
correspondiente. Para conseguir esto, se coloca un motor eléctrico (frecuen-
temente de CD y con escobillas) en cada una de las partes móviles del robot
(conocidas como uniones). Entonces se debe controlar la posición de cada
motor de manera individual para alcanzar un valor de posición deseado. La
posición deseada de cada motor es seleccionada de manera que si cada motor
la alcanza, entonces el extremo del robot consigue colocar la pieza por ensam-
blar en el lugar correcto. Un problema común en esta tarea es la presencia
del efecto de la gravedad, la cual aparece como una perturbación de par que
debe ser compensada. Una vez que el robot se detiene, esta perturbación de
par es constante.
532 10 Control de posición de un motor de CD

Objetivos del capı́tulo

Construir controladores tipo proporcional-integral-derivativo usando un


microcontrolador y una computadora personal.
Construir la totalidad de las interfaces electrónicas necesarias para el sis-
tema de control completo.
Identificar de manera experimental los parámetros del modelo de un motor
de CD.
Identificar las ventajas y las desventajas de los controladores proporcional-
integral-derivativo.
Aplicar a una situación experimental los conceptos de la teorı́a de control
clásico.
En este capı́tulo se continúa con el control de un motor de CD con es-
cobillas e imán permanente, pero ahora se considera el control de posición.
Con este fı́n, se recurre al modelo obtenido en (9.23) después de colocar un
amplificador de potencia y un lazo de corriente (véanse las secciones 9.2 y
9.3). Este modelo se reescribe a continuación para facilitar su referencia:
1 1
θ(s) = [kI ∗ (s) − Tp (s)] (10.1)
s(s + a) J
b nkm
a= , k=
J J
donde θ(s) es la posición a controlar, I ∗ (s) es la variable de entrada o de
control y Tp (s) es una perturbación de par externa.

10.1. Identificación
En esta sección es de interés realizar un experimento que permita conocer
los valores de las constantes k y a del modelo en (10.1). A continuación se
explica la manera de diseñar dicho experimento. Suponga que no hay ninguna
perturbación externa aplicada, es decir Tp (s) = 0, por lo que el modelo (10.1)
se reduce a:
k
θ(s) = I ∗ (s) (10.2)
s(s + a)
Suponga que i∗ se diseña como un controlador proporcional de posición, es
decir, de manera que:

i∗ = kp (θd − θ) (10.3)

o, mediante el uso de la transformada de Laplace:

I ∗ (s) = kp (θd (s) − θ(s)) (10.4)


10.1 Identificación 533

donde kp es una constante positiva. El diagrama a bloques que combina las


expresiones (10.2) y (10.4) se muestra en la figura 10.1. La función de trans-
ferencia de lazo cerrado para este caso es:

θ(s) kp k ωn2
= 2 = 2 (10.5)
θd (s) s + as + kp k s + 2ζωn s + ωn2
p a
ωn = kp k, ζ = p (10.6)
2 kp k

òd ( s) + I ã(s) k
ò(s)
kp s ( s+a)

Figura 10.1. Control proporcional de posición.

De acuerdo a (10.5) y lo visto en la sección 3.3, si la posición deseada θd


es un escalón la respuesta obtenida en el tiempo θ(t) presenta un sobre paso
y un tiempo de subida dados como:
ζ
−√ π
Mp ( %) = 100 × e 1−ζ2 (10.7)
" Ãp !#
1 1 − ζ2
tr = π − arctan (10.8)
ωd ζ

si 0 ≤ ζ < 1, lo cual siempre se puede conseguir usando un valor de kp


suficientemente grande. A partir de (10.7) y (10.8) se obtiene:
v ³ ´
u
u ln2 M p( %)
u 100
ζ=t ³ ´ (10.9)
ln2 M100p( %)
+ π2
" Ãp !#
1 1 − ζ2
ωd = π − arctan (10.10)
tr ζ
ωd
ωn = p (10.11)
1 − ζ2
Esto permite calcular los valores de k y a utilizando el siguiente procedimiento:
Construya el controlador proporcional mostrado en (10.4) o en (10.3).
Asegúrese de que no aparecerán perturbaciones externas de par sobre el
motor. Seleccione un valor conocido y positivo de la ganancia kp . Este
534 10 Control de posición de un motor de CD

valor debe ser suficientemente grande de modo que al aplicar un cambio


tipo escalón en la posición deseada θd se obtenga una posición del motor
θ que presenta un sobre paso claramente apreciable. Grafique respecto al
tiempo la posición θ que se obtiene como respuesta ante un θd tipo escalón.
Mida los valores obtenidos de Mp ( %) y tr .
Utilice las expresiones (10.9)-(10.11) para calcular ζ y ωn .
Utilice las expresiones en (10.6) y el valor de kp usado en el experimento
para calcular k y a.
En la figura 10.2 se presentan los resultados obtenidos al realizar el expe-
rimento descrito en el procedimiento anterior. Se utiliza un valor kp = 0.5 y
midiendo directamente en la figura 10.2 se encuentran los valores:

Mp ( %) = 78.2 %, tr = 0.09[s]

Estas mediciones se simplifican y al mismo tiempo se hacen más exactas si


se utiliza un programa de computadora para realizarlas. Con estos valores se
sigue el procedimiento indicado previamente para encontrar que:

k = 675.4471, a = 2.8681 (10.12)

Finalmente, es importante aclarar que, al igual que en el modelo de velocidad,


no es de interés calcular el valor del factor 1/J que aparece como coeficiente de
la perturbación Tp (s) en (10.1). La razón de esto es que normalmente incluso
el valor de Tp no es conocido y a pesar de ello su efecto puede ser compensado.

ò
[rad]
M p (%) = 78:2

tr = 0:09


[A]

tiempo [s]

Figura 10.2. Identificación experimental.


10.2 Control sin perturbaciones externas (Tp = 0) 535

10.2. Control sin perturbaciones externas (Tp = 0)


El diseño de un controlador tiene como objetivo asegurar que en lazo
cerrado se consigan las caracterı́sticas deseadas de respuesta transitoria y en
estado estacionario. Las caracterı́sticas de respuesta transitoria se refieren al
tiempo de subida (rapidez de respuesta) y al sobre paso (amortiguamiento)
deseados. Estas caracterı́sticas se satisfacen mediante la ubicación conveniente
de los polos de lazo cerrado. Por otro lado, las caracterı́sticas de respuesta en
estado estacionario se consiguen al asegurar que cuando el tiempo crece el
valor de la posición θ alcanza la posición deseada θd . El controlador es el
dispositivo que se encarga de que se satisfagan las caracterı́sticas de respuesta
transitoria y en estado estacionario del sistema en lazo cerrado.
Suponga que la posición deseada es una constante o un escalón, es de-
cir θd = A es una constante. Dado que la planta en (10.1) contiene un polo
en s = 0 entonces es de tipo 1 lo que asegura que θ = θd = A en estado
estacionario, si se usa un controlador proporcional de posición y si no hay
perturbaciones externas de par, es decir, si Tp = 0. Esto significa que el re-
quisito de alcanzar la posición deseada es satisfecho de manera natural por
la planta (el motor de CD). Por tanto, el diseño del controlador debe reali-
zarse simplemente buscando que se satisfagan las caracterı́sticas de respuesta
transitoria, es decir, colocando adecuadamente los polos de lazo cerrado. Ası́,
en el caso de un motor de CD hay dos controladores sencillos que permiten
ubicar adecuadamente los polos de lazo cerrado: i) control proporcional con
realimentación de velocidad e ii) control con una red de adelanto.

10.2.1. Control proporcional con realimentación de velocidad

En este caso, el controlador está dado como:

i∗ (t) = kp (θd − θ) − kv θ̇ (10.13)

donde kp y kv son constantes positivas. Usando la transformada de Laplace


se obtiene:

I ∗ (s) = kp (θd (s) − θ(s)) − kv sθ(s) (10.14)

El diagrama de bloques que resulta de combinar (10.14) y (10.2) es mostrado


en la figura 10.3. La función de transferencia de lazo cerrado está dada como:
θ(s) kp k ωn2
= 2 = 2
θd (s) s + (a + kv k)s + kp k s + 2ζωn s + ωn2
p a + kv k
ωn = kp k, ζ = p (10.15)
2 kp k

Por tanto, siempre se pueden hallar valores positivos de kv y kp que consi-


gan los valores deseados de ζ y ωn . Esto significa que siempre se pueden ubicar
536 10 Control de posición de un motor de CD

òd ( s) + I ã(s) ò(s)
+ k
kp s ( s+a)

à à

kv s

Figura 10.3. Control proporcional de posición con realimentación de velocidad.

los polos de lazo cerrado (s + ζωn + jωd )(s + ζωn − jωd ) = s2 + 2ζωn s + ωn2 , en
cualquier punto sobre el semiplano complejo izquierdo, mediante una selección
adecuada de kp y kv . Por ejemplo, considere los valores en (10.12). Suponga
que se desea que la respuesta ante un escalón tenga el sobre paso y el tiempo
de subida que se indican a continuación:

Mp ( %) = 20 %, tr = 0.068[s] (10.16)

Con estos datos y usando (10.9)-(10.11) se encuentra que los polos de lazo
cerrado deseados están ubicados en:

s = −ζωn ± jωd = −15.4009 ± j30.0623

con ζ = 0.4559 y ωn = 33.7776. Finalmente, usando estos valores, (10.12),


(10.15) y (10.16) se encuentra que las siguientes ganancias consiguen el tiempo
de subida y el sobre paso deseados:

kp = 1.6891, kv = 0.0414 (10.17)

En la figura 10.4 se muestran los resultados experimentales obtenidos con el


controlador (10.13) y las ganancias en (10.17) cuando θd es un escalón unitario.
El sobre paso y el tiempo de subida medidos en dicho experimento son:

Mp ( %) = 16 %, tr = 0.068[s]

los cuales, puede observarse, son cercanos a los valores de diseño especificados
en (10.16).
Es conveniente decir que el utilizar un sensor especializado para medir
velocidad implica una serie de adaptaciones mecánicas que complican mucho
y elevan el costo de la construcción del sistema de control. Por esta razón,
en la práctica es común estimar la velocidad a partir de la posición medida.
En los experimentos de la figura 10.4, la velocidad θ̇ se ha estimado mediante
la diferenciación numérica de la posición medida (véase la sección 10.5). Sin
embargo, este proceso tiene el efecto de un filtro pasa altas: las señales de alta
frecuencia (ruido) son amplificadas de manera importante por el controlador
10.2 Control sin perturbaciones externas (Tp = 0) 537

(realimentación de velocidad). La presencia de ruido puede resultar en el de-


terioro del desempeño del sistema de control pues puede producir vibraciones
en el motor aún cuando ya se encuentre en reposo. Por tanto, siempre se debe
procurar que la ganancia kv utilizada sea pequeña. En la siguiente sección
se utiliza un controlador que no necesita ni la medición de la velocidad ni la
diferenciación de la salida para conseguir los polos deseados de lazo cerrado.

ò
[rad] Mp (%) = 16

ï
tr = 0:068


[A]

tiempo [s]

Figura 10.4. Control proporcional de posición con realimentación de velocidad.


Resultados experimentales (θd = 1.5[rad]).

10.2.2. Control con un compensador de adelanto

En este caso el controlador se especifica mediante su función de transfe-


rencia:
I ∗ (s) s+d
=γ (10.18)
E(s) s+c

donde E(s) es la transformada de Laplace de la diferencia e = θd −θ, mientras


que γ, d y c son constantes positivas por calcular que deben satisfacer d < c.
A continuación se muestra la manera de obtener una expresión que indi-
ca como construir el controlador en (10.18). Mediante división directa de la
fracción en (10.18) se obtiene:
538 10 Control de posición de un motor de CD

I ∗ (s) = γ [E(s) + V (s)] (10.19)


d−c
V (s) = E(s)
s+c
Suponiendo condiciones iniciales cero, se utiliza la transformada inversa de
Laplace en las dos expresiones dadas en (10.19) para obtener:

i∗ = γ[e + v] (10.20)
v̇ = −cv + (d − c)e (10.21)

donde v es la transformada inversa de Laplace de V (s). Entonces, conocien-


do la posición deseada θd y mediante la medición de θ se puede calcular la
señal e; utilizando esta señal como variable conocida se resuelve numérica-
mente la ecuación diferencial en (10.21), con v(0) = 0, para calcular v y luego
usar (10.20) para calcular i∗ . En la sección 10.5 se explica como realizar este
procedimiento de manera numérica.
Ahora se considerará que el controlador está dado como en (10.18). En la
figura 10.5 se muestra el diagrama de bloques que resulta de conectar (10.18)
y (10.2). Nótese que la función de transferencia de lazo abierto:
γk(s + d)
G(s)H(s) = (10.22)
s(s + c)(s + a)
tiene tres polos, por lo que la función de transferencia de lazo cerrado también
tendrá tres polos además de un cero en s = −d. Se deja como ejercicio que
el lector encuentre la función de transferencia de lazo cerrado y que verifique
que tiene la siguiente forma:
θ(s) γk(s + d)
= (10.23)
θd (s) (s − p1 )(s − p2 )(s − p3 )

òd ( s) + I ã(s) k
ò(s)
í s+d
s+c s ( s+a)
à

Figura 10.5. Control de posición con un compensador de adelanto.

Por tanto, en este caso, además de ubicar los polos complejos conjugados,
p1 y p2 , en los lugares especificados también se deberá asegurar que el tercer
polo, en p3 , y el cero en s = −d no afectarán de manera importante la res-
puesta transitoria. Tal como se muestra en la sección 5.2.3, esto se consigue
seleccionando:
10.2 Control sin perturbaciones externas (Tp = 0) 539

ωn2
d = a, c = 2ζωn , γ=
k
Usando esta regla de sintonı́a y los parámetros en (10.12) se encuentra que el
uso de las ganancias:

c = 30.8018, γ = 1.6891, d = 2.8681

en el controlador dado en (10.18), o equivalentemente en (10.20), (10.21),


ubica dos polos de lazo cerrado en:

s = −ζωn ± jωd = −15.4009 ± j30.0623

Ası́, se consigue especificar por diseño un tiempo de subida de 0.068[s] y un


sobre paso del 20 %.
En la figura 10.6 se muestran los resultados experimentales obtenidos cuan-
do θd es un escalón de 1.5[rad]. Las caracterı́sticas de respuesta transitoria
medidas en esta figura son Mp ( %) = 9.6 %, tr = 0.068[s]. Nótese el parecido
de estos valores con los valores de diseño: tr = 0.068[s] y Mp ( %) = 20 %.
Finalmente, es importante subrayar que el uso de la red de adelanto (figura
10.6) también resulta en un pequeño error de estado estacionario.
El lector puede preguntarse ¿Qué se debe usar como valor final para calcu-
lar el sobre paso? ¿El valor deseado de 1.5[rad] o el valor final de 1.4[rad]? El
valor de Mp ( %) = 9.6 % se obtuvo usando 1.5[rad] como valor final. Nótese
que el sobre paso puede ser un poco mas cercano al valor deseado del 20 %
si se mide usando como valor final 1.4[rad]. Esta decisión se deja a criterio
del lector. Por otro lado, el tiempo de subida es exactamente el valor deseado
si se usa como valor final el valor deseado de 1.5[rad]. Estos problemas son
debidos a la existencia de un error en estado estacionario que es mucho más
apreciable que con el controlador proporcional con realimentación de veloci-
dad. Este error en estado estacionario es debido a la presencia de fricción no
lineal: estática y de Coulomb (véase (2.21)).
540 10 Control de posición de un motor de CD

ò
M p (%) = 9:6
[rad]

ï
tr = 0:068


[A]

tiempo [s]

Figura 10.6. Control de posición con un compensador de adelanto. Resultados


experimentales (θd = 1.5[rad]).

10.3. Control bajo el efecto de perturbaciones externas


En esta sección se considera la presencia de una perturbación externa
constante, es decir:
td
Tp = td , Tp (s) = (10.24)
s
donde td es una constante diferente de cero. Esto significa que se considera
la posibilidad de que algún agente externo al motor aplique un par sobre
su flecha. Si se piensa que el motor podrı́a estar actuando sobre una antena
parabólica, entonces el agente externo que produce la perturbación de par bien
podrı́a ser el viento que golpea a la antena. Por otro lado, se considera que
la perturbación es constante porque esto representa el caso extremo en que
el viento golpea a la antena de manera agresiva, con su máxima capacidad
de desviación. Además, la presencia de una perturbación aproximadamente
constante durante intervalos de tiempo que pueden ser cortos o largos es una
situación muy común en mecanismos. Es importante mencionar qué es lo que
se espera de un buen diseño cuando aparece una perturbación externa: el
efecto de la perturbación sobre la salida debe ser llevado a cero tan rápido
como sea posible.
En este tipo de aplicaciones es común utilizar un controlador PID debi-
do a que su parte integral puede llevar a cero las desviaciones debidas a las
10.3 Control bajo el efecto de perturbaciones externas 541

perturbaciones constantes. Sin embargo, tal como se menciona en la sección


5.2.5, no se cuenta con una regla de sintonı́a que permita calcular de manea
exacta las ganancias de un controlador PID que consigan simultáneamente
las caracterı́sticas deseadas de respuesta transitoria (tiempo de subida y so-
bre paso) y un rechazo satisfactorio de los efectos de la perturbación externa.
Por esta razón, en las siguientes dos secciones se presentan dos controlado-
res que son diseñados especı́ficamente para satisfacer simultáneamente estas
especificaciones.

10.3.1. Un controlador PID modificado

Primero se usa la transformada inversa de Laplace para obtener, a partir


de (10.1), la siguiente ecuación diferencial:
1
θ̈ + aθ̇ = ki∗ − Tp (10.25)
J
A continuación se muestra que el siguiente controlador permite obtener una
regla de sintonı́a para calcular de manera exacta sus ganancias de modo que
se consiguen simultáneamente las caracterı́sticas deseadas de respuesta transi-
toria (tiempo de subida y sobre paso) y un rechazo satisfactorio de los efectos
de la perturbación externa:
Z t
i∗ = κp (θd − θ) − κd θ̇ + k1 κp k (θd − θ(r))dr − k1 (θ̇ − θ̇(0))
0
−k1 (a + κd k)(θ − θ(0)) (10.26)

donde θd es una constante que representa el valor deseado de posición mien-


tras que θ(0) y θ̇(0) representan los valores iniciales de posición y velocidad,
respectivamente. Utilizando el hecho de que:
Z t
θ̇ − θ̇(0) = θ̈(r)dr
0
Z t
θ − θ(0) = θ̇(r)dr
0

el controlador anterior se puede escribir como:


Z t Z t
i∗ = κp (θd − θ) − κd θ̇ + k1 κp k (θd − θ(r))dr − k1 θ̈(r)dr
0 0
Z t
−k1 (a + κd k) θ̇(r)dr
0
Z th i
= κp (θd − θ) − κd θ̇ − k1 θ̈(r) + (a + κd k)θ̇(r) + κp k(θ(r) − θd ) dr
0

Sustituyendo esto en (10.25) se obtiene:


542 10 Control de posición de un motor de CD

θ̈ + (a + κd k)θ̇ + κp k(θ − θd )
Z th i 1
+k1 k θ̈(r) + (a + κd k)θ̇(r) + κp k(θ(r) − θd ) dr = − Tp
0 J
Esto se puede escribir como:
1
ξ˙ + k1 kξ = − Tp (10.27)
J
si se define:
Z th i
ξ= θ̈(r) + (a + κd k)θ̇(r) + κp k(θ(r) − θd ) dr
0

Aplicando la transformada de Laplace a (10.27), considerando las condiciones


iniciales iguales a cero, se obtiene:
− J1
ξ(s) = Tp (s)
s + k1 k
o también:
− J1 s
sξ(s) = Tp (s) (10.28)
s + k1 k
td
Si la perturbación es una constante, es decir Tp (s) = s , entonces se puede
usar el teorema del valor final para encontrar:
˙ = lı́m s[sξ(s)]
lı́m ξ(t)
t→∞ s→0
− J1 s td
= lı́m s =0
s→0 s + k1 k s
˙ =
Ası́ que si k1 k > 0, el filtro en (10.28) es estable y se asegura que lı́mt→∞ ξ(t)
0. Más aún, la rapidez con que ξ(t) ˙ se aproxima a cero es mayor conforme
k1 k > 0 es mayor. Nótese que lı́mt→∞ ξ(t) ˙ = 0 implica que:
Z th i
d
θ̈(r) + (a + κd k)θ̇(r) + κp k(θ(r) − θd ) dr
dt 0
= θ̈ + (a + κd k)θ̇ + κp k(θ − θd ) → 0
también tiende a cero. Esto significa que el efecto de la perturbación constante
desaparece al crecer el tiempo y sólo queda la ecuación diferencial θ̈ + (a +
κd k)θ̇ + κp kθ = κp kθd , la cual es estable si κp > 0 y κd > 0, tiene ganancia
unitaria en estado estacionario y las ganancias κp y κd pueden ser usadas para
asignar arbitrariamente los dos polos de dicho sistema. Todo esto significa que:
Si no hay perturbación (Tp = 0 y ξ(t)˙ = 0 para todo t ≥ 0), la respuesta
en posición es como la de un sistema de segundo orden con un tiempo de
subida y un sobre paso que pueden ser seleccionados a voluntad escogiendo
convenientemente los valores de κp y κd . La posición θ alcanza la posición
deseada θd (constante) en estado estacionario.
10.3 Control bajo el efecto de perturbaciones externas 543

Si aparece una perturbación constante (Tp = td 6= 0), la desviación pro-


ducida por la perturbación desaparece al crecer el tiempo. Más aún, si se
escoge un valor de k1 mayor (de manera que el producto k1 k > 0 es ma-
yor), entonces la desviación producida por la perturbación desaparece más
rápido. Si una vez que la desviación debida a la perturbación es llevada a
cero (cuando θ = θd ) se ordena un cambio en el valor constante de θd (se
ordena un cambio de posición deseada θd estando presente la perturbación
Tp ), entonces la posición responde como si la mencionada perturbación
constante Tp no existiera, es decir, como en el punto anterior: con el tiem-
po de subida y el sobre paso deseados y la posición θ alcanza la velocidad
deseada θd en estado estacionario.
Debido a que en control clásico siempre se supone que todas las condiciones
iniciales son cero, entonces se puede suponer que θ(0) = 0, θ̇(0) = 0 y el
controlador en (10.26) se escribe como:
Z t

i = κp (θd − θ) − κd θ̇ + k1 κp k (θd − θ(r))dr − k1 θ̇ − k1 (a + κd k)θ
0
Z t
= [κp + k1 (a + κd k)](θd − θ) − (κd + k1 )θ̇ + k1 κp k (θd − θ(r))dr
0
−k1 (a + κd k)θd
Z t
= KP (θd − θ) − KD θ̇ + KI (θd − θ(r))dr − k1 (a + kd k)θd (10.29)
0
KP = κp + k1 (a + κd k), KD = κd + k1 , KI = k1 κp k

que constituye un simple controlador PID con un término constante de prea-


limentación. Nótese que el término derivativo no contiene la derivada de la
posición deseada. Finalmente, la regla de sintonı́a del controlador en (10.29)
puede resumirse del siguiente modo:
κp > 0 y κd > 0 se eligen de modo que queden fijados el tiempo de subida
y el sobre paso deseados mediante la adecuada ubicación de las raı́ces del
polinomio caracterı́stico s2 + (a + κd k)s + κp k, es decir:

a + κd k = 2ζωn , κp k = ωn2 (10.30)

k1 > 0 se elige grande para reducir rápidamente a cero la desviación de-


bida a la perturbación. Esto puede hacerse al tanteo o puede calcularse
recordando que k11k es la constante de tiempo del filtro en (10.28), el cual
es el responsable de eliminar la desviación producida por la perturbación.
Otra manera (más conocida) de diseñar un controlador PID con las mismas
ventajas que el que se acaba de presentar es usando el concepto de contro-
ladores con dos grados de libertad. Esto es lo que se muestra en la siguiente
sección.
544 10 Control de posición de un motor de CD

10.3.2. Un controlador con dos grados de libertad

A continuación se explica la manera de diseñar un controlador de dos


grados de libertad para el motor de CD que nos ocupa en este capı́tulo. En
la figura 10.7 se muestra el diagrama de bloques de un controlador de dos
grados de libertad. Gp (s) representa la planta mientras que el controlador
está compuesto por dos partes: Gc1 (s) y Gc2 (s). En el ejemplo 4.5 de la sección
4.1 se muestra que la salida del sistema en lazo cerrado se puede calcular como:

θ(s) = G1 (s)θd (s) + G2 (s)D(s)

donde:
Gc1 (s)Gp (s)
G1 (s) =
1 + (Gc1 (s) + Gc2 (s))Gp (s)
Gp (s)
G2 (s) = (10.31)
1 + (Gc1 (s) + Gc2 (s))Gp (s)

son las funciones de transferencia:


θ(s)
G1 (s) = , cuando D(s) = 0
θd (s)
θ(s)
G2 (s) = , cuando θd (s) = 0
D(s)

La razón por la cual este esquema recibe el nombre de controlador de dos


grados de libertad es que las dos funciones de transferencia definidas en (10.31)
pueden ser sintonizadas independientemente una de la otra utilizando para

D(s)
+
òd ( s) + I ã(s) ò(s)
G c1 (s) G p ( s)
+ +
à à

G c2 (s)

Figura 10.7. Sistema en lazo cerrado usando un controlador con dos grados de
libertad.

ello, como variables independientes (o grados de libertad), a las dos partes


del controlador Gc1 (s) y Gc2 (s). Se desea entonces diseñar Gc1 (s) y Gc2 (s) de
manera que: i) se puedan especificar a voluntad las caracterı́sticas de respuesta
10.3 Control bajo el efecto de perturbaciones externas 545

transitoria y en estado estacionario ante una referencia deseada, θd (s), e ii)


el efecto de una perturbación externa, D(s), sea reducido a cero tan rápido
como se desee.
Dado que la planta que interesa en este capı́tulo es un motor de CD su-
ponga que:
k
Gp (s) = (10.32)
s(s + a)
El diseño del controlador con dos grados de libertad que se presenta aquı́ se
fundamenta en considerar que Gc1 (s) y Gc2 (s) son controladores PID [5], cap.
10, y por tanto que se puede escribir:
kd1 s2 + kp1 s + ki1
Gc1 (s) =
s
kd2 s2 + kp2 s + ki2
Gc2 (s) =
s
kd s2 + kp s + ki
Gc (s) = Gc1 (s) + Gc2 (s) =
s
kd (s + α)(s + β) kd (s2 + (α + β)s + αβ)
= = (10.33)
s s
kd = kd1 + kd2 , kp = kp1 + kp2 , ki = ki1 + ki2

para algunas constantes α y β. Entonces:


θ(s) Gc1 (s)Gp (s)
=
θd (s) 1 + Gc (s)Gp (s)

Sustituyendo (10.32) y (10.33) en la expresión anterior se tiene:


k
θ(s) Gc1 (s) s(s+a)
= kd (s2 +(α+β)s+αβ)
θd (s) 1+ k
s s(s+a)
skGc1 (s)
=
s2 (s
+ a) + kd k(s2 + (α + β)s + αβ)
skGc1 (s)
= 3 (10.34)
s + (a + kd k)s2 + kd k(α + β)s + kd kαβ
Suponga que se desea que la respuesta transitoria sea la de dos polos complejos
conjugados dominantes dados como s = −σ + jωd y s = −σ − jωd , σ > 0,
ωd > 0. Entonces el polinomio caracterı́stico debe satisfacer:

s3 + (a + kd k)s2 + kd k(α + β)s + kd kαβ


= (s + σ + jωd )(s + σ − jωd )(s + f )
= s3 + (2σ + f )s2 + (σ 2 + ωd2 + 2σf )s + (σ 2 + ωd2 )f

de donde se obtienen las siguientes relaciones:


546 10 Control de posición de un motor de CD

a + kd k = 2σ + f (10.35)
kd k(α + β) = σ 2 + ωd2 + 2σf (10.36)
kd kαβ = (σ 2 + ωd2 )f (10.37)
Con el fin de que el polo en s = −f , f > 0, no tenga efecto en la respues-
ta transitoria de (10.34) se propone una función de transferencia como la
siguiente:
θ(s) ρ(s + f )
= 3 (10.38)
θd (s) s + (2σ + f )s2 + (σ 2 + ωd2 + 2σf )s + (σ 2 + ωd2 )f
donde, con el fin de conseguir una función de transferencia de ganancia uni-
taria en estado estacionario, se debe cumplir
ρf = (σ 2 + ωd2 )f
es decir:
ρ = σ 2 + ωd2 (10.39)
Por otro lado, con el fin de conseguir que las funciones de transferencia en
(10.34) y (10.38) sean iguales se debe imponer la siguiente condición:
skGc1 (s) = ρ(s + f )
de donde se obtiene:
ρs + ρf 1
Gc1 (s) = = kp1 + ki1 (10.40)
sk s
(σ 2 + ωd2 ) (σ 2 + ωd2 )f
kp1 = , ki1 =
k k
Esto significa que Gc1 (s) debe ser un controlador PI. El controlador Gc2 (s)
se obtiene despejando de (10.33):
Gc2 (s) = Gc (s) − Gc1 (s)
1 (σ 2 + ωd2 ) (σ 2 + ωd2 )f 1
= kd s + kd (α + β) + kd αβ − −
s k k s
2σf 2σ + f − a
= kd2 s + kp2 , kp2 = , kd2 = kd = (10.41)
k k
donde se han usado (10.35), (10.36) y (10.37). Esto significa que Gc2 (s) es
un controlador PD. Por tanto, de acuerdo a la figura 10.7, el controlador
está dado como:
I ∗ (s) = Gc1 (s)(θd (s) − θ(s)) − Gc2 (s)θ(s)
1
= (kp1 + ki1 )(θd (s) − θ(s)) − (kd2 s + kp2 )θ(s)
s
1
= (kp1 + kp2 )(θd (s) − θ(s)) − kd2 sθ(s) + ki1 (θd (s) − θ(s)) − kp2 θd (s)
s
10.3 Control bajo el efecto de perturbaciones externas 547

Aplicando la transformada inversa de Laplace se obtiene:


Z t

i = (kp1 + kp2 )(θd − θ) − kd2 θ̇ + ki1 (θd − θ(r))dr − kp2 θd (10.42)
0

Tal como se ha hecho hasta ahora, se desea que ante una referencia escalón
haya una respuesta transitoria con 0.068[s] como tiempo de subida y 20 % de
sobre paso. En las secciones anteriores se ha visto que los polos de lazo cerrado
correspondientes están dados como s = −σ ± jωd donde:

σ = 15.4009, ωd = 30.0623 (10.43)

Por otro lado, el valor dado a f no afecta a la parte de la respuesta transito-


ria ante una referencia deseada porque su efecto es cancelado (véase (10.38)).
¿Cual es el efecto de f entonces y como seleccionarla? La clave de esta res-
puesta está centrada en dos partes:
Primero se tiene el hecho de que, de acuerdo a (10.35), una vez que se fijan
σ (polos deseados) y a, k (modelo de la planta) la ganancia derivativa kd
es mayor si f es mayor. De acuerdo a lo mencionado en las secciones
precedentes, ganancias derivativas grandes no son deseables por el ruido
que eso introduce. Ası́ que un criterio es seleccionar f tan pequeña como
se pueda.
Segundo, la función de transferencia ante una perturbación dada en (10.31)
se calcula como:
θ(s) ks
=
D(s) (s + σ + jωd )(s + σ − jωd )(s + f )
Nótese que en esta función de transferencia el polo en s = −f no puede ser
cancelado de ninguna manera por lo que su efecto será muy importante en
la parte transitoria de la respuesta ante una perturbación externa. Ası́ que
mientras menor sea el valor de f más lenta será la rapidez con la que
el efecto de la perturbación será eliminado, lo cual puede ser una gran
desventaja. En este sentido, nótese que puede usarse el teorema del valor
final para comprobar que el cero que esta función de transferencia tiene
en s = 0 asegura que el efecto en estado estacionario de una perturbación
constante sera reducido a cero.
Ası́ que la selección de f debe cumplir un compromiso entre la rapidez con
la que las perturbaciones son rechazadas y el ruido que pueda introducirse.
Propóngase:
f = 40 (10.44)
Finalmente, usando los parámetros de la planta:

k = 675.4471, a = 2.8681

ası́ como (10.40), (10.41), (10.43), (10.44) se encuentra:


548 10 Control de posición de un motor de CD

1
Gc1 (s) = 1.6891 + 67.5659 (10.45)
s
Gc2 (s) = 0.1006s + 1.8241 (10.46)
De acuerdo a (10.40), (10.41) y (10.42), el controlador está dado como:
Z t

i = 3.5132(θd − θ) − 0.1006θ̇ + 67.5659 (θd − θ(r))dr − 1.8241θd
0
(10.47)
Finalmente, una última observación. El lector puede comprobar que el con-
trolador en (10.42) es idéntico al controlador en (10.29) si se respeta (10.30)
y se establece que:
f
k1 = , σ = ζωn , σ 2 + ωd2 = ωn2
k
Por tanto, se deja al criterio del lector decidir cual de los enfoques presentados
en las secciones 10.3.1 o 10.3.2 para obtener este controlador es el que prefiere.
En la figura 10.8 se presentan resultados experimentales obtenidos cuando
se usa el controlador (10.47). Las caracterı́sticas de respuesta transitoria medi-
das ante la referencia constante son tr = 0.068[s] y Mp ( %) = 19.3 %, los cuales
son casi idénticos a los deseados (tr = 0.068[s] y Mp ( %) = 20 %). También se
considera la presencia de una perturbación constante D(s) = −Tp (s)/(Jk) =
−0.5/s. Esta perturbación ha sido introducida por software como una señal
que se suma a i∗ , dada en (10.47), a partir de t = 0.7[s]. Nótese que el error
en estado estacionario ante una referencia constante es cero, a pesar de la
presencia de fricción no lineal (estática y de Coulomb) que se describió en las
secciones anteriores. Por otro lado, se puede observar la excelente respuesta
del sistema de control ante la perturbación. También es interesante observar
que esto se consigue gracias a que se usa un valor muy grande de f = 40, lo
cual, a su vez, es posible gracias al bajo contenido de ruido en la medición de
la posición θ (se usa un encoder para medir la posición).
En la figura 10.9 se muestran otros resultados experimentales obtenidos
con el controlador (10.47). En este caso se usa la siguiente posición deseada
que tiene la forma de tres escalones sucesivos:

 1.5, 0 ≤ t < 1.5
θd = 3, 1.5 ≤ t < 4 (10.48)

1.5, t≥4
Se considera la presencia de la siguiente perturbación externa:


 0, 0 ≤ t < 0.7



 0.5, 0.7 ≤ t < 2.55

0, 2.55 ≤ t < 3.25
Tp = (10.49)

 0.5, 3.25 ≤ t < 5.1



 0, 5.1 ≤ t < 5.8

0.5, t ≥ 5.8
10.3 Control bajo el efecto de perturbaciones externas 549

Aparte de la posición medida experimentalmente (lı́nea continua) en la figura


10.9 también se muestra (linea interrumpida) la respuesta obtenida en simu-
lación con el sistema sin perturbaciones θ̈ + 30.8018θ̇ + 1140.9θ = 1140.9θd
el cual responde de acuerdo a las especificaciones de diseño: tr = 0.068[s] y
Mp ( %) = 20 %, pues sus polos están ubicados en s = −15.4009 ± j30.0623.
Se puede apreciar que ambas respuestas son casi idénticas porque casi no se
pueden distinguir en la figura 10.9. Esto es una muestra clara de que se han
conseguido las caracterı́sticas deseadas de respuesta transitoria y en estado
estacionario ante una referencia deseada. Más aún, nótese que los cambios
de referencia en t = 1.5[s] y t = 4[s] ocurren cuando la perturbación Tp
está presente y a pesar de ello aún se satisfacen las caracterı́sticas de respues-
ta transitoria deseadas. Además, las desviaciones debidas a la perturbación
son llevadas a cero rápidamente. Todo esto es evidencia experimental de que
las observaciones hechas justo antes de (10.29) son correctas.

ò
M p (%) = 19:3
[rad]

ï
tr = 0:068


[A]

tiempo [s]

Figura 10.8. Control de posición usando un controlador con dos grados de libertad.
Resultados experimentales (θd = 1.5[rad]).

10.3.3. Un controlador PID clásico

Con el fin de apreciar mejor las ventajas del controlador diseñado en las


secciones 10.3.1 y 10.3.2 a continuación se presentan, en las figuras 10.10 y
10.11, algunos resultados experimentales obtenidos al usar el controlador PID
550 10 Control de posición de un motor de CD

ò
[rad]


[A]

tiempo [s]

Figura 10.9. Control de posición con un controlador con dos grados de libertad.
Resultados experimentales.

clásico:
Z t
∗ d
i = kp (θd − θ) + kd (θd − θ) + ki (θd − θ(r))dr
dt 0

Se usa la misma referencia deseada de posición y la misma perturbación usa-


das en la figura 10.9, es decir, las definidas en (10.48) y (10.49). Aparte de
la posición medida experimentalmente (lı́nea continua), también se muestra
(linea interrumpida) la respuesta obtenida en simulación con el sistema sin
perturbaciones θ̈ + 30.8018θ̇ + 1140.9θ = 1140.9θd el cual responde de acuerdo
a las especificaciones de diseño: tr = 0.068[s] y Mp ( %) = 20 %, pues sus polos
están ubicados en s = −15.4009 ± j30.0623.
El diseño del controlador PID clásico se realiza de acuerdo a la expuesto
en la sección 5.2.5, es decir, usando los parámetros de la planta:

k = 675.4471, a = 2.8681

los polos deseados ubicados en:

s = −15.4009 ± j30.0623

para conseguir un tiempo de subida de 0.068[s] y un sobre paso de 20 %, el


parámetro de diseño α = 0.01, y (5.42), (5.44) se obtienen las ganancias:
10.3 Control bajo el efecto de perturbaciones externas 551

kd = 0.0414, kp = 1.6896, ki = 0.0169

Es importante subrayar que de acuerdo al método de diseño presentado en


la sección 5.2.5, el valor α = 0.01 se elige muy cercano a cero para que la
respuesta transitoria ante la referencia de posición tenga las caracterı́sticas
deseadas lo cual, puede observarse en la figura 10.10, es conseguido para el
primer cambio tipo escalón de la referencia (antes de que aparezca alguna
perturbación externa). Sin embargo, los problemas aparecen una vez que se
aplica la perturbación externa:
El uso de un valor pequeño para α resulta en una ganancia integral muy
pequeña lo cual produce un ajuste integral tan lento que el efecto de la per-
turbación no es compensando en la figura 10.10. Es más, aunque en t ≈ 3[s]
y t ≈ 5.5[s] la posición medida alcanza a la posición deseada, esto es debido a
que la perturbación externa desaparece en esos instantes de tiempo.
Tal como se explica en la sección 5.2.5, se pueden conseguir ganancias
integrales más grandes si se elige un valor grande para α. Por esta razón se
propone α = 10, lo cual resulta en las siguientes ganancias:

kd = 0.0414, kp = 2.1027, ki = 16.8915

En la figura 10.11 se muestran los resultados experimentales correspondientes.


Nótese que la desviación debida a la perturbación es compensada rápidamen-
te. Sin embargo, esto es conseguido al precio de producir una respuesta ante
la referencia deseada con caracterı́sticas muy diferentes a las diseñadas. Esta
es la principal desventaja del control PID clásico: no se pueden calcular de
manera exacta las ganancias que permitan conseguir simultáneamente las ca-
racterı́sticas deseadas de respuesta transitoria ante una referencia de entrada
y un rechazo satisfactorio de las perturbaciones externas. Por el contrario,
este problema es resuelto con el controlador diseñado en las secciones 10.3.1
y 10.3.2 y cuyos resultados experimentales se muestran en la figura 10.9.
552 10 Control de posición de un motor de CD

ò
[rad]


[A]

tiempo [s]

Figura 10.10. Control de posición con un controlador PID clásico (α = 0.01).


Resultados experimentales.

ò
[rad]


[A]

tiempo [s]

Figura 10.11. Control de posición con un controlador PID clásico (α = 10). Re-
sultados experimentales.
10.4 Seguimiento de trayectorias 553

10.4. Seguimiento de trayectorias


En esta sección se diseña un controlador que permite que la posición del
motor alcance una posición deseada que es variable en el tiempo, es decir,
θd (t) ya no es constante sino que cambia con el tiempo. Se supone que no
existe ninguna perturbación externa, es decir que Tp (s) = 0, y que se puede
calcular la primera y la segunda derivada de θd (t), es decir θ̇d (t) y θ̈d (t) se
conocen y son continuas. Considérese el modelo (10.1) una vez que se le aplica
la transformada inversa de Laplace, con Tp (s) = 0, es decir:

θ̈ + aθ̇ = ki∗ (10.50)

Sea el siguiente controlador, calculado a partir del conocimiento de θd , θ̇d y


θ̈d :
· µ ¶ ¸
∗ 1 d2 θd (t) dθ(t) dθd (t) dθ(t)
i (t) = − kd − − kp (θ(t) − θd (t)) + a
k dt2 dt dt dt
(10.51)

Nótese que dθ(t)


dt representa la velocidad medida del motor. Sustituyendo
(10.51) en (10.50) se obtiene:
µ ¶
d2 θ(t) d2 θd (t) dθ(t) dθd (t)
− + kd − + kp (θ(t) − θd (t)) = 0
dt2 dt2 dt dt
(10.52)

Defı́nase el error de seguimiento como ε(t) = θ(t) − θd (t) y su transformada


de Laplace E(s). Entonces (10.52) se puede escribir como:

dε(0)
s2 E(s) − sε(0) − + kd sE(s) − kd ε(0) + kp E(s) = 0 (10.53)
dt
y finalmente:

(kd + s)ε(0) + dε(0)


dt
E(s) = (10.54)
s2 + kd s + kp

De acuerdo al capı́tulo 3 la solución de (10.54) tiene la forma:

ε(t) = εn (t) + εf (t)

donde la respuesta forzada es cero εf (t) = 0 porque la exitación de la ecuación


diferencial en (10.53) es cero. Por tanto, ε(t) = εn (t) lo cual tiende a cero
conforme el tiempo crece si las dos raı́ces del polinomio caracterı́stico s2 +
kd s + kp tienen parte real negativa. Esta situación es la deseable porque si
ε(t) tiende a cero entonces θ(t) tiende a θd (t) conforme el tiempo crece. Por
otro lado, como el polinomio caracterı́stico s2 + kd s + kp es de segundo orden
554 10 Control de posición de un motor de CD

entonces, de acuerdo a la sección 4.2, sus dos raı́ces tienen parte real negativa
si todos los coeficientes de dicho polinomio tienen el mismo signo, es decir,
si kp > 0 y kd > 0. Este es el criterio para la selección de estas ganancias.
Sin embargo, debe tenerse presente que desde el punto de vista práctico no
todas las ganancias ası́ seleccionadas presentarán desempeños satisfactorios y
deberán probarse varios valores hasta obtener un buen funcionamiento. En la
figura 10.12 se muestran los resultados experimentales obtenidos cuando se
usa el motor con k = 25.26 y a = 3.5201 junto con el controlador (10.51), las
ganancias:
kp = 363.88, kd = 22
y la trayectoria deseada:
θd (t) = 0.8 sin(5t) + 0.5 cos(3t) + 3.0 (10.55)
Nótese que θ alcanza el valor deseado de posición θd (t) a pesar de que estas
variables tienen valores iniciales diferentes. Es importante mencionar que de-
bido a que se conoce la expresión para θd dada en (10.55) entonces se obtienen
las expresiones correspondientes para θ̇d y θ̈d mediante diferenciación fuera de
linea por lo que no hay problemas de ruido importantes en este caso.

[V]


[A]

tiempo [s]

Figura 10.12. Controlador para el seguimiento de trayectorias. La posición del


motor θ está representada por la lı́nea interrumpida. La lı́nea continua corresponde
a θd (t).
10.5 Cálculo numérico de los algoritmos de control 555

10.5. Cálculo numérico de los algoritmos de control


Deriferenciación numérica

Esta es la operación que permite obtener un estimado de la velocidad para


los controladores en las secciones 10.2.1, 10.3.2 y 10.4. Sea:
dw
y= (10.56)
dt
entonces, esta operación se puede aproximar numéricamente mediante:
w(k) − w(k − 1)
y≈ (10.57)
∆t
donde w(k) representa el valor de w medido en el instante de muestreo pre-
sente, w(k − 1) es el valor de w medido en el instante de muestreo previo y
∆t es el periodo de muestreo utilizado. Para que se obtenga una buena apro-
ximación ∆t debe ser “pequeño” comparado con el tiempo de respuesta del
motor.

Integración numérica

Se procede como se indica en la sección 9.8

Compensador de adelanto

Ahora se explica como se calcula la expresión en (10.21) involucrada en


el compensador de adelanto presentado en la sección 10.2.2. De acuerdo a
(10.56) y (10.57) se puede hacer un corrimiento en el tiempo para redefinir:

dw w(k + 1) − w(k)
≈ (10.58)
dt ∆t
Esto se puede usar para aproximar:
v(k + 1) − v(k)
v̇ = −cv(k) + (d − c)e(k) ≈ (10.59)
∆t
y, por tanto:

v(k + 1) = [−cv(k) + (d − c)e(k)]∆t + v(k) (10.60)

Entonces, a partir de la medición de e(k) = θd (k) − θ(k) se puede calcular


iterativamente v(k + 1) partiendo del valor inicial v(0) = 0. La forma en que
(10.60) está expresada es muy conveniente pues permite que el primer valor
utilizado de v(k) sea cero en k = 0. Recuérdese que v(k + 1) se calcula en
el instante de muestreo presente pero sólo será utilizado hasta el instante de
muestreo próximo inmediato en el futuro.
556 10 Control de posición de un motor de CD

10.6. Construcción del sistema de control


En la figura 10.13 se muestra el diagrama eléctrico del sistema de control
completo. A continuación se listan los componentes utilizados:
Motor de CD con escobillas e imán permanente. Voltaje nominal 20[V],
corriente nominal 3[A]. Cuenta con un encoder de 400 pulsos/vuelta, el
cual se alimenta con +5[V] de CD.
Una computadora portátil Laptop con puerto USB.
Conector de USB a serie.
Microcontrolador PIC16F877A de Microchip.
Convertidor digital/analógico DAC0800LCN.
Amplificador operacional cuadruple TL084.
Amplificadores operacionales TL081.
Manejador/Receptor MAX232.
Transistores TIP141 y TIP145.

Funcionamiento

El microcontrolador PIC16F877A tiene la tarea principal de ejecutar el


algoritmo de control correspondiente. Es decir, conocido el valor deseado de
posición θd y la medición de la posición actual θ, el microcontrolador calcula
el valor de la señal de control i∗ .
Tal como se indica en la figura 10.13, el valor de −i∗ debe aparecer a
la entrada del amplificador operacional TL081 dentro del recuadro titulado
“control de corriente”. Esto se consigue del siguiente modo. Primero, en el
programa listado en la sección 10.7 se hace iast=-iast, para cambiar el signo
de i∗ a −i∗ . El microcontrolador debe entregar un código digital (iastd) de
8 bits al convertidor digital/analógico de 8 bits DAC0800LCN. Para esto, el
microcontrolador realiza la operación:

iastd = 36.4286 ∗ iast + 127

la cual obedece a la relación mostrada gráficamente en al figura 10.14. El


convertidor digital/analógico trabaja en conjunto con un amplificador opera-
cional TL081. Estos dispositivos están conectados de acuerdo a las sugerencias
del fabricante [1]. Esto asegura que a la salida del amplificador operacional se
obtiene un voltaje cuyo valor numérico corresponde al de −i∗ . Este valor es
recibido por un amplificador operacional TL081 que se encarga de evaluar el
lazo de corriente:

ui = 100(i∗ − i)

Finalmente, el amplificador de potencia de ganancia unitaria está constituido


por un tercer amplificador operacional TL081 junto con dos transistores de
potencia TIP141 y TIP145, conectados en simetrı́a complementaria.
10.6 Construcción del sistema de control 557

Figura 10.13. Diagrama eléctrico del sistema de control de posición basado en el


microcontrolador PIC16F877A.
558 10 Control de posición de un motor de CD

iastd

255

127

à 3:5 3:5 iast

Figura 10.14. Acondicionamiento de la señal i∗ que debe ser enviada al convertidor


digital/analógico.

El Manejador/Receptor MAX232 se encarga de enviar la posición medida


θ y la señal de control i∗ hacia una computadora portátil (a través de un
conector USB a serie) cuyo único propósito es el graficado de dichas variables.
A continuación se describe la manera en que el microcontrolador PIC16F87
7A realiza la función de controlador. Antes que nada se debe aclarar que no
es el propósito presentar toda una exposición de como trabaja este micro-
controlador. Lo que se presenta es una descripción de los recursos de este
microcontrolador que se utilizan para construir los controladores bajo prue-
ba. En la siguiente sección se presenta un listado del programa utilizado.
El microcontrolador PIC16F877A [2] es de tecnologı́a EEPROM, tiene una
velocidad de operación máxima de 20 MHz y cuenta con 5 puertos de entrada-
salida configurables y 3 temporizadores. El timer TMR0 es utilizado en este
capı́tulo para establecer el periodo de muestreo: T = 0.001[seg] (20 cuentas del
timer 0) para los experimentos en las secciones 10.1, 10.2.1 y 10.2.2, mientras
que T = 0.002[seg] (40 cuentas del timer 0) para el experimento en la sección
10.3.2.
La posición θ se mide desde el encoder usando una subrutina y se alma-
cena en la variable “cuenta2” de 16 bits. La posición en radianes se obtiene
mediante la operación pos=cuenta2*0.0039 donde 0.0039=3.1416 rad/(2*400
cuentas). Esto es debido a que tratándose de un encoder de 400 pulsos por
vuelta, en realidad se obtienen 4×400 cuentas por vuelta (por cada 2π ra-
dianes), es decir 2×400 cuentas por cada π radianes. Una vez calculada la
señal de control “iast” se entrega al convertidor digital/analógico a través
del puerto D (PORTD=iastd). Finalmente, la posición (a través de la va-
riable “cuenta”) o la señal de control (a través de la variable “iastd”) son
enviados a la computadora portátil mediante las instrucciones: putc(0xAA);
putc(cuentaH); putc(cuentaL);
10.7 Programación del microcontrolador PIC16F877A 559

Control de corriente

Esta parte es idéntica a lo descrito en la sección 9.6.1.

Amplificador de potencia

Esta parte es idéntica a lo descrito en la sección 9.6.2.

10.7. Programación del microcontrolador PIC16F877A

Se recomienda consultar la referencia [3] para una explicación precisa de


cada una de las instrucciones que aparecen en el siguiente listado.
// Programa para comunicacin serial entre PC y proyecto Control
// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
#device adc=10 //manejar adc de 10 bits
#include<stdlib.h>
#include<math.h>

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD
#usedelay(clock=20000000) //Base de tiempo (frecuencia // del
Xtal)

#use
rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)//Config.
//P. Serie
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05
#byte PORTB = 0x06
#byte PORTC = 0x07
#byte PORTD = 0x08
#byte PORTE = 0x09
#bit PC0 = 0x07.0
#bit PC1 = 0x07.1
//------------Declaracion de variables------------//
int16 inter,cuenta;
int8 cuentaH,cuentaL,puerto,AB,AB_1,aux,cont,iastd,cont2,cont3,cont4;
float pos,error,iast,cuenta2,posm1,kp,kv,c,delta,v,kp1,ki1,kp2,kd2,ie;
unsigned int u;
//int1 ban;
//------------Rutina de interrupcion (lee encoder)------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
560 10 Control de posición de un motor de CD

aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=4;
cont2=0;
cont3=0;
cont4=0;
PORTD=127; // se envia iast=0 al circuito de control
kp=1.6891;
kv=0.0414;
c=30.8018;
delta=1.6891;
v=0.0;
kp1=1.6891;
ki1=67.5659;
kp2=1.8241;
kd2=0.1006;
posm1=0.0;
ie=0.0;
while(cont2<3) // se introduce una espera de aprox 10 segundos
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
10.7 Programación del microcontrolador PIC16F877A 561

cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE) // ciclo de control
{
cont++;
cuenta2=(signed int16)cuenta;
pos=cuenta2*0.0039; // 3.1416 rad/(2*400 cuentas)
error=1.5-pos;
/* Identificacion */
// iast=0.5*error;
/* ___________________________________________ */

/* Control proporcional con retro de velocidad */


// iast=kp*error-kv*(pos-posm1)/0.001;
/* ___________________________________________ */

/* Red de adelanto */
// iast=delta*(error+v);
// v=(-c*v+(2.8-c)*error)*0.001+v;
/* ___________________________________________ */

/* Dos grados de libertad */


iast=kp1*error+ki1*ie-kp2*pos-kd2*(pos-posm1)/0.002;
ie=ie+0.002*error;
/* ___________________________________________ */

if(iast<-3.3) // iast se restringe a [-3.3,+3.3] Amperes


iast=-3.3; // (DAC entrega en el rango [-3.5,+3.5])
if(iast>3.3)
iast=3.3;
iast=-iast; //-i*, TL081 en ‘‘control de corriente’’
if(cont4>70) //tiempo>0.7 seg, perturbacion (-0.5) entrada
iast=iast+0.5;
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
posm1=pos;
/* // descomentar si se desea enviar la posicion a la
computadora portatil (cada 10 mseg)
if(cont==5)
{
cont=0;
inter=(cuenta)&(0xFF00);
cuentaH=inter>>8;
cuentaL=(cuenta)&(0x00FF);
putc(0xAA); //reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
562 10 Control de posición de un motor de CD

putc(cuentaL);
cont4++;
if(cont4==255)
cont4=0;
}
*/
/* // descomentar si se desea enviar la senal de control a
//la computadora portatil (cada 10 mseg)
iast=-iast; // graficar +i*
if(cont4>70) // senal control graficar sin perturbacion
iast=iast+0.5;
iastd=(unsigned int)(36.4286*iast+127);
if(cont==5)
{
cont=0;
inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=(iastd)&(0xFF);
putc(0xAA); //reconocimieno puerto serial
putc(cuentaH); //cuenta al puerto serial
putc(cuentaL);
cont4++;
if(cont4==255)
cont4=0;
}
*/
PC1=1; //inicia espera del timer
while(TMR0<40) //cada cuenta=(4/FXtal)*256 seg,
// (40=2 ms, periodo muestreo)
{
}
PC1=0; //termina espera del timer
TMR0=0;
} //cierre del while infinito
} //cierre del main

10.8. Control basado en una computadora personal

El controlador presentado en la sección 10.4 para el seguimiento de trayec-


torias fue probado experimentalmente usando una computadora personal y
una tarjeta adquisitora de datos. Esto debido a que el cálculo de las funciones
trigonométricas seno y coseno que se requieren consumen mucho tiempo en el
microcontrolador PIC16F877A. Este problema desaparece cuando se usa una
computadora personal. A continuación se listan los componentes principales
del sistema de control.

Computadora personal de escritorio Pentium II a 233 MHz.


10.8 Control basado en una computadora personal 563

Tarjeta adquisitora de datos PCL-812PG de Advantech [4]. Cuenta con 15


canales de entrada analógico/digital manejados por un solo convertidor AD
de aproximaciones sucesivas de 12 bits, con entrada analógica en el rango
de -5[V] a +5[V]. Dos canales de salida digital/analógico, cada uno cuenta
con un convertidor DA de 12 bits, con salida analógica en el rango de 0[V]
a +5[V]. También se cuenta con dos contadores que son programados para
establecer el periodo de muestreo en un amplio rango de valores. En el
experimento de la figura 10.12 se uso un periodo de muestreo de 0.005[s].
Motor de CD con escobillas e imán permanente. Voltaje nominal de 24[V],
corriente nominal de 2.3[A].
Sensor de posición. Potenciómetro de precisión de 1[KOhm], diez vueltas,
con tope.
En la figura 10.15 se presenta el diagrama de bloques del sistema de control
completo.

Acoplamiento mecánico del sensor de posición

Dado que la medición de la posición del motor se realiza con un poten-


ciómetro con tope, es importante preveer la posibilidad de que dicho tope sea
alcanzado pues esto puede dañar al potenciómetro dado el gran par que puede
desarrollar el motor. Por esta razón se utiliza un acoplamiento mecánico que
consta de un anillo de goma que se une firmemente a la flecha del motor. El
diámetro de este anillo es tal que el extremo móvil del potenciómetro puede
entrar en él de manera mas o menos ajustada. De esta manera, si se alcanza
el tope del potenciómetro, la flexibilidad del anillo de goma permite que la
flecha del motor siga girando sin dañar la parte móvil del potenciómetro que
permanecerá en reposo.

Interfaz de entrada

El potenciómetro usado como sensor de posición (figura 10.15) entrega a su


salida un voltaje θ en el rango de 0[V] a +5[V]. Esto es muy conveniente por-
que el convertidor de entrada analógico/digital recibe voltajes en el rango de
-5[V] a +5[V]. Ante el voltaje recibido desde el potenciómetro, el convertidor
analógico/digital entrega un código, “codigoi ”, en el rango de 0 a 2n = 4096
porque dicho convertidor es de 12 bits. A partir de este código debe recupe-
rarse una variable ua que numéricamente sea igual al voltaje entregado por el
potenciómetro θ. De acuerdo a la figura 10.16 esto puede realizarse mediante
la operación:
10.0
ua = codigoi − 5.0 (10.61)
4096.0
la cual debe ser efectuada por el programa de computadora.
basado en una computadora personal.
Figura 10.15. Diagrama de bloques e interfaces del sistema de control de posición

564
10 Control de posición de un motor de CD
Amplificador de potencia
Interfaz de salida Control de corriente
15V
6:72k 3:3k
5:6k 1M Q TIP 141
PCL 3:3k 33k
CP à
ui
812 PG ud TL081
+
à
TL081
+
à
TL081 + u 5V
[0; 5 ] V TL081
+

5:5k 33k
à

à iã Q TIP 145
MOTOR Sensor de
[à 3; 3 ] A 1k posición
5V 1k ò
à 15V

i 5W

Realimentaciòn de corriente

Realimentaciòn de posiciòn
10.8 Control basado en una computadora personal 565
ua

4096 código
i

à5

Figura 10.16. Acondicionamiento de la señal de posición entregada por el conver-


tidor analógico/digital.

Interfaz de salida

De acuerdo a (10.1) la señal de control es la orden de corriente −i∗ la cual,


de acuerdo a las especificaciones del motor, bien puede tomar valores en el
rango de -3[A] a +3[A]. Esta señal es calculada por la computadora, la cual
envı́a el dato a la tarjeta adquisitora de datos quien debe entregar el valor de
−i∗ como una señal de voltaje analógico.
Una vez que el programa de computadora calcula −i∗ , mediante el uso del
algoritmo de control correspondiente, se utiliza un conjunto de instrucciones
que independientemente del valor de −i∗ éste se restringe al rango [-3,+3][V].
Después, sabiendo que el convertidor digital/analógico es de 12 bits, se cons-
truye el esquema mostrado en la figura 10.17 para encontrar que el valor de
−i∗ debe enviarse al convertidor digital/analógico mediante un código calcu-
lado como (esto se realiza en el programa de computadora):
4096
codigoo = (−i∗ ) + 2048 (10.62)
6
Como resultado de esta orden el convertidor digital/analógico entregará un
voltaje analógico ud en el rango de 0[V] a +5[V]. Ası́ que se debe utilizar
un circuito analógico de interfase que adapte este voltaje en el rango 0[V]
a +5[V] al rango de -3[V] a +3[V] que son los valores que tomará −i∗ . De
acuerdo a la figura 10.18 esto se consigue con un circuito analógico, basado
en amplificadores operacionales, que realice la siguiente operación:
6
−i∗ = ud − 3 (10.63)
5
566 10 Control de posición de un motor de CD

Esta es la función que realiza el bloque “interfaz de salida” de la figura 10.15


1
. La razón de que deba aparecer −i∗ como resultado de todas las operaciones
descritas tiene que ver con la compatibilidad de signos que deben respetar los
circuitos que en la figura 10.15 se colocan a continuación del punto señalado
con −i∗ .

código 0

4096

2048

à3 3 (à iã)

Figura 10.17. Acondicionamiento de la señal −i∗ que debe ser enviada al conver-
tidor digital/analógico.

(à iã)

5 ud
à3

Figura 10.18. Diseño de la interfaz analógica que debe ser colocada a la salida del
convertidor digital/analógico.

1
Todos los amplificadores operacionales usados en la figura 10.15 son TL081. Los
tres primeros tienen la terminal “+” conectada a tierra mientras que el conectado
a las bases de los transistores tiene la terminal “+” conectada a ui .
10.8 Control basado en una computadora personal 567

Control de corriente

El amplificador operacional mostrado en el bloque “control de corriente”


de la figura 10.15 realiza la operación indicada en (9.14) con K = 30.

Amplificador de potencia

Esta parte es idéntica a lo expuesto en la sección 9.6.2.

Programa de computadora

Todos los algoritmos de control fueron programados en Borland C++. A


continuación se lista el código utilizado.
#include <stdio.h>
#include <conio.h>
#include <math.h>

#include <stdlib.h>
#include <string.h>
#include <iostream.h>

int alto,bajo,dato,salida,i;

volatile float Ts=0.005;//Periodo de muestreo

/*------------------variables para encoder----------*/


//volatile int alto_dig=0,bajo_dig=0,dato_dig=0;
volatile float y,ir,ym1,v,dv,nv,e,ninte;

volatile float inte,gc1,gc2,tiempo,perturbacion;


/*--------------------------------------------------*/

volatile float r_des=1.0,Kp=1.9434,Kv=0.1777;


//volatile float gama=2.3853,c=12.2734,b=4.8935;
volatile float gama=2.0465,c=10.3672,b=3.8935;

volatile float kp1=1.9434,ki1=9.7170;

volatile float kp2=1.3878,kd2=0.3195;


volatile long double y0;
/*-Direccion base y periodo de muestreo para la tarjeta--*/

int base=0x210;//Direccion base de la tarjeta

int lsb1=0x00;//Periodo de muestreo

int msb1=0x01;//Periodo de muestreo


568 10 Control de posición de un motor de CD

int lsb2=0x00;//Periodo de muestreo

int msb2=0x01;//Periodo de muestreo

volatile float yy[3000];


volatile float uu[3000];

volatile float ref[3000];


FILE *fp;
char Direccion[30];

void Inicializa(void);

void EscribeArchivo(float datos1,floatdatos2,float datos3);

void Cierra(void); void main()


{
clrscr();

/*---------Se programa la tarjeta adquisitora--------*/

/*---Vease manual PCL 812-PG de Advantech------*/

outportb(base+11,6);
//CAD iniciada con reloj y transferencia dato por software
outportb(base+9,0);// ganancia 1

outportb(base+10,15);// Canal AD No. 15


outportb(base+3,0x77);//Programacion periodo de muestreo
outportb(base+1,lsb1);//Programacion periodo de muestreo
outportb(base+1,msb1);//Programacion periodo de muestreo
outportb(base+3,0xb7);//Programacion periodo de muestreo
outportb(base+2,lsb2);//Programacion periodo de muestreo
outportb(base+2,msb2);//Programacion periodo de muestreo
i=1;
do
// inicia ciclo de control
{
/*-------------Conversion AD----------------------------*/
do
{
} while (inportb(base+5)>15);
alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
y=(10.0/4096.0)*dato-5.0;//Posicion theta
tiempo=(i-1)*Ts;
/*--------Inicia lectura de encoder---------------------*/
10.8 Control basado en una computadora personal 569

// para la configuracion de entradas digitales


/*
alto_dig=inport(base+7);
alto_dig+=0xff+1;
bajo_dig=inport(base+6);
bajo_dig=(bajo_dig)&(0x00ff);
dato_dig=256*alto_dig+bajo_dig;
po_rad=((6.283185307*dato_dig)/1600);
// 1600 es el numero de cuentas por revolucion.
// gotoxy(10,10); printf("Posicion en radianes: %f",po_rad);
y=po_rad;
*/
/*-------Termina lectura encoder------------------------*/
if(i==1)
{ //condiciones iniciales
y0=y;
ym1=0.0;
v=0.0;
inte=0.0;
}
y=y-y0;//Salida fijada a cero
e=r_des-y;
/*------ Control proporcional + retro de velocidad------*/
/*
ir=Kp*(r_des-y)-Kv*(y-ym1)/Ts;
*/
/*----------- Control con red de adelanto --------------*/
/*
dv=(-c*v+(b-c)*e )*Ts;
nv=v+dv;
ir=gama*(e+v);
*/
/*---------- Control dos grados de libertad ------------*/
gc1=kp1*e+inte;
gc2=kp2*y+kd2*(y-ym1)/Ts;
ir=gc1-gc2;
ninte=inte+ki1*e*Ts;
perturbacion=0.0;
if(tiempo>1.5)
{perturbacion=0.5;}
ir=-ir+perturbacion;
// Saturacion de ir [-3,3][A]
if(ir>2.9 )
{ ir=2.9; }
if(ir<-2.9)
{ir=-2.9;}
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;
alto=salida & 0x0f00;
570 10 Control de posición de un motor de CD

alto=floor(alto/256.0);
outportb(base+4,bajo); //Manda codigo_o al CDA
outportb(base+5,alto);
yy[i]=y;
uu[i]=ir-perturbacion;
ref[i]=r_des;
ym1=y;
v=nv;
inte=ninte;
i++;
}while (!kbhit());// Termina ciclo de control
// while (i<=3000);
ir=0.0;// Se ordena detener el motor
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;

alto=salida & 0x0f00;


alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);
// Guarda datos en un archivo en el disco duro
cout<<i<<endl;
Inicializa();
i-=1;
for(int jj=1;jj<i;jj++)
{
EscribeArchivo(yy[jj],uu[jj],ref[jj]);
}
Cierra();
}

void Inicializa(void) {
strcpy(Direccion,"c:\\motorcd\\sigue.txt");
if( (fp=fopen(Direccion,"w+")) == NULL)
{
cout<<"No se puede crear el archivo ni modo";
exit(1);
}
}

void EscribeArchivo(float datos1,float datos2,float datos3) {


fprintf(fp,"%f %f %f \n",datos1,datos2,datos3);
}

void Cierra(void) {
fclose(fp);
}
10.10 Preguntas de repaso 571

10.9. Resumen del capı́tulo


Se ha mostrado cómo controlar la posición de un motor de CD bajo el
efecto de una perturbación externa de par. Para esto se han construido dos
controladores: uno es un controlador PID clásico y el otro es un controla-
dor PID modificado. Aunque ambos controladores resuelven el problema, el
controlador PID modificado presenta un mejor desempeño. Como este contro-
lador necesita el valor numérico de los parámetros del motor, se explica como
identificar de manera experimental tales parámetros. En este capı́tulo se ha
mostrado cómo sintonizar el controlador PID clásico usando el valor numérico
de los parámetros del motor. Sin embargo, la principal ventaja de este contro-
lador es que puede ser sintonizado a prueba y error sin necesidad de conocer
tales valores numéricos (véase la sección 5.3 del capı́tulo 5). Por último, se ha
construido un controlador PD para el seguimiento de trayectorias. Esta es una
tarea compleja que necesita del conocimiento de los parámetros del motor. Se
ha explicado de manera detallada como construir estos controladores usando
un microcontrolador y una computadora personal. La razón de usar una com-
putadora personal es la construción del controlador PD para el seguimiento
de trayectorias ya que se requiere del cálculo de funciones sinusoidales del
tiempo lo cual consume demasiado tiempo si se utiliza un microcontrolador.
Cuando se construye un sistema de control en la práctica, es muy impor-
tante que el procesamiento de las señales que realiza el software y el hardware
utilizados corresponda fielmente a las operaciones matemáticas que indica el
controlador. El sistema de control que se ha construido ha sido elaborado
teniendo muy en cuenta este aspecto y la cuidadosa descripción del mismo
lo demuestra. Los autores pensamos que, desafortunadamente, en el medio
académico con mucha frecuencia se construyen sistemas de control de manera
un tanto descuidada. Es decir, cuando se controla la posición de un motor
de CD con frecuencia a la gente sólo le interesa que el motor se mueva hacia
donde se desea y poca antención se presta a verificar que la respuesta tran-
sitoria es la esperada. Normalmente la parte transitoria de la repuesta es la
más afectada por las inconsistencias introducidas en el software y el hardware
a la hora de procesar las señales correspondientes.

10.10. Preguntas de repaso

1. Considere el control PID de posición de un motor de CD ¿Qué pasarı́a si


la perturbación y/o la posición deseada no fueran constantes?
2. En robots industriales se usan controladores PID para el seguimiento de
trayectorias en lugar de controladores PD ¿Cómo cree que se pueda con-
seguir esto? ¿Qué ventajas cree que tenga el uso de controladores PID en
lugar de controladores PD?
3. ¿Cómo afectan las ganancias de un controlador PID clásico a la respues-
ta de un sistema de control de posición? Si el efecto de la perturbación
572 10 Control de posición de un motor de CD

externa es compensada lentamente ¿Qué ajustarı́a en las ganancias del


controlador PID para acelerar este proceso?
4. En el capı́tulo 9 se ha visto que un controlador PI es adecuado para
compensar el efecto de perturbaciones externas de par en sistemas de
control de velocidad ¿Por qué cree que en sistemas de control de posición
se deba usar un controlador PID en lugar de un controlador PI?
5. Mencione algunas ventajas y desventajas de usar microcontroladores y
computadoras personales para construir controladores digitales.
6. Un motor de CD también se puede controlar sin usar un lazo de corriente
si se supone que la inductancia de armadura es despreciable (sobre todo
en motores pequeños) ¿Qué cambios tendrı́a que hacer a los circuitos de
las figuras 10.13 y 10.15 para trabajar sin lazo de corriente?
7. Describa el procedimiento presentado en este capı́tulo para la identifica-
ción experimental de los parámetros de un motor de CD.
8. ¿Qué es un compensador de adelanto?
9. ¿Cuáles son las ventajas y las desventajas de usar compensadores de ade-
lanto como controladores de posición?
10. En teorı́a, la respuesta de un sistema de control de posición se puede hacer
tan rápida y tan amortiguada como se desee usando un controlador PID
¿Qué problemas pueden presentarse en la práctica si las ganancias de un
controlador PID son muy grandes?
Referencias

1. DAC0800 8-bit Digital-to-Analog Converter, Data sheet, National Semiconduc-


tor Corporation, 1995.
2. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
3. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
4. PCL-812PG User’s Manual, Advantech, Taiwan, 1996.
5. K. Ogata, Ingenierı́a de Control Moderna, 4a. edición, Pearson Prentice-Hall,
Madrid, 2003.
6. N.S. Nise, Sistemas de control para ingenierı́a, 1a. edición en español, 1a. Re-
impresión, CECSA, México, 2004.
7. J. Chiasson, Modeling and High-performance control of electric machines, IEEE
Press-Wiley Interscience, New Jersey, 2005.
8. Parker Automation, Position systems and Controls, Training and Product Ca-
talog DC-ROM, Compumotor’s Virtual Classroom, 1998.
11
Control de un sistema de levitación magnética

Los sistemas de levitación magnética son equipos que permiten que un


cuerpo hecho de material ferromagnético “flote” o “levite” en el espacio sin
tener contacto alguno con los otros cuerpos que lo rodean. El secreto es el uso
de una fuerza magnética producida por un poderoso electroimán. La principal
razón para producir tal fenómeno es el hecho de que, al no haber contacto
mecánico, el cuerpo que levita puede moverse sin que exista fricción y, por
tanto, desgaste. Este fenómeno es utilizado actualmente en múltiples aplica-
ciones, quizá la más conocida es la de algunos trenes de alta velocidad.
576 11 Levitación magnética

Objetivos del capı́tulo

Construir la totalidad de las partes que componen a un sistema de levita-


ción magnética.
Construir un controlador PID usando electrónica analógica.
Aplicar los conceptos de control clásico a una planta que es inestable por
naturaleza.
Identificar de manera experimental los parámetros de un sistema relativa-
mente complejo.
Actualmente los sistemas de levitación magnética son muy importantes
debido a la gran cantidad de aplicaciones que tienen. A estos equipos también
se les conoce como MagLev, por la abreviación del término inglés “Magnetic
Levitation System”. Una de las principales razones para el uso de sistemas de
levitación magnética es su capacidad para eliminar la fricción entre las partes
mecánicas que lo forman. Algunos ejemplos de aplicación son los trenes de alta
velocidad que viajan flotando sobre un riel con el cual no tienen contacto [1],
los rodamientos magnéticos [2] que pueden eliminar la fricción y el consecuente
desgaste de las piezas mecánicas involucradas y la construcción de sistemas de
posicionamiento de gran exactitud [3] gracias a que se elimina la fricción no
lineal. Dada la importancia práctica de estos mecanismos, con frecuencia son
utilizados como sistemas experimentales para probar el desempeño de técnicas
de control clásicas y avanzadas [4], [5], [6], [7], [8], [9].
En este capı́tulo se diseña un sistema de levitación magnética sencillo que
puede ser visto como al principio de funcionamiento de las aplicaciones men-
cionadas previamente. En la figura 11.1 se muestra el sistema de levitación
magnética de interés. Este sistema consiste de una esfera de material ferro-
magnético que es atraı́da hacia arriba por la fuerza magnética debida a un
electroimán. Esta esfera metálica también recibe el efecto de la fuerza debida
a la gravedad dirigida hacia abajo. Se desea suspender o levitar a la esfera a
una distancia del imán que pueda ser fijada a voluntad. Sin embargo, el prin-
cipal problema para conseguirlo es que este sistema es claramente inestable
como se explica a continuación. Suponga que el electroimán ejerce sobre la
esfera metálica una fuerza hacia arriba de magnitud constante e igual a la que
ejerce la gravedad hacia abajo. Entonces las fuerzas se cancelan exactamen-
te y la esfera metálica permanecerá suspendida en el espacio. La experiencia
indica que la fuerza del electroimán es mayor conforme se está más cerca de
él, mientras que la fuerza de la gravedad es siempre la misma. Suponga ahora
que, por alguna razón, la esfera se desplaza un poco hacia arriba respecto de
la posición en donde se encontraba flotando. Esto hace que la fuerza del elec-
troimán sea mayor que la fuerza de gravedad, por lo que la esfera será atraı́da
hacia el electroimán hasta quedar pegada al mismo. Por otro lado, si la esfera
se desplaza ligeramente hacia abajo respecto de la posición en donde se en-
contraba flotando, entonces ahora es la fuerza de la gravedad la que vence y la
esfera caerá hasta el suelo. Una situación como la recién descrita es muestra
11 Levitación magnética 577

de la inestabilidad de un sistema: cuando se perturba ligeramente a un siste-


ma inestable, las variables del mismo se alejarán del lugar en que inicialmente
estaban.

electroimán

õ
u

y=0
F y

m
esfera
mg

Figura 11.1. Sistema de levitación magnética.

Las variables y parámetros involucrados son los siguientes:


u es el voltaje aplicado en las terminales del electroimán.
i es la corriente eléctrica a través del devanado del electroimán.
y es la posición de la esfera medida entre la superficie inferior del elec-
troimán y la parte superior de la esfera. Esta distancia es cero cuando la
esfera toca al electroimán y crece (positiva) conforme la esfera se mueve
hacia abajo alejándose del electroimán.
F es la fuerza magnética ejercida por el electroimán sobre la esfera. Su
sentido se define en el mismo sentido en el que y crece. Más adelante se
mostrará que F es negativa por lo que representa correctamente una fuerza
de atracción.
m es la masa de la esfera.
L representa la inductancia del devanado del electroimán. La inductancia
cambia con la posición de la esfera y se acostumbra usar la notación L(y)
para subrayar este hecho.
R es la resistencia del cobre con el que está construido el devanado del
electroimán.
λ es el flujo magnético concatenado por el devanado del electroimán y
está dado como λ = L(y) i.
578 11 Levitación magnética

11.1. Modelo matemático no lineal


Modelo del subsistema eléctrico

Nótese que el circuito eléctrico del electroimán esta formado únicamente


por un circuito RL serie en el que aparecen el voltaje aplicado u, la inductancia
y la resistencia del devanado del electroimán (véase la figura 11.1). Aplicando
la Ley de Kirchhoff de voltajes se tiene:
X
voltaje aplicado = caı́das de voltaje en la malla
u = caı́da en la inductancia + caı́da en la resistencia

u= +Ri (11.1)
dt
donde se ha usado la Ley de Faraday para expresar que la caı́da en la in-
ductancia está dada por la variación respecto al tiempo del flujo concatenado

dt .
El flujo concatenado se relaciona con la corriente eléctrica a través de la
inductancia del siguiente modo λ = L(y) i, donde la inductancia L(y) no
es constante sino que es una función de la posición de la esfera y. Como se
verá más adelante, es importante saber como depende la inductancia de la po-
sición de la esfera. En [7], [8] pp.245, [10] pp. 31, se sugiere que la inductancia
está dada como:
k
L(y) = k0 + y (11.2)
1+ a

donde a, k0 y k son constantes positivas. Es interesante darse cuenta de que k0


y k0 + k representan, respectivamente, los valores de la inductancia cuando la
esfera no está presente (y → ∞) y cuando la esfera está pegada al electroimán
(y = 0). Por tanto, conforme la esfera se aleja del electroimán la inductancia
L(y) variará como se muestra en la figura 11.2. El parámetro a representa
la rapidez con que la inductancia varı́a entre k0 + k y k0 conforme crece
y. Es importante mencionar que la expresión (11.2) es propuesta de manera
empı́rica para ajustarse al comportamiento mostrado en la figura 11.2 y, por
tanto, no es la única manera de representar a L(y). Otra función que también
se propone con frecuencia es [11], [12]:
y
L(y) = k0 + ke− a (11.3)

Puede elegirse cualquiera de las funciones en (11.2) o (11.3) para represen-


tar a L(y) siempre que se obtenga el mejor ajuste a los datos experimentales.
En la sección 11.4.2 se explica como realizar un experimento para identifi-
car los parámetros de la inductancia. En este trabajo se continuará usando
el sı́mbolo general L(y) para representar la inductancia con el fin de que
el lector tenga la posibilidad de utilizar los resultados aquı́ expuestos para
11.1 Modelo matemático no lineal 579

L (y)

k0 + k

k0

Figura 11.2. La inductancia del electroimán como función de la posición de la


esfera.

cualquiera de los casos en (11.2) y en (11.3). Solamente en la parte final del


diseño, cuando se necesiten calcular valores numéricos muy especı́ficos, se pro-
cederá utilizar (11.2) porque con esta expresión se obtuvo el mejor ajuste a
los datos experimentales (véase la sección 11.4.2).

Modelo del subsistema mecánico

Un paso importante para obtener el modelo del subsistema mecánico es


la determinación de la fuerza magnética, F , ejercida por el electroimán sobre
la esfera. Esta fuerza, dirigida en el sentido en el que y crece, está dada por
(2.46). Esta expresión se reescribe a continuación para facilidad de referencia
y, dicho sea de paso, también puede ser consultada en los trabajos previos [7],
[10] pp. 31, [11], [12]:

∂E(i, y)
F = , (11.4)
∂y
1
E(i, y) = L(y) i2 (11.5)
2
donde E(i, y) es la energı́a magnética almacenada en el sistema magnético
completo (electroimán y esfera).
Aplicando la Segunda Ley de Newton a la esfera se obtiene el modelo del
subsistema mecánico (véase la figura 11.1):
580 11 Levitación magnética
X
masa × aceleración = fuerzas sobre la esfera
d2 y
m = fuerza del electroimán + peso de la esfera
dt2
d2 y
m 2 = F (i, y) + mg
dt
d2 y 1 ∂L(y) 2
m 2 = i + mg (11.6)
dt 2 ∂y
donde se han usado (11.4) y (11.5) para escribir:

1 ∂L(y) 2
F (i, y) = i
2 ∂y
El lector puede usar cualquiera de las expresiones en (11.2) y (11.3) para
verificar la siguiente propiedad:
∂L(y)
<0 (11.7)
∂y
para todo valor positivo de y, es decir, para cualquier posición de la esfera
que pueda ser alcanzada en la práctica. Nótese que el peso mg favorece el
incremento de y por lo que debe aparecer con signo positivo en (11.6). Por
otro lado, la fuerza F (i, y) también aparece afectada con un signo positivo
porque se define en la dirección en la que y crece. Sin embargo, su valor
negativo debido a (11.7) implica que su efecto es en contra del incremento de
y, es decir, en dirección opuesta al peso de la esfera. Por tanto, la propiedad
en (11.7) es indispensable para que la esfera pueda levitar venciendo el efecto
de la gravedad.
Por otro lado, se debe considerar el uso de un amplificador de potencia
a la entrada del electroimán (véase la sección 9.2) y un lazo de corriente, es
decir u = Ap γ(i∗ − i) donde Ap es la ganancia del amplificador de potencia,
γ es la ganancia proporcional del lazo de corriente e i∗ es la corriente que se
desea circule a través del electroimán. El propósito de usar un lazo de corriente
puede explicarse sustituyendo u = Ap γ(i∗ − i) en (11.1):


Ap γ(i∗ − i) = +Ri (11.8)
dt
Si se elige un valor grande de γ entonces:
µ ¶
1 dλ
i∗ − i = +Ri ≈0
Ap γ dt

por lo que se puede considerar que i = i∗ , es decir, que la corriente en el


electroimán es igual a la corriente que se ha ordenado. La ventaja de esto es
que ahora el sistema de control es robusto contra cambios de parámetros en
la dinámica eléctrica dada en (11.1). Por ejemplo, la resistencia del devanado
11.2 Modelo lineal aproximado 581

puede tener variaciones (incrementos) importantes debidas al calor producido


por la gran corriente eléctrica que normalmente se necesita para hacer levitar
la esfera. Si la resistencia crece, entonces la corriente (y por tanto, la fuerza
del electroimán sobre la esfera) disminuye. Esto requiere aumentar el voltaje
aplicado para incrementar la fuerza del imán sobre la bola. Como consecuen-
cia, se incrementa el valor de la corriente, aumentando el calor disipado y, por
tanto, la resistencia vuelve a crecer. Finalmente el voltaje aplicado será tan
grande que alcanzará el valor de saturación del amplificador de potencia y,
entonces, la esfera ya no podrá levitar. Al usar el lazo de corriente se con-
sigue que la corriente sea igual a la corriente deseada u ordenada, i = i∗ ,
independientemente de los cambios en la resistencia o algún otro parámetro
en (11.1).
Sustituyendo λ = L(y)i en (11.8) se obtiene:

di ∂L(y)
L(y) = Ap γi∗ − r i − ẏ i (11.9)
dt ∂y
donde se ha definido r = R+Ap γ. Entonces, el modelo del sistema de levitación
magnética completo está dado por:

di ∂L(y)
L(y) = Ap γi∗ − r i − ẏ i (11.10)
dt ∂y
d2 y 1 ∂L(y) 2
m 2 = i + mg (11.11)
dt 2 ∂y

El modelo matemático en (11.10), (11.11), es no lineal porque incluye fun-


ciones inversas de y y funciones cuadráticas de i. Estas caracterı́sticas no
permiten el uso de la transformada de Laplace para diseñar el controlador.
Una manera de resolver este problema es encontrando un modelo lineal que
represente, al menos de manera aproximada, al modelo no lineal en (11.10),
(11.11). Sin embargo, este modelo aproximado y el controlador obtenido a
partir de él sólo serán de utilidad en una región de tamaño reducido.

11.2. Modelo lineal aproximado


11.2.1. Obtención de un modelo en variables de estado

De acuerdo a lo expuesto en la sección 7.1, dado un conjunto de ecuaciones


diferenciales como (11.10), (11.11), se puede encontrar una representación en
variables de estado definiendo las componentes del vector de estado x como
las variables incógnita de dichas ecuaciones diferenciales y sus primeras q − 1
derivadas, donde q es el orden de la ecuación diferencial correspondiente. La
incógnita en (11.10) es i y la ecuación es de primer orden, por tanto, sólo
i califica como componente del vector de estado. Por otro lado, la incógnita
en (11.11) es y y la ecuación es de segundo orden, por tanto y y ẏ califican
582 11 Levitación magnética

como componentes del vector de estado. De acuerdo a lo anterior, se propone


el siguiente vector de estado:
   
x1 i
x =  x2  =  y  (11.12)
x3 ẏ

Es importante aclarar que i∗ no es una variable de estado sino la variable


de control, es decir, ahora es la entrada del sistema de levitación magnética.
Sustituyendo en (11.10), (11.11), las variables definidas en (11.12) se puede
escribir:
µ ¶
1 ∗ ∂L(x2 )
ẋ1 = Ap γi − r x1 − x3 x1
L(x2 ) ∂x2
ẋ2 = x3
1 ∂L(x2 ) 2
ẋ3 = g + x1
2m ∂x2
Usando notación vectorial se obtiene:

ẋ = f (x, i∗ ) (11.13)
   ³ ´
1 ∗ ∂L(x )
f1 (x, i∗ ) Ap γi − r x1 − ∂x2 x3 x1
2

∗  ∗   L(x2 ) 
f (x, i ) = f2 (x, i ) =  x3 (11.14)
f3 (x, i∗ ) g+ 1 ∂L(x2 )
x1 2
2m ∂x2

De acuerdo a la sección 7.2.2, los puntos de operación son las parejas (x∗ , i∗o )
que satisfacen:
 ³ ´  
1 ∂L(x∗ )
L(x∗ ) Ap γi∗o − r x∗1 − ∂x22 x∗3 x∗1 0
 2   
f (x∗ , i∗o ) =  x∗3 = 0 (11.15)

1 ∂L(x2 ) ∗ 2
g + 2m ∂x2 x1 0

∂L(x∗ )
donde L(x∗2 ) y ∂x22 indican que dichas funciones están evaluadas en x2 = x∗2 .
Entonces se obtiene:

x∗3 = 0 (11.16)
s
2mg
x∗1 = ∂L(x∗ )
(11.17)
− ∂x22
r ∗
i∗o = x (11.18)
Ap γ 1
∂L(x∗ )
Recuérdese que − ∂x22 > 0, debido a (11.7). El valor de x∗2 = yd se propone
ya que representa la posición en la que se desea hacer levitar a la esfera.
11.2 Modelo lineal aproximado 583

11.2.2. Aproximación lineal

De acuerdo a (7.29), (7.30), (7.31) en la sección 7.2.2, el modelo no lineal


dado en (11.13), (11.14) puede ser aproximado por el siguiente modelo lineal:

ż = Az + Bv (11.19)
 ∂f1 (x,i∗ ) ∂f1 (x,i∗ ) ∂f1 (x,i∗ )

∂x1 ∗ ∂x2 ∂x3
 ∂f2 (x,i ) ∂f2 (x,i∗ ) ∂f2 (x,i∗ ) 
A= ∂x1 ∂x2 ∂x3 
∂f3 (x,i∗ ) ∂f3 (x,i∗ ) ∂f3 (x,i∗ )
∂x1 ∂x2 ∂x3 x=x∗ ,i∗ =i∗
o
 
∂f1 (x,i∗ )
∂i∗
 ∂f2 (x,i∗ ) 
B= ∂i∗ 
∂f3 (x,i∗ )
∂i∗ x=x∗ ,i∗ =i∗
o

donde z = x − x∗ y v = i∗ − i∗o . Usando (11.14) se obtiene:


   Ap γ 
a11 0 a13 L(x∗2)
A =  0 0 1 , B= 0 , (11.20)
a31 a32 0 0
r 1 ∂L(x∗2 ) ∗
a11 = − , a13 = − x

L(x2 ) L(x∗2 ) ∂x2 1
1 ∂L(x∗2 ) ∗ 1 ∂ 2 L(x∗2 ) ∗2
a31 = x1 , a32 = x1
m ∂x2 2m ∂x22

Recuérdese que el punto de operación x∗ = [x∗1 x∗2 x∗3 ]T , i∗o , representa cua-
tro valores escalares constantes. Usando la transformada de Laplace en cada
renglón de (11.19) junto con los valores dados en (11.20) se obtiene:

1 Ap γ a31
Z1 (s) = [a13 Z3 (s) + V (s)], Z2 (s) = 2 Z1 (s),
s − a11 L(x∗2 ) s − a32
sZ2 (s) = Z3 (s) (11.21)

donde Z1 (s), Z2 (s), Z3 (s), V (s) representan las transformadas de Laplace de


las funciones del tiempo z1 = x1 − x∗1 , z2 = x2 − x∗2 , z3 = x3 − x∗3 y v = i∗ − i∗o ,
respectivamente. Combinando las expresiones en (11.21) se obtiene:
a31 Ap γ
Z2 (s) 2)
L(x∗
= 3 2
(11.22)
V (s) s − a11 s − (a32 + a31 a13 )s + a11 a32

La función de transferencia en (11.22) representa el modelo lineal aproximado


que será utilizado para estudiar y diseñar un controlador que permita levitar
la esfera. Recuérdese que, de acuerdo a la sección 7.2, todo lo que se obtenga a
partir del uso de (11.22) sólo será válido si x e i∗ permanecen cerca del punto
de operación (x∗ , i∗o ).
584 11 Levitación magnética

11.3. Construcción del prototipo


A continuación se describe la manera en que fueron construidas las partes
principales del sistema de levitación magnética.

11.3.1. Esfera

La esfera debe ser de material ferromagnético y, a la vez, debe ser suficien-


temente ligera. Por otro lado, con el fin de facilitar la medición de su posición,
la esfera no debe ser demasiado pequeña. Estos requerimientos fueron satisfe-
chos seleccionando una esfera de unisel de tamaño adecuado (aproximadamen-
te 0.03[m] de diámetro), de acuerdo al sensor de posición que será construido,
y se procedió a cubrir toda su superficie con material ferromagnético. Esto
último se consiguió insertando pequeñas tachuelas de acero sobre la superfi-
cie de la esfera. Aunque no se consiguió una superficie esférica perfectamente
lisa (quedan espacios no ferromagnéticos entre las tachuelas), sin embargo,
los resultados muestran que lo obtenido es suficiente. Con el fin de evitar el
desprendimiento de las tachuelas éstas se insertaron agregando pegamento.

11.3.2. Electroimán

Se utilizó un transformador al cual se le realizaron las siguientes modifi-


caciones. Como la mayorı́a de los transformadores, el transformador original
constaba de un núcleo formado por láminas en forma de E las cuales estaban
colocadas en forma encontrada. Esto permite formar un circuito magnético con
dos ramas con una dispersión despreciable de las lı́neas de campo magnético.
Se procedió a desmontar el núcleo para colocar todas las láminas en forma
de E en una sola dirección como se muestra en la figura 11.1. Esto permi-
te que la esfera al levitar cierre convenientemente el circuito magnético del
electroimán generándose de esta manera una fuerza magnética de atracción
del electroimán sobre la esfera. El devanado del electroimán se construyó en-
rollando alambre magneto del número 19. Esto debe hacerse de manera que
las espiras queden perfectamente acomodadas una a lado de la otra, sin que
quede una sobre la otra, y formando tantas capas como lo permita el espacio
libre que hay en las láminas en forma de E. Las dimensiones del transformador
utilizado fueron seleccionadas mediante experimentación: una vez que se ha
seleccionado la esfera a levitar se verifica si, con las fuentes de alimentación de
las que se dispone, el transformador es capaz de generar una suficiente fuerza
de atracción sobre la esfera. También debe verificarse que el calentamiento del
electroimán obtenido no sea exagerado.

11.3.3. Sensor de posición

El componente principal es una simple fotorresistencia que se conecta en


serie con una resistencia fija para formar un divisor de tensión (véase la figura
12:5V

Figura 11.3. Diagrama eléctrico del sistema de control completo.


t Vt

47000pF 10k 1N4001


15V
10k
à 10k 6:8k

1N5404

TIP141
TL081
+
+
TL081
u L(y)
à
à à LM339
+ +

à
i à 1N4001

5W
12:5V 1k 10k
R2 C2
47k

11.3 Construcción del prototipo


10k 100k
2:2pF 2:2pF
R1 2:2pF 2:2pF
A 10k
à B
10k
TL082
+ à
TL082 à 1k
C1 àë= à v
Ad
+ TL082
+ à
TL082
sensor +
posición 15V à 15V à 15V T1
y i ã = v + i ão
10k 10k 10k
1k
V P1 1k
yv 1k y ãv i
ã

à Ao
d

585
586 11 Levitación magnética

11.3). La fotorresistencia se coloca dentro de una pelota de Ping-Pong para


aprovechar la dispersión de luz que su superficie consigue. De esta manera,
aunque la fotorresistencia es relativamente pequeña, sin embargo se obtiene
una variación uniforme de la luz que incide sobre ella en un amplio rango
de posiciones de la esfera. En este sentido, el diámetro de la esfera de unisel
utilizada para construir la esfera en la sección 11.3.1 es igual al diámetro
de la pelota de Ping-Pong. El conjunto se coloca en un extremo de un tubo
metálico de 0.10[m] de longitud cuyo diámetro se ajusta perfectamente a la
pelota de Ping-Pong. Las paredes interiores del tubo se cubren con cartulina
negra. La parte de la pelota de Ping-Pong que queda fuera del tubo se pinta de
negro. Todo esto permite disminuir la posibilidad de interferencias luminosas.
Frente al otro extremo del tubo se coloca una lámpara de luz visible. El
conjunto se coloca del siguiente modo. Cuando la esfera toca al electroimán la
luz de la lámpara es completamente obstruida y la fotorresistencia no recibe
luz, por lo que su resistencia es muy grande. Conforme la esfera se aleja
(hacia abajo) del electroimán la cantidad de luz que llega desde la lámpara
hasta la fotorresistencia aumenta, por lo que su resistencia disminuye cada vez
más. Ésto permite que el voltaje en el punto yv de la figura 11.3 aumente al
aumentar la posición de la esfera (crece al alejarse la esfera del electroimán).
Es interesante darse cuenta que no es necesario un sistema óptico basado
en algún tipo de luz no visible (infrarroja) si se asegura que se ha reducido
considerablemente la posibilidad de interferencias luminosas. El voltaje yv
representa la medición en volts de la posición y en metros (recuérdese que
y = x2 ). El valor deseado de posición se fija con el voltaje yv∗ en la figura 11.3
mediante el uso de un potenciómetro. Las dos resistencias entre los puntos
yv y yv∗ de la figura 11.3 permiten que el voltaje VP 1 en la misma figura
sea igual a 12 z2v , donde z2v = yv − yv∗ es el error de posición medido en
volts (véase el ejercicio 5 en el capı́tulo 2). Para obtener estos resultados es
recomendable que cada una de estas resistencias (de 10[KOhm]) sean varias
veces más grandes que las resistencias que están en serie con la fotorresistencia
y con el potenciómetro que fija a yv∗ . Por otro lado, las dos resistencias de
10[KOhm] deben ser al menos seis veces más chicas que el valor de R1 . La
relación entre z2v y el error de posición medido en metros z2 = x2 − x∗2
está dada por la ganancia del sensor óptico As , es decir:

z2v = As z2 (11.23)

11.3.4. Controlador

De acuerdo a lo visto en la sección 8.2, el amplificador operacional colocado


entre los puntos A y B de la figura 11.3 constituye un controlador PID que,
además, introduce un cambio de signo. Más adelante, en este capı́tulo, se
explica como seleccionar los valores de R1 , R2 , C1 y C2 .
11.4 Identificación experimental de los parámetros del modelo 587

11.3.5. Lazo de corriente

Los dos amplificadores operacionales que siguen a T 1, en la figura 11.3, son


utilizados para construir el lazo de corriente que efectúa la operación γ(i∗ −i),
valor que es entregado al amplificador de potencia justo en el diodo rectificador
colocado a la entrada del comparador LM339. Este diodo y la resistencia de
10[KOhm] sirven para evitar que sean aplicados voltajes negativos a la entrada
del comparador, los cuales pueden aparecer debido al ruido presente en el
circuito y a la alta ganancia del lazo de corriente γ = 100.

11.3.6. Amplificador de potencia

Como amplificador de potencia se utiliza un modulador por ancho de pulso


(PWM). Este amplificador consta de un circuito que genera una señal trian-
gular cuyo voltaje Vt varı́a entre 0[V] y 12.5[V] (parte superior de la figura
11.3). La frecuencia de esta señal determina la frecuencia base del PWM y
se seleccionó de 1.53[KHz]. Como se explica en la sección 11.5, este valor de
frecuencia satisface los requerimientos de diseño. La señal triangular se com-
para (LM339, en la figura 11.3) con la señal de γ(i∗ − i) entregada por el lazo
de corriente para generar la señal modulada por ancho de pulso, la cual se
aplica a la base de un transistor NPN TIP141 que se encarga de conectar y
desconectar un voltaje de potencia de Vs =12.5[V] (véase la figura 11.3). Este
amplificador de potencia se modela como una ganancia de valor dado como:
Vs 12.5
Ap = = =1 (11.24)
voltaje pico a pico de Vt 12.5

11.4. Identificación experimental de los parámetros del


modelo

11.4.1. Resistencia del electroimán, R

Se aplica sucesivamente un conjunto de voltajes de CD en las terminales del


eletroimán y se mide la corriente eléctrica resultante. Estas parejas de valores
se grafican en la figura 11.4 con el sı́mbolo “+” y se les ajusta una linea recta.
La pendiente de esta linea recta corresponde al valor de la resistencia R. Ası́,
se encuentra que R = 2.72[Ohm].

11.4.2. Inductancia del eletroimán, L(y)

Se coloca la esfera en diferentes posiciones, y, medidas desde la parte infe-


rior del electroimán hasta la parte superior de la esfera. Para cada una de estas
posiciones se mide, usando un puente RLC, la inductancia en las terminales
del electroimán, L(y). Dado que la frecuencia de operación del electroimán
588 11 Levitación magnética

u
[V]

i [A]

Figura 11.4. Medición experimental de R.

será de 1.53[KHz], debido a la frecuencia del amplificador de potencia tipo


PWM, estas mediciones de inductancia fueron realizadas usando una frecuen-
cia de 1[KHz] en el puente RLC. Esta es la frecuencia más cercana a 1.53[KHz]
que permite seleccionar el puente RLC utilizado. En la figura 11.5 se mues-
tran graficados con el sı́mbolo “+” los datos experimentales encontrados. A
continuación se proponen diferentes conjuntos de valores para los parámetros
k0 , k, a y con cada uno de ellos se calcula la función L(y) dada en (11.2)
para los valores de y utilizados en el experimento. En la figura 11.5 se mues-
tran con lı́nea continua los valores de L(y) que mejor se ajustaron a los datos
experimentales. Los parámetros utilizados para conseguir este ajuste son:

k0 = 36.3 × 10−3 [H], k = 3.5 × 10−3 [H], a = 5.2 × 10−3 [m] (11.25)

11.4.3. Ganancia del sensor de posición, As

Se coloca la esfera a diferentes distancias, y, respecto de la superficie infe-


rior del electroimán. Para cada una de estas posiciones se mide el voltaje yv
de la figura 11.3. En la figura 11.6 se grafican con el sı́mbolo “+” los datos
experimentales obtenidos. A estos puntos se les ajusta una lı́nea recta que
resulta tener una pendiente de 100[V/m]. Esto significa que la ganancia del
sensor es:
11.4 Identificación experimental de los parámetros del modelo 589

L(y)
[H]

y [m]

Figura 11.5. Identificación experimental de los parámetros k, k0 y a que definen a


L(y) en (11.2).

yv z2v
As = = = 100[V/m] (11.26)
y z2
Nótese que la ganancia del sensor también relaciona a z2v y z2 si se selecciona
yv∗ = 100x∗2 (recuérdese que y = x2 y que x∗2 = yd ). Se puede apreciar que
el comportamiento lineal del sensor ocurre para valores mayores a y = 0.005
[m].

11.4.4. Masa de la esfera, m

Usando una balanza digital se encontró que m = 0.018[Kg].


590 11 Levitación magnética

yv
[V]

y [m]

Figura 11.6. Identificación experimental de As .

11.5. Diseño del controlador


Primero se debe calcular el punto de operación deseado. Esto se consigue
proponiendo el valor deseado de posición x∗2 = yd = 0.01[m] y usando (11.16),
(11.17), (11.18) para encontrar x∗1 = 2.1174[A], x∗3 = 0[m/s], i∗o = 2.1749[A].
Por otro lado, el amplificador operacional marcado con T 1 realiza la ope-
ración i∗ = v + i∗o , donde v es la señal entregada por el controlador. Este
amplificador operacional introduce una ganancia adicional de valor Ad = 4.7,
la cual debe considerarse como una ganancia en cascada con el controlador.
Usando los valores numéricos mostrados en la sección 11.4, en (11.24), ası́ co-
mo γ = 100, se puede hacer uso de las expresiones en (11.20) para encontrar
que la función de transferencia en (11.22) está dada como:
Z2 (s) −24710
= 3 (11.27)
V (s) s + 2739s2 − 1250s − 3.536 × 106
Defı́nase la siguiente variable:
1
α(s) = V (s) (11.28)
Ad
Entonces usando (11.27), (11.28) y Ad = 4.7 se puede escribir:
Z2 (s) −24710 × 4.7
= 3 (11.29)
α(s) s + 2739s2 − 1250s − 3.536 × 106
11.5 Diseño del controlador 591

Los polos correspondientes están ubicados en:


s1 = 35.9, s2 = −2739.4, s3 = −35.9 (11.30)
lo cual implica que el sistema de levitación magnética es inestable en lazo
abierto, tal como se habı́a pronosticado al principio del presente capı́tulo. Por
esta razón, el principal propósito de diseñar un controlador consiste en con-
seguir que el sistema de control completo sea estable en lazo cerrado. El polo
en s2 = −2739.4 corresponde a la parte eléctrica del sistema de levitación
magnética y es muy grande comparado con los otros dos polos (correspon-
dientes a la parte mecánica) debido a que se está usando un lazo de corriente
de alta ganancia (γ = 100). Sin embargo, con el fin de seleccionar la frecuencia
correcta para el amplificador de potencia por modulación de ancho de pulso se
debe obtener el polo correspondiente a la dinámica eléctrica antes de aplicar
el lazo de corriente. Regresando a (11.1) y usando λ = L(y)i, se encuentra:
di ∂L(y)
L(y) =u−Ri− ẏ i
dt ∂y
Dado que se trata de una ecuación diferencial de primer orden en la variable i,
a partir de esta expresión se concluye que la constante de tiempo de la dinámi-
L(x∗ )
ca eléctrica en lazo abierto (en el punto de operación) está dada por R2 .
Por tanto, el polo de lazo abierto (antes de aplicar el lazo de corriente) de la
R
dinámica eléctrica está en s = − L(x∗ ) = −72.5384. Esto significa que el ancho
2
de banda de la planta a controlar es 72.5384[rad/s] ya que los otros dos polos,
correspondientes a la parte mecánica, son mas cercanos al origen en el plano
s. Es importante asegurar que la planta sólo responderá al valor medio de la
señal modulada por ancho de pulso entregada por el amplificador de poten-
cia. Esto se consigue si la frecuencia del amplificador de potencia 1.53[KHz],
cuando se expresa en radianes por segundo, es muy grande comparada con
72.5384[rad/s] lo cual es cierto porque:
72.5384[rad/s] ≪ 1.53 × 103 × 2π = 9613[rad/s]
Finalmente, una caracterı́stica importante de la función de transferencia en
(11.29) es que tiene ganancia negativa. Esto se debe a que incrementos en la
variable de entrada producen decrementos en la variable de salida y viceversa,
como se explica a continuación. Si la corriente ordenada i∗ aumenta, es decir
si v = i∗ − i∗o crece, entonces aumenta la fuerza del electroimán sobre la esfera
por lo que ésta sube y su posición z2 = x2 − x∗2 disminuye.
En la figura 11.7(a) se muestra el diagrama de bloques propuesto del sis-
tema de control completo. Nótese que se está utilizando realimentación po-
sitiva de la salida. La razón por la que se propone este diagrama de bloques
será comprendida conforme se realice el análisis que sigue a continuación.
Nótese que se pueden combinar (11.23) y (11.29) para obtener:
Z2v (s) −24710 × 4.7As
= 3
α(s) s + 2739s2 − 1250s − 3.536 × 106
592 11 Levitación magnética
Ganancia Amp:
Controlador del sumador potencia
ë = Avd ã Electroiman
yãv à + i + u
G c(s) Ad í Ap
z2v = yv à yãv
+ à
+ ï
ã
io
i
Ad
1Ò y

Sensor
optico
yv Esfera
As

(a)
Sistema de
Controlador levitacion
ë (s) = VA( sd ) Z2v (s) = Yv (s) à Yv ã (s)
G c(s) à G(s)

(b)
Sistema de
Controlador levitacion
0 + ë(s) à Z2v (s)
G c(s) G ( s)
Z2v (s) = Yv (s) à Yv ã (s)
à

(c)

Figura 11.7. Diagramas de bloques equivalentes del sistema de control.

donde Z2v (s) es la transformada de Laplace de z2v . Finalmente, usando As =


100 dado en (11.26) se encuentra:
Z2v (s)
= −G(s) (11.31)
α(s)
11613700
G(s) =
s3 + 2739s2 − 1250s − 3.536 × 106
Usando esta función de transferencia, el diagrama de bloques de la figura
11.7(a) puede representarse como en la figura 11.7(b) el cual, a su vez, pue-
de representarse como en la figura 11.7(c). Este último diagrama de bloques
es importante porque tiene la forma de un sistema en lazo cerrado con rea-
limentación negativa para el cual existen muchas herramientas de análisis y
diseño de controladores como el lugar de las raı́ces y las técnicas de respuesta
11.5 Diseño del controlador 593

en frecuencia. Nótese que este diagrama implica que se está usando una re-
ferencia deseada de valor cero para la variable de salida z2v . Aunque parezca
extraño, ésto tiene una razón muy importante: si z2v = 0 entonces, de acuerdo
a (11.23), z2 = x2 − x∗2 = 0, lo que implica que x2 = x∗2 , es decir, que la esfera
alcanza la posición deseada. Nótese también que para obtener el diagrama de
bloques de la figura 11.7(c) es fundamental utilizar realimentación positiva
ası́ como la estructura del diagrama de bloques que se muestra en la figura
11.7(a), lo que justifica su uso. Otra manera de explicar el uso de dicha rea-
limentación positiva es la necesidad de compensar la ganancia negativa que
tiene la función de transferencia del sistema de levitación magnética Zα(s)2v (s)

dada en (11.31).
La función de transferencia de lazo abierto en la figura 11.7(c) es:

Gc (s)G(s) (11.32)
α(s)
con G(s) dada en (11.31) y Gc (s) = Z2v (s) es la función de transferencia del
controlador que se diseñará.

11.5.1. Un controlador proporcional

Supóngase primero que se usará un controlador proporcional, es decir que


Gc (s) = kp donde kp es una constante positiva. La función de transferencia
de lazo abierto es:
11613700
kp (11.33)
s3 + 2739s2 − 1250s − 3.536 × 106
mientras que la función de transferencia de lazo cerrado está dada como:

kp s3 +2739s211613700
−1250s−3.536×106
11613700 kp
1+ s3 +2739s2 −1250s−3.536×106
11613700 kp
= (11.34)
s3 + 2739s2 − 1250s − 3.536 × 106 + 11613700 kp

Nótese que sin importar el valor que tome kp no se puede afectar el signo
del término −1250s en el denominador de esta función de transferencia. Esto
implica que siempre hay al menos un coeficiente del polinomio caracterı́stico de
dicha función de transferencia que tiene signo contrario a los otros coeficientes
lo cual, de acuerdo a la sección 4.2 significa que hay al menos un polo de lazo
cerrado en el semiplano complejo derecho, es decir, el sistema en lazo cerrado
es inestable.
En un caso como éste es necesario un controlador que contribuya con
un cero a la función de lazo abierto. Esto sugiere el uso de un controlador
proporcional-derivativo (PD). Sin embargo, es importante subrayar lo siguien-
te. De acuerdo a (11.17) y (11.18), el valor de i∗o es utilizado para compensar
594 11 Levitación magnética

de manera exacta el efecto de la gravedad y ası́ conseguir que el error en estado


estacionario sea cero, es decir que y = yd cuando el tiempo sea suficientemente
∂L(x∗ )
grande. Por tanto, cualquier incertidumbre en los valores de mg, de ∂x22 o
de la ganancia Ad resultará en un error de estado estacionario diferente de
cero. Una manera eficiente de resolver este problema es usando un controlador
que incluya una acción integral sobre el error de posición. Por esta razón, a
continuación se diseña un controlador PID.

11.5.2. Un controlador proporcional-integral-derivativo (PID)


El controlador propuesto tiene la siguiente forma:
à k
!
s2 + kdp s + kkdi
Gc (s) = kd (11.35)
s

En la sección 5.2.7 se ha encontrado el lugar de las raı́ces correspondiente a la


función de transferencia de lazo abierto Gc (s)G(s) con G(s) dada en (11.31)
y Gc (s) dada en (11.35) cuando se elige:
kp ki 31.24
= 31.24, = (11.36)
kd kd 0.8
De acuerdo a lo encontrado en la sección 5.2.7, todos los polos de lazo cerrado
tienen parte real negativa para valores de kd que satisfacen kd > 0.01. En la
tabla 11.1 se muestran los valores seleccionados de kd y las correspondientes
ganancias del controlador PID obtenidas usando (11.36).
El controlador PID se construye usando el amplificador operacional colo-
cado entre los puntos A y B de la figura 11.3. De acuerdo a la sección 8.2, las
ganancias de este controlador están dadas como:
R2 C1 1
κp = + , κd = R2 C1 , κi = (11.37)
R1 C2 R1 C2
Por otro lado, en la sección 11.3.3 se indicó que las dos resistencias de
10[KOhm] conectadas al punto VP 1 introducen una ganancia igual a 1/2. Co-
mo esta ganancia debe ser considerada como parte del controlador en (11.35)
se concluye que:
κp κd κi
kp = , kd = , ki = (11.38)
2 2 2
Usando (11.37) y (11.38) se calculan los valores de R1 , R2 , C1 y C2 mos-
trados en la tabla 11.1. En esa misma tabla se muestran los valores que se
usaron experimentalmente para estos elementos de circuito. Estos valores se
consiguieron combinando resistencias y capacitores de los siguientes valores
comerciales: 330[KOhm] y 330[KOhm] (en paralelo), 22[KOhm] y 47[KOhm]
(en serie), 47[KOhm] y 33[KOhm] (en serie), 470[KOhm] y 330[KOhm] (en
serie), varios capacitores de 0.1[µF] en paralelo, un capacitor de 1[µF] y dos
capacitores de 1[µF] en serie.
11.6 Resultados experimentales 595

Tabla 11.1. Valores numéricos probados experimentalmente.


kd Ganancias PID Valores calculados Valores experimentales
R1 = 323.34[KΩ] R1 = 330[KΩ]
kd = 0.0396
R2 = 766.59[KΩ] R2 = 800[KΩ]
0.0396 kp = 1.2371
C1 = 0.10331[µF] C1 = 0.1[µF]
ki = 1.5464
C2 = 1[µF] C2 = 1[µF]
R1 = 161.67[KΩ] R1 = 165[KΩ]
kd = 0.0792
R2 = 766.59[KΩ] R2 = 800[KΩ]
0.0792 kp = 2.4742
C1 = 0.20663[µF] C1 = 0.2[µF]
ki = 3.0928
C2 = 1[µF] C2 = 1[µF]
R1 = 107.78[KΩ] R1 = 100[KΩ]
kd = 0.1188
R2 = 766.59[KΩ] R2 = 800[KΩ]
0.1188 kp = 3.7113
C1 = 0.30994[µF] C1 = 0.3[µF]
ki = 4.6391
C2 = 1[µF] C2 = 1[µF]
R1 = 80.834[KΩ] R1 = 80[KΩ]
kd = 0.1584
R2 = 766.59[KΩ] R2 = 800[KΩ]
0.1584 kp = 4.9484
C1 = 0.41326[µF] C1 = 0.4[µF]
ki = 6.1855
C2 = 1[µF] C2 = 1[µF]
R1 = 64.667[KΩ] R1 = 69[KΩ]
kd = 0.1980
R2 = 766.59[KΩ] R2 = 800[KΩ]
0.1980 kp = 6.1855
C1 = 0.51657[µF] C1 = 0.5[µF]
ki = 7.7319
C2 = 1[µF] C2 = 1[µF]

11.6. Resultados experimentales

En la figura 11.8 se muestran los resultados obtenidos experimentalmente


cuando se usan las ganancias correspondientes a kd = 0.0792. El experimento
realizado consiste en hacer levitar la esfera y una vez que alcanza el reposo se
le aplica un pequeño golpe hacia arriba a manera de perturbación. Nótese que
como respuesta a esta perturbación la variable z2v = yv − yv∗ disminuye ini-
cialmente, lo que significa que la esfera se mueve hacia arriba para después de
algunas oscilaciones regresar a su posición inicial. Nótese también que cuando
la esfera se mueve hacia arriba la corriente ordenada i∗ disminuye ya que es
esta acción la que permite a la esfera regresar hacia abajo. También se puede
observar en la figura 11.8 que 21 z2v es igual a cero en estado estacionario, es
decir que y = yd . Esto significa que, en efecto, la parte integral del controlador
cumple su función. Por otro lado, la corriente eléctrica medida en estado esta-
cionario a través del electroimán es de 1.7[A]. Compárese con x∗1 =2.1174[A]
calculada al principio de la sección 11.5.
Es conveniente advertir que las variables z2v e i∗ mostradas en la figura
11.8 fueron obtenidas mediante el filtrado de las señales medidas debido a que
éstas contenı́an cantidades importantes de ruido. Nótese que a pesar de este
hecho el sistema construido consigue su objetivo principal: usar un controlador
para hacer estable en lazo cerrado a una planta que en lazo abierto es inestable.
596 11 Levitación magnética

Es conveniente aclarar que el objetivo principal del sistema de levitación


magnética construido es conseguir hacer levitar la esfera de una manera esta-
ble. Aunque el conseguir experimentalmente las caracterı́sticas de respuesta
transitoria y de estado estacionario diseñadas es un aspecto importante de un
controlador, sin embargo, no es el aspecto que se quiere resaltar en el proto-
tipo construido. Recuérdese que se trata de una planta altamente no lineal a
la cual se le ha diseñado un controlador a partir de una aproximación lineal
que es válida en una región de trabajo reducida cuyos lı́mites no están de-
finidos explı́citamente. Es por esto que las ganancias del controlador PID se
han seleccionado sólo para asegurar estabilidad pero no se ha hecho nada por
diseñar caracterı́sticas de respuesta transitoria especı́ficas.
Una muestra de como las no linealidades del sistema afectan la respues-
ta del sistema de control completo es presentada a continación. En la tabla
11.2 se presentan los polos de lazo cerrado conseguidos con cada uno de los
valores de kd mostrados en la tabla 11.1. Nótese que en todos los casos, todos
los polos de lazo cerrado tienen parte real negativa. A pesar de esto, en la
tabla 11.2 se muestra que para algunos valores de kd se observó inestabili-
dad de manera experimental. Esto significa que la esfera no pudo permanecer
levitando cuando se probaron las ganancias correspondientes en el prototipo
construido. De manera más especı́fica, se encontró que para valores grandes de
las ganancias PID la esfera empieza a oscilar rápidamente hasta caer al suelo.
Estos resultados experimentales sugieren que no deben utilizarse ganancias
PID muy grandes a pesar de que el análisis teórico asegure estabilidad.
Otro aspecto interesante se observa cuando se varı́a el valor de yd . Utilizan-
do las ganancias correspondientes a kd = 0.0792 y partiendo de yd = 0.01[m],
se redujo yd poco a poco, es decir la esfera se acercó más y más al electroimán.
Conforme esto sucede la esfera empieza a vibrar y llega un momento en que
la esfera permanece levitando pero no en un valor constante de y sino descri-
biendo un movimiento oscilatorio claramente apreciable como se muestra en
la figura 11.9. Si disminuye yd aún más, entonces la oscilación es muy rápida y
de amplitud muy grande de modo que escapa y cae al suelo. Esto sugiere que
se espera que haya menos problemas para hacer levitar la esfera si la posición
deseada que se propone yd es mayor, es decir si se ordena que la esfera levite
más alejada del imán. Esta conjetura es aún más respaldada por el hecho de
que al usar kd = 0.1584 (que produce inestabilidad experimentalmente para
yd = 0.01[m]) se consigue estabilidad, es decir que la esfera levita, cuando se
usa un valor de yd mayor de que 0.01[m]. Sin embargo, esto también tiene un
lı́mite ya que la fuerza del electroimán disminuye al alejarse la esfera.
Finalmente, en la figura 11.10 se muestra una fotografı́a del sistema de
levitación magnética funcionando donde se alcanza a apreciar el electroimán
y el sistema óptico usado para la medición de la posición de la esfera.
11.6 Resultados experimentales 597

Tabla 11.2. Polos de lazo cerrado para los valores de kd usados cuando yd = 0.01[m].

Polos de Comportamiento
kd
lazo cerrado experimental
−2562.0
−149.4
0.0396 estabilidad
−26.2
−1.8
−2353.6
−355.8
0.0792 estabilidad
−28.4
−1.5
−2088.3
−620.6
0.1188 estabilidad
−29.0
−1.4
−1635.3
−1073.5
0.1584 inestabilidad
−29.3
−1.4
−1354.3 + j617.1
−1354.3 − j617.1
0.1980 inestabilidad
−29.4
−1.4

Figura 11.8. Resultados experimentales con el sistema de levitación magnética


cuando yd = 0.01[m]. Trazo superior: 12 z2v . Trazo inferior: i∗ , corriente ordenada.
598 11 Levitación magnética

Figura 11.9. Resultados experimentales con el sistema de levitación magnética


cuando se usa un valor deseado de posición menor que 0.01[m]. Trazo superior:
1
z . Trazo inferior: i∗ , corriente ordenada.
2 2v

Figura 11.10. El sistema de levitación magnética funcionando.


11.8 Preguntas de repaso 599

11.7. Resumen del capı́tulo


En este capı́tulo se ha construido un sistema de control de levitación
magnética usando exclusivamente electrónica analógica. El controlador uti-
lizado es un PID y se ha construido usando amplificadores operacionales de
acuerdo a lo expuesto en la sección 8.2 del capı́tulo 8. Como el sistema es no
lineal por naturaleza, es necesario obtener un modelo lineal aproximado que
sólo será útil de manera local, es decir, el sistema de control funcionará correc-
tamente sólo si el cuerpo a levitar se coloca inicialmente cerca de donde se
desea que permanezca. Para encontrar esta aproximación lineal, es de mucha
utilidad el modelado usando las variables de estado visto en el capı́tulo 7. Una
vez que se cuenta con un modelo lineal, se procede a diseñar el controlador
PID. Esto requiere del conocimiento de los valores numéricos de los parámetros
del modelo lineal del sistema de levitación. Por esta razón, también se explica
de manera detallada como identificar estos parámetros experimentalmente.
Dado que la planta es inestable y no lineal, este es un problema cuya puesta
a apunto en la práctica es un tanto compleja. Esto significa que se debe poner
mucha atención en considerar todas las ganancias introducidas por cada uno
de los elementos del circuito de control cuando se haga el modelado y el diseño
del controlador. Errores en este aspecto frecuentemente resultan en un mal
funcionamiento del sistema de control.
Es muy importante resaltar que la construcción del prototipo que se ha
presentado no requiere de sensores sofisticados y que tampoco es necesaria
una inversión económica importante.

11.8. Preguntas de repaso

1. ¿Por qué es recomendable usar un núcleo con forma de E para el elec-


troimán? ¿Por qué no usar un simple núcleo recto?
2. Con el fin de simplificar el problema, en algunos trabajos existentes sobre
el tema se supone que la inductancia del electroimán es constante ¿Cree
que esto sea correcto?
3. En un sistema de levitación magnética el uso de un lazo de corriente tiene
ventajas importantes en el funcionamiento del sistema de control ¿Cuáles
son estas ventajas?
4. ¿Cuál es la ventaja de usar un controlador PID en lugar de un controlador
PD en este problema?
5. ¿Qué problemas cree que puedan aparecer si se usan capacitores polariza-
dos en el circuito de control?
6. ¿Qué debe hacer si desea incrementar la ganancia del amplificador de
potencia basado en modulación por ancho de pulso?
7. ¿Qué debe hacer para incrementar la frecuencia del modulador por ancho
de pulso?
8. ¿Para qué sirve el diodo que se coloca en paralelo con el electroimán?
600 11 Levitación magnética

9. ¿Qué es el punto de operación en un sistema de levitación magnética y


qué lo determina?
10. ¿A qué atribuye que el modelo en (11.31) tenga ganancia negativa? ¿Y por
qué el polinomio en el denominador tiene algunos coeficientes con signo
negativo?
Referencias

1. J.D. Kraus, Electromagnetics, McGraw-Hill, Singapore, 1992.


2. Autores varios, Special issue on magnetic bearing control, IEEE Transactions on
Control Systems Technology, Vol.4, No. 5, 1996.
3. M.Y. Chen, C.F. Tsai, H.H. Huang, and L.C. Fu, Integrated design for a planar
MagLev for micro positioning, in Proc. American Control Conference, pp. 3066-
3071, Portland, 2005.
4. J. Lévine, J. Lottin, J.C. Ponsart, A nonlinear approach to the control of mag-
netic bearings, IEEE Transactions on Control Systems Technology, vol. 4, no.
5, pp. 524-544, 1996.
5. M.G. Feemster, Y. Fang and D. Dawson, Disturbance rejection for a magnetic
levitation system, IEEE Transactions on Mechatronics, vol. 11, no. 6, pp. 709-
717, 2006.
6. J.-C. Shen H∞ control and sliding mode control of magnetic levitation system,
Asian Journal of Control, vol. 4, no. 3, pp. 333-340, 2002.
7. R. Ortega, A. van der Schaft, I. Mareels and B. Maschke, Putting energy back
in control, IEEE Control Systems Magazine, pp. 18-33, April 2001.
8. R. Ortega, A. Lorı́a, P. J. Nicklasson and H. Sira-Ramı́rez, Passivity-based con-
trol of Euler-Lagrange Systems, Springer, London, 1998.
9. M.S. de Queiroz, and D. Dawson, Nonlinear control of active magnetic bearings:
a backstepping approach, IEEE Transactions on Control Systems Technology,
vol. 4, no. 5, pp. 545-552, 1996.
10. H. Khalil, Nonlinear Systems, 3rd Edition, Prentice-Hall, Upper Saddle River,
2002.
11. W. Hurley, M. Hynes and W. Wolfle, PWM Control of a magnetic suspension
system, IEEE Transactions on Education, vol. 47, no. 2, pp. 165-173, 2004.
12. W. Hurley, W. Wolfle, Electromagnetic design of a magnetic suspension system,
IEEE Transactions on Education, vol. 40, no. 2, pp. 124-130, 1997.
12
Control de un sistema Ball and Beam

balín
R
varilla r
F = mgsenò

mg ò

Figura 12.1. Sistema ball and beam.

El sistema ball and beam es un prototipo didáctico muy popular en siste-


mas de control. Si se considera el modelo completo del mecanismo se encuentra
que es no lineal y que es difı́cil de controlar debido al efecto centrı́fugo que
sufre el balı́n como resultado del giro de la varilla. Sin embargo, este fenóme-
no es importante sólo cuando la velocidad de la varilla es muy grande. Si se
supone que la varilla y el balı́n se mueven a bajas velocidades y si la varilla
sólo describe ángulos cercanos a la horizontal entonces el modelo es lineal y
resulta ser un buen banco de pruebas para las técnicas de control clásico.
604 12 Control de un sistema Ball and Beam

Objetivos del capı́tulo

Construir la totalidad de las partes que componen a un sistema ball and


beam y, en particular, el sensor de la posición del balı́n.
Usar un microcontrolador y una computadora personal para construir un
controlador multilazo que emplea un compensador de adelanto.
Aplicar los conceptos de control clásico a una planta que es inestable por
naturaleza.
Identificar de manera experimental los parámetros del mecanismo.
Considere la situación representada en la figura 12.1. Se trata de una
varilla que cuenta con un canal dentro del cual rueda un balı́n. La inclinación
de la varilla puede ser modificada usando un motor de corriente directa y
esta inclinación genera el movimiento del balı́n por efecto de la gravedad.
El objetivo de control en este mecanismo es conseguir que el balı́n alcance
el reposo en una posición especificada de antemano a lo largo de la varilla.
Este mecanismo es conocido en la literatura en inglés bajo el término “ball
and beam” y es un prototipo muy utilizado para probar experimentalmente
diversos controladores diseñados usando técnicas clásicas y avanzadas [1], [2].
Como se muestra en este capı́tulo, este mecanismo es inestable y los métodos
clásicos de diseño introducen el uso de un lazo interno de control. Estas son
las razones por las que se desea presentar el problema de control de este
mecanismo en el presente capı́tulo
La nomenclatura utilizada es la siguiente:
u es el voltaje aplicado en las terminales de armadura del motor.
x es la posición del balı́n medida desde el extremo izquierdo de la varilla.
θ es la inclinación de la varilla respecto de la horizontal.
m es la masa del balı́n.
R y r representan, respectivamente, el radio del balı́n (esférico) y el radio
de giro del balı́n sobre los bordes del canal.
i es la corriente eléctrica de armadura.
L es la inductancia de armadura.
Ra es la resistencia de armadura.
ke es la constante de fuerza contraeletromotriz.
km es la constante de par.
Jm es la inercia del rotor del motor.
bm es la constante de fricción viscosa del motor.
JL es la inercia de la varilla.
bL es la constante de fricción viscosa de la varilla.
n1 y n2 representan el número de dientes del engrane del eje del motor y
del eje de la varilla, respectivamente, y n = nn21 .
12.1 Modelo matemático 605

12.1. Modelo matemático


El modelo matemático que interesa es aquel que indica cómo se ve afectada
la posición del balı́n, a lo largo de la varilla, bajo el efecto de un voltaje
aplicado en las terminales de armadura del motor.
Es importante observar que conforme el balı́n se desplaza sobre la varilla
el peso del primero ejerce un par de giro sobre la varilla el cual depende de
la posición del balı́n sobre la varilla. Por otro lado, un fenómeno interesante
que puede ocurrir si la varilla se mueve rápidamente es el siguiente. Suponga
que el balı́n trata de escapar, es decir x aumenta, y se cambia rápidamente
la inclinación de la varilla con el fin de hacerlo regresar. Sin embargo, debido
al efecto de la fuerza centrı́fuga el balı́n continuará escapando en lugar de
regresar.
Con el fin de que no aparezcan los efectos descritos en el párrafo anterior
se supondrá que:
El par ejercido por el peso del balı́n sobre la varilla es despreciable, lo cual
es muy cercano a la realidad si el motor actúa sobre la varilla a través de
una caja de engranes con tasa de reducción elevada.
La varilla se moverá con velocidades θ̇ pequeñas y la inclinación θ sólo
tomará valores pequeños alrededor de cero.

Modelo del motor eléctrico y la varilla


El motor de CD y la varilla se pueden modelar como se hizo en la sección
9.1 considerando que la carga está representada por la varilla, es decir:
di
L = u − Ra i − n ke θ̇ (12.1)
dt
J θ̈ = −b θ̇ + n km i (12.2)
J = n2 Jm + JL , b = n2 bm + bL
Procediendo como en las secciones 9.1, 9.2 y 9.3 se puede usar el lazo de
corriente:
ui = K(i∗ − i)
ası́ como el amplificador de potencia:
u = Ap ui
para encontrar que el modelo del motor de CD y la varilla está dado como:
k
θ(s) = I ∗ (s) (12.3)
s(s + a)
b nkm
a= , k=
J J
donde se ha supuesto que no está presente ninguna perturbación externa, es
decir Tp = 0.
606 12 Control de un sistema Ball and Beam

Modelo del movimiento del balı́n

Considere la situación mostrada en la figura 12.1. Se supone que cualquier


desplazamiento x del balı́n es producido por la inclinación θ de la varilla. El
modelo matemático buscado se obtiene usando la Segunda Ley de Newton
para describir el movimiento traslacional del balı́n, el cual tiene dos compo-
nentes: 1) el movimiento traslacional de una partı́cula de masa m y 2) el
movimiento giratorio sobre su propio eje de una esfera de masa m.

balín

!
~

v~ r~
ï
bordes del canal

Figura 12.2. Estudio del movimiento giratorio del balı́n.

Supóngase primero que el balı́n está fijo en el espacio y que es el canal el


que se mueve de modo que, por efecto de la fricción, hace que el balı́n gire (sin
cambiar su posición en el espacio). En la figura 12.2 se muestra tal situación
(suponiendo que ẋ = 0). Nótese que r 6= R debido a la separación entre los
bordes del canal.
Si ω es la velocidad angular con que gira el balı́n y v es la velocidad con
que se desliza el canal hacia la izquierda, entonces:

ω×r=v (12.4)

donde “×” representa el producto cruz de dos vectores y las flechas sobre las
letras indican que las variables son vectores. Aprovechando que la velocidad
angular y el radio son perpendiculares, se puede escribir la expresión anterior
en términos de los módulos de los vectores involucrados como:

ωr = v (12.5)

ω̇ = (12.6)
r
12.1 Modelo matemático 607

Sea f la fuerza que ejerce el canal sobre el balı́n y que hace que éste gire. Nótese
que dicha fuerza se aplica a una distancia r del centro del balı́n. Entonces rf es
el par que ejerce el canal sobre el balı́n. Aplicando la Segunda Ley de Newton
a esta situación se encuentra:

Jb ω̇ = f r (12.7)
2 R2
f = mv̇ 2 (12.8)
5 r
donde se ha usado (12.6) y Jb = 52 mR2 es la inercia de una esfera sólida de
masa m y radio R que gira sobre su propio eje (balı́n) [3], [4], pág. 271.
Ahora considérese la situación real: el canal permanece en reposo y es el
balı́n el que rueda con lo que su posición x ahora cambia y la velocidad y la
aceleración del balı́n están dadas como (se supone que el balı́n rueda sobre los
bordes del canal sin patinar):

ẋ = −v, ẍ = −v̇ (12.9)

Entonces, f es la fuerza equivalente que el movimiento giratorio del balı́n


ejerce sobre sı́ mismo y que contribuye al desplazamiento del balı́n a lo largo
del canal. Con este antecedente, se puede aplicar la Segunda Ley de Newton
al movimiento traslacional del balı́n considerando que, además del efecto de
la gravedad, existe una fuerza f que el giro del balı́n ejerce sobre sı́ mismo
(véase la figura 12.1):

mẍ = f + mg sin θ (12.10)

Usando (12.8), (12.9) se tiene:

2 R2
mẍ = − mẍ 2 + mg sin θ (12.11)
µ 5 r¶
2 R2
1+ ẍ = g sin θ (12.12)
5 r2

Nótese que la fuerza f , debida a la inercia del giro del balı́n, representa una
fuerza de oposición al movimiento traslacional de balı́n: de acuerdo a la Pri-
mera Ley de Newton la inercia representa la oposición que un cuerpo presenta
hacia cambios en su situación actual de movimiento. Con el fin de representar
correctamente la oposición de f a la traslación del balı́n, f (que incluye un
signo negativo) debe aparecer sumando (y no restando) en (12.10).
Como se ha dicho previamente, se considera que θ siempre es muy pequeña
(θ ≈ 0) por lo que se puede escribir:

sin θ ≈ θ (12.13)

Es importante mencionar que esta aproximación require que el ángulo θ


esté dado en radianes [4], pág. 942. Entonces (12.12) se convierte en:
608 12 Control de un sistema Ball and Beam
µ ¶
2 R2
1+ ẍ = gθ (12.14)
5 r2

ó, usando la transformada de Laplace con condiciones iniciales cero:

X(s) ρ
= 2 (12.15)
θ(s) s
g
ρ= 2 R2
1+ 5 r2

lo cual representa el modelo del movimiento del balı́n.


Finalmente, el modelo del sistema ball and beam está dado por la combi-
nación de (12.3) y (12.15), es decir:

X(s) ρ k
= 2, θ(s) = I ∗ (s) (12.16)
θ(s) s s(s + a)

12.2. Construcción del prototipo

En esta parte se describe la manera en que ha sido construido el prototipo


usado. A continuación se listan los componentes principales del sistema de
control.

Computadora personal de escritorio Pentium II a 233 MHz.


Tarjeta de adquisición de datos PCL-812PG de Advantech [5]. Cuenta con
15 canales de entrada analógico-digital manejados por un solo convertidor
AD de aproximaciones sucesivas de 12 bits, con entrada analógica en el
rango de -5[V] a +5[V]. Dos canales de salida digital-analógico, cada uno
cuenta con un convertidor DA de 12 bits, con salida analógica en el rango
de 0[V] a +5[V].
Motor de CD con escobillas e imán permanente. Voltaje nominal de 24[V],
corriente nominal de 2.3[A].
Varilla del sistema ball and beam. Compuesta por: i) una varilla de madera
de sección circular (riel número uno), ii) una varilla de aluminio de sección
circular (riel número dos), iii) una lámina de madera que sirve de soporte
para las dos varillas anteriores.
Sensor de posición para la inclinación de la varilla. Potenciómetro de pre-
cisión de 5[KOhm], una vuelta, sin tope.
Sistema de medición de la posición del balı́n. Se describe a continuación.

En la figura 12.3 se presenta el diagrama de bloques del sistema de control


completo.
12.2 Construcción del prototipo 609
x
INTERFACES
PCL 812 PG Y MECANISMO
CP BALL AND BEAM
ò

SISTEMA DE SISTEMA DE
MEDICIÓN MEDICIÓN
DE ò DE x

òý xý

Figura 12.3. El bloque interfaces y mecanismo ball and beam se muestra en la


figura 12.7. El sistema de medición de θ se muestra en la figura 12.6. El sistema de
medición de x se muestra en la figura 12.4.

12.2.1. Medición de la posición x del balı́n

Una parte importante e interesante del prototipo es el sistema de medición


de la posición del balı́n. De hecho, generalmente esta es la parte que mayores
dificultades presenta a la hora de construir el sistema de control. La manera
más común de hacer esta medición es utilizando una resistencia que se en-
cuentra distribuida a lo largo de uno de los rieles que conforman el canal de la
varilla. El otro riel es un conductor cuya resistencia puede considerarse igual
a cero. Ası́, conforme el balı́n (hecho de material conductor de la electricidad)
rueda haciendo contacto eléctrico con ambos rieles, el segundo conductor tiene
un voltaje que es igual al voltaje que tiene el primer riel justo en el punto don-
de el balı́n hace contacto con él. De esta manera, los rieles forman en conjunto
un potenciómetro y el balı́n constituye el contacto móvil del mismo.
Debido a que el material necesario para distribuir la resistencia a lo lar-
go del primer riel puede ser difı́cil de conseguir en ocasiones, en esta obra
se construye un sistema de medición diferente, el cual puede ser construido
fácilmente y sus componentes son fáciles de conseguir.
El riel que se denominará como número uno esta constituido por una varilla
de madera de sección circular de aproximadamente 0.01[m] de diámetro y
0.65[m] de longitud. Sobre esta varilla de madera se devana cuidadosamente
alambre magneto de manera que las espiras queden ajustadas, una junto a
la otra, sin dejar espacio entre ellas y, a la vez, sin que una se encime a la
otra. De este modo se consigue construir una bobina cilı́ndrica de 0.65[m] de
longitud y 0.01[m] de diámetro cuya superficie externa es suficientemente lisa
como para permitir que el balı́n ruede sobre ella suavemente. La razón de usar
una varilla de madera para construir este riel es evitar la posibilidad de que
las espiras queden en corto circuito si el barniz del alambre magneto llegara
a dañarse.
El riel número dos es una varilla cilı́ndrica de aluminio de 0.65[m] de
longitud y 0.01[m] de diámetro. Ambos rieles se colocan uno frente al otro,
paralelos y a una distancia de 0.017[m], entre los puntos más cercanos de los
rieles, sobre un soporte de madera (véase la figura 12.4). Ası́, se forma un
610
12 Control de un sistema Ball and Beam
0:65 [m]
soporte de madera
riel número dos
1N4002
Figura 12.4. Sistema de medición de x.

0:017 [m] x balín canal 6:8kÒ

xv
1öF

3:3kÒ

riel número uno 10kÒ


1nF + 15V
TL081
1kÒ
+

Zeners
10kÒ TIP41
25kÒ 4:7V
10kÒ 1nF TIP42

10kÒ

à 15V
12.2 Construcción del prototipo 611

canal de 0.65[m] de longitud y 0.017[m] de ancho. Los extremos de este canal


se obstruyen utilizando material suave como la espuma utilizada para empacar
equipo delicado para evitar que el balı́n escape. Este conjunto constituye la
varilla del mecanismo ball and beam.
El balı́n se selecciona de manera que sus dimensiones le permitan rodar
dentro del canal haciendo contacto con ambos rieles y, al mismo tiempo, que
el mismo canal evite que el balı́n lo abandone. Este aspecto es importante,
sobre todo en la etapa en la que se hacen los primeros ajustes experimentales
pues la varilla suele presentar movimientos bruscos que pueden hacer que el
balı́n salte y abandone el canal. Finalmente, se identifica la zona donde el
balı́n hace contacto con el riel número uno y se raspa esa estrecha franja de
la bobina de este riel a lo largo toda la longitud. Esto permitirá el contacto
eléctrico, através del balı́n y conforme éste rueda, entre ambos rieles. El balı́n
utilizado tiene las siguientes dimensiones (véase la figura 12.5):

2R = 0.0238[m], 2z = 0.01895[m], r = 0.0072[m] (12.17)

0:0238 [m ]

balín

r
R

riel número uno riel número dos

0:01895 [m ]

Figura 12.5. El balı́n rodando entre los dos rieles.

Los extremos de la bobina del riel número uno se conectan a una fuente
de voltaje alterno (véase la sección 8.3.1) con forma de onda seno de 10[V]
de pico y de 16[KHz]. El uso de una frecuencia elevada ayuda a limitar la
corriente que demanda la bobina y, al mismo tiempo, reduce el voltaje de rizo
que se produce en el proceso que se describe a continuación. El riel número
dos se conecta a un circuito rectificador de media onda que a su vez alimenta
612 12 Control de un sistema Ball and Beam

a un circuito RC en paralelo que sirve de filtro para reducir el voltaje de rizo


del voltaje de CD que se obtiene. Ası́, conforme el balı́n rueda en el canal,
la magnitud de este voltaje de CD, xv , es representativa de la posición x del
balı́n a lo largo del canal.
Finalmente, se usa una caja de engranes para unir el motor de CD con
la varilla con el fin de aumentar el par aplicado sobre ésta. De acuerdo a lo
expuesto la sección 12.3, no es necesario conocer la tasa de reducción de la
caja de engranes.

12.2.2. Medición de la inclinación θ de la varilla

El ángulo de inclinación θ de la varilla se mide utilizando un potencióme-


tro. Para esto, la terminal móvil del potenciómetro se conecta mecánicamente
a la varilla mediante dos brazos de aluminio (véase la figura 12.6). Ası́, cual-
quier desplazamiento angular de la varilla produce un desplazamiento ángular
de la terminal móvil del potenciómetro y, por tanto, un voltaje, θv , que es re-
presentativo de la inclinación θ de la varilla.

balín motor de CD

varilla terminal
móvil
+ 5V
BASE

brazos

potenciómetro

òý

Figura 12.6. Sistema de medición de θ.

12.2.3. Interfaces y amplificador de potencia

Como puede verse en (12.16) la señal de control es la orden de corriente


−i∗ , la cual se restringe por software a que tome valores en el rango de -3[A] y
+3[A]. Nótese que esta caracterı́stica y el uso de una PC junto con la tarjeta
de adquisición de datos PCL-812PG hacen que la interfaz de salida que se
utilizará para el sistema ball and beam sea idéntica a la que se diseña en la
sección 10.8. Por razones similares, la interfaz de entrada que se utilizará con
12.2 Construcción del prototipo 613

el sistema ball and beam es igual a la diseñada en la sección 10.8. Finalmente,


el amplificador de potencia y el lazo de corriente que se utilizan (véase la
figura 12.7 1 ) son muy parecidos a los diseñados en las secciones 9.6.2 y 9.6.1,
respectivamente.

ò
SISTEMA

BEAM
BALL
AND

5W

MOTOR
u

zona muerta de transistores


TIP 141

TIP 145

Realimentación para reducir


Amplificador de potencia

Q
15V

à 15V

Realimentación de corriente
TL081
à
+

1k
ui
control de corriente

TL081
1M
à
+

i
33k

33k
[à 3; 3 ] A
à iã
3:3k

TL081
à
+
Acondicionamiento de señal

5:5k
3:3k

5V
6:72k
TL081
à
+
5:6k
812 PG
[0; 5 ] V
PCL

Figura 12.7. Bloque de interfaces y mecanismo ball and beam.


1
Todos los amplificadores operacionales usados en la figura 12.7 son TL081. Los
tres primeros tienen la terminal “+” conectada a tierra mientras que el conectado
a las bases de los transistores tiene la terminal “+” conectada a ui .
614 12 Control de un sistema Ball and Beam

12.3. Identificación
12.3.1. Sistema de medición de la inclinación θ de la varilla

Se encontró que cuando la varilla se coloca en posición perfectamente ho-


rizontal (θ = 0[rad]) el potenciómetro entrega 1.45[V] y cuando la varilla se
inclina 10 grados (θ = 0.174[rad]) el potenciómetro entrega 1.7[V]. Se veri-
ficó que el sistema de medición es lineal, es decir, que entrega incrementos de
voltaje que son proporcionales a los incrementos de ángulo θ. Por tanto, la
ganancia del sistema de medición está dada como:

θv (1.7 − 1.45)[V]
Aθ = = = 1.43[V/rad] (12.18)
θ 0.174[rad]

donde θv es la señal de voltaje entregada por el sistema de medición.

12.3.2. Sistema de medición de la posición x del balı́n

Cuando el balı́n se coloca en el extremo izquierdo del canal (x = 0[m]) el


sistema de medición entrega 0.03[V] y cuando el balı́n se coloca en el extremo
derecho del canal (x = 0.65[m]) el sistema de medición entrega 3.7[V]. Se
verificó que el sistema de medición es lineal, es decir, que entrega incrementos
de voltaje que son proporcionales a los incrementos de la posición del balı́n x.
Por tanto, la ganancia del sistema de medición está dada como:

xv (3.7 − 0.03)[V]
Ax = = = 5.64[V/m] (12.19)
x 0.65[m]

donde xv es la señal de voltaje entregada por el sistema de medición.


Por otro lado, la identificación experimental de los parámetros que apare-
cen en el modelo (12.16) puede realizarse estudiando la dinámica del motor
y la varilla (12.3) y la dinámica del balı́n (12.15) por separado. Los procedi-
mientos utilizados se describen a continuación.

12.3.3. Subsistema motor-varilla

El procedimiento utilizado en esta parte en similar al utilizado en la sección


10.1. Se utiliza el siguiente control proporcional de posición:

I ∗ (s) = kp Aθ (θd (s) − θ(s)) (12.20)

donde se usa Aθ porque θv (s) = Aθ θ(s) representa la variable que entrega el


sistema de medición de la inclinación de la varilla y es la variable que realmente
maneja la computadora utilizada como controlador en el experimento. Esto
significa que el sistema en lazo cerrado (12.3), (12.20) queda representado
como en la figura 12.8. La función de transferencia correspondiente es:
12.3 Identificación 615

θv (s) Aθ kp k ωn2
= 2 = 2 (12.21)
θvd s s + as + Aθ kp k s + 2ζωn s + ωn2
p
ωn = Aθ kp k, a = 2ζωn (12.22)
donde θvd (s) = Aθ θd (s) es la inclinación deseada en términos del voltaje

ò d (s ) ò ý d (s ) Iã (s ) ò (s ) ò ý (s )
k
Aò kp s ( s+ a )

+
à

Figura 12.8. Control proporcional de la posición de la varilla.

entregado por el sistema de medición de la inclinación de la varilla. En la figura


12.9 se presentan los resultados experimentales obtenidos cuando kp = 4.
Este experimento se realiza sin colocar el balı́n sobre los rieles. Midiendo
directamente en la figura 12.9 se encuentra que tr = 0.18[s] y Mp ( %) = 60.8.
Estos datos se utilizan en las expresiones:
v ³ ´
u
u ln2 M p( %)
u 100
ζ=t ³ ´ (12.23)
2 M p( %)
ln 100 + π2
" Ãp !#
1 1 − ζ2
ωd = π − atan (12.24)
tr ζ
ωd
ωn = p (12.25)
1 − ζ2
para obtener ζ = 0.15 y ωn = 9.71[rad/s]. Finalmente, utilizando las expre-
siones en (12.22) con kp = 4 se encuentra:
k = 16.5134, a = 3.04 (12.26)

12.3.4. Dinámica del balı́n

Aplicando la transformada inversa de Laplace a (12.15) y considerando


todas las condiciones iniciales iguales a cero se obtiene:
ẍ = ρ θ(t) (12.27)
Suponga que θ(t) = θ0 donde θ0 es una constante. Integrando dos veces
(12.27):
616 12 Control de un sistema Ball and Beam

òv
[V]
M p (%) = 60:8
ò vd ï

ï
tr = 0:18


[A]

tiempo [s]

Figura 12.9. Resultados experimentales usando kp = 4 y el diagrama de bloques


de la figura 12.8.

1
x(t) = ρ θ 0 t2 (12.28)
2
A continuación se presenta un procedimiento que permite estimar de manera
experimental el valor del parámetro ρ.

Fije firmemente la varilla de manera que su inclinación defina un ángulo


de valor θ = θ0 , donde θ0 es un valor positivo pequeño. Un buen valor es
θ0 = 0.174[rad] (el equivalente a 10 grados) porque sin(0.174) = 0.173, es
decir sin(θ0 ) ≈ θ0 .
Coloque el balı́n en el extremo superior de la varilla (x = 0) y déjelo rodar
libremente hasta alcanzar el extremo inferior de la varilla (la varilla no
debe moverse durante este paso). Mida la posición que describe el balı́n
conforme rueda entre los extremos de la varilla. Esta tarea es facilitada si
se utiliza una PC.
Grafique contra el tiempo la posición del balı́n obtenida en el paso anterior.
Usando el valor de θ0 utilizado en el primer paso del experimento, proponga
un valor arbitrario de ρ para graficar la función 21 ρ θ0 t2 sobre los mismos
ejes utilizados en el paso anterior.
Proponga diferentes valores de ρ. El valor correcto de ρ es aquel que per-
mite que la gráfica de los datos experimentales y la gráfica de la función
12.4 Diseño del controlador 617

1
2ρθ0 t2 coincidan durante todo el tiempo en el que se realizó el experi-
mento.
En la figura 12.10 se muestran las gráficas mencionadas en el procedimiento
anterior. Se utiliza θ0 = 0.174[rad] y se encuentra que:

ρ=5 (12.29)

Es importante tener el cuidado de que el valor experimental de x que se gra-


fica esté expresado en unidades de longitud (metros). Esto puede conseguirse
usando x = xv /Ax . Finalmente, es interesante mencionar que la validez de
este valor numérico se ha verificado mediante el uso de (12.15), (12.17) y
g = 9.81[m/s2 ], pues se obtiene un valor igual a 4.687 para ρ.

[m]

1
2
úò 0t 2

x
(experimental)

tiempo [s]

Figura 12.10. Identificación experimental del parámetro ρ.

12.4. Diseño del controlador


Nótese que el modelo de la planta (12.16) tiene tres polos en s = 0 por
lo que es inestable en lazo abierto. Ası́, un objetivo importante del diseño
del sistema de control en lazo cerrado es conseguir su estabilidad. En la fi-
gura 12.11(a) se presenta un diagrama de bloques del sistema de control que
se diseña. Este diagrama de bloques se puede representar como en la figura
618 12 Control de un sistema Ball and Beam

12.11(b). El lector puede revisar lo expuesto en la sección 6.8.2 para entender


por qué se usa este diagrama de bloques. En este problema de diseño se debe
conseguir que lı́mt→∞ x(t) = xd donde xd es una constante que representa la
posición que se desea alcance el balı́n sobre el canal.

Xd (s) Xvd (s) E (s ) + + Iã (s ) k ú X(s)


Ax í s+ b
s+ c
ë
s ( s+ a ) s2
+ V1 (s )
à à à

ò ý (s )
ký s Aò

ò ý (s )

Xv (s)
Ax

(a)
Xd (s) E (s ) + + Iã (s ) ú X(s)
Ax í s+ b
s+ c
ë k
s ( s+ a ) s2
+ V1 (s )
à à à

ò ý (s )
ký s Aò

ò ý (s )

(b)

Figura 12.11. Diagramas de bloques equivalentes del sistema de control a diseñar.

Nótese que la función de transferencia de lazo abierto del sistema mos-


trado en la figura 12.11(b) tiene dos polos en s = 0 por lo que es de tipo 2.
Entonces, como xd es constante, se asegura que lı́mt→∞ x(t) = xd si la función
de transferencia de lazo cerrado X(s)/Xd (s) es estable (véanse las secciones
3.8 y 4.4). Por tanto, el único problema que resta es encontrar los valores
de las constantes α, kv , γ, b y c de manera que la función de transferencia
X(s)/Xd (s) sea estable. A continuación se explica como se consigue esto.
La función de transferencia de lazo abierto del sistema mostrado en la
figura 12.11(b) está dada como:
Ax ρ γb s + b c αkAθ 1
G(s)H(s) = (12.30)
cAθ b s + c s2 + (a + kv kAθ )s + αkAθ s2
donde c > b > 0. En la figura 12.12 se muestran las gráficas de Bode de
G(s)H(s) y de cada una de las funciones de transferencia que la forman.
Nótese que si la constante αkAθ es suficientemente grande, es decir si αkAθ ≫
s2 + (a + kv kAθ )s, entonces:
αkAθ
≈1 (12.31)
s2 + (a + kv kAθ )s + αkAθ
12.4 Diseño del controlador 619

dB

ii)
p i)
b 1 ëkA ò
0 !
v) c iv) iii)

vi)

fase
[grados]
+ 90 v) p
c ëkA ò !
0
b iv) iii)
à 90
à 180 ii)
à 270
à 360 vi)

Figura 12.12. Gráficas de Bode de G(s)H(s) en (12.30).

Esto también puede interpretarse pensando que la función de transferencia


en (12.31) tiene una magnitud de 0[dB] y una fase de 0 grados. Es interesante
observar que esta situación también se puede apreciar en la figura 12.12: cuan-
do αkAθ es suficientemente grande, es decir cuando la frecuencia de corte de la
función de transferencia en (12.31) está colocada muy a la derecha, este factor
de segundo orden no tiene ningún efecto sobre la respuesta en frecuencia en
lazo abierto y, entonces, puede ser despreciado.
Por tanto, si αkAθ es grande el problema se reduce a conseguir estabilidad
en lazo cerrado de un sistema cuya función de transferencia de lazo abierto
está dada como:
Ax ρ γb s + b c 1
(12.32)
cAθ b s + c s2
Esta es una simplificación importante porque se elimina el atraso de fase
debido a la función de transferencia en (12.31), el cual puede tomar valores
entre 0 y −180 grados (en el caso de que dicha función de transferencia no fuera
cercana a la unidad). Esto significa que estabilizar a (12.32) requiere menos
adelanto de fase que el requerido para estabilizar a (12.30). Debe tenerse
presente que introducir mayor adelanto de fase hace más exigente la tarea de
620 12 Control de un sistema Ball and Beam

s+b
diseñar el controlador porque normalmente requiere de un compensador γ s+c
que es más sensible al ruido introducido por los sensores de posición.
Nótese que se puede conseguir un valor grande de αkAθ aumentando el
valor de α pues los valores de k y Aθ son fijos una vez que se ha construido
el prototipo. Sin embargo, un valor grande de αkAθ tiene el efecto de de-
teriorar el desempeño del sistema de control. De hecho, durante las pruebas
experimentales que se realizaron para poner a punto el prototipo se utilizaron
valores grandes de αkAθ y se observó que se incrementa el efecto nocivo del
ruido introducido por los sensores: el mecanismo vibra exageradamente y el
sistema de control no funciona adecuadamente. Por tanto, el valor de α queda
limitado por el máximo valor permitido por el prototipo experimental aún
cuando no se consiga cumplir la condición (12.31).
Por otro lado, si kv = √0 entonces el sistema en (12.31) estará mal amor-
tiguado porque ζ = a/(2 αkAθ ) será pequeño. Esto produce un pico de
resonancia en la gráfica de Bode de (12.30). El problema del pico de resonan-
cia es que incrementa el efecto de las altas frecuencias produciendo vibraciones
no deseadas en el mecanismo. Una solución que ha dado buenos resultados en
el prototipo construido es el uso de un valor k√v > 0 porque esto aumenta el
factor de amortiguamiento ζ = (a + kv kAθ )/(2 αkAθ ) del sistema en (12.31)
y, por tanto, se reduce el pico de resonancia en la gráfica de Bode de (12.30).
En base a estos razonamientos y después de varias pruebas experimentales
se encontró que los siguientes valores producen resultados satisfactorios:
α = 4, kv = 0.2 (12.33)
Nótese que el sistema de la figura 12.11(b), junto con los valores numéricos
en (12.18), (12.19), (12.26), (12.29), (12.33) conforman un problema idéntico
al resuelto en la sección 6.8.2 donde se encontró que la solución está dada por
el siguiente compensador:
s+b
Gc (s) = γ , b = 1.84, c = 13.2, γ = 2.6
s+c

12.5. Construcción del controlador


De acuerdo a la figura 12.11(a), el controlador que se debe construir
está dado como:
i∗ = α[v1 − θv ] − kv θ˙v (12.34)
donde θv y θ˙v representan la señal entregada por el sensor de inclinación
de la varilla y su derivada, respectivamente. Por otro lado, V1 (s) = L{v1 }
está definida como:
s+b
V1 (s) = γ E(s)
s+c
E(s) = Xvd (s) − Xv (s) (12.35)
12.6 Resultados experimentales 621

donde Xv (s) y Xvd (s) son las transformadas de Laplace de la posición del balı́n
medida xv (obtenida a la salida del sistema de medición correspondiente) y
de su valor deseado xvd , respectivamente. Procediendo como en las secciones
10.2.2 y 10.5 se encuentra que la función del tiempo v1 se puede calcular en
tiempo discreto como:

v1 (k) = γ[e(k) + v(k)]


v(k + 1) = [−cv(k) + (b − c)e(k)]∆t + v(k)

donde e(k) y v1 (k) son los valores actuales en tiempo discreto de las funciones
L{e} = E(s) y L{v1 } = V1 (s) definidas en (12.35) (es decir e(k) = xvd (k) −
xv (k)) y ∆t = 0.005[s] es el periodo de muestreo. Ası́, se puede calcular
iterativamente el valor v(k + 1) que representa el valor de v que será utilizado
en el proximo instante de muestreo. Esto se hace partiendo del valor inicial
v(0) = 0. Nótese que v(k + 1) se calcula en el instante de muestreo presente
pero sólo será utilizado hasta el instante de muestreo proximo inmediato en
el futuro.
Finalmente, la señal θ˙v se calcula a partir de la medición de θv del siguiente
modo:
θv (k) − θv (k − 1)
θ˙v ≈ (12.36)
∆t
El controlador se programa en Borland C++ y se utiliza una computadora
personal y una tarjeta adquisitora de datos PCL-812PG de Advantech. Al
final de la sección 12.6 se presenta el código utilizado. Se debe subrayar que
el experimento debe empezar colocando la varilla en una inclinación tal que
θ = 0, con el fin de que el programa de computadora reconozca el valor
(diferente de cero) entregado por el sistema de medición de θ cuando θ = 0.

12.6. Resultados experimentales


En la figura 12.13 se presentan los resultados experimentales obtenidos.
Se utiliza una posición deseada xvd = 1[V] que corresponde a xd = 0.177[m].
Es importante mencionar que con el fin de obtener mejores desempeños se
ajustaron un poco las ganancias del compensador:
s+b
Gc (s) = γ (12.37)
s+c
de modo que b = 2.5, c = 17.7 y γ = 0.854. Durante estos ajustes se mantuvo
constante el factor ξ = 0.14 diseñado en la sección 6.8.2 de manera que b/c =
2.5/17.7 = 1.84/13.2 = 0.14. Al usar b = 2.5 en lugar del valor 1.84 se consigue
reducir un poco el efecto del ruido, el cual ha mostrado ser importante en el
prototipo construido y puede ser apreciado en la figura 12.13. Dicho sea de
paso, mucho del ruido presente es debido al voltaje de rizo en el sistema de
622 12 Control de un sistema Ball and Beam

medición de x y al contacto intermitente del balı́n, mientras rueda, con las


espiras del sensor correspondiente (nótese que en la figura 12.13(a) el ruido
disminuye cuando el balı́n se detiene). Por otro lado, el valor de γ = 0.854
utilizado es tres veces menor que el valor de 2.6 diseñado. Esto se hizo porque
se encontró que un valor grande de γ produce vibraciones del mecanismo
(efecto del ruido). En la figura 12.14 se muestran las gráficas de Bode de
la función de transferencia de lazo abierto en (12.30) cuando se usa b = 2.5,
c = 17.7 y γ = 0.854. El margen de fase obtenido es de alrededor de 20 grados,
es decir aproximadamente el mismo margen de fase diseñado originalmente.
Este pequeño margen de fase explica el gran sobre paso observado en la figura
12.13.
Finalmente, un aspecto que vale la pena mencionar es el efecto de las co-
nexiones a tierra y de las interferencias electromagnéticas que ellas producen,
pues fueron varios los problemas observados (mediciones difı́ciles de entender)
por causa de este aspecto. Se recurrió a bibliografı́a especializada en este tema
[6] y se corrigieron las conexiones a tierra en base a las sugerencias ahı́ expues-
tas. De este modo se eliminaron los problemas observados. La razón por la
cual los efectos de las tierras e interferencias electromagnéticas se presentaron
en este prototipo y no en los otros prototipos que se exponen en esta obra es
la longitud de los conductores utilizados para conectar el sistema de medición
de x. Sin embargo, no fue necesario reducir dicha longitud, simplemente se
eliminaron lazos de tierras que eran innecesarios.
En la figura 12.15 se presentan los resultados obtenidos en simulación del
diagrama de bloques en 12.11(a) cuando se usan los valores numéricos en
(12.18), (12.19), (12.26), (12.29), (12.33), b = 2.5, c = 17.7 y γ = 0.854.
Nótese el parecido existente entre los resultados de las figuras 12.13 y 12.15 a
pesar de la presencia importante de ruido tanto en la posición medida xv como
en la señal de control i∗ . Finalmente, se concluye que el sistema de control
cumple con su propósito: estabilizar la posición del balı́n xv en un valor muy
cercano al valor deseado xvd = 1[V]. Finalmente, en la figura 12.16 se muestra
una fotografı́a del prototipo de sistema ball and beam construido cuando esta
funcionando.
12.6 Resultados experimentales 623

xv
[V]

òv
[V]

tiempo [s]
(a)


[A]

tiempo [s]
(b)

Figura 12.13. Resultados experimentales obtenidos en el sistema ball and beam


construido.
624 12 Control de un sistema Ball and Beam

Bode Diagram

20

0
System: ghctrl
Frequency (rad/sec): 1.72
−20 Magnitude (dB): −0.0122
Magnitude (dB)

−40

−60

−80

−100
−135

−180 System: ghctrl


Frequency (rad/sec): 1.72
Phase (deg): −159
Phase (deg)

−225

−270

−315

−360
0 1 2
10 10 10
Frequency (rad/sec)

Figura 12.14. Gráficas de Bode de G(s)H(s) en (12.30) cuando se usa b = 2.5,


c = 17.7 y γ = 0.854.
12.6 Resultados experimentales 625

xv
[V]

òv
[V]

tiempo [s]
(a)


[A]

tiempo [s]
(b)

Figura 12.15. Resultados en simulación obtenidos con el modelo teórico del sistema
ball and beam construido.
626 12 Control de un sistema Ball and Beam

Figura 12.16. El prototipo ball and beam construido, funcionando.


12.6 Resultados experimentales 627

Código usado para programar el algoritmo de control


#include <stdio.h>
#include <conio.h>
#include <math.h>
#include<stdlib.h>
#include <string.h>
#include <iostream.h>
#include <dos.h>

int alto,bajo,dato,salida,i;
volatile float Ts=0.005;
//Periodo de muestreo
volatile float ir,v,dv,nv,e;

volatile float x,theta,theta0,thetam1;


/*------------------------------------------------------*/
volatile float r_des=0.09,Kp=3.0,Kv=0.2,xd=1.0;

volatile float c=17.663,b=2.50989,gama=0.854;

volatile long double y0;

/*-Direccion base y periodo de muestreo para la tarjeta-*/

int base=0x210;
int lsb1=0x00;
int msb1=0x01;
int lsb2=0x00;

int msb2=0x01;

volatile float yy[3000]; //seal de salida

volatile float uu[3000]; //seal de control

volatile float ref[3000];//seal de referencia

FILE *fp;
char Direccion[30];

void Inicializa(void);

void EscribeArchivo(float datos1,float datos2,float datos3);

void Cierra(void);

void main()
{
628 12 Control de un sistema Ball and Beam

clrscr();

/*----Se programa la tarjeta adquisitora----*/

/*---Vease manual PCL 812-PG de Advantech------*/


outportb(base+11,1);
//converc. AD iniciada con reloj
// y transferencia dato por software
outportb(base+9,0);// ganancia 1

outportb(base+3,0x77);//Control del contador


outportb(base+1,lsb1);
outportb(base+1,msb1);
outportb(base+3,0xb7);
outportb(base+2,lsb2);
outportb(base+2,msb2);
i=1;
do
/*----Inicia ciclo de control----*/
{
outportb(base+10,14);
outportb(base+12,0);
do
{
} while (inportb(base+5)>15);

alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
theta=(10.0/4096.0)*dato-5.0; //theta por canal AD 14
outportb(base+10,15);
outportb(base+12,0);
do
{
} while (inportb(base+5)>15);
alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
x=(10.0/4096.0)*dato-5.0; //x por canal AD 15
if(i==1)
{ //condiciones iniciales
v=0.0;
theta0=theta;
thetam1=0.0;
}
theta=theta-theta0;
/* Control proporcional Varilla*/
// ir=Kp*(r_des-theta);//-Kv*(y-ym1)/Ts;
12.6 Resultados experimentales 629

/* Control con red de adelanto */


e=xd-x;
dv=( -c*v+(b-c)*e )*Ts;
nv=v+dv;
ir=(gama*(e+v)-theta)*4.0-Kv*(theta-thetam1)/Ts;
/*-----Se mantiene a theta cercana a cero----*/
if( (theta>(0.5) )&&(ir>=0.0) )
{ ir=0.0; }
if( (theta<(-0.5) )&&(ir<=0.0) )
{ ir=0.0; }

ir=-ir;
//condicion de saturacion de seal de
if(ir>2.9 )
{ ir=2.9; }
if(ir<-2.9)
{ir=-2.9;}
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;

alto=salida & 0x0f00;


alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);

yy[i]=x;
uu[i]=ir;
ref[i]=theta;
v=nv;
thetam1=theta;
i++;
delay(5);
if (i>3000) i=3000;
}while ( (!kbhit() ) && ( i<=3000 ) );
// while (i<=3000);

ir=0.0;
// detiene el motor
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;
alto=salida & 0x0f00;
alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);
// Guarda datos en un archivo en el disco duro
cout<<i<<endl;
Inicializa();
i-=1;
for(int jj=1;jj<i;jj++)
630 12 Control de un sistema Ball and Beam

{
EscribeArchivo(yy[jj],uu[jj],ref[jj]);
}
Cierra();
}

void Inicializa(void) {
strcpy(Direccion,"c:\\ballbeam\\datos4s8.txt");
if( (fp=fopen(Direccion,"w+")) == NULL)
{
cout<<"No se puede crear el archivo ni modo";
exit(1);
}
}

void EscribeArchivo(float datos1,float datos2,float datos3) {


fprintf(fp,"%f %f %f \n",datos1,datos2,datos3);
}

void Cierra(void) {
fclose(fp);
}

12.7. Control basado en el microcontrolador


PIC16F877A
12.7.1. Construcción del sistema de control

En esta parte se utiliza un microcontrolador PIC16F877A [7] para con-


trolar al sistema ball and beam. Se debe aclarar que la parte mecánica del
prototipo también sufrió algunos cambios ligeros los cuales serán descritos en
lo que sigue. A continuación se listan únicamente los componentes nuevos que
fueron introducidos.
Una computadora portátil Laptop con puerto USB.
Conector de USB a serie.
Microcontrolador PIC16F877A de Microchip.
Convertidor digital/analógico DAC0800LCN.
Amplificadores operacionales TL081.
Manejador/Receptor MAX232.
En la figura 12.17 se muestra un diagrama de bloques del sistema de control
que se construyó. El sistema de medición de x es idéntico al mostrado en la
figura 12.4. Sin embargo, la ganancia que se midió para este sensor (siguiendo
un procedimiento idéntico al descrito en la sección 12.3.2) es:

Ax = 5.3750[V/m] (12.38)
12.7 Control basado en el microcontrolador PIC16F877A 631
x
INTERFACES
PIC16F877A Y MECANISMO
BALL AND BEAM
ò

SISTEMA DE SISTEMA DE
MEDICIÓN MEDICIÓN
DE ò DE x

òý xý

Figura 12.17. El bloque interfaces y mecanismo ball and beam se muestra en la


figura 12.18. El sistema de medición de θ consta de un potenciómetro que se fija
directamente a la flecha del motor. El sistema de medición de x se muestra en la
figura 12.4.

La pequeña diferencia existente con respecto al valor de Ax = 5.64[V/m]


mostrado en (12.19) se atribuye a un pequeño ajuste en el potenciómetro de
25[KOhm] que se encuentra en el circuito oscilador de la figura 12.4, ya que
dicho potenciómetro afecta la amplitud de las señal de corriente alterna que
se aplica al sistema de medición de x. Por otro lado, el sistema de medición
de θ con que ahora se cuenta es un poco diferente al mostrado en la figura
12.6 porque ahora el potenciómetro está colocado directamente sobre el eje de
giro de la varilla y ya no se usan los brazos mostrados en la figura 12.6 para
transmitir el movimiento de la varilla al potenciómetro. Como consecuencia
de esto, el valor obtenido para la ganancia del sistema de medición de θ es:

Aθ = 0.9167[V/rad] (12.39)

el cual es diferente a Aθ = 1.43[V/rad] obtenido en (12.18). Los valores:

k = 16.6035, a = 3.3132, ρ=5 (12.40)

fueron obtenidos usando procedimientos idénticos a los descritos en las seccio-


nes 12.3.3 y 12.3.4. Nótese que estos valores son casi idénticos a los mostrados
en (12.26) y (12.29) porque estos componentes permanecieron sin cambio.
Finalmente, en la figura 12.18 se muestra el diagrama de eléctrico del sis-
tema de control basado en el microcontrolador PIC16F877A mientras que en
la sección 12.7.4 se muestra el listado usado para programar dicho microcon-
trolador. Para una explicación detallada de la figura 12.18 y el programa en
la sección 12.7.4 se recomienda consultar las secciones 9.6 y 10.6 correspon-
dientes al control de velocidad y de posición de un motor de CD. Se desea
subrayar que en este caso se usan dos canales del convertidor analógico/digital
con que cuenta el microcontrolador PIC16F877A: uno para medir la posición
del balı́n y otro para medir la inclinación de la varilla. También se aclara que
la computadora portátil sólo se usa para el graficado de las señales medidas
y no participa en el cálculo del algoritmo de control.
632 12 Control de un sistema Ball and Beam

Figura 12.18. Diagrama eléctrico del sistema de control del sistema ball and beam
basado en el microcontrolador PIC16F877A.
12.7 Control basado en el microcontrolador PIC16F877A 633

12.7.2. Diseño del controlador

Se propone utilizar un esquema de control idéntico al presentado en la


sección 12.4, por lo que el diagrama de bloques del sistema de control en lazo
cerrado es idéntico al mostrado en la figura 12.11. Los valores de ganancias:

α = 12, kv = 0.2 (12.41)

fueron seleccionadas experimentalmente de modo que usando un valor cons-


tante de v1 (t) (véase la figura 12.11), es decir sin realimentar el error de
posición del balı́n y sin usar la red de adelanto colocada antes de V1 (s), se
obtuviera una respuesta de θ que fuera rápida y con poca oscilación. Nótese
que el valor de α = 12 mostrado en (12.41) es diferente de α = 4 obtenido
en (12.33). Esto se debe a un mayor efecto de la fricción sobre la flecha del
motor en el prototipo remodelado, es decir en el usado en esta sección, lo
cual resulta en una mayor zona muerta que es compensada usando un valor
mayor de la ganancia proporcional α. Usando los valores en (12.38), (12.39),
(12.40), (12.41) y la función de transferencia de lazo abierto en (12.30) se pro-
cede a usar el lugar de las raı́ces para determinar que el uso de las siguientes
ganancias asegura estabilidad en lazo cerrado:

γ = 1.2, c = 20, b = 2.5 (12.42)

En la sección 5.2.8 se explica a detalle el procedimiento seguido para obtener


estas ganancias.

12.7.3. Resultados experimentales

La construcción, utilizando herramientas de software, del controlador di-


señado en la sección anterior se realiza como se explica en la sección 12.5 y en
la sección 12.7.4 se muestra el listado de como se consigue usando un micro-
controlador PIC16F877A [8]. También se usa el diagrama eléctrico de la figura
12.18. En la figura 12.19 se muestran los resultados experimentales obtenidos
al usar dicho controlador, es decir, con las ganancias mostradas en (12.41) y
(12.42). Se puede observar que el balı́n alcanza el reposo en una posición xv
muy cercana a 1[V], la cual es muy cercana al valor deseado xvd = 1[V]. La
pequeña diferencia que se puede apreciar es debida a la zona muerta produ-
cida por la fricción sobre la flecha del motor. En la figura 12.20 se muestran
los resultados obtenidos en simulación con el mismo controlador, el diagrama
de bloques en la figura 12.11 y los valores numéricos mostrados en (12.38),
(12.39), (12.40), (12.41), (12.42). Nótese el parecido entre las respuestas en
las figuras 12.19 y 12.20 a pesar de la presencia importante de ruido en el
prototipo experimental. Finalmente, en la figura 12.21 se muestran otros re-
sultados experimentales en los que se aprecia como el sistema de control logra
estabilizar la posición del balı́n xv muy cerca del valor deseado xvd = 1[V]
a pesar de que el balı́n es desviado varias veces de su posición deseada por
634 12 Control de un sistema Ball and Beam

xv
[V]

òv
[V]

tiempo [s]

Figura 12.19. Resultados experimentales usando el microcontrolador PIC16F877A.

un agente externo (el balı́n es empujado intencionalmente con el dedo). Estos


resultados muestran que se ha conseguido satisfactoriamente el propósito del
sistema de control: estabilizar el balı́n muy cerca de su posición deseada. Fi-
nalmente, en la figura 12.22 es muestra una fotografı́a del prototipo usado en
estos experimentos.

xv
[V]

òv
[V]

tiempo [s]

Figura 12.20. Resultados en simulación.


12.7 Control basado en el microcontrolador PIC16F877A 635

xv
[V]

òv
[V]

tiempo [s]

Figura 12.21. Resultados experimentales usando el microcontrolador PIC16F877A.


Aparecen desviaciones producidas por un agente externo.

Figura 12.22. El sistema ball and beam construido.

12.7.4. Programa utilizado en el microcontrolador PIC16F877A

// Programa para comunicacion serial entre PC y proyecto Control


// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
636 12 Control de un sistema Ball and Beam

//#device adc=10 //manejar adc de 10 bits


#include<stdlib.h>
#include<math.h>

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD

#use delay(clock=20000000) //Base de tiempo para retardos


//(frecuencia del Xtal)
//Config.
//P. Serie
#use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05

#byte PORTB = 0x06


#byte PORTC = 0x07
#byte PORTD = 0x08

#byte PORTE = 0x09


#byte ADCON0= 0x1F
#byte ADCON1= 0x9F

#bit PC0 = 0x07.0


#bit PC1 = 0x07.1
//------------Declaracion de variables------------//
int16 inter,cuenta;

int8 cuentaH,cuentaL,puerto,AB,AB_1,aux;

int8 cont,iastd,cont2,cont3,cont4,t_0,t_1;

float x,xd,teta,error,iast,tiempo,c,b;

float gamma,alfa,kv,v,v1,tetam1; unsigned int u,i;


//int1 ban;
//------------Rutina de interrupcion------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
12.7 Control basado en el microcontrolador PIC16F877A 637

}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=0;
cont2=0;
cont3=0;
cont4=0;
PORTD=127;
xd=1.0;
tiempo=0.0;
gamma=1.2;
c=20.0;
b=2.5;
alfa=12.0;
kv=0.2;
tetam1=0.0;
v=0.0;
ADCON1=0x04;
ADCON0=0x81;
while(cont2<3)
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE)
{
ADCON0=0x81; //Cambiando a CH0
638 12 Control de un sistema Ball and Beam

for(i=0;i<37;i++); /estabilizar capacitor interno


t_0=read_adc(); //leer ADC
x=0.0196*t_0;

ADCON0=0x89; //cambiando a CH1


for(i=0;i<37;i++); //estabilizar capacitor interno
t_1=read_adc(); //leer ADC
teta=0.0196*t_1-2.81;//2.81;

error=xd-x;
/* Controlador */
v1=gamma*(error+v);
v=(-c*v+(b-c)*error)*0.002+v;
iast=alfa*(v1-teta)-kv*(teta-tetam1)/0.002;
/* ___________________________________________ */
if(iast<-3.3)
iast=-3.3;
if(iast>3.3)
iast=3.3;
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
tetam1=teta;

cuentaH=t_1;
cuentaL=t_0;
putc(0xAA); //reconocimieno puerto serial
putc(cuentaH); //cuenta al puerto serial
putc(cuentaL);
/*
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
cuentaH=0x00;
cuentaL=(iastd)&(0xFF);
putc(0xAA); //reconocimienopuerto serial
putc(cuentaH); //cuenta puerto serial
putc(cuentaL);
*/
PC1=1; //inicia espera del timer
while(TMR0<40) //1 cuenta=(4/FXtal)*256 seg, 20=1 ms
{
}
PC1=0; //termina espera del timer
TMR0=0;
tiempo=tiempo+0.002;
} //cierre del while infinito
} //cierre del main
12.8 Sistema de medición mejorado 639

12.8. Un sistema de medición mejorado para la


posición del balı́n

Durante las pruebas experimentales presentadas en las secciones 12.6 y


12.7.3, se observó que el sistema de medición mostrado en la figura 12.4 puede
llegar a producir vibraciones rápidas de la varilla por lo que el balı́n puede salir
despedido. Se llegó a la conclusión de que este comportamiento es producido
por el uso de una señal de corriente alterna de alta frecuencia como parte
fundamental del sistema de medición mostrado en la figura 12.4.
En la figura 12.23 se muestra el diagrama eléctrico de un nuevo sistema
de medición que elimina el problema arriba mencionado. Como se puede ob-
servar en esta figura, se continúa utilizando el soporte de madera y los rieles
número uno (alambre magneto arrollado sobre un núcleo cilı́ndrico de made-
ra) y número dos (varilla cilı́ndrica de aluminio) que ya se habı́an utilizado en
la figura 12.4. La modificación consiste en que el riel número uno, el cual se
utilizaba como un inductor en la figura 12.4, ahora se utiliza como una simple
resistencia (resistencia del cobre) en la figura 12.23. Esto significa que los dos
rieles funcionan en conjunto como un simple potenciómetro que en el punto
xv entrega un voltaje de CD que es proporcional a la posición x del balı́n.
El valor de xv se mide utilizando uno de los convertidores analógico-digital
del microcontrolador PIC16F877A conectando la terminal etiquetada como
AN1 al pin número 3 de dicho microcontrolador. Es importante mencionar
que, previamente, xv se hace pasar a través de un filtro pasa bajas con fre-
cuencia de corte de 14.6148 [Hz] (R = 33[KOhm], C = 0.33[µF]). Además,
con el fin de disminuir las posibles variaciones de xv debidas al calentamiento
del riel número uno, el voltaje presente en la terminal etiquetada como AN3
(que se conecta al pin 5 del microcontrolador) se utiliza como el voltaje de
referencia para el convertidor analógico-digital encargado de medir xv . Tam-
bién es importante decir que, previamente, la señal entregada en AN3 se hace
pasar a través de un filtro pasa bajas con frecuencia de corte de 4.8229 [Hz]
(R = 100[KOhm], C = 0.33[µF]).
A continuación se muestra el código utilizado para programar el micro-
controlador PIC16F877A a fı́n de realizar la tarea de leer la posición x del
balı́n:
#device adc=10 //manejar adc de 10 bits
setup_adc(ADC_CLOCK_INTERNAL); //ADC (reloj interno)
setup_adc_ports(ANALOG_RA3_REF);//RA3(AN3)= referencia ADC
set_adc_channel(1);

conv=read_adc();
x=0.65*(conv-511)/1023; // posicion del balin en metros

La expresión x=0.65*(conv-511)/1023 se obtiene del siguiente modo. La


variable “conv” varı́a en el rango [0,210 -1]=[0,1023] porque el convertidor
analógico-digital está programado para trabajar con 10 bits. Sin embargo, la
640 12 Control de un sistema Ball and Beam

Figura 12.23. Un sistema de medición mejorado para la posición del balı́n.


12.10 Preguntas de repaso 641

operación “conv-511” hace que (conv-511) tome valores en el rango [-511,512],


lo cual corresponde a valores de x en el rango de [-0.65/2,0.65/2][m] (en la
sección 12.2.1 se especifica que ambos rieles tienen una longitud de 0.65[m]).
Entonces se debe cumplir la siguiente regla:

511 → 0.65/2 [m]


(conv-511) → x[m]

De aquı́ se obtiene la expresión x=0.65*(conv-511)/1023. Por otro lado, una


mejora adicional que también puede contribuir a reducir el problema citado
al principio de la presente sección es el uso de un encoder, en lugar de un
potenciómetro, para medir el ángulo de inclinación de la varilla θ. En la sección
10.7 se indica como programar el microcontrolador PIC16F877A para leer un
encoder.

12.9. Resumen del capı́tulo


En este capı́tulo se ha construido un sistema ball and beam y todas las
interfases necesarias para su control en lazo cerrado. El esquema de control
utilizado cuenta con dos lazos. El lazo interno sirve para controlar (control
proporcional con realimentación de velocidad) el ángulo de inclinación de la
varilla mientras que el lazo externo controla la posición del balı́n (compensador
de adelanto). Un aspecto interesante del prototipo construido es el que se
refiere al sensor de la posición del balı́n. La idea es construir un canal formado
por dos rieles que, juntos, funcionan de manera similar a un potenciómetro.
Ası́, el voltaje entregado por los rieles es proporcional a la posición del balı́n
sobre la varilla.
Se ha mostrado que el controlador puede ser diseñado utilizando las dos
técnicas fundamentales del control clásico: la respuesta en el tiempo (el lugar
de las raı́ces) y la respuesta en frecuencia (criterio de de estabilidad de Nyquist
y márgenes de fase y de ganancia). Desde el punto de vista de la práctica en
la construcción de sistemas de control, se ha visto que el efecto del ruido
y las correctas conexiones a tierra son muy importantes en este prototipo.
También se han presentado algunos métodos experimentales interesantes para
identificar los parámetros del balı́n y del conjunto motor-varilla. Además, se
ha mostrado como deben ser tomadas en consideración las ganancias debidas
a los sensores, aspecto que generalmente es evitado durante los cursos sobre
control automático en las instituciones educativas.

12.10. Preguntas de repaso


1. ¿Por qué se dice que el sistema ball and beam es inestable en lazo abierto?
2. ¿Cómo funciona el sistema de medición de la posición del balı́n?
642 12 Control de un sistema Ball and Beam

3. Dé una explicación descriptiva (no analı́tica) de por qué se necesita con-
trolar la inclinación de la varilla además de la posición del balı́n.
4. ¿Por qué la masa equivalente del balı́n depende de los radios R y r de
acuerdo a (12.12)? ¿Qué pasarı́a si r = 0 y qué significa esto?
5. Describa el procedimiento experimental descrito en la sección 12.3.4 para
identificar el único parámetro de la dinámica del balı́n ¿Qué otro proce-
dimiento puede usar para esto?
6. El sistema de navegación automática de un barco es muy similar a un
sistema ball and beam, donde papel de la varilla es sustituido por un
timón. En base a esto intente resolver el problema de control automático
de la dirección de un barco.
7. Describa el funcionamiento del amplificador de potencia utilizado
8. ¿Por qué se dice que un compensador de adelanto introduce menos ruido
que un controlador PD?
9. ¿Por qué cree que para controlar la inclinación de la varilla sea preferible
el uso de un controlador proporcional con realimentación de velocidad en
lugar de un controlador PD?
10. En los resultados experimentales obtenidos se alcanza a observar un pe-
queño error en estado estacionario. Sin embargo, el sistema de control es
tipo 2 y la posición deseada del balı́n es constante por lo que el error en
estado estacionario deberı́a ser igual a cero ¿Cómo explica esto?
Referencias

1. Quanser Inc. 119 Spy Court Markham, Ontario L3R 5H6, Canada. Available
at: http://www.quanser.com
2. P.V. Kokotovic, The joy of feedback: nonlinear and adaptive (1991 Bode Prize
Lecture), IEEE Control Systems Magazine, pp. 7-17, June 1992.
3. Hibbeler R. C., 2004, Mecánica vectorial para ingenieros. Dinamica, (10a. edi-
ción), Pearson Educación, México.
4. M. Alonso and E.J. Finn, Fı́sica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
5. PCL-812PG User’s Manual, Advantech, Taiwan, 1996.
6. J. Balcells, F. Daura, R. Esparza y R. Pallás, Interferencias electromagnéticas en
sistemas electrónicos, Alfaomega-Marcombo, Serie Mundo Electrónico, México,
1992.
7. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
8. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
13
Control de un péndulo de Furuta

El péndulo de Furuta es otro prototipo didáctico bien conocido en la litera-


tura de control automático. En este mecanismo se deben controlar simultánea-
mente las posiciones de dos cuerpos, por lo que la solución a este problema
de control es más natural usando el enfoque de las variables de estado que el
de la función de transferencia. La aplicación experimental de las técnicas de
control moderno es la principal razón para incluir el problema de controlar
este mecanismo.
646 13 Control de un péndulo de Furuta

Objetivos del capı́tulo

Construir un péndulo de Furuta.


Construir las interfaces necesarias para el funcionamiento del sistema de
control.
Usar un microcontrolador para construir un controlador por realimentación
del estado.
Aplicar los conceptos de control moderno a una planta que es inestable por
naturaleza.
Identificar de manera experimental los parámetros del mecanismo.
En este capı́tulo se presenta el control de un sistema conocido como el
péndulo de Furuta. En la figura 13.1 se muestra un dibujo del péndulo de
Furuta. Este problema puede ser descrito de una manera muy ilustrativa ha-
ciendo referencia al bien conocido truco de mantener en equilibrio a una escoba
invertida colocada sobre la palma de la mano. En un péndulo de Furuta la
mano es sustituida por una varilla (conocida técnicamente como brazo) que
en un extremo tiene colocado un motor eléctrico del cual recibe un par que
hace posible su movimiento. Ası́, el brazo sólo puede moverse sobre un plano
horizontal de modo que su extremo opuesto a donde se encuentra el motor
describe una circunferencia. En este extremo se coloca otra varilla (conocida
técnicamente como péndulo) de la cual uno de sus extremos se une al extremo
libre del brazo mediante un rodamiento o algún otro dispositivo mecánico que
permite el movimiento libre del péndulo respecto del brazo. Esto significa que
no existe ningún motor colocado en esta unión mecánica. Sin embargo, el ro-
damiento ahı́ colocado restringe el péndulo a movimientos giratorios sobre un
plano perpendicular al brazo. Esto significa que el extremo libre del péndulo
sólo puede describir una circunferencia cuyo centro está en el punto donde se
unen el brazo y el péndulo.
Una de las caracterı́sticas que hacen interesante al péndulo de Furuta desde
el punto de vista de control es que es inherentemente inestable. Esto puede
verse fácilmente recordando el problema de equilibrar la escoba: ésta siempre
tiende a abandonar su posición invertida para caer al suelo. Por tanto, la
sintonización del controlador requerido no es una tarea trivial y requiere de
un conocimiento adecuado de las técnicas de la Teorı́a de Control.
Las variables y parámetros involucrados en el péndulo de Furuta de la
figura 13.1 son los siguientes:
θ0 es la posición angular (en radianes) del brazo medida respecto a una
posición de referencia arbitraria.
θ1 es la posición angular (en radianes) del péndulo medida respecto a su
posición vertical invertida.
τ es el par generado por el motor eléctrico y que es aplicado sobre el brazo.
I0 es la inercia del brazo cuando gira alrededor de uno de sus extremos
más la inercia del motor.
13.1 Modelo matemático 647

péndulo
z ò1
m1

J1 l1
y

I 0; L 0 brazo

ò0
x

motor

Figura 13.1. El péndulo de Furuta.

L0 es la longitud del brazo.


m1 , l1 y J1 representan, respectivamente, la masa, la ubicación del centro
de masa y la inercia del péndulo. J1 se calcula suponiendo que el péndulo
gira alrededor de su centro de masa. Nótese que el péndulo esta constituido
por una varilla de masa no despreciable.
g = 9.81[m/s2 ] representa la aceleración de la gravedad.

13.1. Modelo matemático

De acuerdo a lo descrito previamente, el péndulo de Furuta consta de dos


cuerpos que interactúan. El modelo matemático de este tipo de mecanismos
normalmente se encuentra usando las ecuaciones de Euler-Lagrange [1]. En el
caso del péndulo de Furuta las ecuaciones de Euler-Lagrange se reducen a:
d ∂L ∂L
− =τ (13.1)
dt ∂ θ̇0 ∂θ0
d ∂L ∂L
− =0
dt ∂ θ̇1 ∂θ1

El cero en el lado derecho de la última expresión se refiere a que no hay


ningún motor que aplique un par externo en el lugar donde se unen el brazo
y el péndulo. El lagrangiano L está dado como:
648 13 Control de un péndulo de Furuta

L = K −P (13.2)
K = K0 + K1

donde K0 es la energı́a cinética del brazo, K1 es la energı́a cinética del péndulo


y P es la energı́a potencial del péndulo. No se considera la energı́a potencial
del brazo porque, al moverse sobre un plano horizontal, su energı́a potencial
es constante y puede ser considerada igual a cero.
El cálculo de la energı́a cinética de un cuerpo cuya masa está distribuida en
todo su volumen puede simplificarse si se descompone en dos partes: una parte
debida al movimiento traslacional de su centro de masa (considerado como una
partı́cula) y otra parte debida al movimiento giratorio del cuerpo suponiendo
que rota alrededor de su centro de masa. Sin embargo, si el movimiento del
cuerpo puede ser descrito de manera sencilla entonces no es necesaria esta
descomposición. Por ejemplo, el movimiento del brazo es descrito fácilmente
como el movimiento giratorio de una varilla alrededor de uno de sus extremos
y el giro del rotor del motor alrededor del mismo eje. Por tanto, no es difı́cil
encontrar que:
1
K0 = I0 θ̇2 (13.3)
2 0
Por otro lado, el movimiento del péndulo es más complejo pues depende de
los movimientos combinados del brazo y del péndulo. En este caso es más
conveniente descomponer el movimiento del péndulo en dos partes como se
mencionó anteriormente: El movimiento del péndulo se descompone en el mo-
vimiento traslacional de una partı́cula de masa m1 colocada en su centro de
masa y el movimiento rotativo de una varilla que gira sobre un eje que pasa
por el centro de masa del péndulo. Por tanto:
1 1
K1 = J1 θ̇12 + m1 v1T v1 (13.4)
2 2
donde v1 es un vector que representa la velocidad traslacional del centro de
masa del péndulo, es decir:
 dXx   
dt Xx
v1 =  dX
dt
y 
, X =  Xy  (13.5)
dXz X
dt z

donde Xx , Xy y Xz son las coordenadas cartesianas del centro de masa del


péndulo. Esto significa que X es el vector posición del centro de masa del
péndulo. De acuerdo a las figuras 13.2(a) y 13.2(b) se encuentra que:

   
Xx L0 cos(θ0 ) − l1 sin(θ1 ) sin(θ0 )
X =  Xy  =  L0 sin(θ0 ) + l1 sin(θ1 ) cos(θ0 )  (13.6)
Xz l1 cos(θ1 )
13.1 Modelo matemático 649

y
péndulo

centro de masa
Xy
ò0 l 1senò 1cosò 0

l 1s
en
ò1
L0
L 0senò 0
brazo
ò0
ü Xx
x
L 0cosò 0

l 1senò 1senò 0

L 0cosò 0 à l 1senò 1senò 0

(a) Vista superior.

péndulo
l 1senò 1

P=0
h centro
Xz de masa

ò1
l 1cosò 1
l1

brazo

(b) Vista del plano perpendicular al brazo.

Figura 13.2. Relaciones geométricas en el péndulo de Furuta.


650 13 Control de un péndulo de Furuta

Usando (13.4), (13.5), (13.6) y después de reducir términos se encuentra:


1 1 h i
K1 = J1 θ̇12 + m1 (L0 θ̇0 )2 + (l1 θ̇0 )2 sin2 (θ1 ) + (l1 θ̇1 )2 + 2θ̇0 θ̇1 L0 l1 cos(θ1 )
2 2
(13.7)

Finalmente, para calcular la energı́a potencial del péndulo se usa como punto
de referencia (donde P = 0) al punto donde θ1 = 0. Entonces, recordando
que la energı́a potencial es el producto escalar del vector fuerza aplicada, es
decir el peso del péndulo m1 g, y el vector distancia que va desde el centro de
gravedad del péndulo hasta el punto donde P = 0, se tiene que:

P = −hm1 g, h = l1 − l1 cos(θ1 )

donde el signo “−” se debe a que los vectores mencionados forman más de
90◦ . Entonces:

P = m1 gl1 (cos(θ1 ) − 1) (13.8)

Usando (13.3), (13.7), (13.8) se forma el Lagrangiano, L, de acuerdo a (13.2),


para después sustituir en las ecuaciones de Euler-Lagrange dadas en (13.1).
Realizando las operaciones correspondientes y acomodando convenientemente
los términos resultantes se obtiene:

M (q)q̈ + C(q, q̇)q̇ + g(q) = F (13.9)


· 2 2 2
¸
I + m1 (L0 + l1 sin (θ1 )) m1 l1 L0 cos(θ1 )
M (q) = 0
m1 l1 L0 cos(θ1 ) J1 + m1 l12
· 1 ¸
2 m1 l12 θ̇1 sin(2θ1 ) −m1 l1 L0 θ̇1 sin(θ1 ) + 12 m1 l12 θ̇0 sin(2θ1 )
C(q, q̇) =
− 1 m1 l12 θ̇0 sin(2θ1 ) 0
· 2 ¸ · ¸ · ¸
0 τ θ
g(q) = , F = , q= 0
−m1 l1 g sin(θ1 ) 0 θ1

La expresión (13.9) constituye el modelo del péndulo de Furuta, el cual es


no lineal porque incluye funciones trigonométricas de θ1 ası́ como diferentes
productos entre las velocidades θ̇0 y θ̇1 .

13.2. Modelo lineal aproximado


En esta obra es de interés la aplicación de técnicas de control lineal, las
cuales no pueden aplicarse directamente cuando el modelo de la planta a con-
trolar es no lineal como el mostrado en (13.9). Sin embargo, existe una manera
de resolver este problema. La idea fundamental es encontrar un modelo lineal
aproximado que represente con suficiente exactitud al modelo (13.9) para des-
pués usar dicho modelo lineal aproximado en el diseño de un controlador para
el péndulo de Furuta. Sin embargo, tal como se indica en la sección 7.2.2,
13.2 Modelo lineal aproximado 651

el controlador diseñado de este modo sólo será de utilidad para equilibrar el


péndulo en su posición invertida θ1 = 0 bajo la condición de que el péndulo
se encuentre inicialmente cerca de dicha configuración, es decir, siempre se
deberá cumplir que θ1 ≈ 0.
El primer paso consiste en escribir (13.9) en términos de variables de esta-
do. De acuerdo a lo expuesto en la sección 7.1, dado un conjunto de ecuaciones
diferenciales como (13.9), se puede encontrar una representación en variables
de estado definiendo las componentes del vector de estado x como las variables
incógnita de dichas ecuaciones diferenciales y sus primeras r − 1 derivadas,
donde r es el orden de la ecuación diferencial correspondiente. Nótese que
(13.9) está constituida por dos ecuaciones diferenciales, cada una de segundo
orden. Las incógnitas en dichas ecuaciones son θ0 y θ1 . Por tanto, el vector
de estado puede ser seleccionado como:
   
x1 θ0
 x2   θ̇0 
x=   
 x3  =  θ1 
x4 θ̇1

Despéjese q̈ de (13.9) y defı́nase:


· ¸
w1 (x1 , x2 , x3 , x4 , τ )
q̈ =
w2 (x1 , x2 , x3 , x4 , τ )
= M −1 (x1 , x3 )[−C(x1 , x2 , x3 , x4 )[x2 , x4 ]T − g(x1 , x3 ) + F ]
(13.10)

Una propiedad importante de la matriz M (q) = M (x1 , x3 ) es que siempre


es no singular, es decir, la matriz M −1 (x1 , x3 ) que aparece en la expresión
anterior siempre existe [2]. Entonces, la ecuación de estado correspondiente se
puede escribir como:

ẋ = f (x, u) (13.11)
   
f1 (x, u) x2
 f2 (x, u)   w1 (x1 , x2 , x3 , x4 , u) 
f (x, u) =   
 f3 (x, u)  = 
,
 u=τ
x4
f4 (x, u) w2 (x1 , x2 , x3 , x4 , u)

Usando las ideas de la sección 7.2.2, ahora se obtiene un modelo lineal aproxi-
mado que es válido alrededor de un punto de operación de interés. Los puntos
de operación son las parejas (x∗ , u∗ ) que satisfacen:
 
0
0
f (x , u ) = 
∗ ∗
0

0
652 13 Control de un péndulo de Furuta

es decir, de acuerdo a (13.11), (13.10):

x∗2 = θ̇0∗ = 0, x∗4 = θ̇1∗ = 0,


· ¸
w1 (x∗1 , 0, x∗3 , 0, u∗ )
= M −1 (x∗1 , x∗3 )
w2 (x∗1 , 0, x∗3 , 0, u∗ )
½ · ¸ · ∗ ¸¾
0 u
× −C(x∗1 , 0, x∗3 , 0) − g(x∗1 , x∗3 ) +
0 0
· ¸
0
=
0

Del segundo renglón de estas condiciones se obtiene:


· ∗¸ · ¸
u 0
= g(x∗1 , x∗3 ) =
0 −m1 l1 g sin(θ1∗ )

es decir:

u∗ = 0, x∗3 = θ1∗ = ±nπ

donde n puede ser cero o cualquier número entero. Nótese que no existe nin-
guna condición que deba cumplir x∗1 = θ0∗ lo cual significa que esta variable
puede elegirse de manera totalmente arbitraria. Debido a que se desea esta-
bilizar (o “equilibrar”) el péndulo en su posición vertical invertida (n = 0) se
selecciona el siguiente punto de operación:
 ∗  
x1 0
 x∗2   0 
x =
∗    ∗
 x∗3  =  0  , u = 0 (13.12)
x∗4 0

De acuerdo a (7.29), (7.30), (7.31) el modelo no lineal dado en (13.10), (13.11)


puede ser aproximado por el siguiente modelo lineal:

ż = Az + Bv (13.13)
 ∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u) ∂f1 (x,u) 
∂x1 ∂x2 ∂x3 ∂x4
 ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) ∂f2 (x,u) 
 ∂x1 ∂x2 ∂x3 ∂x4 
A= ∂f3 (x,u) ∂f3 (x,u) ∂f3 (x,u) ∂f3 (x,u) 
 ∂x1 ∂x2 ∂x3 ∂x4

∂f4 (x,u) ∂f4 (x,u) ∂f4 (x,u) ∂f4 (x,u)
∂x1 ∂x2 ∂x3 ∂x4 x=x∗ ,u=u∗
 ∂f 
1 (x,u)

 ∂f2∂u
(x,u) 
 
B =  ∂f3∂u
(x,u) 
 ∂u 
∂f4 (x,u)
∂u x=x∗ ,u=u∗

donde z = x − x∗ y v = u − u∗ . El uso de (13.9), (13.10), (13.11), (13.12),


(13.13) define un procedimiento matemático (que a pesar de ser un poco largo
13.3 Construcción del péndulo de Furuta 653

sólo involucra operaciones matemáticas sencillas) al final del cual se obtiene


lo siguiente:
   
0 1 0 0 0
0 −gm21 l12 L0 J1 +m1 l12
 0 I0 (J1 +m1 l12 )+J1 m1 L20
0

 2 2


A=  , B =  I0 (J1 +m1 l1 )+J1 m1 L0 (13.14)
0 0 0 1  0 
(I0 +m1 L20 )m1 l1 g −m1 l1 L0
0 0 I0 (J1 +m1 l12 )+J1 m1 L20
0 I0 (J1 +m1 l12 )+J1 m1 L20

La expresión (13.13) junto con (13.14) constituyen el modelo lineal aproxi-


mado que se buscaba. Como se mencionó anteriormente, usando (13.13) y
(13.14) se puede diseñar un controlador por realimentación lineal del estado
el cual, sin embargo, asegura buenos resultados si se restringe que el estado
y la entrada sólo evolucionen alrededor del punto de operación (13.12). Esto
también suele indicarse diciendo que z ≈ 0 y v ≈ 0. Esto significa que una
tarea que jamás podrá resolver el controlador que se diseña en este capı́tulo
es el llevar el péndulo desde su posición vertical hacia abajo (θ1 = ±π[rad])
hasta su posición vertical invertida (θ1 = 0). Si el lector está interesado en
resolver dicho problema, se recomienda que consulte las referencias [2] y [3].

13.3. Construcción del péndulo de Furuta e


indentificación de sus parámetros
En la figura 13.3 se presenta un dibujo detallado que muestra las partes
mecánicas utilizadas para construir el péndulo de Furuta. Algunas de estas
partes se introducen con el fin de acoplar mecánicamente el motor con el
brazo y éste con el péndulo. Además, se acoplan dos potenciómetros, uno
directamente a la flecha del motor (P2 ) y otro entre el brazo y el péndulo
(P1 ), para medir θ0 y θ1 , respectivamente. Todas estas partes tienen masas e
inercias que deben ser consideradas dentro del modelo del péndulo de Furuta.
Para calcular los momentos de inercia del sistema se recurre a expresiones
bien conocidas en los libros de texto sobre mecánica clásica para el momento
de inercia de determinados cuerpos geométricos tales como varillas, cilindros
y prismas rectangulares. Debe tenerse presente que la manera que a conti-
nuación se describe para calcular los parámetos del péndulo de Furuta puede
admitir algunas variantes. De hecho, estos parámetros deben ser considerados
como meras aproximaciones cuya exactitud se ve respaldada por el hecho de
que los valores obtenidos permiten calcular, más adelante, las ganancias del
controlador que, en efecto, permiten resolver el problema de control que in-
teresa, es decir, estabilizar o “equilibrar” el péndulo en su posición vertical
invertida.
Para calcular la inercia I0 se suma la inercia Ibrazo de la varilla que forma
al brazo, la inercia Icubo del prisma rectangular C1 (usado para acoplar la
flecha del motor al brazo) y la inercia del motor Irotor . Los valores numéricos
654 13 Control de un péndulo de Furuta

de estas inercias se calculan como se indica a continuación. Se mide la longitud


total del brazo, L0 = 0.235[m], desde el centro del potenciómetro P1 hasta el
centro del prisma rectangular C1 , es decir, hasta la flecha del motor. La masa
total del brazo mbrazo es la suma de i) la masa de la varilla que forma al brazo,
m0 , ii) la masa de la abrazadera ab1 (que une el brazo con el potenciómetro
P1 el cual representa el acoplamiento mecánico entre el brazo y el péndulo
pues el péndulo se une firmemente a la otra parte móvil del potenciómetro
P1 ) e iii) la mitad de la masa del potenciómetro P1 . El momento de inercia de
una varilla que gira respecto de un eje perpendicular a la misma y que pasa
por uno de sus extremos se calcula por medio de la expresión [4]:
1 2
Ibrazo = mbrazo L20 = 0.96644 × 10−3 [kgm ]
3
Para calcular la inercia Icubo del prisma rectangular C1 se utiliza la siguiente
expresión que relaciona su momento de inercia con respecto a un eje de giro
que pasa por su centro [4], [5], pág. 271:
mcubo 2 2
Icubo = (b + c2 ) = 1.9333 × 10−6 [kgm ]
12
donde b y c son las longitudes de los lados de la cara superior del prisma C1
mientras que mcubo es su masa. Por último se calcula la inercia del rotor del
motor. La masa del rotor, mr , se estima como la mitad de la masa del motor
completo más la masa de la abrazadera ab2 (la cual une al potenciómetro P2
con la flecha del rotor) más la mitad de la masa del potenciómetro P2 . La otra
mitad de la masa de P2 permanece siempre en reposo pues está fija al soporte
del mecanismo. Como el motor es cilı́ndrico, se supone que el rotor también
lo es y se estima su radio, R, como la mitad del radio de la carcasa del motor.
Esto permite estimar la inercia del rotor, sin necesidad de desarmar el motor,
del siguiente modo: la inercia de un cuerpo cilı́ndrico de radio R y masa mr
que gira respecto a su eje longitudinal está dada como [4], [5], pág. 271:
1 2
Irotor = mr R2 = 0.16931 × 10−3 [kgm ]
2
Por tanto, el momento de inercia I0 es:
2
I0 = Ibrazo + Icubo + Irotor = 1.137 × 10−3 [kgm ]

Para calcular el momento de inercia J1 del péndulo se considera que su ma-


sa m1 está formada por la suma de 1) la masa del péndulo, 2) la masa del
acoplamiento entre el péndulo y el potenciómetro P1 (placa rectangular de
aluminio que se observa en la figura 13.3) y 3) la mitad de la masa del poten-
ciómetro P1 . Esto debido a que la otra mitad de la masa del potenciómetro
P1 pertenece a la masa total del brazo. Para calcular el momento de inercia
de una varilla que gira sobre un eje perpendicular a la misma y que pasa a
través de su centro de masa se utiliza la expresión [4], [5], pág. 271:
13.3 Construcción del péndulo de Furuta 655

1 2
J1 = m1 (2l1 )2 = 0.38672 × 10−3 [kgm ]
12
donde l1 = 0.1875[m] es la distancia desde el centro del potenciómetro P1
hasta el centro de gravedad del péndulo (ubicado en el centro del péndulo) y
la masa del péndulo es m1 = 0.033[kg].
El modelo (13.13), (13.14) supone que la señal de control v = u (porque
u∗ = 0) es un par. Sin embargo, en la práctica la señal de control es un voltaje
que se aplica al motor el cual se encarga de generar el par u. Para resolver
este problema se procede del siguiente modo. Suponga que en el modelo (9.9),
(9.10) de la sección 9.1 la dinámica eléctrica es muy rápida, es decir, que L = 0
y ke = 0. Entonces se encuentra que el par generado por el motor está dado
aproximadamente por:
km
τ =u= Ea (13.15)
ra
donde ra es la resistencia de armadura del motor, Ea es el voltaje aplicado en
sus terminales y km es la constante de par del motor. Con el fin de poder usar
el voltaje de armadura como señal de control se debe determinar el valor de la
constante km /ra . Esto se consigue mediante el siguiente experimento. El eje
del motor se coloca en posición horizontal con el brazo y el péndulo montados
en sus posiciones. Se aplica cuidadosamente un voltaje en las terminales de
la armadura, de manera que se consiga el equilibrio (reposo) cuando el brazo
quede colocado horizontalmente (el péndulo queda colocado verticalmente).
Esto significa que se ha conseguido un equilibrio entre el par generado por
el motor y el par producido, sobre el eje del rotor, por el peso del brazo y
el peso del péndulo. Una vez conseguido esto se mide el voltaje aplicado a
la armadura Ea y se calcula el par τ debido al peso del brazo y al peso del
péndulo. Con estos datos se usa (13.15) para calcular la constante:

km
= 0.0215[Nm/V]
ra
Finalmente, usando (13.13), (13.14), (13.15) y τ = v junto con los valores
numéricos calculados en esta sección se encuentra el siguiente modelo el cual
será usado para diseñar el controlador:

ż = Az + BEa (13.16)
   
01 0 0 0
 0 0 −35.81 0 km  13.4684 
A= 0 0
, B=B = 
0 1 ra  0 
0 0 72.90 0 −12.6603

Nótese que el voltaje de armadura Ea es ahora la señal de control y que, de


acuerdo a (13.15), el valor de esta variable en el punto de operación dado en
(13.12) es Ea∗ = 0 .
656 13 Control de un péndulo de Furuta

Figura 13.3. Componentes del péndulo de Furuta construido.

13.4. Diseño del controlador


A continuación se diseña un controlador por realimentación lineal del es-
tado que permita estabilizar al sistema dado en (13.16) en z = 0, es decir en
x = x∗ con x∗ dado en (13.12). El controlador debe tener la siguiente forma:

Ea = −Kz (13.17)
£ ¤ ∗
£ ¤T
K = k1 k2 k3 k4 , z = x − x = θ0 θ̇0 θ1 θ̇1

donde k1 , k2 , k3 y k4 son cuatro ganancias constantes que deben determinarse


de manera que se asegure que z tiende a cero (que x tiende a x∗ ) conforme el
tiempo crece. El cálculo de estas ganancias constituye el diseño del controla-
dor. Nótese que el uso de (13.17) en (13.16) permite escribir:

ż = (A − BK)z

De acuerdo a lo expuesto en la sección 7.5 si todos los eigenvalores de la


matriz:

A − BK (13.18)

tienen parte real estrictamente negativa entonces se asegura que z tiende a


cero conforme el tiempo crece o, equivalentemente, que ambas θ0 y θ1 tienden
a cero conforme el tiempo crece, lo cual significa que se consigue estabilizar o
“equilibrar” al péndulo de Furuta en su posición vertical invertida. El primer
13.5 Construcción del controlador 657

paso para diseñar el controlador (13.17) consiste en verificar la controlabilidad


de la planta dada en (13.16). De acuerdo a lo expuesto en la sección 7.9, esto
se cumple si la siguiente matriz de 4 × 4 tiene rango 4:
£ ¤
B AB A2 B A3 B

Esto es verificado fácilmente calculando numéricamente el determinante que


resulta ser diferente de cero. Se concluye entonces que (13.16) es controla-
ble. Esta propiedad asegura que siempre es posible encontrar un vector de
ganancias K (definido en (13.17)) que consigue asignar a los eigenvalores de
la matriz en (13.18) cualquier valor que se desee. Como se mencionó anterior-
mente, la selección obvia y deseable es que todos estos eigenvalores tengan
parte real negativa.
En base a lo anterior, el diseño del controlador se realiza del siguiente
modo. Se propone el siguiente conjunto de eigenvalores para la matriz en
(13.18):

λ̄1 = −94, λ̄2 = −18, λ̄3 = −0.5, λ̄4 = −1

Usando el procedimiento presentado en los ejemplos 7.6 y 7.7 del capı́tulo 7


se encuentra que el correspondiente vector de ganancias es:
£ ¤
K = −1.5215 −4.6690 −152.0048 −13.8931 (13.19)

Esto significa que el controlador en (13.17) se escribe finalmente como:

Ea = 1.5215θ0 + 4.6690θ̇0 + 152.0048θ1 + 13.8931θ̇1 (13.20)

Es importante decir que aunque existen muchos vectores de ganancias K que


desde el punto de vista teórico resuelven el problema de control, sin embargo,
desde el punto de vista práctico, no todas las ganancias K ası́ calculadas per-
miten obtener resultados experimentales satisfactorios. Ası́ que las ganancias
en (13.19) fueron seleccionadas después de verificar experimentalmente que
producen buenos resultados.

13.5. Construcción del controlador


El controlador (13.20) se construye usando el microcontrolador PIC16F877
A de Microchip. A continuación se explica como se ha hecho esto. Antes que
nada se debe aclarar que no es el propósito presentar toda una exposición de
como trabaja este microcontrolador. Lo que se presenta es una descripción de
los recursos de este microcontrolador que se utilizan para construir el contro-
lador (13.20). Al final de este capı́tulo se presenta un listado del programa
utilizado. El microcontrolador PIC16F877A [6] es de tecnologı́a EEPROM,
tiene una velocidad de operación máxima de 20[MHz]. Cuenta con 5 puertos
de entrada-salida configurables, 3 temporizadores (el timer TMR0 es utilizado
658 13 Control de un péndulo de Furuta

en este capı́tulo para establecer el periodo de muestreo: T = 0.0256[seg]), 8 ca-


nales Analógico-Digital los cuales se basan en un CAD (convertidor Analógico-
Digital) de 10 bits (de los cuales sólo se usan los 8 bits más significativos en
este capı́tulo). También cuenta con 2 módulos PWM de los cuales en este
capı́tulo se usa el CCP1 para entregar el voltaje de control a la planta. Es-
te PWM se programa para trabajar a una frecuencia de 4.9[KHz] con una
resolución de 28 − 1 = 255 cuentas.
Las posiciones θ0 y θ1 se miden usando los potenciómetros de precisión
de una vuelta P2 y P1 , respectivamente (ver figura 13.3). Las variaciones de
voltaje de estos potenciómetros son leı́das usando los canales 0 y 1 del CAD,
respectivamente. Se considera que una vuelta completa de cada potenciómetro
equivale exactamente a 2π radianes y que el rango del CAD (sólo se usan los 8
bits más significativos) equivale a tal variación angular. Más aún, el centro de
las variaciones de cada potenciómetro es la posición correspondiente al punto
de operación dado en (13.12), es decir x∗1 = θ0∗ = 0 y x∗3 = θ1∗ = 0. Con esto
en mente se hacen las siguientes operaciones:

theta0 = (CAD0 − 127) (13.21)
255

theta1 = (CAD1 − 127) (13.22)
255
donde CAD0 y CAD1 representan las lecturas entregadas por los canales 0
y 1 del CAD, respectivamente, mientras que theta0 y theta1 representan las
mediciones de θ0 y θ1 , respectivamente, en radianes. Las velocidades θ̇0 y θ̇1
se estiman a partir de las posiciones medidas usando diferenciación numérica:

theta0 (k) − theta0 (k − 1)


dtheta0 = (13.23)
T
theta1 (k) − theta1 (k − 1)
dtheta1 = (13.24)
T
donde k representa el tiempo discreto, dtheta0 y dtheta1 representan los es-
timados de las velocidades θ̇0 y θ̇1 , respectivamente, en radianes por segundo
mientras que T = 0.0256[seg] es el periodo de muestreo utilizado. De este mo-
do theta0 (k) indica el valor de theta0 que se mide en el instante de muestreo
actual y theta0 (k − 1) indica el valor de theta0 que se midió en el instante de
muestreo previo. theta1 (k) y theta1 (k − 1) se definen de manera similar. Con
esta información se calcula:

da = 1.5215 theta0 + 4.6690 dtheta0 + 152.0048 theta1 + 13.8931 dtheta1

y se envı́a da al PWM del microcontrolador como se describe a continuación.


Se supone que da sólo tomará valores en el rango de -5 a +5 volts, por lo
que su valor se satura por software para restringirlo a ese rango de valores
utilizando instrucciones como las siguientes:
13.5 Construcción del controlador 659

if da > 5 then da = 5
if da < −5 then da = −5

Como la resolución del PWM es de 28 − 1 = 255 cuentas, entonces la si-


guiente cuenta debe ser enviada al PWM del microcontrolador para entregar
correctamente el valor de da al amplificador de potencia de la planta:
255
cuenta = abs(da ) (13.25)
5
donde abs(da ) representa el valor absoluto de da . El signo de da es almacenado
en dos bits de control. La señal del PWM se entrega a un puente H (L293D
de Texas Instruments) que se encarga de amplificar convenientemente la po-
tencia de la señal del PWM. Este puente H está alimentado con una fuente de
potencia de 7[V]. Sin embargo, de acuerdo a la hoja de datos de este disposi-
tivo [7] las caidas de voltaje en el mismo determinan que en las terminales del
motor sólo sean aplicados ±5[V]. Este dispositivo tiene dos bits a través de
los cuales se le indica el signo del voltaje que debe entregar. Para ello, el signo
de da se envı́a al puente H a través de los bits 0 y 1 del canal D. Esto significa
que el voltaje promedio que el puente H entrega a las terminales del motor
sólo varı́a en el rango de -5 a +5 volts. Ası́, se asegura que en las termina-
les del motor de CD se aplica un voltaje Ea cuyo promedio es numéricamente
igual a da . Esto es importante porque asegura que la construcción práctica del
controlador respeta el diseño indicado en (13.20). En la figura 13.4 se muestra
el diagrama eléctrico usado para construir el controlador (13.20) en base al
microcontrolador PIC16F877A. Resulta interesante observar la sencillez del
hardware utilizado.
660 13 Control de un péndulo de Furuta

Figura 13.4. Diagrama eléctrico del sistema de control del péndulo de Furuta.
13.6 Resultados experimentales 661

13.6. Resultados experimentales


En la figura 13.5 se muestran los resultados experimentales obtenidos.
Nótese que aunque la posición del brazo θ0 no consigue estabilizarse en cero,
sin embargo la posición del péndulo θ1 permanece en cero, es decir, en la
configuración vertical invertida. Nótese también la presencia importante de
ruido, el cual es debido a los potenciómetros usados para medir la posición
del brazo y del péndulo. Es importante subrayar que, a pesar de ésto, los
resultados experimentales muestran que se ha conseguido el principal objetivo
de control: mantener el péndulo “equilibrado” alrededor de su posición vertical
invertida. En la figura 13.6 se muestra una fotografı́a donde se observa el
sistema de control funcionando.

ò1
[rad]

ò0
[rad]

tiempo [s]

Figura 13.5. Resultados experimentales.


662 13 Control de un péndulo de Furuta

Figura 13.6. El sistema de control completo funcionando.

Programación del microcontrolador PIC16F877A

Se recomienda consultar la referencia [8] para una explicación precisa de


cada una de las instrucciones que aparecen en el siguiente listado.

/*PROGRAMA PARA EL COMPILADOR DE C PCWH VERSION 3.203*/

/*PROGRAMA PARA CONTROLAR UN PENDULO DE FURUTA EN LA POSICION


VERTICAL INESTABLE CON UN MICROCONTROLADOR (PIC16F877A) Y UN
PUENTE H (L293D) MEDIANTE UNA RETROALIMENTACION DE ESTADO (u=-K*x)
*/ #include<16F877A.h> #include <stdlib.h> #include <math.h>

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD

#use delay(clock=20000000) //Frecuencia del cristal Hz


/*Direcciones de los registros a utilizar*/
#byte TMR0 = 0x01
#byte OPTION= 0x81
#byte TRISA = 0x85
#byte TRISB = 0x86

#byte TRISC = 0x87


#byte TRISD = 0x88
#byte ADCON0= 0x1F

#byte ADCON1= 0x9F


#byte PORTB = 0x06
13.6 Resultados experimentales 663

/*Direcciones de los pines a utilizar*/

#bit RC2 = 0x07.2//Pin para mandar senal PWM al puente H (L293D)


#bit RD0 = 0x08.0//Pin para pilotear sentido de movimiento

#bit RD1 = 0x08.1//Pin para pilotear sentido de movimiento


/*RUTINA PRINCIPAL*/
void main(void)
{

/*DECLARACION DE VARIABLES LOCALES*/

unsigned int i,t_0,t_1,pwm;

float teta_0,teta_0_1,teta_0p,teta_1,teta_1_1,teta_1p,u;

/*Configuracion de la tasa de conteo del timer 0*/

OPTION=0x87;//pull up’s deshabilitados, prescaler 1:256 para TMR0


/*Configuracion PWM*/

setup_ccp1(CCP_PWM);
//configurando ccp1 como PWM

setup_timer_2(T2_DIV_BY_4,255,1);
//configurandotimer2,(1/20000000)*4*4*256=2048us

/*Configuracion de entradas y salidas de los puertos*/

TRISA=0x0F;//configurando parte alta del puerto A como salidas y


//parte baja como entradas
TRISB=0x00;//configurando puerto B como
//salidas
TRISC=0x00;//configurando puerto C como salidas
TRISD=0x00;//configurando puerto D como salidas

/*Configuracion ADC*/
ADCON1=0x04;
ADCON0=0x81;

/*Inicializando variables*/
TMR0=0;
teta_0=0;
teta_1=0;
while(1)
{
teta_0_1=teta_0; //posicion anterior brazo
teta_1_1=teta_1; //posicion anterior Pendulo
664 13 Control de un péndulo de Furuta

ADCON0=0x81; //Cambiando a CH0


for(i=0;i<37;i++); //estabilizar capacitor interno
t_0=read_adc(); //leer ADC
teta_0=t_0-127.0; //compensando offset potenciometro
teta_0=0.02464*teta_0; //convirtiendo a radianes

ADCON0=0x89; //cambiando a CH1


for(i=0;i<37;i++); //estabilizar capacitor interno
t_1=read_adc(); //leer ADC
teta_1=t_1-127.0; //compensando offset potenciometro
teta_1=0.02464*teta_1; //convirtiendo a radianes
/*Calculo de derivadas*/
teta_0p=(teta_0-teta_0_1)/0.0256;
teta_1p=(teta_1-teta_1_1)/0.0256;
/*Calculando el control u=-K*x*/

u=1.5215*teta_0+4.6690*teta_0p+152.0048*teta_1+13.8931*teta_1p;
u=51.0*u; //escalamiento a volts de salida
/*Control de saturacion de la senal de control para el PWM*/
if(u>254.0)
u=255.0;
if(u<-254.0)
u=-255.0;
/*Piloteando sentido de movimiento del motor (pines al puente H)*/
if(u<0)
{
RD0=1;
RD1=0;
}
else
{
RD0=0;
RD1=1;
}
pwm=(unsigned int)abs(u);
PORTB=pwm; //valor del pwm por el puerto B
set_pwm1_duty(pwm); //actualizando el valor del PWM
/*Ajuste del periodo de control Ts=0.0256 seg*/
while(TMR0<250); //1 cuenta=0.0000512 seg,(0.0128seg)
TMR0=0;
while(TMR0<250); //1 cuenta=0.0000512 seg,(0.0128seg)
TMR0=0;
}
}
13.8 Preguntas de repaso 665

13.7. Resumen del capı́tulo


En este capı́tulo se ha construido un péndulo de Furuta y todas las interfa-
ces necesarias para su control en lazo cerrado. El esquema de control utilizado
es conocido como realimentación lineal del estado. Consiste en la medición de
las posiciones y las velocidades de los dos cuerpos que componen al mecanismo
y, multiplicándolas por constantes, sumarlas para obtener el par que debe ser
generado por el motor de CD usado como actuador. Dado que se trata de un
sistema inestable y no lineal, la solución de este problema de control, ası́ como
la construcción experimental del mismo, es de gran interés. Otra caracterı́stica
importante del presente capı́tulo es el hecho de mostrar una manera diferen-
te de modelar sistemas mecánicos usando las ecuaciones de Euler-Lagrange.
Este enfoque es particularmente útil cuando se modelan sistemas mecánicos
compuestos por varios cuerpos que se mueven independientemente (grados de
libertad).
De particular interés resulta la identificación del valor numérico de los
parámetros del prototipo. En la literatura de control se habla de masas, cen-
tros de masa e inercias sin entrar en más detalles. Sin embargo, en la práctica,
los cuerpos que componen al mecanismo a su vez están compuestos por torni-
llos, acoplamientos, piezas con diferentes formas geométricas y masas, varillas,
etc. Esto significa que se debe encontrar la masa, el centro de masa y la inercia
equivalente de todas esas piezas que conforman a cada cuerpo del mecanismo.
En el presente capı́tulo se ha mostrado una forma de hacer esto utilizando
fórmulas de la mecánica clásica. También se ha mostrado la manera de obte-
ner un modelo lineal, que representa una aproximación del modelo no lineal
más exacto, el cual se emplea para diseñar el controlador. Esto resulta en un
sistema de control que sólo funcionará correctamente si la configuración inicial
del mecanismo es cercana a la que se desea.

13.8. Preguntas de repaso


1. ¿Por qué se dice que el péndulo de Furuta es inestable en lazo abierto?
2. Dé una explicación descriptiva (no analı́tica) de porqué se necesita con-
trolar simultáneamente la posición del brazo y la posición del péndulo.
3. Describa el procedimiento para identificar los diferentes parámetros del
mecanismo completo.
4. ¿Cómo se identifican los parámetros del motor?
5. Describa el funcionamiento del amplificador de potencia utilizado.
6. Explique que representan todos los posibles puntos de operación del
péndulo de Furuta.
7. ¿Por qué la energı́a potencial del mecanismo sólo considera la energı́a
potencial del péndulo?
8. ¿Qué representa la aproximación lineal de un modelo no lineal?
666 13 Control de un péndulo de Furuta

9. ¿Cuál es la condición que debe cumplir el controlador por realimentación


lineal del estado para que el péndulo de Furuta funcione adecuadamente?
10. ¿Por qué es importante que el modelo del péndulo de Furuta sea contro-
lable? ¿Qué se puede hacer si no es controlable?
Referencias

1. H. Goldstein, C. Poole and J. Safko, Cassical Mechanics, Capı́tulo 1, 3rd edition,


Addison Wesley, New York, 2000.
2. I. Fantoni and R. Lozano, Non-linear control for underactuated mechanichal
systems, Springer, London, 2002.
3. H.I. Torres Rodrı́guez, Control de sistemas no linealizables en forma exacta, Te-
sis de Mestrı́a en Ciencias, CINVESTAV, Departamento de Ingenierı́a Eléctica,
México D. F., 2002.
4. R. C. Hibbeler, Mecánica vectorial para ingenieros. Dinamica, (10a. edición),
Pearson Educación, México, 2004.
5. M. Alonso and E.J. Finn, Fı́sica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
6. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
7. L293D Qudruple half-H drivers, Data sheet, Texas Instruments, 2004.
8. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
14
Control de un péndulo con rueda inercial

El péndulo de con rueda inercial es un mecanismo en el que se debe con-


trolar simultáneamente la posición del péndulo y la velocidad de la rueda. Por
esta razón, es natural analizarlo y diseñarle un controlador usando la técnica
de las variables de estado. Por otro lado, este mecanismo es, de los prototipos
didácticos subactuados y no lineales, el más sencillo. Por ello, es ideal para
introducir al lector en los conceptos de control de sistemas no lineales. Esta
es la principal razón para incluir el problema de controlar este mecanismo.
670 14 Control de un péndulo con rueda inercial

Objetivos del capı́tulo

Modelar el péndulo con rueda inercial usando las ecuaciones de Euler-


Lagrange.
Diseñar un controlador que levante el péndulo con rueda inercial de su
posición vertical no invertida a su posición vertical invertida.
Diseñar un controlador que atrape el péndulo con rueda inercial en su
posición vertical invertida.
Construir un péndulo con rueda inercial.
Identificar los parámetros del péndulo con rueda inercial.
Construir los controladores para levantar y atrapar el péndulo con rueda
inercial.
Obtener resultados experimentales en el péndulo con rueda inercial cons-
truido.

14.1. Péndulo con rueda inercial

En este capı́tulo se diseña una estrategia de control para un mecanismo


conocido como el péndulo con rueda inercial (IWP). En la figura 14.1 puede
apreciarse el Péndulo con rueda inercial en la posición vertical no invertida,
mientras que en la figura 14.2 se muestra un esquema de este mecanismo. Se
trata de un péndulo que en su extremo tiene fijo un motor de CD el cual
mueve a una rueda. En el punto de donde se suspende el péndulo no se aplica
ningún par externo. Se dice entonces que este punto no está actuado mientras
que la rueda está actuada porque recibe el par generado por el motor de CD.
Como el péndulo y la rueda definen dos grados de libertad [1] y sólo existe un
actuador (en la rueda) se dice que este mecanismo es un sistema subactuado
[2].
El péndulo con rueda inercial (IWP) fue presentado por Spong et al. [2],
el cual además de usarse comúnmente con fines académicos ha tenido fuertes
aplicaciones en la investigación como prototipo de referencia para la prueba
de algoritmos no lineales de control [2]-[11].
La nomenclatura utilizada es la siguiente:
q1 es la posición angular del péndulo.
q2 es la posición angular de la rueda.
m1 es la masa del péndulo.
m2 es la masa de la rueda.
τ es el par aplicado a la rueda.
lc1 es la distancia al centro de masa del péndulo.
l1 es la longitud del péndulo.
I1 es la inercia del péndulo cuando gira alrededor de su centro de masa.
I2 es la inercia de la rueda (más la inercia del rotor del motor de CD).
g es la aceleración de la gravedad.
14.1 Péndulo con rueda inercial 671

Figura 14.1. Péndulo con rueda inercial en posición vertical no invertida.

Figura 14.2. El péndulo con rueda inercial.

R es la resistencia de armadura del motor de CD.


L es la inductancia de armadura del motor de CD.
kb y km son las constantes de fuerza contraelectromotriz y de par, respec-
tivamente, del motor de CD.
u e i representan, respectivamente, el voltaje en las terminales de armadura
y la corriente eléctrica a través de la armadura del motor de CD.
De acuerdo a la descripción previa del péndulo con rueda inercial, es claro
que no es posible aplicar un par suficientemente grande como para llevar
al péndulo, de un solo golpe, desde la configuración en la que q1 = 0 y su
672 14 Control de un péndulo con rueda inercial

velocidad es cero q̇1 = 0 hasta la configuración en la que q1 = +π ó q1 = −π


y q̇1 = 0. Más aún, esta última configuración es inestable y se le denomina “la
configuración invertida inestable”. Por estas razones resulta de mucho interés
diseñar una estrategia de control: i) que lleve al péndulo desde los alrededores
de la configuración q1 = 0 y q̇1 = 0 hasta la configuración invertida inestable
e ii) que lo mantenga ahı́. A la primera parte de esta tarea se le denomina
“levantar el péndulo” y la segunda parte se denomina “balancear el péndulo”
o “atrapar el péndulo”.
Como se muestra en este capı́tulo, la tarea de levantar el péndulo requiere
de técnicas de control no lineal pues las técnicas de control lineal no tienen
la capacidad para resolver este problema ya que el modelo del péndulo con
rueda inercial es no lineal. Sin embargo, aunque no lineal, el modelo de este
mecanismo es suficientemente sencillo de modo que esta estrategia puede ser
diseñada usando ideas conceptuales sencillas. Por tanto, el objetivo de presen-
tar este problema de control en este capı́tulo es introducir al lector, mediante
un ejemplo sencillo, a los métodos de diseño de control no lineal.

14.2. Modelo matemático

Dado que el péndulo es un mecanismo compuesto por dos cuerpos que


interactúan, su modelo matemático se obtiene utilizando las ecuaciones de
Euler-Lagrange, es decir:
d ∂L ∂L
− =0 (14.1)
dt ∂ q̇1 ∂q1
d ∂L ∂L
− =τ
dt ∂ q̇2 ∂q2
El cero en el lado derecho de la primera expresión indica que no hay ningún par
externo aplicado en el punto de donde se suspende el péndulo. El lagrangiano
está dado como:

L = K −P (14.2)
K = K1 + K2 , P = P1 + P2

donde K1 y K2 representan, respectivamente, las energı́as cinéticas del péndu-


lo y de la rueda, mientras que P1 y P2 representan, respectivamente, las
energı́as potenciales del péndulo y de la rueda. Como el péndulo es un cuerpo
cuya masa está distribuida a lo largo de una varilla, su energı́a cinética se
calcula como la suma de la energı́a cinética de una partı́cula de masa m1 que
se mueve sobre una circunferencia de radio lc1 más la energı́a cinética de una
varilla que gira alrededor de su centro de masa, es decir:
1 2 2 1
K1 = m1 lc1 q̇1 + I1 q̇12 (14.3)
2 2
14.2 Modelo matemático 673

La energı́a cinética de la rueda se obtiene de manera similar. Sin embargo, se


debe tomar en cuenta que la velocidad con la que gira la rueda, medida por
un observador fijo en el laboratorio, es q̇1 + q̇2 . Entonces, se encuentra que:
1 1
K2 = m2 l12 q̇12 + I2 (q̇1 + q̇2 )2 (14.4)
2 2
Para calcular la energı́a potencial se utiliza como referencia (donde P1 y P2
son iguales a cero) la configuración en la que q1 = 0. Recuérdese que la energı́a
potencial del péndulo es el producto de la fuerza aplicada sobre el péndulo
(peso del péndulo) y la distancia, en la dirección del peso, que separa al centro
de masa del péndulo en la posición actual q1 respecto de la posición en la que
la energı́a potencial es cero, es decir cuando q1 = 0. Entonces:

P1 = gm1 lc1 (1 − cos(q1 )) (14.5)

Procediendo similarmente se encuentra la energı́a potencial de la rueda:

P2 = gm2 l1 (1 − cos(q1 )) (14.6)

Por tanto, de acuerdo a (14.2):


1 2 2 1 1 1
L= m1 lc1 q̇1 + I1 q̇12 + m2 l12 q̇12 + I2 (q̇1 + q̇2 )2 − gm(1 − cos(q1 ))
2 2 2 2
donde m = m1 lc1 + m2 l1 . Sustituyendo L en las ecuaciones de Euler-Lagrange
presentadas en (14.1) y después de agrupar convenientemente los términos
resultantes se obtiene:
· ¸ · ¸ · ¸
q̈ mg sin (q1 ) 0
D 1 + = , (14.7)
q̈2 0 τ
· ¸ · 2
¸
d d m1 lc1 + m2 l12 + I1 + I2 I2
D = 11 12 =
d21 d22 I2 I2

Es muy sencillo mostrar que el determinante de la matriz D es positivo, es


decir:

det(D) = d11 d22 − d12 d21 > 0 (14.8)

El modelo en (14.7) es el modelo más exacto del péndulo con rueda inercial y
en la siguiente sección será utilizado para diseñar la estrategia de control que
lo levantará hasta su configuración invertida inestable.
Finalmente, una aclaración acerca de la señal de control utilizada. El vol-
taje aplicado al motor de CD que actúa sobre la rueda es la señal que ver-
daderamente se puede manipular directamente, mientras que el par es una
variable que resulta como efecto de aplicar dicho voltaje. Sin embargo, en la
práctica es posible suponer que el par es la señal de control si se considera
que la inductancia de armadura es muy pequeña. La siguiente ecuación es el
674 14 Control de un péndulo con rueda inercial

modelo matemático del circuito de armadura del motor de CD con escobillas


equipado con imán permanente que actúa sobre la rueda:
di
L + Ri + kb q̇2 = u (14.9)
dt
Si L y kb se suponen iguales a cero, entonces:
km
τ = km i = u (14.10)
R
Esto significa que el voltaje aplicado tiene una acción directa sobre el par
generado y por eso es válido suponer que el par es la señal de control. El
hecho de suponer kb igual a cero se justifica del siguiente modo. Como pue-
de apreciarse en (14.9) este parámetro introduce fricción viscosa adicional al
mecanismo. Como esto normalmente mejora la estabilidad de un sistema de
control, entonces suponer que kb = 0 sólo hace más interesante el problema
de control en el sentido de que el diseño se hará bajo la suposición de que
ningún efecto estabilizante esta presente de manera natural en el mecanismo.

14.3. Controlador no lineal para levantar el péndulo


El objetivo en esta seccción es diseñar un controlador que levante al péndu-
lo con rueda inercial hasta su configuración invertida inestable, es decir, hasta
alguno de los puntos (q1 , q̇1 ) = (+π, 0) o (q1 , q̇1 ) = (−π, 0). Más adelante se
explicará por qué no es importante el valor que tengan la posición y la ve-
locidad de la rueda durante el intervalo de tiempo en el que se realiza esta
tarea.
Despejando q̈2 del primer renglón en (14.7), sustituyendo este valor en el
segundo renglón de (14.7) y usando (14.10) ası́ como d12 = d22 se obtiene:

J q̈1 + mgl sin(q1 ) = τ1 (14.11)


d22 d11 − d21 d12 km
J= , mgl = mg, τ1 = − u
d12 R
Nótese que J > 0 debido a (14.8). Por tanto, el modelo en (14.11) corresponde
a un péndulo simple donde J, m, l y g representan, respectivamente, su inercia,
su masa y su longitud equivalentes ası́ como la aceleración de la gravedad. La
energı́a de este péndulo se obtiene como la suma de su energı́a cinética y
potencial, es decir:
1 2
V (q1 , q̇1 ) = J q̇ + mgl(1 − cos(q1 )) (14.12)
2 1
En la figura 14.3 se muestran las superficies de nivel de V . Esto significa
que cada curva en dicha figura representa el conjunto de puntos (q1 , q̇1 ) que
corresponden un valor constante de V (q1 , q̇1 ). El lector puede darse cuenta de
14.3 Controlador no lineal para levantar el péndulo 675

V > V0
V = V0 V = V0
0 < V < V0
qç1
[rad=s] ï
V=0

q1 [rad]

Figura 14.3. Superficies de nivel de V en (14.12).

que las curvas más externas corresponden a valores de V cada vez mayores
(positivos) y que la curva cerrada más interna corresponde a un sólo punto,
(q1 , q̇) = (0, 0), donde V tiene su valor mı́nimo e igual a cero.
Calcúlese la derivada respecto al tiempo de V (q1 , q̇1 ), dada en (14.12),
para encontrar:
dV (q1 , q̇1 )
= q̇1 J q̈1 + mglq̇1 sin(q1 ) (14.13)
dt
Si se sustituye el valor de J q̈1 obtenido a partir de (14.11) se obtiene:
dV (q1 , q̇1 )
= q̇1 τ1 (14.14)
dt
Lo que se acaba de calcular se conoce como “la derivada de V a lo largo
de las trayectorias de (14.11)” [12]. Esto quiere decir que (14.14) representa
d
los valores que toma dt V conforme el péndulo en (14.11) se mueve bajo el
efecto del par externo τ1 . Por ejemplo, si τ1 = 0 entonces, de (14.14) se
d
obtiene dt V = 0. Esto significa que conforme el péndulo se mueve su energı́a
V permanece constante. Esto provee mucha información como se explica a
continuación. Conociendo el valor inicial de posición y velocidad (q1 (0), q̇1 (0))
se puede saber el valor inicial de la energı́a V (q1 (0), q̇1 (0)). Como se sabe
676 14 Control de un péndulo con rueda inercial

d
que dt V = 0 porque τ1 = 0 entonces, conforme el tiempo crece, el péndulo
deberá moverse únicamente sobre los puntos que representan a la superficie de
nivel en la cual V (q1 (t), q̇1 (t)) = V (q1 (0), q̇1 (0)), las cuales se muestran en la
figura 14.3. Las flechas que se dibujan sobre las superficies de nivel representan
el sentido en el cual estas son recorridas conforme el péndulo se mueve. Estos
sentidos son fáciles de determinar como se explica a continuación. El estado
del péndulo simple se define como y = [q1 , q̇]T . La variable ẏ = [q̇1 , q̈]T es un
vector cuya dirección indica hacia dónde se está moviendo el estado y. Nótese
que la componente horizontal de ẏ, es decir q̇1 , apunta hacia la derecha siempre
que la velocidad del péndulo q̇1 sea positiva. Esto es suficiente para determinar
el sentido de las flechas dibujadas sobre las superficies de nivel de V .
De acuerdo a lo expuesto en el párrafo anterior, para levantar al péndulo
hasta su configuración invertida inestable sólo se necesita conseguir que la
energı́a del péndulo alcance el valor:
1
V (q1 , q̇1 )|q ó = J(0)2 + mgl(1 − cos(±π)) = 2mgl = V0
1 =+π q1 =−π
q̇1 =0
2

y si tal energı́a se alcanza en un punto donde (q1 , q̇1 ) 6= (+π, 0) ó (q1 , q̇1 ) 6=
d
(−π, 0) entonces aplicar un par τ1 que asegure que dt V = 0 a partir de ese
instante. Nótese que, de acuerdo a la figura 14.3, si V se mantiene constante
una vez que V = V0 entonces el péndulo se seguirá moviendo hasta llegar a
uno de los puntos (q1 , q̇1 ) = (+π, 0) ó (q1 , q̇1 ) = (−π, 0). A continuación se
muestra que todo este mecanismo se asegura si se usa:

τ1 = −kd sat(q̇1 ) signo(V − V0 ) (14.15)


 
 ε0 , q̇1 > ε0  +1, V > V0
sat(q̇1 ) = −ε0 , q̇1 < −ε0 , signo(V − V0 ) = −1, V < V0 (14.16)
 
q̇1 , |q̇1 | ≤ ε0 0, V = V0

donde ε0 y kd son constantes positivas arbitrarias. Sustituyendo (14.15) en


(14.14):

dV (q1 , q̇1 )
= −kd q̇1 sat(q̇1 ) signo(V − V0 ) (14.17)
dt
A partir de (14.16) es fácil darse cuenta de que el producto q̇1 sat(q̇1 ) siempre
es positivo y es cero sólo cuando q̇1 = 0. Ası́ que mientras q̇1 6= 0 se cumple
lo siguiente:
d
Si V < V0 entonces dt V > 0, por lo que la energı́a V aumenta.
d
Si V > V0 entonces dt V < 0, por lo que la energı́a V disminuye.
d
Si V = V0 entonces dt V = 0, por lo que la energı́a V permanece en el
valor V0 .
Entonces, se asegura que la energı́a del péndulo V alcanza el valor necesario
para llegar a uno de los puntos (q1 , q̇1 ) = (+π, 0) ó (q1 , q̇1 ) = (−π, 0). Más
14.3 Controlador no lineal para levantar el péndulo 677

aún, la energı́a se mantiene en ese valor hasta que uno de dichos puntos es
alcanzado. Lo único que falta es analizar que sucede si q̇1 = 0. Nótese que bajo
esa condición el péndulo está en reposo. Sin embargo, la única manera de que
q̇1 = 0 se mantenga para siempre es que q1 = 0 porque sólo ahı́ el péndulo
puede permanecer en reposo. Ası́ que será necesario aplicar al péndulo un
pequeño golpe para que abandone la configuración (q1 , q̇1 ) = (0, 0).
Todo el análisis previo asegura que el péndulo alcanzará la configuración
invertida inestable si, partiendo de la configuración estable, se le aplica un
pequeño golpe que simplemente lo saque del reposo. El lector puede darse
cuenta que todo lo anterior se mantiene sin cambio si en el controlador (14.15)
se usa sat(V −V0 ) en lugar de signo(V −V0 ). Dicho sea de paso, el controlador
en (14.15), (14.16) tiene sus orı́genes en las ideas propuestas en [13].
Por otro lado, es importante darse cuenta de que una vez alcanzada la
configuración invertida inestable, el controlador (14.15) no asegura que el
péndulo vaya a permanecer en dicha configuración. Para esto es necesario
diseñar otro controlador, el cual debe ser puesto en marcha cuando el péndulo
esté muy cerca de la configuración invertida inestable. Esto significa que el
controlador en (14.15) debe ser desconectado a partir de ese momento. En la
siguiente sección se presenta la manera de diseñar el controlador que resuelve
la segunda parte del problema de control: balancear o atrapar el péndulo en
la configuración invertida inestable.
Finalmente, nótese que nada se ha dicho acerca de lo que sucede con la
posición y la velocidad de la rueda durante el tiempo en el cual el péndulo
es llevado hasta su configuración invertida inestable. Dado que la rueda es
simétrica y se supone que está balanceada, entonces la posición de la rueda
no importa. Por otro lado, aunque la velocidad de la rueda crece de manera
desconocida durante el tiempo mencionado, sin embargo el valor de esta ve-
locidad en el momento en que el péndulo llega a su configuración invertida
inestable siempre es es finito y, por lo tanto, todo es cuestión de que el con-
trolador que atrapa al péndulo en dicha configuración inestable se encargue
de regular la velocidad de la rueda en el valor que esta variable tiene en el
momento en que dicho controlador entra en operación.
Ejemplo 14.1 Sea el controlador alternativo:
R
τ1 = −kd (V − V0 ) sat(q̇1 ), u = − τ1 (14.18)
km

 d, q̇1 > d umax km
sat(q̇1 ) = −d, q̇1 < −d , d = (14.19)
 kd RV0
q̇1 , |q̇1 | ≤ d

donde d, umax y kd son constantes positivas arbitrarias. Sustituyendo (14.18)


en (14.14):

dV (q1 , q̇1 )
= −kd (V − V0 ) q̇1 sat(q̇1 ) (14.20)
dt
678 14 Control de un péndulo con rueda inercial

A partir de (14.19) es fácil darse cuenta de que el producto q̇1 sat(q̇1 ) siempre
es positivo y es cero sólo cuando q̇1 = 0. Ası́ que mientras q̇1 6= 0 se cumple
de nuevo lo siguiente:
d
Si V < V0 entonces dt V > 0, por lo que la energı́a V aumenta.
d
Si V > V0 entonces dt V < 0, por lo que la energı́a V disminuye.
d
Si V = V0 entonces dt V = 0, por lo que la energı́a V permanece en el
valor V0 .
Entonces, se asegura nuevamente que la energı́a del péndulo V alcanza el
valor necesario para llegar a uno de los puntos (q1 , q̇1 ) = (+π, 0) ó (q1 , q̇1 ) =
(−π, 0).

14.4. Controlador para atrapar el péndulo


La estrategia que se utiliza para atrapar al péndulo en la configuración
invertida inestable es un controlador lineal que es diseñado usando un modelo
lineal aproximado de (14.7). A continuación se muestra como obtener dicha
aproximación lineal.
Nótese que el modelo en (14.7) no depende de la posición de la rueda q2 .
Tomando esto en consideración se puede definir el estado como:
   
x1 q1
x =  x2  =  q̇1  , (14.21)
x3 q̇2

De (14.7) se puede escribir:


· ¸ ½ · ¸ · ¸¾
q̈1 −1 mg sin (q1 ) 0
=D − + (14.22)
q̈2 0 τ
· ¸ · ¸
−1 d11 d12 1 d22 −d12
D = = (14.23)
d21 d22 d11 d22 − d12 d21 −d21 d11

Nótese que det(D−1 ) 6= 0 porque se trata de la inversa de una matriz no


singular. Usando (14.21) y (14.22) el modelo en (14.7) se puede escribir como:
 
x2
ẋ = f (x, τ ) =  −d11 mg sin (x1 ) + d12 τ  (14.24)
−d21 mg sin (x1 ) + d22 τ

De acuerdo a la sección 7.2.2, los puntos de operación (x∗ , τ ∗ ) de (14.24) se


encuentran a partir de la condición f (x∗ , τ ∗ ) = 0, es decir:
   
x∗2 0
 −d11 mg sin (x∗1 ) + d12 τ ∗  =  0  . (14.25)
−d21 mg sin (x∗1 ) + d22 τ ∗ 0
14.4 Controlador para atrapar el péndulo 679

Es claro que:

x∗2 = 0 (14.26)

Por otro lado, del segundo y tercer renglones de (14.25) se obtiene:

d11 mg sin (x∗1 )


τ∗ = (14.27)
d12
d21 mg sin (x∗1 )
τ∗ =
d22
Igualando estas expresiones:
mg £ ¤
d11 d22 − d21 d12 sin (x∗1 ) = 0 (14.28)
d12 d22
Debido a que det(D−1 ) = d11 d22 −d21 d12 6= 0, entonces (14.28) sólo se cumple
si:
x∗1 = ±nπ, n = 0, 1, 2, 3, . . . (14.29)
Sustituyendo esta condición en cualquiera de las expresiones en (14.27) se
obtiene:
τ∗ = 0 (14.30)
Finalmente, como no existe ninguna restricción sobre x∗3 se concluye:

x∗3 = c. (14.31)

donde c es cualquier número real. De acuerdo a la sección 7.2.2, la aproxima-


ción lineal del sistema en (14.24) en el punto de operación (14.26), (14.29),
(14.30), (14.31), con n = ±1, está dada como:

ż = Az + Bw, (14.32)
 ¯  
¯ ∂f1 ∂f1 ∂f1 ¯ 0 10
∂f (x, τ ) ¯¯ ∂x1 ∂x2 ∂x3 ¯
 ∂f2 ∂f2 ∂f2¯
A= = ¯ =  d11 mg 0 0  ,
∂x ¯τx∗∗ ∂x1
∂f3
∂x2
∂f3
∂x3
∂f3 ¯
∂x1 ∂x2 ∂x3
¯x∗∗ d21 mg 0 0
τ
 ∂f1 ¯  
¯ ¯ 0
∂f (x, τ ) ¯¯ ∂τ
 ∂f2
¯
¯
B= = =  d12 
∂τ ¯x∗ τ
∗ ∂τ
∂f3
¯
¯x∗
∂τ τ∗
d22

donde:

z = x − x∗ , (14.33)

w = τ −τ . (14.34)

son cantidades pequeñas, es decir z ≈ 0, w ≈ 0. Por otro lado, recuérdese que


τ ∗ = 0 y, por tanto, w = τ . entonces se puede usar (14.10) para encontrar la
siguiente versión modificada de (14.32):
680 14 Control de un péndulo con rueda inercial

ż = Az + Bu (14.35)
 
0
km
B =  d12 
R
d22

Este es el modelo lineal aproximado que será utilizado para diseñar el contro-
lador que atrapa o balancea al péndulo en su configuración invertida inestable.
Primero se verifica si el par (A, B) es controlable. Para esto, se calcula el
determinante de la matriz de controlabilidad C = [B|AB|A2 B] y se encuentra
que está dado como:
3
mgkm 2
det(C) = 3
d12 (d11 d22 − d12 d21 ) 6= 0, (14.36)
R
Por tanto, se concluye que el par el par (A, B) es controlable. Esto significa
que siempre es posible encontrar un vector de ganancias K tal que todos los
eigenvalores de la matriz de lazo cerrado (A − BK) queden ubicados en donde
se desee. Esto se consigue usando el controlador:

u = −Kz (14.37)

El valor de K se calcula una vez que se conocen los valores numéricos de los
parámetros involucrados en las matrices A y B. Con el controlador (14.37) se
consigue atrapar el péndulo con rueda inercial en la configuración invertida
inestable definida por el punto de operación (14.26), (14.29), (14.30), (14.31),
con n = ±1. Es importante subrayar que para esto es indispensable que el
estado x del mecanismo se encuentre suficientemente cerca de dicha configu-
ración inestable en el momento en que el controlador en (14.37) empiece a
operar.
Finalmente, es conveniente aclarar que la constante c introducida en
(14.31) toma el valor que la velocidad de la rueda tiene en el instante en
el cual el controlador (14.37) empieza operar. Como esta velocidad puede te-
ner cualquier valor, entonces es muy adecuado el hecho de que c pueda ser
cualquier constante real.

14.5. Construcción del péndulo con rueda inercial e


identificación de sus parámetros
En la figura 14.4 se presenta un dibujo detallado que muestra las partes
mecánicas utilizadas para construir el péndulo con rueda inercial. Algunas de
estas partes son introducidas con el fin de realizar el acoplamiento mecánico
entre las piezas que componen al mecanismo. También se incluye un enco-
der incremental y un tacómetro para medir, respectivamente, la posición del
péndulo q1 y la velocidad de la rueda q̇2 . En la tabla 14.1 se muestran los
14.5 Construcción del péndulo con rueda inercial 681

Soporte
del mecanismo

Dado

Tornillos Encoder

Base
Solera
(pendulo)

Manguera
de boligrafo Motor CD

Rueda
Tacometro
Soporte del
tacometro
Figura 14.4. Partes que componen al péndulo con rueda inercial construido.

Tabla 14.1. Parámetros simples.


Sı́mbolo: Descripción: Valor: Unidades:
l1 longitud de la solera 0.117 m
asol ancho de la solera 0.0254 m
msol masa de la solera 0.016 Kg
mcar masa de la carcasa del actuador 0.03 Kg
msop masa del soporte del tacómetro 0.01375 Kg
mrot masa del rotor del actuador 0.02 Kg
rrot radio del rotor del actuador 0.00915 m
mrue masa de la rueda 0.038 Kg
rrue radio de la rueda 0.0189 m
R resistencia de armadura 4.172 Ohm
L inductancia de armadura 0.0009 H
kb constante de fuerza contra electromotriz 0.00775 Vs/rad
km constante de par 0.00775 Nm/A
682 14 Control de un péndulo con rueda inercial

parámetros medidos de las piezas que componen al péndulo con rueda inercial
ası́ como del motor de CD utilizado como actuador.
La masa equivalente del primer grado de libertad m1 se define como:

m1 = msol + mcar + msop = 0.05975 [Kg]. (14.38)

Para calcular el centro de masa del primer grado de libertad con todos sus
componentes, se aplica el principio de la balanza (la suma de pares en el punto
de apoyo debe de ser igual a cero), por tanto al aplicar un peso equivalente
a una distancia lc1 en el extremo opuesto de la solera, el arreglo de la figura
14.5 debe quedar balanceado. Usando (14.38) y los datos de la tabla 14.1 se
tiene que:
msol l21 + mcar l1 + msop l1
lc1 = = 0.10133 [m]. (14.39)
m1

Figura 14.5. Esquema para calcular lc1 .

El momento de inercia de una placa rectangular de masa m, ancho b y


largo d con eje de rotación x colocado sobre una dirección perpendicular al
plano de lados b y d y que pasa por su centro está dado como [14], [15], pág.
271:
1
Ix = m(b2 + d2 ) (14.40)
12
Usando (14.40) y los datos de la tabla 14.1 se obtiene el momento de inercia
I ∗ como:
1
I∗ = msol (a2sol + l12 ) = 0.0000191122 [Kg m2 ] (14.41)
12
Sin embargo, el momento de inercia I1 está definido alrededor de un eje que
pasa por el centro de masa del péndulo ubicado a una distancia lc1 − l1 /2 del
centro de la cara de lados b y d. De acuerdo al teorema del eje paralelo o de
Steiner [14], [15], pág. 272:
µ ¶2
l1
I1 = I ∗ + msol lc1 − = 0.000048463 [Kg m2 ]
2

Por otro lado, el momento de inercia de un disco de masa m y radio r con


un eje de rotación x colocado a través de su centro y que es perpendicular al
disco está dado como [14], [15], pág. 271:
14.5 Construcción del péndulo con rueda inercial 683

1 2
Ix = mr (14.42)
2
Con los datos de la tabla 14.1 y la expresión (14.42) se tiene que el momento
de inercia de la rueda Irue está dado como:
1 2
Irue = mrue rrue = 0.000006787 [Kg m2 ] (14.43)
2
El momento de inercia de un cilindro de masa m, radio a y altura l con un
eje de rotación x colocado a través de su eje longitudinal está dado como [14],
[15], pág. 271:
1
Ix = ma2 . (14.44)
2
Usando la expresión (14.44) y los datos de la tabla 14.1 se tiene que el momento
de inercia del rotor del actuador Irot está dado como:
1 2
Irot = mrot rrot = 0.000000837225 [Kg m2 ] (14.45)
2
La masa equivalente del segundo grado de libertad m2 se define como:
m2 = mrot + mrue = 0.058 [Kg] (14.46)
Usando (14.43) y (14.45) se tiene que el momento de inercia del segundo grado
de libertad I2 está dado como:
I2 = Irue + Irot = 0.0000076242 [Kg m2 ] (14.47)
Finalmente con los datos de la tabla 14.1, los parámetros en (14.41), (14.38),
(14.39), (14.46), (14.47) y g = 9.81[m/s2 ], se tiene que los valores numéricos
de los parámetros del modelo (14.7) son:
d11 = 0.0014636, d12 = 0.0000076, (14.48)
d21 = 0.0000076, d22 = 0.0000076, (14.49)
mg = 0.12597 (14.50)
Es importante mencionar que la masa del tacómetro se considera dentro de
la masa del soporte del tacómetro, además de que el efecto del rotor del
tacómetro se considera despreciable en el cálculo de la inercia I2 . Esto debido
a que tiene una masa menor a los 0.0001[Kg] y un radio menor a los 0.001
[m]. Por otro lado, los tornillos de sujeción del dado, el dado (de plástico)
y el eje del encoder incremental se desprecian para el cálculo de la inercia
I1 . Esto debido a que la suma de las masas de estos componentes es menor
a los 0.008[Kg] y, lo más importante, están directamente en el eje de giro
del péndulo por lo que los radios inerciales son muy pequeños y el efecto
inercial producido es despreciable. Finalmente, la masa de los dos alambres
conductores (tanto del actuador como del tacómetro), ası́ como la masa de
la manguera de bolı́grafo (de plástico) usada para acoplar el tacómetro a la
rueda, no fueron consideradas en el modelado del prototipo experimental.
684 14 Control de un péndulo con rueda inercial

Ejemplo 14.2 A continuación se presenta la simulación, usando SIMU-


LINK, del péndulo con rueda inercial con los controladores (14.18) y (14.37).
Primeramente se muestra el programa de matlab que se encarga de cargar los
valores numéricos de las constantes que usará la simulación:
clc,clear all;
% Constantes del Motor
R=4.172;
km=0.00775;
Umax=13;
% Modelo del IWP
g=9.81;
mgl=0.12597;
mbg=mgl
d11=0.0014636;
d12=0.0000076;
d21=d12;
d22=d21;
J= (d11*d22-d12*d21)/d12;
D=[d11 d12;d21 d22];
Di=inv(D);
di11=Di(1,1)
di12=Di(1,2)
di21=Di(2,1)
di22=Di(2,2)
%Matrices del IWP linealizado en el punto de operacion
A=[0 1 0;di11*mbg 0 0;di21*mbg 0 0]
B=[0;di12*km/R;di22*km/R]
%Determinar la Controlabilidad
disp(’El sistema es controlable?’); Pc=ctrb(A,B); if rank(Pc) ==
size(Pc)
disp(’Si.’);
else
disp(’No.’);
end
%Controlador No-Lineal
Kd=20;
V0=2*mbg
d=(Umax*km)/(R*Kd*V0)
%Control por retroalimentacion de estado en punto de operacion
n=1
c=-570
xd=[n*pi 0 c]
%valores propios deseados en lazo cerrado
lambda1= -9.27 + 20.6i;
lambda2= -9.27 - 20.6i;
lambda3= -0.719;
Vp=[lambda1 lambda2 lambda3]
K = place(A,B,Vp)
14.5 Construcción del péndulo con rueda inercial 685

%Verificar los valores propios de lazo cerrado


Vp_=eig(A-B*K)
Una vez que se ha ejecutado el programa anterior, ya es posible ejecutar
la simulación. En la figura 14.6 se muestra el diagrama de SIMULINK con
las conexiones necesarias para simular el péndulo con rueda inercial con el
controlador no lineal (14.18) y con el controlador lineal (14.37).

Figura 14.6. Diagrama para simular el IWP en SIMULINK.

En la parte central de la figura 14.6 está armado el péndulo con rueda


inercial partiendo de la ecuación de estado no lineal (14.24) con τ = kRm u. En
la parte superior de la figura 14.6 está armado el controlador no lineal (14.18),
mientras que en la parte inferior de la misma figura se encuentra armado el
controlador lineal (14.37). Para que la simulación no se quede atascada en el
reposo de la posición vertical no invertida, se le puso al segundo integrador
una condición inicial de 0.00001[rad/s].
En la figura 14.7 se muestra la evolución en el tiempo de cada uno de los
elementos del estado x, ası́ como el voltaje u aplicado al motor del IWP.
Finalmente en la figura 14.8 se observa el valor de la energı́a deseada V0 ,
y la evolución tanto de de la energı́a V como de la diferencia (V − V0 ).
686 14 Control de un péndulo con rueda inercial

Figura 14.7. Visualización de la simulación en osciloscopio 1.

Figura 14.8. Visualización de la simulación en osciloscopio 2.


14.6 Construcción del controlador 687

14.6. Construcción del controlador


Usando los valores numéricos de la sección 14.5, considerando kd = 1 y
de acuerdo a (14.11), (14.15) se obtiene el controlador que levanta el péndulo
hasta su configuración invertida inestable:
1
V = C1 q̇12 + mg(1 − cos(q1 )), C1 = J, V0 = 2mg,
2
Rkd umax km
u = C2 sat(q̇1 ) signo(V − V0 ), C2 = , ε0 = , (14.51)
km kd R
donde umax = 13[V], mientras que las constantes C1 y C2 se calculan una sola
vez en la inicialización del programa del controlador, para reducir el número
de multiplicaciones necesarias en la implementación.
Por otro lado, de acuerdo a las secciones 7.13.1 y 7.13.2, en el capı́tulo
7, se encuentra que el uso del controlador lineal (14.37) junto con el vector
de ganancias K = [k1 , k2 , k3 ] = [−340, −11, −0.0085] ubica los eigenvalores
de la matriz (A − BK) en los siguientes valores: λ̄1 = −5.8535 + 17.7192j,
λ̄2 = −5.8535 − 17.7192j y λ̄3 = −0.5268. Por tanto, el controlador (14.37)
queda expresado como:

u = −k1 (q1 − q1d ) − k2 q̇1 − k3 (q̇2 − q̇2d ) (14.52)

donde se usa cualquiera de los valores q1d = +π ó q1d = −π, dependiendo


de a cuál valor se acerca primero q1 . Recuérdese que q̇2d = c es el valor que
tiene la velocidad de la rueda en el momento en que el controlador en (14.52)
empieza a operar.
Defı́nase la condición:

(q1 − q1d )2 + q̇12 < δ (14.53)

para alguna constante δ > 0 suficientemente pequeña y q1d = +π ó q1d = −π.


Esta condición significa que el péndulo se encuentra muy cerca de uno de los
puntos (q1 , q̇1 ) = (+π, 0) ó (q1 , q̇1 ) = (−π, 0). Esta cercanı́a se puede ajustar
proponiendo δ (en esta implementación se manejó δ = 0.3).
La estrategia de control para levantar y atrapar el péndulo con rueda
inercial consiste en utilizar (14.51) hasta que se cumpla (14.53) y a partir
de ese momento desconectar (14.51) y empezar a utilizar (14.52). Para rea-
lizar esta tarea se utiliza el microcontrolador PIC18F4431 de Microchip. A
continuación se explica como se hace esto. Antes que nada se debe aclarar
que no es el propósito presentar toda una exposición de como trabaja este
microcontrolador. Lo que se presenta es una descripción de los recursos de
este microcontrolador que se utilizan para construir la estrategia de control
(14.51), (14.52), (14.53).
Al final de este capı́tulo se presenta un listado del programa utilizado. El
microcontrolador PIC18F4431 [16] es de tecnologı́a flash, tiene una velocidad
de operación máxima de 40 MHz (en este capı́tulo se usa un cristal de 11
688 14 Control de un péndulo con rueda inercial

MHz ya que el circuito esta armado en tarjeta de pruebas). Cuenta con cinco
puertos de entrada-salida configurables, tres temporizadores de 16 bits y uno
de 8 bits (el temporizador de 8 bits es utilizado para establecer el periodo
de muestreo: Ts = 0.01 s), nueve canales Analógico-Digital de 10 bits (por el
canal cero se recibe la señal del tacómetro). También cuenta con ocho canales
PWM (modulación de ancho de pulso) de 14 bits de los cuales en este capı́tulo
se usa el CCP1 configurado para trabajar en 8 bits para entregar el voltaje
de control a la planta.
La posición q1 se mide usando un codificador incremental óptico modelo
CP-360-S de Computer Optical Products Inc. [17]. Este dispositivo ya conec-
tado al microcontrolador tiene una resolución de 1440 cuentas por revolución.
El codificador incremental es leı́do a través de los pines 5 y 6 del canal A
(véase la figura 14.9). Las cuentas del codificador incremental son recibidas
en dos bytes (de 8 bits cada uno) llamados POSCNTH, el más significativo, y
POSCNTL, el menos significativo. El valor real de la cuenta se puede calcular
como:
pos = 256 ∗ P OSCN T H + P OSCN T L
lo cual es equivalente a hacer 8 corrimientos de POSCNTH hacia la izquierda
para luego sumar POSCNTL. La instrucción “q1=(signed long)pos” asigna a
la variable q1 el valor numérico de la cuenta que incluye el signo correspon-
diente, es decir positivo si el movimiento es como el mostrado en la figura
14.2 o negativo en caso contrario. Finalmente, la posición q1 es obtenida en
radianes mediante la operación:
2π 2π
q1 = q1, = 0.004363
1440 1440
Es importante mencionar que con el fin de obtener una lectura correcta de
q1 , que represente fielmente la convención descrita en la figura 14.2 para la
medición de q1 , es necesario energizar el sistema de control cuando el péndulo
esté en la configuración de reposo que de acuerdo a la figura 14.2 corresponde
a q1 = 0. Lo anterior es para que los registros de posición queden inicializados
en cero cuando el sistema se encuentre en dicha posición. La velocidad del
péndulo q̇1 se calcula a partir de la medición de q1 , usando diferenciación
numérica, es decir:
q1 (k) − q1 (k − 1)
q̇1 = (14.54)
T
donde k representa el tiempo discreto, q̇1 representa el estimado de la velocidad
del péndulo en radianes por segundo mientras que Ts = 0.01 s[seg] es el
periodo de muestreo utilizado. De este modo q1 (k) indica el valor de q1 que
se mide en el instante de muestreo actual y q1 (k − 1) indica el valor de q1 que
se midió en el instante de muestreo previo.
La velocidad de la rueda q̇2 se mide usando un tacómetro modelo 34PC.
Se trata de un motor de CD tipo miniatura de los utilizados en los teléfonos
14.6 Construcción del controlador 689

celulares como vibrador. El voltaje que entrega el tacómetro se filtra utilizando


el circuito RC que se muestra en la figura 14.9.
Se encontró que el tacómetro utilizado entrega 0.58[V] cuando la veloci-
dad es máxima e igual a 1634 radianes por segundo. Se supuso que cualquier
valor intermedio varı́a de manera proporcional. Con el fin de mejorar la re-
solución con que se mide esta velocidad se usó el divisor de tensión que se
conecta al pin 4 (ver figura 14.9) para fijar en 3.8372[V] el valor mı́nimo del
rango analógico del canal 0 del convertidor analógico-digital (el valor máxi-
mo esta fijo en 5[V]). Por otro lado, el tacómetro se conectó en serie a otro
divisor de tensión de manera que cuando el tacómetro está en reposo (cuan-
do q̇2 = 0) el voltaje leido por el canal 0 del convertidor analógico-digital
es de (5-3.8372)/2+3.8372=4.4186[V]. Nótese que de esta manera se permi-
ten variaciones de aproximadamente 0.58[V] (es decir 1634 radianes por se-
gundo) hacia arriba y hacia abajo del punto medio del rango analógico del
convertidor analógico-digital. Ası́ que cuando q̇2 = 1634[rad/s] el convertidor
analógico-digital entrega la cuenta 1023 = 210 − 1 (el convertidor AD es de
10 bits) y cuando q̇2 = 0[rad/s] el convertidor analógico-digital entrega la
cuenta 1023/2 = 511. Cuentas menores a 511 representan valores negativos
de q̇2 . De acuerdo a esta información, la velocidad de la rueda se calcula del
siguiente manera. La instrucción “vel=read-adc()-511” asigna a la variable
“vel” el código correspondiente a la velocidad de la rueda mientras que las
instrucciones “q2 p=(signed long)vel” y “q2 p=3.2039*q2 p” consiguen asig-
nar a la variable “q2 p” un valor que es numéricamente igual a la velocidad de
la rueda q̇2 en radianes por segundo (incluyendo su signo). Nótese que la cons-
tante 3.2039=1634/510[(rad/s)/cuenta] representa la ganancia del sistema de
medición.
Con esta información se calcula cualquiera de las expresiones en (14.51) o
(14.52), según sea el caso. El valor de la variable u ası́ obtenida se envı́a al
PWM del microcontrolador como se describe a continuación.
Una manera equivalente de implementar la función saturación en (14.51)
con un menor numero de operaciones se realiza sabiendo que u sólo tomará va-
lores en el rango de -13 a +13 volts, por lo que su valor se satura por software
para restringirlo a ese rango de valores utilizando instrucciones como las si-
guientes:
if u > 13 then u = 13
if u < −13 then u = −13
Como la resolución del PWM es de 28 − 1 = 255 cuentas, entonces la si-
guiente cuenta debe ser enviada al PWM del microcontrolador para entregar
correctamente el valor de u al amplificador de potencia de la planta:
255
cuenta = abs(u)
13
donde abs(u) representa el valor absoluto de u. El signo de u es almacenado
en dos bits de control. La señal del PWM se entrega a un puente H (L293B
690 14 Control de un péndulo con rueda inercial

Figura 14.9. Diagrama eléctrico del sistema de control.

de SGS-Thomson Microelectronics) que se encarga de amplificar convenien-


temente la potencia de la señal del PWM. Este puente H está alimentado
con una fuente de potencia de 15.3[V]. Sin embargo, de acuerdo a la hoja de
datos de este dispositivo [18] las caı́das de voltaje en el mismo determinan
que en las terminales del motor sólo sean aplicados ±13[V]. Este dispositivo
tiene dos bits a través de los cuales se le indica el signo del voltaje que debe
entregar. Para ello, el signo de u se envı́a al puente H a través de los bits 0 y
1 del canal D. Esto significa que el voltaje promedio que el puente H entrega
14.7 Resultados experimentales 691

a las terminales del motor sólo varı́a en el rango de -13 a +13 volts. Ası́, se
asegura que en las terminales del motor de CD se aplica un voltaje u cuyo
promedio es numéricamente igual al valor de u calculado con cualquiera de
las expresiones en (14.51) o (14.52). Esto es importante porque asegura que la
construcción práctica del controlador respeta el diseño indicado por los con-
troladores correspondientes. En la figura 14.9 se muestra el diagrama eléctrico
usado para construir la estrategia de control (14.51), (14.52), (14.53) en base
al microcontrolador PIC18F4431. Resulta interesante observar la sencillez del
hardware utilizado.

14.7. Resultados experimentales

En las figuras 14.10, 14.11, 14.12, 14.13 y 14.14 se muestran los resultados
experimentales obtenidos. Es importante recordar que es necesario aplicar al
principio un pequeño golpe sobre el péndulo de manera que se abandone el
punto (q1 , q̇1 ) = (0, 0). Aunque esto se puede evitar si se envı́a al principio, a
través del programa, un pequeño pulso de voltaje al motor, sin embargo no
se programó la tarea de esta manera.
En la figura 14.10 se muestra como oscila el péndulo, con amplitudes cada
vez mayores, hasta alcanzar la posición q1 = −π con velocidad cero en t ≈ 14[s]
y que permanece en esa posición para todo tiempo futuro. En la figura 14.11
se observa que la velocidad de la rueda permanece constante en un valor de
380[rad/s] a partir de t ≈ 17[s]. Aquı́ es interesante aclarar que la velocidad
de la rueda es regulada en un valor c ≈ 150[rad/s] que es el valor de la rueda
en t ≈ 14[s], instante en el que el controlador (14.52) empieza a funcionar.
La diferencia entre c y la velocidad final de la rueda 380[rad/s] se debe a
la fricción existente en la rueda y que no ha sido considerada en el diseño
realizado en este capı́tulo.
En la figura 14.12 se muestra la señal de control u. Nótese que esta variable
se satura la mayor parte del tiempo durante la etapa en la cual el péndulo es
levantado (t < 14[s]). Esta es la razón por la cual se usan funciones saturación
y signo en el controlador (14.51). De hecho el valor de ε0 = 0.024 se selecciona
4.172
de manera que con este valor y el factor 0.00775 , el valor de u se sature en
±13[V].
En la figura 14.13 se muestra como se mueve el péndulo en el mismo plano
que se definió en la figura 14.3 de la sección 14.3. Es claro que, comparando
ambas figuras, el péndulo se mueve de manera que su energı́a V crece al pasar
el tiempo (también véase la figura 14.14) hasta que V = V0 = 0.2519. Nótese
que V alcanza dicho valor desde t ≈ 11[s] y sin embargo el péndulo es atrapado
o balanceado hasta t ≈ 14[s]. Esta es una prueba de que la energı́a es regulada
en V = V0 hasta que se alcanza el punto (q1 , q̇1 ) = (−π, 0). Es claro que el
péndulo también pasa cerca del punto (q1 , q̇1 ) = (+π, 0) en t ≈ 13[s] pero no
es atrapado, seguramente porque la condición en (14.53) no fue satisfecha en
692 14 Control de un péndulo con rueda inercial

q1
[rad]

tiempo [s]
Figura 14.10. Posición del péndulo conforme se alcanza la configuración invertida
inestable.

qç 2
[rad=s]

tiempo [s]

Figura 14.11. Velocidad de la rueda.


14.7 Resultados experimentales 693

u
[V]

tiempo [s]
Figura 14.12. Voltaje aplicado al motor.

qç 1
[rad=s]

q 1 [rad]

Figura 14.13. Evolución del péndulo en el plano q̇1 − q1 (plano de fase).


694 14 Control de un péndulo con rueda inercial

V
[J]

tiempo [s]
Figura 14.14. Variación de la energı́a conforme se alcanza la configuración invertida
inestable.

ese momento, es decir, el péndulo no pasó suficientemente cerca como para


ser atrapado.
Finalmente, en la figura 14.15 se muestra una fotografı́a donde se observa
al péndulo controlado en la configuración invertida inestable.

Figura 14.15. El péndulo con rueda inercial controlado en su configuracı́on inver-


tida inestable.
14.7 Resultados experimentales 695

Programación del microcontrolador PIC18F4431


Se recomienda consultar la referencia [19] para una explicación precisa de
cada una de las instrucciones que aparecen en el siguiente listado.
//Programa controlar pendulo con rueda inercial para PCW V3.203
#include<18f4431.h>
#device adc=10 //manejar adc de 10 bits
#include<stdlib.h>
#include<math.h>

#fuses HS,NOWDT,NOPROTECT,PUT,NOLVP,NOBROWNOUT,NOWRTC,MCLR,SSP_RC
#define pi_ 3.14159
//ganancia del controlador no lineal
#define kd 1.0
//ganancias del controlador lineal
#define k1 340
#define k2 11
#define k3 0.0085
//parametros
#define mbg 0.12597
#define R 4.172

#define L 0.0009
#define Kb 0.00775
#define Km 0.00775
#define d11 0.0014636
#define d12 0.0000076

#define d21 0.0000076


#define d22 0.0000076

#define delta 0.3


#define ts 0.01
//con timer=108, cada cuenta vale (4/FXtal)*256 seg

/*DIRECCIONES DE REGISTROS DE INTERES*/


#use delay(clock=11000000)
//Base de tiempo para retardos (11 MHz)
#byte porta = 0xf80
//direcciones de los puertos
#byte portb = 0xf81

#byte portc = 0xf82


#byte portd = 0xf83
#byte portd = 0xf84

#byte TMR0H = 0xfd7


#byte TMR0L = 0xfd6
696 14 Control de un péndulo con rueda inercial

#byte T0CON = 0xfd5

#byte INTCON= 0xff2


#byte TMR5H=0xf88
//Conteo de Encoder Parte alta

#byte TMR5L=0xf87 //Conteo de Encoder Parte Baja

#byte QEICON=0xfB6 //Registro de Configuracion de Modulo de


//Cuadratura

#byte T5CON=0xfB7 //Registro de configuracion de TIMER 5

#byte POSCNTL=0xF66 //CAP2BUFL (registro de cuentas parte baja)


#byte POSCNTH=0xF67 //CAP2BUFH (registro de cuentas parte alta)
#byte CAP1CON=0xF63 //Registro configuracion para reset de base de
//tiempo de captura
#byte PIE3=0xFA3

/*DIRECCIONES DE BITS DE INTERES*/

#bit VCFG1=0xfc1.7 //Bit de configuracion del ADC

#bit PD0=0x0f83.0 //control CCW de puente H


#bit PD1=0x0f83.1
//control CW de puente H
#bit PD2=0x0f83.2
//led en protoboard
#bit PD3=0x0f83.3 //led en protoboard
/*DECLARACION DE VARIABLES*/

float u,q1,q1_p,q1_1,q2_p,q1_d,q2_pd,gr,V,S,nf,i_ts,Je2,V0,RKdeKm;
long pos,vel,inter;
int pwm;
signed int n,mod;

/*PROGRAMA PRINCIPAL*/
void main(void)
{
set_tris_a(0b11111111);
//Configurando E/S de los puertos
set_tris_b(0b00000000);
set_tris_c(0b10000000);
set_tris_d(0b00000000);
portb=0X00;
portc=0X00;
portd=0X00;
//CONFIGURANDO PWM
setup_ccp1(CCP_PWM);
14.7 Resultados experimentales 697

setup_ccp2(CCP_PWM);
setup_timer_2(T2_DIV_BY_16,255,1);
// Configurando lectura del encoder
QEICON=QEICON | (0b00010101);
QEICON=QEICON & (0b01110101);
T5CON=T5CON | (0b00011001);
T5CON=T5CON & (0b10011101);
CAP1CON=CAP1CON | (0b01001111);

setup_timer_1(T1_INTERNAL | T1_DIV_BY_8);
TMR5L=0;
TMR5H=0;
POSCNTL=0;
POSCNTH=0;
//Configurando el ADC
setup_port_a(sAN0);
setup_adc(ADC_CLOCK_INTERNAL);
set_adc_channel(0);
delay_us(50);
VCFG1=1; //-Vref=AN2
INTCON=0;//Apagando interrupciones
//Configurando el timer 0
TMR0L=0;
T0CON=0xC7;
//inicializando variables
i_ts=1/ts;
Je2=(d11*d22-d12*d21)/(2*d12);
V0=2*mbg;
RKdeKm=R*Kd/Km;
q1=0.0;
q1_1=0.0;
q2_pd=0.0;
while (TRUE)
{
PD3=1; //inician calculos del control
q1_1=q1; //actualizando la q1(k-1)
pos=POSCNTH;//registros de posicion en una variable
pos=pos<<8;
pos=pos+POSCNTL;
q1=(signed long)pos;
q1=0.004363*q1; //posicion del brazo en radianes
q1_p=(q1-q1_1)*i_ts; //calculando velocidad del brazo
vel=read_adc()-511; //calculando velocidad de la rueda
q2_p=(signed long)vel;
q2_p=3.2039*q2_p; //velocidad de la rueda en rad/seg
//calculo de q1 deseada
n=q1/pi_;
nf=(float)n;
mod=n%2;
698 14 Control de un péndulo con rueda inercial

if(nf==0)
if(q1>=0) // valor deseado por lado llegada
q1_d=pi_;
else
q1_d=-pi_;
if((nf!=0)&&!PD2)
{
if(q1>=0) // valor deseado por lado llegada
{
if(mod==0)
q1_d=pi_*(nf+1.0);
else
q1_d=pi_*nf;
}
else
{
if(mod==0)
q1_d=pi_*(nf-1.0);
else
q1_d=pi_*nf;
}
}
//fijando zona de operacion de cada controlador
if((q1-q1_d)*(q1-q1_d) + q1_p*q1_p < delta)
{
PD2=1; //calculando control lineal
u= k1*(q1-q1_d) + k2*q1_p + k3*(q2_p-q2_pd);
}
else
{
PD2=0; //calculando control no lineal
V=Je2*q1_p*q1_p+mbg*(1-cos(q1));
V=V-V0;
S=0; //funcion signo
if(V>0)
S=1.0;
if(V<0)
S=-1.0;
u=RKdeKm*q1_p*S; //termina controlador no lineal
q2_pd=q2_p; //velocidad deseada de la rueda
}
//saturacion 13V(15.3 V - 2.3 V de caida en puente H = 13 V)
if(u>13)
u=13;
if(u<-13)
u=-13;
//escalamiento de salida, pwm de 8 bits a 13 V
u=19.6*u;
//piloteando sentido de giro del motor
14.9 Preguntas de repaso 699

if(u>=0)
{
PD0=1;
PD1=0;
}
else
{
PD0=0;
PD1=1;
}
//actualizando el valor del pwm
pwm=(unsigned int)abs(u);
set_pwm1_duty(pwm); //actualizando el valor del pwm
PD3=0; //terminan calculos del control
while(TMR0L<108); //cada cuenta vale (4/FXtal)*256 seg
TMR0L=0;
T0CON=0xC7;
} //cierre del while infinito
} //cierre del main

14.8. Resumen
En este capı́tulo se le ha presentado al lector otro sistema no lineal subac-
tuado conocido como el péndulo con rueda inercial. Se ha mostrado también
el modelo matemático del sistema, y en una forma sencilla, se han tratado dos
controladores no lineales que son útiles para la tarea de levantar el péndulo
con rueda inercial. Basados en los capı́tulos previos del libro, se utilizó un con-
trolador por retroalimentación completa del estado para la tarea de atrapar
el péndulo con rueda inercial linealizado en su posición vertical invertida. Con
la finalidad de clarificar en su mayorı́a los aspectos involucrados en llevar los
conocimientos teóricos a la práctica, se mostró la construcción e identificación
de los parámetros de un sistema péndulo con rueda inercial prototipo. Se ha
finalizado con la electrónica y la programación de los dispositivos necesarios
para la realización de experimentos con el prototipo del péndulo con rueda
inercial construido.

14.9. Preguntas de repaso

1. Diga qué grado de libertad del IWP es no actuado.


2. ¿Por qué el IWP tuvo que oscilar varias veces antes de alcanzar la posición
vertical invertida?
3. ¿Qué hubiera sucedido si el voltaje umax en lugar de ser de 13[V] fuera de
7[V].?
700 14 Control de un péndulo con rueda inercial

4. ¿Cuánto vale la frecuencia de corte en [rad/s] y en [Hz] del filtro RC del


tacómetro mostrado en la figura 14.9?
5. ¿Por qué mientras el sistema de control está levantando el IWP la señal
de voltaje de la figura 14.7 va dismunuyendo su amplitud?
6. ¿Por qué mientras el sistema de control está levantando el IWP la señal
de voltaje de la figura 14.12 mantiene su amplitud entre 13[V] y -13[V]?
7. Identifique en qué lı́nea del programa del microcontrolador se manda apa-
gar el led conectado a la terminal 22 del PIC18F4431.
Referencias

1. R. Kelly, V. Santibañez, and A. Loria, Control of robot manipulators in joint


space, Springer, London, 2005.
2. M. W. Spong, P. Corke, and R. Lozano, Nonlinear control of the reaction wheel
pendulum, Automatica, vol. 37, no. 11, pp. 1845-1851, 2001.
3. R. Olfati-Saber, Global stabilization of a flat underactuated system: the inertia
wheel pendulum, Proc. of the 40th IEEE Conf. on Decision and Control, Orlando,
Florida, pp. 3764-3765, 2001.
4. R. Ortega, M. W. Spong, F. Gómez-Estern and G. Blankenstein, Stabilization
of a class of underactuated mechanical systems via interconnection and damping
assignment, IEEE Transactions on Automatic Control, vol. 47, no. 8, pp. 1218-
1233, 2002.
5. S. Afkhami, M. J. Yazdanpanah, and P. J. Maralani, Stabilization of inertia wheel
pendulum using output feedback back-stepping, Proc. of IEEE Conf. on Control
Applications, vol. 2, pp. 977-982, 2003.
6. D. M. Alonso, F. I. Robbio, E. E. Paolini, and J. L. Moiola, Modelling an inertia
wheel pendulum benchmark, Mathematical and Computer Modelling of Dynamical
Systems, vol. 11, no. 3, pp. 255-272, 2005.
7. R. Kelly and R. Campa, IDA-PB control of the inertia wheel pendulum: the
Lagrangian approach (in Spanish), Revista Iberoamericana de Automática e In-
formática Industrial, vol. 2, no. 1, pp. 36-42, 2005.
8. V. Santibañez, R. Kelly, and J. Sandoval, Control of the inertia wheel pendulum
by bounded torques, Proc. of the 44th IEEE Conf. on Decision and Control, and
European Control Conf. CDC-ECC ’05, Seville, Spain, pp. 8266-8270, 2005.
9. M. Abrahantes, J. Mulder, and K. Butter, Modeling, identification and control
of an under actuated inertial wheel pendulum, Proc. of the 39th Southeastern
Symposium on System Theory, Macon, Georgia, pp.1-5, 2007.
10. N. Qaiser, N. Iqbal, A. Hussain, and N. Qaiser, Exponential stabilization of a
class of underactuated mechanical systems using dynamic surface control, Inter-
national Journal of Control, Automation, and Systems, vol. 5, no. 5, pp. 547-558,
2007.
11. R. V. Carrillo-Serrano and V. M. Hernández-Guzmán, Control of the inertia
wheel pendulum taking into account the actuator dynamics, International Journal
of Innovative Computing, Information and Control, vol. 6, no. 12, pp. 5553-5563,
2010.
702 Referencias

12. H. Khalil, Nonlinear Systems, 3rd Edition, Prentice-Hall, Upper Saddle River,
2002.
13. A.L. Fradkov, P.Y. Guzenko, D.J. Hill, and A.Y. Pogromsky, Speed gradient
control and passivity of nonlinear oscillators, Proc. 3rd. IFAC Symposium on Non-
linear control systems (NOLCOS’95), vol. 2, pp. 655-659, 1995.
14. Hibbeler R. C., 2004, Mecánica vectorial para ingenieros. Dinamica, (10a. edi-
ción), Pearson Educación, México.
15. M. Alonso and E.J. Finn, Fı́sica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
16. PIC18F4431 Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2007.
17. CP360S Housed Encoder, Computer Optical Products Inc.,
www.opticalencoder.com.
18. L293B Push-Pull Four channel drivers, Data sheet, SGS-Thomson Microelec-
tronics, 1993.
19. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
Índice alfabético

Adelanto de fase, 314 Ecuación de Shockley, 475


Ancho de banda, 337 Ecuación dinámica
Atraso de fase, 315 ecuación de estado, 396
ecuación de estado no lineal, 399
Bode ecuación de salida, 396
gráficas de, 294 lineal invariante en el tiempo, 396
solución, 411
Ceros, 145
Ecuaciones de Euler-Lagrange, 647, 672
lazo abierto de, 224
lazo abierto, efecto de, 231, 335 Eigenvalores, 409
Circuito de señal pequeña, 473 Energı́a, 17
Compensadores de adelanto, 320 almacenada en un resorte, 22, 24
Componentes de frecuencia cero, 305 cinética, 20, 23, 648, 672, 674
Componentes de frecuencias grandes, de un campo magnético, 41
303 en sistemas de fluidos, 18
Condición en sistemas eléctricos, 18
ángulo de, 224 en sistemas mecánicos rotativos, 18
magnitud de, 224 en sistemas mecánicos traslacionales,
Conexión 18
en cascada, 179 en un capacitor, 26
en lazo cerrado, 181 en una inductancia, 25
en paralelo, 180 magnética, 579
Constante de tiempo, 103, 337 potencial, 650, 673, 674
Control de corriente, 504 Entrada, 102, 145
Controlabilidad
Entrada de prueba
definición, 414
escalón, 202
prueba, 414
parábola, 203
Criterio de Nyquist
caso especial, 332 rampa, 202
caso general, 333 Espectro de frecuencias, 301
Estabilidad, 145, 413
Década, 309 marginal, 145
Decibeles, 294 Estado, 395
Disipador, 27 estimado del, 431
704 Índice alfabético

Factor de amortiguamiento, 122, 338 PIC18F4431, 687


Filtro Modelo lineal aproximado, 403
pasa altas, 314 Modulador por ancho de pulso, PWM,
pasa bajas, 294, 315 587, 591
Fracciones parciales expansión en, 113
raı́ces complejas conjugadas distintas, Objetivo de un sistema de control, 222
135 Observabilidad
raı́ces complejas conjugadas repeti- definición, 416
das, 140 prueba, 416
raı́ces reales distintas, 100, 125
raı́ces reales repetidas, 110, 130 Pico de resonancia, 310, 337
Frecuencia Polares
de cruce de fase, 335 gráficas, 297
de cruce de ganancia, 334, 338 Polinomio caracterı́stico, 102, 145
de esquina, 310, 337 Polos, 104, 144
Frecuencia natural amortiguada, 123 de lazo abierto, efecto de, 230, 335
Frecuencia natural no amortiguada, 123 lazo abierto de, 224
Fuerza magnética, 579 lazo cerrado de, 223
Función constitutiva, 20, 22–24, 27 Potencia
disipada por la fricción viscosa, 28
Función de transferencia, 144
disipada por un resistencia eléctrica,
de ganancia unitaria en estado
30
estacionario, 104, 122, 146
instantanea, 17
estable, 145
Principio de superposición, 181
fase de una, 308
Puerto, 16, 17, 32
inestable, 145
Punto de equilibrio, 401
lazo abierto de, 223
Punto de operación, 402, 474
lazo cerrado de, 222
magnitud de una, 308 Rango de una matriz, 409
marginalmente estable, 145 Resonancia, 143, 316
Respuesta
Inestabilidad, 145 en estado estacionario, caracterı́sticas
de, 222
L’Hopital regla de, 131 forzada, 101, 111, 116, 126
Ley de Faraday, 25, 39, 578 natural, 101, 111, 116, 126
Ley de Hooke, 22, 24 transitoria, caracterı́sticas de, 222
Ley de Kirchhoff de corrientes, 70 Ruido, 305, 315
Ley de Kirchhoff de Voltajes, 67, 578
Ley de la Conservación de la Materia, Salida, 102, 145
105 Segunda Ley de Newton, 20, 22, 579
Ley de Lenz, 39 Series de Fourier, 301
Ley de Ohm, 30 Sistema de control en lazo cerrado, 181,
201, 222
MagLev, 576 Sistema inestable, 577
Margen Sobre paso, 118
fase de, 334, 338
ganancia de, 335 Teorema
Matriz no singular, 408 valor final del, 99
Microcontrolador Tercera Ley de Newton, 43
PIC16F877A, 558, 657 Tiempo de subida, 118, 337
Índice alfabético 705

Tipo de un sistema, 201 definición, 395


Transformación lineal, 425 Variables generalizadas
Transformada acumulación de esfuerzo, 19, 21, 23,
Laplace de, 98 25
Fourier de, 301 acumulación de flujo, 19, 20, 23, 26
Trayectoria de Nyquist, 330 esfuerzo, 17
modificada, 333 flujo, 17
Vectores
Variables de estado linealmente dependientes, 407
criterio de selección, 395 linealmente independientes, 407
Control Automático
Teorı́a de diseño, construcción de prototipos,
modelado, identificación y pruebas experimentales

Hecho en México
Impreso por:
Esteban Becerril Camargo
Simón Bolı́var No. 118, Col. Centro,
Deleg. Cuauhtémoc, México, D.F., C.P. 06080

1,000 Ejemplares, Junio de 2013

También podría gustarte